KR20130111219A - 신규 dna 결합 단백질 및 이의 용도 - Google Patents
신규 dna 결합 단백질 및 이의 용도 Download PDFInfo
- Publication number
- KR20130111219A KR20130111219A KR1020127032393A KR20127032393A KR20130111219A KR 20130111219 A KR20130111219 A KR 20130111219A KR 1020127032393 A KR1020127032393 A KR 1020127032393A KR 20127032393 A KR20127032393 A KR 20127032393A KR 20130111219 A KR20130111219 A KR 20130111219A
- Authority
- KR
- South Korea
- Prior art keywords
- tale
- domain
- sequence
- dna
- cells
- Prior art date
Links
- 102000052510 DNA-Binding Proteins Human genes 0.000 title description 15
- 108700020911 DNA-Binding Proteins Proteins 0.000 title description 11
- 238000000034 method Methods 0.000 claims abstract description 159
- 230000004568 DNA-binding Effects 0.000 claims abstract description 131
- 230000014509 gene expression Effects 0.000 claims abstract description 106
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 83
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 69
- 229920001184 polypeptide Polymers 0.000 claims abstract description 65
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 51
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 51
- 239000002157 polynucleotide Substances 0.000 claims abstract description 51
- 230000033228 biological regulation Effects 0.000 claims abstract description 15
- 108090000623 proteins and genes Proteins 0.000 claims description 508
- 210000004027 cell Anatomy 0.000 claims description 306
- 102000004169 proteins and genes Human genes 0.000 claims description 281
- 238000003776 cleavage reaction Methods 0.000 claims description 201
- 230000007017 scission Effects 0.000 claims description 199
- 101710163270 Nuclease Proteins 0.000 claims description 118
- 150000007523 nucleic acids Chemical class 0.000 claims description 106
- 102000039446 nucleic acids Human genes 0.000 claims description 99
- 108020004707 nucleic acids Proteins 0.000 claims description 99
- 108020001507 fusion proteins Proteins 0.000 claims description 96
- 102000037865 fusion proteins Human genes 0.000 claims description 96
- 230000027455 binding Effects 0.000 claims description 93
- 150000001413 amino acids Chemical class 0.000 claims description 68
- 230000004913 activation Effects 0.000 claims description 55
- 230000001105 regulatory effect Effects 0.000 claims description 42
- 230000006780 non-homologous end joining Effects 0.000 claims description 39
- 230000010354 integration Effects 0.000 claims description 35
- 238000012217 deletion Methods 0.000 claims description 26
- 230000037430 deletion Effects 0.000 claims description 26
- 239000012634 fragment Substances 0.000 claims description 24
- 230000001404 mediated effect Effects 0.000 claims description 23
- 230000004048 modification Effects 0.000 claims description 21
- 238000012986 modification Methods 0.000 claims description 21
- 238000002744 homologous recombination Methods 0.000 claims description 17
- 230000006801 homologous recombination Effects 0.000 claims description 17
- 230000002103 transcriptional effect Effects 0.000 claims description 16
- 108010042407 Endonucleases Proteins 0.000 claims description 13
- 239000003112 inhibitor Substances 0.000 claims description 12
- 230000002779 inactivation Effects 0.000 claims description 9
- 102000004533 Endonucleases Human genes 0.000 claims description 7
- 210000004102 animal cell Anatomy 0.000 claims description 6
- 108091006106 transcriptional activators Proteins 0.000 claims description 6
- 241000251468 Actinopterygii Species 0.000 claims description 5
- 239000008194 pharmaceutical composition Substances 0.000 claims description 4
- 210000005253 yeast cell Anatomy 0.000 claims description 4
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 2
- 230000001629 suppression Effects 0.000 claims description 2
- 238000010362 genome editing Methods 0.000 abstract description 14
- 235000018102 proteins Nutrition 0.000 description 270
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 156
- 108020004414 DNA Proteins 0.000 description 155
- 238000010459 TALEN Methods 0.000 description 139
- 230000004927 fusion Effects 0.000 description 108
- 230000000694 effects Effects 0.000 description 100
- 241000196324 Embryophyta Species 0.000 description 94
- 239000013598 vector Substances 0.000 description 77
- 210000004899 c-terminal region Anatomy 0.000 description 75
- 238000003556 assay Methods 0.000 description 71
- 235000001014 amino acid Nutrition 0.000 description 70
- 230000032965 negative regulation of cell volume Effects 0.000 description 69
- 239000002773 nucleotide Substances 0.000 description 69
- 229940024606 amino acid Drugs 0.000 description 68
- 125000003729 nucleotide group Chemical group 0.000 description 63
- 101000634196 Homo sapiens Neurotrophin-3 Proteins 0.000 description 55
- 102100029268 Neurotrophin-3 Human genes 0.000 description 55
- 239000000203 mixture Substances 0.000 description 53
- 241001465754 Metazoa Species 0.000 description 49
- 230000006870 function Effects 0.000 description 47
- 238000013456 study Methods 0.000 description 40
- 230000035772 mutation Effects 0.000 description 36
- 241000700159 Rattus Species 0.000 description 34
- 238000002474 experimental method Methods 0.000 description 34
- 239000013612 plasmid Substances 0.000 description 33
- 108091028043 Nucleic acid sequence Proteins 0.000 description 32
- 210000004962 mammalian cell Anatomy 0.000 description 32
- 108091034117 Oligonucleotide Proteins 0.000 description 31
- 108700008625 Reporter Genes Proteins 0.000 description 31
- 239000013615 primer Substances 0.000 description 31
- 210000000130 stem cell Anatomy 0.000 description 30
- 239000000047 product Substances 0.000 description 29
- 230000005782 double-strand break Effects 0.000 description 28
- 108020004999 messenger RNA Proteins 0.000 description 27
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 26
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 26
- 125000003275 alpha amino acid group Chemical group 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 24
- 230000009261 transgenic effect Effects 0.000 description 24
- 102000040945 Transcription factor Human genes 0.000 description 23
- 108091023040 Transcription factor Proteins 0.000 description 23
- 210000002257 embryonic structure Anatomy 0.000 description 23
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 22
- 210000003483 chromatin Anatomy 0.000 description 22
- 238000000338 in vitro Methods 0.000 description 22
- 230000008685 targeting Effects 0.000 description 22
- 230000003612 virological effect Effects 0.000 description 22
- 241000282414 Homo sapiens Species 0.000 description 21
- 239000005090 green fluorescent protein Substances 0.000 description 21
- -1 while in others Proteins 0.000 description 20
- 102000004190 Enzymes Human genes 0.000 description 19
- 108090000790 Enzymes Proteins 0.000 description 19
- 230000009368 gene silencing by RNA Effects 0.000 description 19
- 238000001415 gene therapy Methods 0.000 description 19
- 210000001519 tissue Anatomy 0.000 description 19
- 230000001413 cellular effect Effects 0.000 description 18
- 238000013461 design Methods 0.000 description 18
- 238000001727 in vivo Methods 0.000 description 18
- 108010077544 Chromatin Proteins 0.000 description 17
- 238000002965 ELISA Methods 0.000 description 17
- 239000013603 viral vector Substances 0.000 description 17
- 108700019146 Transgenes Proteins 0.000 description 16
- 241000589634 Xanthomonas Species 0.000 description 16
- 238000004519 manufacturing process Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- 238000012163 sequencing technique Methods 0.000 description 16
- 238000012360 testing method Methods 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 15
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 15
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 15
- 239000013604 expression vector Substances 0.000 description 15
- 241000701161 unidentified adenovirus Species 0.000 description 15
- 108010061833 Integrases Proteins 0.000 description 14
- 238000003780 insertion Methods 0.000 description 14
- 230000037431 insertion Effects 0.000 description 14
- 108091008146 restriction endonucleases Proteins 0.000 description 14
- 241000700605 Viruses Species 0.000 description 13
- 101710185494 Zinc finger protein Proteins 0.000 description 13
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 13
- 230000008859 change Effects 0.000 description 13
- 210000001671 embryonic stem cell Anatomy 0.000 description 13
- 230000003993 interaction Effects 0.000 description 13
- 238000001890 transfection Methods 0.000 description 13
- 108060001084 Luciferase Proteins 0.000 description 12
- 206010028980 Neoplasm Diseases 0.000 description 12
- 238000010367 cloning Methods 0.000 description 12
- 201000010099 disease Diseases 0.000 description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 12
- 239000000499 gel Substances 0.000 description 12
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 12
- 230000008439 repair process Effects 0.000 description 12
- 229910052725 zinc Inorganic materials 0.000 description 12
- 239000011701 zinc Substances 0.000 description 12
- 108091093088 Amplicon Proteins 0.000 description 11
- 230000007018 DNA scission Effects 0.000 description 11
- 240000008042 Zea mays Species 0.000 description 11
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 11
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 11
- 230000002759 chromosomal effect Effects 0.000 description 11
- 210000000349 chromosome Anatomy 0.000 description 11
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 11
- 230000001965 increasing effect Effects 0.000 description 11
- 238000002347 injection Methods 0.000 description 11
- 239000007924 injection Substances 0.000 description 11
- 241000894007 species Species 0.000 description 11
- 238000006467 substitution reaction Methods 0.000 description 11
- 230000001225 therapeutic effect Effects 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 10
- 239000005089 Luciferase Substances 0.000 description 10
- 102000018120 Recombinases Human genes 0.000 description 10
- 108010091086 Recombinases Proteins 0.000 description 10
- 230000021615 conjugation Effects 0.000 description 10
- 238000011161 development Methods 0.000 description 10
- 230000018109 developmental process Effects 0.000 description 10
- 238000001476 gene delivery Methods 0.000 description 10
- 238000012239 gene modification Methods 0.000 description 10
- 230000002068 genetic effect Effects 0.000 description 10
- 230000005017 genetic modification Effects 0.000 description 10
- 235000013617 genetically modified food Nutrition 0.000 description 10
- 150000002632 lipids Chemical class 0.000 description 10
- 239000003921 oil Substances 0.000 description 10
- 235000019198 oils Nutrition 0.000 description 10
- 150000003384 small molecules Chemical class 0.000 description 10
- 241000699670 Mus sp. Species 0.000 description 9
- 108090000742 Neurotrophin 3 Proteins 0.000 description 9
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 9
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 9
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 9
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 9
- 239000012190 activator Substances 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000000875 corresponding effect Effects 0.000 description 9
- 208000015181 infectious disease Diseases 0.000 description 9
- 238000004806 packaging method and process Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 108700028369 Alleles Proteins 0.000 description 8
- 101100517192 Arabidopsis thaliana NRPD1 gene Proteins 0.000 description 8
- 101100038200 Arabidopsis thaliana RPD1 gene Proteins 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 8
- 241000702421 Dependoparvovirus Species 0.000 description 8
- 102100034349 Integrase Human genes 0.000 description 8
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 8
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 8
- 238000012408 PCR amplification Methods 0.000 description 8
- 101100473190 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RPN1 gene Proteins 0.000 description 8
- 101100042631 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SIN3 gene Proteins 0.000 description 8
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 8
- 238000013459 approach Methods 0.000 description 8
- 235000005822 corn Nutrition 0.000 description 8
- 239000000539 dimer Substances 0.000 description 8
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 8
- 239000003446 ligand Substances 0.000 description 8
- 230000006798 recombination Effects 0.000 description 8
- 238000005215 recombination Methods 0.000 description 8
- 230000001177 retroviral effect Effects 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- 235000010469 Glycine max Nutrition 0.000 description 7
- 244000068988 Glycine max Species 0.000 description 7
- 102000012330 Integrases Human genes 0.000 description 7
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 7
- 102000055027 Protein Methyltransferases Human genes 0.000 description 7
- 108700040121 Protein Methyltransferases Proteins 0.000 description 7
- 241000232299 Ralstonia Species 0.000 description 7
- 238000005520 cutting process Methods 0.000 description 7
- 235000014113 dietary fatty acids Nutrition 0.000 description 7
- 238000004520 electroporation Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 229930195729 fatty acid Natural products 0.000 description 7
- 239000000194 fatty acid Substances 0.000 description 7
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 7
- 239000000833 heterodimer Substances 0.000 description 7
- 230000001976 improved effect Effects 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 230000037361 pathway Effects 0.000 description 7
- 102000005962 receptors Human genes 0.000 description 7
- 108020003175 receptors Proteins 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 241001430294 unidentified retrovirus Species 0.000 description 7
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 6
- 102000014914 Carrier Proteins Human genes 0.000 description 6
- 102100031780 Endonuclease Human genes 0.000 description 6
- 241000233866 Fungi Species 0.000 description 6
- 241000254158 Lampyridae Species 0.000 description 6
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 description 6
- 101710126211 POU domain, class 5, transcription factor 1 Proteins 0.000 description 6
- 108091027967 Small hairpin RNA Proteins 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 108091008324 binding proteins Proteins 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 6
- 150000004665 fatty acids Chemical class 0.000 description 6
- 230000005764 inhibitory process Effects 0.000 description 6
- 239000002502 liposome Substances 0.000 description 6
- 239000002679 microRNA Substances 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 108020001580 protein domains Proteins 0.000 description 6
- 229950010131 puromycin Drugs 0.000 description 6
- 125000006850 spacer group Chemical group 0.000 description 6
- 238000010561 standard procedure Methods 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 238000010361 transduction Methods 0.000 description 6
- 230000026683 transduction Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 5
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 5
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 5
- 240000002791 Brassica napus Species 0.000 description 5
- 108090000331 Firefly luciferases Proteins 0.000 description 5
- 101000595674 Homo sapiens Pituitary homeobox 3 Proteins 0.000 description 5
- 241000124008 Mammalia Species 0.000 description 5
- 108700011259 MicroRNAs Proteins 0.000 description 5
- 101150036143 NTF3 gene Proteins 0.000 description 5
- 206010029113 Neovascularisation Diseases 0.000 description 5
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 5
- 239000005642 Oleic acid Substances 0.000 description 5
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 5
- 241000283973 Oryctolagus cuniculus Species 0.000 description 5
- 241000589771 Ralstonia solanacearum Species 0.000 description 5
- 230000003213 activating effect Effects 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000009396 hybridization Methods 0.000 description 5
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 5
- 210000001161 mammalian embryo Anatomy 0.000 description 5
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 239000004055 small Interfering RNA Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- 230000004614 tumor growth Effects 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 239000003981 vehicle Substances 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 108090000695 Cytokines Proteins 0.000 description 4
- 102000004127 Cytokines Human genes 0.000 description 4
- 101710096438 DNA-binding protein Proteins 0.000 description 4
- 108010016626 Dipeptides Proteins 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- 108010047956 Nucleosomes Proteins 0.000 description 4
- 102000001253 Protein Kinase Human genes 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 238000002105 Southern blotting Methods 0.000 description 4
- 210000001744 T-lymphocyte Anatomy 0.000 description 4
- 102100035100 Transcription factor p65 Human genes 0.000 description 4
- 102000004357 Transferases Human genes 0.000 description 4
- 108090000992 Transferases Proteins 0.000 description 4
- 108010020764 Transposases Proteins 0.000 description 4
- 102000008579 Transposases Human genes 0.000 description 4
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 4
- 238000002679 ablation Methods 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 239000011543 agarose gel Substances 0.000 description 4
- 235000004279 alanine Nutrition 0.000 description 4
- 230000004075 alteration Effects 0.000 description 4
- RIOXQFHNBCKOKP-UHFFFAOYSA-N benomyl Chemical compound C1=CC=C2N(C(=O)NCCCC)C(NC(=O)OC)=NC2=C1 RIOXQFHNBCKOKP-UHFFFAOYSA-N 0.000 description 4
- 239000011230 binding agent Substances 0.000 description 4
- 210000002459 blastocyst Anatomy 0.000 description 4
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 238000006471 dimerization reaction Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 4
- 229960005542 ethidium bromide Drugs 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 230000005714 functional activity Effects 0.000 description 4
- 210000004602 germ cell Anatomy 0.000 description 4
- 238000000099 in vitro assay Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 210000004185 liver Anatomy 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000000520 microinjection Methods 0.000 description 4
- 210000001623 nucleosome Anatomy 0.000 description 4
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 108060006633 protein kinase Proteins 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000035939 shock Effects 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 239000013607 AAV vector Substances 0.000 description 3
- 108010013043 Acetylesterase Proteins 0.000 description 3
- 102100032305 Bcl-2 homologous antagonist/killer Human genes 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 3
- 101150017501 CCR5 gene Proteins 0.000 description 3
- 101100297347 Caenorhabditis elegans pgl-3 gene Proteins 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 241000195493 Cryptophyta Species 0.000 description 3
- 230000033616 DNA repair Effects 0.000 description 3
- 241000450599 DNA viruses Species 0.000 description 3
- 108091060211 Expressed sequence tag Proteins 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 101100446349 Glycine max FAD2-1 gene Proteins 0.000 description 3
- 241000219146 Gossypium Species 0.000 description 3
- 235000003222 Helianthus annuus Nutrition 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 241000725303 Human immunodeficiency virus Species 0.000 description 3
- 206010020649 Hyperkeratosis Diseases 0.000 description 3
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 3
- 240000008415 Lactuca sativa Species 0.000 description 3
- 108091036060 Linker DNA Proteins 0.000 description 3
- 241000227653 Lycopersicon Species 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 108091061960 Naked DNA Proteins 0.000 description 3
- 108700019961 Neoplasm Genes Proteins 0.000 description 3
- 102000048850 Neoplasm Genes Human genes 0.000 description 3
- 102000011931 Nucleoproteins Human genes 0.000 description 3
- 108010061100 Nucleoproteins Proteins 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 241000209094 Oryza Species 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 206010033799 Paralysis Diseases 0.000 description 3
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 3
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 3
- 102100036088 Pituitary homeobox 3 Human genes 0.000 description 3
- 108091030071 RNAI Proteins 0.000 description 3
- 101100087805 Ralstonia solanacearum rip19 gene Proteins 0.000 description 3
- 108010052090 Renilla Luciferases Proteins 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- 102000006382 Ribonucleases Human genes 0.000 description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 3
- 241000209140 Triticum Species 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- 241000589636 Xanthomonas campestris Species 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 229940009098 aspartate Drugs 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 238000013357 binding ELISA Methods 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 108091092356 cellular DNA Proteins 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000001149 cognitive effect Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 210000004748 cultured cell Anatomy 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 230000006378 damage Effects 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 230000009274 differential gene expression Effects 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 230000003828 downregulation Effects 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 241001493065 dsRNA viruses Species 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 3
- 239000000710 homodimer Substances 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 230000002458 infectious effect Effects 0.000 description 3
- 238000001802 infusion Methods 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 3
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 3
- 239000003607 modifier Substances 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 210000001665 muscle stem cell Anatomy 0.000 description 3
- 210000004897 n-terminal region Anatomy 0.000 description 3
- 210000001178 neural stem cell Anatomy 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 210000000287 oocyte Anatomy 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 238000002823 phage display Methods 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 230000003389 potentiating effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000037432 silent mutation Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical group [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 150000003626 triacylglycerols Chemical class 0.000 description 3
- 239000013638 trimer Substances 0.000 description 3
- 230000003827 upregulation Effects 0.000 description 3
- 210000004291 uterus Anatomy 0.000 description 3
- 235000015112 vegetable and seed oil Nutrition 0.000 description 3
- 235000013311 vegetables Nutrition 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- ZOOGRGPOEVQQDX-UUOKFMHZSA-N 3',5'-cyclic GMP Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=C(NC2=O)N)=C2N=C1 ZOOGRGPOEVQQDX-UUOKFMHZSA-N 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 101001030716 Arabidopsis thaliana Histone deacetylase HDT1 Proteins 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 244000075850 Avena orientalis Species 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 241000219122 Cucurbita Species 0.000 description 2
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 238000009007 Diagnostic Kit Methods 0.000 description 2
- 208000035240 Disease Resistance Diseases 0.000 description 2
- 238000012286 ELISA Assay Methods 0.000 description 2
- 102000006402 Endocrine-Gland-Derived Vascular Endothelial Growth Factor Human genes 0.000 description 2
- 108010044063 Endocrine-Gland-Derived Vascular Endothelial Growth Factor Proteins 0.000 description 2
- 101150016855 FAD2-1 gene Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 244000020551 Helianthus annuus Species 0.000 description 2
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 2
- 108010036115 Histone Methyltransferases Proteins 0.000 description 2
- 102000011787 Histone Methyltransferases Human genes 0.000 description 2
- 102000003964 Histone deacetylase Human genes 0.000 description 2
- 108090000353 Histone deacetylase Proteins 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 102000006947 Histones Human genes 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 2
- 101000687346 Homo sapiens PR domain zinc finger protein 2 Proteins 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 2
- 240000004658 Medicago sativa Species 0.000 description 2
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 2
- 108060004795 Methyltransferase Proteins 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 108010057466 NF-kappa B Proteins 0.000 description 2
- 102000003945 NF-kappa B Human genes 0.000 description 2
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 2
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 2
- XDMCWZFLLGVIID-SXPRBRBTSA-N O-(3-O-D-galactosyl-N-acetyl-beta-D-galactosaminyl)-L-serine Chemical compound CC(=O)N[C@H]1[C@H](OC[C@H]([NH3+])C([O-])=O)O[C@H](CO)[C@H](O)[C@@H]1OC1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 XDMCWZFLLGVIID-SXPRBRBTSA-N 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 102100024885 PR domain zinc finger protein 2 Human genes 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 240000008334 Pisonia alba Species 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 241000125945 Protoparvovirus Species 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 241000220324 Pyrus Species 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 101100272715 Ralstonia solanacearum (strain GMI1000) brg11 gene Proteins 0.000 description 2
- 241000710799 Rubella virus Species 0.000 description 2
- 241000209056 Secale Species 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 240000003829 Sorghum propinquum Species 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical group O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 101710183280 Topoisomerase Proteins 0.000 description 2
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000520892 Xanthomonas axonopodis Species 0.000 description 2
- 241000209149 Zea Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 244000052616 bacterial pathogen Species 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000002551 biofuel Substances 0.000 description 2
- 210000004204 blood vessel Anatomy 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 210000002798 bone marrow cell Anatomy 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 210000002308 embryonic cell Anatomy 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 230000035558 fertility Effects 0.000 description 2
- 230000004345 fruit ripening Effects 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 102000034356 gene-regulatory proteins Human genes 0.000 description 2
- 108091006104 gene-regulatory proteins Proteins 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 210000002149 gonad Anatomy 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 229940088597 hormone Drugs 0.000 description 2
- 239000005556 hormone Substances 0.000 description 2
- 102000057714 human NTF3 Human genes 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 150000004678 hydrides Chemical class 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 238000012405 in silico analysis Methods 0.000 description 2
- 238000005462 in vivo assay Methods 0.000 description 2
- 239000012212 insulator Substances 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 208000028867 ischemia Diseases 0.000 description 2
- 235000020778 linoleic acid Nutrition 0.000 description 2
- OYHQOLUKZRVURQ-IXWMQOLASA-N linoleic acid Natural products CCCCC\C=C/C\C=C\CCCCCCCC(O)=O OYHQOLUKZRVURQ-IXWMQOLASA-N 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 230000003032 phytopathogenic effect Effects 0.000 description 2
- 244000000003 plant pathogen Species 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 235000012015 potatoes Nutrition 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108090000468 progesterone receptors Proteins 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 102000021127 protein binding proteins Human genes 0.000 description 2
- 108091011138 protein binding proteins Proteins 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000014493 regulation of gene expression Effects 0.000 description 2
- 238000007634 remodeling Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 206010039073 rheumatoid arthritis Diseases 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 102000028561 sterol response element binding proteins Human genes 0.000 description 2
- 108091009326 sterol response element binding proteins Proteins 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 125000001424 substituent group Chemical group 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 239000000375 suspending agent Substances 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 238000010396 two-hybrid screening Methods 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 239000008158 vegetable oil Substances 0.000 description 2
- OPCHFPHZPIURNA-MFERNQICSA-N (2s)-2,5-bis(3-aminopropylamino)-n-[2-(dioctadecylamino)acetyl]pentanamide Chemical compound CCCCCCCCCCCCCCCCCCN(CC(=O)NC(=O)[C@H](CCCNCCCN)NCCCN)CCCCCCCCCCCCCCCCCC OPCHFPHZPIURNA-MFERNQICSA-N 0.000 description 1
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- JTTIOYHBNXDJOD-UHFFFAOYSA-N 2,4,6-triaminopyrimidine Chemical compound NC1=CC(N)=NC(N)=N1 JTTIOYHBNXDJOD-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 108010020183 3-phosphoshikimate 1-carboxyvinyltransferase Proteins 0.000 description 1
- WBSCNDJQPKSPII-UHFFFAOYSA-N 6-amino-2-[[6-amino-2-(2,6-diaminohexanoylamino)hexanoyl]amino]hexanoic acid Chemical compound NCCCCC(N)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(O)=O WBSCNDJQPKSPII-UHFFFAOYSA-N 0.000 description 1
- BSFODEXXVBBYOC-UHFFFAOYSA-N 8-[4-(dimethylamino)butan-2-ylamino]quinolin-6-ol Chemical compound C1=CN=C2C(NC(CCN(C)C)C)=CC(O)=CC2=C1 BSFODEXXVBBYOC-UHFFFAOYSA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 102000000452 Acetyl-CoA carboxylase Human genes 0.000 description 1
- 108010016219 Acetyl-CoA carboxylase Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- AETQNIIFKCMVHP-UVBJJODRSA-N Ala-Trp-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AETQNIIFKCMVHP-UVBJJODRSA-N 0.000 description 1
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 1
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 102100021266 Alpha-(1,6)-fucosyltransferase Human genes 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 235000003840 Amygdalus nana Nutrition 0.000 description 1
- 244000296825 Amygdalus nana Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 102100027308 Apoptosis regulator BAX Human genes 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 208000006400 Arbovirus Encephalitis Diseases 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- BHELIUBJHYAEDK-OAIUPTLZSA-N Aspoxicillin Chemical compound C1([C@H](C(=O)N[C@@H]2C(N3[C@H](C(C)(C)S[C@@H]32)C(O)=O)=O)NC(=O)[C@H](N)CC(=O)NC)=CC=C(O)C=C1 BHELIUBJHYAEDK-OAIUPTLZSA-N 0.000 description 1
- 235000005781 Avena Nutrition 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000206761 Bacillariophyta Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000193738 Bacillus anthracis Species 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 108010018763 Biotin carboxylase Proteins 0.000 description 1
- 241001536303 Botryococcus braunii Species 0.000 description 1
- 208000003508 Botulism Diseases 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 244000188595 Brassica sinapistrum Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101150061009 C1 gene Proteins 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 101100290380 Caenorhabditis elegans cel-1 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 206010007269 Carcinogenicity Diseases 0.000 description 1
- 102100028892 Cardiotrophin-1 Human genes 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 102000004018 Caspase 6 Human genes 0.000 description 1
- 108090000425 Caspase 6 Proteins 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000606161 Chlamydia Species 0.000 description 1
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 1
- 206010008631 Cholera Diseases 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 240000005250 Chrysanthemum indicum Species 0.000 description 1
- 241000722206 Chrysotila carterae Species 0.000 description 1
- 241000219109 Citrullus Species 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000131522 Citrus pyriformis Species 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 241000723607 Comovirus Species 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 240000000491 Corchorus aestuans Species 0.000 description 1
- 235000011777 Corchorus aestuans Nutrition 0.000 description 1
- 235000010862 Corchorus capsularis Nutrition 0.000 description 1
- 241000709687 Coxsackievirus Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 244000241257 Cucumis melo Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 206010011732 Cyst Diseases 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 101710155335 DELLA protein SLR1 Proteins 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 1
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 102000011724 DNA Repair Enzymes Human genes 0.000 description 1
- 108010076525 DNA Repair Enzymes Proteins 0.000 description 1
- 230000007035 DNA breakage Effects 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 241000725619 Dengue virus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 206010012689 Diabetic retinopathy Diseases 0.000 description 1
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241000195632 Dunaliella tertiolecta Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 201000011001 Ebola Hemorrhagic Fever Diseases 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 241001466953 Echovirus Species 0.000 description 1
- 235000001950 Elaeis guineensis Nutrition 0.000 description 1
- 244000127993 Elaeis melanococca Species 0.000 description 1
- 241000224431 Entamoeba Species 0.000 description 1
- 101100049549 Enterobacteria phage P4 sid gene Proteins 0.000 description 1
- 241000709661 Enterovirus Species 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 101800001467 Envelope glycoprotein E2 Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 102100034543 Fatty acid desaturase 3 Human genes 0.000 description 1
- 108010087894 Fatty acid desaturases Proteins 0.000 description 1
- 241000724791 Filamentous phage Species 0.000 description 1
- 241000710831 Flavivirus Species 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 241000224466 Giardia Species 0.000 description 1
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 1
- 108700023224 Glucose-1-phosphate adenylyltransferases Proteins 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- 101100446350 Glycine max FAD2-2 gene Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 241001404126 Gyas Species 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 108010002459 HIV Integrase Proteins 0.000 description 1
- 208000037357 HIV infectious disease Diseases 0.000 description 1
- 101150010036 HNT3 gene Proteins 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 108010049606 Hepatocyte Nuclear Factors Proteins 0.000 description 1
- 102000008088 Hepatocyte Nuclear Factors Human genes 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 102100039869 Histone H2B type F-S Human genes 0.000 description 1
- 102100022846 Histone acetyltransferase KAT2B Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 101000819490 Homo sapiens Alpha-(1,6)-fucosyltransferase Proteins 0.000 description 1
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 1
- 101100438883 Homo sapiens CCR5 gene Proteins 0.000 description 1
- 101000916283 Homo sapiens Cardiotrophin-1 Proteins 0.000 description 1
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 1
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 1
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 description 1
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 1
- 101001047006 Homo sapiens Histone acetyltransferase KAT2B Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000615495 Homo sapiens Methyl-CpG-binding domain protein 3 Proteins 0.000 description 1
- 101000724418 Homo sapiens Neutral amino acid transporter B(0) Proteins 0.000 description 1
- 101100137155 Homo sapiens POU5F1 gene Proteins 0.000 description 1
- 101000702560 Homo sapiens Probable global transcription activator SNF2L1 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000702544 Homo sapiens SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily A member 5 Proteins 0.000 description 1
- 101000802101 Homo sapiens mRNA decay activator protein ZFP36L2 Proteins 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 241000598436 Human T-cell lymphotropic virus Species 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 208000035150 Hypercholesterolemia Diseases 0.000 description 1
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 1
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- 102000044753 ISWI Human genes 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 1
- UBORTCNDUKBEOP-UHFFFAOYSA-N L-xanthosine Natural products OC1C(O)C(CO)OC1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UHFFFAOYSA-N 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- 241000208822 Lactuca Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- 206010024238 Leptospirosis Diseases 0.000 description 1
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 241000209082 Lolium Species 0.000 description 1
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 208000016604 Lyme disease Diseases 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 241000220225 Malus Species 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 241000589195 Mesorhizobium loti Species 0.000 description 1
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 1
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102100021291 Methyl-CpG-binding domain protein 3 Human genes 0.000 description 1
- 101150076359 Mhc gene Proteins 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 241000711386 Mumps virus Species 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 102100028267 Neutral amino acid transporter B(0) Human genes 0.000 description 1
- 241000208125 Nicotiana Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 108010008964 Non-Histone Chromosomal Proteins Proteins 0.000 description 1
- 102000006570 Non-Histone Chromosomal Proteins Human genes 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 241001233986 Orychophragmus Species 0.000 description 1
- 101100046877 Oryza sativa subsp. japonica TRAB1 gene Proteins 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 102100036220 PC4 and SFRS1-interacting protein Human genes 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- 102100035593 POU domain, class 2, transcription factor 1 Human genes 0.000 description 1
- 101710084414 POU domain, class 2, transcription factor 1 Proteins 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 241000218196 Persea Species 0.000 description 1
- 101100440941 Petroselinum crispum CPRF1 gene Proteins 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 241000219833 Phaseolus Species 0.000 description 1
- CXOFVDLJLONNDW-UHFFFAOYSA-N Phenytoin Chemical compound N1C(=O)NC(=O)C1(C=1C=CC=CC=1)C1=CC=CC=C1 CXOFVDLJLONNDW-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical group OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 241000218657 Picea Species 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000758706 Piperaceae Species 0.000 description 1
- 241000219843 Pisum Species 0.000 description 1
- 206010035148 Plague Diseases 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- 241000183024 Populus tremula Species 0.000 description 1
- 241000709992 Potato virus X Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102100025803 Progesterone receptor Human genes 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 206010037075 Protozoal infections Diseases 0.000 description 1
- 235000011432 Prunus Nutrition 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 101150065817 ROM2 gene Proteins 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 241000220259 Raphanus Species 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 101710200251 Recombinase cre Proteins 0.000 description 1
- 241000242739 Renilla Species 0.000 description 1
- 241000725643 Respiratory syncytial virus Species 0.000 description 1
- 241000589187 Rhizobium sp. Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000606651 Rickettsiales Species 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000109329 Rosa xanthina Species 0.000 description 1
- 241000702670 Rotavirus Species 0.000 description 1
- 238000011579 SCID mouse model Methods 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101001025539 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Homothallic switching endonuclease Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 235000013290 Sagittaria latifolia Nutrition 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000607720 Serratia Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 241000256248 Spodoptera Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 108010039811 Starch synthase Proteins 0.000 description 1
- 108010085012 Steroid Receptors Proteins 0.000 description 1
- 102000007451 Steroid Receptors Human genes 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 108010043934 Sucrose synthase Proteins 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 101800001271 Surface protein Proteins 0.000 description 1
- 206010043376 Tetanus Diseases 0.000 description 1
- 235000009430 Thespesia populnea Nutrition 0.000 description 1
- 244000299492 Thespesia populnea Species 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- 241000723873 Tobacco mosaic virus Species 0.000 description 1
- 241000224526 Trichomonas Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 241000223104 Trypanosoma Species 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 241000196252 Ulva Species 0.000 description 1
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 1
- 241000219977 Vigna Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 241000815873 Xanthomonas euvesicatoria Species 0.000 description 1
- 108700031884 Xanthomonas pathogenicity Proteins 0.000 description 1
- UBORTCNDUKBEOP-HAVMAKPUSA-N Xanthosine Natural products O[C@@H]1[C@H](O)[C@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-HAVMAKPUSA-N 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 1
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 108700021044 acyl-ACP thioesterase Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 244000193174 agave Species 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- DTOSIQBPPRVQHS-PDBXOOCHSA-N alpha-linolenic acid Chemical compound CC\C=C/C\C=C/C\C=C/CCCCCCCC(O)=O DTOSIQBPPRVQHS-PDBXOOCHSA-N 0.000 description 1
- 235000020661 alpha-linolenic acid Nutrition 0.000 description 1
- 230000033115 angiogenesis Effects 0.000 description 1
- 229940121369 angiogenesis inhibitor Drugs 0.000 description 1
- 239000004037 angiogenesis inhibitor Substances 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000021016 apples Nutrition 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 206010003246 arthritis Diseases 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 239000000022 bacteriostatic agent Substances 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 235000021015 bananas Nutrition 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000004271 bone marrow stromal cell Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000007670 carcinogenicity Effects 0.000 description 1
- 231100000260 carcinogenicity Toxicity 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000007910 cell fusion Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 238000002659 cell therapy Methods 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 108010040093 cellulose synthase Proteins 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 230000007073 chemical hydrolysis Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 238000000749 co-immunoprecipitation Methods 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 235000015246 common arrowhead Nutrition 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000000448 cultured tumor cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 208000031513 cyst Diseases 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 108010005155 delta-12 fatty acid desaturase Proteins 0.000 description 1
- 108010011713 delta-15 desaturase Proteins 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 108020001096 dihydrofolate reductase Proteins 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 210000002304 esc Anatomy 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000006277 exogenous ligand Substances 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 208000024386 fungal infectious disease Diseases 0.000 description 1
- 244000053095 fungal pathogen Species 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 150000002314 glycerols Chemical class 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 210000004565 granule cell Anatomy 0.000 description 1
- 235000021384 green leafy vegetables Nutrition 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 230000010196 hermaphroditism Effects 0.000 description 1
- 238000005734 heterodimerization reaction Methods 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 239000003978 infusion fluid Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000011850 initial investigation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 108010093345 lens epithelium-derived growth factor Proteins 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 108020001756 ligand binding domains Proteins 0.000 description 1
- 229960004488 linolenic acid Drugs 0.000 description 1
- KQQKGWQCNNTQJW-UHFFFAOYSA-N linolenic acid Natural products CC=CCCC=CCC=CCCCCCCCC(O)=O KQQKGWQCNNTQJW-UHFFFAOYSA-N 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 102100034703 mRNA decay activator protein ZFP36L2 Human genes 0.000 description 1
- 208000002780 macular degeneration Diseases 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 235000013310 margarine Nutrition 0.000 description 1
- 239000003264 margarine Substances 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000034217 membrane fusion Effects 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 230000003228 microsomal effect Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000007658 neurological function Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000025308 nuclear transport Effects 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 229940049964 oleate Drugs 0.000 description 1
- 238000002966 oligonucleotide array Methods 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000035778 pathophysiological process Effects 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 238000012247 phenotypical assay Methods 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 108090000102 pigment epithelium-derived factor Proteins 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 239000004014 plasticizer Substances 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 230000001023 pro-angiogenic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 102000003998 progesterone receptors Human genes 0.000 description 1
- 230000000770 proinflammatory effect Effects 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 235000014774 prunus Nutrition 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 108091035233 repetitive DNA sequence Proteins 0.000 description 1
- 102000053632 repetitive DNA sequence Human genes 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 210000001995 reticulocyte Anatomy 0.000 description 1
- 210000003660 reticulum Anatomy 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 201000005404 rubella Diseases 0.000 description 1
- 235000012045 salad Nutrition 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 102000023888 sequence-specific DNA binding proteins Human genes 0.000 description 1
- 108091008420 sequence-specific DNA binding proteins Proteins 0.000 description 1
- 230000009919 sequestration Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 238000010374 somatic cell nuclear transfer Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 235000021012 strawberries Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 208000001608 teratocarcinoma Diseases 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 208000019553 vascular disease Diseases 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- UBORTCNDUKBEOP-UUOKFMHZSA-N xanthosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UUOKFMHZSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/21—Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
- C12Y301/21004—Type II site-specific deoxyribonuclease (3.1.21.4)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Cell Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Immunology (AREA)
- Ophthalmology & Optometry (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
본원은 폴리펩타이드, 폴리뉴클레오타이드 인코딩, 세포 및 TALE DNA 결합 도메인을 포함하는 신규 DNA 결합 도메인을 포함하는 유기체를 개시한다. 내인성 세포 서열의 유전자 발현 조절 및/또는 게놈 편집을 위한 이들 신규 DNA 결합 도메인을 사용하는 방법을 또한 개시한다.
Description
관련 출원에 대한 상호참조
본원은 2010년 5월 17일에 출원된 미국 가출원 제61/395,836호; 2010년 8월 12일에 출원된 제61/401,429호; 2010년 10월 13일에 출원된 제61/455,121호; 2010년 12월 20일에 출원된 제61/459,891호; 2011년 2월 2일에 출원된 제61/462,482호; 2011년 3월 24일에 출원된 제61/465,869호의 이익을 주장하며, 이의 전문이 본원에 참고로써 통합되어 있다.
연방 지원 연구 하에 이뤄진 발명에 대한 권리의 진술
해당 없음.
기술분야
본 발명은 조작된 DNA 결합 단백질을 이용하여 내인성 유전자 및 다른 게놈 좌위(locus)의 발현 상태를 유전적으로 변형시키고 조절하는 방법을 제공한다.
많은, 아마도 대부분의 생리학적 및 병리생리학적 과정들은 유전자 발현의 선택적인 상향 또는 하향조절에 의해 제어될 수 있다. 선택적인 조절에 의해 제어될 수 있는 병리학의 예는, 몇 가지 열거하면, 류마티스 관절염에서 염증유발(proinflammatory) 사이토카인의 부적절한 발현, 고콜레스테롤혈증에서 간 LDL 수용체의 저발현, 고체 종양 성장에서 혈관신생유발 인자(proangiogenic factor)의 과발현 및 혈관신생억제 인자의 저발현을 포함한다. 또한, 바이러스, 세균, 진균, 및 원생생물과 같은 병원체들은 이들의 숙주 세포의 유전자 발현을 변화시킴으로써 제어될 수 있다. 따라서, 간단하게 유익한 유전자를 상향조절하고 질병을 일으키는 유전자를 하향조절할 수 있는 치료 접근법에 대해 충족되지 않은 명확한 요구가 존재한다.
또한, 선택된 유전자의 선택적인 과발현 및 저발현을 가능하게 하는 간단한 방법이 과학계에 대단히 유용할 것이다. 세포 모델 시스템, 형질전환 동물 및 형질전환 식물에서 유전자 조절을 가능하게 하는 방법이 학계의 연구소, 제약 회사, 게놈 회사 및 생명공학 산업에서 광범위하게 사용될 것이다.
유전자 발현은 보통 전사 인자라 불리는 서열 특이적 DNA 결합 단백질의 기능 변화를 통해 제어된다. 이들은 프로모터에서의 전사 개시 복합체의 형성 또는 기능의 효율에 영향을 미치는 작용을 한다. 전사 인자는 긍정적인 방식(활성화) 또는 부정적인 방식(억제)으로 작용할 수 있다.
전사 인자 기능은 구성적(항상 "진행중") 또는 조건적일 수 있다. 조건적 기능은 다양한 수단에 의해 전사 인자에게 부여될 수 있지만, 이들 조절 기전의 대부분은 세포질에서의 상기 인자의 격리 및 유도성 방출 및 이후 핵 전좌(nuclear translocaton), DNA 결합 및 활성화(또는 억제)에 의존한다. 이러한 방식으로 기능하는 전사 인자의 예는 프로게스테론 수용체, 스테롤 반응 요소 결합 단백질(SREBP) 및 NF-카파 B를 포함한다. 이들의 동족 DNA 인식 서열에 결합하는 능력을 변화시킴으로써 인산화 또는 소분자 리간드에 반응하는 전사 인자들의 예가 있다(Hou et al., Science 256:1701 (1994); Gossen & Bujard, Proc . Nat'l Acad Sci 89:5547 (1992); Oligino et al., Gene Ther. 5:491-496 (1998); Wang et al., Gene Ther. 4:432-441 (1997); Neering et al., Blood 88:1147-1155 (1996); and Rendahl et al., Nat . Biotechnol. 16:757-761 (1998)).
아연 핑거 단백질("ZFP") 유래의 DNA 결합 도메인을 포함하는 재조합 전사 인자들은 내인성 유전자의 유전자 발현을 조절하는 능력을 갖는다(예컨대, 미국 특허 제6,534,261호; 제6,599,692호; 제6,503,717호; 제6,689,558호; 제7,067,317호; 제7,262,054호 참조). 이러한 아연 핑거 단백질을 함유하는 조작된 전사 인자를 이용한 임상 시험들은 이들 신규 전사 인자들이 다양한 질환을 치료할 수 있음을 보여주었다(예컨대, 문헌[Yu et al. (2006) FASEB J. 20:479-481] 참조).
게놈 생물학에서 또 다른 주된 관심 분야는, 특히 수많은 게놈의 전체 뉴클레오티드 서열의 결정에 비추어 볼 때, 게놈 서열의 표적화된 변화이다. 그러한 표적화된 절단 사건은, 예를 들어, 표적화된 돌연변이 형성을 유도하고, 세포 DNA 서열의 표적화된 결실을 유도하며, 미리 결정된 염색체 좌위에서의 표적화된 재조합을 촉진하는데 사용될 수 있다. 예를 들어, 미국 특허공보 제20030232410호; 제20050208489호; 제20050026157호; 제20050064474호; 제20060188987호; 제2008015996호, 및 국제공개 제WO 2007/014275호를 참조하며, 이들의 전문이 모든 목적을 위해 참조로써 본원에 통합되어 있다. 또한, 문헌[Santiago et al. (2008) Proc Natl Acad Sci USA 105:5809-5814; Perez et al. (2008) Nat Biotechnol 26:808-816 (2008)]을 참조한다.
설계된 DNA-결합 단백질(예컨대, FokI으로부터와 같은 뉴클레아제 절단 도메인에 연결된 아연-핑거 단백질(ZFP))에 뉴클레아제의 절단 도메인을 연결시키는 인공 뉴클레아제가 진핵 세포에서의 표적화된 절단을 위해 사용되어 왔다. 예를 들어, (1) 살아있는 세포의 게놈 내에, 특히 목적하는 변형을 위한 표적 부위에 이중 가닥 파손(double-strand break, DSB)을 생성함으로써, 그리고 (2) 자연적인 DNA 수선 기전을 통해 이 절단을 "치유"함으로써, 아연 핑거 뉴클레아제-매개의 게놈 편집(genome editing)이 특정 위치에 있는 인간 게놈의 서열을 변형시키는 것으로 나타났다.
특이성을 증가시키기 위해, 상기 절단 사건은, DNA 결합시 이량체화되어 촉매적으로 활성인 뉴클레아제 복합체를 형성하는 한 쌍 이상의 주문 설계된(custom-designed) 아연 핑거 뉴클레아제들을 이용하여 유도된다. 또한, 특이성은, 이종이량체(heterodimer)의 형성시에만 이중-가닥의 DNA를 절단하는 조작된 절단 절반-도메인(cleavage half-domain)을 포함하는 한 쌍 이상의 아연 핑거 뉴클레아제들을 이용하여 더 증가되었다. 예컨대, 전문이 참조로써 본원에 통합되어 있는, 미국 특허공개 제20080131962호를 참조한다.
인공 뉴클레아제에 의해 생성된 이중-가닥의 파손(DSB)은, 예를 들어 표적화된 돌연변이 형성을 유도하고, 세포 DNA 서열의 표적화된 결실을 유도하며, 미리결정된 염색체 좌위에서 표적화된 재조합을 촉진하기 위해 사용되어 왔다. 예를 들어, 모든 목적을 위해 전문이 참고로써 본원에 통합되어 있는, 미국 특허 공개 제20030232410호; 제20050208489호; 제20050026157호; 제20050064474호; 제20060188987호; 제20060063231호; 제20070218528호; 제20070134796호; 제20080015164호 및 국제 공개 제WO 07/014275호 및 제WO 2007/139982호를 참조한다. 따라서, 표적 게놈 위치에서 DSB를 생성하는 능력은 임의의 게놈의 게놈 편집을 가능하게 한다.
DSB를 수선하는 두 가지 주요한 별개의 경로인, 상동 재조합 및 비상동 말단-결합(NHEJ)이 존재한다. 상동 재조합은 세포 수선 과정을 가이드하는 주형("공여체(donor)"로 알려짐)으로서 상동 서열의 존재를 필요로 하며, 상기 수선의 결과는 오류가 없으며 예측가능하다. 상동 재조합을 위한 주형(또는 "공여체") 서열이 없는 경우, 세포는 통상적으로 오류가 발생하기 쉬운 NHEJ 과정을 통해 DSB를 수선하고자 시도한다.
잔토모나스 속의 식물 병원균은 중요한 작물에서 많은 질병을 유발하는 것으로 알려져 있다. 잔토모나스의 병원성은 25개가 넘는 상이한 효과기 단백질(effector protein)을 식물 세포 내로 주입하는 보존된 제III형 분비(T3S) 시스템에 의존한다. 이들 주입된 단백질 중에는 전사 활성자-유사 효과기(transcription activator-like effector) "TALE" 또는 "TAL-효과기"가 있는데, 이는 식물 전사 활성자를 모방하여 식물 전사체를 조작한다(Kay et al (2007) Science 318:648-651 참조). 이들 단백질은 DNA 결합 도메인 및 전사 활성화 도메인을 함유한다. 가장 잘 규명된 TALE 중 하나는 잔토모나스 캄페스트리스(Xanthomonas campestris pv. Vesicatoria) 유래의 AvrBs3이다(Bonas et al (1989) Mol Gen Genet 218: 127-136 및 제WO 2010079430호 참조). TALE는 DNA 인식을 매개하는 집중화된 반복 도메인(centralized repeat domain)을 함유하며, 각 반복 단위는 한 개의 표적 염기를 지정하는 대략 33-35개의 아미노산을 함유한다. TALE는 또한 핵 위치 서열(nuclear localization)과 몇 가지 산성 전사 활성화 도메인을 함유한다(검토를 위해, 문헌[Schornack S, et al (2006) J Plant Physiol 163(3): 256-272]을 참조한다). 또한, 식물병원성 박테리아 랄스토니아 솔라나세아룸(Ralstonia solanacearum)에서, brg11 및 hpx17로 명명된 2개의 유전자들이 랄스토니아 솔라나세아룸 생물변이형 1 균주 GMI1000 및 생물변이형 4 균주 RS1000에서의 잔토모나스의 AvrBs3 패밀리에 상동인 것으로 확인되었다(문헌[Heuer et al (2007) Appl and Envir Micro 73(13): 4379-4384] 참조). 이들 유전자들은 뉴클레오티드 서열이 서로 98.9% 동일하지만, hpx17의 반복 도메인 내에 1,575 bp가 결손된 점이 상이하다. 하지만, 두 유전자 산물들은 잔토모나스의 AvrBs3 패밀리 단백질과 40% 미만의 서열 동일성을 갖는다.
이들 TALE의 DNA-결합 특이성은 일렬(tandem) TALE 반복 단위에서 발견되는 서열에 의존한다. 상기 반복된 서열은 대략 33-35개의 아미노산을 포함하며 상기 반복은 통상적으로 서로 91-100% 상동이다(전술한 Bonas et al). 위치 12 및 13에 있는 초가변 이잔기(diresidue)의 신원(identity)과 TALE의 표적 서열 내의 인접 뉴클레오티드의 신원 사이에는 1 대 1 대응하는 것으로 보인다(문헌[Moscou and Bogdanove, (2009) Science 326:1501 and Boch et al (2009) Science 326:1509-1512] 참조). 이들 2개의 인접한 아미노산들은 반복 가변 이잔기(Repeat Variable Diresidue, RVD)라 불린다. 실험적으로, 위치 12 및 13에 있는 HD 서열이 시토신(C)에 결합하게 하고, NG가 T에 결합하고, NI가 A에 결합하고, NN이 G 또는 A에 결합하고, NG가 T에 결합하도록, 이들 TALE의 DNA 인식을 위한 천연 코드가 결정된다. 이러한 특이성을 결정하는 TALE 반복 단위들은 천연 TALE 반복 단위들과 변화된 수의 반복이 새롭게 조합된 단백질로 조립되어, 변이형 TALE 단백질을 만들어 왔다. 이들 변이형들이 이들의 본래의 구조 내에 있는 경우, 이들은 새로운 서열과 상호작용하고 식물 세포 내의 리포터 유전자의 발현을 활성화시킬 수 있다(전술한 Boch et al). 하지만, 이들 단백질은 본래의(전장) TALE 단백질 구조를 유지하며, 상기 컨스트럭트 내의 TALE 반복 단위의 수와 동일성만이 변화되었다. 또한 전체 또는 거의 전체 TALE 단백질이 FokI 단백질 유래의 뉴클레아제 도메인에 융합되어 TALE-뉴클레아제 융합 단백질("TALEN")을 생성하였으며, 이들 TALEN이 효모 세포에서 에피솜 리포터 유전자를 절단하는 것으로 나타났다(Christian et al . (2010) Genetics 186(2): 757-61; Li et al . (2011a) Nucleic Acids Res . 39(1):359-372). 또한 적절한 서열 증폭 계획이 사용되는 경우, 이러한 컨스트럭트들은 효모 세포에서 내인성 유전자를 정량화할 수 있는 수준까지 변형시키며, 포유동물 및 식물 세포에서 내인성 유전자를 검출가능하지만 정량화할 수 없는 수준까지 변형시킬 수 있다. 문헌[Li et al. (2011b) Nucleic Acids Res . epub doi:10.1093/nar/gkr188; Cermak et al .(2011) Nucleic Acids Res . epub doi:10.1093/nar/gkr218]을 참조한다. 식물과 동물 세포에서의 활성을 검출하기 위해 2단계 농축 계획(enrichment scheme)이 필요하였다는 사실은 거의 전체 TALE 단백질 및 FokI 단백질 유래의 뉴클레아제 도메인 간의 융합이 식물과 동물 세포에서 내인성 유전자를 효과적으로 변형시키지 못한다는 것을 보여준다. 즉, TALE 반복 배열을 FokI 절단 도메인에 연결하기 위해 이들 연구에 사용된 펩타이드들은 고등 진핵생물에서 내인성 유전자의 FokI 도메인에 의한 효과적인 절단을 허용하지 못한다. 그러므로, 이들 연구는 TALE 배열을 뉴클레아제 도메인과 연결하는데 사용될 수 있는, 내인성 진핵생물 환경에서 대단히 유효한 절단을 허용할 조성물을 개발할 필요성을 강조한다.
다양한 세포 유형에서 내인성 유전자를 조절하기 위한 조작된 전사 인자를 포함하는 다양한 적용분야를 위한 이들 결합 단백질의 범위, 특이성 및 유용성을 증가시키기 위한 조작된 DNA 결합 도메인, 및 수많은 모델, 진단 및 치료 시스템, 및 모든 방식의 게놈 조작 및 편집 적용에서 유사하게 사용될 수 있는 조작된 뉴클레아제가 여전히 요구된다.
발명의 요약
따라서 본 발명은 내인성 위치의 발현 상태 또는 서열의 표적 조작의 방법을 제공한다. 본 발명의 일부 구현예에서, 본 발명의 방법은 조작된 전사 인자, 조작된 뉴클레아제 ("TALEN"), 재조합효소, 전이효소, 인테그라아제, 메틸라아제, 효소 도메인 및 리포터를 형성하도록, 기능적 단백질 도메인에 융합된 TALE-반복 단위 (집합적으로 "TALE-융합")의 하나 이상을 포함하는 DNA 결합 단백질을 사용한다. 일부 측면에서, 폴리펩타이드는 내인성 표적 DNA에서 유능한 및 특이적 기능을 위해, 추가 TALE 단백질 서열에 연결된 TALE 반복 단위의 적어도 하나를 포함한다. TALE 반복 도메인 N-및 임의로 C-말단에 연결된 이들 추가 서열은 또한 "N-캡" 및 "C-캡" 서열로 불린다. 따라서, 본 발명은 하나 이상의 (예를 들면, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20 이상의) TALE 반복 및/또는 반-반복 단위를 포함하는 폴리펩타이드를 제공한다.
따라서, 일 측면에서, 본원에서 TALE 반복 단위의 적어도 하나 (예를 들면, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 이상의 반복 단위(들))를 포함하는 DNA 결합 폴리펩타이드가 제공된다. 폴리펩타이드는 전형적으로 TALE 반복(들)의 DNA 결합 기능 또는 TALE 융합 단백질의 기능적 활성을 지지하는 임의의 길이의 N-캡 서열 (폴리펩타이드)를 포함한다. 임의로, 폴리펩타이드는 또한 C-캡 서열 (폴리펩타이드), 예를 들면 대략 250 미만의 아미노산 (C+230 C-캡; 잔기 C-20 내지 잔기 C+230)의 C-캡 서열을 포함할 수 있다. 또한, 특정 구현예에서, 본원에 기재된 TALE 폴리펩타이드의 TALE 반복 단위의 적어도 하나는 비전형적인 반복 가변 2잔기 (RVD) 영역를 포함한다. TALE 반복 단위는 Xanthomonas, Ralstonia 또는 또 하나의 관련 박테리아로부터 단리된 야생형 도메일일 수 있고/있거나 일부 방식으로 조작될 수 있다 (예를 들면, 비-천연 발생일 수 있다). 특정 구현예에서, TALE 반복 단위의 적어도 하나는 조작된다 (예를 들면, 비-천연 발생, 비전형적인, 최적화 코돈, 이들의 조합 등). 특정 구현예에서, TALE 반복 도메인에서의 하나 이상의 아미노산 (예를 들면, TALE 반복들 중의 하나 내의 RVD)는, 도메인이 (천연 발생 TALE DNA 결합 도메인에 의해 결합된 표적 서열로부터 전형적으로 상이한) 선택된 표적 서열에 결합되도록 변경된다. 다른 구현예에서, TALE 반복 단위의 적어도 하나는 TALE 반복 단위 내의 위치 4, 11, 12, 13 또는 32에서 아미노산의 일부 또는 모두에서 변형된다. 일부 구현예에서, TALE 반복 단위의 적어도 하나는 TALE 반복들 중의 하나 내에 위치 2, 3, 4, 11, 12, 13, 21, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 34, 또는 35에서 아미노산의 하나에서 변형된다. 다른 구현예에서, TALE 반복을 인코딩하는 핵산은, DNA 서열이 변경되지만 아미노산 서열이 아니도록 변형된다. 일부 구현예에서, DNA 변형은 코돈 최적화의 목적을 위한 것이다. 추가 구현예에서, TALE 반복 단위의 적어도 하나는 상기 기재된 변형의 조합에 의해 변경된다. 일부 구현예에서, 몇 개의 변형된 TALE 반복 단위를 포함하는 TALE 단백질이 제공된다. 천연 발생 및 비-천연 발생 TALE 반복 단위의 조합이 또한 제공된다. 바람직한 구현예에서, TALE 단백질 (야생형 또는 조작된)은 추가로, 내인성 표적 DNA에서 유능하고 특이적인 기능을 위해 N-캡 및 임의로 C-캡 서열을 포함한다. 일부 구현예에서, N-캡은 잔기 N+1 내지 N+136 (참고 잔기 넘버링 도식의 설명을 위한 도 1b), 또는 그의 임의의 단편을 포함한다. 다른 구현예에서, C-캡은 잔기 C-20 내지 C+28, C-20 내지 C+39, C-20 내지 C+55, 또는 C-20 내지 C+63 또는 그의 전체 길이 TALE C-말단의 임의의 단편. 특정 구현예에서, TALE 반복 도메인, 뿐만 아니라 N-캡 및 임의의 C-캡 서열을 포함하는 폴리펩타이드는 추가로, 조절 또는 기능적 도메인, 예를 들면, 전사 활성제, 전사 억제제, 뉴클레아제, 재조합효소, 전이효소, 인테그라아제, 메틸라아제 등을 포함한다.
이들 단백질을 인코딩하는 폴리뉴클레오타이드는 또한 약제학적 조성물로서 제공된다. 또한, 본 발명은 이들 단백질/폴리뉴클레오타이드을 포함하고/하거나 이들 단백질 (예를 들면, 자손에게 이전된 게놈 변형)에 의해 변형된 숙주세포, 세포주 및 이식유전자 유기체 (예를 들면, 식물, 진균류, 동물)을 포함한다. 예시적인 세포 및 세포주는 동물 세포 (예를 들면, 인간, 세포, 예컨대 줄기세포를 포함하는 포유동물), 식물 세포, 박테리아 세포, 원생동물 세포, 물고기 세포, 또는 진균 세포를 포함한다. 또 하나의 구현예에서, 세포는 포유동물 세포이다. 이들 단백질 및/또는 폴리뉴클레오타이드를 제조하고 사용하는 방법이 또한 제공된다.
일 측면에서, 하나 이상의 비상동 폴리펩타이드 도메인, 예를 들면 기능적 (조절) 도메인에게 작동가능하게 연결된 하나 이상의 조작된 TALE 반복 단위, N-캡, 및 임의의 C-캡 서열을 포함하는 융합 단백질이 본원에서 제공된다. TALE 반복의 모듈을 포함하는 라이브러리는, 조작된 TALE 반복을 관심 기능적 단백질 도메인에 연결시키기 위해 임의 구조로 되거나 유연한 링커로서 제공된다. 기능적 단백질 도메인 (예를 들면, 전사 활성제, 억제제, 또는 뉴클레아제)는 융합 단백질의 C-또는 N-말단에서 위치할 수 있다. 본원에 기재된 융합 단백질을 제조하는 방법이 또한 제공된다.
본 발명은 또한 조작된 TALE 융합 단백질에 대한 적당한 표적 서열 (부위)을 확인하는 방법을 제공한다. 일부 구현예에서, 확인된 표적 부위는 천연 TALE 표적 서열과 비교하여 구아닌 뉴클레오타이드 ("G")의 증가된 수를 갖는다. 다른 구현예에서, 표적은 천연 발생 TALE 단백질에서는 전형적인 바와 같이 피미딘 뉴클레오타이드 ("T")를 플랭킹(flanking)하는 것을 필요로 하지 않는다. 일부 구현예에서, 조작된 TALE 단백질에서 사용하기 위해 선택된 RVD는 표적 서열에서 G 뉴클레오타이드의 인식을 위해 하나 이상의 NK (아스파라긴 - 리신) RVD를 함유한다. 이 발명은 신규 (비-천연 발생) RVD를 추가로 제공하고, 이는 뉴클레오타이드 염기를 인식할 수 있는 본성에서 발견된 것과는 상이하다. 비전형적인 또는 비-천연 발생 RVD (TALE 반복 단위의 위치 12 및 13에서 아미노산 서열)의 비제한적인 예는 표 30a에서 보여진 RVD, 예를 들면, T를 인식하기 위한 VG 및 IA, A 및 T를 인식하기 위한 RG, 및 A, C, 및 T를 인식하기 위한 AA를 포함한다. 또한 모든 뉴클레오타이드 염기 (예를 들면, A, C, T, 및 G)와 동등하게 상호작용할 수 있는 RVD가 제공된다. 본원에 기재된 조성물 및 방법에서 유용한 추가 RVD가 표 27에서 보여진다.
본 발명에 의해 또한 제공된 방법은 사용자의 선택에 의해, TALE-뉴클레아제 ("TALEN") 헤테로다이머에 의해 변형이 수행된 핵산 상의 2개의 표적 부위 사이의 거리 또는 갭 간격을 억제하거나 억제하기 않는다. 일부 구현예에서, 갭 간격은 12-13 염기쌍으로 억제되고, 한편 다른 구현예에서, 조작된 TALEN은 12 내지 21개의 염기쌍이 갭 간격을 포함하는 DNA 표적들을 절단하도록 디자인된다. 일부 구현예에서, TALEN 헤테로다이머는 각 모노머 결합 부위 사이의 1 내지 34개의 뉴클레오타이드의 갭을 포함하는 서열을 절단하도록 디자인된다. 또 더 많은 구현예에서, TALEN은 +28 C-말단 절단 (C+28 C-캡)을 포함하는 TALEN 구성을 이용하여 12 또는 13개의 염기쌍 갭을 갖는 표적을 절단하도록 억제된다. 다른 구현예에서, 설계된 TALEN은 +63 C-말단 절단을 포함하는 TALEN 구성을 사용하여 12 내지 21개의 염기쌍 갭 간격을 포함하는 표적 핵산을 절단하도록 만들어지고, 이는 갭 간격 요건에서의 적응성에 기인하여 적당한 TALEN 표적 부위를 확인할 수 있는 가능성을 증가시킨다. 일부 구현예에서, TALEN은, R1/2 반복이 T 이외의 뉴클레오타이드 염기를 표적으로 할 수 있도록 조작된 R1/2 반복을 갖는다.
또 하나의 측면에서, 본 발명은 조작된 TALE DNA 결합 도메인 융합을 위한 벡터를 제공하고, 여기서 상기 벡터는 다중 TALE 반복 단위, 링커 서열, 프로모터, 선택성 마커, 폴리아데닐화 신호 부위, 기능적 단백질 도메인 등의 클로닝을 허용하도록 TALE 반복 서열을 플랭킹하는 TALE N-캡 및 C-캡 서열 뿐만 아니라 위치를 포함한다. 본원에 의해 또한 제공된 발명은 특이적 TALE DNA 결합 도메인 도메인 및 이들 도메인 (예를 들면, TALEN)을 포함하는 융합 단백질의 준비된 어셈블리를 위한 적어도 하나의 TALE-반복 단위 (예를 들면, 조작된)를 포함하는 모듈 아르키브 라이브러리의 구성하는 방법이다.
또 하나의 측면에서, 본 발명은 세포에서 내인성 세포 유전자의 발현를 조절하는 방법을 제공하고, 상기 방법은 하기 단계들을 포함한다: 내인성 세포 유전자에서의 제1 표적 부위를 기능적 도메인 (예를 들면, 전사 조절자 도메인)에 융합된 제1 조작된 TALE와 접촉시켜, 내인성 세포 유전자의 발현을 조절하는 단계. 또 하나의 측면에서, 본 발명은 세포에서 내인성 세포 유전자의 발현을 조절하는 방법을 제공하고, 상기 방법은 하기 단계들을 포함한다: 내인성 세포 유전자에서의 표적 부위를 융합 TALE 단백질과 접촉시키는 단계로서, 상기 TALE는, TALE가 원하는 서열에 대해 특이성을 갖도록 조작된 TALE 반복 도메인을 포함하는 단계. 일부 구현예에서, 조절 효과는 내인성 유전자의 발현을 활성화하는 것이다. 일부 구현예에서, 내인성 유전자의 발현이 억제된다. 또 하나의 구현예에서, 내인성 유전자의 활성화 또는 억제는, 내인성 활성제 또는 억제제가 관심 유전자의 조절자 영역에 결합되수 없도록 TALE 융합 단백질의 결합에 의해 조절된다.
일 구현예에서, 접촉 단계는 추가로, 내인성 세포 유전자에서의 제2 표적 부위를 제2 조작된 TALE 융합 단백질과 접촉시켜서 제2 내인성 세포 유전자의 발현을 조절하는 것을 포함한다. 또 하나의 구현예에서, 제1 및 제2 표적 부위는 인접되어 있다. 특정 구현예에서, 제1 및 제2 표적 부위는, 예를 들면 TALE-전사 인자를 사용하여 2개 이상의 유전자의 발현을 조절하기 위해 상이한 유전자에 있다. 다른 구현예에서, 제1 및 제2 표적 부위는, 예를 들면 한 쌍의 TALEN 융합 단백질이 동일한 유전자에서 절단하도록 사용될 때 동일한 유전자에 있다. 제1 및 제2 표적 부위는 임의의 염기쌍 ("갭 크기"), 예를 들면, 1 내지 20 (또는 그 사이의 임의의 수) 또는 더 많은 염기쌍에 의해 분리된다. 또 하나의 구현예에서, 접촉 단계는 추가로, 2개 초과의 표적 부위를 접촉시키는 것을 포함한다. 특정 구현예에서, 2개 세트의 표적 부위는 2개의 쌍의 TALEN에 의해 접촉되고, 2개 세트의 표적에서 특이적 결실 또는 삽입을 만들기 위해 사용된다. 또 하나의 구현예에서, 제1 TALE 단백질은 조절 또는 기능적 도메인을 포함하는 융합 단백질이다. 또 하나의 구현예에서, 제1 TALE 단백질은 적어도 2개의 조절 또는 기능적 도메인을 포함하는 융합 단백질이다. 또 하나의 구현예에서, 제1 및 제2 TALE 단백질은 융합 단백질이고, 각각은 조절 도메인을 포함한다. 또 하나의 구현예에서, 제1 및 제2 TALE 단백질은 융합 단백질이고, 이들 각각은 적어도 2개의 조절 도메인을 포함한다. 하나 이상의 기능적 도메인은 TALE 단백질의 말단 중 하나 (또는 둘 모두)에 융합될 수 있다. 임의의 TALE 융합 단백질은 이들 단백질을 인코딩하는 폴리뉴클레오타이드로서 제공될 수 있다.
또 하나의 측면에서, 본 발명은 뉴클레아제 도메인을 본원에 기재된 TALE 반복 도메인에 연결하는 C-캡을 위한 조성물을 제공하고, 여기서 상기 수득한 융합 단백질은 고활성 뉴클레아제 기능을 나타낸다. 일부 구현예에서, C-캡은 천연 TALE C-말단 측면 서열로부터 펩타이드 서열을 포함한다. 다른 구현예에서, C-캡은 TALE 반복 도메인으로부터 펩타이드 서열을 포함한다. 또 하나의 구현예에서, C-캡은 TALE 단백질로부터 유래되지 않는 서열을 포함한다. C-캡은, 예를 들면 천연 TALE C-말단 측면 서열 및/또는 TALE 반복 도메인으로부터의 펩타이드 서열 및/또는 비-TALE 폴리펩타이드을 포함하는 키메라 구조를 또한 나타낼 수 있다.
본원에 기재된 임의의 조성물 또는 방법에서, 조절 또는 기능적 도메인은 전사 억제제, 전사 활성제, 뉴클레아제 도메인, DNA 메틸트랜스페라제, 단백질 아세틸트랜스페라제, 단백질 데아세틸라제, 단백질 메틸트랜스페라제, 단백질 데아미나제, 단백질 키나아제, 및 단백질 포스파타제로 이루어진 그룹으로부터 선택될 수 있다. 일부 측면에서, 기능적 도메인은 후생유전 조절자이다. 식물에서, 그와 같은 TALE 융합은 표준 기술을 사용하여 이종교배에 의해 제거될 수 있다. 그와 같은 구현예에서, 융합 단백질은 비-제한적 예로서, 히스톤 메틸트랜스페라제, DNA 메틸트랜스페라제, 또는 히스톤 데아세틸라제와 같은 후생유전 조절자를 포함한다. 참고 예를 들면, 공유 미국 특허 7,785,792.
따라서, 일부 측면에서, TALE 융합 단백질은 뉴클레아제 도메인에 융합된 TALE-반복 도메인 ("TALEN")을 포함한다. 상기 언급한 바와 같이, 일부 구현예에서, TALE 반복 도메인은 N-캡 서열, 및 임의로, C-캡 서열에 추가로 융합된다. 다른 구현예에서, 뉴클레아제 도메인은 뉴클레아제 도메인의 유능한 촉매 기능을 제공하는 링커 펩타이드 서열을 통해 N-캡의 아미노 말단 또는 C-캡의 카복시 말단에 연결된다. 뉴클레아제 도메인은 천연 발생일 수 있거나 조작된 또는 비-천연 발생일 수 있다. 일부 구현예에서, 뉴클레아제 도메인은 유형 IIS 뉴클레아제 (예를 들면, FokI)으로부터 유래된다. 다른 구현예에서, TALE DNA 결합 도메인은 Bfi I 뉴클레아제 도메인에 작동가능하게 연결된다. 일부 구현예에서, FokI 도메인은 2개의 절단 하프도메인을 포함하는 단일 사슬 뉴클레아제 도메인이고, 다른 것에서, FokI 절단 하프도메인이다. 본 발명의 일부 측면에서, 단일 TALEN 단백질은 표적 DNA에서 이중가닥 절단을 유도하기 위해 자체로 사용되고, 한편 다른 것에서, TALEN은 한 쌍의 뉴클레아제의 일부로서 사용된다. 일부 구현예에서, 상기 쌍은 FokI 하프도메인을 포함하는 2개의 TALEN을 포함하고, 여기서 FokI 하프도메인의 상기 접합은 DNA 절단을 달성하기 위해 필요하고, 한편 다른 경우에, TALEN 단백질은 아연-핑거 뉴클레아제와 조합하여 사용되고, 여기서 2개의 FokI 절단 도메인의 접합은 DNA 절단을 달성하기 위해 필요하다. 일부 구현예에서, TALE DNA 결합 도메인은 아연 핑거/TALE 하이브리드 DNA 결합 도메인을 만들기 위해 아연 핑거에 융합된다. 일부 예에서, 하이브리드 DNA 결합 도메인은 DNA 표적 결합 부위 내의 DNA 염기의 내부 스트래치(stretch)와의 상호작용을 건너뛸 수 있다. 일부 구현예에서, FokI 도메인은 호모다이머를 형성할 수 있고, 다른 예들에서, TALEN 쌍의 각 수로부터 2개의 비-확인된 FokI 절단 도메인의 헤테로다이머화는 표적화된 절단 활성에 필요하다. 이들 헤테로다이머 TALEN 쌍에서, 동일한 유형의 2개의 FokI 도메인이 생산적으로 호모다이머화할 수 있는 것은 아니다. 다른 구현예에서, TALEN 쌍이 사용되고, 여기서 1개의 FokI 절단 도메인은 비활성이고, 이로써 접합이 일어날 수 있지만, 표적 DNA은 가닥들 둘 모두를 절단하기 보다는 1개의 가닥의 DNA 분자 상의 절단을 생성하도록 표시된다.
본원에 기재된 임의의 조성물 또는 방법에서, TALE 융합 단백질은 TALE 융합 단백질 핵산에 의해 인코딩될 수 있다. 특정 구현예에서, TALE 융합 단백질은 인코딩하는 서열은 프로모터에 작동가능하게 연결된다. 따라서, 특정 구현예에서, 내인성 유전자 발현 또는 게놈 변형을 조절하는 방법은 추가로, 먼저 TALE 단백질을 인코딩하는 핵산을 세포에 투여하는 단계를 포함한다. TALE-융합 단백질은 발현 벡터, 예컨대 레트로바이러스 발현 벡터, 아데노바이러스 발현 벡터, DNA 플라스미드 발현 벡터, 또는 AAV 발현 벡터로부터 발현될 수 있다. 일부 구현예에서, 발현 벡터는 렌티바이러스 벡터이고, 이들 구현예의 일부에서, 렌티바이러스 벡터는 결함있는 인테그라아제이다.
또한 본 발명에는 임의의 세포 유형에서 임의의 원하는 표적 위치 (예를 들면, 내인성 유전자)에 대해 특이적인 TALEN (예를 들면, TALEN 쌍)이 제공된다. 비-제한적 예는 NTF3, VEGF, CCR5, IL2Rγ, BAX, BAK, FUT8, GR, DHFR, CXCR4, GS, Rosa26, AAVS1 (PPP1R12C), MHC 유전자, PITX3, ben-1, Pou5F1 (OCT4), C1, RPD1 등에 대해 특이적인 TALEN을 포함한다.
본원에 기재된 TALE-반복 도메인은 내인성 세포 유전자의 전사 개시 부위의 상류이거나 그 부위에 인접한 표적 부위에 결합할 수 있다. 대안적으로, 표적 부위는 내인성 세포 유전자의 전사 개시 부위의 RNA 폴리머라제 정지 부위 하류에 인접할 수 있다. 또 추가의 구현예에서, TALE 융합 단백질 (예를 들면, TALEN)는 코딩 영역의 상류 또는 하류로, 유전자, 예를 들면, 선도 서열, 트레일러(trailer) 서열 또는 인트론(intron) 내이거나 그것에 인접하거나, 비-전사된 영역 내의 비-코딩 서열에서의 부위에 결합한다.
또 하나의 측면에서, 세포에서 관심 하나 이상의 유전자를 절단하는 방법이 본원에서 기재되어 있고, 상기 방법은 하기를 포함한다: (a) 세포에, TALEN 단백질(들)이 발현되고 하나 이상의 유전자는 절단되는 조건 하에서 하나 이상의 유전자에서 표적 부위에 결합하는 하나 이상의 TALEN 단백질(들) (또는 TALEN을 인코딩하는 폴리뉴클레오타이드)에 도입하는 단계. 2개 이상의 TALEN 단백질이 도입되는 구현예에서, 하나, 일부 또는 모든 것은 폴리뉴클레오타이드로서 또는 폴리펩타이드로서 도입될 수 있다. 일부 측면에서, 상기 유전자 절단으로 표적화된 유전자의 기능적 분열이 생긴다. 표적화된 DNA의 절단은 NHEJ이 뒤따를 수 있고, 여기서 작은 삽입 또는 결실 (indel)는 절단의 부위에서 삽입된다. 그 다음 이들 indel는 절단 위치에서 비특이적 돌연변이의 도입을 통해 기능적 분열을 멈추게 한다.
또 하나의 측면에서, 외인성 서열을 세포의 게놈에 도입하는 방법에 본원에 기재되어 있고, 상기 방법은 하기 단계들을 포함한다: (a) 세포에, TALEN 단백질(들)기 발현되고 유전자 내의 하나 이상의 표적 부위가 절단되는 조건 하에서 표적 유전자에서 표적 부위에 결합하는 하나 이상의 TALEN 단백질(들) (또는 TALEN을 인코딩하는 폴리뉴클레오타이드 단백질(들))을 도입하는 단계; 및 (b) 상기 세포를 외인성 폴리뉴클레오타이드와 접촉시키는 단계; 이로써 DNA 표적 부위(들)의 절단은 상동 재조합에 의해 외인성 폴리뉴클레오타이드의 게놈으로의 통합을 자극한다. 특정 구현예에서, 외인성 폴리뉴클레오타이드는 게놈에 물리적으로 통합된다. 다른 구현예에서, 외인성 폴리뉴클레오타이드는 이중가닥 절단의 상동 지향성 복구 (HDR)와 연과된 전문화된 핵산 복제 관정을 통해 외인성 서열을 숙주세포 게놈에 복사하여 게놈에 통합된다. 또 다른 구현예에서, 게놈으로의 통합은 비-상동 의존 표적화된 통합 (예를 들면, "말단-포획")을 통해 일어난다. 일부 구현예에서, 외인성 폴리뉴클레오타이드는 동족 재조합효소 (예를 들면, Cre 또는 FRT, 각각)에 의해 인식을 위해 재조합효소 인식 부위 (예를 들면, loxP 또는 FLP)를 포함한다. 특정 구현예에서, 외인성 서열은 작은 동물 (예를 들면, 토끼 또는 설치류, 예컨대 마우스, 랫트 등)의 게놈에 통합된다. 일 구현예에서, TALE-융합 단백질은 전이효소, 재조합효소 또는 인테그라아제를 포함하고, 여기서 상기 TALE-반복 도메인은 특이적으로 원하는 표적 서열을 인식하기 위해 조작되었다. 일부 구현예에서, TALE 폴리펩타이드가 사용된다. 일부 측면에서, TALE-융합 단백질은 트랜스포사제 또는 인테그라아제를 포함하고, CHO-세포 특이적 전이효소/인테그라아제 시스템의 개발을 위해 사용된다.
일부 구현예에서, TALE-융합 단백질은 메틸트랜스페라제를 포함하고, 여기서 상기 TALE-반복 도메인은 특이적으로 원하는 표적 서열을 인식하기 위해 조작되었다. 일부 구현예에서, TALE-반복 도메인은 게놈 또는 크로마틴의 후생유전 변형을 초래하도록 기능하는 단백질 복합체의 서브유닛에 융합된다.
또 추가의 구현예에서, 상기 TALE-융합은 추가로, 리포터 또는 선택 마커를 포함하고, 여기서 상기 TALE-반복 도메인은 특이적으로 원하는 표적 서열을 인식하기 위해 조작되었다. 일부 측면에서, 리포터는 형광 마커이고, 한편 다른 측면들에서, 리포터는 효소이다.
또 하나의 측면에서, 하나 이상의 TALE-융합 단백질을 포함하는 조성물이 본원에 기재되어 있다. 특정 구현예에서, 조성물은 약제학적으로 허용가능한 부형제와 함께 하나 이상의 TALE-융합 단백질을 포함한다. 일부 구현예에서, 조성물은 TALE 융합 단백질을 인코딩하는 폴리뉴클레오타이드를 포함한다. 일부 구현예는 TALEN를 인코딩하는 DNA 분자를 포함하는 조성물을 포함한다. 다른 구현예에서, 조성물은 TALEN를 인코딩하는 RNA 분자를 포함한다. 일부 조성물은 추가로, 핵산 공여체 분자를 포함한다.
또 하나의 측면에서, 본원에 기재된 하나 이상의 TALE-융합 단백질을 인코딩하는 폴리뉴클레오타이드가 기재되어 있다. 폴리뉴클레오타이드는, 예를 들면, mRNA일 수 있다.
또 하나의 측면에서, 프로모터 (예를 들면, 구조적, 유도성, 조직 특이적 등)에 작동가능하게 연결된 본원에 기재된 하나 이상의 TALE-융합 단백질을 인코딩하는 폴리뉴클레오타이드를 포함하는 TALE-융합 단백질 발현 벡터가 본원에 기재되어 있다.
또 하나의 측면에서, 하나 이상의 TALE-융합 단백질 및/또는 하나 이상의 폴리뉴클레오타이드 (예를 들면, 본원에 기재된 TALE-융합 단백질을 인코딩하는 발현 벡터를 포함하는 숙주세포가 본원에 기재되어 있다. 특정 구현예에서, 숙주세포는 추가로, 벡터를 인코딩하는 아연 핑거 단백질 및/또는 ZFP 중 하나 이상을 포함한다. 숙주세포는 하나 이상의 이들 단백질 발현 벡터를 갖는 안정하게 형질전환되거나 일시적으로 형질감염된 이의 조합일 수 있다. 다른 구현예에서, 하나 이상의 단백질 발현 벡터는 숙주세포에서 1개 또는 융합 단백질을 발현시킨다. 또 하나의 구현예에서, 숙주세포는 추가로, 외인성 폴리뉴클레오타이드 공여체 서열을 포함할 수 있다. 임의의 원핵 또는 진핵 숙주세포가 이용될 수 있고, 이 세포는 비제한적으로, 박테리아, 식물, 물고기, 효모, 조류, 곤충, 벌레 또는 포유동물 세포를 포함한다. 일부 구현예에서, 숙주세포는 식물 세포이다. 다른 측면들에서, 숙주세포는 식물 조직의 일부, 예컨대 식물의 채소부, 보관 기관, 과일, 꽃 및/또는 씨드 조직이다. 추가 구현예에서, 숙주세포는 조류 세포이다. 다른 구현예에서, 숙주세포는 섬유아세포이다. 임의의 구현예에서, 본원에서 기재된 바와 같이, 숙주세포는 줄기세포, 예를 들면 배아 줄기세포를 포함할 수 있다. 줄기세포는 포유동물 줄기세포, 예를 들면, 조혈 줄기세포, 간엽 줄기세포, 배아 줄기세포, 신경 줄기세포, 근육 줄기세포, 간 줄기세포, 피부 줄기세포, 유도만능 줄기세포 및/또는 이들의 조합일 수 있다. 특정 구현예에서, 줄기세포는 인간 유도만능 줄기세포 (hiPSC) 또는 인간 배아 줄기세포 (hESC)이다. 임의의 구현예에서, 본원에서 기재된 바와 같이, 숙주세포는 배아 세포, 예를 들면 하나 이상의 마우스, 랫트, 토끼 또는 다른 포유동물 세포 배아를 포함할 수 있다. 일부 측면에서, 줄기세포 또는 배아 세포는. 예를 들면 돌연변이가 유전성인 생식계열로 통합되는 TALE 매개된 게놈 변형을 갖는 동물을 포함하는 이식 유전자 동물의 개발에 사용된다. 추가 측면에서, 이들 이식유전자 동물은 연구 목적을 위해 사용된 것들, 즉 마우스, 랫트, 토끼이고; 한편 다른 측면들에서, 이식유전자 동물은 가축 동물, 즉 소, 닭, 돼지, 양 등. 또 추가의 측면들에서, 이식유전자 동물은 치료 목적을 위해 사용된 것들, 즉 염소, 소, 닭, 돼지이고; 다른 측면들에서, 이식유전자 동물은 반려 동물, 즉 고양이, 개, 말, 새 또는 물고기이다.
본 발명의 의해 제공된 또 하나의 측면에서 TALE 결합을 위해 적당한 핵산 표적을 확인하는, 방법. 일부 구현예에서, 표적은 전형적인, 천연 발생 TALE 단백질에 의해 사용된 표적 부위에 대한 유사성을 기반으로 선택된다. 다른 구현예에서, 전형적인, 천연 발생 TALE 단백질에 의해 이용되지 않는 표적이 선택되는 것은, 조작된 TALE 단백질이 비전형적인, 표적 서열과 상호작용하도록 하는 방식으로 변경되었기 때문이다. 일부 구현예에서, 이 변경은 비전형적인 (비-천연 발생 또는 희귀한) RVD 서열의 선택을 수반한다. 추가 구현예에서, 사용된 비전형적인 RVD는 원하는 표적 서열에서 G 잔기의 인식을 위한 'NK' RVD이다. 다른 구현예에서, 비-천연 비의 핵산 염기를 함유하는 표적이 선택되는 것은, 조작된 TALE 단백질이 비-천연 비의 핵산 염기와 상호작용하도록 하는 방식으로 변경되었기 때문이다. 일부 구현예에서, 원하는 표적 서열에서 염기의 비는 비정상적인 수의 G 잔기를 포함한다. 다른 구현예에서, 원하는 표적 서열에서 염기의 비는 비정상적인 수의 비전형적인 디-뉴클레오타이드, 트리-뉴클레오타이드 또는 테트라-뉴클레오타이드를 포함한다. TALE-DNA 결합 상호작용을 위한 최고 최적의 표적을 확인하기 위한 디자인 규칙이 또한 제공된다. 이들 규칙은 최적의 디-및 트리-뉴클레오타이드 쌍을 포함하는 표적 부위 서열의 선택에 대한 지침을 제공한다. 또한, 이들 규칙은 또한 덜한 최적의 디-및 트리-뉴클레오타이드 쌍에 대한 지침을 제공하고, 이로써 당업자은 필요하면 이들 서열을 피할 수 있다. 또한 표적 서열의 선택시 더 적응성을 사용자에게 제공하기 위해 모든 뉴클레오타이드와 상호작용할 수 있는 RVD가 제공된다.
일 측면에서, 본 발명은 생체내 게놈 조작을 위한 조성물 및 방법을 제공한다. 특정 구현예에서, TALEN를 인코딩하는 mRNA는 바람직한 특이적 DSB를 도입하기 위해 생식선, 난자 또는 배아에 주입될 수 있다. 일부 구현예에서, 공여체 뉴클레오타이드는 유기체에서 특이적 표적화된 통합을 멈추게 하기 위해 TALEN mRNA와 함께 전달된다.
또 추가 측면에서, 본 발명의 TALE-도메인 단백질 (및 이들 TALE-반복 단백질을 포함하는 융합 단백질)을 포함하는 키트가 본원에 제공된다. 이들 키트는 사용자에 의해 게놈 조작을 쉽게 하기 위해 사용될 수 있고, 이로써 예를 들면, 게놈 내의 원하는 표적 또는 안전한 하버(harbor) 위치를 절단할 TALEN를 제공할 수 있다. TALEN는 핵산 (예를 들면, DNA 또는 RNA)으로서 제공될 수 있거나 단백질로서 제공될 수 있다. 일부 예에서, 단백질은 안정성을 증가시키기 위해 제형될 수 있거나, 건조된 형태로 제공될 수 있다. 일부 예에서, 키트는 진단 목적을 위해 사용된다. 일부 예에서, 키트에 포함된 TALE-융합물은 조절자이다. 일부 예에서, TALE-융합은 리포터를 포함한다.
도 1의 패널 A 및 B는 TALE 단백질을 묘사한다. 도 1a는 TALE 단백질의 도메인 구조의 개요도(일정한 비율로 그려지지 않음)를 보여준다. 'N' 및 'C'는 각각 아미노 및 카르복시 말단을 나타낸다. TALE 반복 도메인, N-캡 및 C-캡이 표시되어 있으며, 이 단백질 내의 N-캡 및 C-캡에 대한 잔기 번호 체계가 나타나 있다. "R0"은 제1 일렬 TALE 반복 앞에 선행하는 34개 아미노산을 나타내며, 이는 TALE 반복 단위와 일부 구조적 상동을 가지며 DNA 표적 서열 내의 티민을 지정할 수 있다. "R1 /2"은 C-말단 TALE "절반-반복(half-repeat)"을 나타내며, 이는 통상적인 TALE 반복 중 첫 번째 20개 잔기에 대해 상동성을 갖는 20개의 잔기 펩타이드 서열(잔기가 C-20부터 C-1으로 번호가 매겨짐)이다. NLS는 핵 위치 서열이다. AD는 산성 활성화 도메인이다. 도 1b(SEQ ID NO: 135)는 N-말단 1-152 아미노산 잔기를 결실시키고자 설계된 클로닝 체계를 이용하여 분리된, 클로닝된 자연적인 TALE 단백질(이하 "TALE13"로 지칭함)의 일차 서열을 보여준다. N-캡 및 C-캡은 상기 서열 아래에 짙은 검정색 선으로 나타나 있고, 상기 N-캡 내의 위치 N+1 및 N+136 및 C-캡 내의 위치 C+1 및 C+278이 나타나 있다. 절반 반복은 "C+1"로 나타낸 위치 바로 앞의 C-캡 및 말단의 첫 번째 20개 잔기이다. TALE 반복 및 절반 반복에서 밑줄친 잔기들은 표적 결합 중 상기 반복에 의해 접촉된 DNA 뉴클레오티드를 지정하는 아미노산(RVD)들을 나타낸다.
도 2의 패널 A 및 B는 TALE13(TR13)의 예측된 표적에 사용하기 위한 리포터 컨스트럭트를 보여준다. 도 2a(SEQ ID NO:136)는 벡터 내로 1-4 TR13 표적를 삽입하는데 사용되는 클로닝 부위를 나타낸 리포터 벡터의 개요도를 보여준다. 이탤릭체로 된 영역은 루시퍼라아제 유전자에 대한 프로모터 영역이다. 도 2b(SEQ ID NO:137)는 두 개의 TR13 표적을 함유하는, 사용된 링커 서열을 보여준다.
도 3의 패널 A 및 B는 0-4 TR13 표적을 함유하는 리포터 컨스트럭트의 개요도(도 3a) 및 각각 R13x1 내지 R13x4로 표시된 1 내지 4개의 다수의 TR13 표적을 함유하는 루시퍼라아제 리포터 컨스트럭트에 대한 TALE13-VP16 융합 단백질(TR13-VP16, VP16의 활성화 도메인과 연결된 TALE13)에 의한 상승적인 리포터 유전자 활성화(도 3b)를 보여준다. pGL3은 어떠한 TR13 표적 요소도 없는 대조군 리포터 벡터이다.
도 4의 패널 A 및 B는 TALE VP16 융합 단백질에 의한 리포터 유전자 활성화 를 보여준다. 도 4a는 본 연구에 사용된 리포터 컨스트럭트 뿐만 아니라, VP16 도메인이 추가되거나 추가되지 않은 TALE 단백질의 개요도이다. R13x2는 TALE13(TR13) 표적 중 2개가 삽입된 컨스트럭트를 나타내는 반면, R15x2는 TALE15(TR15) 표적 중 2개가 삽입된 컨스트럭트를 나타낸다. 도 4b는 TALE 단백질 자체에 의해서가 아닌, VP16 융합을 갖는 TALE 단백질에 의한 리포터 유전자 활성화를 보여준다. 따라서, TALE 단백질 내에 존재하는 천연 전사 활성화 도메인은 본 분석에서 포유동물 세포에서 기능하지 않았다. 더욱이, 정확한 표적이 이들의 상응하는 TALE VP16 융합과 일치하는 경우에만 리포터 유전자 활성화가 일어나기 때문에, 관찰된 전사 활성은 특이적이었다. 클로닝된 TALE13 및 TALE15는 각각 TR13 및 TR15로 나타나 있다. TR13-VP16 및 TR15-VP16은 부가적인 VP16 활성화 도메인이 이들의 C-말단에 융합된 TR13 및 TR15와 유사하다.
도 5의 패널 A 및 B는 프로모터에 대한 표적 서열 배치의 위치적 효과를 묘사한다. 도 5a는 표적 서열이 SV40 프로모터에 대해 근위(R13x4) 또는 원위 (R13x4D)에 위치한 리포터 컨스트럭트의 개요도를 보여준다. 도 5b는 상기 나타낸 TALE에 의한 리포터 유전자 활성화를 보여준다. "nR13V-d145C"는 SV40 핵 위치 서열, C-말단으로부터 145개의 아미노산 잔기가 결실된 TR13 서열(C+133 C-캡을 생성함) 및 VP16 활성화 도메인을 함유하는 발현 컨스트럭트를 지칭하는 반면, "R13-VP16"은 TALE13 서열 및 VP16 활성화 도메인을 함유하는 발현 컨스트럭트를 지칭한다. 나타난 바와 같이, (i) 전장 TALE 중 C-말단 145개 아미노산이 리포터 유전자 활성화에 필요하지 않으며, (ii) 리포터 유전자 활성화는 표적 서열이 프로모터 서열에 대해 근위에 위치할 때 가장 크다.
도 6의 패널 A 및 B는 TALE 융합을 이용한 리포터 유전자(루시퍼라아제) 활성화를 묘사한 그래프이다. 도 6a는 조작된 TALE 18 단백질(본원에서 R23570; 이하 도면에서는 NT-L로 지칭됨)을 포함하는 융합 단백질을 이용한 리포터 유전자의 활성화를 묘사한다. 상기 리포터 컨스트럭트는 루시퍼라아제 유전자의 상류 쪽에 조작된 TALE18 표적의 2 복제본(copy)을 함유한다. 이 리포터의 활성화는 17.5개의 조작된 반복 서열(17개의 전체 TALE 반복 및 하나의 절반 반복), TR13의 일렬 TALE 반복의 측면에 있는 N- 및 C-말단 서열(N-캡 및 C-캡), 및 VP16 활성화 도메인을 함유하는, R23570V를 이용할 때에만 관찰된다. 두 가지 N- 및 C-말단 측면 서열(N-캡 및 C-캡)의 결실은 활성을 폐지시킨다(nR23570S-dNC를 공(mock)에 비교한다). nR23570S-dNC는 SV40 NLS(n), 단일 p65 활성화 도메인(S)에 융합되어 있지만 TALE(dNC)에서 N- 및 C-말단 서열(N-캡 및 C-캡)이 없는 17.5개의 조작된 TALE 반복 서열을 함유한다. nR23570SS-dNC는 2개의 p65 도메인을 갖는다는 것을 제외하면 nR23570S-dNC와 동일하다. R0-VP16 컨스트럭트는 R23570과 동일하지만, 일렬 TALE 반복이 없다. '공(Mock)'은 발현 컨스트럭트가 없는 실험 결과를 보여준다. 도 6b는 조작된(비자연적으로 발생하는) TALE18 도메인을 포함하는 융합 단백질에 의한 그 염색체 환경에서의 내인성 유전자의 활성화를 묘사한다. NTF3 유전자를 표적화하도록 설계된 상기 조작된 TALE18(R23570V)은 내인성 NTF3 mRNA 수준을 상당히 증가시킬 수 있다. 동일한 조건 하에서 NTF3 mRNA의 발현은 R0-VP16 또는 GFP에 의해 영향을 받지 않는다. R23570V 및 R0-VP16은 상기에 기술되어 있다.
도 7의 패널 A 내지 D는 부가적인 예시적인 NTF3-특이적 TALE 전사 인자 융합을 묘사한다. 도 7a는 예시적인 단백질 및 NTF3 프로모터에서의 이들의 표적 (SEQ ID NO: 138)의 도식을 묘사한다. 두 가지 TALE 전사 인자 변이형들이 VP16 활성화 도메인에 연결되어 HEK293 세포에서 발현되었다. 하단에 있는 서열은 인간 NTF3의 프로모터-근위 영역을 보여준다. 밑줄친 염기들은 NT-L TALE 반복 도메인 에 대한 표적 부위를 나타낸다. 굽은 화살표는 NTF3 전사의 출발 부위를 보여준다. 도 7b는 도 7a에 제시된 상부 또는 하부 단백질을 발현하는 HEK293 세포에서의 상대적인 NTF3 mRNA 수준을 보여준다. "eGFP"는 향상된 GFP를 발현하는 대조군 플라스미드로 형질감염된 세포를 나타낸다. 측정은 4반복으로 수행하였고, 오차 막대는 표준 편차를 나타낸다. 도 7C는 7A에 제시된 상부 또는 하부 단백질을 발현하는 HEK293 세포로부터 분비된 NTF3 단백질의 수준을 묘사한다. 측정은 ELISA 분석을 이용하여 4반복으로 수행하였고, 오차 막대는 표준 편차를 나타낸다. "Neg."는 공 벡터 대조군으로 형질감염된 세포를 나타낸다. 도 7D는 RVD(첫 번째 열의 글자), 예측된 결합 부위(두 번째 열의 글자) 및 NT-L에 대한 SELEX-유래 염기 빈도 매트릭스(하단 그래프)를 보여준다. 상기 행렬 내의 첫 번째 및 다섯 번째 위치를 제외하고, 가장 빈번하게 선택된 염기가 표적 좌위 서열과 일치한다.
도 8의 패널 A 및 B는, 다양한 조작된 TALE DNA 결합 도메인의 일련의 N- 및 C-말단 절단의, ELISA에 의해 분석된 DNA 결합능을 묘사한 그래프이다. 도 8a는 9.5개의 TALE 반복을 포함하는 NT3-특이적 TALE DNA 결합 도메인에 대한 데이터를 묘사하는 반면, 도 8b는 9.5개의 TALE 반복을 포함하는 VEGF-특이적 TALE DNA 결합 도메인에 대한 데이터를 묘사한다. 두 가지 데이터 세트의 경우, N-말단 절단이 이뤄질 때, C-말단은 C+95 위치에 유지되는 반면, C-말단 절단의 경우, N-말단이 N+137 위치에 유지되었다(이들 컨스트럭트들은 N+136 N-캡 잔기에 첨부된 메티오닌 잔기를 갖는다). 확인할 수 있는 바와 같이, 두 가지 단백질들은 단백질이 N +134 위치보다 더 N-말단 상에서 절단될 때 본 분석 조건 하에서 상대적인 DNA 결합 친화도에서 분명한 감소를 나타내었다. 또한, 두 가지 단백질들은 C-말단이 아미노산 C+54를 지나 절단될 때 본 분석 조건 하에서 상대적인 DNA 결합 친화도에서 분명한 감소를 나타내었다.
도 9의 패널 A 및 B는 전술한 일련의 N- 및 C-말단 절단의, ELISA에 의해 분석된 DNA 결합능을 묘사한다. 도 9a에 NTF3-특이적 TALE DNA 결합 도메인에 대한 데이터가 나타나 있지만, 이 경우 N-말단 절단이 시험되었을 때, C+54 위치에서 C-말단이 유지되었다. C-말단 절단의 경우, N+134 위치에서 N-말단 아미노산이 유지되었다. 도 9b에 VEGF-특이적 TALE DNA 결합 도메인에 대한 데이터가 나타나 있다. 나타난 바와 같이, N- 및 C-말단은 도 9a에 대하여 전술한 바와 같이 유지되었다.
도 10은 활성과 관련된 TALE 기능성 도메인의 절개도를 보여준다. 표 16에 예시된 표시된 컨스트럭트에 의한 리포터 유전자 활성화에 대한 활성을 조사하였다. 상기 결과는 (i) N-말단 152개 아미노산 및 C-말단 183개 아미노산들이 본 분석에서 강력한 기능에 필요하지 않는다는 것과 (ii) R0 영역 및 류신 풍부 도메인을 포함하는, 일렬 TALE 반복의 측면에 있는 서열이 본 분석에서 세포에서 기능성 활성을 회복시킨다는 것을 보여준다. 첫 번째 TALE 반복의 앞에 있는 N-말단 또는 마지막 반복 이후에 있는 C-말단 서열의 결실은 본 분석에서 기능성 활성을 폐지시킨다. R13V-d145C는 C+133 C-캡을 가지며, R13V-d182C는 C+95 C-캡을 가지고, R13V-dC는 C+22 C-캡을 가지며, nR13V-dN은 N+8 N-캡을 가지고, nR13V-d223N은 N+52 N-캡을 가지며 nR13V-d240은 N+34 N-캡을 갖는다.
도 11의 패널 A 및 B는 K562 세포에서 FokI 도메인의 두 복제본에 연결된 TALE13의 뉴클레아제 활성을 묘사한다. 도 11a는 포유동물 세포에서 뉴클레아제 활성을 검출하기 위한 단일 가닥의 어닐링 기반의 리포터 분석(SSA)의 개요도를 묘사한다. 본 분석에서 리포터 컨스트럭트(SSA-R13)는 GFP 코딩 서열의 N-말단(GF)과 C-말단 부분(FP)에 의해 샌드위치된 TALE13 표적을 함유하였다. 플라스미드 SSA-R13 자체는 GFP 발현을 유도할 수 없었으나, R13 표적의 절단은 GFP의 N-말단(GF) 및 C-말단(FP) 부분 사이의 상동 재조합을 촉진하여 기능성 GFP를 형성한다. 따라서, TALEN 단백질의 뉴클레아제 활성을 GFP 양성 세포의 백분율을 분석함으로써 평가하였다. 도 11B는 TALEN 단백질에 의한 뉴클레아제 활성을 보여준다. SSA-R13 리포터 컨스트럭트로부터 생성된 GFP 양성 세포는 뉴클레아제 플라스미드가 없는 대조 실험(mock)과 비교하여, TALEN(R13d182C-scFokI; C+95 C-캡)을 이용하여 유의하게 증가하였다. R13d182C-scFokI은 FokI 도메인 사이에 GGGGS 서열의 12개의 복제본에 의해 연결된 FokI 도메인의 두 복제본이 VP16 활성화 도메인을 대체하기 위해 사용되는 것을 제외하고 전술한 R13V-d182C와 동일하다.
도 12는 TALE-13 작용기 도메인-FokI 절단 절반-도메인 융합의 시험관내 뉴클레아제 활성을 보여주는 에티디움 브로마이드 겔을 묘사한다. 컬럼들은 4가지 TALE 도메인 뉴클레아제 절단 단백질에 대한 데이터를 보여준다: L2 또는 L8 링커 중 하나를 이용한 N+137, C+28 배열과의 뉴클레아제 융합(실시예 7 참조); L2 링커를 이용한 N+137, C+39 배열과의 뉴클레아제 융합; 및 L2 링커를 갖는 N+137, C+63 융합. 두 가지 표적 부위 사이의 갭 간격(gap spacing)이 웰 아래에 나타나 있으며, 상기 숫자는 표적 사이의 bp 수를 나타낸다. "S"는 단지 절반의 쌍에 대한 단일 표적 부위를 나타낸다. "PmlI"는 표준 제한 효소를 이용한 절단을 나타내며, 블랭크(blank)는 뉴클레아제를 코딩하는 플라스미드 없이 실험이 수행되었을 때의 결과를 나타낸다.
도 13은 표시된 TALE13-FokI 절단 절반 도메인 융합에 의해 얻어진 DNA 절단을 묘사하는 그래프이다. "Dimer Gap"은 두 개의 표적 부위 사이의 bp 수를 나타내며, "퍼센트 DNA 절단"은 반응에서 얼마나 많은 DNA가 절단되었는지를 나타낸다. 상기 결과는 시험된 4개의 뉴클레아제 중 3개를 이용하여 이들 반응 조건에서 실질적으로 100 퍼센트 DNA 절단이 얻어질 수 있음을 보여준다.
도 14는 TALE 도메인-FokI 절반 절단 도메인 융합의 뉴클레아제 활성을 보여주는 에티디움 브로마이드-염색 겔을 묘사한다. 본 실험에서, N-말단은 달라진 반면, C-말단은 C +63 배열로 유지되었다. Pml1 및 블랭크 대조군은 도 12에서와 동일하다. 본 실험에서 시험된 N-말단 절단은 N+137, N+134, N+130 및 N+119였다. 상이한 DNA 표적 부위들은, 라벨이 관련 레인의 아래쪽이 아니라 위쪽에 있다는 점을 제외하면, 도 12처럼 나타나 있다. N-말단이 대략 +134 내지 +137보다 짧을 경우 뉴클레아제의 활성이 감소된다. 5 bp 갭 및 8 bp 갭 표적에 대한 각 레인에 로딩된 DNA의 양이 불균일하여서, 전위된 반복에서 비효율적인 PCR 때문에 이들 레인에서 하부 밴드가 DNA 절단 산물 또는 백그라운드를 나타내는지 여부를 결정하기 어렵다.
도 15의 패널 A 및 B는 K562 세포에서의 TALEN 활성을 묘사한다. 도 15a(SEQ ID NO: 342)는 TALE 쌍을 표적화하는 NTF3에 대한 리포터 플라스미드에서 사용된 표적 서열을 묘사하며, 이는 또한 한 쌍의 CCR5-특이적 ZFN(8267/8196)에 대한 결합 부위를 포함한다. 도 15b는 SSA 뉴클레아제 분석 결과를 묘사하는 그래프로서, (-)NT3 R18 C28L8(옅은 회색 막대; C+28 C-캡, L8 링커)은 NTF3-특이적 쌍 중 단지 하나의 구성원이 존재할 때 관찰된 데이터를 묘사하는 반면, (+)NT3 R18 C28L8(어두운 회색 막대)은 상기 쌍 중 두 가지 구성원이 존재할 때의 결과를 묘사한다. "8267EL8196KK"는 CCR5-특이적 ZFN 쌍을 이용한 결과를 나타낸다.
도 16은 다양한 쌍의 NTF3-표적화 TALEN으로 처리된 세포 상에서의 Cel-I SurveyorTM 불일치 분석(Transgenomics, "Cel-I 분석")의 결과를 묘사한다. 번호 1-30의 시료들은 본문에 기술되어 있다. (+)는 Cel-I 효소의 첨가를 나타내며, (-)는 효소를 첨가하지 않은 분석을 나타낸다. 대부분의 시료에서 대략 226 bp의 밴드가 보이는데, 이는 뉴클레아제에 의한 내인성 NTF3 표적의 절단에 의해 불일치가 유발된 이후, 야생형 서열을 이용하여 불일치 영역을 도입하는 비-상동성 말단 결합을 보여준다. "gfp"는 GFP 코딩 플라스미드만으로 형질감염된 세포 대조군을 나타낸다. 겔 상에서 정량화된 퍼센트 NHEJ 활성이 Cel-I 효소를 함유하는 각 시료에 표시되어 있다. 상기 겔은 각 쌍들이 포유동물 내의 이 내인성 좌위에서 최대 8.66%의 총 대립유전자에서 표적화된 좌위 붕괴를 유발하였음을 입증한다.
도 17의 패널 A 내지 C는 K562 세포에서 NTF3-특이적 TALEN의 활성을 묘사한다. 도 17a는 NT-L TALEN 융합을 위해 만들어진 조작된 파트너인 NT-R로 명명된 조작된 TALEN 단백질에 대한 SELEX 특이성 데이터를 보여준다. 예측된 염기 및 대응되는 RVD가 도면 위에 나타나 있다. +63 C-말단 측면 영역이 본 SELEX 실험에 사용되었다. 도 17b는 배양 조건이 30℃ 또는 37℃인 K562 세포에서 4개의 NTF3-특이적 TALEN 쌍을 이용한 Cel-I 분석 결과인 겔을 보여준다. 제시된 데이터에서 볼 수 있는 바와 같이, 가장 활성인 쌍은 37℃에서 3% 및 저온 충격(cold-shock) 조건(30℃) 하에서 9%의 유전자 변형 수준을 나타내었다(Doyon et al. (2010) Nat Methods 8(1):74-9. Epub 2010 Dec 5 및 미국 출원번호 제12/800,599호). 이후, 저온 충격 연구에서의 PCR 풀(pool)로부터 84개의 앰플리콘(amplicon)의 서열을 분석하고, 7개의 돌연변이된 대립유전자를 확인하였고, 이를 도 17C에 나타내었다(SEQ ID NO: 343-350). 확인할 수 있는 바와 같이, 작은 삽입-결실(indel)이 관찰된다.
도 18의 패널 A 및 B는 TALEN을 이용하여 K562 세포에서 NTF3 좌위의 내인성 절단 이후 관찰된 서열 결과를 묘사한다. 도 18a는 염색체 서열(SEQ ID NO: 139-140)을 묘사하며 박스는 두 가지 TALEN에 대한 결합 부위를 기술한다. 도 18b는 야생형("wt") 서열(SEQ ID NO: 141-175)과 함께 정렬된 실시예 8에 기술된 상이한 NTF3 TALEN 쌍으로 처리된 세포로부터의 NTF3의 서열 결과의 편집물을 묘사한다.
도 19는 NTF3-특이적 TALEN에 의해 유도된 DSB를 통한 내인성 유전자에서의 표적화된 통합(integration) 사건의 결과를 묘사한다. DSB에서의 포획을 위한 올리고뉴클레오티드들은 TALEN 결합 부위 사이의 공간 내에 있는 모든 가능한 서열에 대응되는 오버행(overhang)을 함유하도록 합성되었다. PCR은 삽입된 올리고뉴클레오티드 및 추정되는 절단 부위의 외부에 있는 영역에 작동가능하게 준비된 프라이머 세트를 이용하여 수행되었다. 8개의 상이한 NTF3-특이적 TALEN 쌍이 시험되었고, 상기 쌍들은 A-H로 표시되어 있다. 상기 범례는 레인들이 판독되는 방법을 보여주는 겔의 일부를 보여준다.
도 20의 패널 A 내지 D는 TALEN 쌍에 의해 좌위에서 유도된 DSB 이후 NHEJ에 의해 매개된 내인성 염색체 위치에서의 올리고뉴클레오티드 이중체의 포획을 보여준다. 도 20a는 NTF3 표적 좌위의 일부(상단 이중체, SEQ ID NO: 351) 및 이 연구를 위해 사용된 올리고뉴클레오티드 이중체 중 하나(하단 이중체, SEQ ID NO: 352)를 보여준다. NT-L+28 및 NT-R+63에 대한 결합 부위가 상단 서열에서 밑줄로 표시되어 있다. 또한 상기 이중체를 가장 효과적으로 포획할 절단 오버행(5' CTGG)이 강조되어 있다. 도 20b는 NTF3 표적 좌위의 일부(상단 이중체, SEQ ID NO: 353) 및 본 연구를 위해 사용된 이차 올리고뉴클레오티드 이중체(하단 서열, SEQ ID NO: 354)를 보여준다. NT-L+28 및 NT-R+63에 대한 결합 부위가 상단 서열에서 밑줄로 표시되어 있다. 또한 이 제2 이중체를 가장 효과적으로 포획할 절단 오버행(5' TGGT)이 나타나 있다. 도 20C(SEQ ID NO: 355-357)는 도 20a에 나타난 올리고뉴클레오티드 이중체의 존재 하에 K562 세포에서 NT-L+28 및 NT-R+63의 발현 이후의 결과를 보여준다. 이후, 상기 이중체 내에서 어닐링하는 하나의 프라이머 및 천연 NTF3 위치에 어닐링하는 하나의 프라이머를 사용하여 성공적으로 통합된 이중체 및 게놈 DNA 간의 접합을 증폭시켰다. 얻어진 앰플리콘을 클로닝하고 서열을 분석하였다. 상단의 "예측된" 서열은 상기 절단된 좌위에 올리고뉴클레오티드를 완벽하게 라이게이션하였을 때 생성될 서열을 나타낸다. 박스는 접합 서열에서의 이중체 오버행의 위치를 강조한다. 하단 2개의 선은 본 연구로부터 얻어진 접합 서열을 제공한다. 나타난 바와 같이, 상기 절단 오버행에 대한 이중체의 완벽한 라이게이션으로부터 11개의 접합 서열이 생성된 한편, 한가지 접합 서열은 NHEJ에 의한 수선 이전의 절제(resection)와 일치하는 짧은 결실(12 bp)을 나타내었다. 도 20D(SEQ ID NO: 358-362)는, 도 20a에 나타난 이중체와 비교하여 하나의 염기가 이동된 4 bp 오버행을 갖는, 도 20b에 나타난 올리고뉴클레오티드 이중체가 사용되었다는 점을 제외하고, 도 20C에 나타난 실험으로부터의 결과를 보여준다. 가장 아래의 4개의 선은 본 연구로부터 얻은 접합 서열을 제공한다. 나타난 바와 같이, 4개의 별개의 서열이 확인되었으며, 이들 각각은 NHEJ-매개 수선 이전의 절제와 일치하는 짧은 결실을 나타낸다.
도 21은 주형의 효율적인 증폭을 파괴할 수 있는, PCR 증폭 동안에 천연 TALE 반복 도메인 내에서 형성될 것으로 예측되는 잠재적인 몇 가지 이차 DNA 구조를 묘사한다. Mfold(M. Zuker Nucleic Acids Res. 31(13):3406-15, (2003))를 이용하여 TALE-반복 단백질의 DNA 서열을 분석하였다. 첫 번째 전체 TALE 반복 서열을 코딩하는 핵산의 5' 말단에서 시작하여, 상기 핵산 서열 중 800 염기쌍의 핵산 서열을 분석하였다. 상기 분석된 서열은 대략 7.5개의 반복을 함유하였다. 분석은 몇 가지 매우 안정한 이차 구조를 밝혀내었다.
도 22는 34개의 아미노산 반복 단위 내의 각 위치에서 보존된 아미노산을 나타내는 잔토모나스 박테리아 유래의 1963개의 TALE 반복의 인실리코(in silico) 분석의 그림을 이용한 결과를 묘사한다. 글자 크기는 임의의 제시된 위치에서의 관찰된 다양성과 반비례한다: 큰 글자는 다양성의 낮은 관용을 나타내는 반면, 작은 글자는 제시된 위치에서 관찰될 수 있는 대체 아미노산을 가리킨다. 상이한 색조는 상이한 화학적 계열의 아미노산을 나타낸다. 이 1963개의 TALE 반복 시료에서, 최대 빈도 RVD는 28.8% HD; 20.6% NI, 15.1% NN; 13.2% NG; 8.5% NS; 5.5% HG; 및 5.5% NG*(상기 별표는 RVD가 보다 통상적인 34-잔기 반복 대신에 33-잔기 TALE 반복에서 관찰된 경우임)였다. 15개의 다른 RVD 서열이 본 시료에서 관찰되었지만 이들 모두 1% 미만의 빈도를 가졌다.
도 23은 목적하는 TAKE 융합 단백질을 제조하기 위해, 선택된 TALE 반복 모듈의 PCR 앰플리콘을 일렬로 연결하고 이들을 벡터 백본내로 라이게이션하는데 사용된 방법의 개요도를 묘사한다. 특이적 프라이머들이 실시예 11에 열거되어 있다. 또한, 조립된 TALE 융합이 클로닝된 벡터 백본이 묘사되어 있다. 상기 융합 파트너 도메인은 FokI 뉴클레아제 촉매 도메인이며 TALEN 쌍 중 하나의 구성원의 생산을 가능하게 한다.
도 24의 패널 A 및 B는 RFLP를 코딩하는 이종성의 짧은 분절을 내인성 CCR5 좌위 내로 상동성-기반의 이동을 유발하는 TALEN의 용도를 묘사한다. 도 24a는 분석을 위한 개요도를 보여주며, 사용된 PCR 프라이머의 위치 및 Bgl I 부위를 묘사한다. 도 24b는 CCR5-특이적 TALEN 쌍에 의해 도입된 DSB 내로의 46 bp 공여체 서열의 삽입을 보여주는 겔을 묘사한다. 상기 공여체 서열은 고유한 BglI 제한 부위를 함유하므로, 표적 부위의 PCR 증폭과 이후의 BglI을 이용한 PCR 산물의 절단시, 상기 TALEN 쌍에 의해 절단되어 46 bp 공여체 서열이 삽입된 서열이 도면에 표시된 바와 같이 두 개의 BglI 절단 산물을 가질 것이다.
도 25의 패널 A 및 B는 표적 갭 간격(gap spacing)과 비교하여 TALEN의 절단 효율을 묘사한 그래프이다. 도 25a는 +28/+28 쌍(두 가지 TALEN 상의 C+28 C-캡)을 갖는 CCR5-특이적 TALEN 쌍의 패널의 활성을 묘사하는 반면, 도 25b는 +63/+63 쌍(두 가지 TALEN 상의 C+63 C-캡)을 포함하는 패널 CCR5-특이적 TALEN 쌍의 활성을 묘사한다. 확인할 수 있는 바와 같이, +28/+28 쌍의 활성은 두 가지 표적 서열 사이에 있는 12 또는 13 bp 갭 간격에 더욱 견고하게 제약된 반면, +63/+63 쌍은 12-23 bp의 갭 간격 범위에 걸쳐 활성을 나타낸다.
도 26은 상이한 길이의 C-캡 서열, 또는 다른 방식으로 언급된, 뉴클레아제 도메인에 전체 TAKE 반복의 배열을 연결시키는 상이한 서열을 갖는 CCR5-특이적 TALEN 쌍의 내인성 활성을 묘사한 그래프이다. C-말단 서열에 걸쳐 C 말단 절단이 이루어져 C-2부터 C+278까지의 C-캡을 생성하였다. 이들 컨스트럭트를 대상으로 18 bp 캡 간격을 갖는 내인성 표적에 대한 K562 세포에서의 TALEN 활성을 시험하였고, 상기 시험에서 세포를 37℃(옅은 사각형) 또는 저온 충격 조건(30℃, 진한 다이아몬드)에서 배양하였다. 상기 활성은 전체 TALE 반복의 배열을 FokI 절단 도메인과 연결시키는데 사용된 서열의 동일성에 상당히 의존하였다. 상기 C-캡 표기법이 C+0을 포함하지 않으므로, C-1 C-캡 값이 X=0에서 도식화되었고 C-2가 X=-1로서 도식화되었음에 유의한다. C+5, C+28 등을 X=5, X=28 등으로서 도식화하였다. 피크 활성을 C+63 C-캡 서열에 대해 관찰하였다.
도 27은 RVD 분석을 위해 선택된 예시적인 TALEN의 특이성을 묘사한다. 상기 TALEN을 11개 염기 표적 서열 5'-TTGACAATCCT-3'(SEQ ID NO: 178)에 결합하도록 설계하였다. 위치 5-7에서의 표적의 동일성이 CAA(설계된 표적), CGA, TCG 또는 TTG이도록, 이 표적이 위치 6에서 변화될 때 ELISA 분석에 의해 결정된 DNA 결합 결과가 나타나 있다.
도 28은 시험된 모든 RVD에 대해 측정된 ELISA 친화도의 그래프 표현이다. 상기 데이터는 20x20 격자로 나타나 있으며, 여기에서 RVD의 첫번째 아미노산(위치 12)이 격자의 수직 좌측에 나타나 있고, RVD의 두 번째 아미노산(위치 13)이 상기 격자 위에 수평으로 나타나 있다. 각 격자에서 글자 A, C, G, 및 T의 크기가 각각 CAA 부위, CCA 부위, 및 CGA 부위 및 CTA 부위에 대해 정규화된 ELISA 신호의 제곱근에 기초하여 크기가 변경되어 있다. 많은 RVD는 자연적으로 발생하는 HD, NI, NG, NS, NN, IG, HG, 및 NK RVD에 대하여 개선된 DNA 결합 특성을 갖는다. 자연에서 가장 흔히 발견되는 4개의 RVD(HD, NG, NI, 및 NN)가 참고를 위해 박스 표시되어 있다. 이들 4개의 RVD의 경우, ELISA에 의해 선호되는 염기가 예측된 선호되는 염기와 일치하였다.
도 29는 T 이외의 뉴클레오티드 염기와의 상호작용을 가능하게 하기 위해 C-말단 절반 반복이 RVD에서 변화된 TALEN의 활성의 측정 결과를 묘사한 겔이다. 나타낸 TALEN 활성은 전술한 Cel-I 분석에 의해 결정된 바와 같다. 화살표 머리 부분은 삽입-결실(indel)에서의 Cel-I 절단 결과인 밴드를 가리킨다. 레인 배치가 실시예 16의 표 32에 열거되어 있다. 이들 결과는 TALEN C-말단 절반 반복이 목적하는 각 뉴클레오티드 염기에 결합하도록 조작될 수 있음을 입증한다.
도 30은 완전히 비정형적인 RVD(완전히 치환됨), 한 가지 유형 또는 특이성의 모든 반복 단위(예컨대, 'T' 등을 지정하는 RVD를 갖는 모든 반복 단위)가 비정형적인 RVD로 치환된 반복 도메인을 포함하는 TALE 반복 단위를 갖는 TALEN(타입 치환), 또는 상기 배열을 갖는 단지 하나의 반복 단위가 비정형적인 RVD-포함 반복 단위로 치환된 TALEN(단일 치환됨)을 이용한 TALEN 활성의 측정을 묘사한 겔이다. 활성 분석은 37℃ 또는 저온 충격 조건(30℃)에서 수행하였으며, 임의의 측정가능한 NHEJ 활성의 정량이 레인 상에 나타나 있다.
도 31은 랫트 배아의 TALEN 처리 후 태어난 랫트 새끼에서 NHEJ 사건의 존재를 묘사한 일련의 겔이다. 상기 새끼로부터 게놈 DNA를 분리하고 뉴클레아제 표적 부위를 둘러싼 영역 상에서 PCR을 수행하였다. 그리고 나서, 상기 산물에 대해 T7 엔도뉴클레아제를 이용하여 NHEJ 유도된 불일치를 조사하였다. 화살표는 불일치의 존재로부터 생성된 밴드를 나타낸다. 조사된 66마리의 새끼 중 7마리(11%)가 NHEJ 사건에 대해 양성이었다.
도 2의 패널 A 및 B는 TALE13(TR13)의 예측된 표적에 사용하기 위한 리포터 컨스트럭트를 보여준다. 도 2a(SEQ ID NO:136)는 벡터 내로 1-4 TR13 표적를 삽입하는데 사용되는 클로닝 부위를 나타낸 리포터 벡터의 개요도를 보여준다. 이탤릭체로 된 영역은 루시퍼라아제 유전자에 대한 프로모터 영역이다. 도 2b(SEQ ID NO:137)는 두 개의 TR13 표적을 함유하는, 사용된 링커 서열을 보여준다.
도 3의 패널 A 및 B는 0-4 TR13 표적을 함유하는 리포터 컨스트럭트의 개요도(도 3a) 및 각각 R13x1 내지 R13x4로 표시된 1 내지 4개의 다수의 TR13 표적을 함유하는 루시퍼라아제 리포터 컨스트럭트에 대한 TALE13-VP16 융합 단백질(TR13-VP16, VP16의 활성화 도메인과 연결된 TALE13)에 의한 상승적인 리포터 유전자 활성화(도 3b)를 보여준다. pGL3은 어떠한 TR13 표적 요소도 없는 대조군 리포터 벡터이다.
도 4의 패널 A 및 B는 TALE VP16 융합 단백질에 의한 리포터 유전자 활성화 를 보여준다. 도 4a는 본 연구에 사용된 리포터 컨스트럭트 뿐만 아니라, VP16 도메인이 추가되거나 추가되지 않은 TALE 단백질의 개요도이다. R13x2는 TALE13(TR13) 표적 중 2개가 삽입된 컨스트럭트를 나타내는 반면, R15x2는 TALE15(TR15) 표적 중 2개가 삽입된 컨스트럭트를 나타낸다. 도 4b는 TALE 단백질 자체에 의해서가 아닌, VP16 융합을 갖는 TALE 단백질에 의한 리포터 유전자 활성화를 보여준다. 따라서, TALE 단백질 내에 존재하는 천연 전사 활성화 도메인은 본 분석에서 포유동물 세포에서 기능하지 않았다. 더욱이, 정확한 표적이 이들의 상응하는 TALE VP16 융합과 일치하는 경우에만 리포터 유전자 활성화가 일어나기 때문에, 관찰된 전사 활성은 특이적이었다. 클로닝된 TALE13 및 TALE15는 각각 TR13 및 TR15로 나타나 있다. TR13-VP16 및 TR15-VP16은 부가적인 VP16 활성화 도메인이 이들의 C-말단에 융합된 TR13 및 TR15와 유사하다.
도 5의 패널 A 및 B는 프로모터에 대한 표적 서열 배치의 위치적 효과를 묘사한다. 도 5a는 표적 서열이 SV40 프로모터에 대해 근위(R13x4) 또는 원위 (R13x4D)에 위치한 리포터 컨스트럭트의 개요도를 보여준다. 도 5b는 상기 나타낸 TALE에 의한 리포터 유전자 활성화를 보여준다. "nR13V-d145C"는 SV40 핵 위치 서열, C-말단으로부터 145개의 아미노산 잔기가 결실된 TR13 서열(C+133 C-캡을 생성함) 및 VP16 활성화 도메인을 함유하는 발현 컨스트럭트를 지칭하는 반면, "R13-VP16"은 TALE13 서열 및 VP16 활성화 도메인을 함유하는 발현 컨스트럭트를 지칭한다. 나타난 바와 같이, (i) 전장 TALE 중 C-말단 145개 아미노산이 리포터 유전자 활성화에 필요하지 않으며, (ii) 리포터 유전자 활성화는 표적 서열이 프로모터 서열에 대해 근위에 위치할 때 가장 크다.
도 6의 패널 A 및 B는 TALE 융합을 이용한 리포터 유전자(루시퍼라아제) 활성화를 묘사한 그래프이다. 도 6a는 조작된 TALE 18 단백질(본원에서 R23570; 이하 도면에서는 NT-L로 지칭됨)을 포함하는 융합 단백질을 이용한 리포터 유전자의 활성화를 묘사한다. 상기 리포터 컨스트럭트는 루시퍼라아제 유전자의 상류 쪽에 조작된 TALE18 표적의 2 복제본(copy)을 함유한다. 이 리포터의 활성화는 17.5개의 조작된 반복 서열(17개의 전체 TALE 반복 및 하나의 절반 반복), TR13의 일렬 TALE 반복의 측면에 있는 N- 및 C-말단 서열(N-캡 및 C-캡), 및 VP16 활성화 도메인을 함유하는, R23570V를 이용할 때에만 관찰된다. 두 가지 N- 및 C-말단 측면 서열(N-캡 및 C-캡)의 결실은 활성을 폐지시킨다(nR23570S-dNC를 공(mock)에 비교한다). nR23570S-dNC는 SV40 NLS(n), 단일 p65 활성화 도메인(S)에 융합되어 있지만 TALE(dNC)에서 N- 및 C-말단 서열(N-캡 및 C-캡)이 없는 17.5개의 조작된 TALE 반복 서열을 함유한다. nR23570SS-dNC는 2개의 p65 도메인을 갖는다는 것을 제외하면 nR23570S-dNC와 동일하다. R0-VP16 컨스트럭트는 R23570과 동일하지만, 일렬 TALE 반복이 없다. '공(Mock)'은 발현 컨스트럭트가 없는 실험 결과를 보여준다. 도 6b는 조작된(비자연적으로 발생하는) TALE18 도메인을 포함하는 융합 단백질에 의한 그 염색체 환경에서의 내인성 유전자의 활성화를 묘사한다. NTF3 유전자를 표적화하도록 설계된 상기 조작된 TALE18(R23570V)은 내인성 NTF3 mRNA 수준을 상당히 증가시킬 수 있다. 동일한 조건 하에서 NTF3 mRNA의 발현은 R0-VP16 또는 GFP에 의해 영향을 받지 않는다. R23570V 및 R0-VP16은 상기에 기술되어 있다.
도 7의 패널 A 내지 D는 부가적인 예시적인 NTF3-특이적 TALE 전사 인자 융합을 묘사한다. 도 7a는 예시적인 단백질 및 NTF3 프로모터에서의 이들의 표적 (SEQ ID NO: 138)의 도식을 묘사한다. 두 가지 TALE 전사 인자 변이형들이 VP16 활성화 도메인에 연결되어 HEK293 세포에서 발현되었다. 하단에 있는 서열은 인간 NTF3의 프로모터-근위 영역을 보여준다. 밑줄친 염기들은 NT-L TALE 반복 도메인 에 대한 표적 부위를 나타낸다. 굽은 화살표는 NTF3 전사의 출발 부위를 보여준다. 도 7b는 도 7a에 제시된 상부 또는 하부 단백질을 발현하는 HEK293 세포에서의 상대적인 NTF3 mRNA 수준을 보여준다. "eGFP"는 향상된 GFP를 발현하는 대조군 플라스미드로 형질감염된 세포를 나타낸다. 측정은 4반복으로 수행하였고, 오차 막대는 표준 편차를 나타낸다. 도 7C는 7A에 제시된 상부 또는 하부 단백질을 발현하는 HEK293 세포로부터 분비된 NTF3 단백질의 수준을 묘사한다. 측정은 ELISA 분석을 이용하여 4반복으로 수행하였고, 오차 막대는 표준 편차를 나타낸다. "Neg."는 공 벡터 대조군으로 형질감염된 세포를 나타낸다. 도 7D는 RVD(첫 번째 열의 글자), 예측된 결합 부위(두 번째 열의 글자) 및 NT-L에 대한 SELEX-유래 염기 빈도 매트릭스(하단 그래프)를 보여준다. 상기 행렬 내의 첫 번째 및 다섯 번째 위치를 제외하고, 가장 빈번하게 선택된 염기가 표적 좌위 서열과 일치한다.
도 8의 패널 A 및 B는, 다양한 조작된 TALE DNA 결합 도메인의 일련의 N- 및 C-말단 절단의, ELISA에 의해 분석된 DNA 결합능을 묘사한 그래프이다. 도 8a는 9.5개의 TALE 반복을 포함하는 NT3-특이적 TALE DNA 결합 도메인에 대한 데이터를 묘사하는 반면, 도 8b는 9.5개의 TALE 반복을 포함하는 VEGF-특이적 TALE DNA 결합 도메인에 대한 데이터를 묘사한다. 두 가지 데이터 세트의 경우, N-말단 절단이 이뤄질 때, C-말단은 C+95 위치에 유지되는 반면, C-말단 절단의 경우, N-말단이 N+137 위치에 유지되었다(이들 컨스트럭트들은 N+136 N-캡 잔기에 첨부된 메티오닌 잔기를 갖는다). 확인할 수 있는 바와 같이, 두 가지 단백질들은 단백질이 N +134 위치보다 더 N-말단 상에서 절단될 때 본 분석 조건 하에서 상대적인 DNA 결합 친화도에서 분명한 감소를 나타내었다. 또한, 두 가지 단백질들은 C-말단이 아미노산 C+54를 지나 절단될 때 본 분석 조건 하에서 상대적인 DNA 결합 친화도에서 분명한 감소를 나타내었다.
도 9의 패널 A 및 B는 전술한 일련의 N- 및 C-말단 절단의, ELISA에 의해 분석된 DNA 결합능을 묘사한다. 도 9a에 NTF3-특이적 TALE DNA 결합 도메인에 대한 데이터가 나타나 있지만, 이 경우 N-말단 절단이 시험되었을 때, C+54 위치에서 C-말단이 유지되었다. C-말단 절단의 경우, N+134 위치에서 N-말단 아미노산이 유지되었다. 도 9b에 VEGF-특이적 TALE DNA 결합 도메인에 대한 데이터가 나타나 있다. 나타난 바와 같이, N- 및 C-말단은 도 9a에 대하여 전술한 바와 같이 유지되었다.
도 10은 활성과 관련된 TALE 기능성 도메인의 절개도를 보여준다. 표 16에 예시된 표시된 컨스트럭트에 의한 리포터 유전자 활성화에 대한 활성을 조사하였다. 상기 결과는 (i) N-말단 152개 아미노산 및 C-말단 183개 아미노산들이 본 분석에서 강력한 기능에 필요하지 않는다는 것과 (ii) R0 영역 및 류신 풍부 도메인을 포함하는, 일렬 TALE 반복의 측면에 있는 서열이 본 분석에서 세포에서 기능성 활성을 회복시킨다는 것을 보여준다. 첫 번째 TALE 반복의 앞에 있는 N-말단 또는 마지막 반복 이후에 있는 C-말단 서열의 결실은 본 분석에서 기능성 활성을 폐지시킨다. R13V-d145C는 C+133 C-캡을 가지며, R13V-d182C는 C+95 C-캡을 가지고, R13V-dC는 C+22 C-캡을 가지며, nR13V-dN은 N+8 N-캡을 가지고, nR13V-d223N은 N+52 N-캡을 가지며 nR13V-d240은 N+34 N-캡을 갖는다.
도 11의 패널 A 및 B는 K562 세포에서 FokI 도메인의 두 복제본에 연결된 TALE13의 뉴클레아제 활성을 묘사한다. 도 11a는 포유동물 세포에서 뉴클레아제 활성을 검출하기 위한 단일 가닥의 어닐링 기반의 리포터 분석(SSA)의 개요도를 묘사한다. 본 분석에서 리포터 컨스트럭트(SSA-R13)는 GFP 코딩 서열의 N-말단(GF)과 C-말단 부분(FP)에 의해 샌드위치된 TALE13 표적을 함유하였다. 플라스미드 SSA-R13 자체는 GFP 발현을 유도할 수 없었으나, R13 표적의 절단은 GFP의 N-말단(GF) 및 C-말단(FP) 부분 사이의 상동 재조합을 촉진하여 기능성 GFP를 형성한다. 따라서, TALEN 단백질의 뉴클레아제 활성을 GFP 양성 세포의 백분율을 분석함으로써 평가하였다. 도 11B는 TALEN 단백질에 의한 뉴클레아제 활성을 보여준다. SSA-R13 리포터 컨스트럭트로부터 생성된 GFP 양성 세포는 뉴클레아제 플라스미드가 없는 대조 실험(mock)과 비교하여, TALEN(R13d182C-scFokI; C+95 C-캡)을 이용하여 유의하게 증가하였다. R13d182C-scFokI은 FokI 도메인 사이에 GGGGS 서열의 12개의 복제본에 의해 연결된 FokI 도메인의 두 복제본이 VP16 활성화 도메인을 대체하기 위해 사용되는 것을 제외하고 전술한 R13V-d182C와 동일하다.
도 12는 TALE-13 작용기 도메인-FokI 절단 절반-도메인 융합의 시험관내 뉴클레아제 활성을 보여주는 에티디움 브로마이드 겔을 묘사한다. 컬럼들은 4가지 TALE 도메인 뉴클레아제 절단 단백질에 대한 데이터를 보여준다: L2 또는 L8 링커 중 하나를 이용한 N+137, C+28 배열과의 뉴클레아제 융합(실시예 7 참조); L2 링커를 이용한 N+137, C+39 배열과의 뉴클레아제 융합; 및 L2 링커를 갖는 N+137, C+63 융합. 두 가지 표적 부위 사이의 갭 간격(gap spacing)이 웰 아래에 나타나 있으며, 상기 숫자는 표적 사이의 bp 수를 나타낸다. "S"는 단지 절반의 쌍에 대한 단일 표적 부위를 나타낸다. "PmlI"는 표준 제한 효소를 이용한 절단을 나타내며, 블랭크(blank)는 뉴클레아제를 코딩하는 플라스미드 없이 실험이 수행되었을 때의 결과를 나타낸다.
도 13은 표시된 TALE13-FokI 절단 절반 도메인 융합에 의해 얻어진 DNA 절단을 묘사하는 그래프이다. "Dimer Gap"은 두 개의 표적 부위 사이의 bp 수를 나타내며, "퍼센트 DNA 절단"은 반응에서 얼마나 많은 DNA가 절단되었는지를 나타낸다. 상기 결과는 시험된 4개의 뉴클레아제 중 3개를 이용하여 이들 반응 조건에서 실질적으로 100 퍼센트 DNA 절단이 얻어질 수 있음을 보여준다.
도 14는 TALE 도메인-FokI 절반 절단 도메인 융합의 뉴클레아제 활성을 보여주는 에티디움 브로마이드-염색 겔을 묘사한다. 본 실험에서, N-말단은 달라진 반면, C-말단은 C +63 배열로 유지되었다. Pml1 및 블랭크 대조군은 도 12에서와 동일하다. 본 실험에서 시험된 N-말단 절단은 N+137, N+134, N+130 및 N+119였다. 상이한 DNA 표적 부위들은, 라벨이 관련 레인의 아래쪽이 아니라 위쪽에 있다는 점을 제외하면, 도 12처럼 나타나 있다. N-말단이 대략 +134 내지 +137보다 짧을 경우 뉴클레아제의 활성이 감소된다. 5 bp 갭 및 8 bp 갭 표적에 대한 각 레인에 로딩된 DNA의 양이 불균일하여서, 전위된 반복에서 비효율적인 PCR 때문에 이들 레인에서 하부 밴드가 DNA 절단 산물 또는 백그라운드를 나타내는지 여부를 결정하기 어렵다.
도 15의 패널 A 및 B는 K562 세포에서의 TALEN 활성을 묘사한다. 도 15a(SEQ ID NO: 342)는 TALE 쌍을 표적화하는 NTF3에 대한 리포터 플라스미드에서 사용된 표적 서열을 묘사하며, 이는 또한 한 쌍의 CCR5-특이적 ZFN(8267/8196)에 대한 결합 부위를 포함한다. 도 15b는 SSA 뉴클레아제 분석 결과를 묘사하는 그래프로서, (-)NT3 R18 C28L8(옅은 회색 막대; C+28 C-캡, L8 링커)은 NTF3-특이적 쌍 중 단지 하나의 구성원이 존재할 때 관찰된 데이터를 묘사하는 반면, (+)NT3 R18 C28L8(어두운 회색 막대)은 상기 쌍 중 두 가지 구성원이 존재할 때의 결과를 묘사한다. "8267EL8196KK"는 CCR5-특이적 ZFN 쌍을 이용한 결과를 나타낸다.
도 16은 다양한 쌍의 NTF3-표적화 TALEN으로 처리된 세포 상에서의 Cel-I SurveyorTM 불일치 분석(Transgenomics, "Cel-I 분석")의 결과를 묘사한다. 번호 1-30의 시료들은 본문에 기술되어 있다. (+)는 Cel-I 효소의 첨가를 나타내며, (-)는 효소를 첨가하지 않은 분석을 나타낸다. 대부분의 시료에서 대략 226 bp의 밴드가 보이는데, 이는 뉴클레아제에 의한 내인성 NTF3 표적의 절단에 의해 불일치가 유발된 이후, 야생형 서열을 이용하여 불일치 영역을 도입하는 비-상동성 말단 결합을 보여준다. "gfp"는 GFP 코딩 플라스미드만으로 형질감염된 세포 대조군을 나타낸다. 겔 상에서 정량화된 퍼센트 NHEJ 활성이 Cel-I 효소를 함유하는 각 시료에 표시되어 있다. 상기 겔은 각 쌍들이 포유동물 내의 이 내인성 좌위에서 최대 8.66%의 총 대립유전자에서 표적화된 좌위 붕괴를 유발하였음을 입증한다.
도 17의 패널 A 내지 C는 K562 세포에서 NTF3-특이적 TALEN의 활성을 묘사한다. 도 17a는 NT-L TALEN 융합을 위해 만들어진 조작된 파트너인 NT-R로 명명된 조작된 TALEN 단백질에 대한 SELEX 특이성 데이터를 보여준다. 예측된 염기 및 대응되는 RVD가 도면 위에 나타나 있다. +63 C-말단 측면 영역이 본 SELEX 실험에 사용되었다. 도 17b는 배양 조건이 30℃ 또는 37℃인 K562 세포에서 4개의 NTF3-특이적 TALEN 쌍을 이용한 Cel-I 분석 결과인 겔을 보여준다. 제시된 데이터에서 볼 수 있는 바와 같이, 가장 활성인 쌍은 37℃에서 3% 및 저온 충격(cold-shock) 조건(30℃) 하에서 9%의 유전자 변형 수준을 나타내었다(Doyon et al. (2010) Nat Methods 8(1):74-9. Epub 2010 Dec 5 및 미국 출원번호 제12/800,599호). 이후, 저온 충격 연구에서의 PCR 풀(pool)로부터 84개의 앰플리콘(amplicon)의 서열을 분석하고, 7개의 돌연변이된 대립유전자를 확인하였고, 이를 도 17C에 나타내었다(SEQ ID NO: 343-350). 확인할 수 있는 바와 같이, 작은 삽입-결실(indel)이 관찰된다.
도 18의 패널 A 및 B는 TALEN을 이용하여 K562 세포에서 NTF3 좌위의 내인성 절단 이후 관찰된 서열 결과를 묘사한다. 도 18a는 염색체 서열(SEQ ID NO: 139-140)을 묘사하며 박스는 두 가지 TALEN에 대한 결합 부위를 기술한다. 도 18b는 야생형("wt") 서열(SEQ ID NO: 141-175)과 함께 정렬된 실시예 8에 기술된 상이한 NTF3 TALEN 쌍으로 처리된 세포로부터의 NTF3의 서열 결과의 편집물을 묘사한다.
도 19는 NTF3-특이적 TALEN에 의해 유도된 DSB를 통한 내인성 유전자에서의 표적화된 통합(integration) 사건의 결과를 묘사한다. DSB에서의 포획을 위한 올리고뉴클레오티드들은 TALEN 결합 부위 사이의 공간 내에 있는 모든 가능한 서열에 대응되는 오버행(overhang)을 함유하도록 합성되었다. PCR은 삽입된 올리고뉴클레오티드 및 추정되는 절단 부위의 외부에 있는 영역에 작동가능하게 준비된 프라이머 세트를 이용하여 수행되었다. 8개의 상이한 NTF3-특이적 TALEN 쌍이 시험되었고, 상기 쌍들은 A-H로 표시되어 있다. 상기 범례는 레인들이 판독되는 방법을 보여주는 겔의 일부를 보여준다.
도 20의 패널 A 내지 D는 TALEN 쌍에 의해 좌위에서 유도된 DSB 이후 NHEJ에 의해 매개된 내인성 염색체 위치에서의 올리고뉴클레오티드 이중체의 포획을 보여준다. 도 20a는 NTF3 표적 좌위의 일부(상단 이중체, SEQ ID NO: 351) 및 이 연구를 위해 사용된 올리고뉴클레오티드 이중체 중 하나(하단 이중체, SEQ ID NO: 352)를 보여준다. NT-L+28 및 NT-R+63에 대한 결합 부위가 상단 서열에서 밑줄로 표시되어 있다. 또한 상기 이중체를 가장 효과적으로 포획할 절단 오버행(5' CTGG)이 강조되어 있다. 도 20b는 NTF3 표적 좌위의 일부(상단 이중체, SEQ ID NO: 353) 및 본 연구를 위해 사용된 이차 올리고뉴클레오티드 이중체(하단 서열, SEQ ID NO: 354)를 보여준다. NT-L+28 및 NT-R+63에 대한 결합 부위가 상단 서열에서 밑줄로 표시되어 있다. 또한 이 제2 이중체를 가장 효과적으로 포획할 절단 오버행(5' TGGT)이 나타나 있다. 도 20C(SEQ ID NO: 355-357)는 도 20a에 나타난 올리고뉴클레오티드 이중체의 존재 하에 K562 세포에서 NT-L+28 및 NT-R+63의 발현 이후의 결과를 보여준다. 이후, 상기 이중체 내에서 어닐링하는 하나의 프라이머 및 천연 NTF3 위치에 어닐링하는 하나의 프라이머를 사용하여 성공적으로 통합된 이중체 및 게놈 DNA 간의 접합을 증폭시켰다. 얻어진 앰플리콘을 클로닝하고 서열을 분석하였다. 상단의 "예측된" 서열은 상기 절단된 좌위에 올리고뉴클레오티드를 완벽하게 라이게이션하였을 때 생성될 서열을 나타낸다. 박스는 접합 서열에서의 이중체 오버행의 위치를 강조한다. 하단 2개의 선은 본 연구로부터 얻어진 접합 서열을 제공한다. 나타난 바와 같이, 상기 절단 오버행에 대한 이중체의 완벽한 라이게이션으로부터 11개의 접합 서열이 생성된 한편, 한가지 접합 서열은 NHEJ에 의한 수선 이전의 절제(resection)와 일치하는 짧은 결실(12 bp)을 나타내었다. 도 20D(SEQ ID NO: 358-362)는, 도 20a에 나타난 이중체와 비교하여 하나의 염기가 이동된 4 bp 오버행을 갖는, 도 20b에 나타난 올리고뉴클레오티드 이중체가 사용되었다는 점을 제외하고, 도 20C에 나타난 실험으로부터의 결과를 보여준다. 가장 아래의 4개의 선은 본 연구로부터 얻은 접합 서열을 제공한다. 나타난 바와 같이, 4개의 별개의 서열이 확인되었으며, 이들 각각은 NHEJ-매개 수선 이전의 절제와 일치하는 짧은 결실을 나타낸다.
도 21은 주형의 효율적인 증폭을 파괴할 수 있는, PCR 증폭 동안에 천연 TALE 반복 도메인 내에서 형성될 것으로 예측되는 잠재적인 몇 가지 이차 DNA 구조를 묘사한다. Mfold(M. Zuker Nucleic Acids Res. 31(13):3406-15, (2003))를 이용하여 TALE-반복 단백질의 DNA 서열을 분석하였다. 첫 번째 전체 TALE 반복 서열을 코딩하는 핵산의 5' 말단에서 시작하여, 상기 핵산 서열 중 800 염기쌍의 핵산 서열을 분석하였다. 상기 분석된 서열은 대략 7.5개의 반복을 함유하였다. 분석은 몇 가지 매우 안정한 이차 구조를 밝혀내었다.
도 22는 34개의 아미노산 반복 단위 내의 각 위치에서 보존된 아미노산을 나타내는 잔토모나스 박테리아 유래의 1963개의 TALE 반복의 인실리코(in silico) 분석의 그림을 이용한 결과를 묘사한다. 글자 크기는 임의의 제시된 위치에서의 관찰된 다양성과 반비례한다: 큰 글자는 다양성의 낮은 관용을 나타내는 반면, 작은 글자는 제시된 위치에서 관찰될 수 있는 대체 아미노산을 가리킨다. 상이한 색조는 상이한 화학적 계열의 아미노산을 나타낸다. 이 1963개의 TALE 반복 시료에서, 최대 빈도 RVD는 28.8% HD; 20.6% NI, 15.1% NN; 13.2% NG; 8.5% NS; 5.5% HG; 및 5.5% NG*(상기 별표는 RVD가 보다 통상적인 34-잔기 반복 대신에 33-잔기 TALE 반복에서 관찰된 경우임)였다. 15개의 다른 RVD 서열이 본 시료에서 관찰되었지만 이들 모두 1% 미만의 빈도를 가졌다.
도 23은 목적하는 TAKE 융합 단백질을 제조하기 위해, 선택된 TALE 반복 모듈의 PCR 앰플리콘을 일렬로 연결하고 이들을 벡터 백본내로 라이게이션하는데 사용된 방법의 개요도를 묘사한다. 특이적 프라이머들이 실시예 11에 열거되어 있다. 또한, 조립된 TALE 융합이 클로닝된 벡터 백본이 묘사되어 있다. 상기 융합 파트너 도메인은 FokI 뉴클레아제 촉매 도메인이며 TALEN 쌍 중 하나의 구성원의 생산을 가능하게 한다.
도 24의 패널 A 및 B는 RFLP를 코딩하는 이종성의 짧은 분절을 내인성 CCR5 좌위 내로 상동성-기반의 이동을 유발하는 TALEN의 용도를 묘사한다. 도 24a는 분석을 위한 개요도를 보여주며, 사용된 PCR 프라이머의 위치 및 Bgl I 부위를 묘사한다. 도 24b는 CCR5-특이적 TALEN 쌍에 의해 도입된 DSB 내로의 46 bp 공여체 서열의 삽입을 보여주는 겔을 묘사한다. 상기 공여체 서열은 고유한 BglI 제한 부위를 함유하므로, 표적 부위의 PCR 증폭과 이후의 BglI을 이용한 PCR 산물의 절단시, 상기 TALEN 쌍에 의해 절단되어 46 bp 공여체 서열이 삽입된 서열이 도면에 표시된 바와 같이 두 개의 BglI 절단 산물을 가질 것이다.
도 25의 패널 A 및 B는 표적 갭 간격(gap spacing)과 비교하여 TALEN의 절단 효율을 묘사한 그래프이다. 도 25a는 +28/+28 쌍(두 가지 TALEN 상의 C+28 C-캡)을 갖는 CCR5-특이적 TALEN 쌍의 패널의 활성을 묘사하는 반면, 도 25b는 +63/+63 쌍(두 가지 TALEN 상의 C+63 C-캡)을 포함하는 패널 CCR5-특이적 TALEN 쌍의 활성을 묘사한다. 확인할 수 있는 바와 같이, +28/+28 쌍의 활성은 두 가지 표적 서열 사이에 있는 12 또는 13 bp 갭 간격에 더욱 견고하게 제약된 반면, +63/+63 쌍은 12-23 bp의 갭 간격 범위에 걸쳐 활성을 나타낸다.
도 26은 상이한 길이의 C-캡 서열, 또는 다른 방식으로 언급된, 뉴클레아제 도메인에 전체 TAKE 반복의 배열을 연결시키는 상이한 서열을 갖는 CCR5-특이적 TALEN 쌍의 내인성 활성을 묘사한 그래프이다. C-말단 서열에 걸쳐 C 말단 절단이 이루어져 C-2부터 C+278까지의 C-캡을 생성하였다. 이들 컨스트럭트를 대상으로 18 bp 캡 간격을 갖는 내인성 표적에 대한 K562 세포에서의 TALEN 활성을 시험하였고, 상기 시험에서 세포를 37℃(옅은 사각형) 또는 저온 충격 조건(30℃, 진한 다이아몬드)에서 배양하였다. 상기 활성은 전체 TALE 반복의 배열을 FokI 절단 도메인과 연결시키는데 사용된 서열의 동일성에 상당히 의존하였다. 상기 C-캡 표기법이 C+0을 포함하지 않으므로, C-1 C-캡 값이 X=0에서 도식화되었고 C-2가 X=-1로서 도식화되었음에 유의한다. C+5, C+28 등을 X=5, X=28 등으로서 도식화하였다. 피크 활성을 C+63 C-캡 서열에 대해 관찰하였다.
도 27은 RVD 분석을 위해 선택된 예시적인 TALEN의 특이성을 묘사한다. 상기 TALEN을 11개 염기 표적 서열 5'-TTGACAATCCT-3'(SEQ ID NO: 178)에 결합하도록 설계하였다. 위치 5-7에서의 표적의 동일성이 CAA(설계된 표적), CGA, TCG 또는 TTG이도록, 이 표적이 위치 6에서 변화될 때 ELISA 분석에 의해 결정된 DNA 결합 결과가 나타나 있다.
도 28은 시험된 모든 RVD에 대해 측정된 ELISA 친화도의 그래프 표현이다. 상기 데이터는 20x20 격자로 나타나 있으며, 여기에서 RVD의 첫번째 아미노산(위치 12)이 격자의 수직 좌측에 나타나 있고, RVD의 두 번째 아미노산(위치 13)이 상기 격자 위에 수평으로 나타나 있다. 각 격자에서 글자 A, C, G, 및 T의 크기가 각각 CAA 부위, CCA 부위, 및 CGA 부위 및 CTA 부위에 대해 정규화된 ELISA 신호의 제곱근에 기초하여 크기가 변경되어 있다. 많은 RVD는 자연적으로 발생하는 HD, NI, NG, NS, NN, IG, HG, 및 NK RVD에 대하여 개선된 DNA 결합 특성을 갖는다. 자연에서 가장 흔히 발견되는 4개의 RVD(HD, NG, NI, 및 NN)가 참고를 위해 박스 표시되어 있다. 이들 4개의 RVD의 경우, ELISA에 의해 선호되는 염기가 예측된 선호되는 염기와 일치하였다.
도 29는 T 이외의 뉴클레오티드 염기와의 상호작용을 가능하게 하기 위해 C-말단 절반 반복이 RVD에서 변화된 TALEN의 활성의 측정 결과를 묘사한 겔이다. 나타낸 TALEN 활성은 전술한 Cel-I 분석에 의해 결정된 바와 같다. 화살표 머리 부분은 삽입-결실(indel)에서의 Cel-I 절단 결과인 밴드를 가리킨다. 레인 배치가 실시예 16의 표 32에 열거되어 있다. 이들 결과는 TALEN C-말단 절반 반복이 목적하는 각 뉴클레오티드 염기에 결합하도록 조작될 수 있음을 입증한다.
도 30은 완전히 비정형적인 RVD(완전히 치환됨), 한 가지 유형 또는 특이성의 모든 반복 단위(예컨대, 'T' 등을 지정하는 RVD를 갖는 모든 반복 단위)가 비정형적인 RVD로 치환된 반복 도메인을 포함하는 TALE 반복 단위를 갖는 TALEN(타입 치환), 또는 상기 배열을 갖는 단지 하나의 반복 단위가 비정형적인 RVD-포함 반복 단위로 치환된 TALEN(단일 치환됨)을 이용한 TALEN 활성의 측정을 묘사한 겔이다. 활성 분석은 37℃ 또는 저온 충격 조건(30℃)에서 수행하였으며, 임의의 측정가능한 NHEJ 활성의 정량이 레인 상에 나타나 있다.
도 31은 랫트 배아의 TALEN 처리 후 태어난 랫트 새끼에서 NHEJ 사건의 존재를 묘사한 일련의 겔이다. 상기 새끼로부터 게놈 DNA를 분리하고 뉴클레아제 표적 부위를 둘러싼 영역 상에서 PCR을 수행하였다. 그리고 나서, 상기 산물에 대해 T7 엔도뉴클레아제를 이용하여 NHEJ 유도된 불일치를 조사하였다. 화살표는 불일치의 존재로부터 생성된 밴드를 나타낸다. 조사된 66마리의 새끼 중 7마리(11%)가 NHEJ 사건에 대해 양성이었다.
발명의 상세한 설명
서론
본원은 목적하는 내인성 DNA 서열을 인식할 수 있도록 TALE-반복 도메인을 조작할 수 있다는 것과 기능성 도메인을 상기 조작된 TALE-반복 도메인에 융합하는 것이 그 본래의 염색질 환경 내에 존재하는, 유전자를 비롯한 내인성 세포 좌위의 기능적 상태나 실질적인 게놈 DNA 서열을 변경하는데 사용될 수 있다는 것을 입증한다. 따라서, 본 발명은 유전자를 비롯한 내인성 세포 좌위를 고효율로 특이적으로 인식하도록 조작된 TALE-융합 DNA 결합 단백질을 제공한다. 그 결과, 본 발명의 TALE-융합은 내인성 유전자 전사의 활성화 및 억제 모두를 통해 내인성 유전자 발현을 조절하는데 사용될 수 있다. 상기 TALE-융합은 또한 내인성 염색체 서열을 변형시키는 다른 조절성 또는 기능성 도메인, 예를 들어 뉴클레아제, 트랜스포사아제(transposase) 또는 메틸라아제에 연결될 수 있다.
본원에 기술된 방법 및 조성물은 신규한 인간 및 포유동물의 치료적 응용, 예컨대, 유전적 질병, 암, 진균류, 원생생물, 박테리아, 및 바이러스 감염, 허혈, 심혈관 질환, 관절염, 면역학적 장애 등의 치료를 가능하게 할 뿐만 아니라, 기능성 게놈 분석을 제공하고, 조사 및 약물 탐색을 위한 조작된 세포주를 생성하고, 증가된 질병 저항성을 포함하나 이에 제한되지 않는 변화된 표현형을 갖는 식물을 개발하기 위한 수단을 제공하고, 과실 숙성 특성, 당 및 오일 조성, 수확량, 및 색상을 변경시키는 것을 제공한다.
본원에 기술된 바와 같이, 둘 이상의 TALE-융합은 임의의 세포에 투여되어, 동일한 표적 내인성 세포 유전자, 또는 상이한 표적 내인성 세포 유전자를 인식할 수 있다.
또 다른 구체예에서, TALE-융합 단백질은 하기에 기술된 적어도 하나 이상의 조절성 도메인에 연결된다. 조절성 또는 기능성 도메인의 비제한적인 예는 KRAB 및 VP16과 같은 전사 인자 억제자 또는 활성자 도메인, 보조-억제자 및 보조-활성자 도메인, DNA 메틸 트랜스퍼라아제, 히스톤 아세틸트랜스퍼라아제, 히스톤 디아세틸라아제, 및 엔도뉴클레아제 Fokl으로부터의 절단 도메인과 같은 DNA 절단 도메인을 포함한다.
또한 하나 이상의 TALE-반복 단위, N-캡 및, 선택적으로 게놈 편집(예컨대, 유전자의 절단; 예를 들어, 절단 후 외인성 서열의 삽입(물리적 삽입 또는 상동성-지정 수선(homology-directed repair)을 통한 삽입) 및/또는 절단 후 NHEJ에 의한 유전자의 변화; 하나 이상의 유전자의 부분적인 또는 전체적인 불활성화; 내인성 유전자의 기능적 상태가 변화된 대립유전자의 생성, 조절 요소의 삽입 등)에 유용한 뉴클레아제 도메인에 융합된 C-캡 및 생식세포 내로 운반된 게놈의 변화를 포함하는, 융합 단백질을 포함하는 조성물 및 방법이 본원에 기술된다. 또한, 예를 들어 표적 세포에서 하나 이상의 유전자를 편집(변화)시키는 이들 조성물(시약)을 제조하고 사용하는 방법이 개시된다. 따라서, 본원에 기술된 방법 및 조성물은 하나 이상의 유전자의 표적화된 유전자 변화(예컨대, 넉인(knock-in)) 및/또는 넉아웃(knockout)(일부 또는 전체) 및/또는 임의의 표적 대립유전자의 서열의 무작위 돌연변이를 위한 매우 효율적인 방법을 제공하며, 따라서 인간 질병의 동물 모델의 생성을 가능하게 한다.
또한 매우 활성인 뉴클레아제 기능을 제공하는 TALE 반복 배열에 뉴클레아제 도메인을 연결하기 위한 조성물(C-캡)이 본원에 제공된다. 일부 구체예에서, 상기 C-캡은 본래의 TALE C-말단 측면 서열 유래의 펩타이드 서열을 포함한다. 다른 구체예에서, 상기 C-캡은 TALE 반복 도메인 유래의 펩타이드 서열을 포함한다. 또 다른 구체예에서, 상기 C-캡은 비-TALE 서열을 포함한다. C-캡은 또한 본래의 TALE C-말단 측면 서열 유래의 펩타이드 서열 및/또는 TALE 반복 도메인을 포함하고/하거나 이들 공급원을 포함하지 않는, 키메라 구조를 나타낼 수 있다.
TALEN은 또한 AAVS1(공동소유의 미국특허공개 제20080299580호 참조) 또는 CCR5(공동소유의 미국 특허공개 제20080159996호 참조)와 같은 안전한 하버(harbor) 좌위 내로 관심대상 공여체를 삽입할 수 있도록 조작될 수 있다. 상기 공여체는 관심대상 유전자를 포함하거나 shRNA, RNAi 또는 miRNA와 같은 관심대상 RNA를 코딩할 수 있다.
조작된 TALE-융합 단백질(예컨대, 전사 활성자, 전사 억제자 및 뉴클레아제)의 발현은 또한 tet-조절된 시스템 및 RU-486 시스템(예컨대, Gossen & Bujard, Proc Natl Acad Sci 89:5547 (1992); Oligino et al., Gene Ther. 5:491-496 (1998); Wang et al., Gene Ther. 4:432-441 (1997); Neering et al, Blood 88:1147-1155 (1996); and Rendahl et al., Nat . Biotechnol . 16:757-761 (1998) 참조)로 대표되는 시스템에 의해 제어될 수 있다. 이들은 TALE-융합 활성자 및 억제자의 발현에 소분자 제어를 제공하여 관심대상 표적 유전자(들)의 소분자 제어를 제공한다. 이러한 이로운 특징은 세포 배양 모델, 유전자 치료요법, 및 형질전환 동물 및 식물에서 사용될 수 있다.
개론
방법의 실행 뿐만 아니라 본원에 개시된 조성물의 제조 및 사용은, 달리 나타내지 않는 한, 분자 생물학, 생화학, 염색질 구조 및 분석, 컴퓨터 화학, 세포 배양, 재조합 DNA 및 본 기술분야의 기술 내에 속하는 관련 분야에서의 통상적인 기술을 이용한다. 이들 기술은 문헌에 자세히 설명되어 있다. 예를 들어, 문헌[Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 and Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P.M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; and METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P.B. Becker, ed.) Humana Press, Totowa, 1999]을 참조한다.
정의
용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 상호교환적으로 사용되며, 선형 또는 환형 형태 및 단일-또는 이중-가닥 형태인, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체를 지칭한다. 본 개시의 목적을 위해, 이들 용어들은 중합체의 길이에 대하여 제한하는 것이 아닌 것으로 해석되어야 한다. 상기 용어들은 천연 뉴클레오티드의 공지된 유사체 뿐만 아니라 염기, 당 및/또는 인산 부분(예컨대, 포스포로티오에이트(phosphorothioate) 백본)이 변형된 뉴클레오티드를 포함할 수 있다. 일반적으로, 특정 뉴클레오티드의 유사체는 동일한 염기-쌍 특이성을 가지며, 즉 A의 유사체는 T와 염기쌍을 이룰 것이다.
용어 "폴리펩타이드", "펩타이드" 및 "단백질"은 아미노산 잔기들의 중합체를 지칭하기 위해 상호교환적으로 사용된다. 상기 용어는 또한 하나 이상의 아미노산이 대응하는 자연적으로 발생하는 아미노산의 화학적 유사체 또는 변형된 유도체인 아미노산 중합체에 적용된다.
"결합"은 거대분자 사이(예컨대, 단백질 및 핵산 사이)의 서열-특이적인, 비공유 상호작용을 지칭한다. 상기 상호작용이 전체적으로 서열-특이적인 한, 결합 상호작용의 모든 성분들이 서열 특이적(예컨대, DNA 백본 내의 인산 잔기와 접촉)일 필요는 없다. 상기 상호작용은 일반적으로 10-6 M 이하의 해리 상수(Kd)를 특징으로 한다. "친화도"는 결합의 강도를 지칭하며, 증가된 결합 친화도는 더 낮은 Kd와 상관된다.
"결합 단백질"은 또 다른 분자와 비공유적으로 결합할 수 있는 단백질이다. 결합 단백질은, 예를 들어 DNA 분자(DNA-결합 단백질), RNA 분자(RNA-결합 단백질) 및/또는 단백질 분자(단백질-결합 단백질)에 결합할 수 있다. 단백질-결합 단백질의 경우, 이는 그 자신에 결합하고/하거나(동종이량체, 동종삼량체 등을 형성함), 이는 상이한 단백질 또는 단백질들의 하나 이상의 분자에 결합할 수 있다. 결합 단백질은 한 가지 유형 이상의 결합 활성을 가질 수 있다. 예를 들어, 아연-핑거(zinc-finger) 단백질은 DNA-결합, RNA-결합 및 단백질-결합 활성을 갖는다.
"TALE-반복 도메인"(또한 "반복 배열")은 TALE가 그의 동족 표적 DNA 서열에 결합하는 것에 관여하며 하나 이상의 TALE "반복 단위"를 포함하는 서열이다. 단일 "반복 단위"("반복"으로도 지칭됨)는 통상적으로 33-35개의 아미노산 길이이며 자연적으로 발생하는 TALE 단백질 내의 다른 TALE 반복 서열과 적어도 일부 서열 상동성을 나타낸다. 본원에 기술된 TALE 반복 단위는 일반적으로 (X)1 내지 11-(XRVD)2-(X)20-22(SEQ ID NO: 399) 형태이며, 여기에서 XRVD(위치 12 및 13)는 자연적으로 발생하는 TALE 단백질에서 초가변성(hypervariability)을 나타낸다. 위치 12 및 13에 있는 아미노산의 신원(identity)을 변화시키는 것은 상기 반복 단위가 상호작용하는 DNA 뉴클레오티드(또는 이중-가닥 DNA에서 상보적인 뉴클레오티드의 쌍)의 신원에 대한 선호도를 변화시킬 수 있다. "비정형적인" RVD는, 자연상에서 드물게 또는 결코 발생하지 않는, 예를 들어 자연적으로 발생하는 TALE 단백질의 5% 미만, 바람직하게는 자연적으로 발생하는 TALE 단백질의 2% 미만, 및 더욱 바람직하게는 자연적으로 발생하는 TALE 단백질의 1% 미만으로 발생하는, RVD 서열(위치 12 및 13)이다. 비정형적인 RVD는 비자연적으로 발생할 수 있다.
용어 "N-캡(cap)" 폴리펩타이드 및 "N-말단 서열"은 TALE 반복 도메인의 N-말단 부분의 측면에 있는 아미노산 서열(폴리펩타이드)을 지칭하기 위해 사용된다. N-캡 서열은, TALE-반복 도메인(들)이 DNA에 결합하는 기능을 하는 한, 임의의 길이(아미노산을 포함하지 않음)일 수 있다(아미노산을 포함하지 않음). 따라서, N-캡 서열은 TALE 반복 도메인에 대한 적절한 구조적 안정화 및/또는 DNA와의 비특이적 접촉을 제공하는데 관여할 수 있다. N-캡 서열은 자연적으로 발생하거나 비자연적으로 발생할 수 있으며, 예를 들어 임의의 전장 TALE 단백질의 N-말단 영역으로부터 유래될 수 있다. N-캡 서열은 전장 TALE 단백질에서 발견되는 폴리펩타이드의 단편(절단)이며, 예를 들어 TALE-반복 도메인의 DNA-결합 기능을 지지하거나 TALE 융합 단백질 활성에 대한 지지를 제공하는데 충분한, 자연적으로 발생하는 TALE 단백질 내의 TALE 반복 도메인의 측면에 있는 N-말단 영역의 임의의 절단이다. 각 TALE-반복 단위가 전형적인 RVD를 포함하는 경우 및/또는 C-캡이 TALE 단백질의 전장의 자연적으로 발생하는 C-말단 영역을 포함하는 경우, N-캡 서열은 자연적으로 발생하는 TALE 단백질의 전장 N-말단 영역을 포함하지 않는다. 따라서, 전술한 바와 같이, 이 서열은 반드시 DNA 인식에 관여하는 것은 아니지만, 내인성 표적 DNA에서의 효율적이고 특이적인 기능이나 TALE 융합 단백질의 효율적인 활성을 향상시킬 수 있다. TALE 반복 도메인의 N-말단 부분에 가장 가까운 N-캡 서열의 부분은 TALE 반복 단위에 대해 일부 상동성을 가질 수 있으며 "R0 반복"으로 지칭된다. 통상적으로, 표적 부위의 바로 5' 위치에 대해 선호되는 뉴클레오티드는 티미딘(T)이다. N-캡의 R0 반복 부분이 TALE 반복에 의해 특정된 표적 서열에 인접한 T(또는 이중 가닥 DNA 내의 T에 염기쌍을 이룬 A)와 상호작용하는 것을 선호할지 모른다. R0 서열의 한 가지 예가 하기에 나타나 있다:
LDTGQLLKIAKRGGVTAVEAVHAWRNALTGAPLN (SEQ ID NO: 1)
용어 "C-캡" 또는 "C-말단 영역"은 TALE 반복 도메인의 C-말단 부분의 측면에 있을 수 있는 선택적으로 존재하는 아미노산 서열(폴리펩타이드)을 지칭한다. C-캡은 또한 말단 C-말단 TALE 반복의 임의의 부분을 포함할 수 있으며, 이는 0 잔기, TALE 반복의 절단 또는 전체 TALE 반복을 포함한다. C-말단 영역의 첫 번째 20개의 잔기는 통상적으로 TALE 반복 단위의 첫 번째 20개 잔기와 상동이며, TALE 반복 도메인에 의해 지정된 DNA 서열의 뉴클레오티드 3'의 선호도를 지정할 수 있는 RVD 서열을 함유할 수 있다. 존재하는 경우, TALE 반복의 첫 번째 20개 잔기에 상동인 C-말단 영역의 이 부분은 또한 "절반 반복"으로 지칭된다. C-말단 영역 내의 잔기의 번호매기기 계획(numbering scheme)은, C-20에서 시작하여 C-19, C-18, C-17, C-16, C-15, C-14, C-13, C-12, C-11, C-10, C-9, C-8, C-7, C-6, C-5, C-4, C-3, C-2, C-1로 증가하고, C+1로 증가한 다음 폴리펩타이드의 C-말단 쪽으로 C+2, C+3 등으로 증가하는, 이러한 통상적인 부분적인 상동성을 반영한다. C+28 C-캡은 잔기 C-20에서부터 잔기 C+28(포함함)까지의 서열을 지칭하며, 따라서 48개의 잔기 길이를 갖는다. 상기 C-캡 서열은 자연적으로 발생하거나(예컨대, 자연적으로 발생하는 단백질의 단편) 또는 비-자연적으로 발생하거나(예컨대, 하나 이상의 아미노산 결실, 치환 및/또는 부가를 포함하는 자연적으로 발생하는 단백질의 단편), 또는 C 캡으로서 작용하는 능력을 갖는 임의의 다른 자연적 또는 비-자연적 서열일 수 있다. 상기 C-말단 영역은 TALE 반복 도메인(들)의 DNA-결합 기능에 전적으로 요구되지 않지만, 일부 구체예에서 C-캡은 DNA와 상호작용할 수 있으며, 또한 예를 들어 TALE 반복 도메인의 C-말단에 뉴클레아제를 포함하는 융합 단백질에서, 기능성 도메인의 활성을 향상시킬 수 있다.
"아연-핑거 DNA 결합 단백질"(또는 결합 도메인)은, 구조가 아연 이온의 배위(coordination)를 통해 안정화되는 결합 도메인 내의 아미노산 서열의 영역인, 하나 이상의 아연-핑거를 통해 서열-특이적인 방식으로 DNA에 결합하는, 단백질이거나 또는 더 큰 단백질 내의 도메인이다. 용어 아연-핑거 DNA 결합 단백질은 종종 아연-핑거 단백질 또는 ZFP로 약칭된다.
"선발된(selected)" 아연-핑거 단백질 또는 TALE-반복 도메인을 포함하는 단백질은, 파아지 디스플레이, 상호작용 트랩(interaction trap) 또는 하이브리드 선발(hybrid selection)과 같은 실험 과정으로부터 주로 생성되는 단백질이다. 예컨대, 미국 특허 제5,789,538호; 미국 특허 제5,925,523호; 미국 특허 제6,007,988호; 미국 특허 제6,013,453호; 미국 특허 제6,200,759호; 국제 공개 제WO 95/19431호; 국제 공개 제WO 96/06166호; 국제 공개 제WO 98/53057호; 국제 공개 제WO 98/54311호; 국제 공개 제WO 00/27878호; 국제 공개 제WO 01/60970호; 국제 공개 제WO 01/88197호 및 국제 공개 제WO 02/099084호를 참조한다.
용어 "서열"은 임의의 길이의 뉴클레오티드 서열을 지칭하며, 이는 DNA 또는 RNA일 수 있으며; 선형, 환형 또는 분지되거나, 단일-가닥 또는 이중-가닥일 수 있다. 용어 "공여체 서열(donor sequence)"은 게놈 내로 삽입되는 뉴클레오티드 서열을 지칭한다. 공여체 서열은, 임의의 길이, 예를 들어 2 내지 10,000개의 뉴클레오티드 길이(또는 이들 사이 또는 이들을 초과하는 임의의 정수), 바람직하게는 약 100 내지 1,000개의 뉴클레오티드 길이(또는 이들 사이의 임의의 정수), 더욱 바람직하게는 약 200 내지 500개의 뉴클레오티드 길이일 수 있다.
"상동인, 동일하지 않은 서열"은 제2 서열과 어느 정도의 서열 동일성을 공유하지만, 이의 서열이 제2 서열과 동일하지 않은 제1 서열을 지칭한다. 예를 들어, 돌연변이 유전자의 야생형 서열을 포함하는 폴리뉴클레오티드는 상기 돌연변이 유전자의 서열과 상동이나 동일하지 않다. 특정 구체예에서, 상기 두 서열 간의 상동성 정도는 이들 사이에 상동 재조합을 가능하게 하여 정상적인 세포 기전을 이용하는데 충분하다. 두 개의 상동인 동일하지 않은 서열들은 임의의 길이일 수 있으며, 이들의 비상동성 정도는 단일 뉴클레오티드만큰 작거나(예컨대, 표적화된 상동 재조합에 의해 게놈 점 돌연변이를 정정하기 위해), 10 kb만큼 클 수 있다(예컨대, 염색체 내의 미리결정된 이송성 부위에 유전자를 삽입하기 위해). 상동인 동일하지 않은 서열을 포함하는 두 개의 폴리뉴클레오티드들은 동일한 길이일 필요는 없다. 예를 들어, 20 내지 10,000개의 뉴클레오티드 또는 뉴클레오티드 쌍을 갖는 외인성 폴리뉴클레오티드(즉, 공여체 폴리뉴클레오티드)가 사용될 수 있다.
핵산 및 아미노산 서열 동일성을 결정하는 기술은 본 기술분야에 공지되어 있다. 통상적으로, 상기 기술은 유전자에 대한 mRNA의 뉴클레오티드 서열을 결정하는 것 및/또는 이에 의해 코딩된 아미노산 서열을 결정하는 것, 및 이들 서열을 제2 뉴클레오티드 또는 아미노산 서열과 비교하는 것을 포함한다. 게놈 서열은 이러한 방식으로 결정되고 비교될 수도 있다. 일반적으로, 동일성은 두 개의 폴리뉴클레오티드 또는 폴리펩타이드 서열의 정확한 뉴클레오티드-대-뉴클레오티드 또는 아미노산-대-아미노산 대응을 각각 지칭한다. 둘 이상의 서열들(폴리뉴클레오티드 또는 아미노산)은 이들의 퍼센트 동일성을 결정함으로써 비교될 수 있다. 핵산 서열이든 또는 아미노산 서열이든지 간에, 두 서열의 퍼센트 동일성은 정렬된 두 개의 서열 간의 정확한 일치 수를 더 짧은 서열의 길이로 나누고 100을 곱한 것이다.
대안적으로, 폴리뉴클레오티드들 간의 서열 유사성 정도는, 상동 영역 간에 안정적인 이중체를 형성시킬 수 있는 조건 하에서 폴리뉴클레오티드들을 혼성화한 후, 단일 가닥의 특이적 뉴클레아제(들)를 이용하여 절단하고, 상기 절단된 단편의 크기를 결정함으로써 결정될 수 있다. 두 개의 핵산, 또는 두 개의 폴리펩타이드 서열들은, 상기 방법을 이용하여 결정된 바와 같이 상기 서열들이 분자의 확정된 길이에 대해 적어도 약 70%-75%, 바람직하게는 80%-82%, 더욱 바람직하게는 85%-90%, 더욱더 바람직하게는 92%, 훨씬 더 바람직하게는 95%, 및 가장 바람직하게는 98% 서열 동일성을 나타내는 경우 서로에 대해 실질적으로 상동이다. 본원에 사용된 바와 같이, 또한 실질적으로 상동이라는 것은 특정 DNA 또는 폴리펩타이드 서열에 대해 완전히 동일성을 보이는 서열을 지칭한다. 실질적으로 상동인 DNA 서열들은 특정 시스템에 대해 확정된 바와 같이, 예를 들어 엄격한 조건 하에서, 서던 혼성화 실험에서 확인될 수 있다. 적절한 혼성화 조건을 확정하는 것은 본 기술분야의 기술 내에 속한다. 예컨대, 전술한 문헌[Sambrook et al; Nucleic Acid Hybridization: A Practical Approach, editors B.D. Hames and S.J. Higgins, (1985) Oxford; Washington, DC; IRL Press]을 참조한다.
"재조합"은 두 개의 폴리뉴클레오티드 간의 유전적 정보의 교환 과정을 지칭한다. 본 개시의 목적을 위해, "상동 재조합(HR)"은, 예를 들어 상동성-지정 수선 기전을 통해 세포에서의 이중-가닥 파손의 손상 동안에 일어나는 특수한 형태의 상기 교환을 지칭한다. 이 과정은 뉴클레오티드 서열 상동성을 필요로 하며, "표적" 분자(즉, 이중-가닥 파손을 겪은 것)의 수선에 주형으로 작용하는 "공여체" 분자를 사용하고, 이는 공여체로부터 표적으로 유전적 정보를 전달하기 때문에 "비-교차(non-crossover) 유전자 변환" 또는 "짧은 트랙(short tract) 유전자 변환"으로 다양하게 알려져 있다. 어떤 특정 이론에 한정됨이 없이, 상기 전달은 파손된 표적 및 공여체 사이에 형성되는 이종이합체 DNA의 불일치 정정을 수반하고/하거나, 표적의 일부가 될 수 있는 유전적 정보를 재합성하는데에 상기 공여체가 사용되는 합성-의존성 가닥 어닐링(synthesis-dependent strand annealing)" 및/또는 관련 과정을 수반할 수 있다. 상기 특수한 HR은 상기 공여체 폴리뉴클레오티드의 서열의 일부 또는 전부가 표적 폴리뉴클레오티드 내로 통합되도록 종종 표적 분자의 서열의 변화를 초래한다.
본 개시의 방법에서, 본원에 기술된 하나 이상의 표적화된 뉴클레아제는 미리결정된 부위에서 표적 서열(예컨대, 세포 염색질) 내에 이중-가닥의 파손을 생성하며, 상기 파손 영역 내의 뉴클레오티드 서열과 상동성을 갖는 "공여체" 폴리뉴클레오티드는 세포 내로 도입될 수 있다. 이중-가닥의 파손(DSB)의 존재는 공여체 서열의 통합을 용이하게 하는 것으로 나타났다. 상기 공여체 서열은 물리적으로 통합되거나, 대안적으로 상기 공여체 폴리뉴클레오티드는 상동 재조합을 통해 파손의 수선을 위한 주형으로 사용되어 공여체 내의 뉴클레오티드 서열의 전부 또는 일부를 세포 염색질 내로 도입할 수 있다. 따라서, 세포 염색질 내의 제1 서열이 변화될 수 있고, 특정 구체예에서는, 공여체 폴리뉴클레오티드 내에 존재하는 서열로 변환될 수 있다. 따라서, 용어 "대체하다" 또는 "대체"의 사용은 하나의 뉴클레오티드 서열을 다른 것으로 대체하는 것(즉, 정보적인 관점에서의 서열의 대체)을 나타내는 것으로 이해될 수 있으며, 하나의 폴리뉴클레오티드를 또 다른 것으로 물리적 또는 화학적으로 대체하는 것을 반드시 필요로 하지 않는다. 일부 구체예에서, 본원에 기술된 표적화된 뉴클레아제에 의해 두 개의 DSB가 도입되며, 이는 DSB 사이에서의 DNA의 결실을 초래한다. 일부 구체예에서, "공여체" 폴리뉴클레오티드는 이들 두 개의 DSB 사이에 삽입된다.
따라서, 특정 구체예에서, 관심대상 영역 내의 서열에 상동인 공여체 서열의 부분들은 대체되는 게놈 서열에 대해 약 80 내지 99%(또는 이들 사이의 임의의 정수)의 서열 동일성을 나타낸다. 다른 구체예에서, 예를 들어 공여체와 100개가 넘는 인접한 염기쌍 간에 단지 1개의 뉴클레오티드가 다르면, 공여체 및 게놈 서열 간의 상동성은 99%보다 높다. 특정한 경우, 상기 공여체 서열의 비-상동성 부분은, 관심대상 영역 내로 새로운 서열이 삽입됨으로써, 관심대상 영역 내에 존재하지 않는 서열을 함유할 수 있다. 이러한 경우, 상기 비-상동성 서열은 일반적으로 관심대상 영역 내의 서열에 상동이거나 동일한, 50-1,000개의 염기쌍(또는 이들 사이의 임의의 정수값) 또는 1,000개보다 큰 임의의 수의 염기쌍의 서열의 측면에 위치한다. 다른 구체예에서, 공여체 서열은 제1 서열에 대해 비-상동성이며, 비-상동 재조합 기전에 의해 게놈 내로 삽입된다.
본원에 기술된 임의의 방법에서, 뉴클레아제 도메인에 융합된 부가적인 TALE-융합 단백질 뿐만 아니라 TALE- (또는 아연 핑거) 뉴클레아제의 부가적인 쌍이 세포 내의 부가적인 표적 부위의 부가적인 이중-가닥의 절단을 위해 사용될 수 있다.
본원에 기술된 임의의 방법은 관심대상 유전자(들)의 발현을 방해하는 공여체 서열의 표적화된 통합에 의해 세포 내의 하나 이상의 표적 서열을 부분적으로 또는 전체적으로 불활성화시키는데 사용될 수 있다. 부분적으로 또는 완전히 불활성화된 유전자를 갖는 세포주가 또한 제공된다.
나아가, 본원에 기술된 표적화된 통합 방법은 또한 하나 이상의 외인성 서열을 통합하는데 사용될 수 있다. 상기 외인성 핵산 서열은, 예를 들어 하나 이상의 유전자 또는 cDNA 분자, 또는 임의의 유형의 코딩 또는 비코딩 서열 뿐만 아니라, 하나 이상의 제어 요소(예컨대, 프로모터)를 포함할 수 있다. 또한, 상기 외인성 핵산 서열은 하나 이상의 RNA 분자(예컨대, 작은 헤어핀 RNA(shRNA), 조절 RNA(RNAis), 마이크로RNA(miRNA) 등)를 생산할 수 있다.
"절단"은 DNA 분자의 공유 백본의 파괴를 지칭한다. 절단은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하나 이에 제한되지 않는 다양한 방법에 의해 개시될 수 있다. 단일-가닥의 절단 및 이중-가닥의 절단 모두가 가능하며, 이중-가닥의 절단은 두 개의 별개의 단일-가닥의 절단 사건의 결과로서 발생할 수 있다. DNA 절단은 평활 말단(blunt end) 또는 엇갈림 말단(staggered end) 중 어느 하나를 생성할 수 있다. 특정 구체예에서, 융합 폴리펩타이드는 표적화된 이중-가닥의 DNA 절단을 위해 사용된다.
"절단 절반-도메인"은 이차 폴리펩타이드(동일하거나 상이함)과 함께 절단 활성(바람직하게는 이중-가닥 절단 활성)을 갖는 복합체를 형성하는 폴리펩타이드 서열이다. 용어 "제1 및 제2 절단 절반-도메인", "+ 및 - 절단 절반-도메인" 및 "우측 및 좌측 절단 절반-도메인"은 이량체화하는 절단 절반-도메인의 쌍을 지칭한다.
"조작된 절단 절반-도메인"은 또 다른 절단 절반-도메인(예컨대, 또 다른 조작된 절단 절반-도메인)과 필수적인 이종이량체를 형성하기 위해 변형된 절단 절반-도메인이다. 또한, 전체가 참고로써 본원에 통합되어 있는 문헌[미국 특허공개 제2005/0064474호; 제2007/0218528호 및 제2008/0131962호]을 참조한다.
"염색질"은 세포 게놈을 포함하는 핵단백질 구조이다. 세포 염색질은 핵산, 주로 DNA, 및 히스톤 및 비-히스톤 염색체 단백질을 비롯한 단백질을 포함한다. 진핵 세포의 염색질의 대부분은 뉴클레오좀의 형태로 존재하며, 여기에서 뉴클레오좀 코어는 두 개의 각각의 히스톤 H2A, H2B, H3 및 H4를 포함하는 8량체와 결합된 대략 150개의 염기쌍의 DNA를 포함하고, 링커 DNA(생물에 따라 길이가 다양함)는 뉴클레오좀 코어 사이로 확장한다. 히스톤 H1의 분자는 일반적으로 상기 링커 DNA와 결합된다. 본 개시의 목적을 위해, 용어 "염색질"은, 원핵 및 진핵의 모든 유형의 세포 핵단백질을 포함하는 것을 의미한다. 세포 염색질은 염색체 및 에피솜 염색질 모두를 포함한다.
"염색체"는 세포의 게놈 모두 또는 일부를 포함하는 염색질이다. 세포의 게놈은 종종 세포의 게놈을 포함하는 모든 염색체의 집합체인 그 핵형에 의해 특징지어진다. 세포의 게놈은 하나 이상의 염색체를 포함할 수 있다.
"에피솜"은 복제하는 핵산, 핵단백질 복합체 또는 세포의 염색체 핵형의 일부가 아닌 핵산을 포함하는 다른 구조이다. 에피솜의 예는 플라스미드 및 특정 바이러스 게놈을 포함한다.
"표적 부위" 또는 "표적 서열"은 결합을 위한 충분한 조건이 존재한다면, 결합 분자가 결합할 핵산의 일부를 한정하는 핵산 서열이다. 예를 들어, 서열 5'-GAATTC-3'는 EcoRI 제한 엔도뉴클레아제를 위한 표적 부위이다.
"식물" 세포는 외떡잎 또는 쌍떡잎 식물의 세포를 포함하나, 이에 제한되지는 않는다. 외떡잎 식물의 비제한적인 예는 옥수수, 쌀, 보리, 오트, 밀, 수수, 호밀, 사탕수수, 파인애플, 양파, 바나나, 및 코코넛과 같은 곡초류를 포함한다. 쌍떡잎 식물의 비제한적인 예는 담배, 토마토, 해바라기, 목화, 사탕무, 감자, 상추, 멜론, 대두, 카놀라(유채씨), 및 앨팰퍼(alfalfa)를 포함한다. 식물 세포는 식물의 임의의 부분으로부터 유래되고/거나 식물 발달의 임의의 단계로부터 유래될 수 있다.
"외인성" 분자는 세포 내에 일반적으로 존재하지 않지만, 하나 이상의 유전적, 생화학적 또는 다른 방법에 의해 세포 내로 도입될 수 있는 분자이다. "세포 내에서의 일반적인 존재"는 세포의 특정 발달 단계 및 환경적인 조건에 대하여 결정된다. 따라서, 예를 들어, 근육의 배아 발달 중에만 존재하는 분자는 성인 근육 세포에 대하여 외인성 분자이다. 유사하게, 열 충격에 의해 유도된 분자는 열 충격을 받지 않은 세포에 대하여 외인성 분자이다. 외인성 분자는, 예를 들어 내인성 분자의 기능을 손상시키는 기능 형태 또는 정상적으로 기능하는 내인성 분자의 기능 부전 형태를 포함할 수 있다. 외인성 분자는 또한 또 다른 종에서 일반적으로 발견되는 분자, 예를 들어 동물의 게놈 내로 도입된 인간 서열일 수 있다.
여러 가지 중에서, 외인성 분자는 조합 화학 공정에 의해 생성된 것과 같은 소분자, 또는 단백질, 핵산, 탄수화물, 지질, 당단백질, 지단백질, 다당류, 상기 분자의 임의의 변형 유도체, 또는 상기 분자 중 하나 이상을 포함하는 임의의 복합체와 같은 거대분자일 수 있다. 핵산은 DNA 및 RNA를 포함하며, 단일- 또는 이중-가닥일 수 있고, 선형, 분지 또는 환형일 수 있으며, 임의의 길이일 수 있다. 핵산은 이중체를 형성할 수 있는 것 뿐만 아니라 삼중체-형성 핵산을 포함한다. 예를 들어, 미국 특허 제5,176,996호 및 제5,422,251호를 참조한다. 단백질은 DNA-결합 단백질, 전사 인자, 염색질 리모델링 인자, 메틸화된 DNA 결합 단백질, 폴리머라아제, 메틸라아제, 디메틸라아제, 아세틸라아제, 디아세틸라아제, 키나아제, 포스파타아제, 인테그라아제, 재조합효소, 리가아제, 토포이소머라아제, 기라아제(gyrase) 및 헬리카아제를 포함하나, 이에 제한되지 않는다.
외인성 분자는 내인성 분자로서의 동일한 유형의 분자, 예컨대 외인성 단백질 또는 핵산일 수 있다. 예를 들어, 외인성 핵산은 세포 내로 도입되는 감염성 바이러스 게놈, 플라스미드 또는 에피솜, 또는 세포 내에 일반적으로 존재하지 않는 염색체를 포함할 수 있다. 세포 내로 외인성 분자를 도입하는 방법은 본 기술분야의 숙련자에게 공지되어 있으며, 이는 지질-매개 전달(즉, 중성 및 양이온성 지질을 포함하는 리포좀), 전기천공법, 직접 주사, 세포 융합, 입자 충격(particle bombardment), 인산칼슘 침전법, DEAE-덱스트란-매개 전달 및 바이러스 벡터-매개 전달을 포함하나, 이에 제한되지 않는다.
그에 반해서, "내인성" 분자는 특정 환경 조건 하에서 특정 발달 단계에 있는 특정 세포 내에 일반적으로 존재하는 것이다. 예를 들어, 내인성 핵산은 염색체, 미토콘드리아, 엽록체 또는 다른 세포 기관의 게놈, 또는 자연적으로 발생하는 에피솜 핵산을 포함할 수 있다. 부가적인 내인성 분자는 단백질, 예를 들어, 전사 인자 및 효소를 포함할 수 있다.
"융합" 분자는 둘 이상의 소단위(subunit) 분자가, 바람직하게는 공유적으로 연결된 분자이다. 상기 소단위 분자는 동일한 화학적 유형의 분자이거나, 상이한 화학적 유형의 분자일 수 있다. 첫 번째 유형의 융합 분자의 예는 융합 단백질(예를 들어, TALE-반복 도메인 및 절단 도메인 간의 융합) 및 융합 핵산(예를 들어, 전술한 융합 단백질을 코딩하는 핵산)을 포함하나, 이에 제한되지 않는다. 두 번째 유형의 융합 분자의 예는 삼중체-형성 핵산 및 폴리펩타이드 간의 융합, 및 작은 홈(minor groove) 결합제와 핵산 간의 융합을 포함하나, 이에 제한되지 않는다.
세포에서 융합 단백질의 발현은 융합 단백질을 세포에 전달하거나 융합 단백질을 코딩하는 폴리뉴클레오티드를 세포에 전달함으로써 야기될 수 있으며, 여기에서 상기 폴리뉴클레오티드는 전사되고 상기 전사체는 번역되어 융합 단백질을 생성한다. 트랜스-접합(Trans-splicing), 폴리펩타이드 절단 및 폴리펩타이드 결찰(ligation)이 또한 세포 내 단백질 발현에 관여할 수 있다. 폴리뉴클레오티드 및 폴리펩타이드를 세포에 전달하는 방법은 본 개시 내의 다른 곳에 제시되어 있다.
본 개시의 목적을 위해, "유전자"는 유전자 산물을 코딩하는 DNA 영역(하기 참조) 뿐만 아니라 유전자 산물의 생산을 조절하는 모든 DNA 영역을 포함하며, 상기 조절 서열이 코딩 및/또는 전사된 서열에 인접하는지 여부에 관계없이 그러하다. 따라서, 유전자는 프로모터 서열, 종결자, 리보솜 결합 부위 및 내부 리보솜 도입 부위와 같은 번역 조절 서열, 인핸서, 사일런서(silencer), 절연체(insulator), 경계 요소, 복제 원점, 매트릭스 부착 부위 및 위치 제어 영역을 포함하나, 반드시 이에 제한되지는 않는다.
"유전자 발현"은 유전자 내에 함유된 정보를 유전자 산물로 변환하는 것을 지칭한다. 유전자 산물은 유전자의 직접적인 전사 산물(예컨대, mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, 구조적 RNA, shRNA, RNAi, miRNA 또는 임의의 다른 유형의 RNA)이거나 mRNA의 번역에 의해 생산된 단백질일 수 있다. 유전자 산물은 또한 캡핑(capping), 폴리아데닐화, 메틸화, 및 편집과 같은 공정에 의해 변형된 RNA, 및 예를 들어, 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화, 및 글리코실화에 의해 변형된 단백질을 포함한다.
"갭 크기(gap size)"는 핵산 표적 상의 두 개의 TALE 표적 부위 간의 뉴클레오티드를 지칭한다. 갭은 1 내지 100개의 염기쌍, 또는 5 내지 30개의 염기쌍, 바람직하게는 10 내지 25개의 염기쌍, 및 더욱 바람직하게는 12 내지 21개의 염기쌍을 포함하나 이에 제한되지 않는 임의의 크기일 수 있다. 따라서, 바람직한 갭 크기는 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 21개의 염기쌍일 수 있다.
유전자 발현의 "조절(modulation)"은 유전자의 활성 변화를 지칭한다. 발현의 조절은 유전자 활성화 및 유전자 억제를 포함할 수 있으나, 이에 제한되지 않는다. 게놈 편집(예컨대, 절단, 변화, 불활성화, 공여체 삽입, 무작위 돌연변이)이 발현을 조절하는데 사용될 수 있다. 유전자 불활성화는 본원에 기술된 변형제를 포함하지 않는 세포와 비교하여 유전자 발현의 임의의 감소를 지칭한다. 따라서, 유전자 불활성화는 부분적이거나 전체적일 수 있다.
"관심대상 영역"은, 예를 들어, 유전자 또는 유전자 내 또는 이에 인접한 비코딩 서열과 같은, 세포 염색질의 임의의 영역으로서, 상기 서열은 외인성 분자에 결합하는 것이 바람직하다. 결합은 표적화된 DNA 절단 및/또는 표적화된 재조합을 위한 것일 수 있다. 관심대상 영역은, 예를 들어 염색체, 에피솜, 세포 기관의 게놈(예컨대, 미토콘드리아, 엽록체), 또는 감염성 바이러스 게놈 내에 존재할 수 있다. 관심대상 영역은 유전자의 코딩 영역 내에, 예를 들어 리더 서열, 트레일러(trailer) 서열 또는 인트론과 같이 전사된 비코딩 영역 내에, 또는 상기 코딩 영역의 상류 또는 하부의 전사되지 않은 영역 내에 존재할 수 있다. 관심대상 영역은 단일 뉴클레오티드 쌍만큼 작거나 최대 2,000 뉴클레오티드 쌍의 길이이거나, 또는 임의의 정수값의 뉴클레오티드 쌍일 수 있다.
용어 "작동성 연결(operative linkage)" 및 "작동적으로 연결된 " (또는 "작동가능하게 연결된")은 두 가지 이상의 성분들(예컨대, 서열 요소들)의 병치(juxtaposition)와 관련하여 상호교환적으로 사용되며, 여기에서 상기 성분들은 두 가지 성분들이 정상적으로 기능하고 적어도 하나의 다른 성분에 대해 수행되는 기능을 적어도 하나의 성분이 매개할 수 있는 가능성을 허용한다. 예시로써, 프로모터와 같은 전사 조절 서열은, 상기 전사 조절 서열이 하나 이상의 전사 조절 인자의 존재 또는 부재에 반응하여 코딩 서열의 전사 수준을 제어하는 경우, 상기 코딩 서열에 작동적으로 연결된다. 전사 조절 서열은 일반적으로 코딩 서열과 시스(cis)로 연결되지만, 그것에 직접 인접할 필요는 없다. 예를 들어, 인핸서는 코딩 서열에 작동적으로 연결된 전사 조절 서열이지만, 그럼에도 불구하고 이들은 인접하지 않는다.
융합 폴리펩타이드와 관련하여, 용어 "작동적으로 연결된"은 각각의 성분들이 다른 성분과의 연결에서, 연결되지 않을 경우에 기능을 수행할 것과 동일한 기능을 수행한다는 사실을 지칭할 수 있다. 예를 들어, TALE-반복 도메인이 절단 도메인에 융합된 융합 폴리펩타이드와 관련하여, 만약 상기 융합 폴리펩타이드에서 TALE-반복 도메인 부분이 그 표적 부위 및/또는 그 결합부위에 결합할 수 있는 한편, 상기 절단 도메인은 표적 부위 근처에서 DNA를 절단할 수 있다면, 상기 TALE-반복 도메인 및 절단 도메인은 작동적으로 연결되어 있다.
단백질, 폴리펩타이드 또는 핵산의 "기능적 단편"은 서열이 전장 단백질, 폴리펩타이드 또는 핵산과 동일하지는 않지만 전장 단백질, 폴리펩타이드 또는 핵산과 비교하여 동일하거나 향상된 기능을 보유하는 단백질, 폴리펩타이드 또는 핵산이다. 또한, 기능적 단편은 전장 단백질, 폴리펩타이드 또는 핵산보다 낮은 기능을 갖지만 사용자에 의해 지정된 충분한 기능을 여전히 가질 수 있다. 기능적 단편은 대응되는 본래의 분자보다 더 많거나, 더 적거나, 동일한 수의 잔기를 가질 수 있고/거나, 하나 이상의 아미노산 또는 뉴클레오티드 치환을 함유할 수 있다. 핵산의 기능(예컨대, 코딩 기능, 또는 다른 핵산에 혼성화하는 능력)을 결정하는 방법은 본 기술분야에 널리 공지되어 있다. 유사하게, 단백질 기능을 결정하는 방법이 널리 공지되어 있다. 예를 들어, 폴리펩타이드의 DNA-결합 기능은, 예를 들어, 필터-결합, 전기영동 이동도 분석, 또는 면역침전 분석에 의해 결정될 수 있다. DNA 절단은 겔 전기영동에 의해 분석될 수 있다. 전술한 문헌[Ausubel et al..]을 참조한다. 다른 단백질과 상호작용하는 단백질의 능력은, 예를 들어, 유전적 및 생화학적인, 공동-면역침전, 이중-하이브리드(two-hybrid) 분석 또는 상보성에 의해 결정될 수 있다. 예를 들어, 문헌[Fields et al . (1989) Nature 340:245-246; 미국 특허 제5,585,245호 및 PCT 제WO 98/44350호]을 참조한다.
TALE-반복 도메인은, 예를 들어 초가변 이잔기(diresidue) 영역, 예를 들어 TALE 단백질 내의 반복 단위 중 위치 12 및/또는 13의 조작(하나 이상의 아미노산의 변화)을 통해, 미리 결정된 뉴클레오티드 서열에 결합하도록 "조작"될 수 있다. 일부 구체예에서, 위치 4, 11, 및 32에 있는 아미노산들이 조작될 수 있다. 다른 구체예에서, 비정형적인 RVD가 조작된 TALE 단백질에서 사용하기 위해 선발될 수 있으며, 이는 광범위한 비-자연적인 표적 부위를 명시한다. 예를 들어, NK RVD가 표적 서열 내의 G 뉴클레오티드를 인식하는데 사용하기 위해 선발될 수 있다. 다른 구체예에서, 반복 단위의 특징(즉, 안정성 또는 이차 구조)을 바꾸기 위해 반복 단위 내의 아미노산들이 변화될 수 있다. 그러므로, 조작된 TALE 단백질은 비-자연적으로 발생하는 단백질이다. 일부 구체예에서, TALE 반복 도메인을 코딩하는 유전자는, TALE 반복 아미노산을 지정하는 코돈이 바뀌었지만 지정된 아미노산은 바뀌지 않도록(예컨대, 코돈 최적화의 공지 기법을 통함) DNA 수준에서 조작된다. 조작된 TALE 단백질의 비제한적인 예는 설계 및/또는 선발에 의해 얻어지는 것이다. 설계된 TALE 단백질은 그 설계/조성이 주로 합리적인 기준으로부터 비롯되는 자연에서 발생하지 않는 단백질이다. 설계를 위한 합리적인 기준은, 종래의 TALE 설계 및 결합 데이터의 정보를 저장하는 데이터베이스에서 정보를 처리하기 위한 대체 규칙(substitution rule) 및 컴퓨터 알고리즘의 응용을 포함한다. "선발된" TALE-반복 도메인은 주로 파아지 디스플레이, 상호작용 트랩(interaction trap) 또는 하이브리드 선발과 같은 시험 공정으로부터 생산되는, 비-자연적으로 발생하는 도메인 또는 비정형적인 도메인이다.
"다량체화 도메인"은 TALE-융합 단백질의 아미노, 카르복시 또는 아미노 및 카르복시 말단 영역에서 통합된 도메인이다. 이들 도메인은 다수의 TALE-융합 단백질 단위들의 다량체화를 가능하게 한다. 다량체화 도메인의 예는 류신 지퍼를 포함한다. 다량체화 도메인은 또한 소분자에 의해 조절될 수 있으며, 여기에서 다량체화 도메인은 소분자 또는 외부 리간드의 존재하에만 또 다른 다량체화 도메인과 상호작용을 허용하는 적절한 형태일 것으로 추정된다. 이러한 방식으로, 외인성 리간드가 이들 도메인의 활성을 조절하는데 사용될 수 있다.
상기 방법에 유용한 표적 부위는 다른 기준에 의해 평가되거나 상기 부위에 특이적인 TALE-융합 단백질의 설계 또는 선발(필요한 경우) 및 생산에 직접적으로 사용될 수 있다. 잠재적인 표적 부위를 평가하기 위한 추가 기준은 유전자 내의 특정 영역에 대한 이들의 근접성이다. 표적 부위는, 조절 서열과 같이, 표적 유전자와 입증가능한 생물학적 유의성을 갖는 분절을 반드시 포함하거나 중첩되지는 않도록 선발될 수 있다. 표적 분절을 평가하기 위한 다른 기준은 상기 분절 또는 관련 분절에 결합하는 TALE-융합 단백질의 우선하는 이용가능성, 및/또는 제시된 표적 분절에 결합하는 새로운 TALE-융합 단백질을 설계하는 것의 편의성을 포함한다.
표적 분절이 선발된 이후, 상기 분절에 결합하는 TALE-융합 단백질은 다양한 접근법에 의해 제공될 수 있다. 일단 TALE-융합 단백질이 선발되거나, 설계되거나, 제시된 표적 분절에 제공되면, 상기 TALE-융합 단백질 또는 이를 코딩하는 DNA가 합성된다. TALE-반복 도메인-함유 단백질을 코딩하는 DNA를 합성하고 발현하는 예시적인 방법들이 하기에 기술되어 있다. TALE-융합 단백질 또는 이를 코딩하는 폴리뉴클레오티드는 TALE-융합 단백질이 결합하는 표적 부위를 함유하는 표적 유전자의 발현의 조절 또는 분석에 사용될 수 있다.
TALE
DNA
결합 도메인
본원에 기술된 폴리펩타이드들은 하나 이상(예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 그 이상)의 TALE-반복 단위를 포함한다. 특이성을 담당하는 서열을 결정하기 위해, 다수의 TALE-반복 단위를 포함하는 TALE DNA 결합 도메인이 연구되어 왔다. 하나의 생물 내에, TALE 반복은 통상적으로 고도로 보존되어 있지만(RVD의 경우는 제외), 다른 종에서는 잘 보존되지 않을 수 있다.
본원에 기술된 폴리펩타이드에서 발견되는 TALE-반복 단위는 일반적으로 하기의 형태이다: X1-X2-X3-X4-X5-X6-X7-X8-X9-X10-X11-(XRVD)2-(X)20-22 (SEQ ID NO: 399), 여기에서 X는 임의의 아미노산이고 XRVD (위치 12 및 13)는 DNA 결합에 관여한다. 상기 도메인의 비제한적인 예시적인 구체예들은 X1이 류신(L), 또는 메티오닌(M) 잔기를 포함하는 구체예; X10이 알라닌(A) 잔기 또는 발린(V) 잔기를 포함하는 구체예; (X)20-22가 서열(Gly 또는 Ser)-(X)19-21(SEQ ID NO: 400)을 포함하는 구체예; (X)20-22가 서열 (X)3-4-(Ala 또는 Thr)-(X)16-17(SEQ ID NO: 401)을 포함하는 구체예; (X)20-22가 서열 (X)4-5-(Leu 또는 Val)-(X)15-16(SEQ ID NO: 402)을 포함하는 구체예; 및 상기 임의의 구체예의 조합(예컨대, X1이 류신(L) 또는 메티오닌(M) 잔기를 포함하고 X10이 알라닌(A) 잔기를 포함하며; X1이 L 또는 M을 포함하고 (X)20-22가 서열 Gly/Ser-(X)19-21을 포함하며; (X)20-22가 서열 Gly/Ser-(X)2-3-Ala/Thr-(X)16-17을 포함하고; X10 이 알라닌(A) 또는 발린(V) 잔기를 포함하고 (X)20-22가 서열 Gly/Ser-(X)19-21을 포함하는 등)을 포함한다.
본원에 기술된 조성물 및 방법의 TALE-반복 단위는 임의의 적합한 TALE-단백질로부터 유래될 수 있다. TALE 단백질의 비제한적인 예는 랄스토니아 종(Ralstonia spp .) 또는 잔토모나스 종(Xanthamonas spp .)으로부터 유래된 TALE 단백질을 포함한다. 따라서, 일부 구체예에서, 상기 DNA-결합 도메인은 식물 병원균 잔토모나스로부터 유래된 하나 이상의 자연적으로 발생하고/거나 조작된 TALE-반복 단위를 포함한다(Boch et al, (2009) Science 326: 1509-1512 및 Moscou and Bogdanove, (2009) Science 326: 1501 참조). 다른 구체예에서, 상기 DNA-결합 도메인은 식물 병원균 랄스토니아 솔라나세아룸(Ralstonia solanacearum)으로부터 유래된 하나 이상의 자연적으로 발생하고/거나 조작된 TALE-반복 단위를 포함하거나, TALE 단백질 패밀리로부터 유래된 다른 TALE DNA 결합 도메인을 포함한다. 본원에 기술된 TALE DNA 결합 도메인(적어도 하나의 TALE 반복 단위를 포함함)은 (i) 자연에서 발견되지 않는 하나 이상의 TALE 반복 단위; (ii) 하나 이상의 자연적으로 발생하는 TALE 반복 단위; (iii) 비정형적인 RVD를 갖는 하나 이상의 TALE 반복 단위; 및 (i), (ii) 및/또는 (iii)의 조합을 포함할 수 있다. 일부 구체예에서, 본 발명의 TALE DNA 결합 도메인은 완전히 비-자연적으로 발생하는 반복 단위 또는 비정형적인 반복 단위로 이루어진다. 나아가, 둘 이상의 TALE-반복 단위를 포함하는 본원에 기술된 폴리펩타이드에서, TALE-반복 단위(자연적으로 발생하는 또는 조작됨)는 동일한 종으로부터 유래되거나, 대안적으로 상이한 종으로부터 유래될 수 있다.
표 1은 두 개의 TALE 단백질 내의 예시적인 반복 단위의 정렬을 보여준다. 각 TALE 반복이 별개의 선 위에 나타나 있으며, 각 컬럼은 반복 유형, 상기 반복의 출발 위치, 상기 반복의 이름, 초가변 위치에 있는 잔기, 및 전체 반복 서열을 나타낸다.
[표 1]
크산토모나스로부터의 2개의 TALE로부터 TALE DNA 결합 도메인의 비교
수개의 TALE DNA 결합 단백질을 확인하였으며 AAB00675.1,(13.5 TALE 반복), AAB69865.1 (13.5 반복), AAC43587.1 (17.5 반복), AAD01494.1 (12.5 반복), AAF98343.1 (25.5 반복), AAG02079.2 (25.5 반복), AAN01357.1 (8.5 반복), AAO72098 (17.5 반복), AAQ79773.2 (5.5 반복), AAS46027.1 (28.5 반복), AAS58127.2 (13.5 반복), AAS58128.2 (17.5 반복), AAS58129.3 (18.5 반복), AAS58130.3(9.5 반복), AAT46123.1 (22.5 반복), AAT46124.1 (26.5 반복), AAW59491.1 (5.5 반복), AAW59492.1 (16.5 반복), AAW59493.1 (19.5 반복), AAW77510.1 (5.5 반복), AAY43358 (21.5 반복), AAY43359.1 (11.5 반복), AAY43360.1 (14.5 반복), AAY54166.1 (19.5 반복), AAY54168.1 (16.5 반복), AAY54169.1 (12.5 반복), AAY54170.1 (23.5 반복), ABB70129.1 (21.5 반복), ABB70183.1 (22.5 반복), ABO77779.1 (17.5 반복) 등을 포함하는, 표준 유전자은행(GenBank) 조사에서 찾을 수 있다.
TALE형 단백질은 또한 세균 랄스토니아 솔라나세아룸(Ralstonia solanacearum)에서 발견되었으며 표 2는 이들 DNA 결합 도메인의 2개 예들의 유사한 비교를 나열한다:
[표 2]
랄스토니아로부터의 2개의 TALE로부터 TALE DNA 결합 도메인의 비교
랄스토니아로부터의 TALE 형 단백질의 추가의 예는 ABO27069.1 (10.5 반복), ABO27070.1 (11.5 반복), ABO27071.1 (7.5 반복), ABO27072.1 (3.5 반복) 등을 포함한다.
본원에 기술된 바와 같은 TALE-반복체 도메인을 포함하는 DNA-결합 폴리펩타이드는 또한 추가의 TALE 폴리펩타이드 서열, 예를 들면 N-말단 (N-캡) 서열 및, 임의로, 반복체 도메인을 플랭킹(flanking)하는 C-말단 (C-캡) 서열을 포함할 수 있다. N-캡 서열은 DNA-결합 폴리펩타이드 및 이러한 TALE-반복체 도메인-함유 DNA-결합 폴리펩타이드를 포함하는 융합 단백질의 기능(예를 들면, DNA-결합, 절단, 활성화 등)을 지지하기에 충분한 특정 길이의 천연적으로 또는 비-천연적으로 존재하는 서열일 수 있다. 특정 구현예에서, 상기 단백질은 반복체 도메인에 대해 TALE 단백질 N-말단의 영역의 단편(절단부)을 포함하는 N-캡 서열(예를 들면, 반복체 도메인의 TALE 폴리펩타이드 N-말단의 적어도 130 내지 140개 잔기(예를 들면 131, 132, 133, 134, 135, 136, 137, 138, 139 또는 140개 잔기)를 포함하는 N-캡 서열)을 포함한다. 다른 구현예에서, 본원에 기술된 단백질로서 TALE-반복체 도메인 폴리펩타이드는 반복체 도메인에 대해 TALE 단백질 C-말단의 단편(트렁케이트된; truncated) 영역을 포함하는 C-캡 서열(예를 들면, C-20 내지 C+28, C-20 내지 C+55, 또는 C-20 내지 C+63을 포함하는 C-캡 서열)을 포함한다. 특정 구현예에서, C-캡 서열은 반-반복체(half-repeat)(C-20 내지 C-1)를 포함한다. 본원에 기술된 TALE DNA-결합 폴리펩타이드는 N-캡, C-캡 서열 또는 N-캡과 C-캡 서열 둘다를 포함할 수 있다.
표 1 및 2에 나타낸 TALE 반복체의 완전한 단백질 서열(TALE 반복체 도메인, 및 또한 N-말단 및 C-말단 서열을 포함함)은 하기 표 3에 나타낸다. 표 1 및 2의 TALE 반복체 서열은 굵은 글씨로 나타낸다.
[표 3]
유전자은행 수탁 번호 제
AAA27592
.1호, 제
AAA92974
.1호, 제
ABO27067
.1호 및 제A
BO270
68.1호에 대한 완전한 아미노산 서열.
인공 TALE 단백질 및 TALE 융합 단백질을 생산하여 천연의 또는 조작된 TALE 반복체 단위를 사용하여 신규 서열에 결합시킬 수 있다[참조: Boch et al, ibid and Morbitzer et al, (2010) Proc. Natl. Acad. Sci.USA 107(50):21617-21622]. 또한, 예를 들면, 제WO 2010/079430호를 참조한다. 당해 신규 표적 서열을 식물 세포내 리포터 유전자의 상부에 삽입한 경우, 연구자들은 리보터 유전자의 활성화를 입증할 수 있었다. FokI 절단 도메인을 포함하는 인공의 TALE 융합체는 또한 살아있는 세포내에서 DNA를 절단할 수 있다[참조: Christin et al, ibid, Li et al (2011a) and (2011b) ibid, Cernak et al (2011) Nucl. Acid. Res. epub doi:10.1093/nar/gcr218].
조작된 TALE 단백질 및 TALE 융합 단백질은 천연적으로 존재하는 TALE 단백질과 비교하여 신규한 결합 특이성을 지닐 수 있다. 가공 방법은 합리적인 설계 및 각종 유형의 선택을 포함하나, 이에 한정되지 않는다. 합리적인 설계는 예를 들면, 단일 또는 다수의 TALE 반복체에 대한 모듈을 위한 뉴클레오타이드 서열을 포함하는 데이타베이스를 사용함을 포함한다. 파아지 디스플레이 및 2-하이브리드 시스템을 포함하는 예시적인 선택 방법은 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 및 또한 WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 및 GB 2,338,237에 기재되어 있다. 천연적으로 존재하는 TALE 단백질에서는, 잠재적인 디펩타이드 모티프(motif)의 제한된 레퍼토리(repertoire)만을 전형적으로 사용한다. 따라서, 본원에 기술된 바와 같이, 모든 가능한 모노- 및 디-펩타이드 서열을 함유하는 TALE 관련 도메인이 제작(constructing)되어 후보 TALE 단백질내로 조립되어 왔다. 따라서, 특정 구현예에서, DNA-결합 단백질의 하나 이상의 TALE-반복체 단위는 비전형적인 RVDs를 포함한다.
또한, 동일한 종의 천연적으로 존재하는 TALE 단백질에서, 반복체 단위는 흔히 골격 서열[즉, 직접적인 DNA 접촉(비-RVD 잔기)에 관여되지 않은 잔기(들)]내에 가변성을 거의 나타내지 않는다. 이러한 가변성의 결여는 개개의 TALE 반복체 단위들 사이의 진화적 관계 및 인접한 반복체들 사이의 단백질 폴딩(folding) 요건을 포함하는 다수의 인자들에 기인할 수 있다. 그러나, 상이한 식물병원성 세균종들(phytopathogenicbacterial species) 사이에서 골격 서열은 변할 수 있다. 예를 들면, 크산토모나스 캄페스트리스 피브이 베시카토리아(Xanthomonas campestris pv vesicatoria), 단백질 AvrBs3내 TALE 반복체 서열은 랄스토니아 솔라나세아룸(Ralstonia solanacearum)으로부터의 brg11 및 hpx17 반복체 단위와 40% 미만의 상동성을 가진다[참조: Heuer et al (2007) Appl Environ Micro 73 (13): 4379-4384]. TALE 반복체는 각각의 세균의 천연 환경에서, 예를 들면, TALE이 조절하는 숙주 식물에서 유전자의 서열로부터 엄격한 기능적 선택(stringent functional selection)하에 존재할 수 있다. 따라서, 본원에 기술된 바와 같이, TALE 골격(예를 들면, TALE 반복체 단위내에서 또는 N-캡 및 C-캡 서열과 같은 단복체 단위 외부의 서열)내 변이체는 당해 분야에 공지된 각종 방법에 의해 표적화되거나 무작위한 돌연변이유발에 의해 도입될 수 있으며, 수득되는 TALE 융합 단백질은 최적 활성에 대해 스크리닝하였다.
다수 TALE 반복체 모듈은 또한 상기 기술된 바와 같이 DNA 결합 도메인(적어도 하나의 TALE 반복체 단위 포함)의 조립 뿐만 아니라, 또한 미니-TALE 다합체(즉, 삽합체, 사합체, 오합체 등)의 조립에도 유용할 수 있으며, 여기서, 미니-TALE DNA 결합 도메인 사이의 캡핑 영역(capping region)으로서 기능화된 스패닝 링커(spanning linker)는 염기 스키핑(base skipping)을 허용할 수 있으며 보다 큰 DNA 결합 특이성을 생성할 수 있다. 연결된 미니-TALE DNA 결합 도메인의 사용은 개개의 TALE 반복체들의 수준에서 엄격한 기능적 모듈방식(modularity)에 대한 요건을 완화시킬 수 있으며 보다 복잡하고/하거나 특이적인 DNA 인식 계획의 발달을 허용하며, 여기서, 제공된 모듈내 인접한 모티프로부터의 아미노산은 목적하는 DNA 표적 서열의 협동적인 인식을 위해 서로 자유로이 상호작용할 수 있다. 미니-TALE DNA 결합 도메인은 무작위처리된 디펩타이드 모티프들(또는 특정의 다른 확인된 주요 위치들)을 지닌 적합한 선택 시스템을 사용하여 연결시키고 발현시키며 이들의 핵산 결합 특성들을 기준으로 하여 선택할 수 있다. 대안적으로, 다수-TALE 반복체 모듈을 사용하여 반복체 모듈의 구조를 생성함으로써 어떠한 특이적인 목적하는 TALE-융합 단백질의 신속한 제작를 허용할 수 있다.
융합 단백질들(및 이를 암호화하는 폴리뉴클레오타이드들)의 설계 및 제작를 위한 표적 부위 및 방법의 선택은 당해 분야의 숙련가에게 공지되어 있으며 본원에 이들의 전문들이 참조로 혼입된 미국 특허원 공보 20050064474 및 20060188987에 상세히 설명되어 있다.
TALE DNA 결합 도메인을 아연 핑거(zinc finger) DNA 결합 도메인에 연결시키는 인공 융합 단백질을 또한 생산할 수 있다. 이들 융합체는 또한 목적하는 기능적 도메인에 추가로 연결시킬 수 있다.
또한, 이들 및 다른 참조 문헌들에 기재되어 있는 바와 같이, TALE DNA 결합 도메인 및/또는 아연 핑거 도메인은, 비록 캡핑 서열(N-캡 및 C-캡 서열들)로서 기능할 수 있는 서열들이 TALE 반복체 도메인과 링커 사이의 계면에서 요구될 수 있다고 해도, 예를 들면, 길이가 5개 이상의 아미노산인 링커[예를 들면, TGEKP(SEQ ID NO:48), TGGQRP(SEQ ID NO:49), TGQKP (SEQ ID NO:50), 및/또는 TGSQKP (SEQ ID NO:51)]를 포함하는 어떠한 적합한 링커 서열을 함께 사용하여 연결시킬 수 있다. 따라서, 링커들이 사용되는 경우, 5개 이상의 아미노산의 링커들이 cap 서열들과 함께 사용되어 TALE DNA 결합 도메인들을 목적하는 융합 파트너 도메인에 결합시킬 수 있다. 또한, 길이가 6개 이상의 아미노산인 예시적인 링커 서열들에 대해서는 미국 특허 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 또한, TALE 반복체 도메인과 융합된 기능적 단백질 도메인 사이의 링커를 제작하여 유연하거나 위치적으로 구속되도록 함으로써 가장 효율적인 게놈 변형을 허용할 수 있다. 길이와 조성이 다양한 링커들을 시험할 수 있다.
융합 단백질들
본원에 기술된 바와 같은 DNA-결합 단백질(예를 들면, TALE-융합 단백질) 및 이종 조절 또는 기능적 도메인(또는 이의 기능적 단편)을 포함하는 융합 단백질들 또한 제공된다. 일반적인 도메인들은 예를 들면, 전사 인자 도메인들(활성인자들, 억제인자들(repressors), 보조-활성인자들, 보조-억제인자들), 뉴클레아제 도메인들, 사일런서 도메인들, 종양유전자 도메인들(예를 들면, myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, mos 계열 구성원들 등); DNA 복구 효소들 및 이들의 관련된 인자들 및 변형인자들; DNA 재배열 효소들 및 이들의 관련 인자들 및 변형인자들; 크로마틴 관련된 단백질들 및 이들의 변형인자들(예를 들면, 키나제들, 아세틸라제들 및 데아세틸라제들); 및 DNA 변형 효소들(예를 들면, 메틸트랜스퍼라제들, 토포이소머라제들, 헬리카제들, 리가제들, 키나제들, 포스파타제들, 폴리머라제들, 엔도뉴클레아제들), DNA 표적화 효소들, 예를 들면, 트랜프포손들, 인테그라제들, 레컴비나제들 및 레솔바제들 및 이들의 관련 인자들 및 변형인자들, 핵 호르몬 수용체들, 뉴클레아제들(절단 도메인들 또는 반-도메인들(half-domains)) 및 리간드 결합 도메인들을 포함한다. 다른 융합 단백질들은 수용체 또는 선택 마커들을 포함할 수 있다. 리포터 도메인들의 예들은 GFP, GUS 등을 포함한다. 식물 세포들에서 특수 유용성을 갖는 리포터들은 GUS를 포함한다.
활성화를 달성하기에 적합한 도메인들은 HSV VP16 활성화 도메인[참조: 예를 들면, Hagmann et al., J. Virol. 71, 5952-5962 (1997)] 핵 호르몬 수용체들[참조: 예를 들면, Torchia et al., Curr. Opin. Cell. Biol. 10:373-383 (1998)]; 핵 인자 카파 B의 p65 소단위[참조: Bitko & Barik, J. Virol. 72:5610-5618 (1998) 및 Doyle & Hunt, Neuroreport 8:2937-2942 (1997)); Liu et al., Cancer Gene Ther. 5:3-28 (1998)], 또는 인공 키메라 기능성 도메인, 예를 들면, VP64[참조: Beerli et al., (1998) Proc. Natl. Acad. Sci. USA 95:14623-33], 및 데그론[참조: Molinari et al., (1999) EMBO J. 18, 6439-6447]을 포함한다. 추가의 예시적인 활성화 도메인들은 Oct 1, Oct-2A, Sp1, AP-2, 및 CTF1[참조: Seipel et al., EMBO J. 11, 4961-4968 (1992)] 및 또한 p300, CBP, PCAF, SRC1 PvALF, AtHD2A 및 ERF-2를 포함한다. 예를 들면, Robyr et al. (2000) Mol. Endocrinol. 14:329-347; Collingwood et al. (1999) J. Mol. Endocrinol. 23:255-275; Leo et al. (2000) Gene 245:1-11; Manteuffel-Cymborowska (1999) Acta Biochim. Pol. 46:77-89; McKenna et al. (1999) J. Steroid Biochem. Mol. Biol. 69:3-12; Malik et al. (2000) Trends Biochem. Sci. 25:277-283; 및 Lemon et al. (1999) Curr. Opin. Genet. Dev. 9:499-504를 참조한다. 추가의 예시적인 활성화 도메인은 OsGAI, HALF-1, C1, AP1, ARF-5,-6,-7, 및 -8, CPRF1, CPRF4, MYC-RP/GP, 및 TRAB1을 포함하나, 이에 한정되지 않는다. 예를 들면, Ogawa et al. (2000) Gene 245:21-29; Okanami et al. (1996) Genes Cells 1:87-99; Goff et al. (1991) Genes Dev. 5:298-309; Cho et al. (1999) Plant Mol. Biol. 40:419-429; Ulmason et al. (1999) Proc. Natl. Acad. Sci. USA 96:5844-5849; Sprenger-Haussels et al. (2000) Plant J. 22:1-8; Gong et al. (1999) Plant Mol. Biol. 41:33-44; 및 Hobo et al. (1999) Proc. Natl. Acad. Sci. USA 96:15,348-15,353을 참조한다.
본원에 기술된 바와 같은 DNA-결합 도메인과 기능적 도메인 사이의 융합 단백질(또는 이를 암호화하는 핵산)의 형성시, 활성화 도메인과 상호작용하는 활성화 도메인 또는 분자가 기능적 도메인으로 적합하다는 것은 당해 분야의 숙련가에게 명백할 것이다. 필수적으로 표적 유전자에 활성화 복합체 및/또는 활성화 활성(예를 들면, 히스톤 아세틸화와 같은)을 보충할 수 있는 어떠한 분자도 융합 단백질의 활성화 도메인으로서 유용하다. ISWI-함유 도메인들 및/또는 융합 분자에서 기능성 도메인들로서 사용하기에 적합한 메틸 결합 도메인 단백질들과 같은 인슐레이터(insulator) 도메인들, 국재화 도메인들, 및 크로마틴 리모델링 단백질들은 예를 들면 공동-소유의 미국 특허원 2002/0115215 및 2003/0082552 및 공동-소유의 WO 02/44376에 기술되어 있다.
예시적인 억제 도메인들은 KRAB A/B, KOX, TGF-베타-유도성 얼리 유전자(TGF-beta-inducible early gene (TIEG), v-erbA, SID, MBD2, MBD3, DNMT 계열의 구성원들(예를 들면, DNMT1, DNMT3A, DNMT3B), Rb, 및 MeCP2를 포함하나, 이에 한정되지 않는다[참조: 예를 들면, Bird et al. (1999) Cell 99:451-454; Tyler et al. (1999) Cell 99:443-446; Knoepfler et al. (1999) Cell 99:447-450; 및 Robertson et al. (2000) Nature Genet. 25:338-342]. 추가의 예시적인 억제 도메인들은 ROM2 및 AtHD2A를 포함하나, 이에 한정되지 않는다[참조: 예를 들면, Chem et al. (1996) Plant Cell 8:305-321; and Wu et al. (2000) Plant J. 22:19-27].
특정 구현예에서, TALE-융합 단백질에 의해 결합된 표적 부위는 세포 크로마틴의 접근가능한 영역내에 존재한다. 접근가능한 영역은 예를 들면, 공동-소유의 국제 공보 WO 01/83732에 기술된 바와 같이 측정될 수 있다. 표적 부위가 세포 크로마틴의 접근가능한 영역내에 존재하지 않는 경우, 하나 이상의 접근가능한 영역은 공동-소유의 WO 01/83793에 설명된 바와 같이 생성될 수 있다. 추가의 구현예들에서, 융합 분자의 DNA-결합 도메인은, 이의 표적 부위가 접근가능한 영역내에 있는지 또는 없는지에 상관없이 세포 크로마틴에 결합할 수 있다. 예를 들면, 이러한 DNA-결합 도메인들은 링커 DNA 및/또는 뉴클레오솜 DNA에 결합할 수 있다. 이러한 유형의 "파이오니어(pioneer)" DNA 결합 도메인의 예들은 특정의 스테로이드 수용체 및 간세포 핵 인자 3(HNF3)에서 발견된다[참조: Cordingley et al. (1987) Cell 48:261-270; Pina et al. (1990) Cell 60:719-731; and Cirillo et al. (1998) EMBO J. 17:244-254].
융합 분자는 당해 분야의 숙련가에게 공지된 바와 같이, 약제학적으로 허용되는 담체와 함께 제형화될 수 있다(참조: 예를 들면, Remington's Pharmaceutical Sciences, 17th ed., 1985; 및 공동-소유의 WO 00/42219).
융합 분자의 기능적 성분/도메인은, 융합 분자가 이의 DNA 결합 도메인을 통해 표적 서열에 결합하면 유전자의 전사에 영향을 미칠 수 있는 각종의 상이한 성분 중 어느 것으로부터 선택될 수 있다. 따라서, 기능적 성분은 활성인자들, 억제인자들, 보조-활성인자들, 보조-억제인자들, 및 사일런서들(silencers)과 같은 각종 전사 인자 도메인들을 포함할 수 있으나, 이에 한정되지 않는다.
추가의 예시적인 기능성 도메인은 예를 들면, 공동-소유의 미국 특허 6,534,261 및 미국 특허원 공보 2002/0160940에 기재되어 있다.
외인성의 소 분자들 또는 리간드들에 의해 조절되는 기능성 도메인들이 또한 선택될 수 있다. 예를 들면, RheoSwitch® 기술을 사용할 수 있으며, 여기서 기능성 도메인만이 외부 RheoChemTM 리간드의 존재하에서 이의 활성 구조를 추정한다(참조: 예를 들면, US 20090136465). 따라서, TALE-융합 단백질은 조절가능한 기능성 도메인에 작동적으로 연결될 수 있으며, 여기서 TALE-융합 단백질의 수득된 활성은 외부 리간드에 의해 조절된다.
특정 구현예에서, TALE DNA-결합 단백질, 또는 이의 단편은 적어도 하나의 뉴클레아제(절단 도메인, 절단 반-도메인)에 대한 TALE DNA-결합 도메인의 융합(TALE-반복체 도메인, N-캡 및/또는 C-캡 서열들에 대한 N- 및/또는 C-말단)을 통해 뉴클레아제들로서 사용된다. 본원에 기재된 융합 단백질들의 절단 도메인 부위는 어떠한 엔도뉴클레아제 또는 엑소뉴클레아제로부터도 수득될 수 있다. 절단 도메인이 기원할 수 있는 예시적인 엔도뉴클레아제는 제한 엔도뉴클레아제들 및 호밍 엔도뉴클레아제들(homing endonucleases)을 포함한다. 예를 들면, 2002-2003 Catalogue, New England Biolabs, Beverly, MA; and Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388을 참조한다. DNA를 절단하는 추가의 효소들은 공지되어 있다(예를 들면, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 마이크로코쿠스 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한 Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993 참조). 이들 효소들(또는 이의 기능성 단편들) 중 하나 이상은 절단 도메인들 및 절단 반-도메인들의 공급원으로서 사용될 수 있다.
유사하게, 절단 반-도메인은 상기 설정된 바와 같이, 절단 활성에 대한 이합체화를 필요로 하는 어떠한 뉴클레아제 또는 이의 일부로부터도 기원할 수 있다. 일반적으로, 융합 단백질이 절단 반-도메인들을 포함하는 경우 2개의 융합 단백질들이 절단에 필요하다. 대안적으로, 2개의 절단 반-도메인들을 포함하는 단일 단백질이 사용될 수 있다. 2개의 절단 반-도메인들은 동일한 엔도뉴클레아제(또는 이의 기능성 단편)으로부터 기원할 수 있거나, 각각의 절단 반-도메인은 상이한 엔도뉴클레아제(또는 이의 기능성 단편)으로부터 기원할 수 있다. 또한, 2개의 융합 단백질에 대한 표적 부위는 바람직하게는 서로와 관련하여 배치됨으로써 이들의 각각의 표적 부위들에 대한 2개의 융합 단백질의 결합은, 반-도메인들을 절단함으로써 예를 들면, 이합체화에 의해 기능성 절단 도메인을 형성하도록 하는 서로에 대해 공간적 배향으로 절단 반-도메인들을 위치시킨다. 따라서, 특정 구현예에서, 표적 부위들의 근처 가장자리는 5 내지 8개 뉴클레오타이드들 또는 15 내지 18개 뉴클레오타이드들에 의해 분리된다. 그러나, 뉴클레오타이드들 또는 뉴클레오타이드 쌍들의 어떠한 진정수(integral number)는 2개의 표적 부위들(예를 들면, 2 내지 50개의 뉴클레오타이드 쌍들 이상) 사이에 개입할 수 있다. 일반적으로, 절단 부위는 표적 부위들 사이에 놓여있다.
제한 엔도뉴클레아제들(제한 효소들)은 많은 종들에서 존재하며 DNA(인식 부위에서), 및 절단하는 DNA에 대해 결합 부위에서 또는 근처에서 서열-특이적으로 결합할 수 있다. 특정의 제한 효소(예를 들면, IIS 형)는 인식 부위로부터 제거된 부위에서 DNA를 절단하며 별개의 결합 및 절단 도메인들을 갖는다. 예를 들면, IIS형 효소 Fok I은 하나의 쇄 상의 이의 인식 부위로부터의 9개 뉴클레오타이드들 및 다른 쇄의 이의 인식 부위로부터의 13개 뉴클레오타이드에서 DNA의 이본쇄 절단을 촉매한다. 예를 들면, 미국 특허 5,356,802; 5,436,150 및 5,487,994; 및 또한 Li et al. (1992) Proc. Natl. Acad. Sci. USA 89:4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90:2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91:883-887; Kim et al. (1994b) J. Biol. Chem. 269:31,978-31,982을 참조한다. 따라서, 하나의 구현예에서, 융합 단백질은 적어도 하나의 IIS형 제한 효소로부터의 절단 도메인(또는 절단 반-도메인) 및 가공되거나 가공되지 않을 수 있는 하나 이상의 TALE DNA-결합 도메인들을 포함한다.
절단 도메인들이 결합 도메인으로부터 분리가능한, 예시적인 IIS형 제한 효소들은 Fok I 및 BfiI을 포함한다[참조: Zaremba et al, (2004) J Mol Biol. 336(1):81-92]. Fok 효소는 이합체로서 활성이다[참조: Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10,575]. 표적화된 이-본쇄된 절단 및/또는 TALE 반복체 도메인-Fok I 융합체(또는 C-캡 및 N-캡을 추가로 포함하는 이의 변이체)를 사용하는 세포 서열의 표적화된 대체의 경우, 각각 FokI 절단 반-도메인을 포함하는 2개의 융합 단백질들을 사용하여 촉매적으로 활성인 절단 도메인을 재구성할 수 있다. 대안적으로, TALE-반복체 도메인 및 2개의 Fok I 절단 반-도메인들을 함유하는 단일의 폴리펩타이드 분자를 또한 사용할 수 있다. 다른 바람직한 IIS형 제한 효소는 BfiI이다[참조: Zaremba et al, (2004) J Mol Biol . 336(1):81-92]. 당해 효소의 절단 도메인은 이의 DNA 결합 도메인으로부터 분리하여 TALE DNA 결합 도메인에 작동적으로 연결시킴으로써 TALEN을 생성할 수 있다.
절단 도메인 또는 절단 반-도메인은, 절단 활성을 보유하거나, 다합체화(예를 들면, 이합체화)하여 기능성 절단 도메인을 형성하는 능력을 보유하는 단백질의 어떠한 일부일 수 있다.
예시적인 IIS형 제한 효소들은 본원에 이의 전문이 혼입된 국제 공보 WO 07/014275에 기술되어 있다. 추가의 제한 효소들은 또한 별개의 결합 및 절단 도메인들을 함유하며, 이들은 본 기재내용에 의해 고려된다. 예를 들면, Roberts et al. (2003) Nucleic Acids Res. 31:418-420을 참조한다.
절단 특이성을 향상시키기 위하여, 특정 구현예에서, 절단 도메인은 예를 들면, 이들의 전문 모두가 본원에 참조로 혼입된, 미국 특허 공보 20050064474; 20060188987, 20080131962, 20090311787; 20090305346; 20110014616, 및 미국 특허원 12/931,660에 기술된 바와 같이, 단독이합체화를 최소화하거나 예방하는 하나 이상의 조작된 절단 반-도메인(또한 이합체화 도메인 돌연변이체들로 언급됨)을 포함한다. Fok I의 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, 및 538번 위치에서 아미노산 잔기들은 Fok I 절단 반-도메인들의 이합체화에 영향을 미치기 위한 모든 표적들이다.
필수 이종이합체를 형성하는 Fok I의 예시적인 조작된 절단 반-도메인들은, 제1의 절단 반-도메인이 Fok I의 490 및 538번 위치에서의 아미노산 잔기들에서 돌연변이들을 포함하며 제2의 절단 반-도메인은 486 및 499번 아미노산 잔기에서 돌연변이들을 포함한다.
필수 이종이합체를 형성하는 Fok I형의 추가의 조작된 절단 반-도메인들을 또한 본원에 기술된 융합 단백질들에 사용할 수 있다. 제1의 절단 반-도메인은 Fok I의 490 및 538번 위치에서의 아미노산 잔기들에서 돌연변이들을 포함하며 제2의 절단 반-도메인은 486 및 499번 아미노산 잔기들에서 돌연변이들을 포함한다.
따라서, 하나의 구현예에서, 490번에서 돌연변이는 Glu (E)를 Lys (K)로 대체하며; 538번에서 돌연변이는 Iso (I)를 Lys (K)로 대체하고; 486번에서 돌연변이는 Gln (Q)를 Glu (E)로 대체하며; 499번에서 돌연변이는 Iso (I)를 Lys (K)로 대체한다. 구체적으로, 본원에 기술된 조작된 절단 반-도메인들은 하나의 절단 반-도메인내에서 490번 위치(E→K) 및 538번 위치(I→K)를 돌연변이시켜 "E490K:I538K"로 지정된 조작된 절단 반-도메인을 생산하고 다른 절단 반-도메인에서 486번 위치(Q→E) 및 499번 위치(I→L)을 돌연변이시켜 "Q486E:I499L"로 지정된 조작된 절단 반-도메인을 생산함으로써 제조하였다. 본원에 기술된 조작된 절단 반-도메인들은 필수 이종이합체 돌연변이체들이며, 여기서 일탈적인 절단(aberrant cleavage)은 최소화되거나 폐지된다. 예를 들면, 이의 기재내용 전체가 모든 목적을 위해 참조로 혼입된, 미국 특허 공보 2008/0131962의 실시예 1을 참조한다.
본원에 기술된 조작된 절단 반-도메인들은 필수 이종이합체 돌연변이들이며, 여기서 일탈적인 절단은 최소화되거나 폐지된다. 예를 들면, WO 07/139898의 실시예 1을 참조한다. 특정 구현예들에서, 조작된 절단 반-도메인은 486, 499 및 496번(야생형 FokI에 대한 번호매김)에서 돌연변이들, 예를 들면, 486번 위치에서의 야생형 Gln (Q) 잔기를 Glu (E) 잔기로 대체하고, 499번 위치에서 야생형 Iso (I) 잔기를 Leu (L) 잔기로 대체하며 496번 위치에서 야생형 Asn (N) 잔기를 Asp (D) 또는 Glu (E) 잔기로 대체하는 돌연변이들을 포함한다(또한 "ELD" 및 "ELE" 도메인으로 각각 언급된다). 다른 구현예들에서, 조작된 절단 반-도메인은 490, 538 및 537번 위치(야생형 FokI에 대한 번호매김)에서 돌연변이들, 예를 들면 490번 위치에서 야생형 Glu (E) 잔기를 Lys (K) 잔기로 대체하고, 538번 위치에서 야생형 Iso (I) 잔기를 Lys (K) 잔기로 대체하며, 537번 위치에서 야생형 His (H) 잔기를 Lys (K) 잔기 또는 Arg (R) 잔기로 대체하는 돌연변이들(또한 각각 "KKK" 및 "KKR" 도메인으로 각각 언급됨)을 포함한다. 다른 구현예에서, 조작된 절단 반-도메인은 490 및 537번(야생형 FokI에 대한 번호매김) 위치에서 돌연변이들, 예를 들면, 490번 위치에서 야생형 Glu (E) 잔기가 Lys (K) 잔기로 대체되고 537번 위치에서 야생형 His (H) 잔기가 Lys (K) 잔기 또는 Arg (R) 잔기로 대체된 돌연변이들(또한 각각 "KIK" 및 "KIR" 도메인으로 언급됨)을 포함한다(참조: 2010년 2월 8일자로 출원된 미국 가특허원 61/337,769 및 2010년 9월 23일자로 출원된 미국 가특허원 61/403,916). 또한, "Sharkey" 또는 "Sharkey"(Sharkey prime)" 돌연변이들로 공지된 돌연변이들을 포함하는 FokI 뉴클레아제 도메인 변이체들이 사용될 수 있다[참조: Guo et al, (2010) J. Mol. Biol. doi:10.1016/j.jmb.2010.04.060].
본원에 기술된 조작된 절단 반-도메인들은 어떠한 적합한 방법, 예를 들면, 미국 특허 공보 20050064474, 20070134796; 20080131962에 기술된 바와 같은 야생형 절단 반-도메인들(Fok I)의 부위-지시된 돌연변이유발에 의해 제조될 수 있다.
TALE-융합 폴리펩타이드 및 핵산은 재조합체 유전학의 분야에서 통상의 기술을 이용하여 제조할 수 있다. 본 발명에서 일반적인 사용 방법을 기재하는 기본 교재는 Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); 및 Current Protocols in Molecular Biology (Ausubel et al., eds., 1994))을 포함한다. 또한, 필수적으로 어떠한 핵산도 다양한 시판 공급원 중 어느 것으로부터 특별 주문할 수 있다. 유사하게, 펩타이드들 및 항체들은 각종의 상업적인 공급원 들 중 어느 것으로부터 특별 주문할 수 있다.
2개의 대체 방법들을 통상적으로 사용하여 새로이 설계된 DNA-결합 펩타이드를 발현하는데 요구되는 암호화 서열을 생성한다. 하나의 프로토콜은 오버랩된 올리고뉴클레오타이드들을 이용하는 PCR-계 조립 과정이다. 이들 올리고뉴클레오타이드들은 주로, 그러나 이들을 상이한 DNA-결합 도메인들 각각에 대해 특이적이도록 하는 반복된 도메인들 상의 12 및 13번 위치에 제한되지 않는 치환들을 함유한다. 추가로, 아미노산 치환들은 4, 11 및 32번 위치에서 이루어질 수 있다. 아미노산 치환체들은 또한 하나의 반복체 단위내에서 2, 3, 4, 21, 23, 24, 25, 27, 30, 31, 33, 34 및/또는 35번 위치에서 이루어질 수 있다. 일부 구현예들에서, 반복체 단위는 하나의 위치에서 치환체를 함유하며, 다른 것에서, 반복체 단위는 2 내지 18개 아미노산 치환들을 함유한다. 일부 구현예들에서, 반복체 단위들의 뉴클레오타이드 서열은 아미노산 서열의 변경없이 변경될 수 있다.
당해 분야의 숙련가에게 공지된 단백질 정제의 어떠한 적합한 방법도 사용하여 본 발명의 TALE-융합 단백질들을 정제할 수 있다(참조: Ausubel, supra, Sambrook, supra). 또한, 어떠한 적합한 숙주, 예를 들면, 세균 세포들, 곤충 세포들, 효모 세포들, 포유동물 세포들 등을 사용할 수 있다.
따라서, 융합 분자들은 당해 분야의 숙련가에게 잘 공지된 클로닝 및 생화학 접합 방법들에 의해 제작된다. 융합 분자들은 DNA-결합 도메인 및 기능성 도메인(예를 들면, 전사 활성화 또는 억제 도메인)을 포함한다. 융합 분자들은 또한 핵 국재화 시그날들(예를 들면, SV40 매질 T-항원) 및 에피토프 태그들(예를 들면, FLAG 및 헤마글루티닌)을 임의로 포함한다. 융합 단백질들(및 이들을 암호화하는 핵산들)은, 해독 판독 프레임이 융합 성분들 중에서 보존되도록 설계된다. 본원에 기술된 바와 같은 융합 단백질들은 본원에 기술된 바와 같은 DNA-결합 폴리펩타이드들의 N- 및/또는 C-말단들에서 하나 이상의 기능성 도메인들을 포함할 수 있다.
한편으로는 기능성 도메인(또는 이의 기능성 단편)의 펩타이드 성분과, 다른 한편으로는 비-단백질 DNA-결합 도메인(예를 들면, 항생제, 인터컬레이터(intercalator), 마이너 그루브 결합인자(minor groove binder), 핵산) 사이의 융합체는 당해 분야의 숙련가에게 공지된 생화학적 접합 방법들에 의해 제작된다. 예를 들면, Pierce Chemical Company (Rockford, IL) Catalogue를 참조한다. 마이너 그루브 결합인자와 폴리펩타이드 사이의 융합체들을 제조하는 방법들 및 조성물들이 기술되어 있다[참조: Mapp et al. (2000) Proc . Natl . Acad . Sci . USA 97:3930-3935].
표적화된 절단을 위한 추가의 방법들
어떠한 목적하는 유전자(들)에서 표적 부위를 갖는 어떠한 뉴클레아제도 본원에 기재된 방법들에서 사용할 수 있다. 예를 들면, 호밍(homing) 엔도뉴클레아제들 및 메가뉴클레아제들은 매우 긴 인지 서열들을 가지며, 이들 중 일부는 통계학적 기준으로, 사람-크기의 게놈내에 1회 존재하는 경향이 있다. 목적하느 유전자에서 표적 부위를 갖는 이러한 뉴클레아제 어떤 것도, 표적화된 절단에 대해, 예를 들면, 아연 핑거 뉴클레아제 및/또는 메가뉴클레아제를 포함하는 TALE-반복체 도메인 뉴클레아제 융합체 대신에, 또는 이것들 외에 사용될 수 있다.
특정 구현예들에서, 뉴클레아제는 메가뉴클레아제(호밍 엔도뉴클레아제)이다. 천연적으로-존재하는 메가뉴클레아제들은 15 내지 40개 염기-쌍 절단 부위들을 인지하며 일반적으로 4개의 계열: LAGLIDADG 계열, GIY-YIG 계열, His-Cyst 박스 계열 및 HNH 계열로 그룹화된다. 예시적인 호밍 엔도뉴클레아제들은 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII을 포함한다. 이들의 인지 서열들은 공지되어 있다. 또한, 미국 특허 5,420,032; 미국 특허 6,833,252; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs 카탈로그를 참조한다.
천연적으로-존재하는 메가뉴클레아제들, 주로 LAGLIDADG 계열로부터의 DNA-결합 도메인들을 사용하여 식물, 효모, 드로소필라, 포유동물 세포 및 마우스에서 부위-특이적인 게놈 변형을 촉진하여 왔지만, 이러한 시도는 메가뉴클레아제 인지 서열을 보존하는 동족체 유전자의 변형[참조: Monet et al. (1999), Biochem. Biophysics. Res. Common. 255: 88-93] 또는, 인지 서열이 도입된 예비-조작된 게놈들[참조: Route et al. (1994), Mol. Cell. Biol. 14: 8096-106; Chilton et al. (2003), Plant Physiology. 133: 956-65; Puchta et al. (1996), Proc. Natl. Acad. Sci. USA 93: 5055-60; Rong et al. (2002), Genes Dev. 16: 1568-81; Gouble et al. (2006), J. Gene Med. 8(5):616-622)로 제한되어 왔다. 따라서, 의학적으로 또는 생명과학적으로 관련된 부위들에서 신규의 결합 특이성을 나타내는 메가뉴클레아제들을 가공하기 위한 시도들이 이루어져 왔다[참조: Porteus et al. (2005), Nat. Biotechnol. 23: 967-73; Sussman et al. (2004), J. Mol. Biol. 342: 31-41; Epinat et al. (2003), Nucleic Acids Res. 31: 2952-62; Chevalier et al. (2002) Molec. Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66; 미국 특허 공보 20070117128; 20060206949; 20060153826; 20060078552; 및 20040002092).
전달
TALE-융합 단백질, 이를 암호화하는 폴리뉴클레오타이드 및 본원에 기술된 단백질들 및/또는 폴리뉴클레오타이드들을 포함하는 조성물들은 예를 들면, TAL-융합 단백질들을 암호화하는 mRNA의 주입에 의함을 포함하는 어떠한 적합한 수단들에 의해 표적 세포로 전달할 수 있다[참조: Hammerschmidt et al. (1999) Methods Cell Biol. 59:87-115].
조작된 전사 인자들을 포함하는 단백질들을 전달하는 방법들은 예를 들면, 미국 특허 6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824에 기술되어 있으며, 이들 모두의 기재내용은, 이의 전문이 본원에 참조로 혼입되어 있다.
본원에 기술된 바와 같은 TALE-단백질 융합체들은 또한 하나 이상의 TALE-단백질 융합체들을 암호화하는 서열들을 함유하는 벡터들을 사용하여 전달할 수 있다. 플라스미드 벡터들, 레트로이러스 벡터들, 렌티바이러스 벡터들, 아데노바이러스 벡터들, 폭스바이러스 벡터들; 헤르페스바이러스 벡터들 및 아데노-관련 바이러스 벡터들 등을 포함하나, 이에 한정되지 않는 어떠한 벡터 시스템들도 사용될 수 있다. 또한, 이들의 전문이 본원에 참조로 혼입된 미국 특허 6,534,261; 6,607,882; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824를 참조한다. 또한, 이들 벡터들 중 어느 것도 서열들을 암호화하는 하나 이상의 TALE-단백질 융합체를 포함할 수 있음이 명백할 것이다. 따라서, 하나 이상의 TALE-단백질 융합체(예를 들면, TALEN들의 쌍)를 세포내로 도입시키는 경우, TALE-단백질 융합은 동일한 벡터 또는 상이한 벡터들 위에서 수행할 수 있다. 다수의 벡터들을 사용하는 경우, 각각의 벡터는 하나 또는 다수의 TALE-단백질 융합체들을 암호화하는 서열을 포함할 수 있다.
통상의 바이러스 및 비-바이러스계 유전자 전달 방법들을 사용하여 전체 유기체들 또는 표적 조직들의 세포들(예를 들면, 포유동물 세포들)내에서 조작된 TALE-단백질 융합체들을 암호화하는 핵산들을 도입할 수 있다. 이러한 방법들을 또한 사용하여 TALE-단백질 융합체를 암호화하는 핵산들을 시험관내에서 세포들내로 투여할 수 있다. 특정 구현예들에서, TALE-단백질 융합체들을 암호화하는 핵산들은 생체내 또는 생체외 사용들을 위해 투여된다. 비-바이러스 벡터 전달 시스템들은 DNA 플라스미드들, 네이키드 핵산(naked nucleic acid), 및 리포좀 또는 폴록사머와 같은 전달 비히클과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템들은 DNA 및 RNA 바이러스들을 포함하며, 이들은 세포내로 전달한 후 에피소옴 또는 통합된 게놈들을 가진다. 이들 결합 단백질들을 포함하는 조작된 DNA-결합 단백질들 및 융합 단백질들의 생체내 전달의 고찰을 위해서는, 예를 들면, Rebar (2004) Expert Opinion Invest. Drugs 13(7):829-839; Rossi et al. (2007) Nature Biotech. 25(12):1444-1454 as well as general gene delivery references such as Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Boem (eds.) (1995); and Yu et al., Gene Therapy 1:13-26 (1994)를 참조한다.
비-바이러스 벡터 전달 시스템들은 전기천공(electroporation), 지질감염, 미세주입, 바이올리스틱스(biolistics), 바이로솜들(virosomes), 리포좀들, 면역리포좀들(immunoliposomes), 다가양이온 또는 지질:핵산 접합체들, 네이키드 DNA, 인공 비리온들(virions), 및 DNA의 제제-향상된 흡수를 포함한다. 예를 들면, Sonitron 2000 system(Rich-Mar)을 사용하는 소노포레이션(sonoporation)을 또한 핵산들의 전달에 사용할 수 있다. 바이러스 벡터 전달 시스템들은, DNA 및 RNA 바이러스들을 포함하며, 이는 세포내로 전달 후 에피소옴 또는 통합된 게놈들을 가진다. 추가의 예시적인 핵산 전달 시스템들은 Amaxa Biosystems(독일, 콜로인 소재), Maxcyte, Inc.(매릴린드 록크빌 소재), BTX Molecular Delivery Systems(메사츄세츠 홀링스톤 소재) 및 Copernicus Therapeutics Inc.(참조: 예를 들면, US6008336)에 의해 제공된 것들을 포함한다. 지질감염은 예를 들면, 미국 특허 5,049,386, 미국 특허 4,946,787; 및 미국 특허 4,897,355에 기술되어 있으며 지질감염 시약들은 상업적으로 시판된다(예를 들면, TransfectamTM 및 LipofectinTM). 폴리뉴클레오타이드들의 효율적인 수용체-인지 지질감염에 적합한 양이온성 및 중성 지질들은 Felgner, WO 91/17424, WO 91/16024의 것들을 포함한다. 전달은 세포(생체외 투여) 또는 표적 조직(생체내 투여)에 대해 이루어질 수 있다.
면역지질 복합체들과 같은 표적화된 리포좀들을 포함하는, 지질:핵산 복합체들의 제조는 당해 분야의 숙련가에게 잘 공지되어 있다[참조: 예를 들면, Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther. 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem. 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); 미국 특허 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, 및 4,946,787].
추가의 전달 방법들은 EnGeneIC 전달 비히클들(EDVs)로 전달되는 핵산들의 패키징의 사용을 포함한다. 이들 EDV들은 이특이적인 항체들을 사용하여 표적 조직에 특이적으로 전달되며, 여기서 항체의 하나의 아암(arm)은 표적 조직에 대해 특이성을 가지며 다른 것은 EDV에 대해 특이성을 가진다. 항체는 EDV들을 표적 세포 표면에 도입한 후 EDV는 세포내이입에 의해 세포내로 도입된다. 일단 세포내에 있는 경우, 내용물들이 방출된다[참조: MacDiarmid et al (2009) Nature Biotechnology vol 27(7) p. 643].
적합한 세포들은 진핵 세포들 및 원핵 세포들 및/또는 세포주들을 포함하나 이에 한정되지 않는다. 이러한 세포들 또는 이러한 세포들로부터 생성된 세포주들의 비-제한적 예들은 COS, CHO(예를 들면, CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293(예를 들면, HEK293-F, HEK293-H, HEK293-T), 및 perC6 세포, 및 또한 스포도프테라 푸기페르다(Spodoptera fugiperda)(Sf)와 같은 곤충 세포들, 또는 사카로마이세스(Saccharomyces), 피키아(Pichia) 및 스키조사카로마이세스(Schizosaccharomyces)와 같은 진균 세포들을 포함한다. 특정 구현예에서, 세포주는 CHO-K1, MDCK 또는 HEK293 세포주이다. 또한, 원시 세포들을 분리하여 치료할 피검체내로 재도입을 위해 생체외에서 사용한 후 TALE-융합체들로 치료할 수 있다. 적합한 원시 세포들은 말초 혈액 단핵 세포들(PBMC), 및 예를 들면, CD4+ T 세포들 또는 CD8+ T 세포들, 그러나 이에 한정되지 않는 다른 혈액 세포 소세트를 포함한다. 적합한 세포들은 또한 예를 들면, 배아 줄기 세포들, 도입된 다능성 줄기 세포들, 조혈 줄기 세포들, 시경 줄기 세포들, 중간엽 줄기 세포들, 근육 줄기 세포들 및 피부 줄기 세포들과 같은 줄기 세포들을 포함한다.
변형된 줄기 세포들은 또한 일부 구현예들에서 사용될 수 있다. 예를 들면, 세포자멸사에 대해 내성으로 제조된 줄기 세포들을 치료학적 조성물들로서 사용할 수 있으며, 여기서 줄기 세포들은 또한 본 발명의 TALE-융합 단백질을 함유한다. 세포자멸사에 대한 내성은 예를 들면, 줄기 세포들에서 BAX- 또는 BAK-특이적인 TALEN들을 사용하여 BAX 및/또는 BAK들을 녹킹 아웃(knocking out)시킴에 의해, 또는 예를 들면, 카스파제-6 특이적인 TALEN들을 사용하여 파괴시킨 것들로부터 올 수 있다.
DNA를 조혈 줄기 세포들내로 도입시키는 방법들은 예를 들면, 미국 특허 5,928,638에 기재되어 있다. 삽입유전자들을 조혈 줄기 세포들, 예를 들면, CD34+ 세포들로 도입시키는데 유용한 벡터들은 아데노바이러스 35형을 포함한다.
본원에 기술된 바와 같은 폴리뉴클레오타이드들의 도입에 적합한 벡터들은 본원에 기술된 비-통합 렌티바이러스 벡터들(IDLV)을 포함한다. 예를 들면, Ory et al. (1996) Proc. Natl. Acad. Sci. USA 93:11382-11388; Dull et al. (1998) J. Virol. 72:8463-8471; Zuffery et al. (1998) J. Virol. 72:9873-9880; Follenzi et al. (2000) Nature Genetics 25:217-222; 미국 특허 공보 2009/054985를 참조한다. 위에서 주목한 바와 같이, 기재된 방법들 및 조성물들은 어떠한 세포 유형에도 사용할 수 있다. 동물 세포들의 후대세포, 변이체들 및 유도체들도 또한 사용할 수 있다.
DNA 제작물들은 각종의 통상의 기술들에 의해 목적하는 식물 숙주(예를 들면, 이의 게놈내로)내로 도입시킬 수 있다. 이러한 기술들의 참조를 위해, 예를 들면, Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, pp. 421-463; and Grierson & Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7-9를 참조한다.
예를 들면, DNA 제작물은 식물 세포 원형질체의 전기천공 및 미세주입과 같은 기술들을 사용하여 식물 세포의 게놈 DNA내로 직접 도입시킬 수 있거나, DNA 제작물들을 바이올리스틱 방법들, 예를 들면, DNA 입자 충격[참조: 예를 들면, Klein et al (1987) Nature 327:70-73]을 사용하여 식물 조직내로 직접 도입시킬 수 있다. 대안적으로, DNA 제작물들을 적합한 T-DNA 플랭킹 영역들과 결합시켜 통상의 아가로박테리움 투메파시엔시스(Agrobacterium tumefaciens) 숙주 벡터내로 도입시킬 수 있다. 디스아밍(disarming) 및 이원 벡터들의 사용을 포함하는, 아가로박테리움 투메파시엔스-매개된 형질전환 기술은 또한 과학 문헌에 잘 기술되어 있다. 예를 들면, Horsch et al (1984) Science 233:496-498, 및 Fraley et al (1983) Proc. Nat'l. Acad. Sci. USA 80:4803을 참조한다.
또한, 유전자 전달은 리조비움 아종(Rhizobium sp.) NGR234, 시노르히조보이움 멜리로티(Sinorhizoboium meliloti), 메소르히조비움 로티(Mesorhizobium loti), 감자 바이러스 X, 카울리플라워 모자익 바이러스(cauliflower mosaic virus) 및/또는 카사노바 정맥 모자익 바이러스(cassava vein mosaic virus) 및/또는 담배 모자익 바이러스(tobacco mosaic virus)와 같은 아그로박테리움 세균 또는 바이러스를 사용하여 달성할 수 있다[참조: 예를 들면, Chung et al. (2006) Trends Plant Sci. 11(1):1-4].
아그로박테리움 투메파시엔스 숙주의 발병력 기능들은, 세포가 이원 T DNA 벡터[참조: Bevan (1984) Nuc. Acid Res. 12:8711-8721] 또는 동시-배양 과정[참조: Horsch et al (1985) Science 227:1229-1231]을 사용하여 세균에 의해 감염되는 경우, 제작물 및 인접함 마커의 식물 세포 DNA내로의 삽입을 지시할 것이다. 일반적으로, 아가로박테리움 형질전환 시스템을 사용하여 쌍자엽 식물들을 가공한다[참조: Bevan et al (1982) Ann. Rev. Genet 16:357-384; Rogers et al (1986) Methods Enzymol. 118:627-641]. 아가로박테리움 형질전환 시스템을 또한 사용하여 DNA를 단자엽 식물 및 식물 세포들내로 형질전환시킬 뿐만 아니라 형질감염시킬 수도 있다. 미국 특허 5, 591,616; Hernalsteen et al (1984) EMBO J 3:3039-3041; Hooykass-Van Slogteren et al (1984) Nature 311:763-764; Grimsley et al (1987) Nature 325:1677-179; Boulton et al (1989) Plant Mol. Biol. 12:31-40.; 및 Gould et al (1991) Plant Physiol. 95:426-434를 참조한다.
대안의 유전자 전달 및 형질전환 방법들은 네이키드 DNA의 칼슘-, 폴리에틸렌 글리콜(PEG)- 또는 전기천공-매개된 흡수를 통한 원형질체 형질전환[참조: Paszkowski et al. (1984) EMBO J 3:2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199:169-177; Fromm et al. (1985) Proc. Nat. Acad. Sci. USA 82:5824-5828; and Shimamoto (1989) Nature 338:274-276] 및 식물 조직의 전기천공[참조: D'Halluin et al. (1992) Plant Cell 4:1495-1505]을 포함하나, 이에 한정되지 않는다. 식물 세포 형질전환을 위한 추가의 방법들은 미세주입, 탄화규소 매개된 DNA 흡수[참조: Kaeppler et al. (1990) Plant Cell Reporter 9:415-418], 및 미세발사 충격(microprojectile bombardment)[참조: Klein et al. (1988) Proc. Nat. Acad. Sci. USA 85:4305-4309; 및 Gordon-Kamm et al. (1990) Plant Cell 2:603-618]를 포함한다.
유기체
본원에 기술된 방법들 및 조성물들은, 유전자 발현을 조절하고/하거나 게놈 변형을 통해 유기체를 변경시키는 것이 바람직한, 식물들, 동물들(예를 들면, 마우스들, 랫트들, 영장류들, 농장 동물들, 토끼들 등과 같은 포유동물), 어류 등과 같은 진핵 유기체들을 포함하나, 이에 한정되지 않는 어떠한 유기체에도 적용가능하다. 진핵 세포들(예를 들면, 효모, 식물, 진균, 물고기 및, 고양이, 개, 쥐, 소, 양 및 돼지와 같은 포유동물 세포들)을 사용할 수 있다. 본원에 기술된 것으로서 하나 이상 동종접합성 KO 유전자위치들(loci) 또는 다른 유전적 변형들을 또한 사용할 수 있다.
예시적인 포유동물 세포들은 목적한 유기체의 어떠한 세포 또는 세포주, 예를 들면, 난모세포들, K562 세포들, CHO(차이니즈 햄스터 난모) 세포들, HEP-G2 세포들, BaF-3 세포들, 슈나이더 세포들(Schneider cells), COS 세포들(SV40 T-항원을 발현하는 원숭이 신장 세포들), CV-1 세포들, HuTu80 세포들, NTERA2 세포들, NB4 세포들, HL-60 세포들 및 HeLa 세포들, 293 세포들[참조: 예를 들면, Graham et al. (1977) J. Gen. Virol. 36:59], 및 SP2 또는 NS0와 같은 흑색종 세포들[참조: 예를 들면, Galfre and Milstein (1981) Meth. Enzymol. 73(B):3 46]을 포함한다. 배아 및 성인 줄기 세포들일 수 있는 말초 혈액 단핵세포들(PBMCs) 또는 T-세포들을 또한 사용할 수 있다. 예를 들면, 사용될 수 있는 줄기 세포들은 배아 줄기 세포들(ES), 유도된 다능성 줄기 세포들(iPSC), 중간엽 줄기 세포들, 조혈 줄기 세포들, 간 줄기 세포들, 피부 줄기 세포들 및 신경 줄기 세포들을 포함한다.
예시적인 표적 식물들 및 식물 세포들은 곡물들(예를 들면, 밀, 옥수수, 벼, 수수, 보리), 과일 작물들(예를 들면, 토마토, 사과, 배, 딸기, 오렌지), 목초 작물들(예를 들면, 알파파), 구근 야채 작물들(예를 들면, 당근, 감자, 사탕무우, 참마), 잎 야채 작물들(예를 들면, 상추, 시금치); 소비용 야채 작물들(예를 들면, 대두 및 다른 콩과식물, 호박, 후추들, 가지, 샐러리 등), 개화 식물들(예를 들면, 페츄니아, 장미, 국화), 침엽수 및 소나무들(예를 들면, 전나무, 가문비나무); 튜울립 나무[예를 들면, 피. 트레물라(P. tremula) x 피. 알바(P. alba)]; 식물환경복원에 사용된 섬유 작물들(면화, 황마, 아마, 대나무) 식물들(예를 들면, 중금속 축적 식물들); 오일 작물들(예를 들면, 해바라기, 평지씨) 및 환경 목적으로 사용된 식물들[예를 들면, 아라비돕시스(Arabidopsis)]을 포함하는 작물들과 같은 단자엽 및 쌍자엽 식물들을 포함하나, 이에 한정되지 않는다. 따라서, 기재된 방법들 및 조성물들은 속 아스파라구스(Asparagus), 아베나(Avena), 브라씨카(Brassica), 시트루스(Citrus), 시트룰루스(Citrullus), 캅시쿰(Capsicum), 쿠쿠르비타(Cucurbita), 다우쿠스(Daucus), 에리게론(Erigeron), 글리신(Glycine), 고십피움(Gossypium), 호르데움(Hordeum), 락투카(Lactuca), 롤리움(Lolium), 리코페르시콘(Lycopersicon), 말루스(Malus), 마니호트(Manihot), 니코티아나(Nicotiana), 오리초프라그무스(Orychophragmus), 오리자(Oryza), 페르세아(Persea), 파세올루스(Phaseolus), 프리숨(Pisum), 피루스(Pyrus), 프루누스(Prunus), 라파누스(Raphanus), 세칼레(Secale), 솔라눔(Solanum), 소르굼(Sorghum), 트리티쿰(Triticum), 비티스(Vitis), 비그나(Vigna), 및 제아(Zea)로부터 선택된 종을 포함하나, 이에 한정되지 않는 광범위한 식물들에 걸쳐 용도를 갖는다. 용어 식물 세포들은 분리된 식물 세포들 및 또한 전체 식물들 또는 전체 식물들의 일부들, 예를 들면, 종자들, 칼루스(callus), 잎들, 뿌리들 등을 포함한다. 본 기재내용은 또한 위에서 기술된 식물들의 종자들을 포함하며, 여기서 종자는 삽입유전자 또는 유전자 제작물을 가지고/가지거나 본원에 기술된 조성물들 및/또는 방법들을 사용하여 변형시킨다. 본 기재내용은 위에서 기술된 유전자삽입 식물들의 후대세포, 클론들, 세포주들 또는 세포들을 추가로 포함하며, 여기서 상기 후대세포, 클론, 세포주 또는 세포는 삽입유전자 또는 유전자 제작물을 갖는다.
목적 화합물들, 즉, 가소제들, 탄화수소들 등을 제조하기 위해 조류가 크게 이용되고 있다. 예지적인 조류 종들은 규조류들 및 시아노박테리아를 포함하는 미세조류 및 또한 보트리오코쿠스 브라우니이(Botryococcus braunii), 클로렐라(Chlorella), 두날리엘라 테르티올렉타(Dunaliella tertiolecta), 그라실레리아(Gracileria), 플레우로크리시스 카르테라에(Pleurochrysis carterae), 소르고숨(Sorgassum) 및 울바(Ulva)를 포함함한다.
TALE 융합 단백질에 의한 유전자 발현의 조절을 측정하기 위한 검정
각종 검정들을 사용하여 TALE-융합 단백질에 의한 유전자 발현 조절의 수준을 측정할 수 있다. 특수한 TALE- 융합 단백질의 활성은 예를 들면, 단백질 또는 mRNA 수준들, 생성물 수준들, 효소 활성, 종양 성장; 리포터 유전자의 전사 활성화 또는 억제; 제2 전령인자 수준들(예를 들면, cGMP, cAMP, IP3, DAG, Ca.sup.2+); 사이토킨 및 호르몬 생산 수준들을 측정함으로써 다양한 시험관내 및 생체내 검정을 사용하여 평가할 수 있으며; 신생혈관화는 예를 들면, 면역검정들(예를 들면, ELISA 및 항체들을 사용한 면역조직화학 검정), 하이브리드화 검정들(예를 들면, RNase 보호, 노뎀(northem)들, 반응계내 하이브리드화, 올리고뉴클레오타이드 배열 연구들), 열량계 분석들, 증폭 분석물, 효소 활성 검정들, 종양 성장 검정들, 표현형 검정들 등을 사용하여 평가할 수 있다.
TALE-융합 단백질은 전형적으로 배양된 세포, 예를 들면, 293 세포들, CHO 세포들, VERO 세포들, BHK 세포들, HeLa 세포들, COS 세포들, 식물 세포주들, 식물 칼러스 배양물들 등을 사용하여 시험관내 활성에 대해 우선 시험한다. 바람직하게는 사람 세포들을 사용한다. TALE-융합 단백질은 종종 우선 리포터 유전자를 지닌 일시적인 발현 시스템을 사용하여 시험한 후, 표적 내인성 유전자의 조절을 세포들 및 동물들내에서, 생체내 및 생체외 둘다로 시험한다. TALE 융합 단백질은 세포내에서 재조합적으로 발현되거나, 동물 또는 식물내로 이식된 세포들내에서 재조합적으로 발현되거나, 유전자삽입 동물 또는 식물에서 재조합적으로 발현되거나, 본원에 기술된 전달 비히클들을 사용하여 동물, 식물 또는 세포에 단백질로서 투여될 수 있다. 세포들은 고정화될 수 있거나, 용액이거나, 동물에 투여되거나, 유전자삽입 또는 비-유전자삽입 동물에 천연적으로 존재할 수 있다.
유전자 발현의 조절은 본원에 기술된 시험관내 또는 생체내 검정들 중 하나를 사용하여 시험한다. 시료들 또는 검정들은 TALE-융합 단백질로 처리하고 시험 화합물의 부재하에 대조군 시료들에 대해 비교함으로써 조절 정도를 시험한다.
TALE-융합 단백질의 효과들은 위에서 기술된 매개변수들 중 어느 것을 시험함으로써 측정할 수 있다. 어떠한 적합한 유전자 발현, 표현형적, 또는 생리학적 변화를 사용하여 TALE-융합 단백질의 영향을 평가할 수 있다. 기능적 결과들이 완전한 세포들 또는 동물들을 사용하여 측정되는 경우, 공지된 및 특성화되지 않은 유전 마커들(예를 들면, 노던 블롯들 또는 올리고뉴클레오타이드 배열 연구들) 둘다에 대한 종양 성장, 신생혈관화, 호르몬 방출, 전사 변화들과 같은 각종의 영향들, 세포 성장 또는 pH 변화들과 같은 세포 대사에 있어서의 변화들, 및 cGMP와 같은 세포내 제2의 전령인자들에 있어서의 변화들을 측정할 수 있다.
내인성 유전자 발현의 TALE-융합 단백질 매개된 조절에 대한 바람직한 검정들은 시험관내에서 수행할 수 있다. 하나의 바람직한 시험관내 검정 양식에서, 배양된 세포들내에서 내인성 유전자 발현의 TALE-융합 단백질 매개된 조절은 ELISA 검정을 사용한 단백질 생산을 시험함으로써 측정한다. 시험 시료는 엠티 벡터(empty vector) 또는 다른 유전자에 대해 표적화된 관련되지 않은 TALE-융합 단백질을 사용하여 처리된 대조군 세포들과 비교한다.
다른 구현예에서, 내인성 유전자 발현의 TALE-융합 단백질-매개된 조절은 표적 유전자 mRNA 발현의 수준을 측정함으로써 시험관내에서 측정한다. 유전자 발현의 수준은 예를 들면, PCR, LCR, 또는 하이브리드화 검정들, 예를 들면, 노던 하이브리드화, RNase 보호, 도트 블롯팅(dot blotting)을 사용하여 측정한다. RNase 보호를 하나의 구현예에서 사용한다. 단백질 또는 mRNA의 수준은 본원에 기술된 것으로서, 표지된 검출 제제, 예를 들면, 형광성적으로 또는 방사활성적으로 표지된 핵산들, 방사활성적으로 또는 효소적으로 표지된 항체들 등을 사용하여 검출한다.
대안적으로, 리포터 유전자 시스템은 루시퍼라제, 녹색 형광성 단백질, CAT, 또는 베타-gal과 같은 리포터 유전자에 작동적으로 연결된 표적 유전자 프로모터를 사용하여 고안할 수 있다. 리포터 제작물은 전형적으로 배양된 세포내로 동시-형질감염된다. 선택한 TALE-융합 단백질을 사용한 처리 후, 리포터 유전자 전사, 해독 또는 활성의 양을 당해 분야의 숙련가에게 공지된 표준 기술들에 따라 측정한다.
내인성 유전자 발현의 TALE-융합 단백질 매개된 조절을 모니터링하기에 유용한 바람직한 검정의 다른 예는 생체내에서 수행한다. 당해 검정은 특히 종양 촉진 유전자들, 종양 지지, 예를 들면, 신생혈관화(예를 들면, VEGF)에 관여된 유전자들의 발현을 억제하거나, p53과 같은 종양 억제인자 유전자들을 활성화시키는 TALE-융합체를 시험하는데 특히 유용하다. 당해 검정에서, 선택된 TALE-융합체를 발현하는 배양된 종양 세포들은 무흉선 마우스와 같은 면역 약화된 마우스, 조사된(irradiated) 마우스, 또는 SCID 마우스내로 피하 주입된다. 적합한 기간, 바람직하게는 4 내지 8주 후, 종양 성장을 예를 들면, 용적으로 또는 이의 2개의 치수들로 측정하고, 대조군과 비교한다. 통계적으로 유의적인 감소를 갖는 종양들[예를 들면, 스튜던츠 T 시험(Student's T test)]을 가진 종양들은 성장을 억제하는 것으로 일컬어진다. 대안적으로, 종양 신생혈관화의 정도를 또한 측정할 수 있다. 내피 세포 특이적인 항체들을 사용한 면역검정들을 사용하여 종양의 혈관화 및 종양내 다수의 혈관들에 대해 염색한다. 혈관들의 수(예를 들면, 스튜던츠 T 시험을 사용함)에 있어서 통계적으로 유의적인 감소를 갖는 종양들은 억제된 신생혈관화를 가지는 것으로 일컬어진다.
위에서 기술된 바와 같은 삽입유전자 및 비-삽입유전자 식물들 또는 동물들을 또한 생체내에서 내인성 유전자 발현의 조절을 시험하기 위한 바람직한 구현예로서 사용한다. 삽입유전자 유기체들은 전형적으로 선택한 TALE-융합체를 발현한다. 대안적으로, 선택한 TALE-융합체들을 일시적으로 발현하거나, 이에 대해 TALE 융합 단백질들이 전달 비히클로 투여된 유기체들을 사용할 수 있다. 내인성 유전자 발현의 조절은 본원에 기술된 검정들 중 어느 하나를 사용하여 시험한다.
TALE-융합 단백질을 암호화하는 핵산들
통상의 바이러스 및 비-바이러스계 유전자 전달 방법들을 사용하여 포유동물 세포들, 전체 유기체들 또는 표적 조직들내에서 조작된 TALE 도메인 융합체들을 암호화하는 핵산들을 도입할 수 있다. 이러한 방법들은 TALE 도메인 융합체들을 암호화하는 핵산들을 세포내로 시험관내에서 투여하는데 사용될 수 있다. 바람직하게는, TALE 도메인 융합체들을 암호화하는 핵산들은 생체내 또는 생체외 사용을 위해 투여된다. 비-바이러스 벡터 전달 시스템들은 DNA 플라스미드들, 네이키드 핵산, 및 리포좀과 같은 전달 비히클과 복합체화된 핵산을 포함한다. 바이러스 벡터 전달 시스템들은 세포내로 전달 후, 에피소옴을 가지거나, 게놈들내로 통합된, DNA 및 RNA 바이러스들을 포함한다. 유전자 치료요법 과정들의 고찰을 위해서는, Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and Bohm (eds) (1995); 및 Yu et al., Gene Therapy 1:13-26 (1994)를 참조한다.
조작된 TALE 도메인 융합체들을 암호화하는 핵산들의 전달을 위한 RNA 또는 DNA 바이러스계 시스템들의 사용은 체내에서 바이러스를 특수 세포들로 표적화하고 바이러스 페이로드(payload)를 핵으로 트래피킹(trafficking)하기 위한 고도로 진화된 공정들의 장점을 취한다. 바이러스 벡터들은 환자들에게 직접 투여될 수 있거나(생체내) 이들을 시험관내에서 세포들을 치료하기 위해 사용될 수 있으며 변형된 세포들은 환자들에게 투여된다(생체외). TALE 도메인 융합체들의 전달을 위한 통상의 바이러스계 시스템들은 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련 및 헤르페스 단성 바이러스 벡터들을 포함할 수 있었다. 바이러스 벡터들은 표적 세포들 및 조직들에서 유전자 전달의 현재 가장 효율적이고 다용도인 방법이다. 숙주 게놈내에서의 통합은 레트로바이러스, 렌티바이러스, 및 아데노-관련된 바이러스 유전자 전달 방법을 사용하여 가능하며, 흔히 삽입된 삽입유전자의 장기간 발현을 생성한다. 또한, 고 형질유도 효율이 많은 상이한 세포형들 및 표적 조직들에서 관찰되어왔다.
레트로바이러스의 향성(tropism)은 외부 엔벨로프(envelope) 단백질들을 도입시키고, 표적 세포들의 강력한 표적 집단을 확장시킴으로써 변경시킬 수 있다. 렌티바이러스 벡터들은 분열하지 않는 세포들을 형질유도하거나 형질감염시킬 수 있고 고 바이러스 역가를 전형적으로 생산할 수 있는 레트로바이러스 벡터이다. 따라서, 레트로바이러스 유전자 전달 시스템의 선택은 외부 서열의 6 내지 10 kb 이하에 대한 패키징 능력을 지닌 시스-작용성의 긴 말단 반복체들로 구성된다. 최소 시스-작용성 LTR은 벡터들의 복제 및 패키징에 충분하며, 이후 이들은 영구적인 삽입유전자 발현을 제공하기 위해 표적 세포내로 치료학적 유전자를 통합시키는데 사용된다. 광범위하게 사용된 레트로바이러스 벡터들은 쥣과 백혈병 바이러스(MuLV), 깁본 아페 백혈병 바이러스(gibbon ape leukemia virus: GaLV), 시미안 면역 결핍 바이러스(Simian Immuno deficiency virus: SIV), 사람 면역 결핍성 바이러스(HIV), 및 이의 조합물들을 기본으로 하는 것들을 포함한다[참조: 예를 들면, Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J Virol. 66:1635-1640 (1992); Sommerfelt et al, Virol. 176:58-59 (1990); Wilson et al., J. Virol. 63:2374-2378 (1989); Miller et al., J. Virol. 65:2220-2224 (1991); PCT/US94/05700].
TALE 도메인 융합체들의 일시적인 발현이 바람직한 적용들에서, 아데노바이러스계 시스템들이 전형적으로 사용된다. 아데노바이러스계 벡터들은 많은 세포 유형들에서 매우 높은 형질유도 효율을 지닐 수 있으며 세포 분열을 필요로 하지 않는다. 이러한 벡터들을 사용하여, 발현의 고 역가 및 수준들을 수득하여 왔다. 당해 벡터는 비교적 단순한 시스템에서 다량으로 생산될 수 있다. 아데노-관련 바이러스("AAV") 벡터들을 또한 사용하여 세포를 표적 핵산들로, 예를 들면, 핵산 및 펩타이드들의 시험관내 생산시, 및 생체내 및 생체외 유전자 치료요법 과정들에서 형질유도한다[참조: 예를 들면, West et al., Virology 160:38-47 (1987); U.S. Pat. No. 4,797,368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94:1351 (1994)]. 재조합체 AAV 벡터들의 제작는 미국 특허 5,173,414; Tratschin et al., Mol. Cell. Biol. 5:3251-3260 (1985); Tratschin, et al., Mol Cell. Biol. 4:2072-2081 (1984); Hermonat & Muzyczka, Proc Natl Acad Sci USA 81:6466-6470 (1984); 및 Samulski et al., J. Virol. 63:03822-3828 (1989)를 포함하는, 다수의 공보들에 기술되어 있다.
특히, 적어도 6개의 바이러스 벡터 시도들이 가장 흔히 사용된 시스템에 의한 레트로바이러스 벡터들을 사용하는 임상 시험들에서 유전자 전달을 위해 현재 이용가능하다. 이들 바이러스 벡터들 모두는 헬퍼 세포주들내로 삽입된 유전자들에 의해 결손 벡터들의 보충을 포함하는 시도들을 이용하여 형질유도제를 생성한다.
pLASN 및 MFG-S은 임상 시험들에서 사용된 레트로바이러스 벡터들의 예이다[참조: Dunbar et al., Blood 85:3048-305 (1995); Kohn et al., Nat. Med. 1:1017-102 (1995); Malech et al., Proc Natl Acad Sci USA 94:22 12133-12138 (1997)]. PA317/pLASN은 유전자 치료요법 시험에서 사용된 최초 치료학적 벡터였다[참조: Blaese et al., Science 270:475480 (1995)]. 50% 이상의 형질도입 효능은 MFG-S 패키지된 벡터들에 대해 관찰되어 왔다[참조: Ellem et al., Immunol Immunother. 44(1):10-20 (1997); Dranoff et al., Hum. Gene Ther. 1:111-2 (1997)].
재조합체 아데노-관련 바이러스 벡터들(rAAV)은 결손 및 비병원성 파르보바이러스 아데노-관련 제2형 바이러스를 기본으로 한 유전자 전달 시스템에 대한 촉망되는 대체물이다. 모든 벡터들이 삽입유전자 발현 카세트를 플랭킹하는 AAV 145 bp 역전된 말단 반복체만을 보유하는 플라스미드로부터 기원한다. 형질도입된 세포의 게놈내로의 통합에 기인한 효율적인 유전자 전달 및 안정한 삽입유전자 전달은 당해 벡터 시스템에 대한 주요 특징들이다[참조: Wagner et al., Lancet 351:9117 1702-3 (1998), Kearns et al., Gene Ther. 9:748-55 (1996)].
복제-결함 재조합체 아데노 바이러스들(Ad)은 고 역가로 생산될 수 있으며 다수의 상이한 세포 유형들을 용이하게 감염시키므로, 결장암 유전자 치료요법에 주로 사용된다. 대부분의 아데노바이러스 벡터들은, 삽입유전자가 Ad E1a, E1b, 및 E3 유전자들을 대체하고; 후속적으로 복제 결손인자 벡터가 트랜스 방향으로 결실된 유전자 기능을 보충하는 사람 293 세포들에서 증식되도록 조작된다. Ad 벡터들은 간, 신장 및 근육 시스템 조직들에서 발견된 것들과 같은 비분열성의, 분화된 세포들을 포함하는, 생체내에서 조직들의 다수 유형을 형질도입시킬 수 있다. 통상의 Ad 벡터들은 거대한 운반능을 가진다. 임상 시험에서 Ad 벡터의 사용의 예는 근육내 주입을 사용한 항종양 면역화를 위한 폴리뉴클레오타이드 치료요법을 포함하였다[참조: Sterman et al., Hum. Gene Ther. 7:1083-9 (1998)]. 유전자 전달용 아데노바이러스 벡터들의 용도의 추가의 예들은 Rosenecker et al, Infection 24:1 5-10 (1996); Sterman et al., Hum. Gene Ther. 9:7 1083-1089 (1998); Welsh et al., Hum. Gene Ther. 2:205-18 (1995); Alvarez et al., Hum. Gene Ther. 5:597-613 (1997); Topf et al., Gene Ther. 5:507-513 (1998); Sterman et al., Hum. Gene Ther. 7:1083-1089 (1998); 미국 특허 공보 2008/0159996를 포함한다.
패키징 세포들은 숙주 세포를 감염시킬 수 있는 바이러스 입자들을 형성하는데 사용된다. 이러한 세포들은 아데노바이러스를 패키지하는 293세포들, 및 레트로바이러스를 패키지하는 psi2 세포들 또는 PA317 세포들을 포함한다. 유전자 치료요법에 사용된 바이러스 벡터들은 일반적으로 핵산 벡터를 바이러스 입자내로 패키지하는 생산자 세포주에 의해 생성된다. 벡터들은 통상적으로 숙주내로 패키징 및 후속적인 통합을 위해 요구되는 최소의 바이러스 서열들을 함유하며, 다른 바이러스 서열들은 발현될 단백질에 대한 발현 카세트에 의해 교체된다. 잃어버린 바이러스 기능들은 패키징 세포주에 의해 트랜스 배향으로 공급된다. 예를 들면, 유전자 치료요법에 사용된 AAV 벡터들은 전형적으로 AAV 게놈으로부터의 ITR 서열들만을 소유하며, 이는 숙주 게놈내로의 패키징 및 통합에 요구된다. 바이러스 DNA는 세포주내에서 패키징되며, 당해 세포주는 다른 AAV 유전자들, 즉, rep 및 cap를 암호화하지만 ITR 서열들을 결여한 헬퍼 플라스미드를 함유한다. 세포주는 또한 헬퍼로서 아데노바이러스로 감염된다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자들의 발현을 촉진한다. 헬퍼 플라스미드는 ITR 서열들의 결여로 인하여 유의적인 양으로 패키징되지 않는다. 아데노바이러스에 의한 오염은 예를 들면, 아데노바이러스가 AAV보다 더 민감성인 열 처리에 의해 감소시킬 수 있다.
많은 유전자 치료요법 적용들에서, 유전자 치료요법 벡터를 고도의 특이성으로 특별한 세포 유형에 전달하는 것이 바람직하다. 바이러스 벡터는 전형적으로 변형되어 융합 단백질로서의 리간드를 바이러스들 외부 표면에서 바이러스 피복 단백질과 함께 발현시킴에 의해 제공된 세포 유형에 대한 특이성을 갖는다. 리간드는 목적한 세포 유형 위에 존재하는 것으로 공지된 수용체에 대한 친화성을 갖도록 선택된다. 예를 들면, Han et al., Proc Natl Acad Sci USA 92:9747-9751 (1995)는, 몰로니 쥣과 백혈병 바이러스가 변형되어 gp70에 융합된 사람 헤레굴린을 발현시킬 수 있으며, 재조합체 바이러스는 사람 상피 성장 인자 수용체를 발현하는 특정의 사람 유방암 세포들을 감염시킴을 보고하였다. 이러한 원리를 리간드 융합 단백질을 발현하는, 다른 바이러스 쌍들 및 수용체를 발현하는 표적 세포에 연장시킬 수 있다. 예를 들면, 필라멘트성 파아지를 가공하여 바이러스적으로 어떠한 선택된 세포 수용체에 대해 특이적인 결합 친화성을 갖는 항체 단편들(예를 들면, FAB 또는 Fv)를 나타낼 수 있다. 상기 설명이 바이러스 벡터들에 주로 적용된다고 해도, 동일한 원리들을 비바이러스 벡터들에 적용시킬 수 있다. 이러한 벡터들은 특이적인 표적 세포들에 의한 흡수를 촉진하는 것으로 고려되는 특이적인 흡수 서열들을 함유하도록 가공할 수 있다.
유전자 치료요법 벡터들은 하기 기술된 바와 같이, 개인 환자에게 투여함으로써, 전형적으로 전신계 투여(예를 들면, 정맥내, 복강내, 근육내, 피하, 또는 두개내 주입) 또는 국소 적용에 의해 생체내에서 전달될 수 있다. 대안적으로, 벡터들은 개개 환자로부터 외식된(explanted) 세포들(예를 들면, 림프세포, 골수 흡인물, 조직 생검)과 같은, 세포들에게 생체외에서 또는 공통의 공여자 조혈 줄기 세포들에게 전달한 후, 일반적으로 벡터가 혼입된 세포들을 선택한 후, 환자에게 세포들을 재이식함으로써 전달할 수 있다.
진단, 조사를 위한, 또는 유전자 치료요법을 위한(예를 들면, 숙주 유기체내로 형질감염된 세포들의 재-주입을 통해) 생체외 세포 형질감염은 당해 분야의 숙련가에게 잘 공지되어 있다. 바람직한 구현예에서, 세포들은 대상 유기체로부터 분리하고, TALE 융합 핵산(유전자 또는 cDNA)로 형질감염시키고, 피검자 유기체(예를 들면, 환자)내로 다시 재주입시킨다. 생체외 형질감염에 적합한 각종 세포 유형들이 당해 분야의 숙련가에게 잘 공지되어 있다[참조: 예를 들면, Freshney et al., Culture of Animal Cells, A Manual of Basic Technique (3rd ed. 1994) 및 환자들로부터 세포를 분리하여 배양하는 방법의 논의에 대해서는 상기 문헌에 인용된 문헌들].
하나의 구현예에서, 줄기 세포들은 세포 형질감염 및 유전자 치료요법을 위해 생체외 과정들에서 사용된다. 줄기 세포들을 사용하는 장점은, 이들이 다른 세포 유형들로 시험관내에서 분화될 수 있거나, 이들이 골수내에에서 이식될 포유동물(예를 들면, 세포들의 공여체)내로 도입될 수 있다는 것이다. 시험관내에서 CD34+ 세포들을 GM-CSF, IFN-감마, 및 TNF-알파와 같은 사이토킨들을 사용하여 임상적으로 중요한 면역 세포 유형들로 분화시키는 방법들은 공지되어 있다[참조: Inaba et al., J. Exp. Med. 176:1693-1702 (1992)].
줄기 세포들은 공지된 방법들을 사용하여 형질도입 및 분화를 위해 분리한다. 예를 들어, 줄기 세포들은 골수 세포들로부터 골수 세포들을 CD4+ 및 CD8+(T 세포들), CD45+ (panb 세포들), GR-1(과립세포들), 및 Iad(분화된 항원 표시 세포들)과 같은 원치않는 세포들에 결합하는 항체들로 패닝(panning)함에 의해 분리된다[참조: Inaba et al., J. Exp. Med. 176:1693-1702 (1992)]. 예시적인 줄기 세포들은 사람 배아 줄기 세포들(hES), 유도된 다능성 줄기 세포들(iPSC), 조혈 줄기 세포들, 중간엽 줄기 세포들, 신경 줄기 세포들, 및 근육 줄기 세포들을 포함한다.
치료학적 TALE 도메인 융합 핵산들을 함유하는 벡터들(예를 들면, 레트로바이러스들, 아데노바이러스들, 리포좀들 등)을 또한 생체내에서 세포들의 형질유도를 위한 유기체내로 직접 투여할 수 있다. 대안적으로, 네이키드 DNA를 투여할 수 있다. 투여는 분자를 혈액 또는 조직 세포들과 친밀하게 접촉되도록 하기 위해 일반적으로 사용된 경로들 중 어느 것에 의해 달성된다. 이러한 핵산들을 투여하는 적합한 방법들은 이용가능하며 당해 분야의 숙련가에게 잘 공지되어 있고, 비록 하나 이상의 경로가 특수 조성물을 투여하기 위해 사용될 수 있다고 해도, 특수 경로가 흔히 다른 경로보다 보다 즉시적이고 보다 효과적인 반응을 제공할 수 있다.
약제학적으로 허용되는 담체들은 투여되는 특별한 조성물, 및 또한 조성물을 투여하기 위해 사용된 특별한 방법에 의해 부분적으로 측정된다. 따라서, 하기 기술된 바와 같이, 본 발명의 약제학적 조성물들의 다양한 적합한 제형들이 존재한다(참조: 예를 들면, Remington's Pharmaceutical Sciences, 17th ed., 1989).
약제학적 조성물 및 투여
TALE-융합체 및, TALE-융합체를 암호화하는 발현 벡터들은 유전자 발현의 조절 및 치료학적 또는 예방학적 적용들, 예를 들면, 암, 허혈, 당뇨병성 망막증, 황반 변성, 류마티스 관절염, 건선, HIV 감염, 낫적혈구 세포 빈혈, 알츠하이머병(Alzheimer's disease), 근 위축증, 신경변성병들, 혈관병, 낭성 섬유증, 뇌졸중 등을 위해 환자에게 직접 투여할 수 있다. TALE 융합 단백질 유전자 치료요법에 의해 억제될 수 있는 미생물들의 예들은 병원성 세균, 예를 들면, 클라미디아(chlamydia), 리켓챠 세균(rickettsial bacteria), 마이코박테리아(mycobacteria), 스타필로코쿠스(staphylococcus), 스트렙토코쿠스(streptococcus), 뉴모코쿠스(pneumococcus), 메닝고코쿠스(meningococcus) 및 코노코쿠스(conococcus), 클렙시엘라(klebsiella), 프로테우스(proteus), 세라티아(serratia), 슈도모나스(pseudomonas), 레지오넬라(legionella), 디프테리아(diphtheria), 살모넬라(salmonella), 바실러스(bacillus), 콜레라(cholera), 테타누스독소증(tetanus), 보툴리눔독소증(botulism), 탄저병, 흑사병, 렙토스피라병, 및, 라임병 세균; 감염성 진균, 예를 들면, 아스퍼질러스(Aspergillus), 칸디다 종들(Candida species); 포자충[예를 들면, 플라스모디아(Plasmodia)], 근족충[예를 들면, 엔타모에바(Entamoeba)] 및 편모충들[트리파노소마(Trypanosoma), 라이쉬마니아(Leishmania), 트리초모나스(Trichomonas), 기아르디아(Giardia) 등]과 같은 원생동물; 바이러스병, 바이러스병들, 예를 들면, 간염(A, B 또는 C), 헤르페스 바이러스(예를 들면, VZV, HSV-1, HSV-6, HSV-II, CMV, 및 EBV), HIV, 에볼라, 아데노바이러스, 인플루엔자 바이러스, 플라비바이러스들, 에코바이러스, 리노바이러스, 콕사키에 바이러스, 코모바이러스, 호흡기세포 융합바이러스, 멈프스 바이러스(mumps virus), 로타바이러스(rotavirus), 풍진 바이러스, 루벨라 바이러스(rubella virus), 파르보바이러스(parvovirus), 박시니아 바이러스(vaccinia virus), HTLV 바이러스, 뎅기열 바이러스(dengue virus), 파필로마바이러스(papillomavirus), 폴리오바이러스(poliovirus), 라비스 바이러스(rabies virus), 및 아르보바이러스성 뇌염 바이러스(arboviral encephalitis virus) 등을 포함한다.
치료학적 유효량의 투여는 TALE-융합체를 치료될 조직과 궁극적으로 접촉시키기 위해 도입시키는데 일반적으로 사용된 경로들 중 어느 것에 의해서도 이루어진다. TALE-융합체들은 어떠한 적합항 방식으로, 바람직하게는 약제학적으로 허용되는 담체들을 사용하여 투여된다. 이러한 조절인자들의 적합한 투여 방법들은 이용가능하며 당해 분야의 숙련가에게 잘 공지되어 있으며, 하나 이상의 경로가 특수 조성물을 투여하기 위해 사용될 수 있다고 해도, 특수 경로는 흔히 다른 경로외에 보다 즉각적이고 보다 효과적인 반응을 제공할 수 있다.
예를 들면, 정맥내, 근육내, 피내, 및 피하 경로에 의한 것과 같은 비경구 투여에 적합한 제형들은 항산화제들, 완충제들, 세균정지제들, 및 제형을 의도된 수용체의 혈액과 등장성이되도록 하는 용질, 및 현탁화제들, 가용화제들, 증점제들, 안정화제들, 및 방부제들을 포함할 수 있는 수성 및 비-수성 멸균 현탁제들을 함유할 수 있는 수성 및 비-수성의, 등장성 멸균 주입 용액들을 포함한다. 본 발명의 실시에 있어서, 조성물들은 예를 들면, 정맥내 주입에 의해, 경구적으로, 국소적으로, 복강내로, 방광내로 또는 경막내로 투여할 수 있다. 화합물들의 제형들은 앰플들 및 바이알들과 같은 단위-투여량 또는 다중-투여량 밀봉된 용기들 속에 존재할 수 있다. 주입 용액들 및 현탁액들은 앞서 기술된 종류의 멸균 산제들, 입제들, 및 정제들로부터 제조할 수 있다.
식물들에서 유전자 발현의 조절
TALE-융합체를 사용하여 증가된 질병 내성, 구조적 및 저장 다당류들의 변형, 풍미들, 단백질들, 및 지방산들, 과일 숙성, 수율, 색상, 영양 특성들, 개선된 저장능, 가뭄 또는 침수/범람 내성 등과 같은 장점들에 대해 식물들을 가공할 수 있다. 특히, 향상된 오일 생산을 위한 작물 종들의 가공, 예를 들면, 평지씨들에서 생산된 지방산들의 변형이 흥미롭다(참조: 예를 들면, 미국 특허 7,262,054; 및 미국 특허 공보 2008/0182332 및 20090205083).
종자 오일들은 주로 지방산들의 글리세롤 에스테르들인, 트리아실글리세롤들(TAGs)로 구성된다. 이들 야채 오일들의 상업적인 생산은 주로 6개의 주요 오일 작물들(대두, 기름야자, 평지씨, 해바라기, 면화 종자, 및 땅콩)이차지한다. 야채 오일들은 주로(90%) 마가린, 쇼트닝(shortening), 샐러드 오일들, 및 튀김 오일과 같은 사람 소비용으로 사용된다. 나머지 10%는 윤활제들, 함유화학제품(oleochemicals), 바이오연료들, 세제들, 및 다른 공업용 제품들과 같은 비-식용 제품들에 사용된다.
이들 적용들 각각에 사용된 오일의 바람직한 특성들은 특히 TAG를 형성하는 지방산들내에 존재하는 이중 결합들의 수 및 쇄 길이 측면에서 광범위하게 변한다. 이들 특성들은 막 유동성 및 온도 민감성을 조절하기 위해 식물에 의해 조절된다. 동일한 특성들을 TALE 도메인 융합체들을 사용하여 조절함으로써 식품 및 산업용의 개선된 특성들을 갖는 오일들을 생산할 수 있다.
평지씨 작물들의 TAG들에 있어서 주요 지방산들은, 길이가 16 내지 18개 탄소들이고 0 내지 3개의 이중 결합들을 함유한다. 팔미트산(16:0 [16개 탄소들: 0개의 이중 결합들]), 올레산(18:1), 리놀레산(18:2), 및 리놀렌산(18:3)이 지배적이다. 이중결합들의 수, 또는 포화도는 융점, 반응성, 요리 수행능, 및 수득되는 오일의 건강 기여도를 결정한다.
올레산(18:1)의 리놀레산(18:2)(이는 이후 18:3 형성의 전구체가 된다)의 전환에 관여하는 효소는 DELTA12-올레이트 데사투라제이며, 이는 또한 오메가-6 데사투라제로 언급된다. 지방산 탈포화 경로에서 당해 단계에서의 차단은 고도 불포화유지들(polyunsaturates)의 소비시 올레산의 축적을 초래할 수 있다.
하나의 구현예에서, TALE 도메인(들)을 함유하는 단백질들을 사용하여 대두들에서 FAD2-1 유전자의 발현을 조절한다. 마이크로솜 DELTA.6을 암호화하는 2개의 유전자들은 대두로부터 최근에 클로닝되었으며, FAD2-1 및 FAD2-2로 언급된다[참조: Heppard et al., Plant Physiol. 110:311-319 (1996)]. FAD2-1(델타 12 데사투라제)는 대두 씨에서 다량의 올레산 탈포화를 조절하는 것으로 여겨진다. 따라서, TALE-융합체들을 사용하여 식물들에서 FAD2-1의 유전자 발현을 조절할 수 있다. 구체적으로, TALE 도메인 융합체들을 사용하여 대두에서 FAD2-1 유전자의 발현을 억제함으로써 오일 종자내 올레산(18:1)의 축적을 증가시킬 수 있다. 또한, TALE-융합체를 사용하여 다른 식물들로부터 델타-9 데사투라제, 델타-12 데사투라제, 델타-15 데사투라제, 아세틸-CoA 카복실라제, 아실-ACP-티오에스테라제, ADP-글루코즈 피로포스포릴라제, 전분 신타제, 셀룰로즈 신타제, 슈크로즈 신타제, 노쇠-관련 유전자들, 중금속 킬레이터들, 지방산 과산화물 리아제, 폴리갈락투로나제, EPSP 신타제, 식물 바이러스 유전자들, 식물 진균 병원체 유전자들, 및 식물 세균 병원체 유전자들과 같은 어떠한 다른 식물 유전자의 발현을 조절할 수 있다.
기능성 유전체학 분석들
TALE-융합체는 또한 유전자 발현의 표현형 결과 및 기능을 측정하기 위한 검정들에 대한 용도를 가진다. 집중된 질량 서열분석 노력들과 결부된, 분석 기술들에서의 최근 진전들은 앞서 이용가능하였던 것 보다 많은 분자 표적들을 확인하고 특성화하는 기회를 생성하여 왔다. 유전자들 및 이들의 기능들에 대한 이러한 신규 정보는 기본적인 생물학적 이해와 함께 가속화될 것이며 치료학적 중재를 위한 많은 새로운 표적들을 제공할 것이다. 일부 경우들에서, 분석 도구들은 새로운 데이타의 생성과 보조를 유지하지 못해왔다. 하나의 예가 전세계의 차등적인 유전자 발현의 측정시 최근 발전들에 의해 제공된다. 유전자 발현 미세배열들, 차감적 cDNA 클로닝 빈도들, 감법 하이브리드화(subtractive hybridization) 및 차등적인 디스플레이 방법들에 의해 대표되는 이들 방법들은 상이한 조직들에서 상향 또는 하향-조절되거나 특수 자극에 대한 반응시 유전자들을 매우 신속하게 확인할 수 있다. 점점, 이러한 방법들은 형질전환, 종양 진행, 염증성 반응, 신경학적 질환 등과 같은 생물학적 공정들을 탐색하는데 사용되고 있다. 현재, 제공된 생리학적 현상과 관련되는 차등적으로 발현된 유전자들의 긴 목록들을 매우 용이하게 생성할 수 있지만, 개개의 차등적으로 발현된 유전자와 현상들 사이의 원인 관계의 증명은 어렵다. 지금까지, 차등적으로 발현된 유전자들에 기능을 지정하는 단순한 방법들은 차등적인 유전자 발현을 모니터링하는 능력을 유지하지 못하고 있다.
통상의 분자적 시도들을 사용하여, 후보물 유전자의 과발현은 완전한 길이의 cDNA를 클로닝하고, 이를 포유동물 발현 벡터내로 아클로닝(subcloning)하며 재조합체 벡터를 적절한 숙주 세포내로 형질감염시킴으로써 달성할 수 있다. 이러한 시도는 간단히 용이하지만, 특히 초기 후보물 유전자가 단순히 발현된 서열 태그(EST)에 의해 나타나는 경우, 노동 집약적이다. "통상적인" 방법들에 의한 후보물 유전자의 발현하에서는 여전히 더 문제가 있다. 표적화된 리보자임들에 의지하는 방법들 및 안티센스 방법들은 선택된 표적들의 소 분획에만 신뢰가능하지 않게 성공하고 있다. 동종 재조합에 의한 유전자 녹아웃은 리콤비노게닉(recombinogenic) 줄기 세포들에서는 양호하게 잘 작업하지만 체세포 기원한 세포주들에서는 매우 비효율적이다. 어느 경우에서도 동계 게놈 DNA(10kb의 순서)의 거대한 클론들은 효율적으로 작업하기 위해 재조합에 대해 분리하여야 한다.
TALE-융합 기술들 사용하여 차등적인 유전자 발현 연구들을 신속하게 분석할 수 있다. 조작된 TALE 도메인 융합체들은 특정의 내인성 표적 유전자를 상향 또는 하향-조절하기 위해 용이하게 사용될 수 있다. 매우 적은 서열 정보가 유전자-특이적인 DNA 결합 도메인을 생성하는데 요구된다. 이는, TALE 도메인 융합체 기술이 불량하게 특성화된 차등적으로 발현된 유전자들의 긴 목록들의 분석에 이상적이 되도록 한다. 각각의 후보물 유전자에 대한 TALE-계 DNA-결합 도메인을 단순하게 제조하고, 키메라성 상향 및 하향-조절되는 인공 전사 인자들을 생성하고 모델 시스템내에서 한번에 1회 후보물 유전자들을 스위치 온(on) 또는 스위치 오프(off)함으로써 연구(형질전환, 사이토킨 등에 대한 반응)하에 표현형에 있어 상향 또는 하향-조절의 결과를 시험할 수 있다.
게놈 데이타에 기능성 정보를 첨가하기 위한 조작된 TALE 도메인 융합체를 사용하는 이러한 특수 예는 단지 예시적이다. 유전자 또는 유전자들의 특이적인 상향 또는 하향-조절로부터 유리할 수 있는 어떠한 실험 상황도 조작된 TALE-융합체들의 사용의 신뢰성 및 용이성으로부터 유리할 수 있었다.
또한, 보다 큰 실험적 조절이 보다 통상의 방법들에 의해 달성될 수 있는 TALE 도메인 융합체들에 의해 부여될 수 있다. 이는, 조작된 TALE-융합체들의 생산 및/또는 기능이 작은 분자 조절하에 위치할 수 있기 때문이다. 이러한 시도의 예들은 Tet-On 시스템, 엑다이손-조절된 시스템(ecdysone-regulated system) 및 돌연변이체 프로게스테론 수용체를 포함하는 키메라 인자들을 혼입하는 시스템에 의해 제공된다. 이들 시스템들은 모두 ZFP 조절인자의 기능 및/또는 발현을 소 분자 조절하에 위치시킴으로써 어떠한 목적한 내인성 유전자 또는 어떠한 삽입유전자에 소 분자 조절을 간접적으로 부여할 수 있다.
유전자삽입 유기체들
TALE-융합 기술의 추가의 적용은 유전자 발현을 조작하고/하거나 게놈을 변경시켜 유전자삽입성 동물들 또는 식물들을 생산하는 것이다. 세포주들을 사용하는 것과 같이, 내인성 유전자의 과-발현 또는 유전자삽입 마우스와 같은 유전자삽입 동물에 대한 이종 유전자의 도입은 상당히 간단한 공정이다. 유사하게, 유전자삽입 식물들의 생산은 잘 알려져 있다. 본원에 기술된 TALE 도메인 융합체 기술을 사용하여 유전자삽입 동물들 및 식물들을 용이하게 생성할 수 있다.
유전자 발현을 조작하기 위한 조작된 TALE 도메인 융합체들의 사용은 앞서의 단락에서 기술된 소 분자 조절된 시스템들을 사용하는 성체 동물들로 제한될 수 있다. TALE 도메인-계 억제인자의 발현 및/또는 기능은 발달 동안 스위치 오프될 수 있으며 성체 동물들에서 마음대로 스위치 온될 수 있다. 이러한 시도는 TALE-융합체 발현 모듈(module)만의 첨가에 의존하며; 동종 재조합은 요구되지 않는다. TALE 도메인 융합체 억제인자들은 트랜스 우성이므로, 배선 전파 또는 동형접합성에 대한 관심이 없다. 이들 쟁점들은 불량하게 특성화된 유전자 후보물(cDNA 또는 EST 클론)으로부터 마우스 모델로 이행하는데 요구되는 시간 및 노동에 현저히 영향을 미친다. 당해 능력은 치료학적 개입을 위한 유전자 표적들을 신속하게 확인하고/하거나 입증하고 복합체 생리학적 현상(발달, 조혈, 형질전환, 신경 기능 등)의 분석을 하용한다. 키메라 표적화된 마우스는 문헌[참조: Hogan et al., Manipulating the Mouse Embryo: A Laboratory Manual, (1988); Teratocarcinomas and Embryonic Stem Cells: A Practical Approach, Robertson, ed., (1987); and Capecchi et al., Science 244:1288 (1989)]에 따라 유도시킬 수 있다.
유전적으로 변형된 동물들은 TALE 융합체를 암호화하는 핵산을 세포 또는 배아로 전달함으로써 생성될 수 있다. 전형적으로, 배아는 수정된 하나의 세포 단계 배아이다. 핵산의 전달은 배아의 핵 또는 세포질내로 미세 주입을 포함하는 당해 분야에 공지된 방법들 중 어느 것에 의해 이루어질 수 있다. TALE 융합체를 암호화하는 핵산들은 목적하는 경우 공여체 핵산들과 함께 공-전달될 수 있다. 이후에, 배아들은 당해 분야에 공지된 바와 같이 배양하여 유전적으로 변형된 동물로 발달한다.
본 발명의 하나의 국면에서, 목적한 유전자 또는 유전자자리를 암호화하는 적어도 하나의 염색체 서열 또는 목적 유전자 자리가 수정된 유전적으로 변형된 동물들을 제공한다. 예를 들면, 수정된 유전자는 불활성화됨으로써 전사되지 않거나 적절히 해독되지 않도록 할 수 있다. 대안적으로, 서열을 수정하여 유전자의 대체형이 발현되도록 할 수 있다[예를 들면, 발현된 단백질내 하나 이상의 아미노산의 삽입(녹 인(knock in) 또는 결실(knock out)]. 또한, 목적 유전자는 조절 영역과 같은 삽입된 서열을 포함할 수 있다. 유전적으로 변형된 동물은 수정된 서열에 대해 동종접합성일 수 있거나 이종접합성일 수 있다. 일부 구현예들에서, 유전적으로 변형된 동물은 Rosa26, HPRT, CCR5 또는 AAVS1 (PPP1R12C) 유전자 자리와 같은 '안전한 자리(safe harbor)'내에 삽입된(녹 인) 서열을 가질 수 있다. 동물들에서 이러한 녹인은 다른 염색체 유전자 자리에서 추가로 수정될 수 있다. 일부 구현예들에서, 목적 서열들은 어떠한 선택 마커, 및/또는 프로모터없이 안전한 자리내로 삽입되므로 발현을 구동하기 위해 내인성 프로모터에 의존한다. 일부 국면들에서, 유전적으로 변형된 동물은 "사람화"됨으로써 숙주 종들 동물에 대해 특이적인 특정 유전자들이 사람 동족체로 대체되도록 할 수 있다. 이러한 방식으로, 유전적으로 변형된 동물들은 발현된 사람 유전자(예를 들면, 인자 IX)로 생산되어 사람 유전자, 단백질 또는 질병을 연구하기 위한 동물 모델 시스템의 발달을 허용한다. 일부 구현예들에서, 목적 유전자는 삽입된 목적 유전자(들)를 플랭킹할 수 있는, 인지체 리컴비나제 Cre 및 FLP 각각의 인지를 위한 loxP 또는 FRT와 같은 리컴비나제 인지 부위를 추가로 포함할 수 있다. 유전자들은 뉴클레아제 부위들을 함유하도록 삽입됨으로써 유전적으로 변형된 동물과 인지체 리컴비나제(예를 들면, Cre)를 발현하는 다른 유전적으로 변형된 동물의 교배가 삽입된 유전자를 결여한 후대가 생성되도록 할 수 있다.
적용들
기재된 방법들 및 조성물들은 바람직한 유전자 자리에서 유전자 조절을 제어하는데 사용될 수 있다. 선택한 유전자들은 TALE-반복체 도메인에 융합된 전사 조절 도메인에 따라, 활성화되거나 억제될 수 있다. TALE 활성인자는 분화된 세포들로부터 iPSC를 생산하는 목적을 위해 전분화능-유도 유전자들에 대해 표적화될 수 있다. 이는 특수 질병 상태들 및 iPSC로부터 기원한 세포 치료요법들을 개발하기 위한 시험관내 및 생체내 모델 개발을 위해 사용될 수 있다.
TALE-융합체들은 특히 뇌 또는 눈과 같은 면역 특별 조직에서 치료제들로서 자체로 유용할 수 있다. 예를 들어, 설계된 활성화제들은 적절한 기능(예를 들면, VEGF)에 대한, 또는 과발현되는 경우 독성인 유전자들에 대한 천연의 스플라이스 변이체 비들을 필요로 하는 유전자 생성물의 투여량을 증가시키는데 특히 유용하다. 설계된 TALE 조절인자들에 대한 일시적인 노출은 또한 후생적 변화들을 부여하는 기능적 도메인의 사용을 통해 유전자 발현 상태의 영구적인 스위칭(switching)을 허용할 수 있었다. 당해 기술은 줄기 세포들을 생성하고 이들의 분화 경로들을 제어하기 위한 추가의 용도를 제공할 수 있다. 또한, TALE-융합체들은 면역억제된 환자들에서 사용될 수 있다.
기재된 방법들 및 조성물들은 또한 특정 유전자 또는 유전자들의 게놈적 수정을 위해 사용될 수 있다. 특정 적용들에서, 방법들 및 조성물들은 게놈 서열들의 불활성화를 위해 사용될 수 있다. 지금까지, 절단-계 방법들을 사용하여 옥수수 및 쥐와 같은 경제적으로 중요한 종들을 포함하는, 이러한 능력들이 이미 이용불가능하였던 적어도 9개의 고등 진핵세포들의 게놈들에 대한 변형들을 표적화하였다. 다른 적용들에서, 방법들 및 조성물들은 수정되지 않은 유전자들 또는 사람화된 유전자들의 통합과 비교하여 상이한 발현 또는 생물학적 특성들을 지닌 유전자들의 신규한 대립유전자 형태들의 생성을 포함하는 무작위 돌연변이들의 생성을 허용하며, 이는 결국 세포 또는 동물 모델들의 생성을 허용한다. 다른 적용들에서, 방법들 및 조성물들은 이들 유전자들의 신규한 대립형질 형태들을 수반하는 동물들을 확인하거나 선택하도록 하는 유전자들의 정의된 위치들에서 무작위적 돌연변이들을 생성하는데 사용될 수 있다. 다른 적용들에서, 방법들 및 조성물들은 외인성(공여체) 서열을 게놈의 어떠한 선택된 부위내로의 표적화된 통합을 허용한다. 조절 서열들(예를 들면, 프로모터들)은 목적 부위에 표적화된 양식으로 통합될 수 있었다. "통합"은 물리적 삽입(예를 들면, 숙주 세포의 게놈내로) 및, 또한, 공여체 서열의 동족체-지시된 DNA 복구 동안 발생하는 특수화된 핵산 정보 교환 공정을 통해 숙주 세포 게놈내로의 카피에 의한 통합 둘다를 의미한다.
공여체 서열들은 또한 shRNAs, miRNAs 등과 같은 핵산들을 포함할 수 있다. 이들 소 핵산 공여체들은 게놈내 목적 유전자들에 있어서 이들의 효과들을 연구하는데 사용될 수 있다. 동물 유전자의 게놈성 수정(genomic editing)(예를 들면, 불활성화, 통합 및/또는 표적화되거나 무작위적인 돌연변이)은 예를 들면, 단일 절단 현상에 의해, 절단에 이은 비-동종 말단 결합에 의해, 절단에 이은 동족체-지시된 복구 메카니즘들에 의해, 절단에 이은 공여체 서열의 물리적 통합에 의해, 2개 부위에서 절단에 이은 2개의 절단 부위들 사이의 서열을 결실시키기 위한 결합에 의해, 미스센스(missense) 또는 논센스(nonsense) 코돈의 암호화 영역내로의 표적화된 재조합에 의해, 유전자 또는 조절 영역을 파괴하기 위한 비관련 서열[즉, "스투퍼(stuffer)" 서열]의 유전자 또는 이의 조절 영역내로의 표적화된 재조합에 의해, 전사체의 미스-스플라이싱(mis-splicing)을 유발하기 위한 스플라이스 수용체 서열의 인트론내로의 표적화 재조합에 의해 달성될 수 있다. 일부 적용들에서, 목적한 삽입유전자들은 명시된 위치에서 TALEN-유도된 DSB를 사용하여 포유동물 또는 식물 게놈내의 안전한 하버 유전자자리내로 통합될 수 있다(참조: 미국 특허 공보 20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20060063231; 및 국제 공보 WO 07/014275, 이의 기재내용들은 모든 목적을 위해 이들의 전문이 참조로 혼입된다). 이들 TALEN들은 표적화된 유전적 조작을 위한 키트(kit)들의 성분으로서 공급될 수 있다.
임의로 신규한 또는 비정형의 RVDs를 지니고, 또한 N-캡 및/또는 C-캡 잔기들에 임의로 부착된 TALE-반복체 도메인들을 또한 리컴비나제들, 트랜스포사제들, 레졸바제들 또는 인테그라제들과 같은 DNA 조작 효소들에 융합시킬 수 있다. 따라서, 이들 도메인을 사용하여 표적화된 트랜스포존(transposon) 등과 같은 치료제들 및/또는 도구들의 개발을 허용할 수 있다. 또한, N-캡 및/또는 C-캡 잔기들에 임의로 부착된 TALE-반복체 도메인은 뉴클레아제 도메인에 융합되어 설계자 제한 효소를 만들 수 있다. 예를 들면, N-캡 및/또는 C-캡 잔기들에 임의로 부착된 TALE-반복체 도메인은 일본쇄 FokI 도메인(여기서, 2개의 FokI 절단 반 도메인은 선택한 링커를 사용하여 함께 결합된다)에 융합됨으로써 뉴클레아제 융합체를 지닌 DNA 제제의 처리가 목적하는 위치에서 정확하게 절단이 일어날 수 있게 할수 있다. 당해 기술은 표준 제한 효소들을 사용하여 용이하게 시도되지 않는 DNA 서열의 클로닝 및 조작을 위해 유용할 수 있다. 이러한 시스템은 또한 제조에 사용된 특수화된 세포 시스템들에 유용할 수 있다. 예를 들면, CHO-기원한 세포주들은 내인성으로 활성인 트랜스포사제/인테그라제 시스템을 가지지 않는다. TALE-트랜스포사제/인테그라제 시스템은 CHO 세포내에서 특수 표적화를 위해 개발될 수 있으며 TALE DNA 결합 도메인의 고도의 특수한 특성으로 인해 게놈 수정 등에서 녹 아웃/녹 인에 유용할 수 있다.
TALE-융합체 단백질은 제공된 유전자자리에 대한 특수한 DNA-결합 단백질의 결합을 예방하는데 사용될 수 있다. 예를 들면, 천연의 조절 단백질은, 조작된 TALE 단백질이 숙주 세포내에서 발현되고 이것이 DNA 상의 위치를 점유함으로써 조절 단백질에 의한 조절을 예방하므로 단순히 프로모터내에서 이의 천연 표적에 대한 결합으로부터 차단될 수 있다.
TALE-융합체 단백질은 RNA에 결합하도록 가공될 수 있다. 예를 들면, 이러한 방식으로, 스플라이스 공여체 및/또는 스플라이스 수용체 부위들은 차폐되고 mRNA내에서 특수 위치들에서 스플라이싱을 예방할 수 있다. 다른 국면에서, TALE은 예를 들면, shRNA, miRNA 또는 RNAi와 같은 특수한 기능적 RNA들에 결합할 수 있다.
TALE 융합 단백질은 진단에 유용할 수 있다. 예를 들면, 단백질을 게놈내에서 특정의 서열을 인지하도록 가공됨으로써 특수 질병과 관련된 것으로 공지된 대립형질을 확인할 수 있다. 예를 들면, 구체적인 수의 TALE 반복체 단위들을 지닌 TALE-융합체들은 "야드 스틱(yard stick)" 종류로서 사용되어 트리뉴클레오타이드 반복체 질환(예를 들면, 헌팅톤병)을 가질 가능성이 있는 환자들에서 다수의 트리뉴클레오타이드 반복체들을 측정함으로써 이들 질병들 중 하나로 고생할 경향성을 측정하거나 당해 증상들의 중증도를 예후할 수 있다. 이들 양식의 단백질들은 또한 진단 키트들의 성분으로 공급됨으로써 목적한 유전 마커들이 신속히 확인되도록 한다. 또한, 이들 단백질은 세포들로부터 정제되어 목적 유전자의 대립형질 유형을 분석하고, mRNA 발현 수준들을 측정하는 등과 같은 용도들에 대해 진단 시약들용으로 또는 진단 키트들 속에서 사용될 수 있다. TALE 융합체들은 다채널 또는 미세유동 분석(microfluidic ananysis)들용 규소 칩들 또는 비드들에 부착될 수 있다.
TALE 융합체들은 세팅들을 제조하는에 유용할 수 있다. TALE-전사 인자 융합체들 또는 TALEN들은 목적한 세포주(예를 들면, CHO 세포)들 또는 조류(예를 들면, 생물연료 생산)에서 사용될 수 있다.
TALE 융합체 단백질 매개된 유전자 또는 게놈 유전자자리의 게놈성 수정을 위한 다수의 적용들이 존재한다. 본원에 기술된 방법들 및 조성물들은 사람 질병들의 모델들의 생성 및 목적하는 특성들을 가진 식물 작물들의 생성을 허용한다.
본 명세서에서 인용된 모든 공보들 및 특허원들은, 개개의 공보 또는 특허원 각각이 참조로 혼입되도록 구체적으로 및 개별적으로 나타난 경우와 같이 참조로 본원에 혼입된다.
앞서의 발명이 이해의 명확성을 목적으로 하여 설명 및 예의 방법으로 일부 상세하게 기술되어 있지만, 본 발명의 교시 내용들의 측면에서 특정의 변화들 및 변형들이 첨부된 특허청구범위의 취지 또는 영역으로부터 벗어남이 없이 이에 대해 이루어질 수 있음이 당해 분야에서 통상의 지식을 가진 자에게 용이하게 명백할 것이다.
실시예
실시예 1: 크산토모나스 악소노포디스로부터 천연 TALE의 클로닝
초기 설계 골격으로서 제공될 수 있는 천연의 TALE 단백질을 확인하기 위하여, 둘다 고도의 특이성 및 또한 포유동물 세포내에서 결합하는 표적 서열의 증거를 나타낸 표준 TALE 및 천연 TALE을 확인하였다. 상세하게는, 12.5 TALE 반복체들(12개의 완전한 반복체들 및 TALE 13으로 언급된 반 반복)을 함유하는 TALE-단백질을 다음 프라이머 쌍을 사용하여 PCR 증폭에 의해 크산토모나스 악소노포디스로부터 클로닝하였다:
pthA_d152N_EcoR, ACGTGGATTCATGGTGGATCTACGCACGCTC (SEQ ID NO:52) 및
pthA_Sac2_Rev, TACGTCCGCGGTCCTGAGGCAATAGCTCCATCA (SEQ ID NO:53). 프라이머 쌍을 초기에 설계하여 N-말단 152개 아미노산 트렁케니션(절단)을 지닌 AvrBs3 유전자를 증폭시켰다. 당해 서열들은 식물 세포들 내로의 수송을 위해 필수적이지만, 한편 기능을 위해 불필요한 것으로 이미 밝혀져 있다[참조: Szurek et al (2002) Mol. Micro 46(1) p. 13-23]. 다수의 중심 탄뎀 반복체(tandem repeat)들의 변형을 지닌 고도로 보존된 서열에 의해 특징화된, 수개의 TALE 단백질들을 이들 프라이머 쌍들을 사용하여 PCR로 분리하였다. hssB3.0으로 보고된[참조: Shiotani et al (2007) J. Bacteriol 189 (8): 3271-9] TALE15를 제외하고, 분리된 다른 TALE 단백질들은 공공의 문헌에서 보고되지 않았기 때문에, 신규 단백질들로 여겨진다. 이들은 각각 13, 9, 및 16개 TALE 반복체들을 갖는 TALE13, TALE9, 및 TALE16을 포함한다.
TALE13(추론된 N-캡의 길이를 갖는)의 도메인 맵은 도 1a에 나타내며 단백질이 상호작용하는 DNA 서열을 측정하는 아미노산들 및 도메인들을 나타내는 서열은 당해 작업에서 사용된 위치 번호매김 시스템의 지시인자들과 함께 도 1b에 나타낸다.
실시예 2: TALE13 및 다른 TALE들의 절단 및 DNA 결합에 있어서의 효과들
최대 활성을 제공하는 캡핑 서열들의 범위의 초기 조사로서, TALE의 수개의 절단들을 제조하였다. 당해 절단들은 표 4에서 하기 나타낸다.
[표 4]
TALE
절단 특성들
주: (+)은 영역의 존재를 나타내는 반면 (-)는 이의 부재를 나타낸다.
절단들의 영역들은 다음과 같이 번호매김한다: N-말단에서, 종점(end point)은 처음의 실제 TALE 반복체의 제1 염기로부터 N-말단 방향으로 아미노산 잔기들의 수를 열거하는 번호에 의해 나타낸다(참조: 도 1b). 예를 들면, N+91의 표지는 제1의 실제 반복체의 N-말단으로부터 N-말단 방향으로 완전한 91개 아미노산들을 남기는 N-말단에서의 절단을 기술한다. C-말단에서, 종점은 마지막 완전한 TALE 반복체의 마지막 아미노산으로부터 C-말단 방향으로 아미노산들의 번호로 나타낸다. TALE-13, 클론 #1로 명명된 절단 #1은 제거된 완전한 길이의 TALE 단백질의 N-말단 152개 아미노산 및 수득되는 N 말단에 첨가된 단일의 메티오닌 잔기를 가짐으로써 N+137 종점((N-캡)을 가져서, 당해 클론의 길이가 대략 2.5kb가 되도록 한다. 또한, 절단 #2는 제거된 완전한 길이의 TALE 단백질의 N-말단 152개 아미노산 및, 수득되는 N-말단에 첨가된 단일의 메티오닌 잔기를 갖고, 따라서 N+137 종점, 및 또한 NLS의 5' 가장자리(edge)의 하부로 C-말단 서열을 가져서, 당해 클론이, 길이가 대략 2.0kb가 되도록 한다. 절단 #3은 루이신이 풍부한 영역(루이신이 풍부한 영역은 반-반복체에 대해 C-말단에 존재하며 C-캡의 C +52까지 연장된다)을 결실함으로써, 당해 클론이 길이가 대략 1.6kb가 됨을 제외하고는 클론 #2와 유사하다. 절단 #4는 N-말단에서, 모두 결실되어 있고 R0 반복체 서열을 포함함으로써 당해 클론이 길이가 대략 1.6kb가 됨을 제외하고는 클론 #2와 유사하다. 절단 #5는, C-말단 측면에서 이의 결실이 루이신이 풍부한 서열을 포함(클론 #2와 유사)함으로써, 당해 클론이, 길이가 대략 1.4kb가 됨을 제외하고는 클론 #4와 유사하다. 완전한 길이의 TALE 13 단백질의 추론된 표적 서열은, 당해 단백질에 대해 확인된 내인성 표적 부위가 아직 존재하지 않는다고 해도, TATAAATACCTTCT (SEQ ID NO:54)이다. 절단 #6은, 43개의 추가의 아미노산들이 결실된 것을 제외하고는, N-말단들로부터 152개 아미노산들이 결실되고 C-말단 영역들에서 클론 #2와 유사하다. 절단 #7은 N-말단으로부터 165개 아미노산들을 결실하며 클론 #6과 동일한 C-말단 결실을 갖는다. 절단 #6 및 #7은 하기 논의되어 있다.
표준 SELEX 검정을 트렁케이트된 TALE 단백질들에서 수행하여 이들 단백질이 결합된 DNA 서열을 확인하고[SELEX 방법에 대해서는, Perez, E. E. et al. Nature Biotech. 26, 808-816 (2008) 참조], 그 결과들을 표 5 및 6에 나타낸다. 표 5에 나타낸 실험은 표적 라이브러리 N18TA를 사용하여 수행하였다. N18TA 라이브러리는 하기 서열을 갖는 DNA 중복체(duplex)를 포함한다.
N18TA:
5'CAGGGATCCATGCACTGTACGTTTNNNNNNNNNNNNNNNNNNAAACCACTTGACTGCGGATCCTGG 3'(SEQ ID NO:55), 여기서 N은 모든 4개 염기들의 혼합물을 나타낸다. 추가의 라이브러리들(나타낸 바와 같음)은 다음 서열들을 포함한다:
데이타는 하기 표 5에 염기 빈도 매트릭스(base frequency matrix)로서 나타낸다. 이들 매트릭스들의 각각의 위치에서, 박스는 예측된 RVD 표적 염기를 나타내고, 숫자들은 각각의 회수된 염기 유형의 상대적 빈도를 나타내고, 여기서 1.0은 100%를 나타낸다.
[표 5]
TALE 13, 클론 #1을 사용한 SELEX 결과들
TALE 13 클론 #1 단백질은 N-말단 152개 아미노산들을 결여함에도 불구하고 이의 결합에 있어서 고도로 선택적인 것으로 여겨진다. TALE 13, 클론 #2에 대한 SELEX 데이타는 표 6에 나타낸다. 당해 표에서, SELEX는 표적 서열들의 2개의 상이한 라이브러리들과 함께 반복되었으며 라이브러리들 둘 다로 유사한 결과들을 수득하였다.
[표 6]
TALE 13, 클론 #2를 사용한 SELEX 결과들
클론 #3, 4 및 5를 SELEX 과정에 적용시키는 경우, 컨센수스 서열들은 검출되지 않았다. 따라서, TALE 결합 도메인들은 클론 #2로부터 구성된 N- 및 C-말단 cap 서열들을 필요로 함으로써 당해 검정에서 컨센수스 서열을 수득하는 것으로 여겨진다. 추가의 절단들을 제조하고 필수적으로 문헌(참조: Bartsevich et al., Stem Cells. 2003; 21:632-7)에 기술된 바와 같이 DNA 결합 ELISA 검정을 사용하여 활성에 대해 시험하였다. 절단들은 하기 표 7에 나타내며, 당해 표는 또한 ELISA 결과들을 포함한다. 당해 절단들에서 출발하는 N-말단은 위에서 논의한 #1, #2, 및 #3 절단들에서 N-말단과 동일하게, 152번 아미노산에 존재한다. 당해 일련의 미세한-규모(fine-scale) 절단에서, 종점들은 다음과 같다.
[표 7]
TALE13의 우수한 절단들에서 ELISA 결과들
이들 데이타는, 당해 시험관내 검정에서 효율적인 TALE 결합이 N+122와 N+137 사이 및 또한 C+53과 C+95 사이의 잔기들을 필요로 함을 제안한다(N121 이하 및 이를 포함하는 N-캡 잔기들은 강력한 결합에 충분하지 않았으며 C+52 이하 및 이를 포함하는 C-캡 잔기들은 강력한 결합에 충분하지 않았다).
예비 맵핑 연구는 최적 결합 활성을 달성하기 위해 크산토모나스 TALE의 최소 N-캡 및 C-캡 서열들의 평가를 허용한다. N-말단 cap의 경우, 제1의 실제 반복체로 개시하기 전에 N+122과 N+137 아미노산들 사이의 아미노산들의 일부를 포함하는 서열은 DNA 결합 활성에 요구되는 것으로 여겨진다. 랄스토니아(Ralstonia) cap에 대한 유사한 cap 예들은 크산토모나스 TALE들에 대한 구조적 상동성을 기본으로 제조될 수 있다(하기 표 8 참조). C-말단 cap들에서, 굵은 아미노산들은 RVD들을 나타낸다.
[표 8]
Cqp
예들
실시예 3: 천연의 TALE 단백질들 9 및 16에 대한 결합 특이성
2개의 추가의 천연 TALE 단백질들을 SELEX 과정에 적용시켜 이들 단백질이 결합하는 표적 DNA 서열들을 확인하였다. TALE 9는 다음 DNA 표적을 규정하는 8.5 TALE 반복체들을 갖고: TANAAACCTT (SEQ ID NO:56), 한편, TALE16는 다음 표적을 예측하는 15.5 TALE 반복체들을 갖는다: TACACATCTTTAACACT (SEQ ID NO:57). 당해 데이타는 표 9 및 10에 나타낸다. 표 9에서는, 클론 #2 구조들에서 TALE 9 단백질을 사용하여 결과들을 나타낸다. TALE 13 클론 #2를 사용하는 경우와 같이, 당해 실험을 제2의 부분적으로 무작위처리된 DNA 라이브러리를 사용하여 반복하여 제1 라이브러리와 유사한 데이타를 제공하였다. TALE 13에 대해 위에서 기술한 바와 같이, TALE 9는 이의 표적 서열에 대해 고도로 특이적이다.
[표 9]
TALE 9, 클론 #2을 사용한 SELEX 결과들
표 10은 N18TA 라이브러리를 지닌 TALE 16 단백질에 대한 SELEX 데이타를 나타내며 다시 확인된 표적에 대한 고도의 서열 특이성을 입증한다.
[표 10]
TALE 16, 클론 #2을 사용한 SELEX 결과들
추가의 절단들을 TALE 단백질들에서 수행하여 효율적인 DNA 결합에 대한 조건들에 대해 추가로 조사하였다. 상기 표 4는 이들 절단들을 나타낸다. TALE 9를 클론 #6 절단에서 시험하는 경우(표 11), DNA 결합 특이성이 유지되었다(표 11을 표 9와 비교).
[표 11]
TALE 9, 클론 #6을 사용한 SELEX 결과들
실시예
4: 포유동물 세포들에서
TALE
-융합 단백질들에 의한 리포터 유전자 활성화
포유동물 세포들 내에서 TALE 도메인 융합체들의 기능적 활성을 조사하기 위하여, 조작된 리포터 제작물들을 다음과 같이 제조하였다. 클로닝된 TALE 13 또는 TALE 15에 대한 표적 서열의 하나 이상의 카피들을 NheI과 Bgl II 부위들 사이에 리포터 제작물내에 삽입함으로써 표적들이 pGL3 플라스미드(Promega)내에서 최소 SV40 프로모터에 의해 구동된 개똥벌레 루시퍼라제 발현 단위로부터 상부에 위치하도록 한다(참조: 도 2). pGL3 플라스미드의 프로모터 영역을 도 2a에 나타내고 TALE13에 대한 2개의 예측된 표적 부위들을 도 2b에 나타낸다. 도 3에 나타낸 실험에서, TALE 단백질 제작물은, 2개의 표적을 함유하는 리포터 플라스미드(도 3a), 및 내부 대조군으로서 레닐라(Renilla) 루시퍼라제(Promega)를 함유하는 발현 제작물과 함께, 사람 293 세포내로 공-형질감염시켰다. 다음에, 각각의 TALE 단백질에 의해 유도된 개똥벌레 루시퍼라제 활성을 형질감염 후 2일째에 분석하였다. 다수의 표적들에 대한 반응시, TALE VP16 융합체들은 포유동물 세포들 내에서 리포터 유전자 발현을 상승적으로 활성화시킬 수 있다(도 3). 또한, 도 4b에 나타낸 바와 같이, VP16 활성화 도메인(TR13-VP16 및 TR15-VP16)이 첨가된 TALE 단백질들은 루시퍼라제 리포터 유전자를 활성화시킨다. VP16 도메인이 없는 천연의 TALE 단백질의 발현은 루시퍼라제(TR13 및 TR15)를 활성화시키지 않는다. 따라서, 리포터 유전자 활성화는, 정확한 표적들이 이들의 상응하는 TALE 융합체와 일치하는 경우에만 관찰되며, 이는, 전사 활성화가 표적화된 DNA 결합으로부터 생성됨을 제안한다.
다음에, TALE 표적 서열들을 표적화된 프로모터에 대하여 먼 위치 및 근접한 위치에 삽입하였다. 당해 실험에서, TALE13 표적을 도 5a에 나타낸 바와 같이 사용하였으며, 여기서 4개의 표적 서열들이 프로모터의 상부(예를 들면, "R13x4") 또는 하부("R13x4D")에 삽입되었다. 도 5b에 나타낸 결과들은, 최적의 활성화가, TALE13 결합 부위가 목적 프로모터에 가장 근접하게 상부로 위치하는 경우에 관측됨을 입증한다.
실시예 5: 인공의 TALE 전사 인자의 제작
TALE 단백질이 전사 조절 도메인에 연결되어 포유동물 세포내에서 리포터 유전자 발현을 조절할 수 있는지를 입증하기 위하여, 바람직한 표적 특이성을 가진 TALE 전사 인자를 가공하기 위한 실험들을 수행하였다. TR13 VP16의 사일런트 돌연변이(즉, 아미노산 서열이 변경되지 않은 뉴클레오타이드내 변화)를 도입시켜 처음의 탄뎀 반복체의 개시부 및 마지막 탄뎀 반복체의 말단 각각에서 2개의 유일한 제한 부위들, ApaI 및 HpaI를 생성하였다. 이후에, 이들 ApaI 및 HpaI 부위를 TR13 VP16 골격내로 합성 탄뎀 반복체를 클로닝하는데 사용하여 탄뎀 반복체를 플랭킹하는 완전한 N- 및 C-말단 서열들, 및 VP16 활성화 도메인을 가진 조작된 TALE를 생성하였다.
표적화된 서열은 NT3 프로모터 서열내에 위치하는 GGAGCCATCTGGCCGGGT (SEQ ID NO:58)이었다. 앞서, 당해 서열에 대해 표적화하는 ZFP TF 23570은 내인성 NTF3 유전자 발현을 활성화시키는 것으로 밝혀졌다(참조: 공동-소유의 미국 가특허원 61/206,770). TALE AvrBs3으로부터의 17.5 탄뎀 반복체를 골격으로 사용하여 TALE18(또한 "NT-L"로 명명됨)을 가공하여, 조작된 TALE18 아미노산 서열들의 탄뎀 반복체들이 변경되어 의도한 표적 뉴클레오타이드를 규정하도록 하였다. 조작된 TALE18로부터 DNA-결합 도메인의 아미노산 서열을 하기 표 12에 나타내며, 여기서 RVD들은 굵은 활자체로 박스 안에 나타낸다.
[표 12]
조작된
TALE18
(
NT
-L)의
DNA
-결합 도메인
앞서 조작된 노력들에서 사용된 4개의 RVD들(표적 A, C, G 및 T 각각에 대해 NI, HD, NN, 및 NG) 외에, 본 발명자들은 또한 이것이 2개의 천연적으로 존재하는 단백질들에서 인지체 표적 부위 구아닌을 사용하여 관찰되었으므로, DNA 표적 부위내에서 G 뉴클레오타이드들에 상응하는 위치들에서 TALE 반복체들의 소세트내에 NK RVD를 혼입시켰다(참조: Moscou et al, ibid). 앞서의 실험 연구들과 일치하여(참조: Boch et al, ibid), 본 발명자들은, 평균적으로 NI, HD, NG가 아데닌, 사이토신, 및 티민 각각에 대한 강력한 선호도를 나타내었으며 NN은 구아닌에 대한 선호도를 나타낸 반면, 또한 아데닌에 결합할 수 있음을 발견하였다. 대조적으로, NK RVD는 구아닌에 대해 강력한 선호도를 나타내며, 이는, 적어도 하나의 구아닌을 포함하는 부위들을 표적화하는 조작된 TALE 단백질들에 대한 잠재적인 개선을 나타낸다.
이후에, 조작된 TALE18의 17.5 탄뎀 반복체들을 암호화하는 DNA 서열을 아미노산 서열로부터 유도하여, 다음과 같이, 길이가 약 40개 뉴클레오타이드들인 84개의 오버랩핑 올리고들에 의해 합성하였다. 우선, 전체 1.8kb DNA 서열들을 11개 블럭들로 나누고, 각각의 블록을 포함하는 오버랩된 올리고들을 PCR-계 방법으로 조립하였으며; 이후에 11개의 블록들을 함께 오버랩핑 PCR에 의해 4개의 보다 큰 블록들로 융합시키고, 4개 블록들은 최외곽 프라이머 쌍들을 사용하여 오버랩핑 PCR에 의해 완전한 길이로 조립하였다. 이후에, 합성된 탄뎀 반복체들을 확인하여 위에서 기술한 바와 같이, TR13-VP16의 ApaI 및 HpaI 부위들내로 클로닝하여 NT-3 프로모터(R23570V)에 표적화하는 조작된 TALE18(NT-L)의 발현 제작물을 생성하였다.
이후에, 당해 조작된 단백질(NT-L로 명명됨)의 특이성을 SELEX로 측정하여, 결과들을 하기 표 13에 나타낸다. 알 수 있는 바와 같이, 데이타는, 전체 신규 TALE 단백질을 가공하여 목적한 서열과 결합시키는 것이 가능함을 입증한다. SELEX 선택을 또한 표 13에서 하기 나타낸 바와 같이 클론 #6 절단(상기 참조) 내에서 NT-L을 사용하여 수행하였으며, 하기 TALE 9와 유사하게, NT-L의 특이성이 당해 절단내에서 유지됨을 입증하였다. SELEX 실험은, DNA 결합 특이성이 유지됨이 입증된 클론 #7 절단내에서 NT-L로 수행하였다.
[표 13]
NT-L, 클론 #2, #6, 및 #7을 사용한 SELEX 결과들
이후에, 조작된 NT-L 단백질들의 전사 활성을 표적 서열의 2개 카피들을 함유하는 루시퍼라제 리포터 제작물에 대해 분석하였다. 하기 표 14 및 도 6a에서 나타낸 바와 같이, 조작된 17.5 탄뎀 반복체들을 함유하지만, 기타의 경우 TR13-VP16과 동일한 조작된 NT-L 융합 단백질(R23570V)은 강력한 리포터 유전자 활성화를 구동시킬 수 있는 반면, 탄뎀 반복체들(R0-VP16)이 없는 유사한 제작물은 루시퍼라제를 활성화시키지 않는다. 완전한 길이의 탄뎀 반복체들(N-캡 및 C-캡)을 플랭킹하고 있는 TALE 서열들은, 반복체들(각각 nR23570S-dNC 및 nR23570S-dNC)를 플랭킹하는 N-말단 또는 C-말단 서열의 결실은 전사 활성을 폐지하므로 리포터 유전자 활성화를 필요로 한다. nR23570S-dNC로 명명된 제작물은 SV40 핵 국재화 시그날(n)을 함유하였으며 조작된 NT-L 반복체(R23570)은 단일의 p65 활성화 도메인(S)에 융합되었다. 당해 제작물은 반복체들만을 함유하였으나 TALE(dNC)로부터의 N-말단 또는 C-말단 서열은 함유하지 않았다. 제작된 nR23570SS-dNC는 2개의 p65 활성화 도메인들을 가졌다는 것을 제외하고는 nR23570S-dNC에 대해 기술된 것과 동일하였다.
표 14로부터 알수 있는 바와 같이, 리포터의 최고 수준의 활성화는 R23570V 제작물을 사용하여 발견되었다. NT-L 반복체들은 N-말단 및 C-말단 캡핑 영역들의 부재하에서 사용된 경우, 배경을 초과하는 활성화가 당해 검정에서 관측되지 않았음(모형(mock)에 대해 nR23570S-dNC를 비교)에 주목한다.
[표 14]
NT-L 융합체의 리포터 활성화
다음에, 제작물들을 사용하여, 조작된 융합 단백질이 포유동물 세포에서 이의 염색체 유전자자리내 내인성 유전자를 활성화시킬 수 있는지를 알아보기 위해 내인성 NTF3 유전자를 표적화하였다. 도 6b의 실험에서, 조작된 NT-L (R23570V), 및 대조군 제작물들(R0-VP16, GFP)을 사람 293 세포들에 일시적으로 형질감염시켰다. 형질감염 2일 후에, NT-3 발현 수준을 태크만 분석(Taqman analysis)으로 분석하였다. 도 6b에 나타낸 바와 같이, 조작된 NT-L(R23570V)의 발현은 사람 293 세포들내에서 NTF3 mRNA 발현의 실질적인 증가를 가져온 반면, 대조군 단백질들(R0-VP16 또는 GFP)의 발현은 NTF3 발현 수준에 영향을 미치지 않았다. 이는, 최초로 특이적으로 조작된 TALE 도메인 융합 단백질이 포유동물 세포내에서 사용되어 내인성 유전자의 발현을 활성화시킨 것이다.
추가의 예시적인 제작물을 제조하여 TALE 반복체 도메인을 플랭킹하는 C-말단 영역들의 모든 278개 잔기들이 활성에 필요한지를 측정하였다. 당해 추가의 제작물(+95)은 TALE 반복체 도메인과 VP16 활성화 도메인(예를 들면, C +95 C-캡) 사이의 C-말단 영역의 처음 95개 잔기들만을 함유하였다. 도 7은, 이들 2개의 제작물들(+278 제작물은 도 6에서 R23570V로 언급되었다) 및 mRNA 및 단백질 수준들에서 NTF3 활성화시 이들 단백질들의 효과의 도식을 나타낸다. 또한 보다 긴 이들 제작물들(+278 C-말단(또는 완전한 길이)의 도메인 함유)에 대한 SELEX 결과들을 나타낸다. 당해 도에서 알 수 있는 바와 같이, TALE 전사 인자 제작물들 둘다는 mRNA 및 단백질 수준들 둘다에서 NTF3 발현을 상향-조절할 수 있다.
VEGF, CCR5 및 PEDF 유전자내 영역들에서 결합에 대해 특이적인 제작물들을 또한 생성하였다. 위에서 기술한 바와 같이, 반복체 도메인들을 가공하여 상기 기술된 방법에 의해 이들 표적들에 결합시켰다. 이들 단백질들에 대한 표적 부위들은 실시예 7에서 하기 나타낸다. 단백질들은 10-반복체 또는 18-반복체 DNA 결합 도메인들을 함유하였다.
또한, 일련의 절단들을 9.5 반복체 NTF3-특이적인 및 9.5 반복체 VEGF-특이적인 TALE DNA 결합 도메인들에서 제조하였다. 절단들은 TNT 커플링된 망상적혈구 분해물 시스템(Coupled Reticulocyte Lysate system)(제조원: Promega)내에서 발현시키고 분해물을 사용하여 다음과 같이 DNA 단편들에 결합시켰다. 단백질은 250 나노그람의 뉴클레아제 융합 클론 플라스미드를 함유하는 5μL의 물을 20μL의 분해물에 가하고 30℃에서 90분 동안 항온처리하여 발현시켰다. 결합 검정들은 위에서 기술한 바와 같이 수행하였다. 표준 기술을 사용한 웨스턴 블롯들은, 발현된 단백질들이 모두 동등하게 발현되었음을 입증하였다. 결합 검정들의 결과들은 표 8에 나타낸다. 당해 실험들에서, N-말단의 절단들의 경우, C-말단 아미노산을 C+95에서 유지시킨 반면, C-말단 절단들의 경우, N-말단을 N+137 구조로 유지시켰다. 도면으로부터 알 수 있는 바와 같이, 최대 결합은, 단백질들이 제1의 실제 반복체의 N-말단 측면에서 적어도 134개의 아미노산, 및 반 반복체의 C-말단 측면에서 적어도 54개의 아미노산들을 함유한 경우 관찰되었으며, 흥미롭게도, 이는 NTF3 서열에 대해 표적화된 TALE DNA 결합 도메인 및 VEGF 서열에 대해 표적화된 TALE DNA 결합 도메인 둘다의 경우 사실이었다(패널 A 및 B를 비교함). 중요한 134번 N-말단 위치 주변에서 절단들은, C-말단이 +54(위에서 기술한 바와 같은 C+95보다는 오히려)에 절단된 단백질을 사용하여 반복하고 C-말단 절단들은, N-말단이 +134 위치(N+137보다는 오히려)에 대해 절단된 경우 반복하였다. 데이타는 도 9에 나타내며 앞서의 실험에서 관찰된 바와 같이, C 말단이 +54 이후에 트렁케이트되고/되거나 N 말단이 +134 이후에 트렁케이트된 경우 DNA 결합에 있어서 유사한 드롭-오프(drop-off)를 나타낸다. 이들 데이타는, 당해 시험관내 친화성 검정에서 최적의 결합에 대한 최소의 cap들이 N+134 및 C+54 위치에서 연장되었음을 나타낸다.
실시예 6: 포유동물 세포들에서 DNA 표적화에 관여하는 TALE 기능성 도메인들의 해부
당해 실험에서, 하기 표 15에 나타낸 바와 같이, TALE13 단백질들의 N-말단 또는 C-말단에서 각종 결실들을 생성시켰다.
[표 15]
TALE 13 결실 제작물들
모든 제작물들은 VP16 활성화 도메인(VP 16을 지닌 제작물들은 "R13V"으로 지정하였다) 및 핵 국재화 시그날(NLS를 지닌 제작물들은 "nR13"으로 지정하였다)에 연결시키고 예측된 TALE13 표적들의 2개 카피들을 함유하는 리포터 제작물로부터의 리포터 유전자 활성화에 대해 시험하였다(도 10, 상부 패널).
도 10에 나타낸 바와 같이, 당해 제작물들 세트에서 강력한 리포터 활성화 활성을 보유하는 최소 영역(참조: 표 15)는 R13V-d182C이며, 이는 이의 N-말단에서 152개 아미노산들 및 이의 C-말단에서 183개 아미노산들을 결여하고 있다. 이들 결과들은, 제1의 탄뎀 반복체들과 루이신이 풍부한 영역 앞에 있고 마지막 반복체가 이어서 오는 R0 영역이 당해 검정에서 최적의 결합을 제공한 반면, 이의 C-말단에서 핵 국제화 시그날, 및 천연의 활성화 도메인을 함유하는 영역이 포유동물 세포들에서 DNA-표적화에 불필요함을 입증한다.
실시예 7: 뉴클레아제 도메인들에 연결된 TALE의 뉴클레아제 절단 활성의 입증
다음에, 인공의 TALE 뉴클레아제들(TALENs)과 관련하여 TALE들의 DNA 표적화 능력을 평가하였다. 실시예 6에서 정의된 바와 같은 TALE13의 DNA 표적화 도메인을 뉴클레아제 도메인들에 연결시켜 R13d182C-scFokI로 명명된 제작물을 생성하였으며, 이는 FokI 도메인들 사이에 GGGS 서열의 12개 카피들에 의해 연결된, FokI 뉴클레아제 도메인의 2개 카피들을 사용하여 VP16 활성화 도메인을 대체한 것을 제외하고는, 상기 기술된 R13V-d182C와 동일하다. 이후에, TALEN 제작물을 일본쇄 어닐링(SSA)을 기본으로 한 리포터 검정에서 뉴클레아제 활성에 대해 시험하였다(참조: 공동-소유의 미국 특허 공보 20110014616).
당해 검정에서 사용된 리포터 제작물(도 11a, SSA-R13)은 GFP 암호화 서열의 N-말단(GF) 및 C-말단 부분(FP)에 의해 샌드위치된 예측한 TALE13 표적을 함유한다. 리포터 SSA-R13 자체는 GFP 발현을 유도할 수 없지만, TALE13 표적에서 절단은 GFP의 N- 및 C-말단 부분 중에서 동종 재조합(HR)을 촉진하여 기능성 GFP 삽입유전자를 형성할 것이다. 이의 결과들이 도 11b에 나타나 있는 실험에서, SSA-R13 리포터 제작물은, (모형) TALEN 제작물의 존재 또는 부재와 함께, 앞서 기술한 바와 같이 K562 세포들내로 일시적으로 형질감염시켰다.
형질감염 2일 후, GFP 양성 세포들의 퍼센트를 유동 세포분석법으로 분석하였다. 도 11b에 나타낸 바와 같이, 약 7%의 GFP 양성 세포들이 TALE 플라스미드(모형)를 결여하고 있는 대조군 실험에서 약 1.4%와 비교하여, TALEN 융합체들(R13d182C-scFokI)에 의해 SSA-R13 리포터 플라스미드로부터 생성되었으며, 이는 SSA-R13 리포터에서 TALE13 표적에서 절단에 있어 유의적인 증가를 나타낸다.
이들 데이타는, TALE DNA 결합 도메인들을 사용하여 포유동물 세포들내에서 DNA의 부위 특이적인 절단을 위한 기능적인 TALEN들을 생성할 수 있음을 입증한다.
TALE 도메인 융합체들을 또한 FokI 절단 반 도메인들을 사용하여 제작하였다. 당해 실험에서, 야생형 FokI 반 절단 도메인들을 사용함으로써 뉴클레아제 활성의 경우, 단독이합체가 융합체들 2개로부터 형성되어야만 하도록 하였다. 이들 융합체들을 위해, TALE13 DNA 결합 도메인은 TALE DNA 결합 도메인을 FokI-규정 서열에 인접한 플라스미드내로 클로닝함으로써 각각의 FokI half 도메인에 융합시켰다. 또한, 각종 링커들은 DNA 결합 도메인과 뉴클레아제 도메인 사이에서 용도에 대해 시험하였다. 다음과 같은 링커들 L2 및 L8을 사용하였다: L2= GS (SEQ ID NO:71) 및 L8= GGSGGSGS (SEQ ID NO:72). 표적 부위들을 각각의 표적 결합 부위 사이에 다양한 gap 공간들을 갖는 TOPO2.1 표적 벡터(제조원: Invitrogen)내로 클로닝함으로써 2개가 서로 2 내지 22 bp 분리되도록 하였다. 표적 벡터의 대략 1kb 영역의 PCR 증폭을 수행하여 표적 DNA들을 생성하였다. TALE DNA 결합 도메인들을 또한 앞서 기술한 바와 같이 트렁케이트하고, 상기 실시예 2 및 6에서 기술한 바와 동일한 명명법을 사용하여 기술한다. TALE 도메인 뉴클레아제 융합 클론들은 250나노그램의 뉴클레아제 융합 클론 플라스미드를 함유하는 5μL의 물을 20μL의 분해물에 가하고 30℃에서 90분 동안 항온처리함으로써 TNT 토끼 망상적혈구 분해물 시스템에서 발현시켰다.
이후에, 분해물을 사용하여 다음과 같이 표적 DNA를 절단하였다: 2.5μL의 분해물을 50 나노그람의 PCR-증폭된 표적 DNA 및 1X의 최종 완충액 2(제조원: New England Biolabs) 농도를 함유하는 50μL의 반응물에 가하였다. 절단 반응은 37℃에서 1시간 동안에 이어서 65℃에서 20분의 가열 불활성화하는 것이었다. 이어서, 반응물을 고속에서 원심분리하여 분해물로부터 표적 DNA를 분리하여, 분해물이 반응 웰 속에서 펠렛으로 농축되도록 하였다. DNA-함유 상층액을 피펫팅하여 제거하고 에티디움 브로마이드-염색된 아가로즈 겔(제조원: Invitrogen)에서 이동시켜 절단된 표적 DNA로부터 완전한 표적 DNA를 분리하였다. 이후에, 아가로즈 겔을 AlphaEaseFC(제조원: Alpha Innotech) 소프트웨어를 사용하여 분석함으로써 표적 DNA의 단일 절단 현상으로부터 생성되는 2개의 보다작은 DNA 밴드들 및 대형의 절단되지 않은 DNA 밴드 속에 존재하는 표적 DNA의 양을 측정하였다. 겔내로 로딩된 표적 DNA의 총 양에서 제외된 절단된 DNA의 비율은 각각의 반응에서 절단 퍼센트로 나타낸다.
본 발명자들은 관련없는 펩타이드 서열의 트리밍(trimming)이 TALEN들의 촉매 활성을 개선시킬 수 있는, FokI 절단 도메인의 보다 구속된 부착을 제공할 수 있다는 것을 추론하여, 효율적인 결합에 요구되는 특이적인 영역들 하부로 융합체를 축소시키기 위한 노력에서 TALE 단백질들의 플랭킹 영역들을 최소화하려고 하였다. TALE DNA 결합 도메인의 N- 및 C-말단들(SEQ ID NO:73 및 서열 번호 369)에서 이루어진 절단들은 하기 나타낸 바와 같이 제조하였으며, 여기서 절단 부위들은 아미노산 서열 위에 나타내고, 예측된 2차 구조(C= 무작위 코일(random coil), H= 나선형)는 서열 아래에 나타낸다.
C-캡:
N-캡:
C-말단 결실 연구들의 결과들은 도 12 및 13에 나타낸다. 도 12는 에티디움 브로마이드 염색된 아가로즈 겔들 위에서 절단 생성물을 가시화시킴에 의한 표적 서열들의 절단을 나타낸다. 도 12에서, L2 또는 L8은 사용된 링커를 나타내며, 각각의 레인 아래의 숫자는 이합체의 2개의 표적 DNA 결합 부위들 사이의 bp gap을 나타내었다. 'S'는, 활성 뉴클레아제 단독이합체가 DNA위에서 형성될 수 없도록 단지 하나의 표적 DNA 결합 부위의 존재를 나타낸다. "Pmll"은 TALE 결합 부위들 다음의 클로닝된 DNA 표적 서열내에 위치하는 유일한 제한 부위의 시판되는 제한 효소(제조원: New England Biolabs)를 사용하여 절단의 양성 대조군 반응을 나타낸다. PmlI 부위에서 절단은, 클로닝된 표적 부위가 PCR-증폭된 표적 DNA에 존재하며 또한 절단된 DNA의 대략 예측된 크기를 나타낸다. 블랭크(blank)는, TALEN이 생산되지 않도록 TALEN 암호화 플라스미드의 부재하에서 음성 대조군 TNT 반응을 나타낸다. 데이타는 도 13에서 그래프 양식으로 나타내며, 단백질의 절단 활성이 적어도 9개 염기들의 스페이서 길이(spacer length)에 대해 C+28 및 C+39 C-캡들로 증가함을 나타낸다. 이들 실험들을 지속하여 추가의 C-캡들(C-2, C+5, C+11, C+17, C+22, C+25, C+28 및 C+63)을 제작하였다. 결과들은 하기 표 16에 요약한다. "스페이서"는 표적 부위들 사이의 다수의 염기 쌍들을 나타내고 "SC"는 표적내에서 단지 하나의 결합 부위를 함유하는 시료들을 나타낸다.
[표 16]
시험관내에서 TALE13-단독이합체의 C 말단 절단들
상기 나타낸 데이타로부터 알 수 있는 바와 같이, C-말단이 대략 C+5 이후에 트렁케이트되는 경우 단백질들은 융합 뉴클레아제들로서 당해 검정에서 거의 활성이 되지 않는 것으로 여겨진다.
나타낸 스페이서를 지닌 표적과 함께 나타낸 경우 추가의 C-말단 절단 지점들을 지닌 TALE13 뉴클레아제들의 절단 활성을 또한 평가하고 결과들을 하기 표 17에 나타낸다. "S"는, 절단 표적이 TALE13에 대한 단일 결합 부위를 함유하였음을 나타낸다.
[표 17]
TALE 13 뉴클레아제 C-말단 절단들
TALE 단백질들의 C-말단 영역에서 이루어진 작업과 유사하게, N-말단에서 또한 결실들을 이루었다. 데이타는 도 14에 나타내며, N-말단이 결실된 단백질의 활성은, 절단들이 N+137 위치에 비교적 근접하여 도입되는 경우 감소됨이 명백하다. 당해 도에서, 각각의 컬럼은 상응하는 N-말단 절단 및 사용된 다수의 별개의 클론들로 표지한다. "S"는, 단지 단일의 결합 부위가 표적내에 존재하였음을 나타낸다. 이들 결과들의 합은, TALEN이 FokI 반 도메인들 또는 일본쇄 구조내에서 상호작용할 수 있는 2개의 반 도메인들에 연결되는 경우 매우 활성일 수 있지만, N-캡 및 C-캡의 길이는 수득되는 TALEN들의 DNA 절단 특성들에 있어 효과를 가짐을 나타낸다.
TALEN들을 제작하여 포유동물 세포내에서 내인성 표적에 결합시켰다. 10개의 반복체 NTF3 결합 도메인을 위에서 기술한 바와 같이 FokI half 도메인에 연결시켰다. 또한, NTF3 특이적인 파트너(rNTF3)를 표준 오버랩핑 올리고뉴클레오타이드 제작 기술을 사용하여 상업적으로 제작하였다. 합성 NTF3 파트너를 C 말단: C+63, C+39 및 C+28에서 3개의 변이체들을 사용하여 제조하고, TALE DNA 결합 도메인을 C-말단에 대한 에피토프 tag 및 핵 국재화 시그날 및 C-말단에 대한 야생형 FokI 절단 도메인이 첨부되는 표준 ZFN 벡터내로 클로닝하였다. 당해 실험들에서 사용된 제작물들의 완전한 아미노산 서열들은 실시예 23에 나타낸다.
9.5 반복체 NTF3-Fok1 융합체, 및 18 반복체 NTF3-특이적인 NT-L 단백질 외에, TALEN들을 또한 제조하여 VEGF A 유전자에 대해 특이적인 부위를 표적화하였다. 당해 융합체 단백질은 9.5 반복체 단위들을 함유하였으며 위에서 기술된 바와 같이 제작하였다. 18 반복체 NT-L 및 VEGF-특이적인 TALEN들을 또한 +28, +39 또는 +63의 C 말단 절단으로 제조하였다. 다음에, 이들 합성 융합체 뉴클레아제들을 시험관내에서 뉴클레아제 검정들에 상기와 같이 각종 조합들로 사용하였다. 기재 서열들은 각종 융합체들에 대한 표적 결합 부위들을 나타내는 대문자들로 하기 나타낸다:
NTF3-NTF3 기질(SEQ ID NO:77):
NT3-VEGF 기질(SEQ ID NO:78):
VEGF-NT3 기질(SEQ ID NO:79):
이들 연구들로부터의 결과들은 하기에서 표 18 및 표 19에 나타낸다.
[표 18]
사람 NTF3에 대해 특이적인 TALEN 쌍들
표 18은 각각의 TALEN 쌍의 중복 시험을 나타낸다. 예를 들면, 시료 1 및 16은 TALEN 단합체들의 동일한 조합이다.
[표 19]
NTF3/NTF3 또는 NTF3/VEGF의 조합들에 대해 표적화된 TALEN들
"NN"은 좌측(NT-L) 및 우측(NT-R) NTF3 TALEN들에 대한 결합을 갖는 내인성 NTF3 표적의 관련 부위를 말한다. #1 또는 #2는 동일한 제작물의 상이한 클론들을 말한다.
따라서, 이들 단백질들은 시험관내에서 뉴클레아제들로 활성이다.
이들 단백질들은 또한 상기 기술된 SSA 리포터 시스템을 사용하여 포유동물 세포내에서 엔도뉴클레아제 활성의 검정에서 사용되었다. 표적 기질(도 15a, 서열 번호 452에 나타냄)을 해체된 GFP 리포터 사이에 클로닝함으로써 절제에 의해 수반된 NTF3 부위의 절단이 발현가능한 전체 GFP 리포터를 생성하도록 하였다. 당해 기질은 NTF3 표적 서열 및 CCR5 유전자를 표적화하는데 특이적인 표적 서열을 둘 다 함유한다. 도 15b는 NTF3-특이적인 TALE 단백질들의 선택을 사용하는 당해 실험의 결과를 나타낸다. 당해 실험에서 다음의 NTF3-특이적인 TALEN 융합체들을 사용하였다. TALE13C28L2는 C+28 절단 및 L2 링커를 지닌 위에서 기술한 TALE13 유도체이다. rNT3R17C28L2은 C+28 절단 및 L2 링커를 가진 17.5 반복체 NT3-특이적인 단백질(NT3 유전자의 암호화 쇄와 관련하여 DNA의 역방향 쇄를 표적화한다)이다. rNT3R17C39L2는 C+39 C 말단을 갖는 유사한 제작물이며, rNT3R17C63L2는 C+63 C 말단을 갖는다. 당해 rNT3R17 DNA 결합 도메인은 또한 NT-R로 명명된다. 8267EL/8196zKK는 CCR5 특이적인 아연 핑커 뉴클레아제들의 쌍을 사용하는 대조군이다. "-NT3R18C28L8"로 표지된 데이타는 NTF3 특이적인 파트너(NTF3 유전자의 암호화 쇄와 관련하여 DNA의 전방 쇄를 표적화한다)의 부재에서의 결과들을 나타내는 한편, "HNT3 R18 C28L8"로서 표지된 데이타는 파트너의 존재하의 결과들을 나타낸다. 당해 경우에, 파트너는 C28 위치에서 트렁케이트되고 L8 링커를 함유하는, 17.5 반복체를 지닌 NTF3 특이적인 단백질이다. 도에서 알 수 있는 바와 같이, TALEN들의 정확한 쌍은 리포터 유전자의 효율적인 절단 및 이에 따른 리포터 유전자 발현을 초래한다.
실시예 8: 포유동물 세포내에서 내인성 유전자자리를 절단하기 위한 조작된 TALEN들의 용도
NTF3 유전자자리에 표적화된 위에서 기술된 이합체 쌍들(참조: 표 18)을 포유동물 세포내에서 내인성 유전자자리에서 시험하였다. 나타낸 바와 같은 이합체 쌍들을 아막사 바이오시스템스 장치(Amaxa Biosystems device)(제조원: Cologne, 독일 소재)를 사용하여 제조업자가 공급한 표준 방법들로 K562 세포들 내로 핵감염(nucleofect)시키고 형질감염 후 일시적인 냉 쇼크 성장 조건에 적용시켰다(참조: 미국 특허원 12/800,599).
세포들을 30℃에서 3일 동안 항온처리한 후, DNA를 분리하여 Cel-I 분석에 사용하였다. 당해 검정을 설계하여 야생형 서열과 비교하여 시료 속에서 미스매치를 검출한다. 당해 미스매치들은 비-동종 말단 결합(NHEJ)의 오류발생이 쉬운 공정에 의해 치유되는 TALEN에 의한 절단으로 인하여 DNA내 이본쇄 파괴의 결과이다. NHEJ는 흔히 작은 첨가들 또는 결실들을 도입하며 Cel-I 검정은 이들 변화들을 검출하기 위해 설계된다. 검정들은 예를 들면 미국 특허 공보 20080015164; 20080131962 및 20080159996에 기술된 바와 같이, 다음 프라이머들을 사용하여 증폭시킨 생성물들을 사용하여 수행하였다: LZNT3-F4: 5'-GAAGGGGTTAAGGCGCTGAG-3'(SEQ ID NO:80) 및 LZNT3-1077R: 5'-AGGGACGTCGACATGAAGAG-3'(SEQ ID NO:81). 이들 프라이머들을 내인성 서열로부터 272 bp 앰플리콘(amplicon)을 증폭시키며 Cel-I 검정에 의한 절단은 대략 226 및 46 bp의 생성물을 생산할 것이다. 226 bp 생성물들은 가시적이지만, 46 bp 생성물들은 이들의 크기로 인하여 겔 위에서 관찰하기가 어렵다. 당해 결과들은 도 16에 나타내며, 여기서 관찰된 게놈 변형 퍼센트는 Cel-I 효소를 포함하는 레인들에 나타낸다. 도면으로부터 명백한 바와 같이, 이들 시료 속에 존재하는 뉴클레아제-유도된 돌연변이들이 존재하며, 시료들은 중복하여 재생될 수 있다(예를 들면, 레인 7 및 22, 또는 레인 12 및 27을 비교함).
연구들을 15, 13, 12, 및 10 쌍들(참조: 표 18)로, 형질감염 후 37℃ 또는 30℃에서 항온처리한 세포들을 사용하여 반복하고 결과들을 도 17에 나타낸다. 우선, NT-R TALE DNA 결합 도메인을 앞에서 기술한 바와 같이 SELEX 검정에서 시험하고 결과들을 도 17a에 나타낸다. K562 세포들에서 발현시키는 경우, 이들 단백질들은 Cel-I 검정에 의해 나타난 것으로서, 37℃ 및 30℃에서 시험한 가장 활성인 이종이합체(쌍 12)에 대한 3% 및 9%의 추정된 수준들을 갖는 강력한 유전자 변형을 수득하였다(참조: 도 17b). 또한, 생거 서열분석(Sanger sequencing)은 30℃ 시료에서 분석한 84개 중 7개의 돌연변이된 대립형질들을 확인하였으며 또한 비-동종 말단 결합(NHEJ)을 통해 비-동종 말단 결합의 오류발생이 쉬운 파괴 복구와 일치하는 돌연변이 스펙트럼(약간의 결실들)을 나타내었다(도 17c).
이들 연구들은, 본원에 기술된 것으로서 TALEN 구조물이 내인성 유전자자리에서 및 포유동물 세포내에서 효율적인 NHEJ-매개된 유전자 변형을 구동시킬 수 있음을 나타낸다.
이들 연구들은 또한 고도로 활성인 뉴클레아제 기능을 제공하는 TALE 반복체 배열에 뉴클레아제 도메인을 연결하는데 사용될 수 있는 조성물들을 나타낸다. 시료들을 또한 NTF3 유전자자리에서 정밀한 서열분석에 적용시켰다. 시료들을 4 bp 서열로 바코드화하고 50 bp의 판독 길이를 일루미나 게놈 분석기 장치(Illumina Genome Analyzer instrument)(제조원: Illumina, 캘리포니아 산 디에고 소재)에서 사용하였다. 서열들을 통상의 피톤 스크립트(python script)로 가공하였다. 서열들을 뉴클레아제 활성에 의해 유도된 이본쇄 파괴의 결과로서 비-상동성 말단 결합(NHEJ) 활성의 특징들로서 삽입 또는 결실들["InDels"]의 존재에 대해 분석하였다. 결과들은 도 18에 나타낸다. 내인성 유전자 자리에서, 이들 2개의 단백질들에 의해 인지된 표적 서열들 사이에 12개의 염기 쌍 gap이 존재한다(참조: 도 18a). 도 18b에 나타낸 바와 같이, 포유동물 세포내에서 내인성 NTF3 유전자자리에 대한 활성을 입증하는 다수의 InDels이 존재한다. 도 18b에서, 내인성 유전자자리에서 야생형 서열은 "wt"로 나타낸다.
실시예 9: TALEN 절단 이후의 내인성 유전자자리내로 표적화된 통합
NTF3에서 TALE-매개된 표적화된 통합은 HDR DNA 복구 경로를 통해 또는 NHEJ 경로를 통해 일어날 수 있었다. 본 발명자들은 NHEJ에서 작은 이본쇄 올리고뉴클레오타이드의 포획을 기본으로 한 NTF3에서 TALE-매개된 표적화된 통합을 검정하기 위한 실험을 설계하였다. 본 발명자들은 ZFN-유도된 DNA 이본쇄 파괴들(DSBs)의 부위에서 올리고뉴클레오타이드들의 포획을 이미 밝혔다. 이러한 유형의 표적화된 통합은 ZFN 쌍의 FokI 부위들에 의해 생성된 것들에 대해 상보성인 5' 오버행의 존재(그러나 절대적으로 필요하지는 않았다)에 의해 향상되었다. FokI는 천연적으로 4 bp 5' 오버행들을 생성하며; ZFN과 관련하여, FokI 뉴클레아제 도메인은 4 bp 또는 5 bp 5' 오버행들을 생성한다. NTF3 TALEN들에 의해 남아있는 오버행의 위치 및 조성은 알려져있지 않으므로, 본 발명자들은 NTF3 TALEN 결합 부위들(NT3-1F 내지 NT3-9R) 사이에서 12bp 스페이서 영역에서 모든 가능한 4bp 5' 오버행들을 가진 9개의 이본쇄 올리고뉴클레오타이드 공여체를 설계하였다(참조: 표 20).
[표 20]
표적화된 통합 검정에 사용된 PCR 프라이머들
주 - 프라이머 서열내 *는 2개의 5' 말단 포스포로티오에이트 연결들을 나타낸다. 모든 프라이머들은 5' 포스페이트들을 결여하고 있다.
이들 공여체들은 2개의 5' 말단 포스포로티오에이트 연결들을 함유하며 5' 포스페이트들, 및 프라이머 내부 F에 대한 결합 부위를 결여하고 있다. 상보성 올리고뉴클레오타이드들(예를 들면, NT3-1R을 지닌 NT3-1F)를 10 mM 트리스 pH 8.0, 1 mM EDTA, 50 mM NaCl 속에서 95℃로 가열하고 0.1°/min으로 실온까지 냉각시킴으로써 어닐링하였다. 공여체 올리고뉴클레오타이드들(5μL의 40μM 어닐링된 올리고뉴클레오타이드)을 20μL의 형질감염 혼합물 속에서 개별적으로 각각 8개의 상이한 TALEN 쌍들(A-H, 400 ng의 각각의 플라스미드 참조: 표 21)로 200,000 K562 세포들내에 프로그램 FF-120로 설정된 아막사 뉴클레오펙터(Amaxa Nucleofector)(제조원: Lonza) 및 용액 SF를 사용하여 형질감염시켰다.
[표 21]
NT3-특이적인 TALEN 쌍들
세포들을 형질감염 후 3일째에 수거하고 50μL의 퀵익스트랙트(QuickExtract) 용액(제조원: Epicentre) 속에서 분해하였다. 1 마이크로리터의 조 분해물을 하기 기술한 바와 같이 PCR 분석에 사용하였다.
본 발명자들은 내부 F 및 GJC 273R 프라이머들을 사용하여 올리고뉴클레오타이드 및 염색체에 의해 생성된 연결부의 PCR 증폭에 의해 NTF3 TALEN으로 생성된 DSB내로 올리고뉴클레오타이드 공여체의 표적화된 통합을 검정하였다. 올리고뉴클레오타이드 공여체의 완전한 연결을 기본으로 한 PCR 증폭의 예측된 크기는 염색체에서 파괴 위치에 따라 변한다. 도 19에서 알 수 있는 바와 같이, 공여체의 통합은 TALEN과 공여체 오버행들의 많은 조합들을 사용하여 검출하였다. 최대 시그날이 12bp 스페이서 영역의 중심 근처에서 CTGG 및 TGGT 오버행들을 사용하여 관측되었다. NHEJ에 의해 포획된 공여체들을 함유하는 내인성 염색체 유전자위치들을 서열분석하여 도 20에 나타내었다. NTF3 표적 유전자자리(상부 이중쇄) 및 당해 연구에 사용된 올리고뉴클레오타이드 이중쇄들 중 하나(하부 이중쇄)를 나타내고 NT-L+28 및 NT-R+63에 대한 결합 부위들은 상부 서열에서 밑줄쳐져 있다. 이중쇄(5' CTGG)를 가장 효율적으로 포획할 절단 오버행이 또한 강조되어 있다. 또한 본 연구에 사용된 제2의 올리고뉴클레오타이드 이중쇄가 도 20b에 나타나 있다. NT-L+28 및 NT-R+63에 대한 결합 부위들은 상부 서열에 밑줄쳐져 있다. 당해 이중쇄(5' TGGT)를 가장 효율적으로 포획할 절단 오버행을 또한 나타낸다. 이후에, TALEN들, NT-L+28 및 NT-R+63을 K562 세포내에서 도 20a에 나타낸 올리고뉴클레오타이드 이중쇄의 존재하에 발현시켰다. 이후에, 성공적으로 통합된 이중쇄와 게놈성 DNA 사이의 연결부들을, 이중쇄내에서 어닐링하는 하나의 프라이머 및 천연의 NTF3 유전자 위치로 어닐링하는 하나의 프라이머를 사용하여 증폭시켰다. 수득되는 암플리콘들을 클로닝하고 서열분석하였다. 도 20c에서 "예측된" 서열은 절단된 유전자 위치에 대한 올리고뉴클레오타이드 이중쇄의 완전한 연결로부터 생성될 수 있는 서열을 나타낸다. 박스는 연결부 서열들에서 이중쇄 오버행의 위치를 강조한다. 하부 2개의 라인들은 본 연구로부터 수득된 연결부 서열들을 제공한다. 나타낸 바와 같이, 11개의 연결부 서열들은 절단 오버행에 대한 이중쇄의 완전한 연결로부터 생성되는 반면, 하나의 연결부 서열은 NHEJ에 의한 복구 전에 절제와 일치하는 짧은 결실(12 bp)을 나타내었다. 도 20d는, 도 20a에 나타낸 이중쇄와 관련하여 하나의 염기에 의해 이동된 4bp 오버행을 갖는, 도 20b에 나타낸, 올리고뉴클레오타이드 이중쇄를 사용하는 것을 제외하고는 도 20c에 나타낸 바와 같은 실험들로부터의 결과들을 나타낸다. 최저 4개의 라인들이 당해 연구로부터 수득된 연결부 서열들을 제공한다. 나타낸 바와 같이, 4개의 명백한 서열들이 확인되었으며, 이는 각각 NHEJ-매개된 복구 전에 절제와 일치하는 짧은 결실들을 나타낸다.
실시예 10: 신규의 TALE 단백질들을 암호화하는 유전자들의 효율적인 조립
천연 단백질들에서 발견된 TALE 반복체들을 암호화하는 DNA 서열은 이들의 상응하는 아미노산 서열과 같이 반복적이다. 천연의 TALE은 각각의 반복체의 서열들 사이에 차이인 단지 소수의 염기쌍의 가치를 갖는다. 반복적인 DNA 서열은 목적하는 완전한 길이의 DNA 앰플리콘을 효율적으로 증폭시키는 것을 어렵게 할 수 있다. 이는, 천연 TALE-함유 단백질들에 대한 DNA를 증폭시키기 위해 시도하는 경우 밝혀졌다. Mfold[참조: M. Zuker Nucleic Acids Res. 31(13):3406-15, (2003)]를 사용한 상기 TALE-반복체 단백질의 DNA 서열의 추가의 분석은, 이들이 효율적인 증폭을 파괴하는 반복적인 서열을 가질 뿐 아니라, 매우 안정한 제2 구조를 함유함을 나타내었다. 당해 분석에서, 서열의 800개 염기쌍들을 제1의 완전한 반복체 서열을 암호화하는 핵산의 5' 말단에서 개시하여 분석하였다. 따라서, 분석된 핵산 서열은 대략 7.5 반복체 서열들을 함유하였다. 수개의 이들 2차 구조들을 도 21에 나타낸다.
이들 구조들은 TALE 반복체들 또는 인접하지 않은 반복체들 중 어느 것의 사이에서 발생할 수 있다. TALE 반복체들을 함유하는 DNA 서열들의 효율적인 증폭을 제공하기 위해, 당해 2차 구조 및 편향(bias)을 파괴하기 위한 사일런트 돌연변이들의 도입을 2차 구조를 안정화시키기 위해 제공된 TALE 반복체들의 영역내에서 이루었다. 이후에, 프라이머들이 목적한 TALE 서열의 효율적인 증폭을 허용하도록 하였다. 이후에, PCR 증폭 생성물을 변이에 대해 서열분석하고 융합 단백질들에서 사용하기 위해 클로닝하였다. 또한, 사일런트 돌연변이들을 포유동물 세포들내에서 코돈 최적화를 위해 TALE 뉴클레오타이드 서열내에서 이루었다. 유사한 코돈 최적화를 다른 숙주 세포 시스템들(예를 들면, 식물, 진균 등)내에서 최적 발현을 위해 사용하였다.
실시예 11: TALE 융합 단백질들을 암호화하는 유전자들의 신속한 제작 방법
각종의 TALE 융합 단백질들의 신속한 조립을 허용하기 위하여, 거의 어떠한 선택된 표적 DNA 서열에 대해 특이적인 TALE DNA 결합 도메인을 생성하기 위해 함께 연결될 수 있는 반복체 모듈들의 보관소(archive)를 생성하기 위한 방법을 개발하였다. 목적하는 표적 DNA 서열을 기본으로 하여, 하나 이상의 모듈들을 집어올려서 PCR계 시도를 통해 검색하였다. 모듈들을 무작위적으로 연결시키고 선택한 융합체 파트너 도메인을 하유하는 벡터 골격내로 연결시켰다.
4개의 TALE 반복체 단위들을 함유하는 모듈들을 256개의 가능한 DNA 테트라뉴클레오타이드(예를 들면, AAAA 표적에 대한 1개의 모듈, AAAT에 대한 1개 등) 각각에 대한 특이성을 사용하여 제작하였다. 또한, 모듈들을 또한 모든 64개의 가능한 DNA 트리뉴클레오타이드 표적물들, 모든 가능한 64개의 디뉴클레오타이드 DNA 표적물들 및 또한 4개의 단일 뉴클레오타이드 표적물들에 대해 생성시켰다. 디펩타이드 인지 영역(또한 RVD-반복체 가변 디펩타이드로 언급됨)의 경우, 다음의 코드를 사용하였다: 아데닌의 인지의 경우, RVD는 NI(아스파라긴-아스파르테이트)이었고, 사이토신의 경우, RVD는 HD(히스티딘-아스파르테이트)이었으며, 티민의 경우, RVD는 NG(아스파라긴-글리신)이었고, R(구아닌 또는 아데닌에 대한 비교가능한 특이성)의 경우, RVD는 NN(아스파라긴-아스파라긴)이었다. 또한, 일부 조작된 TALE에서, RVD NK(아스파라긴-라이신)는 일부 단백질들에서 NN보다 G에 대해 보다 높은 특이성을 제공하는 것으로 여겨지므로 G의 인지를 위해 선택하였다. 또한, RVD의 끝에서 두번째 위치 N-말단(반복체 단위의 11번 위치)는 N 또는 아스파라긴(전형적으로 당해 위치는 S 또는 세린이다)이었다. 당해 모듈 보관소는 다른 어떠한 RVDs를 사용함에 의해 확장시킬 수 있다.
PCR 특이성, 완전한 서열 반복체들을 지닌 DNA의 클로닝 및 조작은 문제가 있다. 따라서, 저장소를 제작하기 위하여, 많은 천연의 TALE 반복체 서열들을 분석하여, 아미노산 서열내 가변성이 DNA 수준에서 반복체 서열들을 다양화시키기 위한 시도에서 견딜 수 있는 경우를 살폈다. 결과들은 도 22에 나타내며, 여기서 문자 크기는 제공된 위치에서 관찰된 다양성과 역으로 관련되어 있는데: 문자들이 클수록 다양성의 내성이 거의 없음을 나타내는 반면 문자들이 작을수록 다른 아미노산들이 때때로 관찰되는 위치들을 나타낸다. 예를 들면, 1번 위치에서, 반복체 단위의 제1 아미노산인, L 또는 루이신은 필수적으로 불변적으로 관측된다. 그러나, 4번 위치에서, 3개의 상이한 아미노산들이 때때로 발견된다: E 또는 글루타메이트, A 또는 알라닌, 또는 D 또는 아스파르테이트. 또한, 다양한 반복체 모듈들을 암호화하는 뉴클레오타이드 서열을 또한 변경시켜 유전 코드에서의 중복성을 이용함으로써 특이적인 아미노산들을 암호화하는 코돈들이 상호교환되어 반복체 단위를 암호화하는 DNA 쇄가 다른 반복체 단위로부터 상이한 서열을 가지도록 할 수 있지만, 아미노산 서열은 동일하게 남아있을 것이다. 이들 기술들 모두는, DNA 결합 도메인의 내부가 어떠한 목적하는 표적도 인지할 수 있는 조작된 TALE DNA 결합 도메인들을 제작하는데 사용될 수 있는 모듈들을 모으는데 이용하였다.
설계자가 모듈들의 위치를 규정하도록 하기 위하여, 제II형 S 제한 효소, BsaI을 사용하였으며, 당해 효소는 이의 DNA 표적 부위의 3' 말단으로 절단한다. BsaI는 하기 나타낸 서열을 인지한다. 또한, 효소적 절단 후 남은 절단된 DNA의 "점착성 말단들(sticky ends)(SEQ ID NOs:102-105)"을 나타낸다:
인지 부위 -> 절단 후
당해 분야의 기술자에 의해 인지될 바와 같이, 점착성 말단들의 서열은 제한 인지 부위의 바로 3'의 DNA 서열에 의존하므로, 이들 점착성 말단들의 다른 것에 대한 연결은, 정확한 서열들이 존재하는 경우에만 발생할 것이다. 이는, PCR 앰플리콘들이 BsaI으로 절단되면 공지된 점착성 말단들을 가질 수 있는 목적하는 모듈들을 증폭시키기 위해 PCR 프라이머들을 개발하는데 이용되었다. 이후에, PCR 생성물들을 BsaI 절단 이후에 결합시켜 사용자가 명시한 순서만으로 생성물들이 함께 연결되도록 한다. 1 내지 16개의 완전한 TALE 반복체들로 구성된 4개 이하의 모듈들을 연결시키는 조립 도해가 도 23에 도시되어 있다. 사용된 프라이머들은 다음과 같으며, 여기서 번호매김은 도에 나타낸 것에 상응한다. 나열된 프라이머들이 동일한 개념을 사용함으로써, 4개 이하의 모듈을 연결시키는데 사용되는 것으로 의도되지만, 보다 많은 프라이머들이 4개 이상의 모듈들을 연결시키기 위해 가해질 수 있다.
프라이머들:
당해 방법을 사용하는 경우, BsaI 절단된 PCR 암플리콘들의 연결은, "A" 모듈의 3' 말단이 "B" 모듈의 5' 말단에 연결되고, "B" 모듈의 3' 말단이 "C" 모둘의 5' 말단에만 연결될 수 있는 경우 등에만 발생할 수 있다. 또한, 연결된 모듈들이 클로닝된 벡터 골격은 또한 특이적인 BsaI 절단된 점착성 말단들을 함유함으로써, "A" 모듈의 5' 말단, 및 "D" 모듈의 3' 말단 만이 연결되어 벡터 원형을 완료할 것이다. 따라서, 조작된 TALE DNA 결합 도메인내 각각의 모듈의 위치는 사용자가 선택한 PCR 프라이머들에 의해 측정된다.
현재, TALE DNA 결합 도메인들에 대한 DNA 표적 부위들은 전형적으로 표적(이는 R0 반복체에 의해 인식된다)의 5' 말단에서 및 표적(이는 R1/2 반복체에 의해 인식된다)의 3' 말단에서 T 뉴클레오타이드들에 의해 플랭킹된다. 따라서, 벡터 골격은, 규정된 모듈들을 함유하는 연결된 PCR 암플리콘들이 벡터내 R0와 R1/2 서열들 사이에 골격내로(in frame) 클로닝되도록 설계되어졌다. 또한, 벡터는, 사용자가 규정한 TALE 단백질의 C-말단 도메인 유형(트렁케이트되어 있거나 되어 있지 않은) 및 융합체 파트너에 대해 선택한 외인성 도메인을 함유한다. 도 23에 도시된 설계에서, 외인성 도메인은 TALE 뉴클레아제의 생산을 허용하는 FokI 도메인이다. 벡터는 또한 CMV 프로모터, 핵 국재화 시그날, 발현을 모니터링하기 위한 tag, 및 폴리 A 부위와 같은 융합 단백질의 발현에 필수적인 서열들을 함유한다. 당해 벡터는, 이제 사용자가 선택한 세포내로 형질감염시킬 수 있다. 또한, 벡터는 추가로 변형되어 상이한 세포 시스템들에 대해 바람직하고/하거나 요구되는 것으로서 선택 마커들, 도메인들 또는 다른 유전자들을 함유할 수 있다.
실시예 12: 특이적인 외인성 TALEN들의 설계 및 특성화
TALEN 설계 방법을 평가하기 위해, 본 발명자들은 사람 CCR5 유전자내에서 델타 32 돌연변이(하기에 굵게 밑줄쳐서 나타냄)의 위치 근처의 TALEN 매개된 유전자 변형을 입증하고자 하였다[참조: Stephens JC et al, (1998) Am J Hum Gen 62(6): 1507-15]. 당해 연구를 위해, 본 발명자들은 16개의 이합체 표적들(SEQ ID NO:114 내지 122)의 패널을 정의한, 델타 32의 위치(하기 참조)에서 4개의 "좌측" 및 4개의 "우측" 결합 부위들의 집단을 지정하였다.
당해 패널내에서, 개개의 표적들은 광범위한 gap 크기-5 내지 27bp에 의해 분리된다. TALEN 단백질들은 실시예 11에 기술된 방법들을 사용하여 조립함으로써, 기술된 모든 단백질들 내에서(구체적으로 나타내지 않음), 'T'를 규정하는 RVD가 NG이고, 'A'의 경우 NI이며, 'C'의 경우 HD이고 'G'의 경우 NN이도록 하였다. 다음에, 2개의 대안 단백질들은 48 또는 83개 잔기들의 C-말단 분절을 지닌, 각각의 표적에 대해 생성시켰다. 최종적으로, "좌측" 및 "우측" 단백질들의 모든 쌍방식(pairwise) 조합들(8x8 = 총 64개)을 K562 세포들내에서 발현시키고 내인성 유전자자리의 변형에 대해 분석하였다. 하기 표 22를 참조한다(3일째 및 10일째):
[표 22]
CCR5 △32-특이적인 TALEN 절단들에 대한 활성의 쌍방식 조합들
3일째 변형 수준들
10일째 변형 수준들
표적 부위들은 다양한 gap 크기들을 함유하였으므로, 최대 활성인 뉴클레아제들에 관한 데이타를 또한 2개의 표적 부위들 사이의 거리와 관련하여 분석할 수 있다. 표 23에서 하기 나타낸 것은 표적 부위들에 대한 gap 크기들을 나타내는 것을 제외하고는, 표 22에서 상기 것들과 유사한 패널이다.
[표 23]
쌍방식 조합들에 대한 gap 크기들
*는 Cel I 검정의 의해 평가한 것으로서 <1% 유전자 정정 활성이 존재하였던 쌍들을 나타낸다(표 22의 +63/+63과 비교)
따라서, 표 22 및 표 23으로부터의 데이타는, 이들 쌍들이 최대 활성인 gap 크기들의 범위가 12 내지 21 bp를 포함하지만 11bp 미만 또는 23bp 초과의 gap을 배제하는 것을 측정하기 위해 비교할 수 있다.
본 발명자들의 TALEN 구조물이 다른 주요 세포 DNA 복구 경로를 통해 유전자 수정을 유도할 수 있는지를 입증하기 위하여: 상동성 지시된 복구(HDR), 삽입유전자 통합을 위한 강력하게 안전한-부위(safe-harbor)로서 선행 연구들에서 촉망되는 것으로 밝혀진 CCR5(유전자자리 162로 명명됨)내 제2의 유전자자리[참조: Lombardo et al (2007) Nat Biotechnol 25: 1298-1306]를 표적화하였다. 4개의 "좌측" 및 4개의 "우측"의 바른 결합 부위들을 지정하고(하기 참조, 서열 번호 123 내지 131), 2개의 대안적인 TALEN들을 각각(+28 및 +63 변이체들)에 대해 제작하고, +28/+28 및 +63/+63 쌍들을 Cel-I 검정(SEQ ID NO:370 내지 379)을 사용하여 NHEJ-매개된 유전자 변형에 대해 스크리닝하였다.
표 24에서 하기 나타낸 바와 같이, 시험한 24개의 쌍들 중의, 16개는 21% 이하의 수준에서 검출가능한 변형을 수득하였다.
[표 24]
CCR5의 162번 유전자자리에 대해 표적화된 TALEN 쌍들의 쌍방식 조합들의 활성
다음에, 2개의 가장 활성인 쌍들(L172+28/R185+28 및 L161+63/R177+63)을 K562 세포들내로 BglII 제한 부위를 지닌 46bp 삽입체를 표적화된 유전자자리로 이전시키도록 설계한 공여체 DNA 단편을 사용하여 도입하였다. 사용된 공여체 서열은 실시예 23에 나타낸다.
삽입 후에, 혼입된 tag 공여체 서열은 밑줄쳐져 있는 유일한 BglI 제한 부위를 갖는 다음 서열과 같았다:
공여체 삽입이 HDR을 통해 발생한 경우, 하기 나타낸 바와 같이, 삽입체 부위를 함유하는 영역을 PCR 증폭시킨 후 BglI 분해에 적용시킬 수 있으며, 여기서 상부 쇄는 표적 부위의 서열(SEQ ID NO:133)을 나타내고 하부 쇄(SEQ ID NO:134)는, 표적의 서열이 삽입된 tag 공여체를 가졌음을 나타낸다. 상부 쇄에서 밑줄친 서열은 TALEN 결합 부위를 나타내는 반면, 하부 쇄의 밑줄친 서열은 BglI 제한 부위(SEQ ID NO:445 내지 450)를 나타낸다:
도 24에 나타낸 바와 같이, 하나의 삽입체를 함유하는 클론들의 PCR 생성물들은 BglI 분해 후 2개의 단편들을 가졌다. PCR 및 BglI 분해 도해는 도 24a에 나타낸 반면, 결과들은 도 24b에 나타내며, 고도로 효율적인 수정을 나타내었다. 따라서, 본 발명자들의 TALEN 구조물은 내인성 유전자자리에서 HDR을 통해 효율적인 유전자 변형을 유도하였다.
실시예 13: 선택된 TALEN 구조물들에 대한 gap 공간 선호도의 실험
2개의 바람직한 TALEN 구조물들(C+28 C-캡 또는 C+63 C-캡 쌍들)의 gap 공간 선호도를 시험하기 위해, C+28/C+28 또는 C+63/C+63의 쌍들을 함유하는 모든 TALEN 쌍들을 gap 공간에 따라 활성에 대해 분류하였다. 결과들은 도 25에 나타내며, 보다 작은 TALEN 단백질들, C+28/C+28 쌍이 보다 구속된 gap 공간 선호도를 가지며 표적 서열이 12개 또는 13개 염기쌍들의 gap들에 의해 분리된 경우 표적들에서가장 활성임을 입증한다. 역으로, 도 25b에 나타낸, 보다 큰 TALEN 단백질들, C+63/C+63 쌍들은 12 내지 23 염기 쌍들 범위의 gap 공간을 함유하는 표적들에서 활성이다.
실시예 14: 고도로 활성인 뉴클레아제 기능을 제공하는 TALE 반복체 배열에 뉴클레아제 도메인을 연결시키는데 사용될 수 있는 조성물들의 전신계적 맵핑
조성물들의 전신계적 맵핑은, 뉴클레아제 도메인을 고도로 활성인 뉴클레아제 기능을 제공하는 TALE 반복체 배열에 연결시키는데 사용될 수 있다. 초기에, 하나의 TALEN 쌍을 2개의 결합 도메인들 사이의 정의된 gap 공간을 지닌 단일의 표적에 대해 선택하였다. 선택된 TALEN 쌍은 CCR5 유전자에 대해 특이적이고 18개 염기쌍 gap 공간을 가졌던 L538/R557 쌍으로서 실시예 12에 기술된 것이었다. 결실은 상술한 바와 같이 이루어서 일련의 절단이 C-2 내지 C+278에서 C-캡들을 생성하도록 하였다.
이후에, 이들 절단들을 사용하여 Cel-I 미스매치 검정을 사용하여 K562 세포들에서 뉴클레아제 활성을 분석하였다. 결과들(%NHEJ)은 하기 표 25 및 도 26에 나타낸다.
[표 25]
C-말단 절단들의 양호한 맵핑을 위한 뉴클레아제 활성
데이타는, 당해 내인성 표적에 대한 당해 뉴클레아제 쌍에 대한 최대 활성이, C-캡이 대략 C+63인 경우, 다시 말해서, 펩타이드 LTPEQVVAIASNGGGRPALESIVAQLSRPDPALAALTNDHLVALACLGGRPALDAVKKGLPHAPALIKRTNRRIPERTSHRVA (SEQ ID NO:451)가 완전한 길이의 TALE 반복체들의 배열을 FokI 절단 도메인에 연결시키는데 사용된 경우에 발생함을 입증한다. 당해 실험에서, 뉴클레아제를 앞서와 같이 K652 세포들에서 시험하고 세포들을 30℃ 또는 37℃에서 항온처리하였다. C+278과 비교하여 C+63 C-캡의 활성 비의 대략적인 평가는 37℃ 항온처리시 20배 더 컸으며 30℃ 항온처리의 경우보다 6배 더 컸다.
뉴클레아제 도메인을 내인성 유전자자리에서 고도의 활성인 뉴클레아제 기능이 가능하도록 하는 완전한 길이의 TALE 반복체들의 배열에 연결시키는데 사용될 수 있는 조성물들을 보다 미세하게 특성화하기 위해, 추가의 절단들을 제작하였다. 양호한 일련의 절단들을 다음과 같은 30C-캡들을 포함하도록 조립하였다: C-41, C-35, C-28, C-21, C-16, C-8, C-2, C-1, C+5, C+11, C+17, C+22, C+28, C+34, C+39, C+47, C+55, C+63, C+72, C+79, C+87, C+95, C+109, C+123, C+138, C+153, C+183, C+213, C+231, 및 C+278. 본 발명자들의 C-캡 주목은 -20번 잔기에서 개시함에 주목한다. 따라서, C-41, C-35, C-28, 및 C-21은 C-캡을 완전히 결여하고 마지막 완전한 34-잔기 TALE 반복체의 C-말단으로부터 제거된 20, 14, 7, 또는 0개 잔기들을 지닌 제작물을 나타낸다. 제작물들의 쌍들을 표적 부위들: 0, 2, 4, 7, 10, 14, 18, 23, 28, 및 34개 염기 쌍들 사이에 다음의 gap 공간들을 지닌 적절한 표적 부위들에 대해 시험하였다. 쌍들을 SSA 검정에서 및 또한 내인성 유전자위치에 대한 포유동물 세포내에서 리포터 유전자에 대해 시험하였다. C-캡들을 하기에 설명하며, 여기서 설명은 TALE DNA 결합 도메인의 마지막 완전한 반복체에서 개시하며 C 말단을 향한 지점들을 나타낸다.
C-캡들
실험에 대한 표적 부위들을 하기에 나타내며, 7 bp gap 공간을 지닌 쌍을 나타낸다. -C-16, C-21, C-28, C-35, 및 C-41 C-캡 제작물들은 쌍에서 각각의 TALEN 에 대한 반 반복체내 RVD를 제거하며 이러한 제작물들은 동일한 표적 DNA 서열에 대해 9 bp gap 공간을 효율적으로 갖는다. 시험한 모든 다른 gap 공간들에 대한 표적 부위들은 표적들 사이에 염기 쌍들을 제거하거나 시험할 gap 공간에 따라 추가의 염기 쌍들을 삽입함으로써 제작하였다.
TALEN 단백질들을 암호화하는 유전자들을 실시예 11 및 12에 기술된 바와 같이 조립하고 Cel-1 검정들로 평가하였다. 데이타는 하기 표 26a에 나타낸다. 나타낸 바와 같이, 본원에 기술된 TALE-단백질들은 반 반복체로 연장되는 절단들 및 내인성 유전자자리에 대해 기능성을 완전히 상실하지 않고 TALE 반복체 도메인 자체를 포함하는, 완전한 길이의 TALE-단백질들에 대해 C-말단 절단들을 견딜 수 있다.
[표 26a]
포유동물 세포들에서 TALEN 활성에 대한 C-캡의 효과
주: 숫자들은 Cel-I 검정으로 측정한 NHEJ 활성 퍼센트이다.
또한, C-말단 절단들든 하기 실시예 19에 기술된 바와 같이 DLSSA 검정에서 리포터 유전자에 대해 시험하였다. 당해 실험들에서, CCR5-특이적인 TALEN들의 4개 쌍들을 리포터 시스템에서 사용하였으며, 여기서 이들 쌍들의 표적 부위는 DLSSA 리포터 플라스미드들내로 제작하였다. 4개의 TALEN들의 결합 부위들은 위에 나타내며, TALEN들은 4개 쌍들, L543+R551 (쌍 1), L538+R551 (쌍 2), L543+R557 (쌍 3) 및 L538+R557 (쌍 4)로 사용하였다. Gap 공간들은 쌍들에 대한 결합 부위들 사이에 뉴클레오타이드들의 삽입 또는 결실에 의해 변화시켰다. 데이타는 하기 표 26 b 내지 e에 나타내며, 여기서 수치는 DLSSA 검정에 의해 검출된 상대적인 형광성 및 이에 따른 절단의 정도를 나타낸다. 모든 시료들을 이의 결합 부위가 또한 DLSSA 삽입체(양성 대조군)에 존재하는 대조군 TALEN 쌍에 대해 표준화하였다. 음성 대조군은 TALEN들의 부재하에서 수행된 검정이다. 리포터 #4는 내인성 서열로서 동일한 gap 서열들 및 정확한 DNA 결합 서열을 가지므로 내인성 유전자자리에서 Cel-I 데이타와 비교될 수 있다. 리포터 #4로부터 4개의 TALEN 쌍들의 DLSSA 데이타는 표 26a에 나타낸다. 이들 데이타는 리포터 시스템을 사용하여 발견된 결과들과 내인성 표적에서 관찰된 것들 사이의 일반적인 관련성을 설명하며, 이에 따라 리포터 시스템이 어떠한 내인성 검정에서 시험하기 위한 후보물 뉴클레아제들에 대한 스크리닝 도구로서 유용하다. 이는 정밀한 모델 세포들을 사용하는 시스템들에서 작업하는 경우 또는 의도된 표적 세포 유형이 이용불가능하거나 스크리닝 목적으로 사용되기 어려운 경우에 유용한 도구이다. 이는 또한, 표적 서열들이 내인성 게놈에서 이용불가능한 경우 TALEN 기술 플랫폼을 개발하여 최적화하는데 유용한 도구이다. 활성 뉴클레아제들은 DLSSA로 확인한 후 최종 평가를 위해 내인성 시스템내로 복사(port)할 수 있다.
[표 26b]
L543-R551 TALEN 쌍을 사용한 DLSSA 검정
[표 26c]
L538-R551 TALEN 쌍을 사용한 DLSSA 검정
[표 26d]
L543-R557 TALEN 쌍을 사용한 DLSSA 검정
[표 26e]
L538-R557 TALEN 쌍을 사용한 DLSSA 검정
따라서, Cel-I 및 DLSSA 결과들은, 적절한 C-캡이 사용되고 N-캡이 존재하는 경우 이들 단백질들이 실질적이고 강력한 활성을 가짐을 나타낸다. 또한, gap 공간들은 보다 큰 gap 공간들과 비교하여 C-말단 절단들의 보다 작은 소세트를 사용하여 활성인 보다 작은 gap 공간들을 사용하여 관찰된 최대 활성에서 역활을 담당할 수 있다. 또한, 본 발명자들은, 상대적인 DLSSA 활성이 동일한 온도(37℃)에서 수득된 동일한 TALEN들에 대한 내인성 활성과 선형으로 관련되어 있는 것으로 여겨지지 않는다. 리포터 결과들은 사람 세포들의 천연의 내인성 유전자자리에서 관찰된 것보다 C+153, C+183, C+213, C+231, 및 C+278 C-캡들을 지닌 제작물들에 대해 유의적으로 보다 높은 상대적인 활성을 수득한다. 따라서, 리포터 시스템들, 심지어 포유동물 세포들에서 리포터 시스템들에 있어서 활성은 포유동물 세포들에서 천연적으로 내인성인 활성을 필수적으로 예측하지 않는다.
실시예 15: 신규(비정형의) RVD들
대안적인(비정형의) RVD들을 이용하여 DNA 결합 특이성을 측정하는 위치들에서 다른 아미노산들이 변경될 수 있었는지를 측정하였다. 결합 활성이 SELEX 및 ELISA에 의해 중간 위치에서 미스매치에 대해 민감성인 것으로 밝혀진 TALE 결합 도메인을 제작하였다. 당해 단백질은 서열 5'-TTGACAATCCT-3'(SEQ ID NO:178)에 결합하였으며 서열들 5'-TTGACCATCCT-3'(SEQ ID NO:179), 5'-TTGACGATCCT-3'(SEQ ID NO:180), 또는 5'-TTGACTATCCT-3'(SEQ ID NO:181)에 대해 결합 활성을 거의 나타내지 않았다(도 27에 나타낸 ELISA 데이타). 이들 표적들은 중간 3중 핵산을 나타내는 CXA 표적들로 언급되며, 여기서 X는 A, C, T 또는 G이다.
이후에, 당해 TALE 골격을 사용하여 6번 위치에서 염기를 표적화하는 TALE 반복체에 대한 대안적인 RVD들(아미노산들 12 및 13)의 DNA-결합 특이성을 특성화하였다. 당해 RVD를 암호화하는 2개의 코돈들을 무작위처리하고 클론들을 서열분석에 의해 스크리닝하여 완전한 반복체 단위들이 존재함을 보증하였다. 이후에, 정확한 클론들은 표적 서열의 4개의 버젼들에 대해 DNA-결합 ELISA로 분석하였으며, 여기서 각각의 서열은 신규한(즉, 비정형의) RVD가 (즉 TTGACAATCCT (SEQ ID NO:178), TTGACCATCCT (SEQ ID NO:182), TTGACTATCCT (SEQ ID NO:183) 또는 TTGACGATCCT (SEQ ID NO:184))와 상호작용할 수 있는 위치에서 A, C, T 또는 G를 가졌다. 이들 연구들로부터의 결과들은 표 27a에서 하기 나타내며 당해 검정이, RVD VG가 T와 특이적으로 상호작용할 수 있으며, RG가 T와 상호작용할 수 있고, TA가 T와 상호작용할 수 있으며 AA가 A, C 및 T와 상호작용할 수 있음을 확인함였음을 입증한다.
[표 27a]
예시적인 신규한 RVD들
이들 초기 연구들에 이어서, 분석을 모든 강력한 RVD 조합들을 사용하여 수행하고 고 활성 및 특이성을 사용하여 수개를 확인하였다. 또한, 시험한 모든 염기들에 동등하게 잘 결합한 RVD들을 확인하였다. 이들 데이타는 하기 표 27b 및 또한 도28에 수치 양식으로 제공한다. 하기 나타낸 데이타에서, 모든 데이타는 배경 ELISA 시그날을 감하여 교정한 후 CAA 부위를 지닌 NI, CCA 부위를 지닌 HD, CGA 부위를 지닌 NN, 및 CTA 부위를 지닌 NG의 평균 값에 대해 표준화하였다.
[표 27b]
신규한
RVD
들
당해 데이타는 또한 도 28에 제공하며, 여기서 데이타는 20x20 격자로 나타낸다. RVD의 제1 아미노산(12번 위치)는 격자의 좌측에 나타내고 RVD의 제2 아미노산(13번 위치)은 격자 상단에 나타낸다. 각각의 격자내에서 문자들 A, C, G, 및 T의 크기는 CAA 부위, CCA 부위, 및 CGA 부위 및 CTA 부위 각각에 대한 표준화된 ELISA 시그날의 제곱근을 기본으로 하여 등급화하였다. 박스처리된 RVD들은 크산토모나스에 의해 암호화된 TALE 단백질들에서 발견된 흔히 발생하는 천연의 RVD들을 나타낸다. 많은 RVD들이 천연적으로 존재하는 HD, NI, NG, NS, NN, IG, HG, 및 NK RVD들과 관련하여 개선된 DNA 결합 특성들을 가진다. 예시적인 신규 RVD들 및 이들의 인지체 뉴클레오타이드 염기들이 포함되며, 여기서 N은 모든 염기들과의 양성 상호작용을 나타낸다:
연구들은 공지된 RVD들의 분석을 통해 후보물인 신규 결합제들인 것으로 가설화된 특수 서열들에 대한 RVD 서열들을 적절히 변경시키기 위해 수행되었다. 따라서, 다음의 RVD들이 시험되었다:
RVD
의도된 표적
올리고뉴클레오타이드들을 제조하여 상술한 TALE 제작물의 특이적인 변경을 허용하였다. 이후에, 이들 특이적인 올리고뉴클레오타이드들을 발현 벡터들내로 클로닝시키고 실시예 11에 기술된 바와 같이 조립하며, 수득되는 단백질 추출물들은 DNA-결합 ELISA 및 SELEX로 분석함으로써 RVD들의 결합 특성들을 측정하였다.
비정형 RVD들을 포함하는 12개의 이들 TALE DNA 결합 도메인들을 위에서 기술한 바와 같은 SELEX 분석에 적용시켰다. SELEX 분석으로부터의 결과들은 하기 표 28에 나타낸다. 표에서, 천연의 RVD에 대해 나타낸 데이타('RVD' 컬럼에서 굵은 글씨)는 예시적인 신규 RVD와 함께 나타내며 많은 경우들에서, 신규 RVD가 천연의 RVD와 비교하여 표적화된 염기들에 대해 동일하거나 보다 우수한 선호도를 입증함을 나타낸다.
[표 28]
신규 RVD들로부터의 SELEX 결과들
이후에, 이들 RVD들을 완전한 길이의 TALEN과 관련하여 활성에 대해 시험하였다. CCR5-특이적인 18 반복체 TALEN을 모든 신규한 RVD들을 사용하여 실시예 12에 기술된 CCR5-특이적인 TALEN과의 비교를 위해 생산하였다. 당해 TALEN 쌍에 대한 표적 부위들을 하기에 다시 나타낸다. 101041 TALEN 단량체는 변형된 파트너였던 반면 101047 파트너는 모두 천연 RVD들과 함께 남았다:
또한 전형적인 및 신규한(비정형) RVD들 둘다를 포함하는 CCR5-특이적인 TALEN들을 또한 CCR5 특이적인 TALEN들에서 제작하였으며, 여기서 신규 RVD들은 모든 하나의 유형, 예를 들면, 'T' 또는 'A'를 인지하는 모든 RVD들로 치환시켰다. 비정형 RVD들에 대해 실시예 11 및 12에 앞서 기술한 코드, 즉, A= NI, C= HD, G= NN, T= NG를 사용하였다. 신규한 RVD들의 경우, 다음을 당해 초기 분석에서 시험하였다: A= HI, NI 또는 KI; C= ND, KD, cND; G=SN, AK, DH, cHN, KN; T=TP, IA, VG, SGgs, 또는 IP. 보다 적은 경우 문자들이 사용된 경우, 이들은 RVD 위치들에 근접한 위치들의 변경들을 나타내는데, 예를 들면, "cND"는 반복체 단위내 11, 12 및 13번 위치가 변경되었음을 나타낸다. 이들 연구들을 위해, 후보체 RVD들을 표 27b에 나타낸 데이타로 선택하여 기본 단백질들의 증거를 생성하는데 사용하였다. 추가의 TALE 단백질들은 전체 세트로부터 대안적인 비정형 RVD들을 사용하여 제작할 수 있다. 또한, 비정형 RVD들을 선택하여 염기를 규정하는 RVD들의 혼합물이 생성될 수 있도록 할 수 있다(예를 들어, 하나의 TALEN 단백질은 TP 및 IA RVD들 둘다를 사용하여 제작하여 상이한 위치들에서 'T'를 규정할 수 있다).
반복체 단위들에 대한 RVD 서열들은 하기 표 29a 내지 29c에 나타내며 모든 돌연변이된 위치들은 굵은 서체로 나타낸다.
[표 29a]
모든 신규한(비정형) RVD 치환
[표 29b]
치환들 유형
[표 29c]
단일의 RVD 치환들
이후에, 이들 신규한 TALEN들을 30 및 37℃에서 내인성 CCR5 유전자자리에 대한 절단 활성에 대해 시험하고, 앞서 기술한 바와 같이 Cel-I 검정으로 분석하며 NHEJ를 유도하는데 있어서 활성임을 입증하였다(예를 들면, 도 30 참조). 표지되지 않은 레인은 골격 이동 돌연변이를 지닌 비-기능성 TALEN 제작물을 나타냄에 주목한다.
결과들은, 신규(비정형)의 RVD들이, 각각의 TALE-반복체 단위가 신규의 RVD를 포함하는 TALEN 단백질들에서 및 또한 유형이 치환되거나 단독 치환된 TALEN들에서 사용된 경우 DNA를 절단할 수 있다.
실시예 16: 신규한 TALE C-말단 반 반복체들
천연의 TALE들 중 대부분은 C-말단 반 반복체에서 NG RVD를 사용하여 T 뉴클레오타이드 염기와의 상호작용을 명시한다. 따라서, 신규한 C-말단 반 반복체들의 생성을 시험하여 TALE 표적화의 확장을 허용하였다. Pou5F1 및 PITX3 유전자들을 표적화하는 TALEN들을 골격으로서 사용하고, C-말단 반 반복체(C-캡 아미노산들 C-9 및 C-8)내 RVD를 변경시켜 대안적인 핵산들을 명시하였다. 이들 돌연변이체들에서, NI RVD를 삽입하여 A, C의 경우 HD, G의 경우 NK를 인지하였으며 대조군은 T의 경우 NG였다. 사용된 TALEN들은 15개 내지 18개 사이의 RVD들을 함유하였으며 이들 2개의 유전자들에서 각종 표적 서열들을 표적화하였다.
결과들은 도 29에 나타내며 C-말단 반 반복체내에서 RVD 위치는 단지 T 이외의 뉴클레오타이드 염기들과 상호작용하도록 가공하거나, 모든 염기들을 균일하게 인식하도록 설계할 수 있다. 당해 Cel-I 검정으로 측정된 것으로서, 레인 지정들, 표적 서열들 및 NHEJ %는 하기 표 30에 나타낸다.
[표 30]
신규한 C-말단 반 반복체 표적들
당해 데이타는, 신규한 반 반복체들을 갖는 TALEN들이 이들의 각각의 표적들을 절단할 수 있음을 입증한다.
실시예 17: 최적의 표적 서열들의 확인
최적의 표적 서열들을 측정하고, 따라서, 최적의 TALEN 단백질 설계를 위해서, 인 실리코(in silico) 분석을 다중 SELEX 검정들로부터의 결과들을 사용하여 수행함으로써 i) R1 반복체(N-말단 반복) 단위에 대한 가장 우수한 표적 및 ii) 이합체 및 삽합체 셋팅들에서 이들의 이웃하는 반복체 단위들과 관련하여 특이적인 RVD 반복체들이 거동하는 방법을 측정하였다. 이들 연구들에서, NI RVD는 A, C의 경우 HD, G의 경우 NN, 및 T의 경우 NG를 인지하는데 사용하였다.
결과들은 표 31, 32 및 33에 요약한다. 표 31에서의 값들은 표적화된 염기의 관측된 빈도와 변화(즉, 0.25)에 의해 예측된 염기의 빈도 사이의 비의 알고리즘(기본 4)로 계산한 로그-승산비 점수(log-odds score)들이다. 1.0의 점수는, 표적화된 염기가 시간의 100%(즉, 변화에 의해 예측된 것보다 4배 많은 빈도)로 관찰되었음을 나타낼 수 있고, 0.0의 점수는, 표적화된 염기가 시간의 25%로 관찰되었음을 나타낼 수 있으며, 음성 점수는, 표적화된 염기가 시간의 25% 미만으로 관찰되었음을 나타낼 수 있다. 표 31에서의 값들은 62개의 별개의 TALE 단백질들로부터의 SELEX 데이타로 이루어진 데이타 세트의 적절한 위치들에 대한 평균 염기 빈도로부터 계산되었다. "R1 RVD"로 표지된 값들은 N-말단 TALE 반복체(및 각각의 결합 부위에서 인지체 위치)를 말한다. "R2+ RVD"로 표지된 값들은 모든 다른 RVD들(및 각각의 결합 부위에서 인지체 위치들)을 말한다. 이러한 데이타는, 다른 모든 위치들에 대한 N-말단 위치에서 HD, NN, 및 NG RVD들을 지닌 TALE 반복체들의 특이성에 있어서의 현저한 차이를 나타낸다.
표 32 및 33에 나타낸 값들은 이합체(표 2) 또는 삽합체(표 33) 세팅에서 점수에 대해 독립적으로 각각의 염기에 대해 측정되고 67개의 별개의 TALE 단백질들에 대한 SELEX 데이타로부터 측정된 로그-승산비 점수들에 있어서의 변화를 나타낸다. 따라서, HD RVD에 인접한 NN RVD에 대한 -0.12 값(NN RVD는 제작물의 N-말단에 가깝고 HD RVD는 제작물의 C-말단에 더 가깝다)은, 이합체내 위치들 둘다에 대한 로그-승산비 점수들의 합이, 이들 2개의 RVD들이 서로 독립적으로 거동하는 경우 예측될 수 있는 0.12 미만이었음을 나타낸다. 유사하게, 표 33c에서 -0.34 값은 제2의 NN RVD에 의해 N-말단 측면에서 플랭킹되고 HD RVD에 의해 C-말단 측면에서 플랭킹된 NN RVD가, 목적한 NN RVD가 모든 NN RVD들에 대한 평균 값보다 0.34 미만의 로그-승산비 점수들을 가짐을 나타냄을 나타낸다. 표 32, 33a, 33b, 33c, 및 33d에서, 음성 값들은, 이들이 서로 완전하게 독립적인 경우보다 더 불량하게 수행하는 인접한 RVD들의 조합들을 나타낸다.
[표 31]
단일 위치들에서 RVD 특이성에 대한 로그-승산비 점수들
[표 32]
2개의 인접한 RVD들에 대한 RVD 특이성에 대한 로그-승산비 점수들에 있어서의 변화
[표 33a]
중간에서 삼량체 위치들, NI(A)에서 RVD 특이성에 대한 로드-승산비 점수들에 있어서의 변화
[표 33b]
중간에서 삼량체 위치들, HD(C)에서 RVD 특이성에 대한 로그-승산비 점수들에 있어서의 변화
[표 33c]
중간에서 삼량체 위치들, NN(G)에서 RVD 특이성에 대한 로그-승산비 점수들에 있어서의 변화
[표 33d]
중간에서 삼량체 위치들, NG(T)에서 RVD 특이성에 대한 로그-승산비 점수들에 있어서의 변화
주: 표 33a 내지 33d에서, 이태릭체는 데이타세트에서 3 미만의 값들을 나타내고, 여기서 모든 다른 수들은 가능성 변화들을 측정하는데 사용된 적어도 3개의 값들을 함유한다.
이들 결과들은, 최적의 반복체 단위 결합 및 최적의 단백질 설계/표적 확인에 대한 상황 의존성(context dependency)이 존재하고, 반복체 단위들은 완전하게 모듈러(modular)가 아님을 입증한다. 전체적으로, 이들 데이타는 특수 TALE에 대해서 및 최적의 TALEN들을 설계하기 위한 표적 선택 둘다를 최적화하는 설계 규칙들을 제안하는데 사용될 수 있다. 예를 들면, NI는 가장 적은 상황 의존성 RVD이며 R1 위치에서 가장 우수한 RVD는 NI(예를 들면, 이상적인 표적 부위들은 TA로부터 출발하여 R0 및 R1-NI를 수용해야 한다)이다. AC, AT, CC, CA, TA, AA는 표적에 대해 가장 우수한 이합체들인 반면 GG, GC, AG, TT, CG, GT, 및 TC는 최악인 것으로 여겨진다. 3문자들 측면에서, AAC, ATG, GCA, ATA, ACG, 및 ATC는 표적에 대해 가장 우수한 3문자들인 반면 GGC, AGC, TGC, TTT, GGA, AGT, GGT, GGG, TCT, GTC, CTT, 및 AGG는 최악인 것으로 여겨진다. 따라서, 이들 설계 규칙들을 합하여 최적으로 결합하는 TALEN들을 생성할 수 있다. 유사하게, 표 28에서 NK, AK, 및 DK RVD들을 사용한 SELEX 연구들 및 NK RVD를 사용한 SELEX 연구들(도 17a)은 13번 위치에서 라이신(K)을 가진 RVD들이 A보다는 G를 명시하기 위해 NK, AK 또는 DK RVD에 대해 NI RVD들 C-말단에 인접하도록 하는 경향이 있음을 나타낸다. 따라서, 전형적인 RVD들 및 NK RVD들에 대해 측정된 설계 규칙들은 또한 13번 위치에서 동일한 잔기를 가진 비정형 RVD들에 적용시킬 수 있다.
실시예 18: 사람 줄기 세포들에서 TALEN-구동된 표적화된 통합의 입증
TALEN 시스템의 다양성을 입증하기 위하여, TALEN들을 사용하여 사람 배아 줄기 세포들(ESC) 및 유도된 다능성 줄기 세포들(iPSC)내에서 표적화된 통합을 구동시켰다. 사람 ESC들 및 iPSC들을, 제한 부위를 추가로 포함하는 푸로마이신 공여체 핵산을 푸로마이신 마커의 발현이 AAVS1 프로모터에 의해 구동되는 AAVS1 유전자자리내로 표적화된 통합시키기 위해 사용하였다. 공여체들 및 후속된 방법들은 공동 소유의 WO 2010117464[참조: 또한 Hockemeyer et al (2009) Nat Biotechnol 27(9): 851-857, 여기서 본 발명자들은, AAVS1 유전자자리 내로 이러한 제작물의 표적화된 통합의 자발적인 빈도가 본 발명자들의 검정의 검출 한계 미만임을 입증하였다]에서 앞서 기술된 것들이었다. 사용된 뉴클레아제들은 실시예 11에 기술된 바와 같은 AAVS1 유전자자리에 대해 특이적인 TALEN들이었으며, 표적 결합 부위는 하기에 나타낸다:
우선, 당해 유전자자리를 푸로마이신 내성 유전자(PURO)가 단지 정확한 표적화 현상이 단지 수반되는 내인성 PPP1R12C 프로모터의 제어하에서 발현된 유전자 트랩 시도(gene trap approach)를 사용하여 표적화하였다. 둘째로, PPP1R12C 유전자자리는 포스포글리세레이트 키나제(PGK) 프로모터로부터의 푸로마이신 내성 유전자 PURO를 발현한 자가 선택 카세트를 사용하여 표적화하였다. 푸로마이신 내성 세포들의 클론들을 성장시키고 표준 방법들을 사용하여 제한된 DNA에 대한 서던 블롯으로 스크리닝하였다. 당해 실험에서 사용된 프로브(probe)는 PPP1R12C/AAVS1 유전자자리에 대한 것이었으며 혼입된 공여체를 지닌 DNA의 작은 제한 단편인 서열을 인지하였다(따라서 보다 높은 이동성을 가졌다). 표적화 효율은 사용된 공여체와는 고 독립성이었으며, 분리된 클론들의 대략 50%는 이종 또는 동종의 정확하게 표적화된 현상들을 지니며 목적하는 유전자자리에서만 삽입유전자를 수반하였다. 당해 효율은 ZFNs을 사용하여 앞서 관찰된 것과 비교가능하다. PPP1R12C 유전자자리에 대한 표적화는 도입된 삽입유전자의 발현을 생성하였다. 향상된 녹색 형광성 단백질(eGFP)의 균일한 발현은, 구성적 eGFP 발현 카세트를 추가로 수반하는 SA-PURO 공여체 플라스미드들로 표적화하는 경우 hESCs 및 iPSC에서 관찰되었다. 중요하게는, TALEN들을 사용하여 유전적으로 조작된 hESC들은 다능성 마커들 OCT4, NANOG, SSEA4, Tra-1-81 및 Tra-1-60의 이들 발현에 의해 나타난 바와 같이 다능성으로 남았다.
TALEN들을 사람 OCT4 유전자(OCT4-Int1-TALEN)의 제1 인트론에 대해 설계하였고 표적 서열을 3개의 상이한 플라스미드들과 함께 하기에 나타낸다:
TALEN들은 +63 C-캡을 이용하였으며 대표적인 RVD들(표적 A, C, G, 및 T 각각에 대한 NI, HD, NN, 및 NG)를 사용하였다. 101125는 15.5 TALE 반복체들을 포함하였으며 101225는 16.5 TALE 반복체들을 포함하였다. 101225는 NN RVD를 지닌 반 반복체를 이용함으로써 이의 표적 위치에서 3'G를 인지하였다.
정확한 표적화 현상들은 내인성 OCT4 프로모터의 제어하에서 푸로마이신 및 OCT4 exon1-eGFP 융합 단백질의 발현에 의해 특징화된다. 제1의 2개의 공여체 플라스미드들을 설계하여 스프라이스 수용체 eGFP-2A-자가-절단 펩타이드(2A)-푸로마이신 카세트를 OCT4의 제1 인트론내로 통합시키고, 동족체 아암(arm)들의 설계시 단독으로 차등화하였지만, 제3의 공여체는 eGFP-2A-푸로마이신 카세트의 판독 프레임에 대한 엑손 1의 직접적인 융합체를 생성하도록 가공하였다. 이들 전략들 둘다는 서던 블롯 분석 및 단일-세포-기원한 클론들의 DNA 서열분석에 의해 측정된 것으로서 OCT4 유전자자리 외에 정확한 표적화된 유전자를 생성하였다. 표적화 효율들은 hESC들 및 iPSC들 둘다에서 67% 내지 100%의 범위이었다.
TALEN들을 사용하여 hESC들에서 발현되지 않은 유전자위치를 유전적으로 가공할 수 있는지를 시험하기 위해, TALEN들을 가공하여(101125 및 101225에 대해 사용된 동일한 설계 및 조립 과정을 사용) PITX3 유전자의 제1의 암호화 엑손내에서 절단하였다. 표적 서열들은 하기 나타낸다:
전기천공 후에, 표적화 현상들을 서던 블롯 분석에 의해 외부 5' 및 내부 3' 프로브를 사용하여 평가하였다. PITX3에서 단독으로 공여체-명시된 eGFP 삽입유전자를 단독으로 수반하는 단일-세포-기원한 클론들을 시간의 평균 6%로 수득하였다. 특히, 분석된 96 hESC 클론들 중 하나는 PITX3 Exon1(WI#3에서) hESC들의 대립형질들 둘다에서 삽입유전자를 수반하였으며, 발현되지 않은 유전자의 대립형질들 둘다의 1 단계의 성공적인 유전적 변형을 입증하였다.
이들 결과들은 줄기 세포들의 게놈내로 표적화된 통합을 구동시키기 위해 TALEN들을 사용하는 능력을 입증한다.
실시예 19:생체내에서 수정되는 TALEN 매개된 유전자의 예들
C. 엘레간스(C. elegans)에서 수정되는 TALEN 게놈. TALEN들이 생체내 유전자 수정을 위해 동물들에서 사용될 수 있는지를 입증하기 위해, 다음 실험들을 수행하였다. 카에노르하브디티스 엘레간스(Caenorhabditis elegans) ben -1 돌연변이에 대해 특이적인 TALEN 쌍을 RNA로서 전달하고 문헌[참조: Driscoll et al ( (1989) J. Cell. Biol. 109:2993-3003]에 기술된 바와 같이 베노밀 내성에 대해 스크리닝하였다. ben-1 돌연변이체 표현형은 우성이며 통상의 해부 현미경하에서 후대세포중 100%에서 가시적이다. 요약하면, 야생형 C. 엘레간스 자웅동체들을 TALENs 표적화 ben-1을 암호화하는 mRNA들을 주입하기 전에 통상의 NGM 아가 플레이트들에 길렀다.
TALEN들을 암호화하는 핵산들을 표준 제한 클로닝 과정들을 사용하여 SP6 시험관내 전사 벡터(IVT)내로 삽입하였다. ICT 벡터 골격은 pJK370로부터 기원하였으며 배선 해독을 지지하기 위해 앞서 나타낸 5' 및 3' UTR 서열들을 함유한다[참조: Marin and Evans (2003) Development 130: 2623-2632]. 5' CAP 구조들 및 폴리 A를 함유하는 mRNA들의 생산을 시험관내에서 mMessage mMachine®(제조원: Ambion) 및 폴리A 테일링 키트들(제조원: Ambion)을 사용하여 수행하고 NanoDrop 분광기(제조원: Thermoscientific)를 사용하여 정량화하기 전에 Ambion MEGAClearTM 컬럼 위에서 정제하였다. mRNA 주입물들을 짜이즈 악시오버트(Zeiss Axiovert) 현미경 하에서 나리쉬지(Narishige) IM300 주입기를 사용하여 수행하였다. mRNA들의 주입은 다음의 차이점들을 지닌 표준 C. 엘레간스 DNA 주입 프로토콜들[참조: Stinchcomb et al. (1985) Mol Cell Biol 5:3484-3496]에 따라 수행하였다: 조절인자를 조정하여 N2 가스 탱크로부터의 압력이 60 psi가 되도록 하였다. P주입 및 P균형 측정들을 15 psi 및 2 psi 각각으로 조정하였다. 이들 압력 값들은 벌레 생식샘내로 유액의 보다 온화한 방출을 허용하기 위한 DNA 주입들을 위해 통상적으로 사용된 것들보다 더 낮다. 모든 mRNA들을 500 ng/μL에서 주입하고, TALEN을 암호화하는 모든 mRNA를 쌍들로 주입함으로써, 침내 총 mRNA 농도는 1000 ng/μL이었다.
mRNA 주입에 이어서, 동물들을 7μM 베노밀을 함유하는 플레이트들로 이전시켰다. F1 자가-후대세포는 동물의 내부 부위를 접촉시킴으로써 어린 성충으로서 스크리닝하였다. 이종 돌연변이체 동물들은 다수의 사인곡선-형 운동들을 사용하여 거꾸로 반응한 반면, 야생형 동물들은 마비되어 당해 능력을 상실한다. 마비되지 않은 F1 동물들을 표적 부위(위에서 기술된 바와 같음)의 PCR/Cel-I 분석에 대해 개별적으로 분해하거나, 신선한 베노밀 플레이트들 및 표적 부위에 걸쳐 서열분석함으로써 마비되지 않은 F2로부터 분리한 동종접합체들로 개별적으로 전달하였다. 101318/101321로 지정된 하나의 TALEN 쌍은 ben-1 돌연변이 표현형의 역전을 유발하였으며, F1 후대는 베노밀에 대해 내성인 것으로 밝혀졌다. 베노밀 내성 동물들의 서열 분석은 표적 위치에서 2개의 상이한 보나-피드 인델(bona fide indel)들을 나타내었다. 당해 TALEN 쌍에 대한 표적 부위에서의 유전자자리는 하기 나타내며, 이들의 서열들은 실시예 23에 나타낸다.
이들 데이타는, TALEN들이 생체내에서 게놈 수정할 수 있음을 입증한다.
랫트들에서 TALEN 게놈 수정. 다음에, TALEN들을 사용하여 랫트 게놈을 수정하였다. 내인성 랫트 IgM 유전자에서 엑손 2를 표적화하는 랫트 IgM-특이적인 TALEN 쌍 101187/101188은 상기 실시예 11 및 12에서 앞서 기술한 바와 같이 제작하였다. 랫트 게놈에서 표적 서열은 하기에 나타내며, 여기서 굵은 대문자들은 TALE DNA 결합 도메인에 대한 표적 부위를 나타내고 소문자들은 gap 또는 스페이서 영역을 나타낸다:
이후에, 이들 TALEN 쌍을 암호화하는 핵산들을 문헌[참조: Menoret et al (2010) Eur J Immunol. Oct;40(10): 2932-41]에 기술된 바와 같이 랫트 배아내로 주입하였다. TALEN들을 암호화하는 핵산들을 전핵(pronuclear)(PNI, DNA) 또는 세포질내(IC, RNA) 주입으로서 하기 표 35에 나타낸 투여량으로 주입하였다.
[표 34]
랫트 IgM-특이적인 TALEN들의 경로 및 투여량
* 주: 모든 예측된 모체들은 전달되지 않았다, ND=측정되지 않음
주입된 배아들의 퍼센트를 가임신 암컷 랫트들내로 이식하고 수득되는 신생쥐들을 게놈 수정에 대해 검정하였다. DNA를 전핵 DNA 주입물들로부터 생성된 새끼들로부터 분리하여 문헌[참조: Kim et al (2009) Genome Res. 19(7): 1279-1288]에 기술된 바와 같은 T7 미스매치 분석에 적용시켰다. 요약하면, PCR을 프라이머 세트 GJC153F-154R을 사용하여 수행함으로써 371bp PCR 생성물을 생성시켰다. 프라이머 쌍은 하기 나타낸다:
GJC 153F 프라이머: 5' ggaggcaagaagatggattc (SEQ ID NO:453)
GJC 154R 프라이머: 5'gaatcggcacatgcagatct (SEQ ID NO:454)
당해 분석의 경우, 표준 실시에 의해 분리된 100 ng의 테일 gDNA를 사용하였다. 잠재적인 이종이중쇄들이 다음과 같은 PCR 생성물 5μl를 사용하여 형성되도록 하였다: 95℃/95℃ 내지 85℃(-2℃/초)/85℃ 내지 25℃(-0.1℃/초)/4℃에서 2'. 이후에, 이를 T7 엔도뉴클레아제 I(NEBiolabs ref: M0302L)으로 다음 조건들하에 분해하였다: 5μl의 PCR 이종이중쇄 + 1μl의 10xNEB2 + 0.5μl T7 엔도 + 3.5μl H2O/37℃에서 20'. 분해 후, 반응물을 0.5x TAE 속에서 1.2% 아가로즈 겔 위에서 이동시켰다. 분석된 66마리의 새끼들 중 7마리가 T7 검정에 의한 NHEJ 활성에 대해 양성이었으며(도 31에 나타냄) 서열분석은 NHEJ 관련된 InDels(즉, 랫트 3.3에서 1bp 결실 및 랫트 3.4에서 90 bp 결실)의 존재를 나타내었다.
TALEN 쌍들을 또한 목적한 핵산을 사용한 랫트 세포들내로의 표적화된 통합을 위해 사용하여 유전자삽입 동물들을 생성하였다. TRALEN 쌍에 의해 표적화된 랫트 세포들은 랫트 배아 줄기 세포들이며, 유도된 다능성 줄기(iPS) 세포로 전환가능한 어떠한 랫트 세포 유형 또는 하나 이상의 세포화된 GFP-함유 랫트 배아이다. TALEN 쌍은 세포로 전달되며, 최적으로 CAG 프로모터, mRNA를, 최적으로 5' cap 구조 및 3' 폴리아데노신 테일, TALEN 개방 판독 프레임들을 암호화하는 핵산을 함유하는 정제된 단백질 또는 바이러스 입자들과 함께 함유하는 플라스미드 DNA일 수 있다. 공여체 DNA는 파괴 부위의 양쪽 측면들에서 50 내지 1000bp의 상동성을 함유하는 일본쇄 또는 이본쇄 선형 플라스미드 DNA 또는 파괴 부위의 양쪽 측면들에서 50 내지 1000bp의 상동성을 함유하는 일본쇄 또는 이본쇄 원형 플라스미드 DNA일 수 있다. TALEN 및 공여체는 랫트 세포들 또는 배아들의 미세주입, 랫트 세포들의 전기천공, 지질-계 막 융합, 인산칼슘 침전, PEI 등을 통한 형질감염, 정제된 뉴클레아제 단백질과의 항온처리(예를 들면, 세포를 침투하는 펩타이드에 융합된 경우), 또는 바이러스를 사용한 랫트 세포들 또는 배아들의 감염에 의해 전달된다. 이들 방법들은 당해 분야에 공지되어 있다. 주입된 또는 형질감염된 세포들 또는 배아들로부터 변형된 랫트를 생성하는 수단들은 선택된 전달 방법에 의존할 것이다. 배아들의 경우, 배아들은 가-임신 랫트의 자궁으로 이식될 것이며 앞서 기술된 기간이 되도록 할 것이다. 변형된 세포들의 경우, 3개월이면 가능하다: a) 랫트 세포들이 배아 줄기 세포들인 경우, 랫트 배반포들에게 변형된 랫트 줄기 세포들을 주입한다. 배반포들은 가임신 랫트의 자궁내로 이식되어 기간이 되도록 할 것이다; b) 세포(또는 이의 핵)은 제핵된(enucleated) 난모세포(체세포 핵 전달)로 미세주입되어야 하며 수득되는 배아는 가-임신 랫트의 자궁내로 이식되어 기간이 되도록 할 수 있거나 c) 세포를 iPS 세포로 전환시키고 랫트 배반포내로 주입하여야 한다. 배반포들은 가-임신 랫트의 자궁내로 이식되어 기간이 되도록 할 것이다. 이후에, 새끼들을 PCR 또는 당해 분야에 공지된 어떠한 다른 수단들에 의해 삽입유전자의 존재에 대해 검정한다.
식물들에서 TALEN 게놈 수정. 지. 마이즈(Z. maize) RPD1 및 C1 유전자들에 대해 특이적인 TALEN 쌍들을 상기 실시예 11에서 기술한 바와 같이 제작하였으며 이들의 표적 서열들은 RPD1 유전자자리(서열 번호: 382 내지 387)와 비교하여 하기 나타낸다:
C1 유전자자리에 대해 이루어진 TALEN 쌍들은 하기 유사하게 나타낸다(SEQ ID NO:388 내지 390):
추가의 TALEN 쌍들은 다음과 같이 C1 유전자자리에 대해 제조하였다(SEQ ID NO:391 내지 398):
식물 특이적인 TALEN 쌍들을 포유동물 신경 2A 세포들에서 이중-루시퍼라제 일본쇄 어닐링 검정(Dual-Luciferase Single Strand Annealing Assay)(DLSSA)을 사용하여 활성에 대해 분석하였다. 이는 일시적으로 형질감염된 세포들에서 ZFN 또는 TALEN 활성들을 정량하기 위해 사용된 신규 시스템이며, 업자(Promega)로부터의 Dual-Luciferase Reporter® 검정 시스템을 기본으로 한다(참조: 실시예 13). 당해 시스템은 단일 튜브(웰)내에서 2개의 개개 리포터 효소들, 개똥벌레 및 레닐라 루시퍼라제들의 연속적인 측정을 허용한다. 개똥벌레 및 레닐라 루시퍼라제 리포터들 둘다를 재가공하고 검정 조건들을 최적화한다. 개똥벌레 루시퍼라제 리포터 제작물은 ZFN 또는 TALEN들에 대한 DNA 결합 부위들에 의해 분리된 개똥벌레 암호화 영역들의 2개의 불완전한 카피들을 함유한다. 당해 연구에서, 5' 카피는 개똥벌레 유전자의 N-말단 부위의 대략 2/3으로부터 기원하고 3' 카피는 개똥벌레 유전자의 C-말단 부분의 대략 2/3로부터 기원한다. 2개의 불완전힌 카피들은 약 600-bp의 동족체 아암들을 함유한다. 분리된 개똥벌레 단편들은 루시퍼라제 활성을 가지지 않는다. ZFN 또는 TALEN 쌍에 의해 유발된 DNA 이본쇄 파괴는 일본쇄 어닐링 경로에 의한 플랭킹 반복체들 사이의 재조합을 자극할 것이며 이후 개똥벌레 루시퍼라제 기능을 회복할 것이다. 동시-형질감염된 레닐라 루시퍼라제 플라스미드는 내부 대조군을 제공한다. 각각의 리포터의 발광 활성은 발광계에서 판독된다. 내부 대조군(레닐라)의 활성에 대한 실험 리포터의 활성의 표준화는 세포 생존능 및/또는 형질감염 효능에 있어서의 차이들에 의해 유발된 실험적 가변능을 최소화한다. 표준화된 값을 사용하여 제공된 ZFN 또는 TALEN 쌍의 활성을 측정한다. 이는, 정밀한 모델 세포들을 지닌 시스템들내에서 작업하거나 의도된 표적 세포 유형이 유용하기 않거나 서열분석 목적으로 사용되기 어려운 경우 유용한 도구이다. 이는 또한, 표적 서열들이 내인성 게놈에서 이용가능하지 않은 경우 TALEN 기술 플랫폼을 개발하고 최적화하는데 유용한 도구이다. 활성 뉴클레아제들은 DLSSA에 의해 확인된 후 최종 평가를 위한 내인성 시스템내로 복사될 수 있다. 식물 표적들에서 활성 TALEN 쌍들은 하기 표 35a에 나타낸다.
[표 35a]
식물 TALEN
*주: 당해 검정에서 활성은 루시퍼라제 SSA 검정에서 상대적인 단위들로 측정된다.
이후에, TALEN 쌍들을 금-입자 충격을 통해 표준 방법[참조: Frame et al, (2000) In vitro cellular & developmental biology. 36(1): 21-29]을 사용하여 옥수수 Hi II 배아들로 전달하였다. TALEN 쌍당 총, 약 90개의 수분된 옥수수 배아들을 형질전환하고 약 7일 동안 게놈 DNA 추출을 위해 혼주(pooling) 및 액체 N2 속에서 동결시키기 전에 캘루스(callus) 개시 배지 위에서 성장하도록 하였다. 게놈 DNA를 DNeasy Plant Miniprep kit(제조원: Qiagen)를 사용하여 충격을 가한 플레이트당 4 내지 6개의 동결된 배아들로부터 분리하였다. 이후에, 각각의 TALEN 표적을 2단계 PCR에 의해 3개의 생물학적 삼중쇄(triplicate)들로 이루어진 혼주된 게놈 DNA로부터 고-충실성 푸션 핫 스타트 II 폴리머라제(High-Fidelity Phusion Hot Start II Polymerase)(NEB)를 사용하여 2-단계 PCR 라운드로 증폭시켰다. 제1 라운드에서, 각각의 부위는 400ng의 게놈 DNA를 사용하여 20-주기 PCR속에서 증폭시키고 프라이머들은 표 35b에 나열하였다. 제2 라운드에서, 추가의 20 주기들을 1μl의 제1 PCR로부터의 생성물 및 프라이머들 SOLEXA-OUT-F1 및 SOLEXA-OUT-R1을 사용하여 수행함으로써 완전한 일루미나 서열분석 앰플리콘(Illumina sequencing amplicon)들을 생성하였다. 이후에, 수득되는 PCR 생성물들을 퀴아퀵 PCR 정제 컬럼(Qiaquick PCR Purification column)(제조원: Qiagen)들 위에서 정제하고, 각각 50nM로 표준화하고, 동 용적들 속에서 합하여 총 8개 부위들이 단일 일루미나 레인에서 서열분석되도록 하였다. 처리되지 않은 게놈 DNA로부터의 대조군 앰플리콘들을 별도의 레인에 넣었다. 일루미나 단일-판독 100bp 서열분석을 ELIM 바이오파마슈티칼스(ELIM Biopharmaceuticals)(캘리포니아주 하이워드 소재)에서 수행하였다.
[표 35b]
일루미나 서열분석에 사용된 올리고뉴클레오타이드 프라이머들의 서열들
서열분석은 하기 표 36에 나타낸 바와 같이 TALEN 처리된 배아들로부터의 세포 혼주물들에서 다수의 InDels의 존재를 나타내었다. 서열 분석의 세부사항들은 다음과 같다: TALEN 처리된 제아 마이즈(Zea maize) 배아들로부터 기원한 바코드처리한 서열들을 함께 혼주시키고 일루미나 GA2 서열분석기(Illumina GA2 sequencer) 위에서 100bp 판독-길이 서열분석에 넣었다. 모의 처리된 제아 마이즈 배아들로부터 기원한 바코드 처리된 서열들을 함께 혼주시키고 동일한 일루미나 GA2 서열분석기의 별개의 레인 위에서 100bp 판독-길이 서열분석에 넣었다. 각각의 수득되는 데이타 파일에서 서열들을 바코드로 분리하고 변형되지 않은 게놈 서열에 대해 정렬하였다. 배아들의 소 분획들은 배아의 대부분에 대해 C1 유전자에서 3bp 삽입체를 함유하였다. 예측된 TALEN 절단 부위들 위에 집중된 10bp 윈도우(window)내에서 적어도 2개의 연속 삽입되거나 결실된 염기들로 이루어진 InDels을 강력한 NHEJ 현상들로 고려하고 추가로 가공하였다. 제공된 TALEN 처리된 시료 및 인지체 모의 처리된 시료 둘다에서 유사한 빈도로 발생한 InDels을 서열분석 인공물들로 고려하여 폐기하였다.
[표 36]
TALEN 처리된 옥수수에서 InDels
표 37은 상기 나타낸 8개 시료들에서 가잔 우수하게 관찰된 InDels을 나타내며, TALEN들이 유전자 표적물들 및 모든 쌍들의 뉴클레아제들을 사용하여 NHEJ를 유도시킬 수 있었음을 입증한다. 각각의 시료의 경우, 변경되지 않은 게놈 서열은 밑줄친 2개의 TALEN 결합 부위들 사이의 gap으로 나타낸다. 결실된 염기들은 쉼표로 나타내고 삽입된 염기들은 삽입된 서열의 말단을 나타내는 "{"삽입된 서열의 출발을 나타내고"}"을 사용하여 괄호로 나타낸다.
[표 37]
옥수수 시료들에서 관찰된
InDels
처리된 S1 TALEN (유전자 표적: C1, TALEN 쌍 101370/101371)
처리된 S2 TALEN (유전자 표적: C1, TALEN 쌍 101378/101379)
처리된 S3 TALEN (유전자 표적: C1, TALEN 쌍 101380/101381)
처리된 S4 TALEN (유전자 표적: RPD1, TALEN 쌍 101388/101391)
처리된 S5 TALEN (유전자 표적: RPD1, TALEN 쌍 101389/101391)
처리된 S6 TALEN (유전자 표적: RPD1, TALEN 쌍 101389/101393)
처리된 S7 TALEN (유전자 표적: RPD1, TALEN 쌍 101390/101391)
처리된 S8 TALEN (유전자 표적: RPD1, TALEN 쌍 101390/101393)
InDel 빈도는 모든 시료들에서 유사하였다(5,400 현상들 중 1개에 대해 11,000개 현상들 중 약 1 또는 0.0087% 내지 0.0185%). 이는, 제한하는 인자가 TALEN 활성보다는 오히려 옥수수 배아들로의 바이오리스틱스(biolistic) 전달이다. TALEN 처리된 제아 마이즈 배아들로부터 기원한 바코드처리된 서열들을 함께 혼주시키고 일루미나 GA2 서열분석기 위에서 100bp 판독-길이 서열분석을 위해 넣었다.
다음에, 이들 TALEN들을 사용하여 TALEN들에 의해 생성된 DSB내로 목적한 특정의 바람직한 DNA의 표적화된 통합(TI)를 구동시킨다. TI는 단자엽 또는 쌍자엽 식물들에서 당해 분야에 공지된 방법들[참조: 예를 들면, Shukla et al (2009) Nature 459:437 및 Cai et al (2009) Plant Mol Biol 69:699]을 사용하여 달성할 수 있다. 신규한 식물 종들은 또한, 목적하는 경우, 선택된 TALEN에 대해 안정하게 유전자삽입성이도록 생성되어 TALEN 균주의, 돌연변이가 요구되는 다른 균주로의 교배를 허용한 후, 후대를 분리함으로써 일부 후대가 목적하는 돌연변이만을 함유하도록 하고 TALEN 삽입유전자가 분리제거되도록 할 수 있다.
따라서, 이들 실시예들은, 본 발명의 신규한 TALEN들이 식물 및 동물 시스템들에서 생체내에서 게놈 수정할 수 있음을 입증한다.
실시예 21: TALE 반복체 단위의 변경들
TALE 반복체 단위에서 변경들을 이용하기 위해, 크산토모나스(Xanthomonas) 및 랄스토니아(Ralstonia) 둘다로부터의 서열을 비교하였다. 랄스토니아로부터의 52개의 유일한 반복체 단위들을 시험하여 각각의 위치에서 잔기 빈도들을 관찰한 후, 이들 값들을 편집하였다. 데이타는 하기 표 38에 나타내며, 여기서 아민노산들은 좌측으로부터 우측으로 1문자 코드로 나타내며 반복체 단위에서 위치는 상부로부터 하부로 나타내고, RVD 위치들은 굵은 글씨체로 나타낸다:
[표 38]
랄스토니아 반복체들에서 발견된 아미노산들의 빈도들
이후에, 이들 반복체 단위들을 크산토모나스로부터의 것들과 조합하여 유일한 반복체 단위들을 생성할 수 있다. 랄스토니아 반복체들에서 발견된 잔기들과 크산토모나스 잔기들에서 발견된 잔기들의 조합인 반복체 서뎔들은 증가된 DNA 결합 친화성, 증가된 DNA 결합 특이성, 또는 산화에 대한 감소된 민감성과 같은 개선된 특징들을 갖는 단백질들을 수득할 수 있었다. 이러한 반복체 단위 조합물들의 예는 굵고 보다 큰 글자크기로 나타낸 변경된 잔기들과 함께 포함한다:
LTPDQVVAIASHDGGKQALETVQRLLPVLCQDHG 현재의 크산토모나스(SEQ ID NO:333)
당해 가능성을 이용하기 위하여, 하기 표 39에 나타낸 반복체 단위들을 제작하였다. 표는 제1 라인에서 전형적인 랄스토니아 반복체 단위를 나타내고, 제2 라인에 크산토모나스 반복체 단위를 나타낸다. TALE 반복체들에 대한 서열 요건들을 프로브하도록 설계된 랄스토니아 기원한 잔기들 및 다른 변이체들을 함유하는 신규 반복체들은 후속 라인들에 나타낸다. 제2 라인에서 전형적인 크산토모나스 반복체 단위로부터의 모든 차이들은 밑줄쳐져 있다. 다음에, 반복체 단위들은 3 내지 27열에서 굵은 글씨의 위치들을 변화시켜 가공하였다. 이후에, 이들 신규한, 조작된 반복체 단위들은 실시예 15에서 신규한 RVD들을 시험하기 위해 설계된 시스템으로 치환하여 도 27에 나타내고, 수득되는 제작물들은 시험관내에서 해독하고 ELISA에서 사용하였다. ELISA에서 사용된 표적 서열은, 이들 신규 골격 돌연변이체들 모두에서 RVD가 C와 상호작용하도록 HD에서 일정하게 유지되도록 실시예 15에 기술된 'C' 변이체(예를 들면, TTGACCATCC, 서열 번호 182)이었다. 표 39에 나타낸 이들 ELISA 결과들(3개의 상이한 실험들의 평균)은 표준 서열 반복체 단위 서열에 대해 모두 표준화하였다.
[표 39]
신규 반복체 골격 치환체들
ELISA 결과들로부터 알 수 있는 바와 같이, 2, 3, 4, 6, 7, 8, 9, 10 또는 11번 위치들에서 돌연변이들을 지닌 조작된(예를 들면, 신규한) 골격을 포함하는 TALE DNA 결합 도메인의 활성은 약화된다(결합에 있어서 가장 유의적인 효과를 가진 2, 3, 4, 7, 및 11번 위치에서 돌연변이들을 지닌다). 대조적으로, 20, 21, 24, 25, 26, 및 27번 위치에서 많은 치환들은 DNA 결합에서 최소 효과를 가졌거나 DNA 결합을 실제로 증가시켰다. 랄스토니아 반복체에서 21 내지 27번 위치들로부터의 하나 이상의 잔기들이 크산토모나스 반복체내로 치환되는 경우 결합에 있어 최대 증가들이 발생하였다.
하이브리드 반복체 단위들을 어떠한 목적하는 단백질들을 인식할 수 있는 신규한 TALE 단백질들을 생성시키기 위해 직렬로 조합하였다. 이들 신규한 TALE DNA 결합 도메인들은 또한 뉴클레아제 도메인들, 전사 조절 도메인, 또는 다른 어떠한 활성 단백질 도메인에 연결시켜 DNA 상호작용 후 측정가능한 결과를 유발시킨다.
실시예
21:
TALE
-아연
핑거
DNA
결합 도메인
하이드리드들의
제작
아연 핑거들을 TALE DNA 결합 도메인들에 융합시켜 하이브리드 DNA 결합 도메인을 생성한 후 이를 뉴클레아제에 연결시켰다. 표적 DNA 서열들은 하기 나타내며, CCR5 유전자내에 유전자자리를 둘러싸는 영역을 포함한다. 상기 및 하기에 나타낸 결합 부위는 TALE DNA 결합 도메인에 대한 표적 결합 부위들이며 아연 핑거 결합 부위는 표적 서열위에 굵은 글씨로 밑줄쳐서 나타낸다. 굵은 글씨/밑줄에서 "TAG" 서열은 CCR5-특이적인 ZFN SBS#8267로부터의 제4 핑거에 대한 결합 부위이나, 굵은 글씨/밑줄에서 "AAACTG" 서열은 CCR5-특이적인 ZFN SBS#8196에서 제3 및 제4 핑거들에 대한 결합 부위이다(참조: 미국 특허원 11/805,707). 하기 서열들은, 아연 핑거 DNA 표적들이 DNA 쇄상에서 TALE DNA 결합 도메인 표적들과 인접하지 않으며, "내부 gap"을 생성함을 나타낸다. 따라서, 이러한 유형의 융합은, 내부 gap 영역내에서 요구되는 경우 연구자가 DNA의 영역을 무시하도록 한다.
하기 표, 표 40은 연구들의 결과들을 나타낸다. 당해 연구들에서, 하나의 뉴클레아제 파트너는 7, 10, 또는 13개 염기들의 내부 gap과 일정하게 유지된다. 이후에, 파트너 뉴클레아제를 4 내지 16개 염기들의 내부 gap을 포함하는 단백질들과 짝을 지었다. 표에 나타낸 바와 같이, TALE/아연 핑거 하이브리드 DNA 결합 도메인들은, 내부 gap들이 4 내지 16개 염기들의 범위인 경우 활성 뉴클레아제 쌍들을 형성할 수 있다.
[표 40]
아연 핑거-TALE DNA 결합 도메인 하이드리드들
실시예 22: TALE-인테그라제 융합 단백질의 제작
레트로바이러스들의 생애 주기 동안에, 바이러스 게놈 RNA들은 역 전사되어 심지어 특정의 열점(hot spot)들에 대한 선호도들이 존재한다고 해도, 숙주 게놈내로 많은 상이한 부위들에서 통합된다. 레트로바이러스 벡터들을 이용하는 적용들, 특히 유전자 치료요법의 경우, 종양유전자 위치 근처의 조작된 바이러스 게놈의 무작위적인 통합으로 인하여 레트로바이러스 벡터들의 가능한 발암성은 강력한 위험 인자를 나타낸다. 이러한 잠재적인 문제점들을 극복하기 위하여, 바이러스 인테그라제들의 특이성은 특이적인 TALE DNA-결합 도메인들을 이용함에 의해 예비-측정된 부위들로 재-지시된다. 융합체들은 전체 또는 트렁케이트된 인테그라제들 및 전체 또는 트렁케이트된 인테그라제-결합 단백질들(예를 들면, HIV 인테그라제의 경우 LEDGF)를 사용하여 제조한다. 또한, 쌍의 하나의 구성원이 하나의 단백질(예를 들면, 단백질 1)에 융합된 통합체이고 제2 쌍은 TALE DNA 결합 도메인과 다른 단백질(예를 들면, 단백질 2)의 융합체인 융합체 쌍들을 제조하며, 여기서 단백질 1 및 단백질 2는 서로 결합한다. 융합체 쌍들은 발현 벡터내로 클로닝하여 당해 쌍이 목적 세포내에서 발현된다. 포유동물 게놈 표적의 경우, 융합체 쌍은 포유동물 발현 벡터를 사용하여 발현되도록 한다. TALEN 융합체들의 발현 동안, 공여체 DNA가 공급되어 공여체가 TALEN-유도된 DNA 융합 후 절단 부위내로 혼입되도록 한다.
실시예 23: 다양한 TALE 제작물의 서열
DNA
서열 및 단백질 서열
밑줄 친 코딩 서열을 갖는 완전 TALEN 제작물 서열 (SEQ ID NO:217):
NTF3 변형 및 시험관내
절단 연구에서 사용된 각각의 TALEN에 대한 완전 단백질 및 코딩 서열
각각의 발현 제작물의 서열을 재생하기 위해, 상기 제작물의 밑줄 친 영역을 하기 보여진 각각의 CDS으로 대체하라.
2. CCR5 연구에 대한 TALEN 제작물 및 단백질 서열
밑줄 친 코딩 서열을 갖는 완전 TALEN 제작물 서열 (SEQ ID NO:238):
각각 CCR-5 표적화된 TALEN에 대한 완전 단백질 및 코딩 서열
:
각각의 발현 제작물의 서열을 재생하기 위해, 상기 제작물의 밑줄 친 영역을 하기 보여진 각각의 CDS으로 대체하라.
CCR5 공여체 서열:
3. TALE 제작물 및 단백질 서열 used 유전자 활성화 연구
밑줄 친 코딩 서열을 갖는 완전 TALE 제작물 서열 (SEQ ID NO:303):
유전자 활성화 연구에서 사용된 각각의 TALE에 대한 완전 단백질 및 코딩 서열
:
각각의 발현 제작물의 서열을 재생하기 위해, 상기 제작물의 밑줄 친 영역을 하기 보여진 각각의 CDS으로 대체하라.
NT-L +95 단백질이 SV40로부터 핵 위치 서열 (NLS)을 포함하지만, NT-L +278에 대한 핵 수송은 TALE C-말단 측면(flanking) 영역3에서 존재하는 내인성 위치 서열에 의존한다는 것을 주목하라.
4. 기타 DNA 서열
도 37에서 기재된 시험을 위해 사용된 공여체 (SEQ ID NO:318)
TALE13 리포터 제작물 (밑줄 친 TALE13 결합 부위 및 SV40 프로모터) (SEQ ID NO:319):
TALE13의 DNA 서열 (SEQ ID NO:320):
TALEs VEGF-1 및 CCR5-1의 단백질 및 유전자 서열
AAVS1 특이적 TALEN의 유전자 서열
101077 ORF (밑줄 친 TALE 영역) (SEQ ID NO:325):
101079 ORF (밑줄 친 TALE 영역) (SEQ ID NO:326):
ben
-1 특이적
TALEN
ORF
의 서열:
SEQUENCE LISTING
<110> SANGAMO BIOSCIENCES, INC.
<120> NOVEL DNA-BINDING PROTEINS AND USES THEREOF
<130> 8325-0079.40
<140> PCT/US2011/000885
<141> 2011-05-17
<150> 61/465,869
<151> 2011-03-24
<150> 61/462,482
<151> 2011-02-02
<150> 61/459,891
<151> 2010-12-20
<150> 61/455,121
<151> 2010-10-13
<150> 61/401,429
<151> 2010-08-12
<150> 61/395,836
<151> 2010-05-17
<160> 555
<170> PatentIn version 3.5
<210> 1
<211> 34
<212> PRT
<213> Xanthomonas campestris
<400> 1
Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr
1 5 10 15
Ala Val Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro
20 25 30
Leu Asn
<210> 2
<211> 34
<212> PRT
<213> Xanthomonas campestris
<400> 2
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 3
<211> 34
<212> PRT
<213> Xanthomonas campestris
<400> 3
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 4
<211> 34
<212> PRT
<213> Xanthomonas campestris
<400> 4
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 5
<211> 34
<212> PRT
<213> Xanthomonas campestris
<400> 5
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 6
<211> 34
<212> PRT
<213> Xanthomonas campestris
<400> 6
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 7
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 7
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 8
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 8
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 9
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 9
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Asn
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 10
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 10
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Gly Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 11
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 11
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
1 5 10 15
Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 12
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 12
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Gly Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 13
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 13
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 14
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 14
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 15
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 15
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Thr
20 25 30
His Gly
<210> 16
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 16
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 17
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 17
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
1 5 10 15
Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 18
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 18
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 19
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 19
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 20
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 20
Leu Thr Pro Ala Gln Val Val Ala Ile Ala Asn His Gly Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 21
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 21
Leu Thr Pro Val Gln Val Val Ala Ile Ala Ser Asn Ser Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 22
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 22
Leu Thr Pro Val Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
1 5 10 15
Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 23
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 23
Leu Thr Pro Val Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 24
<211> 34
<212> PRT
<213> Xanthomonas oryzae
<400> 24
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln
1 5 10 15
Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu
20 25 30
Ala Ala
<210> 25
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 25
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Thr Gly Gly Lys
1 5 10 15
Arg Ala Leu Glu Ala Val Cys Val Gln Leu Pro Val Leu Arg Ala Ala
20 25 30
Pro Tyr Arg
35
<210> 26
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 26
Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Lys Ala His Leu Leu Asp Leu Leu Gly Ala
20 25 30
Pro Tyr Val
35
<210> 27
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 27
Leu Asp Thr Glu Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Lys Ala Asp Leu Leu Asp Leu Arg Gly Ala
20 25 30
Pro Tyr Ala
35
<210> 28
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 28
Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Lys Ala Asp Leu Leu Asp Leu Arg Gly Ala
20 25 30
Pro Tyr Ala
35
<210> 29
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 29
Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Lys Ala Gln Leu Leu Asp Leu Arg Gly Ala
20 25 30
Pro Tyr Ala
35
<210> 30
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 30
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Lys Ala Gln Leu Leu Asp Leu Arg Gly Ala
20 25 30
Pro Tyr Ala
35
<210> 31
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 31
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Gly Ile Gly Glu Gln Leu Leu Lys Leu Arg Thr Ala
20 25 30
Pro Tyr Gly
35
<210> 32
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 32
Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser Ser His Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Pro Asp Leu Arg Ala Ala
20 25 30
Pro Tyr Ala
35
<210> 33
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 33
Leu Ser Thr Ala Gln Leu Val Ala Ile Ala Ser Asn Pro Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Arg Glu Leu Arg Ala Ala
20 25 30
Pro Tyr Ala
35
<210> 34
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 34
Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser Asn His Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Arg Glu Leu Arg Ala Ala
20 25 30
Pro Tyr Ala
35
<210> 35
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 35
Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser Asn His Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Arg Gly Leu Arg Ala Ala
20 25 30
Pro Tyr Gly
35
<210> 36
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 36
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser Ser Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Trp Ala Leu Leu Pro Val Leu Arg Ala Thr
20 25 30
Pro Tyr Asp
35
<210> 37
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 37
Leu Asn Thr Ala Gln Val Val Ala Ile Ala Ser His Tyr Gly Gly Lys
1 5 10 15
Pro Ala Leu Glu Ala Val Trp Ala Lys Leu Pro Val Leu Arg Gly Val
20 25 30
Pro Tyr Ala
35
<210> 38
<211> 33
<212> PRT
<213> Ralstonia solanacearum
<400> 38
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Cys Ile Ser Gly Gln Gln
1 5 10 15
Ala Leu Glu Ala Ile Glu Ala His Met Pro Thr Leu Arg Gln Ala Pro
20 25 30
His
<210> 39
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 39
Leu Ser Thr Ala Gln Leu Val Ala Ile Ala Ser Asn Pro Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Pro Phe Arg Glu Val Arg Ala Ala
20 25 30
Pro Tyr Ala
35
<210> 40
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 40
Leu Ser Pro Glu Gln Val Val Ala Ile Ala Ser Asn His Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Arg Gly Leu Arg Ala Ala
20 25 30
Pro Tyr Gly
35
<210> 41
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 41
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser Ser Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Trp Ala Leu Leu Pro Val Leu Arg Ala Thr
20 25 30
Pro Tyr Asp
35
<210> 42
<211> 35
<212> PRT
<213> Ralstonia solanacearum
<400> 42
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Pro Ala Leu Glu Ala Val Trp Ala Lys Leu Pro Val Leu Arg Gly Ala
20 25 30
Pro Tyr Ala
35
<210> 43
<211> 33
<212> PRT
<213> Ralstonia solanacearum
<400> 43
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Cys Ile Ser Gly Gln Gln
1 5 10 15
Ala Leu Glu Ala Ile Glu Ala His Met Pro Thr Leu Arg Gln Ala Pro
20 25 30
His
<210> 44
<211> 494
<212> PRT
<213> Xanthomonas campestris
<400> 44
Met Asp Pro Ile Arg Ser Arg Thr Pro Ser Pro Ala Arg Glu Leu Leu
1 5 10 15
Pro Gly Pro Gln Pro Asp Gly Val Gln Pro Thr Ala Asp Arg Gly Val
20 25 30
Ser Pro Pro Ala Gly Gly Pro Leu Asp Gly Leu Pro Ala Arg Arg Thr
35 40 45
Met Ser Arg Thr Arg Leu Pro Ser Pro Pro Ala Pro Ser Pro Ala Phe
50 55 60
Ser Ala Gly Ser Phe Ser Asp Leu Leu Arg Gln Phe Asp Pro Ser Leu
65 70 75 80
Phe Asn Thr Ser Leu Phe Asp Ser Leu Pro Pro Phe Gly Ala His His
85 90 95
Thr Glu Ala Ala Thr Gly Glu Trp Asp Glu Val Gln Ser Gly Leu Arg
100 105 110
Ala Ala Asp Ala Pro Pro Pro Thr Met Arg Val Ala Val Thr Ala Ala
115 120 125
Arg Pro Pro Arg Ala Lys Pro Ala Pro Arg Arg Arg Ala Ala Gln Pro
130 135 140
Ser Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr
145 150 155 160
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
165 170 175
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
180 185 190
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
195 200 205
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
210 215 220
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
225 230 235 240
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
245 250 255
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
260 265 270
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
275 280 285
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
290 295 300
Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala
305 310 315 320
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly
325 330 335
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
340 345 350
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
355 360 365
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
370 375 380
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
385 390 395 400
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
405 410 415
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
420 425 430
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
435 440 445
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val
450 455 460
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
465 470 475 480
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Ile
485 490
<210> 45
<211> 1102
<212> PRT
<213> Xanthomonas oryzae
<400> 45
Met Asp Pro Ile Arg Ser Arg Thr Pro Ser Pro Ala Arg Glu Leu Leu
1 5 10 15
Pro Gly Pro Gln Pro Asp Arg Val Gln Pro Thr Ala Asp Arg Gly Gly
20 25 30
Ala Pro Pro Ala Gly Gly Pro Leu Asp Gly Leu Pro Ala Arg Arg Thr
35 40 45
Met Ser Arg Thr Arg Leu Pro Ser Pro Pro Ala Pro Ser Pro Ala Phe
50 55 60
Ser Ala Gly Ser Phe Ser Asp Leu Leu Arg Gln Phe Asp Pro Ser Leu
65 70 75 80
Leu Asp Thr Ser Leu Leu Asp Ser Met Pro Ala Val Gly Thr Pro His
85 90 95
Thr Ala Ala Ala Pro Ala Glu Cys Asp Glu Val Gln Ser Gly Leu Arg
100 105 110
Ala Ala Asp Asp Pro Pro Pro Thr Val Arg Val Ala Val Thr Ala Arg
115 120 125
Pro Pro Arg Ala Lys Pro Ala Pro Arg Arg Arg Ala Ala Gln Pro Ser
130 135 140
Asp Ala Ser Pro Ala Ala Gln Val Asp Leu Arg Thr Leu Gly Tyr Ser
145 150 155 160
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
165 170 175
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
180 185 190
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Thr
195 200 205
Tyr Gln Asp Ile Ile Arg Ala Leu Pro Glu Ala Thr His Glu Asp Ile
210 215 220
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
225 230 235 240
Leu Thr Glu Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
245 250 255
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
260 265 270
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu
275 280 285
Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Asn Gln
290 295 300
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
305 310 315 320
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Gly Gly Gly
325 330 335
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
340 345 350
Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile
355 360 365
Gly Gly Lys Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu
370 375 380
Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser
385 390 395 400
His Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
405 410 415
Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile
420 425 430
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
435 440 445
Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val
450 455 460
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
465 470 475 480
Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln
485 490 495
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
500 505 510
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Thr His Gly Leu Thr Pro
515 520 525
Asp Gln Val Val Ala Ile Ala Asn His Asp Gly Gly Lys Gln Ala Leu
530 535 540
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu
545 550 555 560
Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
565 570 575
Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
580 585 590
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
595 600 605
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
610 615 620
Asp His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Asn
625 630 635 640
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
645 650 655
Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Asn
660 665 670
His Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
675 680 685
Val Leu Cys Gln Asp His Gly Leu Thr Pro Val Gln Val Val Ala Ile
690 695 700
Ala Ser Asn Ser Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
705 710 715 720
Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Val Gln Val Val
725 730 735
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Ala Thr Val Gln
740 745 750
Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Val Gln
755 760 765
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
770 775 780
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro
785 790 795 800
Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu
805 810 815
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
820 825 830
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala
835 840 845
Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Glu Leu Ile Arg
850 855 860
Arg Ile Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Asp
865 870 875 880
Leu Ala His Val Val Arg Val Leu Gly Phe Phe Gln Ser His Ser His
885 890 895
Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly Met Ser Arg
900 905 910
His Gly Leu Ala Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu
915 920 925
Ala Arg Tyr Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile
930 935 940
Leu Gln Ala Ser Gly Met Lys Arg Val Lys Pro Ser Pro Thr Ser Ala
945 950 955 960
Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu
965 970 975
Arg Asp Leu Asp Ala Pro Ser Pro Met His Glu Gly Asp Gln Thr Arg
980 985 990
Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro
995 1000 1005
Ser Thr Gln Gln Ser Phe Glu Val Arg Val Pro Glu Gln Gln Asp
1010 1015 1020
Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr
1025 1030 1035
Arg Ile Gly Gly Gly Leu Pro Asp Pro Gly Thr Pro Ile Ala Ala
1040 1045 1050
Asp Leu Ala Ala Ser Ser Thr Val Met Trp Glu Gln Asp Ala Ala
1055 1060 1065
Pro Phe Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu Glu
1070 1075 1080
Glu Leu Ala Trp Leu Met Glu Leu Leu Pro Gln Ser Gly Ser Val
1085 1090 1095
Gly Gly Thr Ile
1100
<210> 46
<211> 174
<212> PRT
<213> Ralstonia solanacearum
<400> 46
Leu Ser Thr Ala Gln Leu Val Ala Ile Ala Ser Asn Pro Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Pro Phe Arg Glu Val Arg Ala Ala
20 25 30
Pro Tyr Ala Leu Ser Pro Glu Gln Val Val Ala Ile Ala Ser Asn His
35 40 45
Gly Gly Lys Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Arg Gly Leu
50 55 60
Arg Ala Ala Pro Tyr Gly Leu Ser Thr Ala Gln Val Val Ala Ile Ala
65 70 75 80
Ser Ser Asn Gly Gly Lys Gln Ala Leu Glu Ala Val Trp Ala Leu Leu
85 90 95
Pro Val Leu Arg Ala Thr Pro Tyr Asp Leu Ser Thr Ala Gln Val Val
100 105 110
Ala Ile Ala Ser His Asp Gly Gly Lys Pro Ala Leu Glu Ala Val Trp
115 120 125
Ala Lys Leu Pro Val Leu Arg Gly Ala Pro Tyr Ala Leu Ser Thr Ala
130 135 140
Gln Val Val Ala Ile Ala Cys Ile Ser Gly Gln Gln Ala Leu Glu Ala
145 150 155 160
Ile Glu Ala His Met Pro Thr Leu Arg Gln Ala Pro His Ser
165 170
<210> 47
<211> 509
<212> PRT
<213> Ralstonia solanacearum
<220>
<221> NON_CONS
<222> (245)..(246)
<400> 47
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Thr Gly Gly Lys
1 5 10 15
Arg Ala Leu Glu Ala Val Cys Val Gln Leu Pro Val Leu Arg Ala Ala
20 25 30
Pro Tyr Arg Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser Asn Lys
35 40 45
Gly Gly Lys Gln Ala Leu Glu Ala Val Lys Ala His Leu Leu Asp Leu
50 55 60
Leu Gly Ala Pro Tyr Val Leu Asp Thr Glu Gln Val Val Ala Ile Ala
65 70 75 80
Ser His Asn Gly Gly Lys Gln Ala Leu Glu Ala Val Lys Ala Asp Leu
85 90 95
Leu Asp Leu Arg Gly Ala Pro Tyr Ala Leu Ser Thr Glu Gln Val Val
100 105 110
Ala Ile Ala Ser His Asn Gly Gly Lys Gln Ala Leu Glu Ala Val Lys
115 120 125
Ala Asp Leu Leu Asp Leu Arg Gly Ala Pro Tyr Ala Leu Ser Thr Glu
130 135 140
Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys Gln Ala Leu Glu
145 150 155 160
Ala Val Lys Ala Gln Leu Leu Asp Leu Arg Gly Ala Pro Tyr Ala Leu
165 170 175
Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asn Gly Gly Lys Gln
180 185 190
Ala Leu Glu Ala Val Lys Ala Gln Leu Leu Asp Leu Arg Gly Ala Pro
195 200 205
Tyr Ala Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly
210 215 220
Gly Lys Gln Ala Leu Glu Gly Ile Gly Glu Gln Leu Leu Lys Leu Arg
225 230 235 240
Thr Ala Pro Tyr Gly Leu Ser Thr Glu Gln Val Val Ala Ile Ala Ser
245 250 255
Ser His Gly Gly Lys Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Pro
260 265 270
Asp Leu Arg Ala Ala Pro Tyr Ala Leu Ser Thr Ala Gln Leu Val Ala
275 280 285
Ile Ala Ser Asn Pro Gly Gly Lys Gln Ala Leu Glu Ala Val Arg Ala
290 295 300
Leu Phe Arg Glu Leu Arg Ala Ala Pro Tyr Ala Leu Ser Thr Glu Gln
305 310 315 320
Val Val Ala Ile Ala Ser Asn His Gly Gly Lys Gln Ala Leu Glu Ala
325 330 335
Val Arg Ala Leu Phe Arg Glu Leu Arg Ala Ala Pro Tyr Ala Leu Ser
340 345 350
Thr Glu Gln Val Val Ala Ile Ala Ser Asn His Gly Gly Lys Gln Ala
355 360 365
Leu Glu Ala Val Arg Ala Leu Phe Arg Gly Leu Arg Ala Ala Pro Tyr
370 375 380
Gly Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser Ser Asn Gly Gly
385 390 395 400
Lys Gln Ala Leu Glu Ala Val Trp Ala Leu Leu Pro Val Leu Arg Ala
405 410 415
Thr Pro Tyr Asp Leu Asn Thr Ala Gln Val Val Ala Ile Ala Ser His
420 425 430
Tyr Gly Gly Lys Pro Ala Leu Glu Ala Val Trp Ala Lys Leu Pro Val
435 440 445
Leu Arg Gly Val Pro Tyr Ala Leu Ser Thr Ala Gln Val Val Ala Ile
450 455 460
Ala Cys Ile Ser Gly Gln Gln Ala Leu Glu Ala Ile Glu Ala His Met
465 470 475 480
Pro Thr Leu Arg Gln Ala Pro His Gly Leu Ser Pro Glu Arg Val Ala
485 490 495
Ala Ile Ala Cys Ile Gly Gly Arg Ser Ala Val Glu Ala
500 505
<210> 48
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 48
Thr Gly Glu Lys Pro
1 5
<210> 49
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 49
Thr Gly Gly Gln Arg Pro
1 5
<210> 50
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 50
Thr Gly Gln Lys Pro
1 5
<210> 51
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 51
Thr Gly Ser Gln Lys Pro
1 5
<210> 52
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 52
acgtggattc atggtggatc tacgcacgct c 31
<210> 53
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 53
tacgtccgcg gtcctgaggc aatagctcca tca 33
<210> 54
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 54
tataaatacc ttct 14
<210> 55
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (25)..(42)
<223> a, c, t, g, unknown or other
<400> 55
cagggatcca tgcactgtac gtttnnnnnn nnnnnnnnnn nnaaaccact tgactgcgga 60
tcctgg 66
<210> 56
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (3)..(3)
<223> a, c, t, g, unknown or other
<400> 56
tanaaacctt 10
<210> 57
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 57
tacacatctt taacact 17
<210> 58
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 58
ggagccatct ggccgggt 18
<210> 59
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (25)..(46)
<223> a, c, t, g, unknown or other
<400> 59
cagggatcca tgcactgtac gaaannnnnn nnnnnnnnnn nnnnnntttc cacttgactg 60
cggatcctgg 70
<210> 60
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (25)..(45)
<223> a, c, t, g, unknown or other
<400> 60
cagggatcca tgcactgtac gtttnnnnnn nnnnnnnnnn nnnnnaaacc acttgactgc 60
ggatcctgg 69
<210> 61
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (25)..(47)
<223> a, c, t, g, unknown or other
<400> 61
cagggatcca tgcactgtac gtttnnnnnn nnnnnnnnnn nnnnnnnaaa ccacttgact 60
gcggatcctg g 71
<210> 62
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (25)..(54)
<223> a, c, t, g, unknown or other
<400> 62
cagggatcca tgcactgtac gcccnnnnnn nnnnnnnnnn nnnnnnnnnn nnnngggcca 60
cttgactgcg gatcctgg 78
<210> 63
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 63
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 64
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 64
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 65
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 65
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 66
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 66
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 67
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 67
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 68
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 68
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 69
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 69
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Arg
1 5 10 15
Pro Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 70
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 70
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
1 5 10 15
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
20 25 30
Leu Ala Ala
35
<210> 71
<211> 2
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 71
Gly Ser
1
<210> 72
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 72
Gly Gly Ser Gly Gly Ser Gly Ser
1 5
<210> 73
<211> 77
<212> PRT
<213> Xanthomonas campestris
<400> 73
Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys
1 5 10 15
Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu
20 25 30
Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His
35 40 45
Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala
50 55 60
Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val
65 70 75
<210> 74
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 74
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Gln Leu Leu Val Leu Arg Ala Ala
20 25 30
Pro Tyr Ala
35
<210> 75
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 75
Leu Thr Pro Asp Ala Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 76
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 76
Leu Thr Pro Asp Gln Ala Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 77
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 77
gcacgtggcg gagccatctg gccgggttgg ctggttataa ccgcgcagat tctgttcacc 60
gcgcgata 68
<210> 78
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 78
gcacgtggcg gagccatctg gccgggttgg ctggttatga agggggagga tcgatcggac 60
gcgcgata 68
<210> 79
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 79
gcacgtggcc atggactcct cccccttcag ctggttataa ccgcgcagat tctgttcacc 60
gcgcgata 68
<210> 80
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 80
gaaggggtta aggcgctgag 20
<210> 81
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 81
agggacgtcg acatgaagag 20
<210> 82
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 82
tggcgtacgg atccaagctt cgtcgaccta gcc 33
<210> 83
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 83
gccaggctag gtcgacgaag cttggatccg tac 33
<210> 84
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 84
ggctgtacgg atccaagctt cgtcgaccta gcc 33
<210> 85
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 85
agccggctag gtcgacgaag cttggatccg tac 33
<210> 86
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 86
gctggtacgg atccaagctt cgtcgaccta gcc 33
<210> 87
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 87
cagcggctag gtcgacgaag cttggatccg tac 33
<210> 88
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 88
ctgggtacgg atccaagctt cgtcgaccta gcc 33
<210> 89
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 89
ccagggctag gtcgacgaag cttggatccg tac 33
<210> 90
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 90
tggtgtacgg atccaagctt cgtcgaccta gcc 33
<210> 91
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 91
accaggctag gtcgacgaag cttggatccg tac 33
<210> 92
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 92
ggttgtacgg atccaagctt cgtcgaccta gcc 33
<210> 93
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 93
aaccggctag gtcgacgaag cttggatccg tac 33
<210> 94
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 94
gttagtacgg atccaagctt cgtcgaccta gcc 33
<210> 95
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 95
taacggctag gtcgacgaag cttggatccg tac 33
<210> 96
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 96
ttatgtacgg atccaagctt cgtcgaccta gcc 33
<210> 97
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 97
ataaggctag gtcgacgaag cttggatccg tac 33
<210> 98
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 98
tatagtacgg atccaagctt cgtcgaccta gcc 33
<210> 99
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<220>
<221> modified_base
<222> (1)..(2)
<223> Phosphorothioate linkage
<220>
<221> modified_base
<222> (2)..(3)
<223> Phosphorothioate linkage
<400> 99
tataggctag gtcgacgaag cttggatccg tac 33
<210> 100
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 100
ggatccaagc ttcgtcgacc t 21
<210> 101
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 101
cagcgcaaac tttggggaag 20
<210> 102
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (7)..(12)
<223> a, c, t, g, unknown or other
<400> 102
ggtctcnnnn nn 12
<210> 103
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (7)..(12)
<223> a, c, t, g, unknown or other
<400> 103
ggtctcnnnn nn 12
<210> 104
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (7)..(12)
<223> a, c, t, g, unknown or other
<400> 104
ccagagnnnn nn 12
<210> 105
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (7)..(12)
<223> a, c, t, g, unknown or other
<400> 105
ccagagnnnn nn 12
<210> 106
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 106
ggatccggat ggtctcaacc tgaccccaga ccag 34
<210> 107
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 107
gagggatgcg ggtctctgag tccatgatcc tggcacagt 39
<210> 108
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 108
ggatccggat gggtctcaac tcaccccaga ccaggta 37
<210> 109
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 109
gagggatgcg ggtctctcag cccatgatcc tggcacagt 39
<210> 110
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 110
ggatccggat gggtctcagc tgaccccaga ccag 34
<210> 111
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 111
gagggatgcg ggtctctcaa accatgatcc tggcacagt 39
<210> 112
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 112
ggatccggat gggtctcatt tgaccccaga ccaggta 37
<210> 113
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 113
ctcgagggat ggtctcctgt caggccatga tcc 33
<210> 114
<211> 13
<212> DNA
<213> Homo sapiens
<400> 114
cttcattaca cct 13
<210> 115
<211> 17
<212> DNA
<213> Homo sapiens
<400> 115
tcattacacc tgcagct 17
<210> 116
<211> 14
<212> DNA
<213> Homo sapiens
<400> 116
acacctgcag ctct 14
<210> 117
<211> 17
<212> DNA
<213> Homo sapiens
<400> 117
acacctgcag ctctcat 17
<210> 118
<211> 79
<212> DNA
<213> Homo sapiens
<400> 118
aaaaagaagg tcttcattac acctgcagct ctcattttcc atacagtcag tatcaattct 60
ggaagaattt ccagacatt 79
<210> 119
<211> 79
<212> DNA
<213> Homo sapiens
<400> 119
aatgtctgga aattcttcca gaattgatac tgactgtatg gaaaatgaga gctgcaggtg 60
taatgaagac cttcttttt 79
<210> 120
<211> 14
<212> DNA
<213> Homo sapiens
<400> 120
gatactgact gtat 14
<210> 121
<211> 13
<212> DNA
<213> Homo sapiens
<400> 121
tgatactgac tgt 13
<210> 122
<211> 17
<212> DNA
<213> Homo sapiens
<400> 122
cttccagaat tgatact 17
<210> 123
<211> 15
<212> DNA
<213> Homo sapiens
<400> 123
tcttccagaa ttgat 15
<210> 124
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 124
Gly Gly Gly Gly Ser
1 5
<210> 125
<211> 9
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown: "LAGLIDADG" motif sequence
<400> 125
Leu Ala Gly Leu Ile Asp Ala Asp Gly
1 5
<210> 126
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (24)..(49)
<223> a, c, t, g, unknown or other
<400> 126
cagggatcca tgcactgtac gttnnnnnnn nnnnnnnnnn nnnnnnnnna accacttgac 60
tgcggatcct gg 72
<210> 127
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 127
Gly Gly Gly Ser
1
<210> 128
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 128
atcgcgcggt gaacagaatc tgcgcggtta taaccagcca acccggccag atggctccgc 60
cacgtgca 68
<210> 129
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 129
atcgcgcgtc cgatcgatcc tcccccttca taaccagcca acccggccag atggctccgc 60
cacgtgca 68
<210> 130
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 130
atcgcgcggt gaacagaatc tgcgcggtta taaccagctg aagggggagg agtccatggc 60
cacgtgca 68
<210> 131
<211> 246
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 131
ctgaccccgg agcaggtggt ggccatcgcc agcaatattg gtggcaagca ggcgctggag 60
acggtgcagc ggctgttgcc ggtgctgtgc caggcccatg gcctgacccc ggagcaggtg 120
gtggccatcg ccagcaatgg cggcaagcag gcgctggaga cggtgcagcg gctgttgccg 180
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagcaatatt 240
ggtggc 246
<210> 132
<211> 332
<212> PRT
<213> Xanthomonas sp.
<400> 132
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
35 40 45
Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp
50 55 60
Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys
65 70 75 80
Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His
85 90 95
Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr
100 105 110
Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe
115 120 125
Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr
130 135 140
Gln Phe Gly Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg Val
145 150 155 160
Gly Val Thr Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala Ser
165 170 175
Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys
180 185 190
Pro Ser Pro Thr Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His Ala
195 200 205
Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Thr His
210 215 220
Glu Gly Asp Gln Arg Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp
225 230 235 240
Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg Ala
245 250 255
Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys
260 265 270
Arg Pro Arg Thr Ser Ile Gly Gly Gly Leu Pro Asp Pro Gly Thr Pro
275 280 285
Thr Ala Ala Asp Leu Ala Ala Ser Ser Thr Val Met Arg Glu Gln Asp
290 295 300
Glu Asp Pro Phe Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu
305 310 315 320
Glu Glu Leu Ala Trp Leu Met Glu Leu Leu Pro Gln
325 330
<210> 133
<211> 92
<212> DNA
<213> Homo sapiens
<400> 133
tcatctttgg ttttgtgggc aacatgctgg tcatcctcat cctgataaac tgcaaaaggc 60
tgaagagcat gactgacatc tacctgctca ac 92
<210> 134
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 134
tcatctttgg ttttgtgggc aacatgctgg tcatcctcat ctagatcagt gagtatgccc 60
tgatggcgtc tggactggat gcctcgtcta gaaaactgca aaaggctgaa gagcatgact 120
gacatctacc tgctcaac 138
<210> 135
<211> 840
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 135
Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile
1 5 10 15
Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val
20 25 30
Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro
35 40 45
Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala
50 55 60
Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp
65 70 75 80
Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu
85 90 95
Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala
100 105 110
Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn
115 120 125
Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala
130 135 140
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
145 150 155 160
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val
165 170 175
Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
180 185 190
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
195 200 205
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
210 215 220
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
225 230 235 240
Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
245 250 255
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
260 265 270
Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
275 280 285
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Ala His
290 295 300
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys
305 310 315 320
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
325 330 335
His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly
340 345 350
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
355 360 365
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
370 375 380
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
385 390 395 400
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
405 410 415
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
420 425 430
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala
435 440 445
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
450 455 460
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val
465 470 475 480
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
485 490 495
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
500 505 510
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
515 520 525
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
530 535 540
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala
545 550 555 560
Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala
565 570 575
Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg
580 585 590
Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu
595 600 605
Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val
610 615 620
Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys His
625 630 635 640
Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly Met
645 650 655
Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg Val Gly Val Thr Glu
660 665 670
Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp
675 680 685
Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr
690 695 700
Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser
705 710 715 720
Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Thr His Glu Gly Asp Gln
725 730 735
Arg Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr
740 745 750
Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg Ala Pro Glu Gln Arg
755 760 765
Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr
770 775 780
Ser Ile Gly Gly Gly Leu Pro Asp Pro Gly Thr Pro Thr Ala Ala Asp
785 790 795 800
Leu Ala Ala Ser Ser Thr Val Met Arg Glu Gln Asp Glu Asp Pro Phe
805 810 815
Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu Glu Glu Leu Ala
820 825 830
Trp Leu Met Glu Leu Leu Pro Gln
835 840
<210> 136
<211> 253
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 136
ggtaccgagc tcttacgcgt gctagcccgg gctcgagatc tgcgatctgc atctcaatta 60
gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc cgcccagttc 120
cgcccattct ccgccccatc gctgactaat tttttttatt tatgcagagg ccgaggccgc 180
ctcggcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc taggcttttg 240
caaaaagctt ggc 253
<210> 137
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 137
ctagtataaa taccttctgc cttactagta taaatacctt ctgccttgct agctcga 57
<210> 138
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 138
gagcggagcc atctggccgg gttggctggt tataaccgcg cagattctgt tcacgggact 60
cagagttgaa gc 72
<210> 139
<211> 86
<212> DNA
<213> Homo sapiens
<400> 139
tcaactctga gtcccgtgaa cagaatctgc gcggttataa ccagccaacc cggccagatg 60
gctccgcgct cagcgcctta acccct 86
<210> 140
<211> 86
<212> DNA
<213> Homo sapiens
<400> 140
aggggttaag gcgctgagcg cggagccatc tggccgggtt ggctggttat aaccgcgcag 60
attctgttca cgggactcag agttga 86
<210> 141
<211> 83
<212> DNA
<213> Homo sapiens
<400> 141
tcaactctga gtcccgtgaa cagaatctgc gcggttataa ccagccaacc cggccagatg 60
gctccgcgct cagcgcctta acc 83
<210> 142
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 142
tcaactctga gtcccgtgaa cagaatctgc gcggttataa caacca 46
<210> 143
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 143
tcaactctga gtcccgtgaa cagaatctgc gcggttatat ataacc 46
<210> 144
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 144
tcaactctga gtcccgtgaa cagaatctgc gcggttataa gccaac 46
<210> 145
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 145
tcaactctga gtcccgtgaa cagaatctgc gcggttatca gccaac 46
<210> 146
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 146
tcaactctga gtcccgtgaa cagaatctgc gcggttacca gccaac 46
<210> 147
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 147
tcaactctga gtcccgtgaa cagaatctgc gcggttccag ccaacc 46
<210> 148
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 148
tcaactctga gtcccgtgaa cagaatctgc gcggttatgc caaccc 46
<210> 149
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 149
tcaactctga gtcccgtgaa cagaatctgc gcggccaacc cggcca 46
<210> 150
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 150
tcaactctga gtcccgtgaa cagaatctgc gcggttaacc cggcca 46
<210> 151
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 151
tcaactctga gtcccgtgaa cagaatctgc gcggttataa cggcca 46
<210> 152
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 152
tcaactctga gtcccgtgaa cagaatctgc gcggtcaacc cggcca 46
<210> 153
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 153
tcaactctga gtcccgtgaa cagaatctgc gcagccaacc cggcca 46
<210> 154
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 154
tcaactctga gtcccgtgaa cagaatctgc ccagccaacc cggcca 46
<210> 155
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 155
tcaactctga gtcccgtgaa cagaatctgc gccaacccgg ccagat 46
<210> 156
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 156
tcaactctga gtcccgtgaa cagaatctgc gcgcccggcc agatgg 46
<210> 157
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 157
tcaactctga gtcccgtgaa cagaatctgc gcccggccag atggct 46
<210> 158
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 158
tcaactctga gtcccgtgaa cagaatctgc gcggccagat ggctcc 46
<210> 159
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 159
tcaactctga gtcccgtgaa cagaatctgc gcggtcagat ggctcc 46
<210> 160
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 160
tcaactctga gtcccgtgaa cagaatctgc gcggttataa ggctcc 46
<210> 161
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 161
tcaactctga gtcccgtgaa cagaatctgc gcggttatat ggctcc 46
<210> 162
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 162
tcaactctga gtcccgtgaa cagaatctgc ccggccagat ggctcc 46
<210> 163
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 163
tcaactctga gtcccgtgaa cagaatcaac ccggccagat ggctcc 46
<210> 164
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 164
tcaactctga gtcccgtgaa cagaaccaac ccggccagat ggctcc 46
<210> 165
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 165
tcaactctga gtcccgtgaa cagaatctgc gcgccagatg gctccg 46
<210> 166
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 166
tcaactctga gtcccgtgaa cagaatctgc gccagatggc tccgcg 46
<210> 167
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 167
tcaactctga gtcccgtgaa cagaatctgc gcggatggct ccgcgc 46
<210> 168
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 168
tcaactctga gtcccgtgaa cagaatctgc gcggttaccg cgctca 46
<210> 169
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 169
tcaactctga gtcccgtgaa cagaatctgc gcggttccgc gctcag 46
<210> 170
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 170
tcaactctga gtcccgtgaa caggatggct ccgcgctcag cgcctt 46
<210> 171
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 171
tcaactctga gtcccgtgaa cagaatggct ccgcgctcag cgcctt 46
<210> 172
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 172
tcaactctga gtcccgtgaa cagatggctc cgcgctcagc gcctta 46
<210> 173
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 173
tcaactctga gtcccgtgaa cagaatctcc gcgctcagcg ccttaa 46
<210> 174
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 174
tcaactctga gtcccgtgaa cagaatctgc gcgctcagcg ccttaa 46
<210> 175
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 175
tcaactctga gtcccgtgaa cagaatccgc gctcagcgcc ttaacc 46
<210> 176
<211> 5914
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 176
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctca 240
gaattaaccc tcactaaagg gactagtcct gcaggtttaa acgaattcgc ccttgatact 300
tattaaccat accttggagg ggaaatcaca catgaaaagt gtcatttctt tactaatcat 360
attcatgtct tttctcccca tagcaagaca aagacctgtt ttaaacacat ttacaaccta 420
tatgttgcct tgtactaggt aaaaagttgt acatttctga aataattttg gtatttctgt 480
tcagatcact aaactcaaga atcagcaatt ctctgaggct ttcttttaaa tatacataag 540
gaactttcgg agtgaaggga gagtttgtca ataacttgat gcatgtgaag gggagataaa 600
aaggttgcta tttttcatca acatattttg atttggcttt ctataattga tgggcttaaa 660
agatctaatc tactttaaac agatgccaaa taaatggatg aatcttagac cctctataac 720
agtaacttcc ttttaaaaaa gacctctccc accccacccc cagcccaggc tgtgtatgaa 780
aactaagcca tgtgcacaac tctgactggg tcaccagccc acttgagtcc gtgtcacaag 840
cccacagata tttcctgctc cccagtggat cgggtgtaaa ctgagcttgc tcgctcggga 900
gcctcttgct ggaaaataga acagcatttg cagaagcgtt tggcaatgtg cttttggaag 960
aagactaaga ggtagtttct gaacttctcc ccgacaaagg catagatgat ggggttgatg 1020
cagcagtgcg tcatcccaag agtctctgtc acctgcatag cttggtccaa cctgttagag 1080
ctactgcaat tattcaggcc aaagaattcc tggaaggtgt tcaggagaag gacaatgttg 1140
tagggagccc agaagagaaa ataaacaatc atgatggtga agataagcct cacagccctg 1200
tgcctcttct tctcatttcg acaccgaagc agagttttta ggattcccga gtagcagatg 1260
accatgacaa gcagcggcag gaccagcccc aagatgacta tctttaatgt ctggaaattc 1320
ttccagaatt gatactgact gtatggaaaa tgagagctgc aggtgtaatg aagaccttct 1380
ttttgagatc tggtaaagat gattcctggg agagacgcaa acacagccac cacccaagtg 1440
atcacacttg tcaccacccc aaaggtgacc gtcctggctt ttaaagcaaa cacagcatgg 1500
acgacagcca ggtacctatc gattgtcagg aggatgatga agaagattcc agagaagaag 1560
cctataaaat agagccctgt caagagttga cacattgtat ttccaaagtc ccactgggcg 1620
gcagcatagt gagcccagaa ggggacagta agaaggaaaa acaggtcaga gatggccagg 1680
ttgagcaggt agatgtcagt catgctcttc agccttttgc agttttctag acgaggcatc 1740
cagtccagac gccatcaggg catactcact gatctagatg aggatgacca gcatgttgcc 1800
cacaaaacca aagatgaaca ccagtgagta gagcggaggc aggaggcggg ctgcgatttg 1860
cttcacattg attttttggc agggctccga tgtataataa ttgatgtcat agattggact 1920
tgacacttga taatccatct tgttccaccc tgtgcataaa taaaaagtga tcttttataa 1980
agtcctagaa tgtatttagt tgccctccat gaatgcaaac tgttttatac atcaataggt 2040
ttttaattgc ctacatagat gtctacattg aattaactct ctttttggcc aagcaatgaa 2100
gttttgtagt gaagggaagg tttgctgcta gcttccctgt ccactagatg gagagcttgg 2160
ctctgttggg ggaattcatg aaagcaccat ctcaccaaat aaaatcttgt gctctatagc 2220
accatggagt gaatgaagct ttgacaacaa ttaagggcga attcgcggcc gctaaattca 2280
attcgcccta tagtgagtcg tattacaatt cactggccgt cgttttacaa cgtcgtgact 2340
gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 2400
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctatacg 2460
tacggcagtt taaggtttac acctataaaa gagagagccg ttatcgtctg tttgtggatg 2520
tacagagtga tattattgac acgccggggc gacggatggt gatccccctg gccagtgcac 2580
gtctgctgtc agataaagtc tcccgtgaac tttacccggt ggtgcatatc ggggatgaaa 2640
gctggcgcat gatgaccacc gatatggcca gtgtgccggt ctccgttatc ggggaagaag 2700
tggctgatct cagccaccgc gaaaatgaca tcaaaaacgc cattaacctg atgttctggg 2760
gaatataaat gtcaggcatg agattatcaa aaaggatctt cacctagatc cttttcacgt 2820
agaaagccag tccgcagaaa cggtgctgac cccggatgaa tgtcagctac tgggctatct 2880
ggacaaggga aaacgcaagc gcaaagagaa agcaggtagc ttgcagtggg cttacatggc 2940
gatagctaga ctgggcggtt ttatggacag caagcgaacc ggaattgcca gctggggcgc 3000
cctctggtaa ggttgggaag ccctgcaaag taaactggat ggctttcttg ccgccaagga 3060
tctgatggcg caggggatca agctctgatc aagagacagg atgaggatcg tttcgcatga 3120
ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct 3180
atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc 3240
aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcaag 3300
acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg 3360
acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc 3420
tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc 3480
ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg 3540
agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc 3600
atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgagcatg cccgacggcg 3660
aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc 3720
gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag 3780
cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg 3840
tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg 3900
agttcttctg aattattaac gcttacaatt tcctgatgcg gtattttctc cttacgcatc 3960
tgtgcggtat ttcacaccgc atcaggtggc acttttcggg gaaatgtgcg cggaacccct 4020
atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagatt atcaaaaagg 4080
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 4140
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 4200
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 4260
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 4320
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 4380
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 4440
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 4500
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 4560
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 4620
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 4680
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 4740
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 4800
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 4860
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 4920
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 4980
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 5040
tattgaagca tttatcaggg ttattgtctc atgaccaaaa tcccttaacg tgagttttcg 5100
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5160
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5220
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5280
ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 5340
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 5400
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 5460
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 5520
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 5580
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 5640
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 5700
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5760
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5820
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5880
gagcgcagcg agtcagtgag cgaggaagcg gaag 5914
<210> 177
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 177
tcatctttgg ttttgtgggc aacatgctgg tcatcctcat ctagatcagt gagtatgccc 60
tgatggcgtc tggactggat gcctcgtcta gaaaactgca aaaggctgaa gagcatgact 120
gacatctacc tgctcaac 138
<210> 178
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 178
ttgacaatcc t 11
<210> 179
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 179
ttgaccatcc t 11
<210> 180
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 180
ttgacgatcc t 11
<210> 181
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 181
ttgactatcc t 11
<210> 182
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 182
ttgaccatcc t 11
<210> 183
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 183
ttgactatcc t 11
<210> 184
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 184
ttgacgatcc t 11
<210> 185
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 185
gcagctgccc agacct 16
<210> 186
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 186
gaccctgcct gct 13
<210> 187
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 187
gaccctgcct gctcct 16
<210> 188
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 188
cacctgcagc tgcccag 17
<210> 189
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 189
gggctctccc atgcat 16
<210> 190
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 190
tcctagaagg gcaggc 16
<210> 191
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 191
ctgggctctc ccat 14
<210> 192
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 192
cccccattcc tagaagg 17
<210> 193
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 193
ccgcaccccc agct 14
<210> 194
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 194
gctcctggcc cttgca 16
<210> 195
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 195
ggcactccgc accccca 17
<210> 196
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 196
accgctgtgc tcctggc 17
<210> 197
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 197
ggcactccgc acccc 15
<210> 198
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 198
taccgctgtg ctcct 15
<210> 199
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 199
acgccgtgga aaggcc 16
<210> 200
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 200
cggggatgat ctacgg 16
<210> 201
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 201
acgccgtgga aaggc 15
<210> 202
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 202
cggggatgat ctac 14
<210> 203
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 203
acgccgtgga aaggcc 16
<210> 204
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 204
cggggatgat ctac 14
<210> 205
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 205
cgttgccccc gccct 15
<210> 206
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 206
atgagcggcc ccgcc 15
<210> 207
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 207
gagcggcccc gcccgt 16
<210> 208
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 208
cgttgccccc gccct 15
<210> 209
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 209
atgagcggcc ccgcc 15
<210> 210
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 210
gaatcgttgc ccccgc 16
<210> 211
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 211
gagcggcccc gcccgt 16
<210> 212
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 212
gaatcgttgc ccccgc 16
<210> 213
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 213
tcccctccac cccacagtgg ggccactagg gacaggattg gtgacagaaa a 51
<210> 214
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 214
ttttctgtca ccaatcctgt ccctagtggc cccactgtgg ggtggagggg a 51
<210> 215
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 215
tccagcctga tggaacttat aagggagaaa gtgatttgca gttggaaaga a 51
<210> 216
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 216
ttctttccaa ctgcaaatca ctttctccct tataagttcc atcaggctgg a 51
<210> 217
<211> 5991
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 217
gactcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660
aattaatacg actcactata gggagaccca agctggctag cgtttaaact taagctgatc 720
cactagtcca gtgtggtgga attcgccatg gactacaaag accatgacgg tgattataaa 780
gatcatgaca tcgattacaa ggatgacgat gacaagatgg cccccaagaa gaagaggaag 840
gtgggcattc acggggtacc cgccgctgtg gatctacgca cgctcggcta cagccagcag 900
caacaggaga agatcaaacc gaaggttcgt tcgacagtgg cgcagcacca cgaggcactg 960
gtcggccatg ggtttacaca cgcgcacatc gttgcgctca gccaacaccc ggcagcgtta 1020
gggaccgtcg ctgtcaagta tcaggacatg atcgcagcgt tgccagaggc gacacacgaa 1080
gcgatcgttg gcgtcggcaa acagtggtcc ggcgcacgcg ccctggaggc cttgctcacg 1140
gtggcgggag agttgagagg tccaccgtta cagttggaca caggccaact tctcaagatt 1200
gcaaaacgtg gcggcgtgac cgcagtggag gcagtgcatg catggcgcaa tgcactgacg 1260
ggggcccccc tgaaccttac tcccgaacaa gtagtagcga tagccagtaa taacggaggt 1320
aaacaagcct tggagacggt ccaaaggttg ctcccggtct tgtgtcaggc acatgggctg 1380
acgcctcaac aggtcgtcgc gatagcgtct aataatggag gaaagcaagc tctggaaacc 1440
gtccagcgac tccttccggt tctgtgccag gctcatggtc tgactccgca gcaagtcgtt 1500
gctatagcgt ccaacatcgg aggcaaacag gccctggaga ccgtgcagcg gttgttgcct 1560
gtgctttgcc aagcccacgg gcttacgcct gagcaagtgg tggcgattgc cagtaacaac 1620
ggcggcaaac aagcccttga gactgtgcag aggctcttgc cggtactctg ccaagcacac 1680
ggcttgaccc ccgagcaggt tgtagccata gctagtcacg acgggggtaa gcaagcgttg 1740
gaaacggtgc aagcacttct ccccgttctc tgtcaagcgc atggacttac cccggaacag 1800
gtggtcgcca ttgcaagcca tgatggagga aagcaggcgc tcgaaacagt ccaggcactt 1860
ttgcccgtac tttgtcaagc tcacggtctc accccggaac aggtggtagc cattgcatct 1920
aacatcggag gtaagcaagc attggaaacg gttcaggccc tgttgcctgt actttgccag 1980
gcgcacggtc tgacacctga gcaggttgtc gccatcgcta gcaacggagg tgggaaacag 2040
gcacttgaaa ctgtgcagag gcttctgccg gtgctgtgcc aagcgcatgg ccttacaccc 2100
gagcaagtag tggctattgc gagtcatgat ggaggcaagc aagcgctgga gactgtccaa 2160
cgacttcttc cggtcttgtg tcaggcacat ggattgaccc ctcaacaagt cgtggcgata 2220
gctagcaacg gcggtggaaa acaggccctc gaaaccgtcc agcgactgct ccccgtactg 2280
tgtcaagccc atggacttac cccagaacaa gttgtggcga ttgcctctaa caatggtggg 2340
aagcaagctc ttgagacggt gcaggcgttg ttgcccgtgc tttgtcaagc tcacgggctc 2400
acgccagagc aagtggtcgc tatcgcgagt aataaagggg gcaaacaagc cttggagaca 2460
gtgcaaaggc tcctgccagt gctctgccag gctcatggtt tgacacccga acaggtagtt 2520
gcaatagcga gtcatgatgg cggaaagcaa gctcttgaaa ctgtgcagcg gctgttgcct 2580
gtactgtgtc aagcccacgg gctgacaccg gaacaagttg tagcgatcgc tagccacgat 2640
ggcgggaaac aagctctgga aacggtacag agactcctcc cagtgctttg tcaggcacac 2700
ggcctcacgc cagagcaggt tgtcgccatc gcgtcaaaca atggtggaaa gcaggccctg 2760
gagacagtcc aacggttgct gccggtcctt tgccaggctc acgggttgac cccccagcag 2820
gtcgtggcca ttgcctcaaa caagggcggt aggccagcat tggagacggt gcagaggctt 2880
ctgcctgtgc tctgccaagc gcatggactc acccccgagc aagtggttgc tatcgcaagt 2940
aacaacggag ggaaacaagc gctcgaaacc gtgcaaaggt tgctccccgt tctctgtcag 3000
gcgcacggtc ttacgccaca acaggtggtg gcgattgcat ctaatggagg cggacgccct 3060
gccttggaga gcattgtggc ccagctgtcc aggccggacc ctgccctggc cgcgttaacc 3120
aacgaccacc tcgtcgcctt ggcctgcctc ggcggaggtt ctggcggcag cggatcccag 3180
ctggtgaaga gcgagctgga ggagaagaag tccgagctgc ggcacaagct gaagtacgtg 3240
ccccacgagt acatcgagct gatcgagatc gccaggaaca gcacccagga ccgcatcctg 3300
gagatgaagg tgatggagtt cttcatgaag gtgtacggct acaggggaaa gcacctgggc 3360
ggaagcagaa agcctgacgg cgccatctat acagtgggca gccccatcga ttacggcgtg 3420
atcgtggaca caaaggccta cagcggcggc tacaatctgc ctatcggcca ggccgacgag 3480
atgcagagat acgtggagga gaaccagacc cggaataagc acatcaaccc caacgagtgg 3540
tggaaggtgt accctagcag cgtgaccgag ttcaagttcc tgttcgtgag cggccacttc 3600
aagggcaact acaaggccca gctgaccagg ctgaaccaca tcaccaactg caatggcgcc 3660
gtgctgagcg tggaggagct gctgatcggc ggcgagatga tcaaagccgg caccctgaca 3720
ctggaggagg tgcggcgcaa gttcaacaac ggcgagatca acttcagatc ttgataactc 3780
gagtctagag ggcccgttta aacccgctga tcagcctcga ctgtgccttc tagttgccag 3840
ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact 3900
gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt 3960
ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat 4020
gctggggatg cggtgggctc tatggcttct actgggcggt tttatggaca gcaagcgaac 4080
cggaattgcc agctggggcg ccctctggta aggttgggaa gccctgcaaa gtaaactgga 4140
tggctttctc gccgccaagg atctgatggc gcaggggatc aagctctgat caagagacag 4200
gatgaggatc gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt 4260
gggtggagag gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg 4320
ccgtgttccg gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg 4380
gtgccctgaa tgaactgcaa gacgaggcag cgcggctatc gtggctggcc acgacgggcg 4440
ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg 4500
gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca 4560
tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc 4620
accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc 4680
aggatgatct ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca 4740
aggcgagcat gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga 4800
atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg 4860
cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg 4920
aatgggctga ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg 4980
ccttctatcg ccttcttgac gagttcttct gaattattaa cgcttacaat ttcctgatgc 5040
ggtattttct ccttacgcat ctgtgcggta tttcacaccg catacaggtg gcacttttcg 5100
gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 5160
gctcatgaga caataaccct gataaatgct tcaataatag cacgtgctaa aacttcattt 5220
ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta 5280
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 5340
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 5400
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 5460
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 5520
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 5580
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 5640
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 5700
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 5760
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 5820
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 5880
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 5940
ggccttttta cggttcctgg gcttttgctg gccttttgct cacatgttct t 5991
<210> 218
<211> 1008
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 218
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
195 200 205
His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala
325 330 335
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
435 440 445
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
465 470 475 480
His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Gln Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Arg Pro Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys
725 730 735
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
740 745 750
His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly
755 760 765
Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp
770 775 780
Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys
785 790 795 800
Leu Gly Gly Gly Ser Gly Gly Ser Gly Ser Gln Leu Val Lys Ser Glu
805 810 815
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
820 825 830
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
835 840 845
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
850 855 860
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
865 870 875 880
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
885 890 895
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
900 905 910
Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
915 920 925
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
930 935 940
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
945 950 955 960
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
965 970 975
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
980 985 990
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
995 1000 1005
<210> 219
<211> 3024
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 219
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccgccgct 120
gtggatctac gcacgctcgg ctacagccag cagcaacagg agaagatcaa accgaaggtt 180
cgttcgacag tggcgcagca ccacgaggca ctggtcggcc atgggtttac acacgcgcac 240
atcgttgcgc tcagccaaca cccggcagcg ttagggaccg tcgctgtcaa gtatcaggac 300
atgatcgcag cgttgccaga ggcgacacac gaagcgatcg ttggcgtcgg caaacagtgg 360
tccggcgcac gcgccctgga ggccttgctc acggtggcgg gagagttgag aggtccaccg 420
ttacagttgg acacaggcca acttctcaag attgcaaaac gtggcggcgt gaccgcagtg 480
gaggcagtgc atgcatggcg caatgcactg acgggggccc ccctgaacct tactcccgaa 540
caagtagtag cgatagccag taataacgga ggtaaacaag ccttggagac ggtccaaagg 600
ttgctcccgg tcttgtgtca ggcacatggg ctgacgcctc aacaggtcgt cgcgatagcg 660
tctaataatg gaggaaagca agctctggaa accgtccagc gactccttcc ggttctgtgc 720
caggctcatg gtctgactcc gcagcaagtc gttgctatag cgtccaacat cggaggcaaa 780
caggccctgg agaccgtgca gcggttgttg cctgtgcttt gccaagccca cgggcttacg 840
cctgagcaag tggtggcgat tgccagtaac aacggcggca aacaagccct tgagactgtg 900
cagaggctct tgccggtact ctgccaagca cacggcttga cccccgagca ggttgtagcc 960
atagctagtc acgacggggg taagcaagcg ttggaaacgg tgcaagcact tctccccgtt 1020
ctctgtcaag cgcatggact taccccggaa caggtggtcg ccattgcaag ccatgatgga 1080
ggaaagcagg cgctcgaaac agtccaggca cttttgcccg tactttgtca agctcacggt 1140
ctcaccccgg aacaggtggt agccattgca tctaacatcg gaggtaagca agcattggaa 1200
acggttcagg ccctgttgcc tgtactttgc caggcgcacg gtctgacacc tgagcaggtt 1260
gtcgccatcg ctagcaacgg aggtgggaaa caggcacttg aaactgtgca gaggcttctg 1320
ccggtgctgt gccaagcgca tggccttaca cccgagcaag tagtggctat tgcgagtcat 1380
gatggaggca agcaagcgct ggagactgtc caacgacttc ttccggtctt gtgtcaggca 1440
catggattga cccctcaaca agtcgtggcg atagctagca acggcggtgg aaaacaggcc 1500
ctcgaaaccg tccagcgact gctccccgta ctgtgtcaag cccatggact taccccagaa 1560
caagttgtgg cgattgcctc taacaatggt gggaagcaag ctcttgagac ggtgcaggcg 1620
ttgttgcccg tgctttgtca agctcacggg ctcacgccag agcaagtggt cgctatcgcg 1680
agtaataaag ggggcaaaca agccttggag acagtgcaaa ggctcctgcc agtgctctgc 1740
caggctcatg gtttgacacc cgaacaggta gttgcaatag cgagtcatga tggcggaaag 1800
caagctcttg aaactgtgca gcggctgttg cctgtactgt gtcaagccca cgggctgaca 1860
ccggaacaag ttgtagcgat cgctagccac gatggcggga aacaagctct ggaaacggta 1920
cagagactcc tcccagtgct ttgtcaggca cacggcctca cgccagagca ggttgtcgcc 1980
atcgcgtcaa acaatggtgg aaagcaggcc ctggagacag tccaacggtt gctgccggtc 2040
ctttgccagg ctcacgggtt gaccccccag caggtcgtgg ccattgcctc aaacaagggc 2100
ggtaggccag cattggagac ggtgcagagg cttctgcctg tgctctgcca agcgcatgga 2160
ctcacccccg agcaagtggt tgctatcgca agtaacaacg gagggaaaca agcgctcgaa 2220
accgtgcaaa ggttgctccc cgttctctgt caggcgcacg gtcttacgcc acaacaggtg 2280
gtggcgattg catctaatgg aggcggacgc cctgccttgg agagcattgt ggcccagctg 2340
tccaggccgg accctgccct ggccgcgtta accaacgacc acctcgtcgc cttggcctgc 2400
ctcggcggag gttctggcgg cagcggatcc cagctggtga agagcgagct ggaggagaag 2460
aagtccgagc tgcggcacaa gctgaagtac gtgccccacg agtacatcga gctgatcgag 2520
atcgccagga acagcaccca ggaccgcatc ctggagatga aggtgatgga gttcttcatg 2580
aaggtgtacg gctacagggg aaagcacctg ggcggaagca gaaagcctga cggcgccatc 2640
tatacagtgg gcagccccat cgattacggc gtgatcgtgg acacaaaggc ctacagcggc 2700
ggctacaatc tgcctatcgg ccaggccgac gagatgcaga gatacgtgga ggagaaccag 2760
acccggaata agcacatcaa ccccaacgag tggtggaagg tgtaccctag cagcgtgacc 2820
gagttcaagt tcctgttcgt gagcggccac ttcaagggca actacaaggc ccagctgacc 2880
aggctgaacc acatcaccaa ctgcaatggc gccgtgctga gcgtggagga gctgctgatc 2940
ggcggcgaga tgatcaaagc cggcaccctg acactggagg aggtgcggcg caagttcaac 3000
aacggcgaga tcaacttcag atct 3024
<210> 220
<211> 1036
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 220
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu
165 170 175
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
180 185 190
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
195 200 205
Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly
210 215 220
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
225 230 235 240
Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Ile
245 250 255
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
260 265 270
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
275 280 285
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
290 295 300
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
305 310 315 320
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu
325 330 335
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
340 345 350
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
355 360 365
Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
370 375 380
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
385 390 395 400
Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
405 410 415
Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu
420 425 430
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
435 440 445
Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln
450 455 460
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
465 470 475 480
Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
485 490 495
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
500 505 510
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn
515 520 525
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu
530 535 540
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
545 550 555 560
Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
565 570 575
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
580 585 590
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
595 600 605
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
610 615 620
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
625 630 635 640
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
645 650 655
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
660 665 670
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
675 680 685
Gln Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Arg Pro Ala Leu
690 695 700
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
705 710 715 720
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
725 730 735
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
740 745 750
Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
755 760 765
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
770 775 780
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
785 790 795 800
Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala
805 810 815
Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser
820 825 830
His Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
835 840 845
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
850 855 860
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
865 870 875 880
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
885 890 895
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
900 905 910
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
915 920 925
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
930 935 940
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
945 950 955 960
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
965 970 975
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His
980 985 990
Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile
995 1000 1005
Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val
1010 1015 1020
Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
1025 1030 1035
<210> 221
<211> 3108
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 221
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120
gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180
tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240
gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300
atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360
ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420
cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480
gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaaccttac tcccgaacaa 540
gtagtagcga tagccagtaa taacggaggt aaacaagcct tggagacggt ccaaaggttg 600
ctcccggtct tgtgtcaggc acatgggctg acgcctcaac aggtcgtcgc gatagcgtct 660
aataatggag gaaagcaagc tctggaaacc gtccagcgac tccttccggt tctgtgccag 720
gctcatggtc tgactccgca gcaagtcgtt gctatagcgt ccaacatcgg aggcaaacag 780
gccctggaga ccgtgcagcg gttgttgcct gtgctttgcc aagcccacgg gcttacgcct 840
gagcaagtgg tggcgattgc cagtaacaac ggcggcaaac aagcccttga gactgtgcag 900
aggctcttgc cggtactctg ccaagcacac ggcttgaccc ccgagcaggt tgtagccata 960
gctagtcacg acgggggtaa gcaagcgttg gaaacggtgc aagcacttct ccccgttctc 1020
tgtcaagcgc atggacttac cccggaacag gtggtcgcca ttgcaagcca tgatggagga 1080
aagcaggcgc tcgaaacagt ccaggcactt ttgcccgtac tttgtcaagc tcacggtctc 1140
accccggaac aggtggtagc cattgcatct aacatcggag gtaagcaagc attggaaacg 1200
gttcaggccc tgttgcctgt actttgccag gcgcacggtc tgacacctga gcaggttgtc 1260
gccatcgcta gcaacggagg tgggaaacag gcacttgaaa ctgtgcagag gcttctgccg 1320
gtgctgtgcc aagcgcatgg ccttacaccc gagcaagtag tggctattgc gagtcatgat 1380
ggaggcaagc aagcgctgga gactgtccaa cgacttcttc cggtcttgtg tcaggcacat 1440
ggattgaccc ctcaacaagt cgtggcgata gctagcaacg gcggtggaaa acaggccctc 1500
gaaaccgtcc agcgactgct ccccgtactg tgtcaagccc atggacttac cccagaacaa 1560
gttgtggcga ttgcctctaa caatggtggg aagcaagctc ttgagacggt gcaggcgttg 1620
ttgcccgtgc tttgtcaagc tcacgggctc acgccagagc aagtggtcgc tatcgcgagt 1680
aataaagggg gcaaacaagc cttggagaca gtgcaaaggc tcctgccagt gctctgccag 1740
gctcatggtt tgacacccga acaggtagtt gcaatagcga gtcatgatgg cggaaagcaa 1800
gctcttgaaa ctgtgcagcg gctgttgcct gtactgtgtc aagcccacgg gctgacaccg 1860
gaacaagttg tagcgatcgc tagccacgat ggcgggaaac aagctctgga aacggtacag 1920
agactcctcc cagtgctttg tcaggcacac ggcctcacgc cagagcaggt tgtcgccatc 1980
gcgtcaaaca atggtggaaa gcaggccctg gagacagtcc aacggttgct gccggtcctt 2040
tgccaggctc acgggttgac cccccagcag gtcgtggcca ttgcctcaaa caagggcggt 2100
aggccagcat tggagacggt gcagaggctt ctgcctgtgc tctgccaagc gcatggactc 2160
acccccgagc aagtggttgc tatcgcaagt aacaacggag ggaaacaagc gctcgaaacc 2220
gtgcaaaggt tgctccccgt tctctgtcag gcgcacggtc ttacgccaca acaggtggtg 2280
gcgattgcat ctaatggagg cggacgccct gccttggaga gcattgtggc ccagctgtcc 2340
aggccggacc ctgccctggc cgcgttaacc aacgaccacc tcgtcgcctt ggcctgcctc 2400
ggcggacgtc ctgcgctgga tgcagtgaaa aagggattgc cgcacgcgcc ggccttgatc 2460
aaaagaacca atcgccgtat tcccgaacgc acatcccatc gcgttgccgg atcccagctg 2520
gtgaagagcg agctggagga gaagaagtcc gagctgcggc acaagctgaa gtacgtgccc 2580
cacgagtaca tcgagctgat cgagatcgcc aggaacagca cccaggaccg catcctggag 2640
atgaaggtga tggagttctt catgaaggtg tacggctaca ggggaaagca cctgggcgga 2700
agcagaaagc ctgacggcgc catctataca gtgggcagcc ccatcgatta cggcgtgatc 2760
gtggacacaa aggcctacag cggcggctac aatctgccta tcggccaggc cgacgagatg 2820
cagagatacg tggaggagaa ccagacccgg aataagcaca tcaaccccaa cgagtggtgg 2880
aaggtgtacc ctagcagcgt gaccgagttc aagttcctgt tcgtgagcgg ccacttcaag 2940
ggcaactaca aggcccagct gaccaggctg aaccacatca ccaactgcaa tggcgccgtg 3000
ctgagcgtgg aggagctgct gatcggcggc gagatgatca aagccggcac cctgacactg 3060
gaggaggtgc ggcgcaagtt caacaacggc gagatcaact tcagatct 3108
<210> 222
<211> 1001
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 222
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu
165 170 175
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
180 185 190
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
195 200 205
Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly
210 215 220
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
225 230 235 240
Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile
245 250 255
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
260 265 270
Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser
275 280 285
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
290 295 300
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
305 310 315 320
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
325 330 335
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
340 345 350
Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
355 360 365
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln
370 375 380
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
385 390 395 400
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
405 410 415
Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
420 425 430
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
435 440 445
Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
450 455 460
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
465 470 475 480
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
485 490 495
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
500 505 510
Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly
515 520 525
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
530 535 540
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
545 550 555 560
Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
565 570 575
Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile
580 585 590
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
595 600 605
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val
610 615 620
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
625 630 635 640
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
645 650 655
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
660 665 670
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
675 680 685
Gln Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu
690 695 700
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
705 710 715 720
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
725 730 735
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
740 745 750
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
755 760 765
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
770 775 780
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
785 790 795 800
Gly Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu
805 810 815
Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile
820 825 830
Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val
835 840 845
Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly
850 855 860
Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile
865 870 875 880
Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn
885 890 895
Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn
900 905 910
Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr
915 920 925
Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe
930 935 940
Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn
945 950 955 960
Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu
965 970 975
Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe
980 985 990
Asn Asn Gly Glu Ile Asn Phe Arg Ser
995 1000
<210> 223
<211> 3003
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 223
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acctatggtg 120
gacttgagga cactcggtta ttcgcaacag caacaggaga aaatcaagcc taaggtcagg 180
agcaccgtcg cgcaacacca cgaggcgctt gtggggcatg gcttcactca tgcgcatatt 240
gtcgcgcttt cacagcaccc tgcggcgctt gggacggtgg ctgtcaaata ccaagatatg 300
attgcggccc tgcccgaagc cacgcacgag gcaattgtag gggtcggtaa acagtggtcg 360
ggagcgcgag cacttgaggc gctgctgact gtggcgggtg agcttagggg gcctccgctc 420
cagctcgaca ccgggcagct gctgaagatc gcgaagagag ggggagtaac agcggtagag 480
gcagtgcacg cctggcgcaa tgcgctcacc ggggccccct tgaatcttac tccagagcag 540
gtcgtcgcaa tcgcgtcgaa taacggggga aagcaagcac tggaaaccgt gcagaggttg 600
ttgccggtct tgtgtcaggc tcacggcttg acacctgccc aagtggtggc cattgcgtcg 660
aacatcgggg gaaaacaggc acttgaaaca gtccagagac ttttgcccgt cctctgccag 720
gcgcacggcc tcacgccgga tcaggtggta gccatcgcgt caaacatcgg agggaagcag 780
gctctggaaa cggtgcagcg gcttttgccg gtactttgcc aagctcatgg gctcacgcca 840
gcccaagtgg tagctatcgc atcgcacgac ggagggaagc aggccttgga gacagtgcaa 900
cggctcctcc ccgtgttgtg ccaggcacat gggttgactc cagagcaggt cgtagcaatc 960
gcctccaata tcgggggaaa gcaagcgttg gagacagtgc agcgactgct gcctgtgctt 1020
tgccaggctc atggcctgac gcccgatcag gtagtggcaa tcgcgtcaaa caaaggtgga 1080
aagcaggcac tcgaaacggt acagcgcttg ctgcccgtct tgtgtcaggc ccacggtctg 1140
acacccgacc aggtagtcgc gattgcgtcg aacatcgggg gaaagcaagc gttggaaacg 1200
gtacaacgcc tgctcccggt gctctgccag gctcatggac ttacacccga gcaggtggtc 1260
gccatcgcgt caaacatcgg aggcaaacag gcattggaga cagtgcagcg ccttctccca 1320
gtcttgtgtc aggcccacgg tctgacaccc gaccaggtcg tcgcgattgc atcgaatgga 1380
ggtgggaaac aggcccttga gacagtacag aggcttttgc ccgtgttgtg ccaggcccac 1440
ggactcacac ccgaacaagt cgtcgccatt gccagccatg atggaggtaa acaggcactt 1500
gagactgtcc agcgcctcct gccggtgctg tgccaagcac atgggctgac cccgcagcaa 1560
gtcgtagcga tcgcctcgaa tggtggagga aaacaagcgc ttgaaaccgt ccagaggttg 1620
ctcccggtgc tgtgccaggc acatggcctt acgcctgaac aagtagtcgc gattgccagc 1680
aacaaaggcg gaaaacaggc tctcgaaacg gtccagcggt tgctgccggt gttgtgccag 1740
gcgcacggtc ttacaccgga ccaggtggtg gcgattgcct cccacgatgg gggtaaacag 1800
gcactggaaa ccgtgcagag attgctccca gtactttgtc aggcacatgg tctgactcct 1860
gctcaagtgg tcgcgatcgc ctcgaacaat ggcggaaagc aggcgctcga aacggtacag 1920
cggctccttc cggtgctctg ccaagcccac ggattgacgc cagaacaggt cgtggcaatt 1980
gcgtcacacg acggtggaaa gcaggcgctc gaaactgtgc aaagactcct gcccgtactc 2040
tgccaggcac acggtttgac tccccagcag gtagtggcca tcgcgagcaa taagggagga 2100
aagcaggcgc ttgaaacggt gcagagactt ctgcccgtgc tttgtcaagc ccacgggctg 2160
actccggagc aggtagtggc catcgcctca aacaacggag gaaagcaagc tctcgaaacc 2220
gtacagaggc ttctccccgt gctctgtcag gcccacgggt tgacccccga acaggtggtc 2280
gccattgcta gcaacggggg aggacggcca gccttggagt ccatcgtagc ccaattgtcc 2340
aggcccgatc ccgcgttggc tgcgttaacg aatgaccatc tggtggcgtt ggcatgtctt 2400
ggtggatccc agctggtgaa gagcgagctg gaggagaaga agtccgagct gcggcacaag 2460
ctgaagtacg tgccccacga gtacatcgag ctgatcgaga tcgccaggaa cagcacccag 2520
gaccgcatcc tggagatgaa ggtgatggag ttcttcatga aggtgtacgg ctacagggga 2580
aagcacctgg gcggaagcag aaagcctgac ggcgccatct atacagtggg cagccccatc 2640
gattacggcg tgatcgtgga cacaaaggcc tacagcggcg gctacaatct gcctatcggc 2700
caggccgacg agatgcagag atacgtggag gagaaccaga cccggaataa gcacatcaac 2760
cccaacgagt ggtggaaggt gtaccctagc agcgtgaccg agttcaagtt cctgttcgtg 2820
agcggccact tcaagggcaa ctacaaggcc cagctgacca ggctgaacca catcaccaac 2880
tgcaatggcg ccgtgctgag cgtggaggag ctgctgatcg gcggcgagat gatcaaagcc 2940
ggcaccctga cactggagga ggtgcggcgc aagttcaaca acggcgagat caacttcaga 3000
tct 3003
<210> 224
<211> 1036
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 224
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu
165 170 175
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
180 185 190
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
195 200 205
Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly
210 215 220
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
225 230 235 240
Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile
245 250 255
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
260 265 270
Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser
275 280 285
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
290 295 300
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
305 310 315 320
Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
325 330 335
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
340 345 350
Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
355 360 365
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln
370 375 380
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
385 390 395 400
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
405 410 415
Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
420 425 430
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
435 440 445
Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
450 455 460
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
465 470 475 480
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
485 490 495
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
500 505 510
Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly
515 520 525
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
530 535 540
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
545 550 555 560
Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
565 570 575
Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile
580 585 590
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
595 600 605
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val
610 615 620
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
625 630 635 640
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
645 650 655
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
660 665 670
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
675 680 685
Gln Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu
690 695 700
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
705 710 715 720
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
725 730 735
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
740 745 750
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
755 760 765
Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro
770 775 780
Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu
785 790 795 800
Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala
805 810 815
Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser
820 825 830
His Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys
835 840 845
Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile
850 855 860
Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu
865 870 875 880
Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys
885 890 895
His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly
900 905 910
Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly
915 920 925
Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val
930 935 940
Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp
945 950 955 960
Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser
965 970 975
Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His
980 985 990
Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile
995 1000 1005
Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val
1010 1015 1020
Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
1025 1030 1035
<210> 225
<211> 3108
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 225
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acctatggtg 120
gacttgagga cactcggtta ttcgcaacag caacaggaga aaatcaagcc taaggtcagg 180
agcaccgtcg cgcaacacca cgaggcgctt gtggggcatg gcttcactca tgcgcatatt 240
gtcgcgcttt cacagcaccc tgcggcgctt gggacggtgg ctgtcaaata ccaagatatg 300
attgcggccc tgcccgaagc cacgcacgag gcaattgtag gggtcggtaa acagtggtcg 360
ggagcgcgag cacttgaggc gctgctgact gtggcgggtg agcttagggg gcctccgctc 420
cagctcgaca ccgggcagct gctgaagatc gcgaagagag ggggagtaac agcggtagag 480
gcagtgcacg cctggcgcaa tgcgctcacc ggggccccct tgaatcttac tccagagcag 540
gtcgtcgcaa tcgcgtcgaa taacggggga aagcaagcac tggaaaccgt gcagaggttg 600
ttgccggtct tgtgtcaggc tcacggcttg acacctgccc aagtggtggc cattgcgtcg 660
aacatcgggg gaaaacaggc acttgaaaca gtccagagac ttttgcccgt cctctgccag 720
gcgcacggcc tcacgccgga tcaggtggta gccatcgcgt caaacatcgg agggaagcag 780
gctctggaaa cggtgcagcg gcttttgccg gtactttgcc aagctcatgg gctcacgcca 840
gcccaagtgg tagctatcgc atcgcacgac ggagggaagc aggccttgga gacagtgcaa 900
cggctcctcc ccgtgttgtg ccaggcacat gggttgactc cagagcaggt cgtagcaatc 960
gcctccaata tcgggggaaa gcaagcgttg gagacagtgc agcgactgct gcctgtgctt 1020
tgccaggctc atggcctgac gcccgatcag gtagtggcaa tcgcgtcaaa caaaggtgga 1080
aagcaggcac tcgaaacggt acagcgcttg ctgcccgtct tgtgtcaggc ccacggtctg 1140
acacccgacc aggtagtcgc gattgcgtcg aacatcgggg gaaagcaagc gttggaaacg 1200
gtacaacgcc tgctcccggt gctctgccag gctcatggac ttacacccga gcaggtggtc 1260
gccatcgcgt caaacatcgg aggcaaacag gcattggaga cagtgcagcg ccttctccca 1320
gtcttgtgtc aggcccacgg tctgacaccc gaccaggtcg tcgcgattgc atcgaatgga 1380
ggtgggaaac aggcccttga gacagtacag aggcttttgc ccgtgttgtg ccaggcccac 1440
ggactcacac ccgaacaagt cgtcgccatt gccagccatg atggaggtaa acaggcactt 1500
gagactgtcc agcgcctcct gccggtgctg tgccaagcac atgggctgac cccgcagcaa 1560
gtcgtagcga tcgcctcgaa tggtggagga aaacaagcgc ttgaaaccgt ccagaggttg 1620
ctcccggtgc tgtgccaggc acatggcctt acgcctgaac aagtagtcgc gattgccagc 1680
aacaaaggcg gaaaacaggc tctcgaaacg gtccagcggt tgctgccggt gttgtgccag 1740
gcgcacggtc ttacaccgga ccaggtggtg gcgattgcct cccacgatgg gggtaaacag 1800
gcactggaaa ccgtgcagag attgctccca gtactttgtc aggcacatgg tctgactcct 1860
gctcaagtgg tcgcgatcgc ctcgaacaat ggcggaaagc aggcgctcga aacggtacag 1920
cggctccttc cggtgctctg ccaagcccac ggattgacgc cagaacaggt cgtggcaatt 1980
gcgtcacacg acggtggaaa gcaggcgctc gaaactgtgc aaagactcct gcccgtactc 2040
tgccaggcac acggtttgac tccccagcag gtagtggcca tcgcgagcaa taagggagga 2100
aagcaggcgc ttgaaacggt gcagagactt ctgcccgtgc tttgtcaagc ccacgggctg 2160
actccggagc aggtagtggc catcgcctca aacaacggag gaaagcaagc tctcgaaacc 2220
gtacagaggc ttctccccgt gctctgtcag gcccacgggt tgacccccga acaggtggtc 2280
gccattgcta gcaacggggg aggacggcca gccttggagt ccatcgtagc ccaattgtcc 2340
aggcccgatc ccgcgttggc tgcgttaacg aatgaccatc tggtggcgtt ggcatgtctt 2400
ggtggacgac ccgcgctcga tgcagtcaaa aagggtctgc ctcatgctcc cgcattgatc 2460
aaaagaacca accggcggat tcccgagaga acttcccatc gagtcgcggg atcccagctg 2520
gtgaagagcg agctggagga gaagaagtcc gagctgcggc acaagctgaa gtacgtgccc 2580
cacgagtaca tcgagctgat cgagatcgcc aggaacagca cccaggaccg catcctggag 2640
atgaaggtga tggagttctt catgaaggtg tacggctaca ggggaaagca cctgggcgga 2700
agcagaaagc ctgacggcgc catctataca gtgggcagcc ccatcgatta cggcgtgatc 2760
gtggacacaa aggcctacag cggcggctac aatctgccta tcggccaggc cgacgagatg 2820
cagagatacg tggaggagaa ccagacccgg aataagcaca tcaaccccaa cgagtggtgg 2880
aaggtgtacc ctagcagcgt gaccgagttc aagttcctgt tcgtgagcgg ccacttcaag 2940
ggcaactaca aggcccagct gaccaggctg aaccacatca ccaactgcaa tggcgccgtg 3000
ctgagcgtgg aggagctgct gatcggcggc gagatgatca aagccggcac cctgacactg 3060
gaggaggtgc ggcgcaagtt caacaacggc gagatcaact tcagatct 3108
<210> 226
<211> 829
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 226
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu
165 170 175
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
180 185 190
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
195 200 205
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys
210 215 220
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
225 230 235 240
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
245 250 255
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
260 265 270
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
275 280 285
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
290 295 300
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
305 310 315 320
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
325 330 335
Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
340 345 350
Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
355 360 365
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val
370 375 380
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
385 390 395 400
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
405 410 415
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
420 425 430
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
435 440 445
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
450 455 460
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
465 470 475 480
Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
485 490 495
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
500 505 510
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
515 520 525
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
530 535 540
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
545 550 555 560
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
565 570 575
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
580 585 590
Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
595 600 605
Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
610 615 620
Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu
625 630 635 640
Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr
645 650 655
Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu
660 665 670
Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly
675 680 685
Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val
690 695 700
Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser
705 710 715 720
Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr
725 730 735
Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp
740 745 750
Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val
755 760 765
Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn
770 775 780
His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu
785 790 795 800
Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val
805 810 815
Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
820 825
<210> 227
<211> 2487
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 227
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120
gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180
tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240
gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300
atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360
ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420
cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480
gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540
gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600
ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660
aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720
catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780
ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840
caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900
ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960
agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020
caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080
gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140
gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260
gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320
tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380
aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440
accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500
gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560
gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680
ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740
ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800
gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860
cacctcgtcg ccttggcctg cctcggcgga tcccagctgg tgaagagcga gctggaggag 1920
aagaagtccg agctgcggca caagctgaag tacgtgcccc acgagtacat cgagctgatc 1980
gagatcgcca ggaacagcac ccaggaccgc atcctggaga tgaaggtgat ggagttcttc 2040
atgaaggtgt acggctacag gggaaagcac ctgggcggaa gcagaaagcc tgacggcgcc 2100
atctatacag tgggcagccc catcgattac ggcgtgatcg tggacacaaa ggcctacagc 2160
ggcggctaca atctgcctat cggccaggcc gacgagatgc agagatacgt ggaggagaac 2220
cagacccgga ataagcacat caaccccaac gagtggtgga aggtgtaccc tagcagcgtg 2280
accgagttca agttcctgtt cgtgagcggc cacttcaagg gcaactacaa ggcccagctg 2340
accaggctga accacatcac caactgcaat ggcgccgtgc tgagcgtgga ggagctgctg 2400
atcggcggcg agatgatcaa agccggcacc ctgacactgg aggaggtgcg gcgcaagttc 2460
aacaacggcg agatcaactt cagatct 2487
<210> 228
<211> 840
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 228
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu
165 170 175
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
180 185 190
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
195 200 205
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys
210 215 220
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
225 230 235 240
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
245 250 255
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
260 265 270
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
275 280 285
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
290 295 300
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
305 310 315 320
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
325 330 335
Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
340 345 350
Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
355 360 365
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val
370 375 380
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
385 390 395 400
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
405 410 415
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
420 425 430
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
435 440 445
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
450 455 460
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
465 470 475 480
Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
485 490 495
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
500 505 510
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
515 520 525
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
530 535 540
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
545 550 555 560
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
565 570 575
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
580 585 590
Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
595 600 605
Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
610 615 620
Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly
625 630 635 640
Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu
645 650 655
Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu
660 665 670
Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met
675 680 685
Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly
690 695 700
Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp
705 710 715 720
Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu
725 730 735
Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln
740 745 750
Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro
755 760 765
Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys
770 775 780
Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys
785 790 795 800
Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met
805 810 815
Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn
820 825 830
Asn Gly Glu Ile Asn Phe Arg Ser
835 840
<210> 229
<211> 2520
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 229
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120
gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180
tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240
gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300
atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360
ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420
cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480
gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540
gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600
ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660
aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720
catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780
ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840
caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900
ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960
agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020
caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080
gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140
gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260
gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320
tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380
aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440
accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500
gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560
gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680
ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740
ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800
gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860
cacctcgtcg ccttggcctg cctcggcgga cgtcctgcgc tggatgcagt gaaaaaggga 1920
ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 1980
aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2040
cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2100
cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2160
tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2220
gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2280
aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2340
ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2400
aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2460
accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2520
<210> 230
<211> 851
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 230
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu
165 170 175
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
180 185 190
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
195 200 205
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys
210 215 220
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
225 230 235 240
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
245 250 255
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
260 265 270
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
275 280 285
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
290 295 300
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
305 310 315 320
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
325 330 335
Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
340 345 350
Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
355 360 365
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val
370 375 380
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
385 390 395 400
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
405 410 415
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
420 425 430
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
435 440 445
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
450 455 460
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
465 470 475 480
Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
485 490 495
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
500 505 510
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
515 520 525
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
530 535 540
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
545 550 555 560
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
565 570 575
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
580 585 590
Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
595 600 605
Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
610 615 620
Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly
625 630 635 640
Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Gly Ser Gln Leu Val
645 650 655
Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys
660 665 670
Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser
675 680 685
Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys
690 695 700
Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp
705 710 715 720
Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val
725 730 735
Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala
740 745 750
Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His
755 760 765
Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu
770 775 780
Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala
785 790 795 800
Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu
805 810 815
Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr
820 825 830
Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn
835 840 845
Phe Arg Ser
850
<210> 231
<211> 2553
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 231
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120
gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180
tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240
gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300
atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360
ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420
cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480
gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540
gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600
ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660
aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720
catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780
ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840
caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900
ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960
agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020
caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080
gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140
gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260
gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320
tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380
aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440
accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500
gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560
gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680
ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740
ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800
gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860
cacctcgtcg ccttggcctg cctcggcgga cgtcctgcgc tggatgcagt gaaaaaggga 1920
ttgccgcacg cgccggcctt gatcaaaaga accggatccc agctggtgaa gagcgagctg 1980
gaggagaaga agtccgagct gcggcacaag ctgaagtacg tgccccacga gtacatcgag 2040
ctgatcgaga tcgccaggaa cagcacccag gaccgcatcc tggagatgaa ggtgatggag 2100
ttcttcatga aggtgtacgg ctacagggga aagcacctgg gcggaagcag aaagcctgac 2160
ggcgccatct atacagtggg cagccccatc gattacggcg tgatcgtgga cacaaaggcc 2220
tacagcggcg gctacaatct gcctatcggc caggccgacg agatgcagag atacgtggag 2280
gagaaccaga cccggaataa gcacatcaac cccaacgagt ggtggaaggt gtaccctagc 2340
agcgtgaccg agttcaagtt cctgttcgtg agcggccact tcaagggcaa ctacaaggcc 2400
cagctgacca ggctgaacca catcaccaac tgcaatggcg ccgtgctgag cgtggaggag 2460
ctgctgatcg gcggcgagat gatcaaagcc ggcaccctga cactggagga ggtgcggcgc 2520
aagttcaaca acggcgagat caacttcaga tct 2553
<210> 232
<211> 864
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 232
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu
165 170 175
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
180 185 190
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
195 200 205
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys
210 215 220
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
225 230 235 240
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
245 250 255
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
260 265 270
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
275 280 285
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
290 295 300
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
305 310 315 320
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
325 330 335
Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
340 345 350
Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
355 360 365
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val
370 375 380
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
385 390 395 400
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
405 410 415
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
420 425 430
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
435 440 445
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
450 455 460
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
465 470 475 480
Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
485 490 495
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
500 505 510
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
515 520 525
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
530 535 540
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
545 550 555 560
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
565 570 575
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
580 585 590
Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
595 600 605
Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
610 615 620
Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly
625 630 635 640
Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro
645 650 655
Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu
660 665 670
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
675 680 685
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
690 695 700
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
705 710 715 720
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
725 730 735
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
740 745 750
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
755 760 765
Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
770 775 780
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
785 790 795 800
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
805 810 815
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
820 825 830
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
835 840 845
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
850 855 860
<210> 233
<211> 2592
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 233
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120
gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180
tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240
gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300
atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360
ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420
cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480
gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540
gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600
ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660
aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720
catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780
ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840
caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900
ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960
agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020
caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080
gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140
gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260
gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320
tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380
aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440
accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500
gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560
gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680
ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740
ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800
gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860
cacctcgtcg ccttggcctg cctcggcgga cgtcctgcgc tggatgcagt gaaaaaggga 1920
ttgccgcacg cgccggcctt gatcaaaaga accaatcgcc gtattcccga acgcacatcc 1980
catcgcgttg ccggatccca gctggtgaag agcgagctgg aggagaagaa gtccgagctg 2040
cggcacaagc tgaagtacgt gccccacgag tacatcgagc tgatcgagat cgccaggaac 2100
agcacccagg accgcatcct ggagatgaag gtgatggagt tcttcatgaa ggtgtacggc 2160
tacaggggaa agcacctggg cggaagcaga aagcctgacg gcgccatcta tacagtgggc 2220
agccccatcg attacggcgt gatcgtggac acaaaggcct acagcggcgg ctacaatctg 2280
cctatcggcc aggccgacga gatgcagaga tacgtggagg agaaccagac ccggaataag 2340
cacatcaacc ccaacgagtg gtggaaggtg taccctagca gcgtgaccga gttcaagttc 2400
ctgttcgtga gcggccactt caagggcaac tacaaggccc agctgaccag gctgaaccac 2460
atcaccaact gcaatggcgc cgtgctgagc gtggaggagc tgctgatcgg cggcgagatg 2520
atcaaagccg gcaccctgac actggaggag gtgcggcgca agttcaacaa cggcgagatc 2580
aacttcagat ct 2592
<210> 234
<211> 880
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 234
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu
165 170 175
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
180 185 190
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
195 200 205
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys
210 215 220
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
225 230 235 240
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
245 250 255
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
260 265 270
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
275 280 285
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
290 295 300
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
305 310 315 320
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
325 330 335
Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
340 345 350
Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
355 360 365
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val
370 375 380
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
385 390 395 400
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
405 410 415
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
420 425 430
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
435 440 445
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
450 455 460
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
465 470 475 480
Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
485 490 495
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
500 505 510
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
515 520 525
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
530 535 540
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
545 550 555 560
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
565 570 575
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
580 585 590
Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
595 600 605
Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
610 615 620
Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly
625 630 635 640
Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro
645 650 655
Glu Arg Thr Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val
660 665 670
Leu Gly Phe Phe Gln Cys His Ser Gly Ser Gln Leu Val Lys Ser Glu
675 680 685
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
690 695 700
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
705 710 715 720
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
725 730 735
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
740 745 750
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
755 760 765
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
770 775 780
Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
785 790 795 800
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
805 810 815
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
820 825 830
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
835 840 845
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
850 855 860
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
865 870 875 880
<210> 235
<211> 2640
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 235
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120
gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180
tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240
gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300
atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360
ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420
cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480
gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540
gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600
ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660
aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720
catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780
ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840
caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900
ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960
agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020
caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080
gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140
gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260
gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320
tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380
aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440
accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500
gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560
gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680
ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740
ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800
gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860
cacctcgtcg ccttggcctg cctcggcgga cgtcctgcgc tggatgcagt gaaaaaggga 1920
ttgccgcacg cgccggcctt gatcaaaaga accaatcgcc gtattcccga acgcacatcc 1980
catcgcgttg ccgaccacgc gcaagtggtt cgcgtgctgg gttttttcca gtgccactcc 2040
ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2100
aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2160
cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2220
cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2280
tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2340
gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2400
aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2460
ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2520
aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2580
accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2640
<210> 236
<211> 896
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 236
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu
165 170 175
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln
180 185 190
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
195 200 205
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Lys
210 215 220
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
225 230 235 240
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
245 250 255
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
260 265 270
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
275 280 285
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
290 295 300
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
305 310 315 320
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
325 330 335
Pro Val Leu Arg Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
340 345 350
Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
355 360 365
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val
370 375 380
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
385 390 395 400
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
405 410 415
Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr
420 425 430
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
435 440 445
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
450 455 460
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
465 470 475 480
Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln
485 490 495
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
500 505 510
Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly
515 520 525
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
530 535 540
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
545 550 555 560
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
565 570 575
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
580 585 590
Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser
595 600 605
Arg Pro Asp Pro Ser Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala
610 615 620
Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly
625 630 635 640
Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro
645 650 655
Glu Arg Thr Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val
660 665 670
Leu Gly Phe Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp
675 680 685
Ala Met Thr Gln Phe Gly Met Ser Gly Ser Gln Leu Val Lys Ser Glu
690 695 700
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
705 710 715 720
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
725 730 735
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
740 745 750
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
755 760 765
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
770 775 780
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
785 790 795 800
Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
805 810 815
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
820 825 830
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
835 840 845
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
850 855 860
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
865 870 875 880
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
885 890 895
<210> 237
<211> 2688
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 237
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcacggggt acccatggtg 120
gatctacgca cgctcggcta cagccagcag caacaggaga agatcaaacc gaaggttcgt 180
tcgacagtgg cgcagcacca cgaggcactg gtcggccatg ggtttacaca cgcgcacatc 240
gttgcgctca gccaacaccc ggcagcgtta gggaccgtcg ctgtcaagta tcaggacatg 300
atcgcagcgt tgccagaggc gacacacgaa gcgatcgttg gcgtcggcaa acagtggtcc 360
ggcgcacgcg ccctggaggc cttgctcacg gtggcgggag agttgagagg tccaccgtta 420
cagttggaca caggccaact tctcaagatt gcaaaacgtg gcggcgtgac cgcagtggag 480
gcagtgcatg catggcgcaa tgcactgacg ggggcccccc tgaacctgac cccggagcag 540
gtggtggcca tcgccagcaa tattggtggc aagcaggcgc tggagacggt gcagcggctg 600
ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 660
aatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 720
catggcctga ccccggagca ggtggtggcc atcgccagca atattggtgg caagcaggcg 780
ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct gaccccggag 840
caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 900
ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc 960
agcaatattg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgcgc 1020
caggcccatg gcctgacccc ggagcaggtc gtggccatcg ccagcaatgg cggcaagcag 1080
gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1140
gcacaggtgg tggccatcgc cagcaatatt ggcggcaagc aggcgctgga gacggtgcag 1200
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt cgtggccatc 1260
gccagccacg atggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1320
tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1380
aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1440
accccggacc aggtggtggc catcgccagc aatggcggtg gcaagcaggc gctggagacg 1500
gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga ccaggtggtg 1560
gccatcgcca gcaatggcgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1620
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1680
ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1740
ggcctgaccc cggagcaggt ggtggccatc gccagcaatg gcggcggcag gccggcgctg 1800
gagagcattg ttgcccagtt atctcgccct gatccgtcgt tggccgcgtt aaccaacgac 1860
cacctcgtcg ccttggcctg cctcggcgga cgtcctgcgc tggatgcagt gaaaaaggga 1920
ttgccgcacg cgccggcctt gatcaaaaga accaatcgcc gtattcccga acgcacatcc 1980
catcgcgttg ccgaccacgc gcaagtggtt cgcgtgctgg gttttttcca gtgccactcc 2040
cacccagcgc aagcatttga tgacgccatg acgcagttcg ggatgagcgg atcccagctg 2100
gtgaagagcg agctggagga gaagaagtcc gagctgcggc acaagctgaa gtacgtgccc 2160
cacgagtaca tcgagctgat cgagatcgcc aggaacagca cccaggaccg catcctggag 2220
atgaaggtga tggagttctt catgaaggtg tacggctaca ggggaaagca cctgggcgga 2280
agcagaaagc ctgacggcgc catctataca gtgggcagcc ccatcgatta cggcgtgatc 2340
gtggacacaa aggcctacag cggcggctac aatctgccta tcggccaggc cgacgagatg 2400
cagagatacg tggaggagaa ccagacccgg aataagcaca tcaaccccaa cgagtggtgg 2460
aaggtgtacc ctagcagcgt gaccgagttc aagttcctgt tcgtgagcgg ccacttcaag 2520
ggcaactaca aggcccagct gaccaggctg aaccacatca ccaactgcaa tggcgccgtg 2580
ctgagcgtgg aggagctgct gatcggcggc gagatgatca aagccggcac cctgacactg 2640
gaggaggtgc ggcgcaagtt caacaacggc gagatcaact tcagatct 2688
<210> 238
<211> 5667
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 238
gactcttcgc gatgtacggg ccagatatac gcgttgacat tgattattga ctagttatta 60
atagtaatca attacggggt cattagttca tagcccatat atggagttcc gcgttacata 120
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 180
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 240
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 300
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 360
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat 420
gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg gatttccaag 480
tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc 540
aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg tacggtggga 600
ggtctatata agcagagctc tctggctaac tagagaaccc actgcttact ggcttatcga 660
aattaatacg actcactata gggagagcca agctgactag cgtttaaact taagctgatc 720
cactagtcca gtgtggtgga attcgccatg gactacaaag accatgacgg tgattataaa 780
gatcatgaca tcgattacaa ggatgacgat gacaagatgg cccccaagaa gaagaggaag 840
gtgggcattc accgcggggt acctatggtg gacttgagga cactcggtta ttcgcaacag 900
caacaggaga aaatcaagcc taaggtcagg agcaccgtcg cgcaacacca cgaggcgctt 960
gtggggcatg gcttcactca tgcgcatatt gtcgcgcttt cacagcaccc tgcggcgctt 1020
gggacggtgg ctgtcaaata ccaagatatg attgcggccc tgcccgaagc cacgcacgag 1080
gcaattgtag gggtcggtaa acagtggtcg ggagcgcgag cacttgaggc gctgctgact 1140
gtggcgggtg agcttagggg gcctccgctc cagctcgaca ccgggcagct gctgaagatc 1200
gcgaagagag ggggagtaac agcggtagag gcagtgcacg cctggcgcaa tgcgctcacc 1260
ggggccccct tgaacctgac cccagaccag gtagtcgcaa tcgccaacaa taacggggga 1320
aagcaagccc tggaaaccgt gcaaaggttg ttgccggtcc tttgtcaaga ccacggcctt 1380
acaccggagc aagtcgtggc cattgcatca catgacggtg gcaaacaggc tcttgagacg 1440
gttcagagac ttctcccagt tctctgtcaa gcccacgggc tgactcccga tcaagttgta 1500
gcgattgcga gcaatggggg agggaaacaa gcattggaga ctgtccaacg gctccttccc 1560
gtgttgtgtc aagcccacgg tttgacgcct gcacaagtgg tcgccatcgc caacaacaac 1620
ggcggtaagc aggcgctgga aacagtacag cgcctgctgc ctgtactgtg ccaggatcat 1680
ggactcaccc cagaccaggt agtcgcaatc gccaacaata acgggggaaa gcaagccctg 1740
gaaaccgtgc aaaggttgtt gccggtcctt tgtcaagacc acggccttac accggagcaa 1800
gtcgtggcca ttgcatcaaa cggaggtggc aaacaggctc ttgagacggt tcagagactt 1860
ctcccagttc tctgtcaagc ccacgggctg actcccgatc aagttgtagc gattgcgagc 1920
catgatggag ggaaacaagc attggagact gtccaacggc tccttcccgt gttgtgtcaa 1980
gcccacggtt tgacgcctgc acaagtggtc gccatcgcct ccaatattgg cggtaagcag 2040
gcgctggaaa cagtacagcg cctgctgcct gtactgtgcc aggatcatgg gctgacccca 2100
gaccaggtag tcgcaatcgc gtcgaatggc gggggaaagc aagccctgga aaccgtgcaa 2160
aggttgttgc cggtcctttg tcaagaccac ggccttacac cggagcaagt cgtggccatt 2220
gcatcacatg acggtggcaa acaggctctt gagacggttc agagacttct cccagttctc 2280
tgtcaagccc acgggctgac tcccgatcaa gttgtagcga ttgcgagcca tgatggaggg 2340
aaacaagcat tggagactgt ccaacggctc cttcccgtgt tgtgtcaagc ccacggtttg 2400
acgcctgcac aagtggtcgc catcgcctcc aacggtggcg gtaagcaggc gctggaaaca 2460
gtacagcgcc tgctgcctgt actgtgccag gatcatggtt tgaccccaga ccaggtagtc 2520
gcaatcgcgt cgcatgacgg gggaaagcaa gccctggaaa ccgtgcaaag gttgttgccg 2580
gtcctttgtc aagaccacgg ccttacgcct gcacaagtgg tcgccatcgc ctccaatatt 2640
ggcggtaagc aggcgctgga aacagtacag cgcctgctgc ctgtactgtg ccaggatcat 2700
ggcctgacac ccgaacaggt ggtcgccatt gctagcaacg ggggaggacg gccagccttg 2760
gagtccatcg tagcccaatt gtccaggccc gatcccgcgt tggctgcgtt aacgaatgac 2820
catctggtgg cgttggcatg tcttggtgga tcccagctgg tgaagagcga gctggaggag 2880
aagaagtccg agctgcggca caagctgaag tacgtgcccc acgagtacat cgagctgatc 2940
gagatcgcca ggaacagcac ccaggaccgc atcctggaga tgaaggtgat ggagttcttc 3000
atgaaggtgt acggctacag gggaaagcac ctgggcggaa gcagaaagcc tgacggcgcc 3060
atctatacag tgggcagccc catcgattac ggcgtgatcg tggacacaaa ggcctacagc 3120
ggcggctaca atctgcctat cggccaggcc gacgagatgc agagatacgt ggaggagaac 3180
cagacccgga ataagcacat caaccccaac gagtggtgga aggtgtaccc tagcagcgtg 3240
accgagttca agttcctgtt cgtgagcggc cacttcaagg gcaactacaa ggcccagctg 3300
accaggctga accacatcac caactgcaat ggcgccgtgc tgagcgtgga ggagctgctg 3360
atcggcggcg agatgatcaa agccggcacc ctgacactgg aggaggtgcg gcgcaagttc 3420
aacaacggcg agatcaactt cagatcttga taactcgagt ctagagggcc cgtttaaacc 3480
cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg cccctccccc 3540
gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata aaatgaggaa 3600
attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt ggggcaggac 3660
agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt gggctctatg 3720
gcttctactg ggcggtttta tggacagcaa gcgaaccgga attgccagct ggggcgccct 3780
ctggtaaggt tgggaagccc tgcaaagtaa actggatggc tttctcgccg ccaaggatct 3840
gatggcgcag gggatcaagc tctgatcaag agacaggatg aggatcgttt cgcatgattg 3900
aacaagatgg attgcacgca ggttctccgg ccgcttgggt ggagaggcta ttcggctatg 3960
actgggcaca acagacaatc ggctgctctg atgccgccgt gttccggctg tcagcgcagg 4020
ggcgcccggt tctttttgtc aagaccgacc tgtccggtgc cctgaatgaa ctgcaagacg 4080
aggcagcgcg gctatcgtgg ctggccacga cgggcgttcc ttgcgcagct gtgctcgacg 4140
ttgtcactga agcgggaagg gactggctgc tattgggcga agtgccgggg caggatctcc 4200
tgtcatctca ccttgctcct gccgagaaag tatccatcat ggctgatgca atgcggcggc 4260
tgcatacgct tgatccggct acctgcccat tcgaccacca agcgaaacat cgcatcgagc 4320
gagcacgtac tcggatggaa gccggtcttg tcgatcagga tgatctggac gaagagcatc 4380
aggggctcgc gccagccgaa ctgttcgcca ggctcaaggc gagcatgccc gacggcgagg 4440
atctcgtcgt gacccatggc gatgcctgct tgccgaatat catggtggaa aatggccgct 4500
tttctggatt catcgactgt ggccggctgg gtgtggcgga ccgctatcag gacatagcgt 4560
tggctacccg tgatattgct gaagagcttg gcggcgaatg ggctgaccgc ttcctcgtgc 4620
tttacggtat cgccgctccc gattcgcagc gcatcgcctt ctatcgcctt cttgacgagt 4680
tcttctgaat tattaacgct tacaatttcc tgatgcggta ttttctcctt acgcatctgt 4740
gcggtatttc acaccgcata caggtggcac ttttcgggga aatgtgcgcg gaacccctat 4800
ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata 4860
aatgcttcaa taatagcacg tgctaaaact tcatttttaa tttaaaagga tctaggtgaa 4920
gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 4980
gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 5040
ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 5100
gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 5160
ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 5220
cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 5280
cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 5340
ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 5400
tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 5460
cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 5520
ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 5580
aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctgggctt 5640
ttgctggcct tttgctcaca tgttctt 5667
<210> 239
<211> 900
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 239
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu
690 695 700
Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu
705 710 715 720
Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn
725 730 735
Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met
740 745 750
Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro
755 760 765
Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile
770 775 780
Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln
785 790 795 800
Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys
805 810 815
His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr
820 825 830
Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys
835 840 845
Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val
850 855 860
Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly
865 870 875 880
Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile
885 890 895
Asn Phe Arg Ser
900
<210> 240
<211> 2700
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 240
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgccaacaac aacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgccaaca ataacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160
aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220
cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280
cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340
tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400
gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460
aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520
ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580
aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640
accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700
<210> 241
<211> 935
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 241
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala
690 695 700
Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys
705 710 715 720
Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly
725 730 735
Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg
740 745 750
His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile
755 760 765
Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu
770 775 780
Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser
785 790 795 800
Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr
805 810 815
Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro
820 825 830
Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr
835 840 845
Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser
850 855 860
Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly
865 870 875 880
Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn
885 890 895
Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile
900 905 910
Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn
915 920 925
Gly Glu Ile Asn Phe Arg Ser
930 935
<210> 242
<211> 2805
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 242
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgccaacaac aacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgccaaca ataacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160
agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220
aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280
gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340
aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400
agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460
gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520
agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580
gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640
aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700
agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760
gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805
<210> 243
<211> 900
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 243
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu
690 695 700
Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu
705 710 715 720
Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn
725 730 735
Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met
740 745 750
Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro
755 760 765
Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile
770 775 780
Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln
785 790 795 800
Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys
805 810 815
His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr
820 825 830
Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys
835 840 845
Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val
850 855 860
Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly
865 870 875 880
Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile
885 890 895
Asn Phe Arg Ser
900
<210> 244
<211> 2700
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 244
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg atcaagtcgt ggccattgca 660
aataataacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggac catggactca ccccagacca ggtagtcgca 960
atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160
aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220
cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280
cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340
tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400
gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460
aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520
ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580
aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640
accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700
<210> 245
<211> 935
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 245
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala
690 695 700
Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys
705 710 715 720
Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly
725 730 735
Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg
740 745 750
His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile
755 760 765
Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu
770 775 780
Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser
785 790 795 800
Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr
805 810 815
Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro
820 825 830
Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr
835 840 845
Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser
850 855 860
Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly
865 870 875 880
Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn
885 890 895
Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile
900 905 910
Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn
915 920 925
Gly Glu Ile Asn Phe Arg Ser
930 935
<210> 246
<211> 2805
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 246
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg atcaagtcgt ggccattgca 660
aataataacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160
agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220
aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280
gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340
aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400
agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460
gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520
agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580
gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640
aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700
agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760
gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805
<210> 247
<211> 900
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 247
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu
690 695 700
Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu
705 710 715 720
Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn
725 730 735
Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met
740 745 750
Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro
755 760 765
Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile
770 775 780
Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln
785 790 795 800
Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys
805 810 815
His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr
820 825 830
Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys
835 840 845
Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val
850 855 860
Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly
865 870 875 880
Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile
885 890 895
Asn Phe Arg Ser
900
<210> 248
<211> 2700
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 248
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacagg cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg ccaacaataa cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160
aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220
cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280
cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340
tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400
gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460
aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520
ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580
aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640
accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700
<210> 249
<211> 935
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 249
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala
690 695 700
Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys
705 710 715 720
Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly
725 730 735
Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg
740 745 750
His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile
755 760 765
Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu
770 775 780
Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser
785 790 795 800
Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr
805 810 815
Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro
820 825 830
Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr
835 840 845
Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser
850 855 860
Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly
865 870 875 880
Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn
885 890 895
Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile
900 905 910
Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn
915 920 925
Gly Glu Ile Asn Phe Arg Ser
930 935
<210> 250
<211> 2805
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 250
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacagg cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg ccaacaataa cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160
agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220
aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280
gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340
aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400
agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460
gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520
agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580
gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640
aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700
agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760
gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805
<210> 251
<211> 968
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 251
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu
770 775 780
Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu
785 790 795 800
Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met
805 810 815
Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly
820 825 830
Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp
835 840 845
Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu
850 855 860
Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln
865 870 875 880
Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro
885 890 895
Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys
900 905 910
Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys
915 920 925
Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met
930 935 940
Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn
945 950 955 960
Asn Gly Glu Ile Asn Phe Arg Ser
965
<210> 252
<211> 2904
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 252
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860
ccggagcaag tcgtggccat tgcatctaat atcggtggca aacaggctct tgagacggtt 1920
cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980
attgcgagca acatcggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040
ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100
ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160
ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220
tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280
ctggtggcgt tggcatgtct tggtggatcc cagctggtga agagcgagct ggaggagaag 2340
aagtccgagc tgcggcacaa gctgaagtac gtgccccacg agtacatcga gctgatcgag 2400
atcgccagga acagcaccca ggaccgcatc ctggagatga aggtgatgga gttcttcatg 2460
aaggtgtacg gctacagggg aaagcacctg ggcggaagca gaaagcctga cggcgccatc 2520
tatacagtgg gcagccccat cgattacggc gtgatcgtgg acacaaaggc ctacagcggc 2580
ggctacaatc tgcctatcgg ccaggccgac gagatgcaga gatacgtgga ggagaaccag 2640
acccggaata agcacatcaa ccccaacgag tggtggaagg tgtaccctag cagcgtgacc 2700
gagttcaagt tcctgttcgt gagcggccac ttcaagggca actacaaggc ccagctgacc 2760
aggctgaacc acatcaccaa ctgcaatggc gccgtgctga gcgtggagga gctgctgatc 2820
ggcggcgaga tgatcaaagc cggcaccctg acactggagg aggtgcggcg caagttcaac 2880
aacggcgaga tcaacttcag atct 2904
<210> 253
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 253
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
770 775 780
Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His
785 790 795 800
Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
805 810 815
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu
820 825 830
Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met
835 840 845
Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His
850 855 860
Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser
865 870 875 880
Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly
885 890 895
Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu
900 905 910
Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys
915 920 925
Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly
930 935 940
His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile
945 950 955 960
Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly
965 970 975
Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg
980 985 990
Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
995 1000
<210> 254
<211> 3009
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 254
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860
ccggagcaag tcgtggccat tgcatctaat atcggtggca aacaggctct tgagacggtt 1920
cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980
attgcgagca acatcggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040
ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100
ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160
ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220
tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280
ctggtggcgt tggcatgtct tggtggacga cccgcgctcg atgcagtcaa aaagggtctg 2340
cctcatgctc ccgcattgat caaaagaacc aaccggcgga ttcccgagag aacttcccat 2400
cgagtcgcgg gatcccagct ggtgaagagc gagctggagg agaagaagtc cgagctgcgg 2460
cacaagctga agtacgtgcc ccacgagtac atcgagctga tcgagatcgc caggaacagc 2520
acccaggacc gcatcctgga gatgaaggtg atggagttct tcatgaaggt gtacggctac 2580
aggggaaagc acctgggcgg aagcagaaag cctgacggcg ccatctatac agtgggcagc 2640
cccatcgatt acggcgtgat cgtggacaca aaggcctaca gcggcggcta caatctgcct 2700
atcggccagg ccgacgagat gcagagatac gtggaggaga accagacccg gaataagcac 2760
atcaacccca acgagtggtg gaaggtgtac cctagcagcg tgaccgagtt caagttcctg 2820
ttcgtgagcg gccacttcaa gggcaactac aaggcccagc tgaccaggct gaaccacatc 2880
accaactgca atggcgccgt gctgagcgtg gaggagctgc tgatcggcgg cgagatgatc 2940
aaagccggca ccctgacact ggaggaggtg cggcgcaagt tcaacaacgg cgagatcaac 3000
ttcagatct 3009
<210> 255
<211> 900
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 255
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu
690 695 700
Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu
705 710 715 720
Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn
725 730 735
Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met
740 745 750
Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro
755 760 765
Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile
770 775 780
Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln
785 790 795 800
Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys
805 810 815
His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr
820 825 830
Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys
835 840 845
Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val
850 855 860
Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly
865 870 875 880
Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile
885 890 895
Asn Phe Arg Ser
900
<210> 256
<211> 2700
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 256
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgccaacaat 1380
aacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaatgg cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160
aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220
cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280
cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340
tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400
gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460
aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520
ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580
aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640
accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700
<210> 257
<211> 935
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 257
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala
690 695 700
Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys
705 710 715 720
Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly
725 730 735
Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg
740 745 750
His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile
755 760 765
Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu
770 775 780
Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser
785 790 795 800
Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr
805 810 815
Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro
820 825 830
Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr
835 840 845
Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser
850 855 860
Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly
865 870 875 880
Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn
885 890 895
Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile
900 905 910
Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn
915 920 925
Gly Glu Ile Asn Phe Arg Ser
930 935
<210> 258
<211> 2805
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 258
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgccaacaat 1380
aacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaatgg cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcttga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160
agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220
aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280
gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340
aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400
agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460
gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520
agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580
gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640
aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700
agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760
gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805
<210> 259
<211> 832
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 259
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala
595 600 605
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
610 615 620
Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys Ser Glu
625 630 635 640
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
645 650 655
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
660 665 670
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
675 680 685
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
690 695 700
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
705 710 715 720
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
725 730 735
Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
740 745 750
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
755 760 765
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
770 775 780
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
785 790 795 800
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
805 810 815
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
820 825 830
<210> 260
<211> 2496
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 260
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgccaacaat 1380
aacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800
ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860
acgaatgacc atctggtggc gttggcatgt cttggtggat cccagctggt gaagagcgag 1920
ctggaggaga agaagtccga gctgcggcac aagctgaagt acgtgcccca cgagtacatc 1980
gagctgatcg agatcgccag gaacagcacc caggaccgca tcctggagat gaaggtgatg 2040
gagttcttca tgaaggtgta cggctacagg ggaaagcacc tgggcggaag cagaaagcct 2100
gacggcgcca tctatacagt gggcagcccc atcgattacg gcgtgatcgt ggacacaaag 2160
gcctacagcg gcggctacaa tctgcctatc ggccaggccg acgagatgca gagatacgtg 2220
gaggagaacc agacccggaa taagcacatc aaccccaacg agtggtggaa ggtgtaccct 2280
agcagcgtga ccgagttcaa gttcctgttc gtgagcggcc acttcaaggg caactacaag 2340
gcccagctga ccaggctgaa ccacatcacc aactgcaatg gcgccgtgct gagcgtggag 2400
gagctgctga tcggcggcga gatgatcaaa gccggcaccc tgacactgga ggaggtgcgg 2460
cgcaagttca acaacggcga gatcaacttc agatct 2496
<210> 261
<211> 867
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 261
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala
595 600 605
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
610 615 620
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val
625 630 635 640
Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg
645 650 655
Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val
660 665 670
Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys
675 680 685
Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser
690 695 700
Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys
705 710 715 720
Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp
725 730 735
Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val
740 745 750
Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala
755 760 765
Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His
770 775 780
Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu
785 790 795 800
Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala
805 810 815
Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu
820 825 830
Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr
835 840 845
Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn
850 855 860
Phe Arg Ser
865
<210> 262
<211> 2601
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 262
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgccaacaat 1380
aacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800
ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860
acgaatgacc atctggtggc gttggcatgt cttggtggac gacccgcgct cgatgcagtc 1920
aaaaagggtc tgcctcatgc tcccgcattg atcaaaagaa ccaaccggcg gattcccgag 1980
agaacttccc atcgagtcgc gggatcccag ctggtgaaga gcgagctgga ggagaagaag 2040
tccgagctgc ggcacaagct gaagtacgtg ccccacgagt acatcgagct gatcgagatc 2100
gccaggaaca gcacccagga ccgcatcctg gagatgaagg tgatggagtt cttcatgaag 2160
gtgtacggct acaggggaaa gcacctgggc ggaagcagaa agcctgacgg cgccatctat 2220
acagtgggca gccccatcga ttacggcgtg atcgtggaca caaaggccta cagcggcggc 2280
tacaatctgc ctatcggcca ggccgacgag atgcagagat acgtggagga gaaccagacc 2340
cggaataagc acatcaaccc caacgagtgg tggaaggtgt accctagcag cgtgaccgag 2400
ttcaagttcc tgttcgtgag cggccacttc aagggcaact acaaggccca gctgaccagg 2460
ctgaaccaca tcaccaactg caatggcgcc gtgctgagcg tggaggagct gctgatcggc 2520
ggcgagatga tcaaagccgg caccctgaca ctggaggagg tgcggcgcaa gttcaacaac 2580
ggcgagatca acttcagatc t 2601
<210> 263
<211> 900
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 263
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu
690 695 700
Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu
705 710 715 720
Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn
725 730 735
Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met
740 745 750
Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro
755 760 765
Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile
770 775 780
Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln
785 790 795 800
Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys
805 810 815
His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr
820 825 830
Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys
835 840 845
Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val
850 855 860
Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly
865 870 875 880
Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile
885 890 895
Asn Phe Arg Ser
900
<210> 264
<211> 2700
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 264
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgccaacaac aacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaacgg tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160
aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220
cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280
cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340
tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400
gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460
aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520
ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580
aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640
accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700
<210> 265
<211> 935
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 265
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala
690 695 700
Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys
705 710 715 720
Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly
725 730 735
Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg
740 745 750
His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile
755 760 765
Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu
770 775 780
Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser
785 790 795 800
Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr
805 810 815
Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro
820 825 830
Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr
835 840 845
Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser
850 855 860
Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly
865 870 875 880
Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn
885 890 895
Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile
900 905 910
Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn
915 920 925
Gly Glu Ile Asn Phe Arg Ser
930 935
<210> 266
<211> 2805
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 266
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgccaacaac aacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaacgg tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caacatcgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160
agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220
aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280
gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340
aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400
agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460
gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520
agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580
gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640
aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700
agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760
gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805
<210> 267
<211> 866
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 267
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
245 250 255
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile
625 630 635 640
Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn
645 650 655
Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys
660 665 670
Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr
675 680 685
Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr
690 695 700
Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val
705 710 715 720
Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly
725 730 735
Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp
740 745 750
Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp
755 760 765
Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile
770 775 780
Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe
785 790 795 800
Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln
805 810 815
Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser
820 825 830
Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu
835 840 845
Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
850 855 860
Arg Ser
865
<210> 268
<211> 2598
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 268
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagccatga tggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgccaaca ataacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860
cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920
gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980
gcgttggcat gtcttggtgg atcccagctg gtgaagagcg agctggagga gaagaagtcc 2040
gagctgcggc acaagctgaa gtacgtgccc cacgagtaca tcgagctgat cgagatcgcc 2100
aggaacagca cccaggaccg catcctggag atgaaggtga tggagttctt catgaaggtg 2160
tacggctaca ggggaaagca cctgggcgga agcagaaagc ctgacggcgc catctataca 2220
gtgggcagcc ccatcgatta cggcgtgatc gtggacacaa aggcctacag cggcggctac 2280
aatctgccta tcggccaggc cgacgagatg cagagatacg tggaggagaa ccagacccgg 2340
aataagcaca tcaaccccaa cgagtggtgg aaggtgtacc ctagcagcgt gaccgagttc 2400
aagttcctgt tcgtgagcgg ccacttcaag ggcaactaca aggcccagct gaccaggctg 2460
aaccacatca ccaactgcaa tggcgccgtg ctgagcgtgg aggagctgct gatcggcggc 2520
gagatgatca aagccggcac cctgacactg gaggaggtgc ggcgcaagtt caacaacggc 2580
gagatcaact tcagatct 2598
<210> 269
<211> 901
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 269
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
245 250 255
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile
625 630 635 640
Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn
645 650 655
Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp
660 665 670
Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr
675 680 685
Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln
690 695 700
Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys
705 710 715 720
Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg
725 730 735
Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe
740 745 750
Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys
755 760 765
Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val
770 775 780
Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly
785 790 795 800
Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn
805 810 815
Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val
820 825 830
Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr
835 840 845
Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala
850 855 860
Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala
865 870 875 880
Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu
885 890 895
Ile Asn Phe Arg Ser
900
<210> 270
<211> 2703
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 270
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagccatga tggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgccaaca ataacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaat 1380
ggcgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860
cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920
gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980
gcgttggcat gtcttggtgg acgacccgcg ctcgatgcag tcaaaaaggg tctgcctcat 2040
gctcccgcat tgatcaaaag aaccaaccgg cggattcccg agagaacttc ccatcgagtc 2100
gcgggatccc agctggtgaa gagcgagctg gaggagaaga agtccgagct gcggcacaag 2160
ctgaagtacg tgccccacga gtacatcgag ctgatcgaga tcgccaggaa cagcacccag 2220
gaccgcatcc tggagatgaa ggtgatggag ttcttcatga aggtgtacgg ctacagggga 2280
aagcacctgg gcggaagcag aaagcctgac ggcgccatct atacagtggg cagccccatc 2340
gattacggcg tgatcgtgga cacaaaggcc tacagcggcg gctacaatct gcctatcggc 2400
caggccgacg agatgcagag atacgtggag gagaaccaga cccggaataa gcacatcaac 2460
cccaacgagt ggtggaaggt gtaccctagc agcgtgaccg agttcaagtt cctgttcgtg 2520
agcggccact tcaagggcaa ctacaaggcc cagctgacca ggctgaacca catcaccaac 2580
tgcaatggcg ccgtgctgag cgtggaggag ctgctgatcg gcggcgagat gatcaaagcc 2640
ggcaccctga cactggagga ggtgcggcgc aagttcaaca acggcgagat caacttcaga 2700
tct 2703
<210> 271
<211> 832
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 271
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala
595 600 605
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
610 615 620
Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys Ser Glu
625 630 635 640
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
645 650 655
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
660 665 670
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
675 680 685
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
690 695 700
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
705 710 715 720
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
725 730 735
Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
740 745 750
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
755 760 765
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
770 775 780
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
785 790 795 800
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
805 810 815
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
820 825 830
<210> 272
<211> 2496
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 272
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agcaatgggg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380
gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcaa atatcggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tcccacgacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800
ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860
acgaatgacc atctggtggc gttggcatgt cttggtggat cccagctggt gaagagcgag 1920
ctggaggaga agaagtccga gctgcggcac aagctgaagt acgtgcccca cgagtacatc 1980
gagctgatcg agatcgccag gaacagcacc caggaccgca tcctggagat gaaggtgatg 2040
gagttcttca tgaaggtgta cggctacagg ggaaagcacc tgggcggaag cagaaagcct 2100
gacggcgcca tctatacagt gggcagcccc atcgattacg gcgtgatcgt ggacacaaag 2160
gcctacagcg gcggctacaa tctgcctatc ggccaggccg acgagatgca gagatacgtg 2220
gaggagaacc agacccggaa taagcacatc aaccccaacg agtggtggaa ggtgtaccct 2280
agcagcgtga ccgagttcaa gttcctgttc gtgagcggcc acttcaaggg caactacaag 2340
gcccagctga ccaggctgaa ccacatcacc aactgcaatg gcgccgtgct gagcgtggag 2400
gagctgctga tcggcggcga gatgatcaaa gccggcaccc tgacactgga ggaggtgcgg 2460
cgcaagttca acaacggcga gatcaacttc agatct 2496
<210> 273
<211> 867
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 273
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala
595 600 605
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
610 615 620
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val
625 630 635 640
Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg
645 650 655
Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val
660 665 670
Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys
675 680 685
Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser
690 695 700
Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys
705 710 715 720
Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp
725 730 735
Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val
740 745 750
Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala
755 760 765
Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His
770 775 780
Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu
785 790 795 800
Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala
805 810 815
Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu
820 825 830
Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr
835 840 845
Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn
850 855 860
Phe Arg Ser
865
<210> 274
<211> 2601
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 274
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agcaatgggg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380
gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcaa atatcggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tcccacgacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800
ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860
acgaatgacc atctggtggc gttggcatgt cttggtggac gacccgcgct cgatgcagtc 1920
aaaaagggtc tgcctcatgc tcccgcattg atcaaaagaa ccaaccggcg gattcccgag 1980
agaacttccc atcgagtcgc gggatcccag ctggtgaaga gcgagctgga ggagaagaag 2040
tccgagctgc ggcacaagct gaagtacgtg ccccacgagt acatcgagct gatcgagatc 2100
gccaggaaca gcacccagga ccgcatcctg gagatgaagg tgatggagtt cttcatgaag 2160
gtgtacggct acaggggaaa gcacctgggc ggaagcagaa agcctgacgg cgccatctat 2220
acagtgggca gccccatcga ttacggcgtg atcgtggaca caaaggccta cagcggcggc 2280
tacaatctgc ctatcggcca ggccgacgag atgcagagat acgtggagga gaaccagacc 2340
cggaataagc acatcaaccc caacgagtgg tggaaggtgt accctagcag cgtgaccgag 2400
ttcaagttcc tgttcgtgag cggccacttc aagggcaact acaaggccca gctgaccagg 2460
ctgaaccaca tcaccaactg caatggcgcc gtgctgagcg tggaggagct gctgatcggc 2520
ggcgagatga tcaaagccgg caccctgaca ctggaggagg tgcggcgcaa gttcaacaac 2580
ggcgagatca acttcagatc t 2601
<210> 275
<211> 968
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 275
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu
770 775 780
Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu
785 790 795 800
Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met
805 810 815
Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly
820 825 830
Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp
835 840 845
Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu
850 855 860
Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln
865 870 875 880
Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro
885 890 895
Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys
900 905 910
Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys
915 920 925
Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met
930 935 940
Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn
945 950 955 960
Asn Gly Glu Ile Asn Phe Arg Ser
965
<210> 276
<211> 2904
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 276
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaatatcggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggacca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380
gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860
ccggagcaag tcgtggccat tgcatcaaat atcggtggca aacaggctct tgagacggtt 1920
cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980
attgcgaata acaatggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040
ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100
ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160
ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220
tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280
ctggtggcgt tggcatgtct tggtggatcc cagctggtga agagcgagct ggaggagaag 2340
aagtccgagc tgcggcacaa gctgaagtac gtgccccacg agtacatcga gctgatcgag 2400
atcgccagga acagcaccca ggaccgcatc ctggagatga aggtgatgga gttcttcatg 2460
aaggtgtacg gctacagggg aaagcacctg ggcggaagca gaaagcctga cggcgccatc 2520
tatacagtgg gcagccccat cgattacggc gtgatcgtgg acacaaaggc ctacagcggc 2580
ggctacaatc tgcctatcgg ccaggccgac gagatgcaga gatacgtgga ggagaaccag 2640
acccggaata agcacatcaa ccccaacgag tggtggaagg tgtaccctag cagcgtgacc 2700
gagttcaagt tcctgttcgt gagcggccac ttcaagggca actacaaggc ccagctgacc 2760
aggctgaacc acatcaccaa ctgcaatggc gccgtgctga gcgtggagga gctgctgatc 2820
ggcggcgaga tgatcaaagc cggcaccctg acactggagg aggtgcggcg caagttcaac 2880
aacggcgaga tcaacttcag atct 2904
<210> 277
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 277
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
770 775 780
Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His
785 790 795 800
Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
805 810 815
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu
820 825 830
Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met
835 840 845
Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His
850 855 860
Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser
865 870 875 880
Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly
885 890 895
Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu
900 905 910
Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys
915 920 925
Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly
930 935 940
His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile
945 950 955 960
Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly
965 970 975
Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg
980 985 990
Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
995 1000
<210> 278
<211> 3009
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 278
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga atggcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaatatcggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agccatgatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380
gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860
ccggagcaag tcgtggccat tgcatcaaat atcggtggca aacaggctct tgagacggtt 1920
cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980
attgcgaata acaatggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040
ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100
ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160
ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220
tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280
ctggtggcgt tggcatgtct tggtggacga cccgcgctcg atgcagtcaa aaagggtctg 2340
cctcatgctc ccgcattgat caaaagaacc aaccggcgga ttcccgagag aacttcccat 2400
cgagtcgcgg gatcccagct ggtgaagagc gagctggagg agaagaagtc cgagctgcgg 2460
cacaagctga agtacgtgcc ccacgagtac atcgagctga tcgagatcgc caggaacagc 2520
acccaggacc gcatcctgga gatgaaggtg atggagttct tcatgaaggt gtacggctac 2580
aggggaaagc acctgggcgg aagcagaaag cctgacggcg ccatctatac agtgggcagc 2640
cccatcgatt acggcgtgat cgtggacaca aaggcctaca gcggcggcta caatctgcct 2700
atcggccagg ccgacgagat gcagagatac gtggaggaga accagacccg gaataagcac 2760
atcaacccca acgagtggtg gaaggtgtac cctagcagcg tgaccgagtt caagttcctg 2820
ttcgtgagcg gccacttcaa gggcaactac aaggcccagc tgaccaggct gaaccacatc 2880
accaactgca atggcgccgt gctgagcgtg gaggagctgc tgatcggcgg cgagatgatc 2940
aaagccggca ccctgacact ggaggaggtg cggcgcaagt tcaacaacgg cgagatcaac 3000
ttcagatct 3009
<210> 279
<211> 866
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 279
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile
625 630 635 640
Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn
645 650 655
Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys
660 665 670
Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr
675 680 685
Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr
690 695 700
Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val
705 710 715 720
Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly
725 730 735
Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp
740 745 750
Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp
755 760 765
Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile
770 775 780
Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe
785 790 795 800
Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln
805 810 815
Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser
820 825 830
Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu
835 840 845
Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
850 855 860
Arg Ser
865
<210> 280
<211> 2598
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 280
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gaacattggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380
attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860
cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920
gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980
gcgttggcat gtcttggtgg atcccagctg gtgaagagcg agctggagga gaagaagtcc 2040
gagctgcggc acaagctgaa gtacgtgccc cacgagtaca tcgagctgat cgagatcgcc 2100
aggaacagca cccaggaccg catcctggag atgaaggtga tggagttctt catgaaggtg 2160
tacggctaca ggggaaagca cctgggcgga agcagaaagc ctgacggcgc catctataca 2220
gtgggcagcc ccatcgatta cggcgtgatc gtggacacaa aggcctacag cggcggctac 2280
aatctgccta tcggccaggc cgacgagatg cagagatacg tggaggagaa ccagacccgg 2340
aataagcaca tcaaccccaa cgagtggtgg aaggtgtacc ctagcagcgt gaccgagttc 2400
aagttcctgt tcgtgagcgg ccacttcaag ggcaactaca aggcccagct gaccaggctg 2460
aaccacatca ccaactgcaa tggcgccgtg ctgagcgtgg aggagctgct gatcggcggc 2520
gagatgatca aagccggcac cctgacactg gaggaggtgc ggcgcaagtt caacaacggc 2580
gagatcaact tcagatct 2598
<210> 281
<211> 901
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 281
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile
625 630 635 640
Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn
645 650 655
Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp
660 665 670
Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr
675 680 685
Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln
690 695 700
Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys
705 710 715 720
Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg
725 730 735
Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe
740 745 750
Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys
755 760 765
Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val
770 775 780
Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly
785 790 795 800
Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn
805 810 815
Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val
820 825 830
Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr
835 840 845
Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala
850 855 860
Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala
865 870 875 880
Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu
885 890 895
Ile Asn Phe Arg Ser
900
<210> 282
<211> 2703
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 282
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gaacattggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380
attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860
cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920
gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980
gcgttggcat gtcttggtgg acgacccgcg ctcgatgcag tcaaaaaggg tctgcctcat 2040
gctcccgcat tgatcaaaag aaccaaccgg cggattcccg agagaacttc ccatcgagtc 2100
gcgggatccc agctggtgaa gagcgagctg gaggagaaga agtccgagct gcggcacaag 2160
ctgaagtacg tgccccacga gtacatcgag ctgatcgaga tcgccaggaa cagcacccag 2220
gaccgcatcc tggagatgaa ggtgatggag ttcttcatga aggtgtacgg ctacagggga 2280
aagcacctgg gcggaagcag aaagcctgac ggcgccatct atacagtggg cagccccatc 2340
gattacggcg tgatcgtgga cacaaaggcc tacagcggcg gctacaatct gcctatcggc 2400
caggccgacg agatgcagag atacgtggag gagaaccaga cccggaataa gcacatcaac 2460
cccaacgagt ggtggaaggt gtaccctagc agcgtgaccg agttcaagtt cctgttcgtg 2520
agcggccact tcaagggcaa ctacaaggcc cagctgacca ggctgaacca catcaccaac 2580
tgcaatggcg ccgtgctgag cgtggaggag ctgctgatcg gcggcgagat gatcaaagcc 2640
ggcaccctga cactggagga ggtgcggcgc aagttcaaca acggcgagat caacttcaga 2700
tct 2703
<210> 283
<211> 968
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 283
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu
770 775 780
Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu
785 790 795 800
Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met
805 810 815
Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly
820 825 830
Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp
835 840 845
Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu
850 855 860
Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln
865 870 875 880
Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro
885 890 895
Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys
900 905 910
Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys
915 920 925
Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met
930 935 940
Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn
945 950 955 960
Asn Gly Glu Ile Asn Phe Arg Ser
965
<210> 284
<211> 2904
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 284
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gaacattggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380
attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860
ccggagcaag tcgtggccat tgcatcaaac ggaggtggca aacaggctct tgagacggtt 1920
cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980
attgcgagcc atgatggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040
ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc caatattggc 2100
ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160
ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220
tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280
ctggtggcgt tggcatgtct tggtggatcc cagctggtga agagcgagct ggaggagaag 2340
aagtccgagc tgcggcacaa gctgaagtac gtgccccacg agtacatcga gctgatcgag 2400
atcgccagga acagcaccca ggaccgcatc ctggagatga aggtgatgga gttcttcatg 2460
aaggtgtacg gctacagggg aaagcacctg ggcggaagca gaaagcctga cggcgccatc 2520
tatacagtgg gcagccccat cgattacggc gtgatcgtgg acacaaaggc ctacagcggc 2580
ggctacaatc tgcctatcgg ccaggccgac gagatgcaga gatacgtgga ggagaaccag 2640
acccggaata agcacatcaa ccccaacgag tggtggaagg tgtaccctag cagcgtgacc 2700
gagttcaagt tcctgttcgt gagcggccac ttcaagggca actacaaggc ccagctgacc 2760
aggctgaacc acatcaccaa ctgcaatggc gccgtgctga gcgtggagga gctgctgatc 2820
ggcggcgaga tgatcaaagc cggcaccctg acactggagg aggtgcggcg caagttcaac 2880
aacggcgaga tcaacttcag atct 2904
<210> 285
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 285
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
770 775 780
Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His
785 790 795 800
Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
805 810 815
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu
820 825 830
Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met
835 840 845
Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His
850 855 860
Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser
865 870 875 880
Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly
885 890 895
Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu
900 905 910
Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys
915 920 925
Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly
930 935 940
His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile
945 950 955 960
Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly
965 970 975
Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg
980 985 990
Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
995 1000
<210> 286
<211> 3009
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 286
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gaacattggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctcccacga cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380
attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggatca agtcgtggcc attgcaaata ataacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag ccatgatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgcatga cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860
ccggagcaag tcgtggccat tgcatcaaac ggaggtggca aacaggctct tgagacggtt 1920
cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980
attgcgagcc atgatggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040
ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc caatattggc 2100
ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160
ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220
tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280
ctggtggcgt tggcatgtct tggtggacga cccgcgctcg atgcagtcaa aaagggtctg 2340
cctcatgctc ccgcattgat caaaagaacc aaccggcgga ttcccgagag aacttcccat 2400
cgagtcgcgg gatcccagct ggtgaagagc gagctggagg agaagaagtc cgagctgcgg 2460
cacaagctga agtacgtgcc ccacgagtac atcgagctga tcgagatcgc caggaacagc 2520
acccaggacc gcatcctgga gatgaaggtg atggagttct tcatgaaggt gtacggctac 2580
aggggaaagc acctgggcgg aagcagaaag cctgacggcg ccatctatac agtgggcagc 2640
cccatcgatt acggcgtgat cgtggacaca aaggcctaca gcggcggcta caatctgcct 2700
atcggccagg ccgacgagat gcagagatac gtggaggaga accagacccg gaataagcac 2760
atcaacccca acgagtggtg gaaggtgtac cctagcagcg tgaccgagtt caagttcctg 2820
ttcgtgagcg gccacttcaa gggcaactac aaggcccagc tgaccaggct gaaccacatc 2880
accaactgca atggcgccgt gctgagcgtg gaggagctgc tgatcggcgg cgagatgatc 2940
aaagccggca ccctgacact ggaggaggtg cggcgcaagt tcaacaacgg cgagatcaac 3000
ttcagatct 3009
<210> 287
<211> 866
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 287
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn
515 520 525
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile
625 630 635 640
Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn
645 650 655
Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys
660 665 670
Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr
675 680 685
Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr
690 695 700
Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val
705 710 715 720
Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly
725 730 735
Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp
740 745 750
Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp
755 760 765
Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile
770 775 780
Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe
785 790 795 800
Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln
805 810 815
Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser
820 825 830
Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu
835 840 845
Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe
850 855 860
Arg Ser
865
<210> 288
<211> 2598
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 288
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380
gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcaa acggaggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgaa taacaatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860
cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920
gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980
gcgttggcat gtcttggtgg atcccagctg gtgaagagcg agctggagga gaagaagtcc 2040
gagctgcggc acaagctgaa gtacgtgccc cacgagtaca tcgagctgat cgagatcgcc 2100
aggaacagca cccaggaccg catcctggag atgaaggtga tggagttctt catgaaggtg 2160
tacggctaca ggggaaagca cctgggcgga agcagaaagc ctgacggcgc catctataca 2220
gtgggcagcc ccatcgatta cggcgtgatc gtggacacaa aggcctacag cggcggctac 2280
aatctgccta tcggccaggc cgacgagatg cagagatacg tggaggagaa ccagacccgg 2340
aataagcaca tcaaccccaa cgagtggtgg aaggtgtacc ctagcagcgt gaccgagttc 2400
aagttcctgt tcgtgagcgg ccacttcaag ggcaactaca aggcccagct gaccaggctg 2460
aaccacatca ccaactgcaa tggcgccgtg ctgagcgtgg aggagctgct gatcggcggc 2520
gagatgatca aagccggcac cctgacactg gaggaggtgc ggcgcaagtt caacaacggc 2580
gagatcaact tcagatct 2598
<210> 289
<211> 901
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 289
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn
515 520 525
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile
625 630 635 640
Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn
645 650 655
Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp
660 665 670
Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr
675 680 685
Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln
690 695 700
Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys
705 710 715 720
Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg
725 730 735
Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe
740 745 750
Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys
755 760 765
Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val
770 775 780
Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly
785 790 795 800
Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn
805 810 815
Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val
820 825 830
Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr
835 840 845
Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala
850 855 860
Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala
865 870 875 880
Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu
885 890 895
Ile Asn Phe Arg Ser
900
<210> 290
<211> 2703
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 290
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgccaa caataacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaatatcg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaacggaggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgcat 1380
gacgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcaa acggaggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgaa taacaatgga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtactgt gccaggatca tggcctgaca 1860
cccgaacagg tggtcgccat tgctagcaac gggggaggac ggccagcctt ggagtccatc 1920
gtagcccaat tgtccaggcc cgatcccgcg ttggctgcgt taacgaatga ccatctggtg 1980
gcgttggcat gtcttggtgg acgacccgcg ctcgatgcag tcaaaaaggg tctgcctcat 2040
gctcccgcat tgatcaaaag aaccaaccgg cggattcccg agagaacttc ccatcgagtc 2100
gcgggatccc agctggtgaa gagcgagctg gaggagaaga agtccgagct gcggcacaag 2160
ctgaagtacg tgccccacga gtacatcgag ctgatcgaga tcgccaggaa cagcacccag 2220
gaccgcatcc tggagatgaa ggtgatggag ttcttcatga aggtgtacgg ctacagggga 2280
aagcacctgg gcggaagcag aaagcctgac ggcgccatct atacagtggg cagccccatc 2340
gattacggcg tgatcgtgga cacaaaggcc tacagcggcg gctacaatct gcctatcggc 2400
caggccgacg agatgcagag atacgtggag gagaaccaga cccggaataa gcacatcaac 2460
cccaacgagt ggtggaaggt gtaccctagc agcgtgaccg agttcaagtt cctgttcgtg 2520
agcggccact tcaagggcaa ctacaaggcc cagctgacca ggctgaacca catcaccaac 2580
tgcaatggcg ccgtgctgag cgtggaggag ctgctgatcg gcggcgagat gatcaaagcc 2640
ggcaccctga cactggagga ggtgcggcgc aagttcaaca acggcgagat caacttcaga 2700
tct 2703
<210> 291
<211> 832
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 291
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Thr Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala
595 600 605
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
610 615 620
Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu Val Lys Ser Glu
625 630 635 640
Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro
645 650 655
His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp
660 665 670
Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly
675 680 685
Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile
690 695 700
Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys
705 710 715 720
Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met
725 730 735
Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro
740 745 750
Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe
755 760 765
Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr
770 775 780
Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu
785 790 795 800
Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu
805 810 815
Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
820 825 830
<210> 292
<211> 2496
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 292
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg atcaagtcgt ggccattgca 660
aataataacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc acatgacggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agcaatgggg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg ccaacaacaa cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380
attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caatggggga gggaaacaaa cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800
ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860
acgaatgacc atctggtggc gttggcatgt cttggtggat cccagctggt gaagagcgag 1920
ctggaggaga agaagtccga gctgcggcac aagctgaagt acgtgcccca cgagtacatc 1980
gagctgatcg agatcgccag gaacagcacc caggaccgca tcctggagat gaaggtgatg 2040
gagttcttca tgaaggtgta cggctacagg ggaaagcacc tgggcggaag cagaaagcct 2100
gacggcgcca tctatacagt gggcagcccc atcgattacg gcgtgatcgt ggacacaaag 2160
gcctacagcg gcggctacaa tctgcctatc ggccaggccg acgagatgca gagatacgtg 2220
gaggagaacc agacccggaa taagcacatc aaccccaacg agtggtggaa ggtgtaccct 2280
agcagcgtga ccgagttcaa gttcctgttc gtgagcggcc acttcaaggg caactacaag 2340
gcccagctga ccaggctgaa ccacatcacc aactgcaatg gcgccgtgct gagcgtggag 2400
gagctgctga tcggcggcga gatgatcaaa gccggcaccc tgacactgga ggaggtgcgg 2460
cgcaagttca acaacggcga gatcaacttc agatct 2496
<210> 293
<211> 867
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 293
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn Asn Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala
595 600 605
Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His
610 615 620
Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val
625 630 635 640
Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg
645 650 655
Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly Ser Gln Leu Val
660 665 670
Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu Lys
675 680 685
Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn Ser
690 695 700
Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met Lys
705 710 715 720
Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro Asp
725 730 735
Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile Val
740 745 750
Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln Ala
755 760 765
Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys His
770 775 780
Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr Glu
785 790 795 800
Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys Ala
805 810 815
Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val Leu
820 825 830
Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly Thr
835 840 845
Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile Asn
850 855 860
Phe Arg Ser
865
<210> 294
<211> 2601
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 294
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg atcaagtcgt ggccattgca 660
aataataacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaacat cggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcga acattggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc acatgacggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agcaatgggg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg ccaacaacaa cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380
attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcac atgacggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gcctgacacc cgaacaggtg gtcgccattg ctagcaacgg gggaggacgg 1800
ccagccttgg agtccatcgt agcccaattg tccaggcccg atcccgcgtt ggctgcgtta 1860
acgaatgacc atctggtggc gttggcatgt cttggtggac gacccgcgct cgatgcagtc 1920
aaaaagggtc tgcctcatgc tcccgcattg atcaaaagaa ccaaccggcg gattcccgag 1980
agaacttccc atcgagtcgc gggatcccag ctggtgaaga gcgagctgga ggagaagaag 2040
tccgagctgc ggcacaagct gaagtacgtg ccccacgagt acatcgagct gatcgagatc 2100
gccaggaaca gcacccagga ccgcatcctg gagatgaagg tgatggagtt cttcatgaag 2160
gtgtacggct acaggggaaa gcacctgggc ggaagcagaa agcctgacgg cgccatctat 2220
acagtgggca gccccatcga ttacggcgtg atcgtggaca caaaggccta cagcggcggc 2280
tacaatctgc ctatcggcca ggccgacgag atgcagagat acgtggagga gaaccagacc 2340
cggaataagc acatcaaccc caacgagtgg tggaaggtgt accctagcag cgtgaccgag 2400
ttcaagttcc tgttcgtgag cggccacttc aagggcaact acaaggccca gctgaccagg 2460
ctgaaccaca tcaccaactg caatggcgcc gtgctgagcg tggaggagct gctgatcggc 2520
ggcgagatga tcaaagccgg caccctgaca ctggaggagg tgcggcgcaa gttcaacaac 2580
ggcgagatca acttcagatc t 2601
<210> 295
<211> 968
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 295
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu
770 775 780
Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu
785 790 795 800
Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met
805 810 815
Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly
820 825 830
Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp
835 840 845
Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu
850 855 860
Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln
865 870 875 880
Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro
885 890 895
Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys
900 905 910
Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys
915 920 925
Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met
930 935 940
Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn
945 950 955 960
Asn Gly Glu Ile Asn Phe Arg Ser
965
<210> 296
<211> 2904
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 296
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaatatcggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380
attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcaa acggaggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860
ccggagcaag tcgtggccat tgcatcaaac ggaggtggca aacaggctct tgagacggtt 1920
cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980
attgcgagca acatcggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040
ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100
ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160
ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220
tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280
ctggtggcgt tggcatgtct tggtggatcc cagctggtga agagcgagct ggaggagaag 2340
aagtccgagc tgcggcacaa gctgaagtac gtgccccacg agtacatcga gctgatcgag 2400
atcgccagga acagcaccca ggaccgcatc ctggagatga aggtgatgga gttcttcatg 2460
aaggtgtacg gctacagggg aaagcacctg ggcggaagca gaaagcctga cggcgccatc 2520
tatacagtgg gcagccccat cgattacggc gtgatcgtgg acacaaaggc ctacagcggc 2580
ggctacaatc tgcctatcgg ccaggccgac gagatgcaga gatacgtgga ggagaaccag 2640
acccggaata agcacatcaa ccccaacgag tggtggaagg tgtaccctag cagcgtgacc 2700
gagttcaagt tcctgttcgt gagcggccac ttcaagggca actacaaggc ccagctgacc 2760
aggctgaacc acatcaccaa ctgcaatggc gccgtgctga gcgtggagga gctgctgatc 2820
ggcggcgaga tgatcaaagc cggcaccctg acactggagg aggtgcggcg caagttcaac 2880
aacggcgaga tcaacttcag atct 2904
<210> 297
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 297
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
770 775 780
Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His
785 790 795 800
Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
805 810 815
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu
820 825 830
Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met
835 840 845
Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His
850 855 860
Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser
865 870 875 880
Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly
885 890 895
Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu
900 905 910
Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys
915 920 925
Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly
930 935 940
His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile
945 950 955 960
Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly
965 970 975
Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg
980 985 990
Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
995 1000
<210> 298
<211> 3009
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 298
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gcatgacggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcaaacggag gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctcccac gacggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc aaatatcggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg aataacaatg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg cctccaatat tggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380
attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcaa acggaggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
aacaacaacg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg cgtcgaacat tgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttaca 1860
ccggagcaag tcgtggccat tgcatcaaac ggaggtggca aacaggctct tgagacggtt 1920
cagagacttc tcccagttct ctgtcaagcc cacgggctga ctcccgatca agttgtagcg 1980
attgcgagca acatcggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 2040
ttgtgtcaag cccacggttt gacgcctgca caagtggtcg ccatcgcctc ccacgacggc 2100
ggtaagcagg cgctggaaac agtacagcgc ctgctgcctg tactgtgcca ggatcatggc 2160
ctgacacccg aacaggtggt cgccattgct agcaacgggg gaggacggcc agccttggag 2220
tccatcgtag cccaattgtc caggcccgat cccgcgttgg ctgcgttaac gaatgaccat 2280
ctggtggcgt tggcatgtct tggtggacga cccgcgctcg atgcagtcaa aaagggtctg 2340
cctcatgctc ccgcattgat caaaagaacc aaccggcgga ttcccgagag aacttcccat 2400
cgagtcgcgg gatcccagct ggtgaagagc gagctggagg agaagaagtc cgagctgcgg 2460
cacaagctga agtacgtgcc ccacgagtac atcgagctga tcgagatcgc caggaacagc 2520
acccaggacc gcatcctgga gatgaaggtg atggagttct tcatgaaggt gtacggctac 2580
aggggaaagc acctgggcgg aagcagaaag cctgacggcg ccatctatac agtgggcagc 2640
cccatcgatt acggcgtgat cgtggacaca aaggcctaca gcggcggcta caatctgcct 2700
atcggccagg ccgacgagat gcagagatac gtggaggaga accagacccg gaataagcac 2760
atcaacccca acgagtggtg gaaggtgtac cctagcagcg tgaccgagtt caagttcctg 2820
ttcgtgagcg gccacttcaa gggcaactac aaggcccagc tgaccaggct gaaccacatc 2880
accaactgca atggcgccgt gctgagcgtg gaggagctgc tgatcggcgg cgagatgatc 2940
aaagccggca ccctgacact ggaggaggtg cggcgcaagt tcaacaacgg cgagatcaac 3000
ttcagatct 3009
<210> 299
<211> 900
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 299
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Ser Gln Leu
690 695 700
Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg His Lys Leu
705 710 715 720
Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile Ala Arg Asn
725 730 735
Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu Phe Phe Met
740 745 750
Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser Arg Lys Pro
755 760 765
Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr Gly Val Ile
770 775 780
Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro Ile Gly Gln
785 790 795 800
Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr Arg Asn Lys
805 810 815
His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser Ser Val Thr
820 825 830
Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly Asn Tyr Lys
835 840 845
Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn Gly Ala Val
850 855 860
Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile Lys Ala Gly
865 870 875 880
Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn Gly Glu Ile
885 890 895
Asn Phe Arg Ser
900
<210> 300
<211> 2700
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 300
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc acatgacggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agcaacatcg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg ccaacaacaa cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380
attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcaa atatcggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg ccaacaataa cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggatcccagc tggtgaagag cgagctggag gagaagaagt ccgagctgcg gcacaagctg 2160
aagtacgtgc cccacgagta catcgagctg atcgagatcg ccaggaacag cacccaggac 2220
cgcatcctgg agatgaaggt gatggagttc ttcatgaagg tgtacggcta caggggaaag 2280
cacctgggcg gaagcagaaa gcctgacggc gccatctata cagtgggcag ccccatcgat 2340
tacggcgtga tcgtggacac aaaggcctac agcggcggct acaatctgcc tatcggccag 2400
gccgacgaga tgcagagata cgtggaggag aaccagaccc ggaataagca catcaacccc 2460
aacgagtggt ggaaggtgta ccctagcagc gtgaccgagt tcaagttcct gttcgtgagc 2520
ggccacttca agggcaacta caaggcccag ctgaccaggc tgaaccacat caccaactgc 2580
aatggcgccg tgctgagcgt ggaggagctg ctgatcggcg gcgagatgat caaagccggc 2640
accctgacac tggaggaggt gcggcgcaag ttcaacaacg gcgagatcaa cttcagatct 2700
<210> 301
<211> 935
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 301
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala
690 695 700
Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys
705 710 715 720
Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly
725 730 735
Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg
740 745 750
His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile
755 760 765
Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu
770 775 780
Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser
785 790 795 800
Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr
805 810 815
Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro
820 825 830
Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr
835 840 845
Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser
850 855 860
Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly
865 870 875 880
Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn
885 890 895
Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile
900 905 910
Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn
915 920 925
Gly Glu Ile Asn Phe Arg Ser
930 935
<210> 302
<211> 2805
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 302
atggactaca aagaccatga cggtgattat aaagatcatg acatcgatta caaggatgac 60
gatgacaaga tggcccccaa gaagaagagg aaggtgggca ttcaccgcgg ggtacctatg 120
gtggacttga ggacactcgg ttattcgcaa cagcaacagg agaaaatcaa gcctaaggtc 180
aggagcaccg tcgcgcaaca ccacgaggcg cttgtggggc atggcttcac tcatgcgcat 240
attgtcgcgc tttcacagca ccctgcggcg cttgggacgg tggctgtcaa ataccaagat 300
atgattgcgg ccctgcccga agccacgcac gaggcaattg taggggtcgg taaacagtgg 360
tcgggagcgc gagcacttga ggcgctgctg actgtggcgg gtgagcttag ggggcctccg 420
ctccagctcg acaccgggca gctgctgaag atcgcgaaga gagggggagt aacagcggta 480
gaggcagtgc acgcctggcg caatgcgctc accggggccc ccttgaacct gaccccagac 540
caggtagtcg caatcgcgtc gaatggcggg ggaaagcaag ccctggaaac cgtgcaaagg 600
ttgttgccgg tcctttgtca agaccacggc cttacaccgg agcaagtcgt ggccattgca 660
tcacatgacg gtggcaaaca ggctcttgag acggttcaga gacttctccc agttctctgt 720
caagcccacg ggctgactcc cgatcaagtt gtagcgattg cgagcaatgg gggagggaaa 780
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacg 840
cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggcgct ggaaacagta 900
cagcgcctgc tgcctgtact gtgccaggat catggactca ccccagacca ggtagtcgca 960
atcgcgtcgc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgccggtc 1020
ctttgtcaag accacggcct tacaccggag caagtcgtgg ccattgcatc acatgacggt 1080
ggcaaacagg ctcttgagac ggttcagaga cttctcccag ttctctgtca agcccacggg 1140
ctgactcccg atcaagttgt agcgattgcg agcaacatcg gagggaaaca agcattggag 1200
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacgcc tgcacaagtg 1260
gtcgccatcg ccaacaacaa cggcggtaag caggcgctgg aaacagtaca gcgcctgctg 1320
cctgtactgt gccaggatca tgggctgacc ccagaccagg tagtcgcaat cgcgtcgaac 1380
attgggggaa agcaagccct ggaaaccgtg caaaggttgt tgccggtcct ttgtcaagac 1440
cacggcctta caccggagca agtcgtggcc attgcatcaa atatcggtgg caaacaggct 1500
cttgagacgg ttcagagact tctcccagtt ctctgtcaag cccacgggct gactcccgat 1560
caagttgtag cgattgcgag caatggggga gggaaacaag cattggagac tgtccaacgg 1620
ctccttcccg tgttgtgtca agcccacggt ttgacgcctg cacaagtggt cgccatcgcc 1680
tccaacggtg gcggtaagca ggcgctggaa acagtacagc gcctgctgcc tgtactgtgc 1740
caggatcatg gtttgacccc agaccaggta gtcgcaatcg ccaacaataa cgggggaaag 1800
caagccctgg aaaccgtgca aaggttgttg ccggtccttt gtcaagacca cggccttacg 1860
cctgcacaag tggtcgccat cgcctccaat attggcggta agcaggcgct ggaaacagta 1920
cagcgcctgc tgcctgtact gtgccaggat catggcctga cacccgaaca ggtggtcgcc 1980
attgctagca acgggggagg acggccagcc ttggagtcca tcgtagccca attgtccagg 2040
cccgatcccg cgttggctgc gttaacgaat gaccatctgg tggcgttggc atgtcttggt 2100
ggacgacccg cgctcgatgc agtcaaaaag ggtctgcctc atgctcccgc attgatcaaa 2160
agaaccaacc ggcggattcc cgagagaact tcccatcgag tcgcgggatc ccagctggtg 2220
aagagcgagc tggaggagaa gaagtccgag ctgcggcaca agctgaagta cgtgccccac 2280
gagtacatcg agctgatcga gatcgccagg aacagcaccc aggaccgcat cctggagatg 2340
aaggtgatgg agttcttcat gaaggtgtac ggctacaggg gaaagcacct gggcggaagc 2400
agaaagcctg acggcgccat ctatacagtg ggcagcccca tcgattacgg cgtgatcgtg 2460
gacacaaagg cctacagcgg cggctacaat ctgcctatcg gccaggccga cgagatgcag 2520
agatacgtgg aggagaacca gacccggaat aagcacatca accccaacga gtggtggaag 2580
gtgtacccta gcagcgtgac cgagttcaag ttcctgttcg tgagcggcca cttcaagggc 2640
aactacaagg cccagctgac caggctgaac cacatcacca actgcaatgg cgccgtgctg 2700
agcgtggagg agctgctgat cggcggcgag atgatcaaag ccggcaccct gacactggag 2760
gaggtgcggc gcaagttcaa caacggcgag atcaacttca gatct 2805
<210> 303
<211> 8245
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 303
taatacgact cactataggg agacccaagc tggctagctt aagctgatcc actagtccag 60
tgtggtggaa ttcgctagcg ccaccatggc ccccaagaag aagaggaagg tgggaatcga 120
tggggtaccc gccgctgtgg atctacgcac gctcggctac agccagcagc aacaggagaa 180
gatcaaaccg aaggttcgtt cgacagtggc gcagcaccac gaggcactgg tcggccatgg 240
gtttacacac gcgcacatcg ttgcgctcag ccaacacccg gcagcgttag ggaccgtcgc 300
tgtcaagtat caggacatga tcgcagcgtt gccagaggcg acacacgaag cgatcgttgg 360
cgtcggcaaa cagtggtccg gcgcacgcgc cctggaggcc ttgctcacgg tggcgggaga 420
gttgagaggt ccaccgttac agttggacac aggccaactt ctcaagattg caaaacgtgg 480
cggcgtgacc gcagtggagg cagtgcatgc atggcgcaat gcactgacgg gggcccccct 540
gaacctgacc ccggagcagg tggtggccat cgccagcaat attggtggca agcaggcgct 600
ggagacggtg cagcggctgt tgccggtgct gtgccaggcc catggcctga ccccggagca 660
ggtggtggcc atcgccagca atggcggcaa gcaggcgctg gagacggtgc agcggctgtt 720
gccggtgctg tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcaa 780
tattggtggc aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc 840
ccatggcctg accccggagc aggtggtggc catcgccagc aatattggtg gcaagcaggc 900
gctggagacg gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccggc 960
acaggtggtg gccatcgcca gcaatattgg cggcaagcag gcgctggaga cggtgcagcg 1020
gctgttgccg gtgctgcgcc aggcccatgg cctgaccccg gagcaggtcg tggccatcgc 1080
cagcaatggc ggcaagcagg cgctggagac ggtgcagcgg ctgttgccgg tgctgtgcca 1140
ggcccatggc ctgaccccgg cacaggtggt ggccatcgcc agcaatattg gcggcaagca 1200
ggcgctggag acggtgcagc ggctgttgcc ggtgctgtgc caggcccatg gcctgacccc 1260
ggagcaggtc gtggccatcg ccagccacga tggcggcaag caggcgctgg agacggtgca 1320
gcggctgttg ccggtgctgt gccaggccca tggcctgacc ccggagcagg tggtggccat 1380
cgccagccac gatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct 1440
gtgccaggcc catggcctga ccccggacca ggtggtggcc atcgccagca atggcggtgg 1500
caagcaggcg ctggagacgg tgcagcggct gttgccggtg ctgtgccagg cccatggcct 1560
gaccccggac caggtggtgg ccatcgccag caatggcggt ggcaagcagg cgctggagac 1620
ggtgcagcgg ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg agcaggtggt 1680
ggccatcgcc agccacgatg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc 1740
ggtgctgtgc caggcccatg gcctgacccc ggagcaggtg gtggccatcg ccagcaatgg 1800
cggcggcagg ccggcgctgg agagcattgt tgcccagtta tctcgccctg atccggcgtt 1860
ggccgcgtta accaacgacc acctcgtcgc cttggcctgc ctcggcggac gtcctgcgct 1920
ggatgcagtg aaaaagggat tgccgcacgc gccggccttg atcaaaagaa ccaatcgccg 1980
tattcccgaa cgcacatccc atcgcgttgc cgaccacgcg caagtggttc gcgtgctggg 2040
ttttttccag tgccactccc acccagcgca agcatttgat gacgccatga cgcagttcgg 2100
gatgagcagg cacgggttgt tacagctctt tcgcagagtg ggcgtcaccg aactcgaagc 2160
ccgcagtgga acgctccccc cagcctcgca gcgttgggac cgtatcctcc aggcatcagg 2220
gatgaaaagg gccaaaccgt cccctacttc aactcaaacg ccggaccagg cgtctttgca 2280
tgcattcgcc gattcgctgg agcgtgacct tgatgcgccc agcccaacgc acgagggaga 2340
tcagaggcgg gcaagcagcc gtaaacggtc ccgatcggat cgtgctgtca ccggtccctc 2400
cgcacagcaa tcgttcgagg tgcgcgctcc cgaacagcgc gatgcgctgc atttgcccct 2460
cagttggagg gtaaaacgcc cgcgtaccag tatcgggggc ggcctcccgg atcctggtac 2520
gcccacggct gccgacctgg cagcgtccag caccgtgatg cgggaacaag atgaggaccc 2580
cttcgcaggg gcagcggatg atttcccggc attcaacgaa gaggagctcg catggttgat 2640
ggagctattg cctcaggacc gcggccgcgc ccccccgacc gatgtcagcc tgggggacga 2700
gctccactta gacggcgagg acgtggcgat ggcgcatgcc gacgcgctag acgatttcga 2760
tctggacatg ttgggggacg gggattcccc gggtccggga tttacccccc acgactccgc 2820
cccctacggc gctctggata tggccgactt cgagtttgag cagatgttta ccgatgccct 2880
tggaattgac gagtacggtg gcggccgcga ctacaaggac gacgatgaca agtaagcttc 2940
tcgagtctag ctagtttaaa cccgctgatc agcctcgact gtgccttcta gttgccagcc 3000
atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gaaggtgcca ctcccactgt 3060
cctttcctaa taaaatgagg aaattgcatc gcattgtctg agtaggtgtc attctattct 3120
ggggggtggg gtggggcagg acagcaaggg ggaggattgg gaagacaata gcaggcatgc 3180
tggggatgcg gtgggctcta tggcttctga ggcggaaaga accagctggg gctctagggg 3240
gtatccccac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag 3300
cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt 3360
tctcgccacg ttcgccggct ttccccgtca agctctaaat cggggcatcc ctttagggtt 3420
ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg 3480
tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt 3540
taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt 3600
tgatttataa gggattttgg ggatttcggc ctattggtta aaaaatgagc tgatttaaca 3660
aaaatttaac gcgaattaat tctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca 3720
ggctccccag gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccaggtg 3780
tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 3840
agcaaccata gtcccgcccc taactccgcc catcccgccc ctaactccgc ccagttccgc 3900
ccattctccg ccccatggct gactaatttt ttttatttat gcagaggccg aggccgcctc 3960
tgcctctgag ctattccaga agtagtgagg aggctttttt ggaggcctag gcttttgcaa 4020
aaagctcccg ggagcttgta tatccatttt cggatctgat caagagacag gatgaggatc 4080
gtttcgcatg attgaacaag atggattgca cgcaggttct ccggccgctt gggtggagag 4140
gctattcggc tatgactggg cacaacagac aatcggctgc tctgatgccg ccgtgttccg 4200
gctgtcagcg caggggcgcc cggttctttt tgtcaagacc gacctgtccg gtgccctgaa 4260
tgaactgcag gacgaggcag cgcggctatc gtggctggcc acgacgggcg ttccttgcgc 4320
agctgtgctc gacgttgtca ctgaagcggg aagggactgg ctgctattgg gcgaagtgcc 4380
ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag aaagtatcca tcatggctga 4440
tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc ccattcgacc accaagcgaa 4500
acatcgcatc gagcgagcac gtactcggat ggaagccggt cttgtcgatc aggatgatct 4560
ggacgaagag catcaggggc tcgcgccagc cgaactgttc gccaggctca aggcgcgcat 4620
gcccgacggc gaggatctcg tcgtgaccca tggcgatgcc tgcttgccga atatcatggt 4680
ggaaaatggc cgcttttctg gattcatcga ctgtggccgg ctgggtgtgg cggaccgcta 4740
tcaggacata gcgttggcta cccgtgatat tgctgaagag cttggcggcg aatgggctga 4800
ccgcttcctc gtgctttacg gtatcgccgc tcccgattcg cagcgcatcg ccttctatcg 4860
ccttcttgac gagttcttct gagcgggact ctggggttcg aaatgaccga ccaagcgacg 4920
cccaacctgc catcacgaga tttcgattcc accgccgcct tctatgaaag gttgggcttc 4980
ggaatcgttt tccgggacgc cggctggatg atcctccagc gcggggatct catgctggag 5040
ttcttcgccc accccaactt gtttattgca gcttataatg gttacaaata aagcaatagc 5100
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa 5160
ctcatcaatg tatcttatca tgtctgtata ccgtcgacct ctagctagag cttggcgtaa 5220
tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 5280
cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 5340
attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 5400
tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg 5460
ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 5520
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 5580
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 5640
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 5700
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 5760
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 5820
caatgctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 5880
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 5940
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 6000
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 6060
actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 6120
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 6180
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 6240
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 6300
aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 6360
atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 6420
gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 6480
atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 6540
ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 6600
cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 6660
agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 6720
cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 6780
tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 6840
agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 6900
gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 6960
gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 7020
ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 7080
tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 7140
tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 7200
gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 7260
caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 7320
atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 7380
gtcgacggat cgggagatct cccgatcccc tatggtcgac tctcagtaca atctgctctg 7440
atgccgcata gttaagccag tatctgctcc ctgcttgtgt gttggaggtc gctgagtagt 7500
gcgcgagcaa aatttaagct acaacaaggc aaggcttgac cgacaattgc atgaagaatc 7560
tgcttagggt taggcgtttt gcgctgcttc gcgatgtacg ggccagatat acgcgttgac 7620
attgattatt gactagttat taatagtaat caattacggg gtcattagtt catagcccat 7680
atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg 7740
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 7800
tccattgacg tcaatgggtg gactatttac ggtaaactgc ccacttggca gtacatcaag 7860
tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 7920
attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag 7980
tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt 8040
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 8100
accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaatgg 8160
gcggtaggcg tgtacggtgg gaggtctata taagcagagc tctctggcta actagagaac 8220
ccactgctta ctggcttatc gaaat 8245
<210> 304
<211> 1105
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 304
Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys
1 5 10 15
Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu
20 25 30
Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His
35 40 45
Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala
50 55 60
Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln
65 70 75 80
Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu
85 90 95
Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile
100 105 110
Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg
115 120 125
Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val
130 135 140
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
145 150 155 160
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
165 170 175
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
180 185 190
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
195 200 205
Gln Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
210 215 220
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
225 230 235 240
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
245 250 255
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
260 265 270
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
275 280 285
Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln
290 295 300
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
305 310 315 320
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu
325 330 335
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
340 345 350
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro
355 360 365
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
370 375 380
Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
385 390 395 400
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
405 410 415
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
420 425 430
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
435 440 445
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
450 455 460
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
465 470 475 480
Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
485 490 495
Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
500 505 510
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln
515 520 525
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
530 535 540
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
545 550 555 560
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
565 570 575
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
580 585 590
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
595 600 605
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
610 615 620
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
625 630 635 640
Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile
645 650 655
Ala Ser Asn Lys Gly Gly Arg Pro Ala Leu Glu Thr Val Gln Arg Leu
660 665 670
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
675 680 685
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
690 695 700
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
705 710 715 720
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser
725 730 735
Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr
740 745 750
Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu
755 760 765
Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg
770 775 780
Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Asp His
785 790 795 800
Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys His Ser His Pro
805 810 815
Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly Met Ser Arg His
820 825 830
Gly Leu Leu Gln Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala
835 840 845
Arg Ser Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu
850 855 860
Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Thr Gln
865 870 875 880
Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg
885 890 895
Asp Leu Asp Ala Pro Ser Pro Thr His Glu Gly Asp Gln Arg Arg Ala
900 905 910
Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser
915 920 925
Ala Gln Gln Ser Phe Glu Val Arg Ala Pro Glu Gln Arg Asp Ala Leu
930 935 940
His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg Thr Ser Ile Gly
945 950 955 960
Gly Gly Leu Pro Asp Pro Gly Thr Pro Thr Ala Ala Asp Leu Ala Ala
965 970 975
Ser Ser Thr Val Met Arg Glu Gln Asp Glu Asp Pro Phe Ala Gly Ala
980 985 990
Ala Asp Asp Phe Pro Ala Phe Asn Glu Glu Glu Leu Ala Trp Leu Met
995 1000 1005
Glu Leu Leu Pro Gln Asp Arg Gly Arg Ala Pro Pro Thr Asp Val
1010 1015 1020
Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met
1025 1030 1035
Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
1040 1045 1050
Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala
1055 1060 1065
Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met
1070 1075 1080
Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly Gly Arg Asp
1085 1090 1095
Tyr Lys Asp Asp Asp Asp Lys
1100 1105
<210> 305
<211> 3315
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 305
atggtggatc tacgcacgct cggctacagc cagcagcaac aggagaagat caaaccgaag 60
gttcgttcga cagtggcgca gcaccacgag gcactggtcg gccatgggtt tacacacgcg 120
cacatcgttg cgctcagcca acacccggca gcgttaggga ccgtcgctgt caagtatcag 180
gacatgatcg cagcgttgcc agaggcgaca cacgaagcga tcgttggcgt cggcaaacag 240
tggtccggcg cacgcgccct ggaggccttg ctcacggtgg cgggagagtt gagaggtcca 300
ccgttacagt tggacacagg ccaacttctc aagattgcaa aacgtggcgg cgtgaccgca 360
gtggaggcag tgcatgcatg gcgcaatgca ctgacggggg cccccctgaa ccttactccc 420
gaacaagtag tagcgatagc cagtaataac ggaggtaaac aagccttgga gacggtccaa 480
aggttgctcc cggtcttgtg tcaggcacat gggctgacgc ctcaacaggt cgtcgcgata 540
gcgtctaata atggaggaaa gcaagctctg gaaaccgtcc agcgactcct tccggttctg 600
tgccaggctc atggtctgac tccgcagcaa gtcgttgcta tagcgtccaa catcggaggc 660
aaacaggccc tggagaccgt gcagcggttg ttgcctgtgc tttgccaagc ccacgggctt 720
acgcctgagc aagtggtggc gattgccagt aacaacggcg gcaaacaagc ccttgagact 780
gtgcagaggc tcttgccggt actctgccaa gcacacggct tgacccccga gcaggttgta 840
gccatagcta gtcacgacgg gggtaagcaa gcgttggaaa cggtgcaagc acttctcccc 900
gttctctgtc aagcgcatgg acttaccccg gaacaggtgg tcgccattgc aagccatgat 960
ggaggaaagc aggcgctcga aacagtccag gcacttttgc ccgtactttg tcaagctcac 1020
ggtctcaccc cggaacaggt ggtagccatt gcatctaaca tcggaggtaa gcaagcattg 1080
gaaacggttc aggccctgtt gcctgtactt tgccaggcgc acggtctgac acctgagcag 1140
gttgtcgcca tcgctagcaa cggaggtggg aaacaggcac ttgaaactgt gcagaggctt 1200
ctgccggtgc tgtgccaagc gcatggcctt acacccgagc aagtagtggc tattgcgagt 1260
catgatggag gcaagcaagc gctggagact gtccaacgac ttcttccggt cttgtgtcag 1320
gcacatggat tgacccctca acaagtcgtg gcgatagcta gcaacggcgg tggaaaacag 1380
gccctcgaaa ccgtccagcg actgctcccc gtactgtgtc aagcccatgg acttacccca 1440
gaacaagttg tggcgattgc ctctaacaat ggtgggaagc aagctcttga gacggtgcag 1500
gcgttgttgc ccgtgctttg tcaagctcac gggctcacgc cagagcaagt ggtcgctatc 1560
gcgagtaata aagggggcaa acaagccttg gagacagtgc aaaggctcct gccagtgctc 1620
tgccaggctc atggtttgac acccgaacag gtagttgcaa tagcgagtca tgatggcgga 1680
aagcaagctc ttgaaactgt gcagcggctg ttgcctgtac tgtgtcaagc ccacgggctg 1740
acaccggaac aagttgtagc gatcgctagc cacgatggcg ggaaacaagc tctggaaacg 1800
gtacagagac tcctcccagt gctttgtcag gcacacggcc tcacgccaga gcaggttgtc 1860
gccatcgcgt caaacaatgg tggaaagcag gccctggaga cagtccaacg gttgctgccg 1920
gtcctttgcc aggctcacgg gttgaccccc cagcaggtcg tggccattgc ctcaaacaag 1980
ggcggtaggc cagcattgga gacggtgcag aggcttctgc ctgtgctctg ccaagcgcat 2040
ggactcaccc ccgagcaagt ggttgctatc gcaagtaaca acggagggaa acaagcgctc 2100
gaaaccgtgc aaaggttgct ccccgttctc tgtcaggcgc acggtcttac gccacaacag 2160
gtggtggcga ttgcatctaa tggaggcgga cgccctgcct tggagagcat tgtggcccag 2220
ctgtccaggc cggaccctgc cctggccgcg ttaaccaacg accacctcgt cgccttggcc 2280
tgcctcggcg gacgtcctgc gctggatgca gtgaaaaagg gattgccgca cgcgccggcc 2340
ttgatcaaaa gaaccaatcg ccgtattccc gaacgcacat cccatcgcgt tgccgaccac 2400
gcgcaagtgg ttcgcgtgct gggttttttc cagtgccact cccacccagc gcaagcattt 2460
gatgacgcca tgacgcagtt cgggatgagc aggcacgggt tgttacagct ctttcgcaga 2520
gtgggcgtca ccgaactcga agcccgcagt ggaacgctcc ccccagcctc gcagcgttgg 2580
gaccgtatcc tccaggcatc agggatgaaa agggccaaac cgtcccctac ttcaactcaa 2640
acgccggacc aggcgtcttt gcatgcattc gccgattcgc tggagcgtga ccttgatgcg 2700
cccagcccaa cgcacgaggg agatcagagg cgggcaagca gccgtaaacg gtcccgatcg 2760
gatcgtgctg tcaccggtcc ctccgcacag caatcgttcg aggtgcgcgc tcccgaacag 2820
cgcgatgcgc tgcatttgcc cctcagttgg agggtaaaac gcccgcgtac cagtatcggg 2880
ggcggcctcc cggatcctgg tacgcccacg gctgccgacc tggcagcgtc cagcaccgtg 2940
atgcgggaac aagatgagga ccccttcgca ggggcagcgg atgatttccc ggcattcaac 3000
gaagaggagc tcgcatggtt gatggagcta ttgcctcagg accgcggccg cgcccccccg 3060
accgatgtca gcctggggga cgagctccac ttagacggcg aggacgtggc gatggcgcat 3120
gccgacgcgc tagacgattt cgatctggac atgttggggg acggggattc cccgggtccg 3180
ggatttaccc cccacgactc cgccccctac ggcgctctgg atatggccga cttcgagttt 3240
gagcagatgt ttaccgatgc ccttggaatt gacgagtacg gtggcggccg cgactacaag 3300
gacgacgatg acaag 3315
<210> 306
<211> 939
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 306
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile Asp Gly Val Pro Ala
1 5 10 15
Ala Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys
20 25 30
Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu
35 40 45
Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His
50 55 60
Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala
65 70 75 80
Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln
85 90 95
Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu
100 105 110
Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile
115 120 125
Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg
130 135 140
Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val
145 150 155 160
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
165 170 175
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
180 185 190
Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr
195 200 205
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
210 215 220
Gln Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu
225 230 235 240
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
245 250 255
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln
260 265 270
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
275 280 285
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
290 295 300
Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln
305 310 315 320
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
325 330 335
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu
340 345 350
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
355 360 365
Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro
370 375 380
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
385 390 395 400
Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
405 410 415
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
420 425 430
Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
435 440 445
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
450 455 460
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
465 470 475 480
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
485 490 495
Glu Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu
500 505 510
Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
515 520 525
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Lys Gly Gly Lys Gln
530 535 540
Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His
545 550 555 560
Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly
565 570 575
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
580 585 590
Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp
595 600 605
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
610 615 620
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
625 630 635 640
Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
645 650 655
Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile
660 665 670
Ala Ser Asn Lys Gly Gly Arg Pro Ala Leu Glu Thr Val Gln Arg Leu
675 680 685
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val
690 695 700
Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
705 710 715 720
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln
725 730 735
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu Ser
740 745 750
Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu Thr
755 760 765
Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu
770 775 780
Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg
785 790 795 800
Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Asp His
805 810 815
Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys His Ser His Pro
820 825 830
Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly Met Ser Gly Ser
835 840 845
Arg Gly Arg Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His
850 855 860
Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp
865 870 875 880
Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe
885 890 895
Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe
900 905 910
Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly
915 920 925
Gly Gly Arg Asp Tyr Lys Asp Asp Asp Asp Lys
930 935
<210> 307
<211> 2817
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 307
atggccccca agaagaagag gaaggtggga atcgatgggg tacccgccgc tgtggatcta 60
cgcacgctcg gctacagcca gcagcaacag gagaagatca aaccgaaggt tcgttcgaca 120
gtggcgcagc accacgaggc actggtcggc catgggttta cacacgcgca catcgttgcg 180
ctcagccaac acccggcagc gttagggacc gtcgctgtca agtatcagga catgatcgca 240
gcgttgccag aggcgacaca cgaagcgatc gttggcgtcg gcaaacagtg gtccggcgca 300
cgcgccctgg aggccttgct cacggtggcg ggagagttga gaggtccacc gttacagttg 360
gacacaggcc aacttctcaa gattgcaaaa cgtggcggcg tgaccgcagt ggaggcagtg 420
catgcatggc gcaatgcact gacgggggcc cccctgaacc ttactcccga acaagtagta 480
gcgatagcca gtaataacgg aggtaaacaa gccttggaga cggtccaaag gttgctcccg 540
gtcttgtgtc aggcacatgg gctgacgcct caacaggtcg tcgcgatagc gtctaataat 600
ggaggaaagc aagctctgga aaccgtccag cgactccttc cggttctgtg ccaggctcat 660
ggtctgactc cgcagcaagt cgttgctata gcgtccaaca tcggaggcaa acaggccctg 720
gagaccgtgc agcggttgtt gcctgtgctt tgccaagccc acgggcttac gcctgagcaa 780
gtggtggcga ttgccagtaa caacggcggc aaacaagccc ttgagactgt gcagaggctc 840
ttgccggtac tctgccaagc acacggcttg acccccgagc aggttgtagc catagctagt 900
cacgacgggg gtaagcaagc gttggaaacg gtgcaagcac ttctccccgt tctctgtcaa 960
gcgcatggac ttaccccgga acaggtggtc gccattgcaa gccatgatgg aggaaagcag 1020
gcgctcgaaa cagtccaggc acttttgccc gtactttgtc aagctcacgg tctcaccccg 1080
gaacaggtgg tagccattgc atctaacatc ggaggtaagc aagcattgga aacggttcag 1140
gccctgttgc ctgtactttg ccaggcgcac ggtctgacac ctgagcaggt tgtcgccatc 1200
gctagcaacg gaggtgggaa acaggcactt gaaactgtgc agaggcttct gccggtgctg 1260
tgccaagcgc atggccttac acccgagcaa gtagtggcta ttgcgagtca tgatggaggc 1320
aagcaagcgc tggagactgt ccaacgactt cttccggtct tgtgtcaggc acatggattg 1380
acccctcaac aagtcgtggc gatagctagc aacggcggtg gaaaacaggc cctcgaaacc 1440
gtccagcgac tgctccccgt actgtgtcaa gcccatggac ttaccccaga acaagttgtg 1500
gcgattgcct ctaacaatgg tgggaagcaa gctcttgaga cggtgcaggc gttgttgccc 1560
gtgctttgtc aagctcacgg gctcacgcca gagcaagtgg tcgctatcgc gagtaataaa 1620
gggggcaaac aagccttgga gacagtgcaa aggctcctgc cagtgctctg ccaggctcat 1680
ggtttgacac ccgaacaggt agttgcaata gcgagtcatg atggcggaaa gcaagctctt 1740
gaaactgtgc agcggctgtt gcctgtactg tgtcaagccc acgggctgac accggaacaa 1800
gttgtagcga tcgctagcca cgatggcggg aaacaagctc tggaaacggt acagagactc 1860
ctcccagtgc tttgtcaggc acacggcctc acgccagagc aggttgtcgc catcgcgtca 1920
aacaatggtg gaaagcaggc cctggagaca gtccaacggt tgctgccggt cctttgccag 1980
gctcacgggt tgacccccca gcaggtcgtg gccattgcct caaacaaggg cggtaggcca 2040
gcattggaga cggtgcagag gcttctgcct gtgctctgcc aagcgcatgg actcaccccc 2100
gagcaagtgg ttgctatcgc aagtaacaac ggagggaaac aagcgctcga aaccgtgcaa 2160
aggttgctcc ccgttctctg tcaggcgcac ggtcttacgc cacaacaggt ggtggcgatt 2220
gcatctaatg gaggcggacg ccctgccttg gagagcattg tggcccagct gtccaggccg 2280
gaccctgccc tggccgcgtt aaccaacgac cacctcgtcg ccttggcctg cctcggcgga 2340
cgtcctgcgc tggatgcagt gaaaaaggga ttgccgcacg cgccggcctt gatcaaaaga 2400
accaatcgcc gtattcccga acgcacatcc catcgcgttg ccgaccacgc gcaagtggtt 2460
cgcgtgctgg gttttttcca gtgccactcc cacccagcgc aagcatttga tgacgccatg 2520
acgcagttcg ggatgagcgg atcccgcggc cgcgcccccc cgaccgatgt cagcctgggg 2580
gacgagctcc acttagacgg cgaggacgtg gcgatggcgc atgccgacgc gctagacgat 2640
ttcgatctgg acatgttggg ggacggggat tccccgggtc cgggatttac cccccacgac 2700
tccgccccct acggcgctct ggatatggcc gacttcgagt ttgagcagat gtttaccgat 2760
gcccttggaa ttgacgagta cggtggcggc cgcgactaca aggacgacga tgacaag 2817
<210> 308
<211> 949
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 308
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile Asp Gly Val Pro Ala
1 5 10 15
Ala Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys
20 25 30
Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu
35 40 45
Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His
50 55 60
Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala
65 70 75 80
Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln
85 90 95
Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu
100 105 110
Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile
115 120 125
Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg
130 135 140
Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val
145 150 155 160
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
165 170 175
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
180 185 190
Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
195 200 205
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
210 215 220
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
225 230 235 240
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
245 250 255
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
260 265 270
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
275 280 285
Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
290 295 300
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Ala
305 310 315 320
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
325 330 335
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
340 345 350
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile
355 360 365
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
370 375 380
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
385 390 395 400
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
405 410 415
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
420 425 430
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
435 440 445
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
450 455 460
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
465 470 475 480
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln
485 490 495
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
500 505 510
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
515 520 525
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
530 535 540
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
545 550 555 560
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro
565 570 575
Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu
580 585 590
Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly
595 600 605
Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala
610 615 620
Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg
625 630 635 640
Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys
645 650 655
His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly
660 665 670
Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg Val Gly Val Thr
675 680 685
Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp
690 695 700
Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala Lys Pro Ser Pro
705 710 715 720
Thr Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His Ala Phe Ala Asp
725 730 735
Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Thr His Glu Gly Asp
740 745 750
Gln Arg Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser Asp Arg Ala Val
755 760 765
Thr Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg Ala Pro Glu Gln
770 775 780
Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val Lys Arg Pro Arg
785 790 795 800
Thr Ser Ile Gly Gly Gly Leu Pro Asp Pro Gly Thr Pro Thr Ala Ala
805 810 815
Asp Leu Ala Ala Ser Ser Thr Val Met Arg Glu Gln Asp Glu Asp Pro
820 825 830
Phe Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu Glu Glu Leu
835 840 845
Ala Trp Leu Met Glu Leu Leu Pro Gln Asp Arg Gly Arg Ala Pro Pro
850 855 860
Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val
865 870 875 880
Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
885 890 895
Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala
900 905 910
Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe
915 920 925
Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly Gly Arg Asp Tyr Lys
930 935 940
Asp Asp Asp Asp Lys
945
<210> 309
<211> 2847
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 309
atggccccca agaagaagag gaaggtggga atcgatgggg tacccgccgc tgtggatcta 60
cgcacgctcg gctacagcca gcagcaacag gagaagatca aaccgaaggt tcgttcgaca 120
gtggcgcagc accacgaggc actggtcggc catgggttta cacacgcgca catcgttgcg 180
ctcagccaac acccggcagc gttagggacc gtcgctgtca agtatcagga catgatcgca 240
gcgttgccag aggcgacaca cgaagcgatc gttggcgtcg gcaaacagtg gtccggcgca 300
cgcgccctgg aggccttgct cacggtggcg ggagagttga gaggtccacc gttacagttg 360
gacacaggcc aacttctcaa gattgcaaaa cgtggcggcg tgaccgcagt ggaggcagtg 420
catgcatggc gcaatgcact gacgggggcc cccctgaacc tgaccccgga gcaggtggtg 480
gccatcgcca gcaatattgg tggcaagcag gcgctggaga cggtgcagcg gctgttgccg 540
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagcaatggc 600
ggcaagcagg cgctggagac ggtgcagcgg ctgttgccgg tgctgtgcca ggcccatggc 660
ctgaccccgg agcaggtggt ggccatcgcc agcaatattg gtggcaagca ggcgctggag 720
acggtgcagc ggctgttgcc ggtgctgtgc caggcccatg gcctgacccc ggagcaggtg 780
gtggccatcg ccagcaatat tggtggcaag caggcgctgg agacggtgca gcggctgttg 840
ccggtgctgt gccaggccca tggcctgacc ccggcacagg tggtggccat cgccagcaat 900
attggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gcgccaggcc 960
catggcctga ccccggagca ggtcgtggcc atcgccagca atggcggcaa gcaggcgctg 1020
gagacggtgc agcggctgtt gccggtgctg tgccaggccc atggcctgac cccggcacag 1080
gtggtggcca tcgccagcaa tattggcggc aagcaggcgc tggagacggt gcagcggctg 1140
ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtcgtggc catcgccagc 1200
cacgatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 1260
gcccatggcc tgaccccgga gcaggtggtg gccatcgcca gccacgatgg cggcaagcag 1320
gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 1380
gaccaggtgg tggccatcgc cagcaatggc ggtggcaagc aggcgctgga gacggtgcag 1440
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggaccaggt ggtggccatc 1500
gccagcaatg gcggtggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 1560
tgccaggccc atggcctgac cccggagcag gtggtggcca tcgccagcca cgatggcggc 1620
aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1680
accccggagc aggtggtggc catcgccagc aatggcggcg gcaggccggc gctggagagc 1740
attgttgccc agttatctcg ccctgatccg gcgttggccg cgttaaccaa cgaccacctc 1800
gtcgccttgg cctgcctcgg cggacgtcct gcgctggatg cagtgaaaaa gggattgccg 1860
cacgcgccgg ccttgatcaa aagaaccaat cgccgtattc ccgaacgcac atcccatcgc 1920
gttgccgacc acgcgcaagt ggttcgcgtg ctgggttttt tccagtgcca ctcccaccca 1980
gcgcaagcat ttgatgacgc catgacgcag ttcgggatga gcaggcacgg gttgttacag 2040
ctctttcgca gagtgggcgt caccgaactc gaagcccgca gtggaacgct ccccccagcc 2100
tcgcagcgtt gggaccgtat cctccaggca tcagggatga aaagggccaa accgtcccct 2160
acttcaactc aaacgccgga ccaggcgtct ttgcatgcat tcgccgattc gctggagcgt 2220
gaccttgatg cgcccagccc aacgcacgag ggagatcaga ggcgggcaag cagccgtaaa 2280
cggtcccgat cggatcgtgc tgtcaccggt ccctccgcac agcaatcgtt cgaggtgcgc 2340
gctcccgaac agcgcgatgc gctgcatttg cccctcagtt ggagggtaaa acgcccgcgt 2400
accagtatcg ggggcggcct cccggatcct ggtacgccca cggctgccga cctggcagcg 2460
tccagcaccg tgatgcggga acaagatgag gaccccttcg caggggcagc ggatgatttc 2520
ccggcattca acgaagagga gctcgcatgg ttgatggagc tattgcctca ggaccgcggc 2580
cgcgcccccc cgaccgatgt cagcctgggg gacgagctcc acttagacgg cgaggacgtg 2640
gcgatggcgc atgccgacgc gctagacgat ttcgatctgg acatgttggg ggacggggat 2700
tccccgggtc cgggatttac cccccacgac tccgccccct acggcgctct ggatatggcc 2760
gacttcgagt ttgagcagat gtttaccgat gcccttggaa ttgacgagta cggtggcggc 2820
cgcgactaca aggacgacga tgacaag 2847
<210> 310
<211> 791
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 310
Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys
1 5 10 15
Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu
20 25 30
Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His
35 40 45
Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala
50 55 60
Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln
65 70 75 80
Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu
85 90 95
Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile
100 105 110
Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg
115 120 125
Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val
130 135 140
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
145 150 155 160
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
165 170 175
Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
195 200 205
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
260 265 270
Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Ala
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
305 310 315 320
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
325 330 335
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile
340 345 350
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
355 360 365
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
370 375 380
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
385 390 395 400
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
405 410 415
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
420 425 430
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
435 440 445
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
450 455 460
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln
465 470 475 480
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
485 490 495
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
500 505 510
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
515 520 525
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
530 535 540
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro
545 550 555 560
Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu
565 570 575
Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly
580 585 590
Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala
595 600 605
Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg
610 615 620
Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys
625 630 635 640
His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly
645 650 655
Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg Val Gly Val Thr
660 665 670
Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala Ser Gln Arg Trp
675 680 685
Asp Arg Ile Leu Gln Ala Ser Gly Gly Ser Gly His Arg Gly Arg Ala
690 695 700
Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu
705 710 715 720
Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp
725 730 735
Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp
740 745 750
Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln
755 760 765
Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly Gly Arg Asp
770 775 780
Tyr Lys Asp Asp Asp Asp Lys
785 790
<210> 311
<211> 2373
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 311
atggtggatc tacgcacgct cggctacagc cagcagcaac aggagaagat caaaccgaag 60
gttcgttcga cagtggcgca gcaccacgag gcactggtcg gccatgggtt tacacacgcg 120
cacatcgttg cgctcagcca acacccggca gcgttaggga ccgtcgctgt caagtatcag 180
gacatgatcg cagcgttgcc agaggcgaca cacgaagcga tcgttggcgt cggcaaacag 240
tggtccggcg cacgcgccct ggaggccttg ctcacggtgg cgggagagtt gagaggtcca 300
ccgttacagt tggacacagg ccaacttctc aagattgcaa aacgtggcgg cgtgaccgca 360
gtggaggcag tgcatgcatg gcgcaatgca ctgacgggtg cccccctgaa cctgaccccg 420
gagcaggtgg tggccatcgc cagcaatatt ggtggcaagc aggcgctgga gacggtgcag 480
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt ggtggccatc 540
gccagcaatg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgtgc 600
caggcccatg gcctgacccc ggagcaggtg gtggccatcg ccagcaatat tggtggcaag 660
caggcgctgg agacggtgca gcggctgttg ccggtgctgt gccaggccca tggcctgacc 720
ccggagcagg tggtggccat cgccagcaat attggtggca agcaggcgct ggagacggtg 780
cagcggctgt tgccggtgct gtgccaggcc catggcctga ccccggcaca ggtggtggcc 840
atcgccagca atattggcgg caagcaggcg ctggagacgg tgcagcggct gttgccggtg 900
ctgcgccagg cccatggcct gaccccggag caggtcgtgg ccatcgccag caatggcggc 960
aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1020
accccggcac aggtggtggc catcgccagc aatattggcg gcaagcaggc gctggagacg 1080
gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga gcaggtcgtg 1140
gccatcgcca gccacgatgg cggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1200
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1260
ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1320
ggcctgaccc cggaccaggt ggtggccatc gccagcaatg gcggtggcaa gcaggcgctg 1380
gagacggtgc agcggctgtt gccggtgctg tgccaggccc atggcctgac cccggaccag 1440
gtggtggcca tcgccagcaa tggcggtggc aagcaggcgc tggagacggt gcagcggctg 1500
ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 1560
cacgatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 1620
gcccatggcc tgaccccgga gcaggtggtg gccatcgcca gcaatggcgg cggcaggccg 1680
gcgctggaga gcattgttgc ccagttatct cgccctgatc cggcgttggc cgcgttgacc 1740
aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgcgctgga tgcagtgaaa 1800
aagggattgc cgcacgcgcc ggccttgatc aaaagaacca atcgccgtat tcccgaacgc 1860
acatcccatc gcgttgccga ccacgcgcaa gtggttcgcg tgctgggttt tttccagtgc 1920
cactcccacc cagcgcaagc atttgatgac gccatgacgc agttcgggat gagcaggcac 1980
gggttgttac agctctttcg cagagtgggc gtcaccgaac tcgaagcccg cagtggaacg 2040
ctccccccag cctcgcagcg ttgggaccgt atcctccagg catcgggggg atccggccac 2100
cgcggccgcg cccccccgac cgatgtcagc ctgggggacg agctccactt agacggcgag 2160
gacgtggcga tggcgcatgc cgacgcgcta gacgatttcg atctggacat gttgggggac 2220
ggggattccc cgggtccggg atttaccccc cacgactccg ccccctacgg cgctctggat 2280
atggccgact tcgagtttga gcagatgttt accgatgccc ttggaattga cgagtacggt 2340
ggcggccgcg actacaagga cgacgatgac aag 2373
<210> 312
<211> 751
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 312
Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys
1 5 10 15
Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu
20 25 30
Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His
35 40 45
Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala
50 55 60
Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln
65 70 75 80
Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu
85 90 95
Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile
100 105 110
Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg
115 120 125
Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val
130 135 140
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
145 150 155 160
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
165 170 175
Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
195 200 205
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
260 265 270
Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Ala
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
305 310 315 320
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
325 330 335
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile
340 345 350
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
355 360 365
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
370 375 380
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
385 390 395 400
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
405 410 415
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
420 425 430
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
435 440 445
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
450 455 460
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln
465 470 475 480
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
485 490 495
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
500 505 510
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
515 520 525
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
530 535 540
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro
545 550 555 560
Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu
565 570 575
Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly
580 585 590
Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala
595 600 605
Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg
610 615 620
Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln Cys
625 630 635 640
His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe Gly
645 650 655
Met Ser Gly Ser Arg Gly Arg Ala Pro Pro Thr Asp Val Ser Leu Gly
660 665 670
Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp
675 680 685
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro
690 695 700
Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp
705 710 715 720
Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile
725 730 735
Asp Glu Tyr Gly Gly Gly Arg Asp Tyr Lys Asp Asp Asp Asp Lys
740 745 750
<210> 313
<211> 2253
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 313
atggtggatc tacgcacgct cggctacagc cagcagcaac aggagaagat caaaccgaag 60
gttcgttcga cagtggcgca gcaccacgag gcactggtcg gccatgggtt tacacacgcg 120
cacatcgttg cgctcagcca acacccggca gcgttaggga ccgtcgctgt caagtatcag 180
gacatgatcg cagcgttgcc agaggcgaca cacgaagcga tcgttggcgt cggcaaacag 240
tggtccggcg cacgcgccct ggaggccttg ctcacggtgg cgggagagtt gagaggtcca 300
ccgttacagt tggacacagg ccaacttctc aagattgcaa aacgtggcgg cgtgaccgca 360
gtggaggcag tgcatgcatg gcgcaatgca ctgacggggg cccccctgaa cctgaccccg 420
gagcaggtgg tggccatcgc cagcaatatt ggtggcaagc aggcgctgga gacggtgcag 480
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt ggtggccatc 540
gccagcaatg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgtgc 600
caggcccatg gcctgacccc ggagcaggtg gtggccatcg ccagcaatat tggtggcaag 660
caggcgctgg agacggtgca gcggctgttg ccggtgctgt gccaggccca tggcctgacc 720
ccggagcagg tggtggccat cgccagcaat attggtggca agcaggcgct ggagacggtg 780
cagcggctgt tgccggtgct gtgccaggcc catggcctga ccccggcaca ggtggtggcc 840
atcgccagca atattggcgg caagcaggcg ctggagacgg tgcagcggct gttgccggtg 900
ctgcgccagg cccatggcct gaccccggag caggtcgtgg ccatcgccag caatggcggc 960
aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1020
accccggcac aggtggtggc catcgccagc aatattggcg gcaagcaggc gctggagacg 1080
gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga gcaggtcgtg 1140
gccatcgcca gccacgatgg cggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1200
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1260
ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1320
ggcctgaccc cggaccaggt ggtggccatc gccagcaatg gcggtggcaa gcaggcgctg 1380
gagacggtgc agcggctgtt gccggtgctg tgccaggccc atggcctgac cccggaccag 1440
gtggtggcca tcgccagcaa tggcggtggc aagcaggcgc tggagacggt gcagcggctg 1500
ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 1560
cacgatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 1620
gcccatggcc tgaccccgga gcaggtggtg gccatcgcca gcaatggcgg cggcaggccg 1680
gcgctggaga gcattgttgc ccagttatct cgccctgatc cggcgttggc cgcgttaacc 1740
aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgcgctgga tgcagtgaaa 1800
aagggattgc cgcacgcgcc ggccttgatc aaaagaacca atcgccgtat tcccgaacgc 1860
acatcccatc gcgttgccga ccacgcgcaa gtggttcgcg tgctgggttt tttccagtgc 1920
cactcccacc cagcgcaagc atttgatgac gccatgacgc agttcgggat gagcggatcc 1980
cgcggccgcg cccccccgac cgatgtcagc ctgggggacg agctccactt agacggcgag 2040
gacgtggcga tggcgcatgc cgacgcgcta gacgatttcg atctggacat gttgggggac 2100
ggggattccc cgggtccggg atttaccccc cacgactccg ccccctacgg cgctctggat 2160
atggccgact tcgagtttga gcagatgttt accgatgccc ttggaattga cgagtacggt 2220
ggcggccgcg actacaagga cgacgatgac aag 2253
<210> 314
<211> 679
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 314
Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys
1 5 10 15
Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu
20 25 30
Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His
35 40 45
Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala
50 55 60
Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln
65 70 75 80
Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu
85 90 95
Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile
100 105 110
Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg
115 120 125
Asn Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val
130 135 140
Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
145 150 155 160
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
165 170 175
Val Val Ala Ile Ala Ser Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
195 200 205
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
260 265 270
Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Ala
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
305 310 315 320
Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln
325 330 335
Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile
340 345 350
Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu
355 360 365
Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser
370 375 380
His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro
385 390 395 400
Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile
405 410 415
Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu
420 425 430
Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln Val Val
435 440 445
Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln
450 455 460
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp Gln
465 470 475 480
Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr
485 490 495
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
500 505 510
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
515 520 525
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
530 535 540
Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro
545 550 555 560
Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu
565 570 575
Ala Ala Leu Thr Asn Asp His Leu Val Ala Gly Ser Arg Gly Arg Ala
580 585 590
Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu
595 600 605
Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp
610 615 620
Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp
625 630 635 640
Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln
645 650 655
Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly Gly Arg Asp
660 665 670
Tyr Lys Asp Asp Asp Asp Lys
675
<210> 315
<211> 2037
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 315
atggtggatc tacgcacgct cggctacagc cagcagcaac aggagaagat caaaccgaag 60
gttcgttcga cagtggcgca gcaccacgag gcactggtcg gccatgggtt tacacacgcg 120
cacatcgttg cgctcagcca acacccggca gcgttaggga ccgtcgctgt caagtatcag 180
gacatgatcg cagcgttgcc agaggcgaca cacgaagcga tcgttggcgt cggcaaacag 240
tggtccggcg cacgcgccct ggaggccttg ctcacggtgg cgggagagtt gagaggtcca 300
ccgttacagt tggacacagg ccaacttctc aagattgcaa aacgtggcgg cgtgaccgca 360
gtggaggcag tgcatgcatg gcgcaatgca ctgacggggg cccccctgaa cctgaccccg 420
gagcaggtgg tggccatcgc cagcaatatt ggtggcaagc aggcgctgga gacggtgcag 480
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggagcaggt ggtggccatc 540
gccagcaatg gcggcaagca ggcgctggag acggtgcagc ggctgttgcc ggtgctgtgc 600
caggcccatg gcctgacccc ggagcaggtg gtggccatcg ccagcaatat tggtggcaag 660
caggcgctgg agacggtgca gcggctgttg ccggtgctgt gccaggccca tggcctgacc 720
ccggagcagg tggtggccat cgccagcaat attggtggca agcaggcgct ggagacggtg 780
cagcggctgt tgccggtgct gtgccaggcc catggcctga ccccggcaca ggtggtggcc 840
atcgccagca atattggcgg caagcaggcg ctggagacgg tgcagcggct gttgccggtg 900
ctgcgccagg cccatggcct gaccccggag caggtcgtgg ccatcgccag caatggcggc 960
aagcaggcgc tggagacggt gcagcggctg ttgccggtgc tgtgccaggc ccatggcctg 1020
accccggcac aggtggtggc catcgccagc aatattggcg gcaagcaggc gctggagacg 1080
gtgcagcggc tgttgccggt gctgtgccag gcccatggcc tgaccccgga gcaggtcgtg 1140
gccatcgcca gccacgatgg cggcaagcag gcgctggaga cggtgcagcg gctgttgccg 1200
gtgctgtgcc aggcccatgg cctgaccccg gagcaggtgg tggccatcgc cagccacgat 1260
ggcggcaagc aggcgctgga gacggtgcag cggctgttgc cggtgctgtg ccaggcccat 1320
ggcctgaccc cggaccaggt ggtggccatc gccagcaatg gcggtggcaa gcaggcgctg 1380
gagacggtgc agcggctgtt gccggtgctg tgccaggccc atggcctgac cccggaccag 1440
gtggtggcca tcgccagcaa tggcggtggc aagcaggcgc tggagacggt gcagcggctg 1500
ttgccggtgc tgtgccaggc ccatggcctg accccggagc aggtggtggc catcgccagc 1560
cacgatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 1620
gcccatggcc tgaccccgga gcaggtggtg gccatcgcca gcaatggcgg cggcaggccg 1680
gcgctggaga gcattgttgc ccagttatct cgccctgatc cggcgttggc cgcgttaacc 1740
aacgaccacc tcgtcgccgg atcccgcggc cgcgcccccc cgaccgatgt cagcctgggg 1800
gacgagctcc acttagacgg cgaggacgtg gcgatggcgc atgccgacgc gctagacgat 1860
ttcgatctgg acatgttggg ggacggggat tccccgggtc cgggatttac cccccacgac 1920
tccgccccct acggcgctct ggatatggcc gacttcgagt ttgagcagat gtttaccgat 1980
gcccttggaa ttgacgagta cggtggcggc cgcgactaca aggacgacga tgacaag 2037
<210> 316
<211> 493
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 316
Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys
1 5 10 15
Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu
20 25 30
Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His
35 40 45
Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala
50 55 60
Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln
65 70 75 80
Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu
85 90 95
Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile
100 105 110
Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg
115 120 125
Asn Ala Leu Thr Gly Ala Pro Leu Asn Ala Leu Thr Asn Asp His Leu
130 135 140
Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys
145 150 155 160
Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg
165 170 175
Ile Pro Glu Arg Thr Ser His Arg Val Ala Asp His Ala Gln Val Val
180 185 190
Arg Val Leu Gly Phe Phe Gln Cys His Ser His Pro Ala Gln Ala Phe
195 200 205
Asp Asp Ala Met Thr Gln Phe Gly Met Ser Arg His Gly Leu Leu Gln
210 215 220
Leu Phe Arg Arg Val Gly Val Thr Glu Leu Glu Ala Arg Ser Gly Thr
225 230 235 240
Leu Pro Pro Ala Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly
245 250 255
Met Lys Arg Ala Lys Pro Ser Pro Thr Ser Thr Gln Thr Pro Asp Gln
260 265 270
Ala Ser Leu His Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala
275 280 285
Pro Ser Pro Thr His Glu Gly Asp Gln Arg Arg Ala Ser Ser Arg Lys
290 295 300
Arg Ser Arg Ser Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ser
305 310 315 320
Phe Glu Val Arg Ala Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu
325 330 335
Ser Trp Arg Val Lys Arg Pro Arg Thr Ser Ile Gly Gly Gly Leu Pro
340 345 350
Asp Pro Gly Thr Pro Thr Ala Ala Asp Leu Ala Ala Ser Ser Thr Val
355 360 365
Met Arg Glu Gln Asp Glu Asp Pro Phe Ala Gly Ala Ala Asp Asp Phe
370 375 380
Pro Ala Phe Asn Glu Glu Glu Leu Ala Trp Leu Met Glu Leu Leu Pro
385 390 395 400
Gln Asp Arg Gly Arg Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu
405 410 415
Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala Leu
420 425 430
Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro
435 440 445
Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala
450 455 460
Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu
465 470 475 480
Tyr Gly Gly Gly Arg Asp Tyr Lys Asp Asp Asp Asp Lys
485 490
<210> 317
<211> 1479
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 317
atggtggatc tacgcacgct cggctacagc cagcagcaac aggagaagat caaaccgaag 60
gttcgttcga cagtggcgca gcaccacgag gcactggtcg gccatgggtt tacacacgcg 120
cacatcgttg cgctcagcca acacccggca gcgttaggga ccgtcgctgt caagtatcag 180
gacatgatcg cagcgttgcc agaggcgaca cacgaagcga tcgttggcgt cggcaaacag 240
tggtccggcg cacgcgccct ggaggccttg ctcacggtgg cgggagagtt gagaggtcca 300
ccgttacagt tggacacagg ccaacttctc aagattgcaa aacgtggcgg cgtgaccgca 360
gtggaggcag tgcatgcatg gcgcaatgca ctgacggggg cccccctgaa cgcgttaacc 420
aacgaccacc tcgtcgcctt ggcctgcctc ggcggacgtc ctgcgctgga tgcagtgaaa 480
aagggattgc cgcacgcgcc ggccttgatc aaaagaacca atcgccgtat tcccgaacgc 540
acatcccatc gcgttgccga ccacgcgcaa gtggttcgcg tgctgggttt tttccagtgc 600
cactcccacc cagcgcaagc atttgatgac gccatgacgc agttcgggat gagcaggcac 660
gggttgttac agctctttcg cagagtgggc gtcaccgaac tcgaagcccg cagtggaacg 720
ctccccccag cctcgcagcg ttgggaccgt atcctccagg catcagggat gaaaagggcc 780
aaaccgtccc ctacttcaac tcaaacgccg gaccaggcgt ctttgcatgc attcgccgat 840
tcgctggagc gtgaccttga tgcgcccagc ccaacgcacg agggagatca gaggcgggca 900
agcagccgta aacggtcccg atcggatcgt gctgtcaccg gtccctccgc acagcaatcg 960
ttcgaggtgc gcgctcccga acagcgcgat gcgctgcatt tgcccctcag ttggagggta 1020
aaacgcccgc gtaccagtat cgggggcggc ctcccggatc ctggtacgcc cacggctgcc 1080
gacctggcag cgtccagcac cgtgatgcgg gaacaagatg aggacccctt cgcaggggca 1140
gcggatgatt tcccggcatt caacgaagag gagctcgcat ggttgatgga gctattgcct 1200
caggaccgcg gccgcgcccc cccgaccgat gtcagcctgg gggacgagct ccacttagac 1260
ggcgaggacg tggcgatggc gcatgccgac gcgctagacg atttcgatct ggacatgttg 1320
ggggacgggg attccccggg tccgggattt accccccacg actccgcccc ctacggcgct 1380
ctggatatgg ccgacttcga gtttgagcag atgtttaccg atgcccttgg aattgacgag 1440
tacggtggcg gccgcgacta caaggacgac gatgacaag 1479
<210> 318
<211> 5914
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 318
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gccaagctca 240
gaattaaccc tcactaaagg gactagtcct gcaggtttaa acgaattcgc ccttgatact 300
tattaaccat accttggagg ggaaatcaca catgaaaagt gtcatttctt tactaatcat 360
attcatgtct tttctcccca tagcaagaca aagacctgtt ttaaacacat ttacaaccta 420
tatgttgcct tgtactaggt aaaaagttgt acatttctga aataattttg gtatttctgt 480
tcagatcact aaactcaaga atcagcaatt ctctgaggct ttcttttaaa tatacataag 540
gaactttcgg agtgaaggga gagtttgtca ataacttgat gcatgtgaag gggagataaa 600
aaggttgcta tttttcatca acatattttg atttggcttt ctataattga tgggcttaaa 660
agatctaatc tactttaaac agatgccaaa taaatggatg aatcttagac cctctataac 720
agtaacttcc ttttaaaaaa gacctctccc accccacccc cagcccaggc tgtgtatgaa 780
aactaagcca tgtgcacaac tctgactggg tcaccagccc acttgagtcc gtgtcacaag 840
cccacagata tttcctgctc cccagtggat cgggtgtaaa ctgagcttgc tcgctcggga 900
gcctcttgct ggaaaataga acagcatttg cagaagcgtt tggcaatgtg cttttggaag 960
aagactaaga ggtagtttct gaacttctcc ccgacaaagg catagatgat ggggttgatg 1020
cagcagtgcg tcatcccaag agtctctgtc acctgcatag cttggtccaa cctgttagag 1080
ctactgcaat tattcaggcc aaagaattcc tggaaggtgt tcaggagaag gacaatgttg 1140
tagggagccc agaagagaaa ataaacaatc atgatggtga agataagcct cacagccctg 1200
tgcctcttct tctcatttcg acaccgaagc agagttttta ggattcccga gtagcagatg 1260
accatgacaa gcagcggcag gaccagcccc aagatgacta tctttaatgt ctggaaattc 1320
ttccagaatt gatactgact gtatggaaaa tgagagctgc aggtgtaatg aagaccttct 1380
ttttgagatc tggtaaagat gattcctggg agagacgcaa acacagccac cacccaagtg 1440
atcacacttg tcaccacccc aaaggtgacc gtcctggctt ttaaagcaaa cacagcatgg 1500
acgacagcca ggtacctatc gattgtcagg aggatgatga agaagattcc agagaagaag 1560
cctataaaat agagccctgt caagagttga cacattgtat ttccaaagtc ccactgggcg 1620
gcagcatagt gagcccagaa ggggacagta agaaggaaaa acaggtcaga gatggccagg 1680
ttgagcaggt agatgtcagt catgctcttc agccttttgc agttttctag acgaggcatc 1740
cagtccagac gccatcaggg catactcact gatctagatg aggatgacca gcatgttgcc 1800
cacaaaacca aagatgaaca ccagtgagta gagcggaggc aggaggcggg ctgcgatttg 1860
cttcacattg attttttggc agggctccga tgtataataa ttgatgtcat agattggact 1920
tgacacttga taatccatct tgttccaccc tgtgcataaa taaaaagtga tcttttataa 1980
agtcctagaa tgtatttagt tgccctccat gaatgcaaac tgttttatac atcaataggt 2040
ttttaattgc ctacatagat gtctacattg aattaactct ctttttggcc aagcaatgaa 2100
gttttgtagt gaagggaagg tttgctgcta gcttccctgt ccactagatg gagagcttgg 2160
ctctgttggg ggaattcatg aaagcaccat ctcaccaaat aaaatcttgt gctctatagc 2220
accatggagt gaatgaagct ttgacaacaa ttaagggcga attcgcggcc gctaaattca 2280
attcgcccta tagtgagtcg tattacaatt cactggccgt cgttttacaa cgtcgtgact 2340
gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 2400
ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctatacg 2460
tacggcagtt taaggtttac acctataaaa gagagagccg ttatcgtctg tttgtggatg 2520
tacagagtga tattattgac acgccggggc gacggatggt gatccccctg gccagtgcac 2580
gtctgctgtc agataaagtc tcccgtgaac tttacccggt ggtgcatatc ggggatgaaa 2640
gctggcgcat gatgaccacc gatatggcca gtgtgccggt ctccgttatc ggggaagaag 2700
tggctgatct cagccaccgc gaaaatgaca tcaaaaacgc cattaacctg atgttctggg 2760
gaatataaat gtcaggcatg agattatcaa aaaggatctt cacctagatc cttttcacgt 2820
agaaagccag tccgcagaaa cggtgctgac cccggatgaa tgtcagctac tgggctatct 2880
ggacaaggga aaacgcaagc gcaaagagaa agcaggtagc ttgcagtggg cttacatggc 2940
gatagctaga ctgggcggtt ttatggacag caagcgaacc ggaattgcca gctggggcgc 3000
cctctggtaa ggttgggaag ccctgcaaag taaactggat ggctttcttg ccgccaagga 3060
tctgatggcg caggggatca agctctgatc aagagacagg atgaggatcg tttcgcatga 3120
ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct 3180
atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc 3240
aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcaag 3300
acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg 3360
acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc 3420
tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc 3480
ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg 3540
agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc 3600
atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgagcatg cccgacggcg 3660
aggatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc 3720
gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag 3780
cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg 3840
tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg 3900
agttcttctg aattattaac gcttacaatt tcctgatgcg gtattttctc cttacgcatc 3960
tgtgcggtat ttcacaccgc atcaggtggc acttttcggg gaaatgtgcg cggaacccct 4020
atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagatt atcaaaaagg 4080
atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat 4140
gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc 4200
tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg 4260
gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct 4320
ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca 4380
actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg 4440
ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg 4500
tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc 4560
cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag 4620
ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg 4680
ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag 4740
tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat 4800
agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg 4860
atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca 4920
gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca 4980
aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat 5040
tattgaagca tttatcaggg ttattgtctc atgaccaaaa tcccttaacg tgagttttcg 5100
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 5160
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 5220
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 5280
ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 5340
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 5400
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 5460
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 5520
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 5580
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 5640
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 5700
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 5760
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 5820
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 5880
gagcgcagcg agtcagtgag cgaggaagcg gaag 5914
<210> 319
<211> 5052
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 319
ggtaccgagc tcttacgcgt gctagtataa ataccttctg ccttactagt ataaatacct 60
tctgccttgc tagctcgaga tctgcgatct gcatctcaat tagtcagcaa ccatagtccc 120
gcccctaact ccgcccatcc cgcccctaac tccgcccagt tccgcccatt ctccgcccca 180
tcgctgacta atttttttta tttatgcaga ggccgaggcc gcctcggcct ctgagctatt 240
ccagaagtag tgaggaggct tttttggagg cctaggcttt tgcaaaaagc ttggcattcc 300
ggtactgttg gtaaagccac catggaagac gccaaaaaca taaagaaagg cccggcgcca 360
ttctatccgc tggaagatgg aaccgctgga gagcaactgc ataaggctat gaagagatac 420
gccctggttc ctggaacaat tgcttttaca gatgcacata tcgaggtgga catcacttac 480
gctgagtact tcgaaatgtc cgttcggttg gcagaagcta tgaaacgata tgggctgaat 540
acaaatcaca gaatcgtcgt atgcagtgaa aactctcttc aattctttat gccggtgttg 600
ggcgcgttat ttatcggagt tgcagttgcg cccgcgaacg acatttataa tgaacgtgaa 660
ttgctcaaca gtatgggcat ttcgcagcct accgtggtgt tcgtttccaa aaaggggttg 720
caaaaaattt tgaacgtgca aaaaaagctc ccaatcatcc aaaaaattat tatcatggat 780
tctaaaacgg attaccaggg atttcagtcg atgtacacgt tcgtcacatc tcatctacct 840
cccggtttta atgaatacga ttttgtgcca gagtccttcg atagggacaa gacaattgca 900
ctgatcatga actcctctgg atctactggt ctgcctaaag gtgtcgctct gcctcataga 960
actgcctgcg tgagattctc gcatgccaga gatcctattt ttggcaatca aatcattccg 1020
gatactgcga ttttaagtgt tgttccattc catcacggtt ttggaatgtt tactacactc 1080
ggatatttga tatgtggatt tcgagtcgtc ttaatgtata gatttgaaga agagctgttt 1140
ctgaggagcc ttcaggatta caagattcaa agtgcgctgc tggtgccaac cctattctcc 1200
ttcttcgcca aaagcactct gattgacaaa tacgatttat ctaatttaca cgaaattgct 1260
tctggtggcg ctcccctctc taaggaagtc ggggaagcgg ttgccaagag gttccatctg 1320
ccaggtatca ggcaaggata tgggctcact gagactacat cagctattct gattacaccc 1380
gagggggatg ataaaccggg cgcggtcggt aaagttgttc cattttttga agcgaaggtt 1440
gtggatctgg ataccgggaa aacgctgggc gttaatcaaa gaggcgaact gtgtgtgaga 1500
ggtcctatga ttatgtccgg ttatgtaaac aatccggaag cgaccaacgc cttgattgac 1560
aaggatggat ggctacattc tggagacata gcttactggg acgaagacga acacttcttc 1620
atcgttgacc gcctgaagtc tctgattaag tacaaaggct atcaggtggc tcccgctgaa 1680
ttggaatcca tcttgctcca acaccccaac atcttcgacg caggtgtcgc aggtcttccc 1740
gacgatgacg ccggtgaact tcccgccgcc gttgttgttt tggagcacgg aaagacgatg 1800
acggaaaaag agatcgtgga ttacgtcgcc agtcaagtaa caaccgcgaa aaagttgcgc 1860
ggaggagttg tgtttgtgga cgaagtaccg aaaggtctta ccggaaaact cgacgcaaga 1920
aaaatcagag agatcctcat aaaggccaag aagggcggaa agatcgccgt gtaattctag 1980
agtcggggcg gccggccgct tcgagcagac atgataagat acattgatga gtttggacaa 2040
accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 2100
ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 2160
atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa cctctacaaa 2220
tgtggtaaaa tcgataagga tccgtcgacc gatgcccttg agagccttca acccagtcag 2280
ctccttccgg tgggcgcggg gcatgactat cgtcgccgca cttatgactg tcttctttat 2340
catgcaactc gtaggacagg tgccggcagc gctcttccgc ttcctcgctc actgactcgc 2400
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 2460
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 2520
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 2580
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 2640
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 2700
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 2760
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 2820
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 2880
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 2940
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 3000
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 3060
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 3120
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 3180
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 3240
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 3300
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 3360
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 3420
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 3480
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 3540
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 3600
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 3660
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 3720
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 3780
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 3840
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 3900
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 3960
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 4020
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 4080
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 4140
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 4200
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 4260
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg 4320
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 4380
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 4440
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 4500
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 4560
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 4620
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 4680
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca 4740
aaatattaac gcttacaatt tgccattcgc cattcaggct gcgcaactgt tgggaagggc 4800
gatcggtgcg ggcctcttcg ctattacgcc agcccaagct accatgataa gtaagtaata 4860
ttaaggtacg ggaggtactt ggagcggccg caataaaata tctttatttt cattacatct 4920
gtgtgttggt tttttgtgtg aatcgatagt actaacatac gctctccatc aaaacaaaac 4980
gaaacaaaac aaactagcaa aataggctgt ccccagtgca agtgcaggtg ccagaacatt 5040
tctctatcga ta 5052
<210> 320
<211> 2520
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 320
gtggatctac gcacgctcgg ctacagccag cagcaacagg agaagatcaa accgaaggtt 60
cgttcgacag tggcgcagca ccacgaggca ctggtcggcc atgggtttac acacgcgcac 120
atcgttgcgc tcagccaaca cccggcagcg ttagggaccg tcgctgtcaa gtatcaggac 180
atgatcgcag cgttgccaga ggcgacacac gaagcgatcg ttggcgtcgg caaacagtgg 240
tccggcgcac gcgccctgga ggccttgctc acggtggcgg gagagttgag aggtccaccg 300
ttacagttgg acacaggcca acttctcaag attgcaaaac gtggcggcgt gaccgcagtg 360
gaggcagtgc atgcatggcg caatgcactg acgggtgccc ccctgaacct gaccccggag 420
caggtggtgg ccatcgccag caatattggt ggcaagcagg cgctggagac ggtgcagcgg 480
ctgttgccgg tgctgtgcca ggcccatggc ctgaccccgg agcaggtggt ggccatcgcc 540
agcaatggcg gcaagcaggc gctggagacg gtgcagcggc tgttgccggt gctgtgccag 600
gcccatggcc tgaccccgga gcaggtggtg gccatcgcca gcaatattgg tggcaagcag 660
gcgctggaga cggtgcagcg gctgttgccg gtgctgtgcc aggcccatgg cctgaccccg 720
gagcaggtgg tggccatcgc cagcaatatt ggtggcaagc aggcgctgga gacggtgcag 780
cggctgttgc cggtgctgtg ccaggcccat ggcctgaccc cggcacaggt ggtggccatc 840
gccagcaata ttggcggcaa gcaggcgctg gagacggtgc agcggctgtt gccggtgctg 900
cgccaggccc atggcctgac cccggagcag gtcgtggcca tcgccagcaa tggcggcaag 960
caggcgctgg agacggtgca gcggctgttg ccggtgctgt gccaggccca tggcctgacc 1020
ccggcacagg tggtggccat cgccagcaat attggcggca agcaggcgct ggagacggtg 1080
cagcggctgt tgccggtgct gtgccaggcc catggcctga ccccggagca ggtcgtggcc 1140
atcgccagcc acgatggcgg caagcaggcg ctggagacgg tgcagcggct gttgccggtg 1200
ctgtgccagg cccatggcct gaccccggag caggtggtgg ccatcgccag ccacgatggc 1260
ggcaagcagg cgctggagac ggtgcagcgg ctgttgccgg tgctgtgcca ggcccatggc 1320
ctgaccccgg accaggtggt ggccatcgcc agcaatggcg gtggcaagca ggcgctggag 1380
acggtgcagc ggctgttgcc ggtgctgtgc caggcccatg gcctgacccc ggaccaggtg 1440
gtggccatcg ccagcaatgg cggtggcaag caggcgctgg agacggtgca gcggctgttg 1500
ccggtgctgt gccaggccca tggcctgacc ccggagcagg tggtggccat cgccagccac 1560
gatggcggca agcaggcgct ggagacggtg cagcggctgt tgccggtgct gtgccaggcc 1620
catggcctga ccccggagca ggtggtggcc atcgccagca atggcggcgg caggccggcg 1680
ctggagagca ttgttgccca gttatctcgc cctgatccgg cgttggccgc gttgaccaac 1740
gaccacctcg tcgccttggc ctgcctcggc ggacgtcctg cgctggatgc agtgaaaaag 1800
ggattgccgc acgcgccggc cttgatcaaa agaaccaatc gccgtattcc cgaacgcaca 1860
tcccatcgcg ttgccgacca cgcgcaagtg gttcgcgtgc tgggtttttt ccagtgccac 1920
tcccacccag cgcaagcatt tgatgacgcc atgacgcagt tcgggatgag caggcacggg 1980
ttgttacagc tctttcgcag agtgggcgtc accgaactcg aagcccgcag tggaacgctc 2040
cccccagcct cgcagcgttg ggaccgtatc ctccaggcat cagggatgaa aagggccaaa 2100
ccgtccccta cttcaactca aacgccggac caggcgtctt tgcatgcatt cgccgattcg 2160
ctggagcgtg accttgatgc gcccagccca acgcacgagg gagatcagag gcgggcaagc 2220
agccgtaaac ggtcccgatc ggatcgtgct gtcaccggtc cctccgcaca gcaatcgttc 2280
gaggtgcgcg ctcccgaaca gcgcgatgcg ctgcatttgc ccctcagttg gagggtaaaa 2340
cgcccgcgta ccagtatcgg gggcggcctc ccggatcctg gtacgcccac ggctgccgac 2400
ctggcagcgt ccagcaccgt gatgcgggaa caagatgagg accccttcgc aggggcagcg 2460
gatgatttcc cggcattcaa cgaagaggag ctcgcatggt tgatggagct attgcctcag 2520
<210> 321
<211> 693
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 321
Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile
1 5 10 15
Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val
20 25 30
Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro
35 40 45
Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala
50 55 60
Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp
65 70 75 80
Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu
85 90 95
Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala
100 105 110
Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn
115 120 125
Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Gln Gln Val Val Ala
130 135 140
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
145 150 155 160
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val
165 170 175
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
195 200 205
Gln Val Val Ala Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly
260 265 270
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
305 310 315 320
Gly Lys Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys
325 330 335
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn
340 345 350
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
355 360 365
Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala
370 375 380
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
385 390 395 400
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
405 410 415
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
420 425 430
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val
435 440 445
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
450 455 460
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
465 470 475 480
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
485 490 495
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
500 505 510
Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
515 520 525
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
530 535 540
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
545 550 555 560
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
565 570 575
His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly
580 585 590
Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp
595 600 605
Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys
610 615 620
Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His
625 630 635 640
Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr
645 650 655
Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe
660 665 670
Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr
675 680 685
Gln Phe Gly Met Ser
690
<210> 322
<211> 2079
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 322
gtggatctac gcacgctcgg ctacagccag cagcaacagg agaagatcaa accgaaggtt 60
cgttcgacag tggcgcagca ccacgaggca ctggtcggcc atgggtttac acacgcgcac 120
atcgttgcgc tcagccaaca cccggcagcg ttagggaccg tcgctgtcaa gtatcaggac 180
atgatcgcag cgttgccaga ggcgacacac gaagcgatcg ttggcgtcgg caaacagtgg 240
tccggcgcac gcgccctgga ggccttgctc acggtggcgg gagagttgag aggtccaccg 300
ttacagttgg acacaggcca acttctcaag attgcaaaac gtggcggcgt gaccgcagtg 360
gaggcagtgc atgcatggcg caatgcactg acgggggccc ccctgaacct gacgcctcaa 420
caggtcgtcg cgatagcgtc taataatgga ggaaagcaag ctctggaaac cgtccagcga 480
ctccttccgg ttctgtgcca ggctcatggt ctgactccgc agcaagtcgt tgctatagcg 540
tccaacatcg gaggcaaaca ggccctggag accgtgcagc ggttgttgcc tgtgctttgc 600
caagcccacg ggcttacgcc tgagcaagtg gtggcgattg ccagtaacaa cggcggcaaa 660
caagcccttg agactgtgca gaggctcttg ccggtactct gccaagcaca cggcttgacc 720
cccgagcagg ttgtagccat agctagtcac gacgggggta agcaagcgtt ggaaacggtg 780
caagcacttc tccccgttct ctgtcaagcg catggactta ccccggaaca ggtggtcgcc 840
attgcaagcc atgatggggg taagcaagcg ttggaaacgg tgcaagcact tctccccgtt 900
ctctgtcaag cgcatggact taccccggaa caggtggtcg ccattgcaag ccatgatgga 960
ggaaagcagg cgctcgaaac agtccaggca cttttgcccg tactttgtca agctcacggt 1020
ctcaccccgg aacaggtggt agccattgca tctaacggag ggggcaaaca agccttggag 1080
acagtgcaaa ggctcctgcc agtgctctgc caggctcatg gtttgacacc cgaacaggta 1140
gttgcaatag cgagtcatga tggcggaaag caagctcttg aaactgtgca gcggctgttg 1200
cctgtactgt gtcaagccca cgggctgaca ccggaacaag ttgtagcgat cgctagccac 1260
gatggcggga aacaagctct ggaaacggta cagagactcc tcccagtgct ttgtcaggca 1320
cacggcctca cgccagagca ggttgtcgcc atcgcgtcac atgatggggg caaacaagcc 1380
ttggagacag tgcaaaggct cctgccagtg ctctgccagg ctcatggttt gacacccgaa 1440
caggtagttg caatagcgag tcatgatggc ggaaagcaag ctcttgaaac tgtgcagcgg 1500
ctgttgcctg tactgtgtca agcccacggg ctgacaccgg aacaagttgt agcgatcgct 1560
agccacgatg gcgggaaaca agctctggaa acggtacaga gactcctccc agtgctttgt 1620
caggcacacg gcctcacgcc agagcaggtt gtcgccatcg cgtcaaacgg tggagggaaa 1680
caagcgctcg aaaccgtgca aaggttgctc cccgttctct gtcaggcgca cggtcttacg 1740
ccacaacagg tggtggcgat tgcatctaat ggaggcggac gccctgcctt ggagagcatt 1800
gtggcccagc tgtccaggcc ggaccctgcc ctggccgcgt taaccaacga ccacctcgtc 1860
gccttggcct gcctcggcgg acgtcctgcg ctggatgcag tgaaaaaggg attgccgcac 1920
gcgccggcct tgatcaaaag aaccaatcgc cgtattcccg aacgcacatc ccatcgcgtt 1980
gccgaccacg cgcaagtggt tcgcgtgctg ggttttttcc agtgccactc ccacccagcg 2040
caagcatttg atgacgccat gacgcagttc gggatgagc 2079
<210> 323
<211> 659
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 323
Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys Ile
1 5 10 15
Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu Val
20 25 30
Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His Pro
35 40 45
Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala Ala
50 55 60
Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln Trp
65 70 75 80
Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu Leu
85 90 95
Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile Ala
100 105 110
Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg Asn
115 120 125
Ala Leu Thr Gly Ala Pro Leu Asn Leu Thr Pro Glu Gln Val Val Ala
130 135 140
Ile Ala Ser Asn Lys Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Ala
145 150 155 160
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val
165 170 175
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
180 185 190
Gln Ala Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
195 200 205
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
210 215 220
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
225 230 235 240
Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
245 250 255
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
260 265 270
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
275 280 285
Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala
290 295 300
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
305 310 315 320
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
325 330 335
Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His
340 345 350
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
355 360 365
Leu Cys Gln Ala His Gly Leu Thr Pro Gln Gln Val Val Ala Ile Ala
370 375 380
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
385 390 395 400
Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val Val Ala
405 410 415
Ile Ala Ser Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
420 425 430
Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln Val
435 440 445
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
450 455 460
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu
465 470 475 480
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
485 490 495
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
500 505 510
Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala
515 520 525
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly
530 535 540
Leu Thr Pro Gln Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
545 550 555 560
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
565 570 575
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
580 585 590
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
595 600 605
Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His
610 615 620
Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln
625 630 635 640
Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe
645 650 655
Gly Met Ser
<210> 324
<211> 1977
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 324
gtggatctac gcacgctcgg ctacagccag cagcaacagg agaagatcaa accgaaggtt 60
cgttcgacag tggcgcagca ccacgaggca ctggtcggcc atgggtttac acacgcgcac 120
atcgttgcgc tcagccaaca cccggcagcg ttagggaccg tcgctgtcaa gtatcaggac 180
atgatcgcag cgttgccaga ggcgacacac gaagcgatcg ttggcgtcgg caaacagtgg 240
tccggcgcac gcgccctgga ggccttgctc acggtggcgg gagagttgag aggtccaccg 300
ttacagttgg acacaggcca acttctcaag attgcaaaac gtggcggcgt gaccgcagtg 360
gaggcagtgc atgcatggcg caatgcactg acgggggccc ccctgaacct tacacccgag 420
caagtagtgg ctattgcgag taataaaggg ggtaagcaag cgttggaaac ggtgcaagca 480
cttctccccg ttctctgtca agcgcatgga cttaccccgg aacaggtggt cgccattgca 540
agccatgatg gaggaaagca ggcgctcgaa acagtccagg cacttttgcc cgtactttgt 600
caagctcacg gtctcacccc ggaacaggtg gtagccattg catctaacgg agggggcaaa 660
caagccttgg agacagtgca aaggctcctg ccagtgctct gccaggctca tggtttgaca 720
cccgaacagg tagttgcaat agcgagtcat gatggcggaa agcaagctct tgaaactgtg 780
cagcggctgt tgcctgtact gtgtcaagcc cacgggctga caccggaaca agttgtagcg 840
atcgctagca acggcggagg taagcaagca ttggaaacgg ttcaggccct gttgcctgta 900
ctttgccagg cgcacggtct gacacctgag caggttgtcg ccatcgctag caacggaggt 960
gggaaacagg cacttgaaac tgtgcagagg cttctgccgg tgctgtgcca agcgcatggc 1020
cttacacccg agcaagtagt ggctattgcg agtcatgatg gaggcaagca agcgctggag 1080
actgtccaac gacttcttcc ggtcttgtgt caggcacatg gattgacccc tcaacaagtc 1140
gtggcgatag ctagcaacat cggaggcaaa caggccctgg agaccgtgca gcggttgttg 1200
cctgtgcttt gccaagccca cgggcttacg cctgagcaag tggtggcgat tgccagtaac 1260
aacgggggca aacaagcctt ggagacagtg caaaggctcc tgccagtgct ctgccaggct 1320
catggtttga cacccgaaca ggtagttgca atagcgagtc atgatggcgg aaagcaagct 1380
cttgaaactg tgcagcggct gttgcctgta ctgtgtcaag cccacgggct gacaccggaa 1440
caagttgtag cgatcgctag ccacgatggc gggaaacaag ctctggaaac ggtacagaga 1500
ctcctcccag tgctttgtca ggcacacggc ctcacgccag agcaggttgt cgccatcgcg 1560
tcaaacggtg gagggaaaca agcgctcgaa accgtgcaaa ggttgctccc cgttctctgt 1620
caggcgcacg gtcttacgcc acaacaggtg gtggcgattg catctaatgg aggcggacgc 1680
cctgccttgg agagcattgt ggcccagctg tccaggccgg accctgccct ggccgcgtta 1740
accaacgacc acctcgtcgc cttggcctgc ctcggcggac gtcctgcgct ggatgcagtg 1800
aaaaagggat tgccgcacgc gccggccttg atcaaaagaa ccaatcgccg tattcccgaa 1860
cgcacatccc atcgcgttgc cgaccacgcg caagtggttc gcgtgctggg ttttttccag 1920
tgccactccc acccagcgca agcatttgat gacgccatga cgcagttcgg gatgagc 1977
<210> 325
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 325
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
245 250 255
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
770 775 780
Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His
785 790 795 800
Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
805 810 815
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu
820 825 830
Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met
835 840 845
Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His
850 855 860
Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser
865 870 875 880
Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly
885 890 895
Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu
900 905 910
Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys
915 920 925
Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly
930 935 940
His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile
945 950 955 960
Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly
965 970 975
Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg
980 985 990
Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
995 1000
<210> 326
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 326
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val
340 345 350
Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His
515 520 525
Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
770 775 780
Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His
785 790 795 800
Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
805 810 815
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu
820 825 830
Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met
835 840 845
Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His
850 855 860
Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser
865 870 875 880
Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly
885 890 895
Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu
900 905 910
Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys
915 920 925
Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly
930 935 940
His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile
945 950 955 960
Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly
965 970 975
Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg
980 985 990
Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
995 1000
<210> 327
<211> 935
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 327
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Asn Asn Asn Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Asn Asn
515 520 525
Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Ala Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg Pro Ala Leu Glu
660 665 670
Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala Leu Ala Ala Leu
675 680 685
Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly Gly Arg Pro Ala
690 695 700
Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro Ala Leu Ile Lys
705 710 715 720
Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His Arg Val Ala Gly
725 730 735
Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu Leu Arg
740 745 750
His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile Glu Ile
755 760 765
Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val Met Glu
770 775 780
Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly Gly Ser
785 790 795 800
Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile Asp Tyr
805 810 815
Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn Leu Pro
820 825 830
Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn Gln Thr
835 840 845
Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr Pro Ser
850 855 860
Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe Lys Gly
865 870 875 880
Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn Cys Asn
885 890 895
Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu Met Ile
900 905 910
Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe Asn Asn
915 920 925
Gly Glu Ile Asn Phe Arg Ser
930 935
<210> 328
<211> 1003
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 328
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Arg Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr
35 40 45
Ser Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val
50 55 60
Ala Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His
65 70 75 80
Ile Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val
85 90 95
Lys Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala
100 105 110
Ile Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala
115 120 125
Leu Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp
130 135 140
Thr Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val
145 150 155 160
Glu Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
180 185 190
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
195 200 205
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
210 215 220
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
225 230 235 240
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
245 250 255
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
260 265 270
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
275 280 285
Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
290 295 300
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
305 310 315 320
Ile Ala Ser Asn Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
325 330 335
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
340 345 350
Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val
355 360 365
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
370 375 380
Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu
385 390 395 400
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
405 410 415
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
420 425 430
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
435 440 445
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
450 455 460
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
465 470 475 480
His Gly Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser His Asp Gly
485 490 495
Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys
500 505 510
Gln Ala His Gly Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser Asn
515 520 525
Gly Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val
530 535 540
Leu Cys Gln Ala His Gly Leu Thr Pro Ala Gln Val Val Ala Ile Ala
545 550 555 560
Asn Asn Asn Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg Leu Leu
565 570 575
Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Asp Gln Val Val Ala
580 585 590
Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu Glu Thr Val Gln Arg
595 600 605
Leu Leu Pro Val Leu Cys Gln Asp His Gly Leu Thr Pro Glu Gln Val
610 615 620
Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr Val
625 630 635 640
Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Asp
645 650 655
Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu
660 665 670
Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr
675 680 685
Pro Ala Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala
690 695 700
Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp His Gly
705 710 715 720
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
725 730 735
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
740 745 750
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
755 760 765
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
770 775 780
Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His
785 790 795 800
Arg Val Ala Gly Ser Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys
805 810 815
Ser Glu Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu
820 825 830
Leu Ile Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met
835 840 845
Lys Val Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His
850 855 860
Leu Gly Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser
865 870 875 880
Pro Ile Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly
885 890 895
Tyr Asn Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu
900 905 910
Glu Asn Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys
915 920 925
Val Tyr Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly
930 935 940
His Phe Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile
945 950 955 960
Thr Asn Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly
965 970 975
Gly Glu Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg
980 985 990
Lys Phe Asn Asn Gly Glu Ile Asn Phe Arg Ser
995 1000
<210> 329
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 329
gaccctgcct gctcct 16
<210> 330
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 330
cacctgcagc tgcccag 17
<210> 331
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 331
ggcccttgca gccgt 15
<210> 332
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 332
cagacgctgg cact 14
<210> 333
<211> 34
<212> PRT
<213> Xanthomonas sp.
<400> 333
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 334
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 334
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 335
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 335
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Gln Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 336
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 336
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Trp Ala Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 337
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 337
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Pro Ala Leu Glu Ala Val Trp Ala Lys Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 338
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 338
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 339
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 339
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Leu Phe Pro Asp Leu Cys Gln Asp
20 25 30
His Gly
<210> 340
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 340
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Arg Gln Asp
20 25 30
His Gly
<210> 341
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 341
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Gln Leu Pro Val Leu Arg Gly Ala
20 25 30
His Gly
<210> 342
<211> 400
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 342
ctcctgcctc cgctctactc actggtgttc atctttggtt ttgtgggcaa catgctggtc 60
atcctcatcc tgataaactg caaaaggctg aagagcatga ctgacatcta cctgctcaac 120
ctggccatct ctgacctgtt tttccttctt actgtcccct tctgggctca ctatgctgcc 180
gcccagtggg actttggaaa gatggccgcg aattcgccct taatgatacg gcgaccaccg 240
agatctacac tctttcccta cacgacgctc ttccgatctg gagccatctg gccgggttgg 300
ctggttataa ccgcgcagat tctgttcacg ggactcagag ttgaagctcc tctcccttcc 360
gaacagctcc gcgcaccgcc ccgcgacgca gcccggcgca 400
<210> 343
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 343
cgcggagcca tctggccggg ttggctggtt ataaccgcgc agattctgtt cacgggactc 60
agagttgaag c 71
<210> 344
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 344
cgcggagcca tctggccggg ttggctgata accgcgcaga ttctgttcac gggactcaga 60
gttgaagc 68
<210> 345
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 345
cgcggagcca tctggccggg ttggctgtaa ccgcgcagat tctgttcacg ggactcagag 60
ttgaagc 67
<210> 346
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 346
cgcggagcca tctggccggg ttggttataa ccgcgcagat tctgttcacg ggactcagag 60
ttgaagc 67
<210> 347
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 347
cgcggagcca tctggttata accgcgcaga ttctgttcac gggactcaga gttgaagc 58
<210> 348
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 348
cgcggagcca tctggccggg ttggcgcaga ttctgttcac gggactcaga gttgaagc 58
<210> 349
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 349
cgcggagcca tctggccgcg cagattctgt tcacgggact cagagttgaa gc 52
<210> 350
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 350
cgcggagcca tctggccggg acgggactca gagttgaagc 40
<210> 351
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 351
gcggagccat ctggccgggt tggctggtta taaccgcgca gattctgttc ac 52
<210> 352
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 352
ctgggtacgg atccaagctt cgtcgaccta gcc 33
<210> 353
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 353
gcggagccat ctggccgggt tggctggtta taaccgcgca gattctgttc ac 52
<210> 354
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 354
tggtgtacgg atccaagctt cgtcgaccta gcc 33
<210> 355
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 355
atccaagctt cgtcgaccta gccctggtta taaccgcgca gattctgtt 49
<210> 356
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 356
atccaagctt cgtcgaccta gccctggtta taaccgcgca gattctgtt 49
<210> 357
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 357
atccaagctt cgtcgaccta gccgcgcaga ttctgtt 37
<210> 358
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 358
atccaagctt cgtcgaccta gcctggttat aaccgcgcag attctgtt 48
<210> 359
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 359
atccaagctt cgtcgaccta gcctggttaa ccgcgcagat tctgtt 46
<210> 360
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 360
atccaagctt cgtcgaccta gcctggtata accgcgcaga ttctgtt 47
<210> 361
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 361
atccaagctt cgtcgaccta gcctggtgta cgcagattct gtt 43
<210> 362
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 362
atccaagctt cgtcgacctg gttataaccg cgcagattct gtt 43
<210> 363
<211> 137
<212> PRT
<213> Xanthomonas sp.
<400> 363
Met Val Asp Leu Arg Thr Leu Gly Tyr Ser Gln Gln Gln Gln Glu Lys
1 5 10 15
Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu
20 25 30
Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His
35 40 45
Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala
50 55 60
Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln
65 70 75 80
Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu
85 90 95
Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile
100 105 110
Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg
115 120 125
Asn Ala Leu Thr Gly Ala Pro Leu Asn
130 135
<210> 364
<211> 121
<212> PRT
<213> Xanthomonas sp.
<400> 364
Ile Lys Pro Lys Val Arg Ser Thr Val Ala Gln His His Glu Ala Leu
1 5 10 15
Val Gly His Gly Phe Thr His Ala His Ile Val Ala Leu Ser Gln His
20 25 30
Pro Ala Ala Leu Gly Thr Val Ala Val Lys Tyr Gln Asp Met Ile Ala
35 40 45
Ala Leu Pro Glu Ala Thr His Glu Ala Ile Val Gly Val Gly Lys Gln
50 55 60
Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu Leu Thr Val Ala Gly Glu
65 70 75 80
Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr Gly Gln Leu Leu Lys Ile
85 90 95
Ala Lys Arg Gly Gly Val Thr Ala Val Glu Ala Val His Ala Trp Arg
100 105 110
Asn Ala Leu Thr Gly Ala Pro Leu Asn
115 120
<210> 365
<211> 72
<212> PRT
<213> Xanthomonas sp.
<400> 365
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
1 5 10 15
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
20 25 30
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
35 40 45
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
50 55 60
Ala Leu Ile Lys Arg Thr Asn Arg
65 70
<210> 366
<211> 41
<212> PRT
<213> Xanthomonas sp.
<400> 366
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
1 5 10 15
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
20 25 30
Leu Ala Ala Leu Thr Asn Asp His Leu
35 40
<210> 367
<211> 121
<212> PRT
<213> Ralstonia sp.
<400> 367
Leu Lys Gln Glu Ser Leu Ala Glu Val Ala Lys Tyr His Ala Thr Leu
1 5 10 15
Ala Gly Gln Gly Phe Thr His Ala Asp Ile Cys Arg Ile Ser Arg Arg
20 25 30
Trp Gln Ser Leu Arg Val Val Ala Asn Asn Tyr Pro Glu Leu Met Ala
35 40 45
Ala Leu Pro Arg Leu Thr Thr Ala Gln Ile Val Asp Ile Ala Arg Gln
50 55 60
Arg Ser Gly Asp Leu Ala Leu Gln Ala Leu Leu Pro Val Ala Ala Ala
65 70 75 80
Leu Thr Ala Ala Pro Leu Gly Leu Ser Ala Ser Gln Ile Ala Thr Val
85 90 95
Ala Gln Tyr Gly Glu Arg Pro Ala Ile Gln Ala Leu Tyr Arg Leu Arg
100 105 110
Arg Lys Leu Thr Arg Ala Pro Leu Gly
115 120
<210> 368
<211> 40
<212> PRT
<213> Ralstonia sp.
<400> 368
Leu Ser Ile Ala Gln Val Ile Ala Ile Ala Cys Ile Gly Gly Arg Gln
1 5 10 15
Ala Leu Thr Ala Ile Glu Met His Met Leu Ala Leu Arg Ala Ala Pro
20 25 30
Tyr Asn Leu Ser Pro Glu Arg Val
35 40
<210> 369
<211> 119
<212> PRT
<213> Xanthomonas campestris
<400> 369
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
1 5 10 15
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
20 25 30
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
35 40 45
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
50 55 60
Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His
65 70 75 80
Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly Phe Phe Gln
85 90 95
Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met Thr Gln Phe
100 105 110
Gly Met Ser Arg His Gly Leu
115
<210> 370
<211> 15
<212> DNA
<213> Homo sapiens
<400> 370
gctggtcatc ctcat 15
<210> 371
<211> 15
<212> DNA
<213> Homo sapiens
<400> 371
ggtcatcctc atcct 15
<210> 372
<211> 15
<212> DNA
<213> Homo sapiens
<400> 372
catcctcatc ctgat 15
<210> 373
<211> 17
<212> DNA
<213> Homo sapiens
<400> 373
cctcatcctg ataaact 17
<210> 374
<211> 73
<212> DNA
<213> Homo sapiens
<400> 374
tggttttgtg ggcaacatgc tggtcatcct catcctgata aactgcaaaa ggctgaagag 60
catgactgac atc 73
<210> 375
<211> 73
<212> DNA
<213> Homo sapiens
<400> 375
gatgtcagtc atgctcttca gccttttgca gtttatcagg atgaggatga ccagcatgtt 60
gcccacaaaa cca 73
<210> 376
<211> 15
<212> DNA
<213> Homo sapiens
<400> 376
gctcttcagc ctttt 15
<210> 377
<211> 13
<212> DNA
<213> Homo sapiens
<400> 377
gctcttcagc ctt 13
<210> 378
<211> 15
<212> DNA
<213> Homo sapiens
<400> 378
catgctcttc agcct 15
<210> 379
<211> 14
<212> DNA
<213> Homo sapiens
<400> 379
gtcagtcatg ctct 14
<210> 380
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 380
ttcctgccca gctccatttc cttctcctgg aactaccaga acaacactga a 51
<210> 381
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 381
ttcagtgttg ttctggtagt tccaggagaa ggaaatggag ctgggcagga a 51
<210> 382
<211> 17
<212> DNA
<213> Zea maize
<400> 382
ttatttgaag aaactat 17
<210> 383
<211> 15
<212> DNA
<213> Zea maize
<400> 383
ttatttgaag aaact 15
<210> 384
<211> 16
<212> DNA
<213> Zea maize
<400> 384
tttgaagaac tatatt 16
<210> 385
<211> 59
<212> DNA
<213> Zea maize
<400> 385
ttatttgaag aaactatatt acagagcata agcttatgca acactcccac tagttgatt 59
<210> 386
<211> 59
<212> DNA
<213> Zea maize
<400> 386
aatcaactag tgggagtgtt gcataagctt atgctctgta atatagtttc ttcaaataa 59
<210> 387
<211> 14
<212> DNA
<213> Zea maize
<400> 387
tgggagtgtt gcat 14
<210> 388
<211> 18
<212> DNA
<213> Zea maize
<400> 388
tggggaggag ggcgtgct 18
<210> 389
<211> 60
<212> DNA
<213> Zea maize
<400> 389
tggggaggag ggcgtgctgc gcgaaggaag gcgttaagag aggggcgtgg acgagcaagg 60
<210> 390
<211> 60
<212> DNA
<213> Zea maize
<400> 390
ccttgctcgt ccacgcccct ctcttaacgc cttccttcgc gcagcacgcc ctcctcccca 60
<210> 391
<211> 17
<212> DNA
<213> Zea maize
<400> 391
tgaactacct ccggccc 17
<210> 392
<211> 18
<212> DNA
<213> Zea maize
<400> 392
tcctacgacg aggaggat 18
<210> 393
<211> 74
<212> DNA
<213> Zea maize
<400> 393
ctgaactacc tccggcccaa catcaggcgc ggcaacatct cctacgacga ggaggatctc 60
atgatcatcc gcct 74
<210> 394
<211> 74
<212> DNA
<213> Zea maize
<400> 394
aggcggatga tcatgagatc ctcctcgtcg taggagatgt tgccgcgcct gatgttgggc 60
cggaggtagt tcag 74
<210> 395
<211> 17
<212> DNA
<213> Zea maize
<400> 395
tcctcgtcgt aggagat 17
<210> 396
<211> 23
<212> DNA
<213> Zea maize
<400> 396
ccacaggctc ctcggcaaca ggt 23
<210> 397
<211> 23
<212> DNA
<213> Zea maize
<400> 397
acctgttgcc gaggagcctg tgg 23
<210> 398
<211> 16
<212> DNA
<213> Zea maize
<400> 398
ttgccgagga gcctgt 16
<210> 399
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MOD_RES
<222> (1)..(11)
<223> Any amino acid
<220>
<221> MOD_RES
<222> (12)..(13)
<223> Any amino acid and these positions are involved in DNA binding
<220>
<221> MOD_RES
<222> (14)..(35)
<223> Any amino acid and this region may encompass 20 to 22 residues
<400> 399
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa
35
<210> 400
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (1)..(1)
<223> Gly or Ser
<220>
<221> MOD_RES
<222> (2)..(22)
<223> Any amino acid and this region may encompass 19 to 21 residues
<400> 400
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa
20
<210> 401
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (1)..(4)
<223> Any amino acid and this region may encompass 3 to 4 residues
<220>
<221> MOD_RES
<222> (5)..(5)
<223> Ala or Thr
<220>
<221> MOD_RES
<222> (6)..(22)
<223> Any amino acid and this region may encompass 16 to 17 residues
<400> 401
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa
20
<210> 402
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<220>
<221> MOD_RES
<222> (1)..(5)
<223> Any amino acid and this region may encompass 4 to 5 residues
<220>
<221> MOD_RES
<222> (6)..(6)
<223> Leu or Val
<220>
<221> MOD_RES
<222> (7)..(22)
<223> Any amino acid and this region may encompass 15 to 16 residues
<400> 402
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa
20
<210> 403
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 403
Leu Thr Pro Asp Gln Val Ala Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 404
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 404
Leu Thr Pro Asp Gln Val Val Leu Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 405
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 405
Leu Thr Pro Asp Gln Val Val Thr Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 406
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 406
Leu Thr Pro Asp Gln Val Val Ala Ala Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 407
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 407
Leu Thr Pro Asp Gln Val Val Ala Val Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 408
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 408
Leu Thr Pro Asp Gln Val Val Ala Ile Leu Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 409
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 409
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ala His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 410
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 410
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Ala Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 411
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 411
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 412
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 412
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Ala Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 413
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 413
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Ala Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 414
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 414
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Arg Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 415
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 415
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Lys Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 416
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 416
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Trp Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 417
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 417
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 418
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 418
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Ala Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 419
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 419
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Gln Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 420
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 420
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Ala Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 421
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 421
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Ala Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 422
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 422
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Leu Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 423
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 423
Leu Thr Pro Asp Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 424
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 424
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 425
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 425
Leu Ser Thr Ala Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Ala Val Arg Ala Leu Leu Pro Val Leu Cys Gln Asp
20 25 30
His Gly
<210> 426
<211> 53
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 426
ctacactctt tccctacacg acgctcttcc gatctggagc ttgatcgacg aga 53
<210> 427
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 427
ctacactctt tccctacacg acgctcttcc gatctctgtg gaggcggatg at 52
<210> 428
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 428
ctacactctt tccctacacg acgctcttcc gatctactac ctccggccca ac 52
<210> 429
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 429
ctacactctt tccctacacg acgctcttcc gatctggccg ctgcagactc tatctcacc 59
<210> 430
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 430
ctacactctt tccctacacg acgctcttcc gatctttccg ctgcagactc tatctcacc 59
<210> 431
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 431
ctacactctt tccctacacg acgctcttcc gatctccggg ctgcagactc tatctcacc 59
<210> 432
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 432
ctacactctt tccctacacg acgctcttcc gatctaaccg ctgcagactc tatctcacc 59
<210> 433
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 433
ctacactctt tccctacacg acgctcttcc gatctccaag ctgcagactc tatctcacc 59
<210> 434
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 434
caagcagaag acggcatacg agctcttccg atctttccct ccatttgcct tc 52
<210> 435
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 435
caagcagaag acggcatacg agctcttccg atctgtgtgt gggtgcaggt tt 52
<210> 436
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 436
caagcagaag acggcatacg agctcttccg atcttcgtcg tcagctcgtg ta 52
<210> 437
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 437
caagcagaag acggcatacg agctcttccg atcttgccag gaacactttc ca 52
<210> 438
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 438
caagcagaag acggcatacg agctcttccg atcttgccag gaacactttc ca 52
<210> 439
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 439
caagcagaag acggcatacg agctcttccg atcttgccag gaacactttc ca 52
<210> 440
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 440
caagcagaag acggcatacg agctcttccg atcttgccag gaacactttc ca 52
<210> 441
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 441
caagcagaag acggcatacg agctcttccg atcttgccag gaacactttc ca 52
<210> 442
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 442
aatgatacgg cgaccaccga gatctacact ctttccctac acg 43
<210> 443
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 443
caagcagaag acggcata 18
<210> 444
<211> 8152
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 444
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc 240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta 300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc 360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa 420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg 480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa 540
aacgacggcc agtcttaagc tcgggcccca aataatgatt ttattttgac tgatagtgac 600
ctgttcgttg caacaaattg atgagcaatg cttttttata atgccaactt tgtacaaaaa 660
agcaggctcc gaattcgccc ttttaattaa tgcagtgcag cgtgacccgg tcgtgcccct 720
ctctagagat aatgagcatt gcatgtctaa gttataaaaa attaccacat attttttttg 780
tcacacttgt ttgaagtgca gtttatctat ctttatacat atatttaaac tttactctac 840
gaataatata atctatagta ctacaataat atcagtgttt tagagaatca tataaatgaa 900
cagttagaca tggtctaaag gacaattgag tattttgaca acaggactct acagttttat 960
ctttttagtg tgcatgtgtt ctcctttttt tttgcaaata gcttcaccta tataatactt 1020
catccatttt attagtacat ccatttaggg tttagggtta atggttttta tagactaatt 1080
tttttagtac atctatttta ttctatttta gcctctaaat taagaaaact aaaactctat 1140
tttagttttt ttatttaata atttagatat aaaatagaat aaaataaagt gactaaaaat 1200
taaacaaata ccctttaaga aattaaaaaa actaaggaaa catttttctt gtttcgagta 1260
gataatgcca gcctgttaaa cgccgtcgac gagtctaacg gacaccaacc agcgaaccag 1320
cagcgtcgcg tcgggccaag cgaagcagac ggcacggcat ctctgtcgct gcctctggac 1380
ccctctcgag agttccgctc caccgttgga cttgctccgc tgtcggcatc cagaaattgc 1440
gtggcggagc ggcagacgtg agccggcacg gcaggcggcc tcctcctcct ctcacggcac 1500
cggcagctac gggggattcc tttcccaccg ctccttcgct ttcccttcct cgcccgccgt 1560
aataaataga caccccctcc acaccctctt tccccaacct cgtgttgttc ggagcgcaca 1620
cacacacaac cagatctccc ccaaatccac ccgtcggcac ctccgcttca aggtacgccg 1680
ctcgtcctcc cccccccccc ctctctacct tctctagatc ggcgttccgg tccatggtta 1740
gggcccggta gttctacttc tgttcatgtt tgtgttagat ccgtgtttgt gttagatccg 1800
tgctgctagc gttcgtacac ggatgcgacc tgtacgtcag acacgttctg attgctaact 1860
tgccagtgtt tctctttggg gaatcctggg atggctctag ccgttccgca gacgggatcg 1920
atttcatgat tttttttgtt tcgttgcata gggtttggtt tgcccttttc ctttatttca 1980
atatatgccg tgcacttgtt tgtcgggtca tcttttcatg cttttttttg tcttggttgt 2040
gatgatgtgg tctggttggg cggtcgttct agatcggagt agaattctgt ttcaaactac 2100
ctggtggatt tattaatttt ggatctgtat gtgtgtgcca tacatattca tagttacgaa 2160
ttgaagatga tggatggaaa tatcgatcta ggataggtat acatgttgat gcgggtttta 2220
ctgatgcata tacagagatg ctttttgttc gcttggttgt gatgatgtgg tgtggttggg 2280
cggtcgttca ttcgttctag atcggagtag aatactgttt caaactacct ggtgtattta 2340
ttaattttgg aactgtatgt gtgtgtcata catcttcata gttacgagtt taagatggat 2400
ggaaatatcg atctaggata ggtatacatg ttgatgtggg ttttactgat gcatatacat 2460
gatggcatat gcagcatcta ttcatatgct ctaaccttga gtacctatct attataataa 2520
acaagtatgt tttataatta ttttgatctt gatatacttg gatgatggca tatgcagcag 2580
ctatatgtgg atttttttag ccctgccttc atacgctatt tatttgcttg gtactgtttc 2640
ttttgtcgat gctcaccctg ttgtttggtg ttacttctgc aggactagtc cagtgtggtg 2700
gaattcgcca tggactacaa agaccatgac ggtgattata aagatcatga catcgattac 2760
aaggatgacg atgacaagat ggcccccaag aagaagagga aggtgggcat tcacggggta 2820
cctatggtgg acttgaggac actcggttat tcgcaacagc aacaggagaa aatcaagcct 2880
aaggtcagga gcaccgtcgc gcaacaccac gaggcgcttg tggggcatgg cttcactcat 2940
gcgcatattg tcgcgctttc acagcaccct gcggcgcttg ggacggtggc tgtcaaatac 3000
caagatatga ttgcggccct gcccgaagcc acgcacgagg caattgtagg ggtcggtaaa 3060
cagtggtcgg gagcgcgagc acttgaggcg ctgctgactg tggcgggtga gcttaggggg 3120
cctccgctcc agctcgacac cgggcagctg ctgaagatcg cgaagagagg gggagtaaca 3180
gcggtagagg cagtgcacgc ctggcgcaat gcgctcaccg gggccccctt gaacctgacc 3240
ccagaccagg tagtcgcaat cgcgtcgcat gacgggggaa agcaagccct ggaaaccgtg 3300
caaaggttgt tgccggtcct ttgtcaagac cacggcctta caccggagca agtcgtggcc 3360
attgcatcac atgacggtgg caaacaggct cttgagacgg ttcagagact tctcccagtt 3420
ctctgtcaag cccacgggct gactcccgat caagttgtag cgattgcgag caatggggga 3480
gggaaacaag cattggagac tgtccaacgg ctccttcccg tgttgtgtca agcccacggt 3540
ttgacgcctg cacaagtggt cgccatcgcc tccaatattg gcggtaagca ggcgctggaa 3600
acagtacagc gcctgctgcc tgtactgtgc caggatcatg gactcacccc agaccaggta 3660
gtcgcaatcg cgtcgcatga cgggggaaag caagccctgg aaaccgtgca aaggttgttg 3720
ccggtccttt gtcaagacca cggccttaca ccggatcaag tcgtggccat tgcaaataat 3780
aacggtggca aacaggctct tgagacggtt cagagacttc tcccagttct ctgtcaagcc 3840
cacgggctga ctcccgatca agttgtagcg attgcgagca acatcggagg gaaacaagca 3900
ttggagactg tccaacggct ccttcccgtg ttgtgtcaag cccacggttt gacgcctgca 3960
caagtggtcg ccatcgcctc ccacgacggc ggtaagcagg cgctggaaac agtacagcgc 4020
ctgctgcctg tactgtgcca ggatcatggg ctgaccccag accaggtagt cgcaatcgcc 4080
aacaataacg ggggaaagca agccctggaa accgtgcaaa ggttgttgcc ggtcctttgt 4140
caagaccacg gccttacacc ggagcaagtc gtggccattg catcaaatat cggtggcaaa 4200
caggctcttg agacggttca gagacttctc ccagttctct gtcaagccca cgggctgact 4260
cccgatcaag ttgtagcgat tgcgaataac aatggaggga aacaagcatt ggagactgtc 4320
caacggctcc ttcccgtgtt gtgtcaagcc cacggtttga cgcctgcaca agtggtcgcc 4380
atcgccaaca acaacggcgg taagcaggcg ctggaaacag tacagcgcct gctgcctgta 4440
ctgtgccagg atcatggttt gaccccagac caggtagtcg caatcgcgtc gaacattggg 4500
ggaaagcaag ccctggaaac cgtgcaaagg ttgttgccgg tcctttgtca agaccacggc 4560
cttacaccgg atcaagtcgt ggccattgca aataataacg gtggcaaaca ggctcttgag 4620
acggttcaga gacttctccc agttctctgt caagcccacg ggctgactcc cgatcaagtt 4680
gtagcgattg cgaataacaa tggagggaaa caagcattgg agactgtcca acggctcctt 4740
cccgtgttgt gtcaagccca cggtttgacg cctgcacaag tggtcgccat cgcctccaat 4800
attggcggta agcaggcgct ggaaacagta cagcgcctgc tgcctgtact gtgccaggat 4860
catggcctga cacccgaaca ggtggtcgcc attgctagca acgggggagg acggccagcc 4920
ttggagtcca tcgtagccca attgtccagg cccgatcccg cgttggctgc gttaacgaat 4980
gaccatctgg tggcgttggc atgtcttggt ggacgacccg cgctcgatgc agtcaaaaag 5040
ggtctgcctc atgctcccgc attgatcaaa agaaccaacc ggcggattcc cgagagaact 5100
tcccatcgag tcgcgggatc ccagctggtt aaatcagaac tcgaagaaaa aaagagcgag 5160
ctgcggcata aactcaaata tgtccctcat gagtacatag aactgattga aatcgcccgc 5220
aattccaccc aggatcggat tcttgaaatg aaagtgatgg aattttttat gaaagtttac 5280
ggctatcgcg ggaagcacct tggggggtcg cggaagccgg acggtgctat ttacactgtc 5340
ggttccccga tcgattatgg cgtaattgtt gacacgaaag catattcggg tgggtataat 5400
cttcctattg gtcaggctga tgagatgcag cggtacgttg aagagaatca gacgcggaac 5460
aagcatatta acccaaatga gtggtggaag gtgtatccat catcggtcac cgaatttaag 5520
ttcttgtttg tgtcgggcca ctttaagggg aactacaagg cccaacttac caggttgaat 5580
cacataacca actgtaacgg agctgttctg tcagtagaag agctgttgat aggcggggaa 5640
atgattaaag caggtacatt aacgttggag gaagtacgcc gcaagtttaa taacggcgag 5700
attaacttta gatctgagac ctgataaaca aacacacggt ctcctcgagc tcgcagatcg 5760
ttcaacatct ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt 5820
atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg 5880
ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata 5940
gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta 6000
ctagatccga taagcttaag ggcgaattcg acccagcttt cttgtacaaa gttggcatta 6060
taaaaaataa ttgctcatca atttgttgca acgaacaggt cactatcagt caaaataaaa 6120
tcattatttg ccatccagct gatatcccct atagtgagtc gtattacatg gtcatagctg 6180
tttcctggca gctctggccc gtgtctcaaa atctctgatg ttacattgca caagataaaa 6240
atatatcatc atgcctcctc tagaccagcc aggacagaaa tgcctcgact tcgctgctgc 6300
ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagtggacat 6360
aagcctgttc ggttcgtaag ctgtaatgca agtagcgtat gcgctcacgc aactggtcca 6420
gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg 6480
actgtttttt tggggtacag tctatgcctc gggcatccaa gcagcaagcg cgttacgccg 6540
tgggtcgatg tttgatgtta tggagcagca acgatgttac gcagcagggc agtcgcccta 6600
aaacaaagtt aaacatcatg agggaagcgg tgatcgccga agtatcgact caactatcag 6660
aggtagttgg cgtcatcgag cgccatctcg aaccgacgtt gctggccgta catttgtacg 6720
gctccgcagt ggatggcggc ctgaagccac acagtgatat tgatttgctg gttacggtga 6780
ccgtaaggct tgatgaaaca acgcggcgag ctttgatcaa cgaccttttg gaaacttcgg 6840
cttcccctgg agagagcgag attctccgcg ctgtagaagt caccattgtt gtgcacgacg 6900
acatcattcc gtggcgttat ccagctaagc gcgaactgca atttggagaa tggcagcgca 6960
atgacattct tgcaggtatc ttcgagccag ccacgatcga cattgatctg gctatcttgc 7020
tgacaaaagc aagagaacat agcgttgcct tggtaggtcc agcggcggag gaactctttg 7080
atccggttcc tgaacaggat ctatttgagg cgctaaatga aaccttaacg ctatggaact 7140
cgccgcccga ctgggctggc gatgagcgaa atgtagtgct tacgttgtcc cgcatttggt 7200
acagcgcagt aaccggcaaa atcgcgccga aggatgtcgc tgccgactgg gcaatggagc 7260
gcctgccggc ccagtatcag cccgtcatac ttgaagctag acaggcttat cttggacaag 7320
aagaagatcg cttggcctcg cgcgcagatc agttggaaga atttgtccac tacgtgaaag 7380
gcgagatcac caaggtagtc ggcaaataac cctcgagcca cccatgacca aaatccctta 7440
acgtgagtta cgcgtcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 7500
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 7560
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 7620
tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact 7680
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 7740
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 7800
aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 7860
cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg cttcccgaag 7920
ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 7980
agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 8040
ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 8100
acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg tt 8152
<210> 445
<211> 17
<212> DNA
<213> Homo sapiens
<400> 445
tcattacacc tgcagct 17
<210> 446
<211> 17
<212> DNA
<213> Homo sapiens
<400> 446
acacctgcag ctctcat 17
<210> 447
<211> 77
<212> DNA
<213> Homo sapiens
<400> 447
aaaaagaagg tcttcattac acctgcagct ctcattttcc atacagtcag tatcaattct 60
ggaagaattt ccagaca 77
<210> 448
<211> 77
<212> DNA
<213> Homo sapiens
<400> 448
tgtctggaaa ttcttccaga attgatactg actgtatgga aaatgagagc tgcaggtgta 60
atgaagacct tcttttt 77
<210> 449
<211> 13
<212> DNA
<213> Homo sapiens
<400> 449
tgatactgac tgt 13
<210> 450
<211> 17
<212> DNA
<213> Homo sapiens
<400> 450
cttccagaat tgatact 17
<210> 451
<211> 83
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 451
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Arg
1 5 10 15
Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro Asp Pro Ala
20 25 30
Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala Cys Leu Gly
35 40 45
Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro His Ala Pro
50 55 60
Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg Thr Ser His
65 70 75 80
Arg Val Ala
<210> 452
<211> 400
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 452
tgcgccgggc tgcgtcgcgg ggcggtgcgc ggagctgttc ggaagggaga ggagcttcaa 60
ctctgagtcc cgtgaacaga atctgcgcgg ttataaccag ccaacccggc cagatggctc 120
cagatcggaa gagcgtcgtg tagggaaaga gtgtagatct cggtggtcgc cgtatcatta 180
agggcgaatt cgcggccatc tttccaaagt cccactgggc ggcagcatag tgagcccaga 240
aggggacagt aagaaggaaa aacaggtcag agatggccag gttgagcagg tagatgtcag 300
tcatgctctt cagccttttg cagtttatca ggatgaggat gaccagcatg ttgcccacaa 360
aaccaaagat gaacaccagt gagtagagcg gaggcaggag 400
<210> 453
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 453
ggaggcaaga agatggattc 20
<210> 454
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 454
gaatcggcac atgcagatct 20
<210> 455
<211> 14
<212> DNA
<213> Homo sapiens
<400> 455
tttgtgggca acat 14
<210> 456
<211> 17
<212> DNA
<213> Homo sapiens
<400> 456
tttgtgggca acatgct 17
<210> 457
<211> 14
<212> DNA
<213> Homo sapiens
<400> 457
tgctcttcag cctt 14
<210> 458
<211> 16
<212> DNA
<213> Homo sapiens
<400> 458
tcatgctctt cagcct 16
<210> 459
<211> 15
<212> DNA
<213> Homo sapiens
<400> 459
tgtcagtcat gctct 15
<210> 460
<211> 17
<212> DNA
<213> Homo sapiens
<400> 460
tagatgtcag tcatgct 17
<210> 461
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<220>
<221> MOD_RES
<222> (2)..(2)
<223> Thr or unknown amino acid
<220>
<221> MOD_RES
<222> (3)..(3)
<223> Pro or Leu
<220>
<221> MOD_RES
<222> (4)..(4)
<223> Asp, Ala, Glu, or unknown amino acid
<220>
<221> MOD_RES
<222> (8)..(8)
<223> Ala or unknown amino acid
<220>
<221> MOD_RES
<222> (11)..(11)
<223> Ser or Asn
<220>
<221> MOD_RES
<222> (12)..(12)
<223> Asn or His
<220>
<221> MOD_RES
<222> (13)..(13)
<223> Asp, Gly, Ile, Asn, or Ser
<220>
<221> MOD_RES
<222> (15)..(15)
<223> Gly or unknown amino acid
<220>
<221> MOD_RES
<222> (22)..(22)
<223> Val or unknown amino acid
<220>
<221> MOD_RES
<222> (24)..(24)
<223> Arg or unknown amino acid
<220>
<221> MOD_RES
<222> (31)..(31)
<223> Gln or unknown amino acid
<220>
<221> MOD_RES
<222> (32)..(32)
<223> Asp, Ala, or unknown amino acid
<400> 461
Leu Xaa Xaa Xaa Gln Val Val Xaa Ile Ala Xaa Xaa Xaa Gly Xaa Lys
1 5 10 15
Gln Ala Leu Glu Thr Xaa Gln Xaa Leu Leu Pro Val Leu Cys Xaa Xaa
20 25 30
His Gly
<210> 462
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 462
gtcttcatta cacctgcagc tctcattttc catacagtca gtatcaattc tggaagaatt 60
tccagacatt 70
<210> 463
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 463
aatgtctgga aattcttcca gaattgatac tgactgtatg gaaaatgaga gctgcaggtg 60
taatgaagac 70
<210> 464
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 464
Ser Gly Gly Ser
1
<210> 465
<211> 18
<212> DNA
<213> Zea maize
<400> 465
tgaactagtg ggagtgtt 18
<210> 466
<211> 18
<212> DNA
<213> Zea maize
<400> 466
tcgtccacgc ccctctct 18
<210> 467
<211> 70
<212> DNA
<213> Zea maize
<400> 467
gagcgcgatg gggaggaggg cgtgctgcgc gaaggaaggc gttaagagag gggcgtggac 60
gagcaaggag 70
<210> 468
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 468
gagcgcgatg gggaggaggg cgtgctgcgc gacgttaaga gaggggcgtg gacgagcaag 60
gag 63
<210> 469
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 469
gagcgcgatg gggaggaggg cgtgctgcgc gaaggagcgt taagagaggg gcgtggacga 60
gcaaggag 68
<210> 470
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 470
gagcgcgatg gggaggaggg cgtgctgcgc gaaaggcgtt aagagagggg cgtggacgag 60
caaggag 67
<210> 471
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 471
gagcgcgatg gggaggaggg cgtgctgcgc gaggcgttaa gagaggggcg tggacgagca 60
aggag 65
<210> 472
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 472
gagcgcgatg gggaggaggg cgtgctgtgc gaaaggcgtt aagagagggg cgtggacgag 60
caaggag 67
<210> 473
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 473
gagcgcgatg gggaggaggg cgtgctgcgc gaaggcgtta agagaggggc gtggacgagc 60
aaggag 66
<210> 474
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 474
gagcgcgatg gggaggaggg cgtgcagcgc gaggcgttaa gagaggggcg tggacgagca 60
aggag 65
<210> 475
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 475
gagcgcgatg gggaggaagg cgttaagaga ggggcgtgga cgagcaagga g 51
<210> 476
<211> 70
<212> DNA
<213> Zea maize
<400> 476
gagatcctcc tcgtcgtagg agatgttgcc gcgcctgatg ttgggccgga ggtagttcag 60
ccaccgcagc 70
<210> 477
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 477
gagatcctcc tcgtcgtagg agatgttggg ccggaggtag ttcagccacc gcagc 55
<210> 478
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 478
gagatcctcc tcgtcgtagg agatgttgct gatgttgggc cggaggtagt tcagccaccg 60
cagc 64
<210> 479
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 479
gagatcctcc tcgtcgtagg agatgttgcc gcctgatgtt gggccggagg tagttcagcc 60
accgcagc 68
<210> 480
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 480
gagatcctcc tcgtcgtagg agatgttgcc gcctgatgtt gggccggagg tagttcagcc 60
accgcagc 68
<210> 481
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 481
gagatcctcc tcgtcgtagg agatgttgct gatgttgggc cgggggtagt tcagccaccg 60
cagc 64
<210> 482
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 482
gagatcctcc tcgtcgtagg agatgttggg ccggaggtag ttcagccacc gcagc 55
<210> 483
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 483
gagatcctcc tcgtcgtagg agatgttgcc gcgatgttgg gccggaggta gttcagccac 60
cgcagc 66
<210> 484
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 484
gagatcctcc tcgtcgtagg agatgttgcc tgatgttggg ccggaggtag ttcagccacc 60
gcagc 65
<210> 485
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 485
gagatcctcc tcgtcgtagg agatgttgcc ctgatgttgg gccggaggta gttcagccac 60
cgcagc 66
<210> 486
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 486
gagatcctcc tcgtcgtagg agatgttgcc gatgttgggc cggaggtagt tcagccaccg 60
cagc 64
<210> 487
<211> 70
<212> DNA
<213> Zea maize
<400> 487
ggcaacatct cctacgacga ggaggatctc atcatccgcc tccacaggct cctcggcaac 60
aggtcggtgc 70
<210> 488
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 488
ggcaacatct cctacgacga ggaggatctc atccctccac aggctcctcg gcaacaggtc 60
ggtgc 65
<210> 489
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 489
ggcaacatct cctacgacga ggaggatctc atcgcctcca caggctcctc ggcaacaggt 60
cggtgc 66
<210> 490
<211> 70
<212> DNA
<213> Zea maize
<400> 490
ctcggaagtt atttgaagaa actatattac agagcataag cttatgcaac actcccacta 60
gttcattttt 70
<210> 491
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 491
ctcggaagtt atttgaagaa actatattac agagcatata agcttatgca acactcccac 60
tagttcattt tt 72
<210> 492
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 492
ctcggaagtt atttgaagaa actatattaa gcttatgcaa cactcccact agttcatttt 60
t 61
<210> 493
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 493
ctcggaagtt atttgaagaa actatattac agagcaagct tatgcaacac tcccactagt 60
tcattttt 68
<210> 494
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 494
ctcggaagtt atttgaagaa actatattac agcttatgca acactcccac tagttcattt 60
tt 62
<210> 495
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 495
ctcggaagct tatgcaacac tcccactagt tcattttt 38
<210> 496
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 496
ctcggaagtt atttgaagaa actatatcaa cactcccact agttcatttt t 51
<210> 497
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 497
ctcggaagtt atttgaagaa actatattgc agcttatgca acactcccac tagttcattt 60
tt 62
<210> 498
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 498
ctcggaagtg gcataagctt atgcaacact cccactagtt cattttt 47
<210> 499
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 499
ctcggaagtt atttgaagaa acttatgcaa cactcccact agttcatttt t 51
<210> 500
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 500
ctcggaagtt atttgaagaa actatattac agagcaacac tcccactagt tcattttt 58
<210> 501
<211> 70
<212> DNA
<213> Zea maize
<400> 501
ctcggaagtt atttgaagaa actatattac agagcataag cttatgcaac actcccacta 60
gttcattttt 70
<210> 502
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 502
ctcggaagtt atttgaagaa actatattac aagcttatgc aacactccca ctagttcatt 60
ttt 63
<210> 503
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 503
ctcggaagtt atttgaagaa actatattac agaagcttat gcaacactcc cactagttca 60
ttttt 65
<210> 504
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 504
ctcggaagtt atttgaagaa actatattac agagcttatg caacactccc actagttcat 60
tttt 64
<210> 505
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 505
ctcggaagtt atttgaagaa actatattac agcataagct tatgcaacac tcccactagt 60
tcattttt 68
<210> 506
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 506
ctcggaagtt atttgaagaa actatattac agtaagctta tgcaacactc ccactagttc 60
attttt 66
<210> 507
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 507
ctcggaagtt atttgaagaa actatattac taagcttatg caacactccc actagttcat 60
tttt 64
<210> 508
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 508
ctcggaagtt atttgaagaa actatattac aaagcttatg caacactccc actagttcat 60
tttt 64
<210> 509
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 509
ctcggaagtt atttgaagaa actatattac agataagctt atgcaacact cccactagtt 60
cattttt 67
<210> 510
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 510
ctcggaagct tatgcaacac tcccactagt tcattttt 38
<210> 511
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 511
ctcggaagtt atttgaagaa actatattaa aagcttatgc aacactccca ctagttcatt 60
ttt 63
<210> 512
<211> 70
<212> DNA
<213> Zea maize
<400> 512
ctcggaagtt atttgaagaa actatattac agagcataag cttatgcaac actcccacta 60
gttcattttt 70
<210> 513
<211> 58
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 513
ctcggaagtt atttgaagaa actatattac catgcaacac tcccactagt tcattttt 58
<210> 514
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 514
ctcggaagtt atttgaagaa actatattta tgcaacactc ccactagttc attttt 56
<210> 515
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 515
ctcggaagtt atttgaagaa actatattac cttatgcaac actcccacta gttcattttt 60
<210> 516
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 516
ctcggaagtt atttgaagaa actatatgca acactcccac tagttcattt tt 52
<210> 517
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 517
ctcggaagtt atttgaagaa actatattat gcaacactcc cactagttca ttttt 55
<210> 518
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 518
ctcggaagtt atttgaagaa actatattac atatgcaaca ctcccactag ttcattttt 59
<210> 519
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 519
ctcggaagtt atttgaagaa actatattac agagcatact tatgcaacac tcccactagt 60
tcattttt 68
<210> 520
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 520
ctcggaagtt atttgaagaa actatattac agatgcaaca ctcccactag ttcattttt 59
<210> 521
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 521
ctcggaagtt atttgaagaa actatattac agagcatatt atgcaacact cccactagtt 60
cattttt 67
<210> 522
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 522
ctcggaagtt atttgaagaa actatattac aatatgcaac actcccacta gttcattttt 60
<210> 523
<211> 70
<212> DNA
<213> Zea maize
<400> 523
ctcggaagtt atttgaagaa actatattac agagcataag cttatgcaac actcccacta 60
gttcattttt 70
<210> 524
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 524
ctcggaagtt atttgaagaa actatattac agagagctta tgcaacactc ccactagttc 60
attttt 66
<210> 525
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 525
ctcggaagtt atttgaagaa actatattac agaagcttat gcaacactcc cactagttca 60
ttttt 65
<210> 526
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 526
ctcggaagtt atttgaagaa actatattac agagcttatg caacactccc actagttcat 60
tttt 64
<210> 527
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 527
ctcggaagtt atttgaagaa actatattac agagaagctt atgcaacact cccactagtt 60
cattttt 67
<210> 528
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 528
ctcggaagtt atttgaagaa actatattac agagcagctt atgcaacact cccactagtt 60
cattttt 67
<210> 529
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 529
ctcggaagtt atttgaagaa actatattac agagcaagct tatgcaacac tcccactagt 60
tcattttt 68
<210> 530
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 530
ctcggaagtt atttgaagaa actatattac agaaagctta tgcaacactc ccactagttc 60
attttt 66
<210> 531
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 531
ctcggaagct tatgcaacac tcccactagt tcattttt 38
<210> 532
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 532
ctcggaagtt atttgaagaa actatattac agagcgctta tgcaacactc ccactagttc 60
attttt 66
<210> 533
<211> 65
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 533
ctcggaagtt atttgaagaa actatattac agaggcttat gcaacactcc cactagttca 60
ttttt 65
<210> 534
<211> 70
<212> DNA
<213> Zea maize
<400> 534
ctcggaagtt atttgaagaa actatattac agagcataag cttatgcaac actcccacta 60
gttcattttt 70
<210> 535
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 535
ctcggaagtt atttgaagaa actatattac agagcttatg caacactccc actagttcat 60
tttt 64
<210> 536
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 536
ctcggaagtt atttgaagaa actatattac agagcaagct tatgcaacac tcccactagt 60
tcattttt 68
<210> 537
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 537
ctcggaagtt atttgaagaa actatattac agagcagctt atgcaacact cccactagtt 60
cattttt 67
<210> 538
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 538
ctcggaagtt atttgaagaa actatattac agagcgctta tgcaacactc ccactagttc 60
attttt 66
<210> 539
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 539
ctcggaagtt atttgaagaa actatattac agagcactta tgcaacactc ccactagttc 60
attttt 66
<210> 540
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 540
ctcggaagtt atttgaagaa actatattac agtatgcaac actcccacta gttcattttt 60
<210> 541
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 541
ctcggaagtt atttgaagaa actatattac agagctatgc aacactccca ctagttcatt 60
ttt 63
<210> 542
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 542
ctcggaagtt atttgaagaa actatattac agatatgcaa cactcccact agttcatttt 60
t 61
<210> 543
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 543
ctcggaagtt atttgaagaa actatattat gcaacactcc cactagttca ttttt 55
<210> 544
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 544
ctcggaagtt atttgaagaa acttatgcaa cactcccact agttcatttt t 51
<210> 545
<211> 74
<212> DNA
<213> Homo sapiens
<400> 545
gttttgtggg caacatgctg gtcatcctca tcctgataaa ctgcaaaagg ctgaagagca 60
tgactgacat ctac 74
<210> 546
<211> 74
<212> DNA
<213> Homo sapiens
<400> 546
gtagatgtca gtcatgctct tcagcctttt gcagtttatc aggatgagga tgaccagcat 60
gttgcccaca aaac 74
<210> 547
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 547
tataaatacc ttct 14
<210> 548
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 548
tggagccatc tggccgggt 19
<210> 549
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 549
tgaacagaat ctgcgcggt 19
<210> 550
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 550
gtgaacagaa tctgcgcggt tataaccagc caacccggcc agatggctcc gc 52
<210> 551
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 551
ccagggctag gtcgacgaag cttggatccg tac 33
<210> 552
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 552
gtgaacagaa tctgcgcggt tataaccagc caacccggcc agatggctcc gc 52
<210> 553
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 553
accaggctag gtcgacgaag cttggatccg tac 33
<210> 554
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 554
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Ala Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
<210> 555
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 555
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Asn Gly Gly Gly Lys
1 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 30
His Gly
Claims (21)
- 적어도 하나의 TALE-반복 단위;
N-캡 폴리펩타이드; 및
TALE 단백질의 단편을 포함하는 C-캡 폴리펩타이드
를 포함하는, 단리된 비-천연 발생 DNA 결합 폴리펩타이드. - 청구항 1에 있어서, 적어도 하나의 TALE-반복 단위는 비전형적인 반복 가변 2잔기 (RVD)를 포함하는, 단리된 폴리펩타이드.
- 청구항 2에 있어서, 상기 단백질은 표 27에서 보여진 비전형적인 RVD를 포함하는, 폴리펩타이드.
- 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 C-캡 폴리펩타이드는 그 길이가 대략 230개 미만의 아미노산인, 폴리펩타이드.
- 청구항 1 내지 5 중 어느 한 항에 있어서, 상기 C-캡은 TALE 반복 도메인을 포함하는, 폴리펩타이드.
- 청구항 1 내지 5 중 어느 한 항의 폴리펩타이드, 및 적어도 하나의 기능적 도메인을 포함하는, 융합 단백질.
- 청구항 6에 있어서, 상기 기능적 도메인은 전사 활성제 또는 전사 억제제인, 융합 단백질.
- 청구항 7 에 있어서, 상기 기능적 도메인은 뉴클레아제를 포함하는, 융합 단백질.
- 청구항 8에 있어서, 상기 뉴클레아제는 TypeIIS 엔도뉴클레아제로부터의 적어도 하나의 절단 도메인 또는 절단 반-도메인을 포함하는, 융합 단백질.
- 청구항 1 내지 5 중 어느 한 항에 따른 폴리펩타이드 또는 청구항 6 내지 9 중 어느 한 항에 따른 융합 단백질을 인코딩하는, 폴리뉴클레오타이드.
- 청구항 1 내지 5 중 어느 한 항에 따른 폴리펩타이드, 청구항 6 내지 9 중 어느 한 항에 따른 융합 단백질 또는 청구항 10에 따른 폴리뉴클레오타이드를 포함하는, 숙주세포.
- 청구항 1 내지 5 중 어느 한 항에 따른 폴리펩타이드, 청구항 6 내지 9 중 어느 한 항에 따른 융합 단백질 또는 청구항 10에 따른 폴리뉴클레오타이드를 포함하는 약제학적 조성물.
- 세포에서 내인성 유전자의 발현을 조절하는 방법으로서,
상기 방법은 청구항 6 내지 9 중 어느 한 항에 따른 융합 단백질 또는 상기 융합 단백질을 인코딩하는 폴리뉴클레오타이드를 상기 세포에 도입하는 것을 포함하며, 상기 융합 단백질은 내인성 유전자에서 표적 부위에 결합하는 TALE-반복 도메인을 포함하고, 또한 내인성 유전자의 발현이 조절되는, 방법. - 청구항 13에 있어서, 상기 조절은 유전자 활성화를 포함하는, 방법.
- 청구항 13에 있어서, 상기 조절은 유전자 억제 또는 불활성화를 포함하는, 방법.
- 청구항 15에 있어서, 상기 융합 단백질은 절단 도메인 또는 절단 반-도메인을 포함하고, 상기 내인성 유전자는 절단에 의해 불활성화되는, 방법.
- 청구항 16에 있어서, 불활성화는 비-상동 말단 연결 (NHEJ)을 통해 일어나는, 방법.
- 세포의 게놈에서 관심 영역을 변형시키는 방법으로서,
상기 방법은 청구항 8 또는 9에 따른 적어도 하나의 융합 단백질 또는 상기 융합 단백질을 인코딩하는 폴리뉴클레오타이드를 세포에 도입하는 것을 포함하며, 상기 융합 단백질은 세포의 게놈에서 표적 부위에 결합하는 TALE-반복 도메인을 포함하고, 상기 융합 단백질은 관심 영역에서 게놈을 절단하는, 방법. - 청구항 18에 있어서, 상결 변형은 관심 영역에서 결실을 도입하는 것을 포함하는, 방법.
- 청구항 18에 있어서, 상기 변형은 외인성 핵산을 관심 영역에 도입하는 것을 포함하며, 상기 방법은 상기 외인성 핵산을 세포에 도입하는 것을 추가로 포함하며, 상기 외인성 핵산은 상동 재조합 또는 NHEJ 매개된 말단 포획에 의해 관심 영역에 통합되는, 방법.
- 청구항 13 내지 20 중 어느 한 항에 있어서, 상기 세포는 식물 세포, 동물 세포, 물고기 세포 및 효모 세포로 이루어진 그룹으로부터 선택된 원핵세포인 방법.
Applications Claiming Priority (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US39583610P | 2010-05-17 | 2010-05-17 | |
US61/395,836 | 2010-05-17 | ||
US40142910P | 2010-08-12 | 2010-08-12 | |
US61/401,429 | 2010-08-12 | ||
US45512110P | 2010-10-13 | 2010-10-13 | |
US61/455,121 | 2010-10-13 | ||
US201061459891P | 2010-12-20 | 2010-12-20 | |
US61/459,891 | 2010-12-20 | ||
US201161462482P | 2011-02-02 | 2011-02-02 | |
US61/462,482 | 2011-02-02 | ||
US201161465869P | 2011-03-24 | 2011-03-24 | |
US61/465,869 | 2011-03-24 | ||
PCT/US2011/000885 WO2011146121A1 (en) | 2010-05-17 | 2011-05-17 | Novel dna-binding proteins and uses thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130111219A true KR20130111219A (ko) | 2013-10-10 |
KR101953237B1 KR101953237B1 (ko) | 2019-02-28 |
Family
ID=44991974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020127032393A KR101953237B1 (ko) | 2010-05-17 | 2011-05-17 | 신규 dna 결합 단백질 및 이의 용도 |
Country Status (9)
Country | Link |
---|---|
US (8) | US8586526B2 (ko) |
EP (2) | EP2571512B1 (ko) |
JP (2) | JP6208580B2 (ko) |
KR (1) | KR101953237B1 (ko) |
CN (1) | CN103025344B (ko) |
AU (1) | AU2011256838B2 (ko) |
CA (1) | CA2798988C (ko) |
IL (1) | IL222961B (ko) |
WO (1) | WO2011146121A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170002542A (ko) * | 2014-05-07 | 2017-01-06 | 어드밴스드 진 앤드 셀 테크놀로지스 엘엘씨 (에이쥐씨티 엘엘씨) | Hiv 공동 수용체 ccr5의 표적화된 녹아웃을 위한 tal 이펙터 뉴클레아제 |
Families Citing this family (579)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120196370A1 (en) | 2010-12-03 | 2012-08-02 | Fyodor Urnov | Methods and compositions for targeted genomic deletion |
EP2206723A1 (en) | 2009-01-12 | 2010-07-14 | Bonas, Ulla | Modular DNA-binding domains |
US20110239315A1 (en) | 2009-01-12 | 2011-09-29 | Ulla Bonas | Modular dna-binding domains and methods of use |
US8772008B2 (en) * | 2009-05-18 | 2014-07-08 | Sangamo Biosciences, Inc. | Methods and compositions for increasing nuclease activity |
PT2564695E (pt) | 2009-07-08 | 2015-06-03 | Kymab Ltd | Modelos animais e moléculas terapêuticas |
US9445581B2 (en) | 2012-03-28 | 2016-09-20 | Kymab Limited | Animal models and therapeutic molecules |
PL2816112T3 (pl) | 2009-12-10 | 2019-03-29 | Regents Of The University Of Minnesota | Modyfikacja DNA za pośrednictwem efektorów TAL |
PT2534173T (pt) | 2010-02-08 | 2019-10-31 | Sangamo Therapeutics Inc | Semidomínios de clivagem manipulados |
CA2788850C (en) * | 2010-02-09 | 2019-06-25 | Sangamo Biosciences, Inc. | Targeted genomic modification with partially single-stranded donor molecules |
BR112012020257A8 (pt) * | 2010-02-11 | 2018-02-14 | Recombinetics Inc | métodos e aparelhos para produzir artiodátilos transgênicos |
US8771985B2 (en) | 2010-04-26 | 2014-07-08 | Sangamo Biosciences, Inc. | Genome editing of a Rosa locus using zinc-finger nucleases |
CA2798988C (en) | 2010-05-17 | 2020-03-10 | Sangamo Biosciences, Inc. | Tal-effector (tale) dna-binding polypeptides and uses thereof |
EP2392208B1 (en) * | 2010-06-07 | 2016-05-04 | Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) | Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use |
WO2012012667A2 (en) | 2010-07-21 | 2012-01-26 | Sangamo Biosciences, Inc. | Methods and compositions for modification of a hla locus |
EP2622090B1 (en) | 2010-09-27 | 2019-06-19 | Sangamo Therapeutics, Inc. | Compositions for inhibiting viral entry into cells |
WO2012051343A1 (en) | 2010-10-12 | 2012-04-19 | The Children's Hospital Of Philadelphia | Methods and compositions for treating hemophilia b |
US9267123B2 (en) | 2011-01-05 | 2016-02-23 | Sangamo Biosciences, Inc. | Methods and compositions for gene correction |
US10920242B2 (en) | 2011-02-25 | 2021-02-16 | Recombinetics, Inc. | Non-meiotic allele introgression |
US9528124B2 (en) * | 2013-08-27 | 2016-12-27 | Recombinetics, Inc. | Efficient non-meiotic allele introgression |
JP2014509195A (ja) * | 2011-02-25 | 2014-04-17 | リコンビネティクス・インコーポレイテッド | 遺伝子改変動物、およびそれを作製する方法 |
DK2694091T3 (da) * | 2011-04-05 | 2019-06-03 | Cellectis | Fremgangsmåde til fremstilling af kompakte tale-nukleaser og anvendelse heraf |
SG194583A1 (en) | 2011-04-22 | 2013-12-30 | Univ California | Adeno-associated virus virions with variant capsid and methods of use thereof |
WO2012168124A1 (en) | 2011-06-06 | 2012-12-13 | Bayer Cropscience Nv | Methods and means to modify a plant genome at a preselected site |
JP6214530B2 (ja) * | 2011-07-15 | 2017-10-18 | ザ ジェネラル ホスピタル コーポレイション | 転写活性化因子様エフェクターの組立て方法 |
WO2013066438A2 (en) | 2011-07-22 | 2013-05-10 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
EP2737063B1 (en) | 2011-07-25 | 2016-06-01 | Sangamo BioSciences, Inc. | Methods and compositions for alteration of a cystic fibrosis transmembrane conductance regulator (cftr) gene |
MX365219B (es) * | 2011-07-27 | 2019-05-27 | The Broad Inst Inc Star | Uso de una composición en un método para inhibir el crecimiento del carcinoma de células escamosas de cabeza y cuello (hnscc). |
CN103890181A (zh) | 2011-08-22 | 2014-06-25 | 拜尔作物科学公司 | 修饰植物基因组的方法和手段 |
JP2014533930A (ja) | 2011-09-19 | 2014-12-18 | カイマブ・リミテッド | 免疫グロブリン遺伝子多様性の操作およびマルチ抗体治療薬 |
ES2961613T3 (es) | 2011-09-21 | 2024-03-12 | Sangamo Therapeutics Inc | Métodos y composiciones para la regulación de la expresión transgénica |
EP2761008A1 (en) | 2011-09-26 | 2014-08-06 | Kymab Limited | Chimaeric surrogate light chains (slc) comprising human vpreb |
AU2012328682B2 (en) | 2011-10-27 | 2017-09-21 | Sangamo Therapeutics, Inc. | Methods and compositions for modification of the HPRT locus |
US9458205B2 (en) | 2011-11-16 | 2016-10-04 | Sangamo Biosciences, Inc. | Modified DNA-binding proteins and uses thereof |
JP6259766B2 (ja) * | 2011-11-18 | 2018-01-10 | ユニヴェルシテ ラヴァルUniversite Laval | フラタキシンレベルを増加させる方法および生成物ならびにその使用 |
US10801017B2 (en) | 2011-11-30 | 2020-10-13 | The Broad Institute, Inc. | Nucleotide-specific recognition sequences for designer TAL effectors |
US8450107B1 (en) | 2011-11-30 | 2013-05-28 | The Broad Institute Inc. | Nucleotide-specific recognition sequences for designer TAL effectors |
US20130137173A1 (en) * | 2011-11-30 | 2013-05-30 | Feng Zhang | Nucleotide-specific recognition sequences for designer tal effectors |
US9253965B2 (en) | 2012-03-28 | 2016-02-09 | Kymab Limited | Animal models and therapeutic molecules |
RU2624139C2 (ru) * | 2011-12-05 | 2017-06-30 | Фэктор Байосайенс Инк. | Способы и препараты для трансфекции клеток |
CA3226329A1 (en) | 2011-12-16 | 2013-06-20 | Targetgene Biotechnologies Ltd | Compositions and methods for modifying a predetermined target nucleic acid sequence |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
WO2013102289A1 (zh) * | 2012-01-04 | 2013-07-11 | 清华大学 | 特异结合和靶定dna-rna 杂合双链的方法 |
WO2013102290A1 (zh) * | 2012-01-04 | 2013-07-11 | 清华大学 | 特异识别含有5-甲基化胞嘧啶的dna的方法 |
CN103193871B (zh) * | 2012-01-04 | 2018-05-15 | 清华大学 | 根据蛋白质-dna复合物晶体结构设计新型tale的方法 |
KR102084539B1 (ko) | 2012-02-29 | 2020-03-04 | 상가모 테라퓨틱스, 인코포레이티드 | 헌팅턴병을 치료하기 위한 방법 및 조성물 |
EP3141259B1 (en) * | 2012-03-15 | 2019-07-31 | Cellectis | Repeat variable diresidues for targeting nucleotides |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
GB2502127A (en) | 2012-05-17 | 2013-11-20 | Kymab Ltd | Multivalent antibodies and in vivo methods for their production |
US10251377B2 (en) | 2012-03-28 | 2019-04-09 | Kymab Limited | Transgenic non-human vertebrate for the expression of class-switched, fully human, antibodies |
US20130274129A1 (en) | 2012-04-04 | 2013-10-17 | Geneart Ag | Tal-effector assembly platform, customized services, kits and assays |
CA2871008C (en) | 2012-04-23 | 2022-11-22 | Bayer Cropscience Nv | Targeted genome engineering in plants |
PL2847335T3 (pl) | 2012-04-25 | 2019-01-31 | Regeneron Pharmaceuticals, Inc. | Celowanie dużymi wektorami do celowania wspomagane nukleazą |
WO2013163628A2 (en) | 2012-04-27 | 2013-10-31 | Duke University | Genetic correction of mutated genes |
US9738879B2 (en) | 2012-04-27 | 2017-08-22 | Duke University | Genetic correction of mutated genes |
JP6352250B2 (ja) | 2012-05-02 | 2018-07-04 | ダウ アグロサイエンシィズ エルエルシー | リンゴ酸デヒドロゲナーゼの標的改変 |
WO2013169802A1 (en) | 2012-05-07 | 2013-11-14 | Sangamo Biosciences, Inc. | Methods and compositions for nuclease-mediated targeted integration of transgenes |
DE202013012241U1 (de) | 2012-05-25 | 2016-01-18 | Emmanuelle Charpentier | Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription |
CN104718284A (zh) | 2012-05-25 | 2015-06-17 | 塞勒克提斯公司 | 工程化用于免疫疗法的异体和免疫抑制耐受性t细胞的方法 |
US20150017136A1 (en) * | 2013-07-15 | 2015-01-15 | Cellectis | Methods for engineering allogeneic and highly active t cell for immunotherapy |
US9890364B2 (en) | 2012-05-29 | 2018-02-13 | The General Hospital Corporation | TAL-Tet1 fusion proteins and methods of use thereof |
WO2013182910A2 (en) * | 2012-06-05 | 2013-12-12 | Cellectis | New transcription activator-like effector (tale) fusion protein |
BR112014031891A2 (pt) | 2012-06-19 | 2017-08-01 | Univ Minnesota | direcionamento genético nas plantas utilizando vírus de dna |
AR091482A1 (es) * | 2012-06-21 | 2015-02-04 | Recombinetics Inc | Celulas modificadas geneticamente y metodos par su obtencion |
US20140072961A1 (en) * | 2012-07-11 | 2014-03-13 | University of Nevada, Las Vegas | Method of Genome Surgery with Paired, Permeant Endonuclease Excision |
HUE051612T2 (hu) | 2012-07-11 | 2021-03-01 | Sangamo Therapeutics Inc | Eljárások és készítmények lizoszomális tárolási betegségek kezelésére |
EP2872154B1 (en) | 2012-07-11 | 2017-05-31 | Sangamo BioSciences, Inc. | Methods and compositions for delivery of biologics |
US10648001B2 (en) | 2012-07-11 | 2020-05-12 | Sangamo Therapeutics, Inc. | Method of treating mucopolysaccharidosis type I or II |
US20140230083A1 (en) | 2012-07-24 | 2014-08-14 | Cellectis | Modular base-specific nucleic acid binding domains from burkholderia rhizoxinica proteins |
ES2757623T3 (es) * | 2012-07-25 | 2020-04-29 | Broad Inst Inc | Proteínas de unión a ADN inducibles y herramientas de perturbación genómica y aplicaciones de las mismas |
US10058078B2 (en) | 2012-07-31 | 2018-08-28 | Recombinetics, Inc. | Production of FMDV-resistant livestock by allele substitution |
KR102474010B1 (ko) | 2012-08-29 | 2022-12-02 | 상가모 테라퓨틱스, 인코포레이티드 | 유전적 병태를 치료하기 위한 방법 및 조성물 |
EP2893022B1 (en) | 2012-09-04 | 2020-05-13 | The Scripps Research Institute | Chimeric polypeptides having targeted binding specificity |
EP3406715B1 (en) | 2012-09-07 | 2023-12-13 | Corteva Agriscience LLC | Fad3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks |
UA118090C2 (uk) * | 2012-09-07 | 2018-11-26 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив |
UA119135C2 (uk) | 2012-09-07 | 2019-05-10 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб отримання трансгенної рослини |
DK2906684T3 (da) | 2012-10-10 | 2020-09-28 | Sangamo Therapeutics Inc | T-celle-modificerende forbindelser og anvendelser deraf |
EP3789405A1 (en) | 2012-10-12 | 2021-03-10 | The General Hospital Corporation | Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins |
CN103772506A (zh) * | 2012-10-22 | 2014-05-07 | 北京唯尚立德生物科技有限公司 | 一种“转录激活子样效应因子-功能基团-雌激素受体”功能蛋白及其应用 |
ES2926021T3 (es) | 2012-10-23 | 2022-10-21 | Toolgen Inc | Composición para escindir un ADN objetivo que comprende un ARN guía específico para el ADN objetivo y ácido nucleico codificador de proteína Cas o proteína Cas, y uso de la misma |
WO2014071219A1 (en) * | 2012-11-01 | 2014-05-08 | Factor Bioscience Inc. | Methods and products for expressing proteins in cells |
JP6450683B2 (ja) | 2012-11-01 | 2019-01-09 | セレクティス | 治療用タンパク質の生産のための植物 |
CA2891510C (en) * | 2012-11-16 | 2022-10-18 | Transposagen Biopharmaceuticals, Inc. | Site-specific enzymes and methods of use |
CN105121649A (zh) | 2012-11-16 | 2015-12-02 | 赛莱蒂克斯公司 | 靶向修饰藻基因组的方法 |
US9756871B2 (en) | 2012-11-20 | 2017-09-12 | J.R. Simplot Company | TAL-mediated transfer DNA insertion |
WO2014089212A1 (en) * | 2012-12-05 | 2014-06-12 | Sangamo Biosciences, Inc. | Methods and compositions for regulation of metabolic disorders |
PL2928496T3 (pl) | 2012-12-06 | 2020-04-30 | Sigma-Aldrich Co. Llc | Modyfikacja i regulacja genomu w oparciu o CRISPR |
BR112015013784A2 (pt) * | 2012-12-12 | 2017-07-11 | Massachusetts Inst Technology | aplicação, manipulação e otimização de sistemas, métodos e composições para manipulação de sequência e aplicações terapêuticas |
US8993233B2 (en) | 2012-12-12 | 2015-03-31 | The Broad Institute Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
MX2015007549A (es) * | 2012-12-12 | 2017-01-20 | Broad Inst Inc | Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias. |
US8697359B1 (en) * | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
PL2896697T3 (pl) | 2012-12-12 | 2016-01-29 | Broad Inst Inc | Projektowanie systemów, sposoby i optymalizowane kompozycje kierujące do manipulacji sekwencją |
PL2898075T3 (pl) | 2012-12-12 | 2016-09-30 | PROJEKTOWANIE i OPTYMALIZACJA ULEPSZONYCH SYSTEMÓW, SPOSOBY I KOMPOZYCJE ENZYMÓW DO MANIPULACJI SEKWENCJĄ | |
EP2931892B1 (en) | 2012-12-12 | 2018-09-12 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
EP2825654B1 (en) | 2012-12-12 | 2017-04-26 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
RU2699523C2 (ru) * | 2012-12-17 | 2019-09-05 | Президент Энд Фэллоуз Оф Харвард Коллидж | Рнк-направляемая инженерия генома человека |
US9708589B2 (en) | 2012-12-18 | 2017-07-18 | Monsanto Technology Llc | Compositions and methods for custom site-specific DNA recombinases |
ES2673864T3 (es) | 2012-12-21 | 2018-06-26 | Cellectis | Patatas con endulzamiento inducido en frío reducido |
WO2014124284A1 (en) | 2013-02-07 | 2014-08-14 | The General Hospital Corporation | Tale transcriptional activators |
CA2900992C (en) | 2013-02-20 | 2023-02-28 | Regeneron Pharmaceuticals, Inc. | Genetic modification of rats |
US10227610B2 (en) | 2013-02-25 | 2019-03-12 | Sangamo Therapeutics, Inc. | Methods and compositions for enhancing nuclease-mediated gene disruption |
WO2014131833A1 (en) | 2013-02-27 | 2014-09-04 | Helmholtz Zentrum München Deutsches Forschungszentrum Für Gesundheit Und Umwelt (Gmbh) | Gene editing in the oocyte by cas9 nucleases |
EP2971039B1 (en) | 2013-03-14 | 2020-01-01 | Immusoft Corporation | Methods for in vitro memory b cell differentiation and transduction with vsv-g pseudotyped viral vectors |
NZ712727A (en) | 2013-03-14 | 2017-05-26 | Caribou Biosciences Inc | Compositions and methods of nucleic acid-targeting nucleic acids |
US20140273235A1 (en) * | 2013-03-15 | 2014-09-18 | Regents Of The University Of Minnesota | ENGINEERING PLANT GENOMES USING CRISPR/Cas SYSTEMS |
US10113162B2 (en) | 2013-03-15 | 2018-10-30 | Cellectis | Modifying soybean oil composition through targeted knockout of the FAD2-1A/1B genes |
US11039586B2 (en) | 2013-03-15 | 2021-06-22 | Monsanto Technology Llc | Creation and transmission of megaloci |
US11332719B2 (en) * | 2013-03-15 | 2022-05-17 | The Broad Institute, Inc. | Recombinant virus and preparations thereof |
US20140363561A1 (en) * | 2013-03-15 | 2014-12-11 | J.R. Simplot Company | Tal-mediated transfer dna insertion |
US10793867B2 (en) | 2013-03-15 | 2020-10-06 | Monsanto Technology, Llc | Methods for targeted transgene-integration using custom site-specific DNA recombinases |
US9788534B2 (en) | 2013-03-18 | 2017-10-17 | Kymab Limited | Animal models and therapeutic molecules |
US9828582B2 (en) * | 2013-03-19 | 2017-11-28 | Duke University | Compositions and methods for the induction and tuning of gene expression |
WO2014153470A2 (en) | 2013-03-21 | 2014-09-25 | Sangamo Biosciences, Inc. | Targeted disruption of t cell receptor genes using engineered zinc finger protein nucleases |
WO2014161821A1 (en) | 2013-04-02 | 2014-10-09 | Bayer Cropscience Nv | Targeted genome engineering in eukaryotes |
KR102223568B1 (ko) | 2013-04-05 | 2021-03-04 | 다우 아그로사이언시즈 엘엘씨 | 식물의 게놈 내의 외인성 서열의 통합을 위한 방법 및 조성물 |
AU2014253942B9 (en) | 2013-04-16 | 2020-08-13 | Regeneron Pharmaceuticals, Inc. | Targeted modification of rat genome |
CN105008536A (zh) * | 2013-04-16 | 2015-10-28 | 深圳华大基因科技服务有限公司 | 分离的寡核苷酸及其用途 |
CN103233004B (zh) * | 2013-04-28 | 2015-04-29 | 新疆农垦科学院 | 一种人工dna分子及检测目标基因表达的方法 |
US9783618B2 (en) | 2013-05-01 | 2017-10-10 | Kymab Limited | Manipulation of immunoglobulin gene diversity and multi-antibody therapeutics |
US11707056B2 (en) | 2013-05-02 | 2023-07-25 | Kymab Limited | Animals, repertoires and methods |
US9783593B2 (en) | 2013-05-02 | 2017-10-10 | Kymab Limited | Antibodies, variable domains and chains tailored for human use |
WO2014182700A1 (en) | 2013-05-10 | 2014-11-13 | Sangamo Biosciences, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering |
US11077144B2 (en) | 2013-05-13 | 2021-08-03 | Cellectis | CD19 specific chimeric antigen receptor and uses thereof |
US11311575B2 (en) | 2013-05-13 | 2022-04-26 | Cellectis | Methods for engineering highly active T cell for immunotherapy |
CN116083487A (zh) | 2013-05-15 | 2023-05-09 | 桑格摩生物治疗股份有限公司 | 用于治疗遗传病状的方法和组合物 |
AU2014274840B2 (en) | 2013-06-05 | 2020-03-12 | Duke University | RNA-guided gene editing and gene regulation |
KR20160034901A (ko) | 2013-06-17 | 2016-03-30 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물 |
CN107995927B (zh) | 2013-06-17 | 2021-07-30 | 布罗德研究所有限公司 | 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途 |
CN105793425B (zh) | 2013-06-17 | 2021-10-26 | 布罗德研究所有限公司 | 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用 |
EP3011029B1 (en) | 2013-06-17 | 2019-12-11 | The Broad Institute, Inc. | Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation |
WO2014204727A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
FR3008424B1 (fr) * | 2013-07-09 | 2017-12-15 | Centre National De La Recherche Scient (Cnrs) | Procede de modification ciblee du genome pour la generation d'un organisme animal |
RU2748433C2 (ru) | 2013-07-10 | 2021-05-25 | Президент Энд Фэллоуз Оф Харвард Коллидж | ОРТОГОНАЛЬНЫЕ БЕЛКИ Cas9 ДЛЯ РНК-НАПРАВЛЯЕМОЙ РЕГУЛЯЦИИ И РЕДАКТИРОВАНИЯ ГЕНОВ |
CN104293828B (zh) * | 2013-07-16 | 2017-07-21 | 中国科学院上海生命科学研究院 | 植物基因组定点修饰方法 |
US10563225B2 (en) | 2013-07-26 | 2020-02-18 | President And Fellows Of Harvard College | Genome engineering |
CA2920253A1 (en) | 2013-08-02 | 2015-02-05 | Enevolv, Inc. | Processes and host cells for genome, pathway, and biomolecular engineering |
JP5931022B2 (ja) * | 2013-08-09 | 2016-06-08 | 国立大学法人広島大学 | Dna結合ドメインを含むポリペプチド |
WO2015020218A1 (ja) * | 2013-08-09 | 2015-02-12 | 独立行政法人理化学研究所 | Dna結合タンパク質ドメインの改変による高活性taleタンパク質 |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US10006011B2 (en) | 2013-08-09 | 2018-06-26 | Hiroshima University | Polypeptide containing DNA-binding domain |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
WO2015031619A1 (en) | 2013-08-28 | 2015-03-05 | Sangamo Biosciences, Inc. | Compositions for linking dna-binding domains and cleavage domains |
US20160251410A1 (en) | 2013-09-03 | 2016-09-01 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Compositions and methods for expressing recombinant polypeptides |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
DE202014010413U1 (de) | 2013-09-18 | 2015-12-08 | Kymab Limited | Zellen und Organismen |
CA2925723A1 (en) | 2013-10-01 | 2015-04-09 | Kymab Limited | Animal models and therapeutic molecules |
US9476884B2 (en) * | 2013-10-04 | 2016-10-25 | University Of Massachusetts | Hybridization- independent labeling of repetitive DNA sequence in human chromosomes |
CN116836957A (zh) | 2013-10-17 | 2023-10-03 | 桑格摩生物科学股份有限公司 | 用于核酸酶介导的基因组工程改造的递送方法和组合物 |
EP3057432B1 (en) | 2013-10-17 | 2018-11-21 | Sangamo Therapeutics, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering in hematopoietic stem cells |
JP6484987B2 (ja) | 2013-10-21 | 2019-03-20 | Jnc株式会社 | エビルシフェラーゼの触媒蛋白質の変異遺伝子とその使用法 |
WO2015059690A1 (en) | 2013-10-24 | 2015-04-30 | Yeda Research And Development Co. Ltd. | Polynucleotides encoding brex system polypeptides and methods of using s ame |
CN105814214A (zh) | 2013-10-25 | 2016-07-27 | 家畜改良有限公司 | 遗传标记和其用途 |
WO2015065964A1 (en) | 2013-10-28 | 2015-05-07 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof |
EP3862434A1 (en) | 2013-11-04 | 2021-08-11 | Dow AgroSciences LLC | Optimal soybean loci |
AU2014341929B2 (en) | 2013-11-04 | 2017-11-30 | Corteva Agriscience Llc | Optimal maize loci |
NZ719494A (en) | 2013-11-04 | 2017-09-29 | Dow Agrosciences Llc | Optimal maize loci |
BR102014027436B1 (pt) | 2013-11-04 | 2022-06-28 | Dow Agrosciences Llc | Molécula de ácido nucleico recombinante, e método para a produção de uma célula vegetal transgênica |
JP5900942B2 (ja) | 2013-11-06 | 2016-04-06 | 国立大学法人広島大学 | 核酸挿入用ベクター |
JP2016536021A (ja) | 2013-11-07 | 2016-11-24 | エディタス・メディシン,インコーポレイテッド | CRISPR関連方法および支配gRNAのある組成物 |
CN105934524A (zh) | 2013-11-11 | 2016-09-07 | 桑格摩生物科学股份有限公司 | 用于治疗亨廷顿氏病的方法和组合物 |
PT3492593T (pt) | 2013-11-13 | 2021-10-18 | Childrens Medical Center | Regulação da expressão de genes mediada por nucleases |
US9951353B2 (en) * | 2013-11-15 | 2018-04-24 | The United States Of America, As Represented By The Secretary, Dept. Of Health And Human Services | Engineering neural stem cells using homologous recombination |
EP3071695A2 (en) * | 2013-11-18 | 2016-09-28 | Crispr Therapeutics AG | Crispr-cas system materials and methods |
EP2878667A1 (en) * | 2013-11-29 | 2015-06-03 | Institut Pasteur | TAL effector means useful for partial or full deletion of DNA tandem repeats |
CN105940109A (zh) | 2013-12-06 | 2016-09-14 | 国立健康与医学研究所 | 用于在受试者的视网膜色素上皮中表达目的多核苷酸的方法和药物组合物 |
EP3757116A1 (en) | 2013-12-09 | 2020-12-30 | Sangamo Therapeutics, Inc. | Methods and compositions for genome engineering |
RU2725520C2 (ru) | 2013-12-11 | 2020-07-02 | Регенерон Фармасьютикалс, Инк. | Способы и композиции для направленной модификации генома |
CA2932472A1 (en) | 2013-12-12 | 2015-06-18 | Massachusetts Institute Of Technology | Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders |
WO2015089486A2 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems |
AU2014361834B2 (en) | 2013-12-12 | 2020-10-22 | Massachusetts Institute Of Technology | CRISPR-Cas systems and methods for altering expression of gene products, structural information and inducible modular Cas enzymes |
KR20160089527A (ko) | 2013-12-12 | 2016-07-27 | 더 브로드 인스티튜트, 인코퍼레이티드 | 게놈 편집을 위한 crispr-cas 시스템 및 조성물의 전달, 용도 및 치료적 응용 |
WO2015089364A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crystal structure of a crispr-cas system, and uses thereof |
US9068179B1 (en) | 2013-12-12 | 2015-06-30 | President And Fellows Of Harvard College | Methods for correcting presenilin point mutations |
ES2837856T3 (es) | 2013-12-20 | 2021-07-01 | Hutchinson Fred Cancer Res | Moléculas efectoras quiméricas etiquetadas y receptores de las mismas |
US10774338B2 (en) | 2014-01-16 | 2020-09-15 | The Regents Of The University Of California | Generation of heritable chimeric plant traits |
JP2017510542A (ja) | 2014-01-31 | 2017-04-13 | ファクター バイオサイエンス インコーポレイテッド | 核酸生成及び送達のための方法及び製品 |
EP3102673B1 (en) | 2014-02-03 | 2020-04-15 | Sangamo Therapeutics, Inc. | Methods and compositions for treatment of a beta thalessemia |
CA2939621C (en) | 2014-02-13 | 2019-10-15 | Takara Bio Usa, Inc. | Methods of depleting a target molecule from an initial collection of nucleic acids, and compositions and kits for practicing the same |
CN104844696A (zh) * | 2014-02-19 | 2015-08-19 | 北京大学 | 一种转录激活子样效应因子功能蛋白设计、合成及其应用 |
EP3110454B1 (en) | 2014-02-24 | 2020-11-18 | Sangamo Therapeutics, Inc. | Methods and compositions for nuclease-mediated targeted integration |
TW201538518A (zh) | 2014-02-28 | 2015-10-16 | Dow Agrosciences Llc | 藉由嵌合基因調控元件所賦予之根部特異性表現 |
US11028388B2 (en) | 2014-03-05 | 2021-06-08 | Editas Medicine, Inc. | CRISPR/Cas-related methods and compositions for treating Usher syndrome and retinitis pigmentosa |
US11339437B2 (en) | 2014-03-10 | 2022-05-24 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
US11141493B2 (en) | 2014-03-10 | 2021-10-12 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
ES2745769T3 (es) | 2014-03-10 | 2020-03-03 | Editas Medicine Inc | Procedimientos y composiciones relacionados con CRISPR/CAS para tratar la amaurosis congénita de Leber 10 (LCA10) |
ES2879373T3 (es) | 2014-03-18 | 2021-11-22 | Sangamo Therapeutics Inc | Métodos y composiciones para la regulación de la expresión de proteínas de dedo de zinc |
US11242525B2 (en) | 2014-03-26 | 2022-02-08 | Editas Medicine, Inc. | CRISPR/CAS-related methods and compositions for treating sickle cell disease |
WO2015153889A2 (en) | 2014-04-02 | 2015-10-08 | University Of Florida Research Foundation, Incorporated | Materials and methods for the treatment of latent viral infection |
CN103923215B (zh) * | 2014-04-15 | 2016-02-10 | 中国农业大学 | 使ACC-α基因启动子PⅢ失活的物质及其应用 |
JP6265020B2 (ja) | 2014-04-16 | 2018-01-24 | Jnc株式会社 | エビルシフェラーゼの触媒蛋白質の変異遺伝子とその使用法 |
US9522936B2 (en) | 2014-04-24 | 2016-12-20 | Sangamo Biosciences, Inc. | Engineered transcription activator like effector (TALE) proteins |
RU2691102C2 (ru) | 2014-05-08 | 2019-06-11 | Сангамо Байосайенсиз, Инк. | Способы и композиции для лечения болезни хантингтона |
AU2015259191B2 (en) | 2014-05-13 | 2019-03-21 | Sangamo Therapeutics, Inc. | Methods and compositions for prevention or treatment of a disease |
WO2015188056A1 (en) | 2014-06-05 | 2015-12-10 | Sangamo Biosciences, Inc. | Methods and compositions for nuclease design |
EP3158072B1 (en) | 2014-06-20 | 2021-01-13 | Cellectis | Potatoes with reduced granule-bound starch synthase |
CA2954201A1 (en) | 2014-07-08 | 2016-01-14 | Vib Vzw | Means and methods to increase plant yield |
WO2016005985A2 (en) | 2014-07-09 | 2016-01-14 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Method for reprogramming cells |
US20170142942A1 (en) | 2014-07-14 | 2017-05-25 | Washington State University | Nanos knock-out that ablates germline cells |
EP3169773B1 (en) | 2014-07-15 | 2023-07-12 | Juno Therapeutics, Inc. | Engineered cells for adoptive cell therapy |
US9816074B2 (en) | 2014-07-25 | 2017-11-14 | Sangamo Therapeutics, Inc. | Methods and compositions for modulating nuclease-mediated genome engineering in hematopoietic stem cells |
WO2016014837A1 (en) | 2014-07-25 | 2016-01-28 | Sangamo Biosciences, Inc. | Gene editing for hiv gene therapy |
US9616090B2 (en) | 2014-07-30 | 2017-04-11 | Sangamo Biosciences, Inc. | Gene correction of SCID-related genes in hematopoietic stem and progenitor cells |
WO2016022363A2 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
CN107208093B (zh) | 2014-09-04 | 2022-03-01 | 纪念斯隆-凯特琳癌症中心 | 用于治疗血红蛋白病的球蛋白基因治疗 |
IL234638A0 (en) | 2014-09-14 | 2014-12-02 | Yeda Res & Dev | NMDA receptor antagonists for the treatment of Gaucher disease |
PL3194570T3 (pl) | 2014-09-16 | 2021-12-20 | Sangamo Therapeutics, Inc. | Sposoby i kompozycje do inżynierii genomowej w której pośredniczy nukleaza i korekty hematopoetycznych komórek macierzystych |
CN105440111B (zh) * | 2014-09-30 | 2019-08-13 | 深圳华大基因研究院 | 一对转录激活子样效应因子核酸酶及其编码序列与应用 |
CA2963080A1 (en) | 2014-10-01 | 2016-04-07 | The General Hospital Corporation | Methods for increasing efficiency of nuclease-induced homology-directed repair |
US20170369848A1 (en) * | 2014-11-11 | 2017-12-28 | Q Therapeutics, Inc. | Engineering mesenchymal stem cells using homologous recombination |
US11319555B2 (en) | 2014-11-20 | 2022-05-03 | Duke University | Compositions, systems and methods for cell therapy |
KR102531016B1 (ko) | 2014-11-21 | 2023-05-10 | 리제너론 파마슈티칼스 인코포레이티드 | 쌍 형성된 가이드 rna를 사용하는 표적화된 유전자 변형을 위한 방법 및 조성물 |
EP3985115A1 (en) | 2014-12-12 | 2022-04-20 | The Broad Institute, Inc. | Protected guide rnas (pgrnas) |
US10889834B2 (en) | 2014-12-15 | 2021-01-12 | Sangamo Therapeutics, Inc. | Methods and compositions for enhancing targeted transgene integration |
CA2969151A1 (en) | 2014-12-23 | 2016-06-30 | Syngenta Participations Ag | Methods and compositions for identifying and enriching for cells comprising site specific genomic modifications |
EP3247366A4 (en) | 2015-01-21 | 2018-10-31 | Sangamo Therapeutics, Inc. | Methods and compositions for identification of highly specific nucleases |
EP3256487A4 (en) | 2015-02-09 | 2018-07-18 | Duke University | Compositions and methods for epigenome editing |
EP4406585A3 (en) | 2015-02-13 | 2024-10-23 | Factor Bioscience Inc. | Nucleic acid products and methods of administration thereof |
WO2016135507A1 (en) * | 2015-02-27 | 2016-09-01 | University Of Edinburgh | Nucleic acid editing systems |
CN104694539A (zh) * | 2015-03-09 | 2015-06-10 | 上海市同济医院 | 一种利用talen技术构建可敲除小鼠cramp基因质粒的方法 |
EP3273971A4 (en) | 2015-03-27 | 2018-12-05 | Yeda Research and Development Co. Ltd. | Methods of treating motor neuron diseases |
JP6964843B2 (ja) * | 2015-03-31 | 2021-11-10 | 国立研究開発法人農業・食品産業技術総合研究機構 | バイナリー遺伝子発現システム |
WO2016161446A1 (en) | 2015-04-03 | 2016-10-06 | Dana-Farber Cancer Institute, Inc. | Composition and methods of genome editing of b-cells |
JP2018511331A (ja) | 2015-04-15 | 2018-04-26 | ダウ アグロサイエンシィズ エルエルシー | 導入遺伝子発現のための植物プロモーター |
BR112017021903B1 (pt) | 2015-04-15 | 2023-12-05 | Corteva Agriscience Llc | Promotor de planta para expressão de transgene |
EP3286571B1 (en) | 2015-04-24 | 2021-08-18 | Editas Medicine, Inc. | Evaluation of cas9 molecule/guide rna molecule complexes |
WO2016176652A2 (en) | 2015-04-29 | 2016-11-03 | Fred Hutchinson Cancer Research Center | Modified stem cells and uses thereof |
US10179918B2 (en) | 2015-05-07 | 2019-01-15 | Sangamo Therapeutics, Inc. | Methods and compositions for increasing transgene activity |
MX2017014446A (es) | 2015-05-12 | 2018-06-13 | Sangamo Therapeutics Inc | Regulacion de expresion genica mediada por nucleasa. |
EP3303586A1 (en) | 2015-05-29 | 2018-04-11 | Juno Therapeutics, Inc. | Composition and methods for regulating inhibitory interactions in genetically engineered cells |
ES2886599T3 (es) | 2015-06-17 | 2021-12-20 | Poseida Therapeutics Inc | Composiciones y métodos para dirigir proteínas a loci específicos en el genoma |
WO2016205759A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation |
MX2017016289A (es) | 2015-06-18 | 2018-08-15 | Broad Inst Inc | Mutaciones de la enzima crispr que reducen los efectos fuera del blanco. |
US9957501B2 (en) | 2015-06-18 | 2018-05-01 | Sangamo Therapeutics, Inc. | Nuclease-mediated regulation of gene expression |
ES2594486B1 (es) * | 2015-06-19 | 2017-09-26 | Biopraxis Research Aie | Molécula de ácido nucleico, proteína de fusión y método para modificar el material genético de una célula |
US10801040B2 (en) | 2015-07-07 | 2020-10-13 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Methods and pharmaceutical compositions for expressing a polynucleotide of interest in the peripheral nervous system of a subject |
WO2017011519A1 (en) | 2015-07-13 | 2017-01-19 | Sangamo Biosciences, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering |
MA42895A (fr) | 2015-07-15 | 2018-05-23 | Juno Therapeutics Inc | Cellules modifiées pour thérapie cellulaire adoptive |
US10786547B2 (en) | 2015-07-16 | 2020-09-29 | Biokine Therapeutics Ltd. | Compositions, articles of manufacture and methods for treating cancer |
LT3331355T (lt) | 2015-08-06 | 2024-07-25 | The Curators Of The University Of Missouri | Kiaulių reprodukcinio ir respiracinio sindromo virusui (prrsv) atsparios kiaulės ir ląstelės, turinčios modifikuotus cd163 genus |
KR20240132120A (ko) | 2015-08-25 | 2024-09-02 | 듀크 유니버시티 | Rna-가이드된 엔도뉴클레아제를 이용하는 게놈 조작에서 특이성을 개선하는 조성물 및 방법 |
US10837024B2 (en) | 2015-09-17 | 2020-11-17 | Cellectis | Modifying messenger RNA stability in plant transformations |
TW201718862A (zh) | 2015-09-22 | 2017-06-01 | Dow Agrosciences Llc | 用於轉殖基因表現之植物啟動子及3’utr |
TW201718861A (zh) | 2015-09-22 | 2017-06-01 | 道禮責任有限公司 | 用於轉殖基因表現之植物啟動子及3’utr |
CA2998500A1 (en) | 2015-09-23 | 2017-03-30 | Sangamo Therapeutics, Inc. | Htt repressors and uses thereof |
EP4089175A1 (en) | 2015-10-13 | 2022-11-16 | Duke University | Genome engineering with type i crispr systems in eukaryotic cells |
US10280429B2 (en) | 2015-10-22 | 2019-05-07 | Dow Agrosciences Llc | Plant promoter for transgene expression |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
BR112018008519A2 (pt) | 2015-10-28 | 2018-11-06 | Sangamo Therapeutics Inc | construtos específicos de fígado, cassetes de expressão de fator viii e métodos de uso dos mesmos |
WO2017079428A1 (en) | 2015-11-04 | 2017-05-11 | President And Fellows Of Harvard College | Site specific germline modification |
WO2017078935A1 (en) | 2015-11-04 | 2017-05-11 | Dow Agrosciences Llc | Plant promoter for transgene expression |
JP6976249B2 (ja) | 2015-11-23 | 2021-12-08 | サンガモ セラピューティクス, インコーポレイテッド | 免疫を工学操作するための方法および組成物 |
CA3008382A1 (en) | 2015-12-18 | 2017-06-22 | Sangamo Therapeutics, Inc. | Targeted disruption of the mhc cell receptor |
AU2016369490C1 (en) | 2015-12-18 | 2021-12-23 | Sangamo Therapeutics, Inc. | Targeted disruption of the T cell receptor |
CA3009127A1 (en) | 2016-01-06 | 2017-07-13 | Yeda Research And Development Co. Ltd. | Compositions and methods for treating malignant, autoimmune and inflammatory diseases |
BR112018014288A2 (pt) | 2016-01-15 | 2018-12-18 | Univ Minnesota | métodos e composições para o tratamento de doença neurológica |
EP3405024B1 (en) | 2016-01-21 | 2022-12-28 | The State of Israel - Ministry of Agriculture & Rural Development, Agricultural Research Organization (ARO) (Volcani Center) | Parthenocarpic plants and methods of producing same |
EP3408376A1 (en) | 2016-01-31 | 2018-12-05 | Hadasit Medical Research Services and Development Ltd. | Autosomal-identical pluripotent stem cell populations having non-identical sex chromosomal composition and uses thereof |
UY37108A (es) | 2016-02-02 | 2017-08-31 | Cellectis | Modificación de la composición de aceites de soja mediante el knockout dirigido de los genes fad3a/b/c |
EP3411056A4 (en) | 2016-02-02 | 2019-10-02 | Sangamo Therapeutics, Inc. | COMPOUNDS FOR NETWORKING DNA BINDING DOMAINS AND SPLITTING DOMAINS |
JP7025932B2 (ja) * | 2016-02-04 | 2022-02-25 | 花王株式会社 | 変異リゾプス属菌 |
US20190046497A1 (en) | 2016-02-14 | 2019-02-14 | Yeda Research And Development Co., Ltd. | Methods of modulating protein exocytosis and uses of same in therapy |
WO2017153982A1 (en) | 2016-03-06 | 2017-09-14 | Yeda Research And Development Co. Ltd. | Method for modulating myelination |
CA3016504A1 (en) | 2016-03-23 | 2017-09-28 | Dana-Farber Cancer Institute, Inc. | Methods for enhancing the efficiency of gene editing |
WO2017165862A1 (en) | 2016-03-25 | 2017-09-28 | Editas Medicine, Inc. | Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency |
JP6246258B2 (ja) * | 2016-04-25 | 2017-12-13 | 国立大学法人広島大学 | Dna結合ドメインを含むポリペプチド |
ES2908467T3 (es) | 2016-04-29 | 2022-04-29 | Adverum Biotechnologies Inc | Evasión de anticuerpos neutralizantes por un virus adenoasociado recombinante |
UA124343C2 (uk) | 2016-05-13 | 2021-09-01 | 4Д Молекьюлар Терапьютікс Інк. | Капсиди аденоасоційованого вірусу і спосіб його використання |
UA126901C2 (uk) | 2016-05-26 | 2023-02-22 | Нунемс Б.В. | Рослина кавуна, яка продукує безкісточкові плоди |
CN117431234A (zh) | 2016-05-27 | 2024-01-23 | 阿迪根有限公司 | 用于基因组编辑分子的细胞内递送的肽和纳米颗粒 |
GB2552861B (en) | 2016-06-02 | 2019-05-15 | Sigma Aldrich Co Llc | Using programmable DNA binding proteins to enhance targeted genome modification |
EP3475446A1 (en) | 2016-06-27 | 2019-05-01 | Juno Therapeutics, Inc. | Method of identifying peptide epitopes, molecules that bind such epitopes and related uses |
MA45491A (fr) | 2016-06-27 | 2019-05-01 | Juno Therapeutics Inc | Épitopes à restriction cmh-e, molécules de liaison et procédés et utilisations associés |
EP3490556A4 (en) | 2016-07-27 | 2020-04-15 | Case Western Reserve University | CONNECTIONS AND METHOD FOR PROMOTING MYELINIZATION |
CN116286986A (zh) | 2016-07-29 | 2023-06-23 | 加利福尼亚大学董事会 | 具有变异衣壳的腺相关病毒病毒体和其使用方法 |
AU2017305404B2 (en) | 2016-08-02 | 2023-11-30 | Editas Medicine, Inc. | Compositions and methods for treating CEP290 associated disease |
CA3032699A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
JP7066126B2 (ja) | 2016-08-09 | 2022-05-13 | ブイアイビー ブイゼットダブリュ | セルロースシンターゼ阻害剤および突然変異体植物 |
CA2941315C (en) | 2016-08-12 | 2018-03-06 | Api Labs Inc. | High thebaine poppy and methods of producing the same |
US20190195864A1 (en) | 2016-08-15 | 2019-06-27 | Enevolv, Inc. | Cell-free sensor systems |
CN118546979A (zh) | 2016-08-17 | 2024-08-27 | 孟山都技术公司 | 通过操纵赤霉素代谢增加可收获产量的用于矮株型植物的方法和组合物 |
CA3033788A1 (en) | 2016-08-17 | 2018-02-22 | Factor Bioscience Inc. | Nucleic acid products and methods of administration thereof |
IL247368A0 (en) | 2016-08-18 | 2016-11-30 | Yeda Res & Dev | Diagnostic and therapeutic uses of exosomes |
JP7203014B2 (ja) | 2016-08-24 | 2023-01-12 | サンガモ セラピューティクス, インコーポレイテッド | 工学操作されたヌクレアーゼを使用した遺伝子発現の調節 |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
CN110418841A (zh) | 2016-08-24 | 2019-11-05 | 桑格摩生物治疗股份有限公司 | 工程化的靶特异性核酸酶 |
US10960085B2 (en) | 2016-09-07 | 2021-03-30 | Sangamo Therapeutics, Inc. | Modulation of liver genes |
CN109996868A (zh) | 2016-09-23 | 2019-07-09 | 弗雷德哈钦森癌症研究中心 | 特异性用于次要组织相容性(h)抗原ha-1的tcr及其用途 |
US10400246B2 (en) | 2016-10-03 | 2019-09-03 | Dow Agrosciences Llc | Plant promoter for transgene expression |
BR112019005687A2 (pt) | 2016-10-03 | 2019-07-02 | Dow Agrosciences Llc | promotor vegetal para expressão de transgenes |
AU2017338827B2 (en) | 2016-10-03 | 2023-08-31 | Juno Therapeutics, Inc. | HPV-specific binding molecules |
US10961505B2 (en) | 2016-10-05 | 2021-03-30 | FUJIFILM Cellular Dynamics, Inc. | Generating mature lineages from induced pluripotent stem cells with MECP2 disruption |
AU2017343780B2 (en) | 2016-10-13 | 2023-08-31 | Juno Therapeutics, Inc. | Immunotherapy methods and compositions involving tryptophan metabolic pathway modulators |
WO2018071868A1 (en) | 2016-10-14 | 2018-04-19 | President And Fellows Of Harvard College | Aav delivery of nucleobase editors |
GB201617559D0 (en) | 2016-10-17 | 2016-11-30 | University Court Of The University Of Edinburgh The | Swine comprising modified cd163 and associated methods |
CA3040179A1 (en) | 2016-10-19 | 2018-04-26 | Adverum Biotechnologies, Inc. | Modified aav capsids and uses thereof |
US11219695B2 (en) | 2016-10-20 | 2022-01-11 | Sangamo Therapeutics, Inc. | Methods and compositions for the treatment of Fabry disease |
CA3041668A1 (en) | 2016-10-31 | 2018-05-03 | Sangamo Therapeutics, Inc. | Gene correction of scid-related genes in hematopoietic stem and progenitor cells |
WO2018092072A1 (en) | 2016-11-16 | 2018-05-24 | Cellectis | Methods for altering amino acid content in plants through frameshift mutations |
JP2019535298A (ja) | 2016-11-28 | 2019-12-12 | イェダ リサーチ アンド ディベロップメント カンパニー リミテッドYeda Research And Development Co.Ltd. | 単離ポリヌクレオチドおよびポリペプチドおよび関心のある発現産物を発現させるためにそれらを使用する方法 |
US11504389B2 (en) | 2016-12-01 | 2022-11-22 | Sangamo Therapeutics, Inc. | Tau modulators and methods and compositions for delivery thereof |
WO2018102612A1 (en) | 2016-12-02 | 2018-06-07 | Juno Therapeutics, Inc. | Engineered b cells and related compositions and methods |
MX2019006438A (es) | 2016-12-05 | 2019-11-28 | Juno Therapeutics Inc | Produccion de celulas modificadas para terapia de celulas adoptivas. |
ES2968892T3 (es) | 2016-12-08 | 2024-05-14 | Univ Case Western Reserve | Métodos y composiciones para aumentar la producción de mielina funcional |
WO2018119021A1 (en) * | 2016-12-21 | 2018-06-28 | HSU, Ethan | Composition for editing a nucleic acid sequence and method using the same |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
US20200124615A1 (en) | 2016-12-29 | 2020-04-23 | Ukko Inc. | Methods for identifying and de-epitoping allergenic polypeptides |
WO2018129021A1 (en) * | 2017-01-06 | 2018-07-12 | The Johns Hopkins University | Modular, inducible repressors for the control of gene expression |
IL250479A0 (en) | 2017-02-06 | 2017-03-30 | Sorek Rotem | Genetically engineered cells expressing a disarm system that confers resistance to phages and methods for their production |
EP3592853A1 (en) | 2017-03-09 | 2020-01-15 | President and Fellows of Harvard College | Suppression of pain by gene editing |
JP2020510439A (ja) | 2017-03-10 | 2020-04-09 | プレジデント アンド フェローズ オブ ハーバード カレッジ | シトシンからグアニンへの塩基編集因子 |
WO2018170184A1 (en) | 2017-03-14 | 2018-09-20 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
SG11201908527SA (en) | 2017-03-15 | 2019-10-30 | Hutchinson Fred Cancer Res | High affinity mage-a1-specific tcrs and uses thereof |
IL269458B2 (en) | 2017-03-23 | 2024-02-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
WO2018189360A1 (en) | 2017-04-13 | 2018-10-18 | Cellectis | New sequence specific reagents targeting ccr5 in primary hematopoietic cells |
EP3612023A4 (en) | 2017-04-20 | 2021-05-12 | Egenesis, Inc. | GENETICALLY MODIFIED ANIMAL PRODUCTION PROCESSES |
EP3615668B1 (en) | 2017-04-25 | 2024-02-28 | Cellectis | Alfalfa with reduced lignin composition |
AU2018256877B2 (en) | 2017-04-28 | 2022-06-02 | Acuitas Therapeutics, Inc. | Novel carbonyl lipids and lipid nanoparticle formulations for delivery of nucleic acids |
CN110869497A (zh) | 2017-05-03 | 2020-03-06 | 桑格摩生物治疗股份有限公司 | 修饰囊性纤维化跨膜传导调节蛋白(cftr)基因的方法和组合物 |
IL252151A0 (en) | 2017-05-07 | 2017-07-31 | Fainzilber Michael | Treatment of stress disorders |
EP3622070A2 (en) | 2017-05-10 | 2020-03-18 | Editas Medicine, Inc. | Crispr/rna-guided nuclease systems and methods |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
US10780119B2 (en) | 2017-05-24 | 2020-09-22 | Effector Therapeutics Inc. | Methods and compositions for cellular immunotherapy |
US11512287B2 (en) | 2017-06-16 | 2022-11-29 | Sangamo Therapeutics, Inc. | Targeted disruption of T cell and/or HLA receptors |
BR112019027133B8 (pt) | 2017-06-20 | 2022-08-23 | Inst Curie | Uso de uma célula imune modificada deficiente para suv39h1 |
IL253642A0 (en) | 2017-07-24 | 2017-09-28 | Seger Rony | Combined treatment for cancer |
JP2020534795A (ja) | 2017-07-28 | 2020-12-03 | プレジデント アンド フェローズ オブ ハーバード カレッジ | ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物 |
CN111182790A (zh) | 2017-07-31 | 2020-05-19 | 瑞泽恩制药公司 | Crispr报告体非人类动物及其用途 |
SG11201911619YA (en) | 2017-07-31 | 2020-01-30 | Regeneron Pharma | Assessment of crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo |
US11130999B2 (en) | 2017-07-31 | 2021-09-28 | Regeneron Pharmaceuticals, Inc. | Cas-ready mouse embryonic stem cells and mice and uses thereof |
JP7207665B2 (ja) * | 2017-08-04 | 2023-01-18 | 北京大学 | メチル化により修飾されたdna塩基を特異的に認識するtale rvdおよびその使用 |
CN109384833B (zh) * | 2017-08-04 | 2021-04-27 | 北京大学 | 特异性识别甲基化修饰dna碱基的tale rvd及其应用 |
JP7109009B2 (ja) | 2017-08-08 | 2022-07-29 | 北京大学 | 遺伝子ノックアウト方法 |
US11692166B2 (en) | 2017-08-23 | 2023-07-04 | Technion Research & Development Foundation Limited | Compositions and methods for improving alcohol tolerance in yeast |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
WO2019051128A1 (en) | 2017-09-06 | 2019-03-14 | Fred Hutchinson Cancer Research Center | SPECIFIC STREP LABEL CHIMERIC RECEPTORS AND USES THEREOF |
WO2019051135A1 (en) | 2017-09-06 | 2019-03-14 | Fred Hutchinson Cancer Research Center | METHODS FOR IMPROVING ADOPTIVE CELL THERAPY |
WO2019060454A2 (en) | 2017-09-20 | 2019-03-28 | 4D Molecular Therapeutics Inc. | CAPSID VARIANT ADENO-ASSOCIATED VIRUSES AND METHODS OF USE |
JP2020537515A (ja) | 2017-10-03 | 2020-12-24 | ジュノー セラピューティクス インコーポレイテッド | Hpv特異的結合分子 |
US11795443B2 (en) | 2017-10-16 | 2023-10-24 | The Broad Institute, Inc. | Uses of adenosine base editors |
WO2019079777A1 (en) | 2017-10-20 | 2019-04-25 | Fred Hutchinson Cancer Research Center | COMPOSITIONS AND METHODS FOR TIGIT AND / OR CD112R TARGETING IMMUNOTHERAPY OR COMPRISING THE OVEREXPRESSION OF CD226 |
US11851679B2 (en) | 2017-11-01 | 2023-12-26 | Juno Therapeutics, Inc. | Method of assessing activity of recombinant antigen receptors |
IL255664A0 (en) | 2017-11-14 | 2017-12-31 | Shachar Idit | Hematopoietic stem cells with enhanced properties |
US20200277573A1 (en) | 2017-11-17 | 2020-09-03 | Iovance Biotherapeutics, Inc. | Til expansion from fine needle aspirates and small biopsies |
JP2021503885A (ja) | 2017-11-22 | 2021-02-15 | アイオバンス バイオセラピューティクス,インコーポレイテッド | 末梢血からの末梢血リンパ球(pbl)の拡大培養 |
CR20200282A (es) | 2017-11-27 | 2021-02-18 | 4D Molecular Therapeutics Inc | Cápsides variantes de virus adenoasociados y su uso para inhibir la angiogénesis |
WO2019109047A1 (en) | 2017-12-01 | 2019-06-06 | Fred Hutchinson Cancer Research Center | Binding proteins specific for 5t4 and uses thereof |
MA50942A (fr) | 2017-12-01 | 2020-10-07 | Encoded Therapeutics Inc | Protéines de liaison à l'adn modifiées |
EP3720509A4 (en) | 2017-12-06 | 2021-12-08 | Memorial Sloan-Kettering Cancer Center | GLOBING THERAPY FOR THE TREATMENT OF HEMOGLOBINOPATHIES |
EP3501268B1 (en) | 2017-12-22 | 2021-09-15 | KWS SAAT SE & Co. KGaA | Regeneration of plants in the presence of histone deacetylase inhibitors |
EP3508581A1 (en) | 2018-01-03 | 2019-07-10 | Kws Saat Se | Regeneration of genetically modified plants |
WO2019140278A1 (en) | 2018-01-11 | 2019-07-18 | Fred Hutchinson Cancer Research Center | Immunotherapy targeting core binding factor antigens |
IL257225A (en) | 2018-01-29 | 2018-04-09 | Yeda Res & Dev | Treatment of sarcoma |
WO2019157324A1 (en) | 2018-02-08 | 2019-08-15 | Sangamo Therapeutics, Inc. | Engineered target specific nucleases |
JP2021514188A (ja) | 2018-02-15 | 2021-06-10 | メモリアル スローン ケタリング キャンサー センター | Foxp3標的因子組成物と養子細胞療法のための使用方法 |
WO2019161151A1 (en) | 2018-02-15 | 2019-08-22 | Monsanto Technology Llc | Compositions and methods for improving crop yields through trait stacking |
WO2019165116A1 (en) | 2018-02-26 | 2019-08-29 | Fred Hutchinson Cancer Research Center | Compositions and methods for cellular immunotherapy |
AU2019236209A1 (en) | 2018-03-14 | 2020-10-01 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
WO2019178613A1 (en) | 2018-03-16 | 2019-09-19 | Immusoft Corporation | B cells genetically engineered to secrete follistatin and methods of using the same to treat follistatin-related diseases, conditions, disorders and to enhance muscle growth and strength |
CN111885915B (zh) | 2018-03-19 | 2023-04-28 | 瑞泽恩制药公司 | 使用crispr/cas系统对动物进行转录调制 |
EP3545756A1 (en) | 2018-03-28 | 2019-10-02 | KWS SAAT SE & Co. KGaA | Regeneration of plants in the presence of inhibitors of the histone methyltransferase ezh2 |
EP3775237A1 (en) | 2018-04-05 | 2021-02-17 | Juno Therapeutics, Inc. | T cells expressing a recombinant receptor, related polynucleotides and methods |
BR112020020245A2 (pt) | 2018-04-05 | 2021-04-06 | Editas Medicine, Inc. | Métodos de produzir células expressando um receptor recombinante e composições relacionadas |
KR20210019993A (ko) | 2018-04-05 | 2021-02-23 | 주노 쎄러퓨티크스 인코퍼레이티드 | Τ 세포 수용체 및 이를 발현하는 조작된 세포 |
WO2019210131A1 (en) | 2018-04-27 | 2019-10-31 | Iovance Biotherapeutics, Inc. | Closed process for expansion and gene editing of tumor infiltrating lymphocytes and uses of same in immunotherapy |
EP3567111A1 (en) | 2018-05-09 | 2019-11-13 | KWS SAAT SE & Co. KGaA | Gene for resistance to a pathogen of the genus heterodera |
US11690921B2 (en) | 2018-05-18 | 2023-07-04 | Sangamo Therapeutics, Inc. | Delivery of target specific nucleases |
GB201809273D0 (en) | 2018-06-06 | 2018-07-25 | Vib Vzw | Novel mutant plant cinnamoyl-coa reductase proteins |
SG11202011962TA (en) | 2018-06-07 | 2020-12-30 | Brigham & Womens Hospital Inc | Methods for generating hematopoietic stem cells |
WO2019238909A1 (en) | 2018-06-15 | 2019-12-19 | KWS SAAT SE & Co. KGaA | Methods for improving genome engineering and regeneration in plant |
US11291176B2 (en) | 2018-06-15 | 2022-04-05 | Nunhems B.V. | Seedless watermelon plants comprising modifications in an ABC transporter gene |
EP3807299A1 (en) | 2018-06-15 | 2021-04-21 | KWS SAAT SE & Co. KGaA | Methods for enhancing genome engineering efficiency |
CA3103500A1 (en) | 2018-06-15 | 2019-12-19 | KWS SAAT SE & Co. KGaA | Methods for improving genome engineering and regeneration in plant ii |
US20220306699A1 (en) * | 2018-06-27 | 2022-09-29 | Altius Institute For Biomedical Sciences | Nucleic Acid Binding Domains and Methods of Use Thereof |
US20210371847A1 (en) * | 2018-06-27 | 2021-12-02 | Altius Institute For Biomedical Sciences | Gapped And Tunable Repeat Units For Use In Genome Editing And Gene Regulation Compositions |
EP3814370A4 (en) * | 2018-06-27 | 2022-06-22 | Altius Institute For Biomedical Sciences | NUCLEASES FOR GENOMIC EDITING |
US20210292381A1 (en) | 2018-07-04 | 2021-09-23 | Ukko Inc. | Methods of de-epitoping wheat proteins and use of same for the treatment of celiac disease |
WO2020018964A1 (en) | 2018-07-20 | 2020-01-23 | Fred Hutchinson Cancer Research Center | Compositions and methods for controlled expression of antigen-specific receptors |
WO2020041501A1 (en) | 2018-08-22 | 2020-02-27 | Fred Hutchinson Cancer Research Center | Immunotherapy targeting kras or her2 antigens |
AU2019326408A1 (en) | 2018-08-23 | 2021-03-11 | Sangamo Therapeutics, Inc. | Engineered target specific base editors |
SG11202101455TA (en) | 2018-08-28 | 2021-03-30 | Hutchinson Fred Cancer Res | Methods and compositions for adoptive t cell therapy incorporating induced notch signaling |
EP3623379A1 (en) | 2018-09-11 | 2020-03-18 | KWS SAAT SE & Co. KGaA | Beet necrotic yellow vein virus (bnyvv)-resistance modifying gene |
WO2020061161A1 (en) | 2018-09-18 | 2020-03-26 | Sangamo Therapeutics, Inc. | Programmed cell death 1 (pd1) specific nucleases |
US20240165232A1 (en) | 2018-09-24 | 2024-05-23 | Fred Hutchinson Cancer Research Center | Chimeric receptor proteins and uses thereof |
IL262658A (en) | 2018-10-28 | 2020-04-30 | Memorial Sloan Kettering Cancer Center | Prevention of age related clonal hematopoiesis and diseases associated therewith |
US20220090018A1 (en) | 2018-11-05 | 2022-03-24 | Iovance Biotherapeutics, Inc. | Processes for production of tumor infiltrating lymphocytes and used of the same in immunotherapy |
WO2020096927A1 (en) | 2018-11-05 | 2020-05-14 | Iovance Biotherapeutics, Inc. | Expansion of tils utilizing akt pathway inhibitors |
AU2019377422A1 (en) | 2018-11-05 | 2021-05-27 | Iovance Biotherapeutics, Inc. | Treatment of NSCLC patients refractory for anti-PD-1 antibody |
EP3877512A2 (en) | 2018-11-05 | 2021-09-15 | Iovance Biotherapeutics, Inc. | Selection of improved tumor reactive t-cells |
WO2020097530A2 (en) | 2018-11-09 | 2020-05-14 | Fred Hutchinson Cancer Research Center | Immunotherapy targeting mesothelin |
EA202191463A1 (ru) | 2018-11-28 | 2021-10-13 | Борд Оф Риджентс, Дзе Юниверсити Оф Техас Систем | Мультиплексное редактирование генома иммунных клеток для повышения функциональности и устойчивости к подавляющей среде |
AU2019390394B2 (en) | 2018-11-28 | 2023-11-30 | Forty Seven, Inc. | Genetically modified HSPCs resistant to ablation regime |
CA3121210A1 (en) | 2018-11-29 | 2020-06-04 | Board Of Regents, The University Of Texas System | Methods for ex vivo expansion of natural killer cells and use thereof |
GB201820109D0 (en) | 2018-12-11 | 2019-01-23 | Vib Vzw | Plants with a lignin trait and udp-glycosyltransferase mutation |
JP2022514023A (ja) | 2018-12-19 | 2022-02-09 | アイオバンス バイオセラピューティクス,インコーポレイテッド | 操作されたサイトカイン受容体対を使用して腫瘍浸潤リンパ球を拡大培養する方法及びその使用 |
MX2021008358A (es) | 2019-01-11 | 2021-09-30 | Acuitas Therapeutics Inc | Lipidos para la administracion de agentes activos en nanoparticulas lipidicas. |
EP3918080A1 (en) | 2019-01-29 | 2021-12-08 | The University Of Warwick | Methods for enhancing genome engineering efficiency |
WO2020163017A1 (en) | 2019-02-06 | 2020-08-13 | Klogenix Llc | Dna binding proteins and uses thereof |
CN112805026A (zh) | 2019-02-06 | 2021-05-14 | 桑格摩生物治疗股份有限公司 | 用于治疗i型黏多糖贮积症的方法 |
CA3130618A1 (en) | 2019-02-20 | 2020-08-27 | Fred Hutchinson Cancer Research Center | Binding proteins specific for ras neoantigens and uses thereof |
AU2020233284A1 (en) | 2019-03-01 | 2021-09-16 | Iovance Biotherapeutics, Inc. | Expansion of tumor infiltrating lymphocytes from liquid tumors and therapeutic uses thereof |
BR112021017265A2 (pt) | 2019-03-05 | 2021-12-21 | The State Of Israel Ministry Of Agriculture & Rural Development Agricultural Res Organization Aro Vo | Agente de edição de dna, população de células de aves, ave quimérica, método para gerar uma ave quimérica e método para induzir letalidade em um embrião macho de uma ave |
MX2021010831A (es) | 2019-03-08 | 2021-12-15 | Obsidian Therapeutics Inc | Composiciones de ligando del cumulo de diferenciación 40 (cd40l) y métodos para regulación ajustable. |
WO2020185796A1 (en) | 2019-03-11 | 2020-09-17 | Fred Hutchinson Cancer Research Center | High avidity wt1 t cell receptors and uses thereof |
EP3708651A1 (en) | 2019-03-12 | 2020-09-16 | KWS SAAT SE & Co. KGaA | Improving plant regeneration |
US11781131B2 (en) | 2019-03-18 | 2023-10-10 | Regeneron Pharmaceuticals, Inc. | CRISPR/Cas dropout screening platform to reveal genetic vulnerabilities associated with tau aggregation |
SG11202108091YA (en) | 2019-03-18 | 2021-08-30 | Regeneron Pharma | Crispr/cas screening platform to identify genetic modifiers of tau seeding or aggregation |
DE112020001342T5 (de) | 2019-03-19 | 2022-01-13 | President and Fellows of Harvard College | Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen |
SG11202110607WA (en) | 2019-04-01 | 2021-10-28 | Tenaya Therapeutics Inc | Adeno-associated virus with engineered capsid |
MX2021012152A (es) | 2019-04-02 | 2021-11-03 | Sangamo Therapeutics Inc | Metodos para el tratamiento de beta-talasemia. |
SG11202108451VA (en) | 2019-04-03 | 2021-09-29 | Regeneron Pharma | Methods and compositions for insertion of antibody coding sequences into a safe harbor locus |
WO2020209332A1 (ja) | 2019-04-09 | 2020-10-15 | 国立研究開発法人科学技術振興機構 | 核酸結合性タンパク質 |
AU2020262281A1 (en) | 2019-04-23 | 2021-11-04 | Sangamo Therapeutics, Inc. | Modulators of chromosome 9 open reading frame 72 gene expression and uses thereof |
TW202106699A (zh) | 2019-04-26 | 2021-02-16 | 美商愛德維仁生物科技公司 | 用於玻璃體內遞送之變異體aav蛋白殼 |
CA3137961A1 (en) | 2019-04-26 | 2020-10-29 | Sangamo Therapeutics, Inc. | Engineering aav |
KR20220016474A (ko) | 2019-05-01 | 2022-02-09 | 주노 쎄러퓨티크스 인코퍼레이티드 | 변형된 cd247 유전자 자리로부터 키메라 수용체를 발현하는 세포, 관련 폴리뉴클레오타이드 및 방법 |
AU2020265741A1 (en) | 2019-05-01 | 2021-11-25 | Editas Medicine, Inc. | Cells expressing a recombinant receptor from a modified TGFBR2 Locus, related polynucleotides and methods |
WO2020232029A1 (en) | 2019-05-13 | 2020-11-19 | Iovance Biotherapeutics, Inc. | Methods and compositions for selecting tumor infiltrating lymphocytes and uses of the same in immunotherapy |
PL3840767T3 (pl) * | 2019-05-29 | 2024-03-04 | Hubro Therapeutics As | Peptydy |
WO2020244759A1 (en) | 2019-06-05 | 2020-12-10 | Klemm & Sohn Gmbh & Co. Kg | New plants having a white foliage phenotype |
JP2022536606A (ja) | 2019-06-14 | 2022-08-18 | リジェネロン・ファーマシューティカルズ・インコーポレイテッド | タウオパチーのモデル |
EP3757219A1 (en) | 2019-06-28 | 2020-12-30 | KWS SAAT SE & Co. KGaA | Enhanced plant regeneration and transformation by using grf1 booster gene |
CN114938647A (zh) | 2019-07-04 | 2022-08-23 | 乌科公司 | 去表位的α-麦醇溶蛋白及其在乳糜泻和麸质敏感性管理中的用途 |
IL268111A (en) | 2019-07-16 | 2021-01-31 | Fainzilber Michael | Methods of treating pain |
US20220267737A1 (en) | 2019-07-18 | 2022-08-25 | University Of Rochester | Cell-type selective immunoprotection of cells |
CN114222815A (zh) | 2019-07-23 | 2022-03-22 | 记忆疗法公司 | Suv39h1缺陷的免疫细胞 |
US10501404B1 (en) | 2019-07-30 | 2019-12-10 | Factor Bioscience Inc. | Cationic lipids and transfection methods |
JP2022543112A (ja) | 2019-08-01 | 2022-10-07 | サナ バイオテクノロジー,インコーポレイテッド | Dux4発現細胞およびそれらの使用 |
AU2020334064A1 (en) | 2019-08-20 | 2022-03-03 | Fred Hutchinson Cancer Center | T-cell immunotherapy specific for WT-1 |
AU2020336302A1 (en) | 2019-08-23 | 2022-03-03 | Sana Biotechnology, Inc. | CD24 expressing cells and uses thereof |
CN114616002A (zh) | 2019-09-13 | 2022-06-10 | 瑞泽恩制药公司 | 使用由脂质纳米颗粒递送的crispr/cas系统在动物中进行的转录调控 |
WO2021067864A1 (en) | 2019-10-02 | 2021-04-08 | Sangamo Therapeutics, Inc. | Zinc finger protein transcription factors for treatment of prion disease |
EP4041897A1 (en) * | 2019-10-11 | 2022-08-17 | Basf Plant Science Company GmbH | Increase in corn transformation efficacy by the n-terminus of a tale |
CA3155727A1 (en) | 2019-10-25 | 2021-04-29 | Cecile Chartier-Courtaud | Gene editing of tumor infiltrating lymphocytes and uses of same in immunotherapy |
IL270306A (en) | 2019-10-30 | 2021-05-31 | Yeda Res & Dev | Prevention and treatment of pre-myeloid and myeloid malignancies |
EP4051787A1 (en) | 2019-11-01 | 2022-09-07 | Sangamo Therapeutics, Inc. | Gin recombinase variants |
AU2020376048A1 (en) | 2019-11-01 | 2022-06-02 | Sangamo Therapeutics, Inc. | Compositions and methods for genome engineering |
CN114746125A (zh) | 2019-11-08 | 2022-07-12 | 瑞泽恩制药公司 | 用于x连锁青少年型视网膜劈裂症疗法的crispr和aav策略 |
BR112022009067A2 (pt) | 2019-11-12 | 2022-08-09 | Kws Saat Se & Co Kgaa | Gene para resistência a um patógeno do gênero heterodera |
WO2021108363A1 (en) | 2019-11-25 | 2021-06-03 | Regeneron Pharmaceuticals, Inc. | Crispr/cas-mediated upregulation of humanized ttr allele |
CA3161104A1 (en) | 2019-12-11 | 2021-06-17 | Cecile Chartier-Courtaud | Processes for the production of tumor infiltrating lymphocytes (tils) and methods of using the same |
IL271656A (en) | 2019-12-22 | 2021-06-30 | Yeda Res & Dev | System and methods for identifying cells that have undergone genome editing |
US20230056856A1 (en) | 2020-01-08 | 2023-02-23 | Obsidian Therapeutics, Inc. | Compositions and methods for tunable regulation of transcription |
WO2021152587A1 (en) | 2020-01-30 | 2021-08-05 | Yeda Research And Development Co. Ltd. | Treating acute liver disease with tlr-mik inhibitors |
AU2021232598A1 (en) | 2020-03-04 | 2022-09-08 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for sensitization of tumor cells to immune therapy |
WO2021195079A1 (en) | 2020-03-23 | 2021-09-30 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use |
CA3173096A1 (en) | 2020-03-25 | 2021-09-30 | Sonja SCHREPFER | Hypoimmunogenic neural cells for the treatment of neurological disorders and conditions |
IL297851A (en) | 2020-05-04 | 2023-01-01 | Saliogen Therapeutics Inc | Transposition-based treatments |
EP4146794A1 (en) | 2020-05-04 | 2023-03-15 | Iovance Biotherapeutics, Inc. | Processes for production of tumor infiltrating lymphocytes and uses of the same in immunotherapy |
US20230212613A1 (en) | 2020-05-06 | 2023-07-06 | Cellectis S.A. | Methods for targeted insertion of exogenous sequences in cellular genomes |
CN115715203A (zh) | 2020-05-06 | 2023-02-24 | 塞勒克提斯公司 | 对细胞进行基因修饰以递送治疗性蛋白质的方法 |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
CN115835873A (zh) | 2020-05-13 | 2023-03-21 | 朱诺治疗学股份有限公司 | 用于产生表达重组受体的供体分批细胞的方法 |
CN111518220A (zh) * | 2020-05-14 | 2020-08-11 | 重庆英茂盛业生物科技有限公司 | 一种融合蛋白及其设计方法 |
US20230190871A1 (en) | 2020-05-20 | 2023-06-22 | Sana Biotechnology, Inc. | Methods and compositions for treatment of viral infections |
EP4153741A1 (en) | 2020-05-21 | 2023-03-29 | Oxford Genetics Limited | Hdr enhancers |
GB202007577D0 (en) | 2020-05-21 | 2020-07-08 | Oxford Genetics Ltd | Hdr enhancers |
GB202007578D0 (en) | 2020-05-21 | 2020-07-08 | Univ Oxford Innovation Ltd | Hdr enhancers |
WO2021234388A1 (en) | 2020-05-21 | 2021-11-25 | Oxford Genetics Limited | Hdr enhancers |
WO2021247836A1 (en) | 2020-06-03 | 2021-12-09 | Board Of Regents, The University Of Texas System | Methods for targeting shp-2 to overcome resistance |
JP2023531531A (ja) | 2020-06-26 | 2023-07-24 | ジュノ セラピューティクス ゲーエムベーハー | 組換え受容体を条件付きで発現する操作されたt細胞、関連ポリヌクレオチド、および方法 |
US11976019B2 (en) | 2020-07-16 | 2024-05-07 | Acuitas Therapeutics, Inc. | Cationic lipids for use in lipid nanoparticles |
AU2021316727A1 (en) | 2020-07-30 | 2023-03-02 | INSERM (Institut National de la Santé et de la Recherche Médicale) | Immune cells defective for SOCS1 |
IL300516A (en) | 2020-08-13 | 2023-04-01 | Sana Biotechnology Inc | Methods for treating susceptible patients with hypoimmunogenic cells, and related methods and compounds |
EP4204545A2 (en) | 2020-08-25 | 2023-07-05 | Kite Pharma, Inc. | T cells with improved functionality |
WO2022066973A1 (en) | 2020-09-24 | 2022-03-31 | Fred Hutchinson Cancer Research Center | Immunotherapy targeting pbk or oip5 antigens |
WO2022066965A2 (en) | 2020-09-24 | 2022-03-31 | Fred Hutchinson Cancer Research Center | Immunotherapy targeting sox2 antigens |
KR20230074519A (ko) | 2020-09-25 | 2023-05-30 | 상가모 테라퓨틱스, 인코포레이티드 | 핵염기 편집을 위한 아연 핑거 융합 단백질 |
EP4225902A1 (en) | 2020-10-05 | 2023-08-16 | Protalix Ltd. | Dicer-like knock-out plant cells |
WO2022076606A1 (en) | 2020-10-06 | 2022-04-14 | Iovance Biotherapeutics, Inc. | Treatment of nsclc patients with tumor infiltrating lymphocyte therapies |
EP4225330A1 (en) | 2020-10-06 | 2023-08-16 | Iovance Biotherapeutics, Inc. | Treatment of nsclc patients with tumor infiltrating lymphocyte therapies |
WO2022076353A1 (en) | 2020-10-06 | 2022-04-14 | Fred Hutchinson Cancer Research Center | Compositions and methods for treating mage-a1-expressing disease |
WO2022079719A1 (en) | 2020-10-15 | 2022-04-21 | Yeda Research And Development Co. Ltd. | Method of treating myeloid malignancies |
CN116802203A (zh) | 2020-11-04 | 2023-09-22 | 朱诺治疗学股份有限公司 | 从经修饰的恒定cd3免疫球蛋白超家族链基因座表达嵌合受体的细胞、相关多核苷酸和方法 |
AU2021378791A1 (en) * | 2020-11-11 | 2023-06-15 | Monsanto Technology Llc | Methods to improve site-directed integration frequency |
WO2022104109A1 (en) | 2020-11-13 | 2022-05-19 | Catamaran Bio, Inc. | Genetically modified natural killer cells and methods of use thereof |
CN117042600A (zh) | 2020-11-16 | 2023-11-10 | 猪改良英国有限公司 | 具有经编辑的anp32基因的抗甲型流感动物 |
US20220162288A1 (en) | 2020-11-25 | 2022-05-26 | Catamaran Bio, Inc. | Cellular therapeutics engineered with signal modulators and methods of use thereof |
AU2021387979A1 (en) | 2020-11-26 | 2023-03-30 | Ukko Inc. | Modified high molecular weight glutenin subunit and uses thereof |
WO2022120022A1 (en) | 2020-12-02 | 2022-06-09 | Regeneron Pharmaceuticals, Inc. | Crispr sam biosensor cell lines and methods of use thereof |
CA3201767A1 (en) | 2020-12-14 | 2022-06-23 | Thomas M. Schmitt | Compositions and methods for cellular immunotherapy |
JP2024500403A (ja) | 2020-12-17 | 2024-01-09 | アイオバンス バイオセラピューティクス,インコーポレイテッド | 腫瘍浸潤リンパ球によるがんの治療 |
IL279559A (en) | 2020-12-17 | 2022-07-01 | Yeda Res & Dev | Controlling the ubiquitination process of mlkl for disease treatment |
EP4262811A1 (en) | 2020-12-17 | 2023-10-25 | Iovance Biotherapeutics, Inc. | Treatment with tumor infiltrating lymphocyte therapies in combination with ctla-4 and pd-1 inhibitors |
EP4263832A2 (en) | 2020-12-18 | 2023-10-25 | Yeda Research and Development Co. Ltd | Compositions for use in the treatment of chd2 haploinsufficiency and methods of identifying same |
EP4019639A1 (en) | 2020-12-22 | 2022-06-29 | KWS SAAT SE & Co. KGaA | Promoting regeneration and transformation in beta vulgaris |
EP4019638A1 (en) | 2020-12-22 | 2022-06-29 | KWS SAAT SE & Co. KGaA | Promoting regeneration and transformation in beta vulgaris |
AU2021412988A1 (en) | 2020-12-31 | 2023-06-15 | Sana Biotechnology, Inc. | Methods and compositions for modulating car-t activity |
TW202241508A (zh) | 2021-01-29 | 2022-11-01 | 美商艾歐凡斯生物治療公司 | 細胞介素相關之腫瘤浸潤性淋巴球組合物及方法 |
WO2022198141A1 (en) | 2021-03-19 | 2022-09-22 | Iovance Biotherapeutics, Inc. | Methods for tumor infiltrating lymphocyte (til) expansion related to cd39/cd69 selection and gene knockout in tils |
EP4314280A1 (en) | 2021-03-22 | 2024-02-07 | Juno Therapeutics, Inc. | Method to assess potency of viral vector particles |
AR125199A1 (es) | 2021-03-23 | 2023-06-21 | Iovance Biotherapeutics Inc | Edición génica cish de linfocitos infiltrantes de tumores y usos de los mismos en inmunoterapia |
TW202308669A (zh) | 2021-04-19 | 2023-03-01 | 美商艾歐凡斯生物治療公司 | 嵌合共刺激性受體、趨化激素受體及彼等於細胞免疫治療之用途 |
EP4334438A1 (en) | 2021-05-05 | 2024-03-13 | Fujifilm Cellular Dynamics, Inc. | Methods and compositions for ipsc-derived microglia |
US20240316006A1 (en) | 2021-05-10 | 2024-09-26 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Pharmaceutical compositions for treating neurological conditions |
WO2022241227A1 (en) | 2021-05-14 | 2022-11-17 | Akoya Biosciences, Inc. | Amplification of rna detection signals in biological samples |
EP4340850A1 (en) | 2021-05-17 | 2024-03-27 | Iovance Biotherapeutics, Inc. | Pd-1 gene-edited tumor infiltrating lymphocytes and uses of same in immunotherapy |
US20220389436A1 (en) | 2021-05-26 | 2022-12-08 | FUJIFILM Cellular Dynamics, Inc. | Methods to prevent rapid silencing of genes in pluripotent stem cells |
KR20240013135A (ko) | 2021-05-27 | 2024-01-30 | 사나 바이오테크놀로지, 인크. | 조작된 hla-e 또는 hla-g를 포함하는 저면역원성 세포 |
WO2022264132A1 (en) | 2021-06-13 | 2022-12-22 | Yissum Research Development Company Of The Hebrew University Of Jerusalem Ltd. | Method for reprogramming human cells |
EP4370544A2 (en) | 2021-07-14 | 2024-05-22 | Sana Biotechnology, Inc. | Altered expression of y chromosome-linked antigens in hypoimmunogenic cells |
WO2023288281A2 (en) | 2021-07-15 | 2023-01-19 | Fred Hutchinson Cancer Center | Chimeric polypeptides |
EP4377446A1 (en) | 2021-07-28 | 2024-06-05 | Iovance Biotherapeutics, Inc. | Treatment of cancer patients with tumor infiltrating lymphocyte therapies in combination with kras inhibitors |
CA3227103A1 (en) | 2021-07-30 | 2023-02-02 | Matthew P. GEMBERLING | Compositions and methods for modulating expression of frataxin (fxn) |
EP4377460A1 (en) | 2021-07-30 | 2024-06-05 | Tune Therapeutics, Inc. | Compositions and methods for modulating expression of methyl-cpg binding protein 2 (mecp2) |
JP2024536647A (ja) | 2021-08-03 | 2024-10-07 | ジェニシティー リミテッド | 操作されたtcr複合体及びそれを使用する方法 |
WO2023014825A1 (en) | 2021-08-03 | 2023-02-09 | Akoya Biosciences, Inc. | Rna detection by selective labeling and amplification |
EP4130028A1 (en) | 2021-08-03 | 2023-02-08 | Rhazes Therapeutics Ltd | Engineered tcr complex and methods of using same |
WO2023014922A1 (en) | 2021-08-04 | 2023-02-09 | The Regents Of The University Of Colorado, A Body Corporate | Lat activating chimeric antigen receptor t cells and methods of use thereof |
AU2022325955A1 (en) | 2021-08-11 | 2024-02-08 | Sana Biotechnology, Inc. | Genetically modified cells for allogeneic cell therapy to reduce instant blood mediated inflammatory reactions |
WO2023019227A1 (en) | 2021-08-11 | 2023-02-16 | Sana Biotechnology, Inc. | Genetically modified cells for allogeneic cell therapy to reduce complement-mediated inflammatory reactions |
AU2022325232A1 (en) | 2021-08-11 | 2024-02-08 | Sana Biotechnology, Inc. | Genetically modified primary cells for allogeneic cell therapy |
JP2024534772A (ja) | 2021-08-11 | 2024-09-26 | サナ バイオテクノロジー,インコーポレイテッド | 同種異系細胞療法用の遺伝子改変細胞 |
MX2024001443A (es) | 2021-08-11 | 2024-05-15 | Sana Biotechnology Inc | Sistemas inducibles para alterar la expresión génica en células hipoinmunógenas. |
WO2023039488A1 (en) | 2021-09-09 | 2023-03-16 | Iovance Biotherapeutics, Inc. | Processes for generating til products using pd-1 talen knockdown |
CN118234849A (zh) | 2021-09-10 | 2024-06-21 | 富士胶片细胞动力公司 | 诱导多能干细胞衍生细胞的组合物及其使用方法 |
KR20240055084A (ko) | 2021-09-13 | 2024-04-26 | 라이프 테크놀로지스 코포레이션 | 유전자 편집 도구 |
EP4415539A1 (en) | 2021-10-14 | 2024-08-21 | Weedout Ltd. | Methods of weed control |
WO2023069790A1 (en) | 2021-10-22 | 2023-04-27 | Sana Biotechnology, Inc. | Methods of engineering allogeneic t cells with a transgene in a tcr locus and associated compositions and methods |
WO2023076880A1 (en) | 2021-10-25 | 2023-05-04 | Board Of Regents, The University Of Texas System | Foxo1-targeted therapy for the treatment of cancer |
EP4423755A2 (en) | 2021-10-27 | 2024-09-04 | Iovance Biotherapeutics, Inc. | Systems and methods for coordinating manufacturing of cells for patient-specific immunotherapy |
CA3232470A1 (en) | 2021-10-27 | 2023-05-04 | Leah SABIN | Compositions and methods for expressing factor ix for hemophilia b therapy |
CN118251491A (zh) | 2021-10-28 | 2024-06-25 | 瑞泽恩制药公司 | 用于敲除C5的CRISPR/Cas相关方法及组合物 |
CA3235390A1 (en) | 2021-10-29 | 2023-05-04 | Deepika Rajesh | Dopaminergic neurons comprising mutations and methods of use thereof |
WO2023081900A1 (en) | 2021-11-08 | 2023-05-11 | Juno Therapeutics, Inc. | Engineered t cells expressing a recombinant t cell receptor (tcr) and related systems and methods |
CA3238939A1 (en) | 2021-12-08 | 2023-06-15 | Gaurang Patel | Mutant myocilin disease model and uses thereof |
WO2023105244A1 (en) | 2021-12-10 | 2023-06-15 | Pig Improvement Company Uk Limited | Editing tmprss2/4 for disease resistance in livestock |
GB202118058D0 (en) | 2021-12-14 | 2022-01-26 | Univ Warwick | Methods to increase yields in crops |
WO2023122722A1 (en) | 2021-12-22 | 2023-06-29 | Sangamo Therapeutics, Inc. | Novel zinc finger fusion proteins for nucleobase editing |
KR20240137574A (ko) | 2021-12-23 | 2024-09-20 | 사나 바이오테크놀로지, 인크. | 자가면역 질환 치료를 위한 키메라 항원 수용체[chimeric antigen receptor, car] t 세포 및 관련 방법 |
WO2023126458A1 (en) | 2021-12-28 | 2023-07-06 | Mnemo Therapeutics | Immune cells with inactivated suv39h1 and modified tcr |
WO2023129940A1 (en) | 2021-12-30 | 2023-07-06 | Regel Therapeutics, Inc. | Compositions for modulating expression of sodium voltage-gated channel alpha subunit 1 and uses thereof |
WO2023131616A1 (en) | 2022-01-05 | 2023-07-13 | Vib Vzw | Means and methods to increase abiotic stress tolerance in plants |
WO2023131637A1 (en) | 2022-01-06 | 2023-07-13 | Vib Vzw | Improved silage grasses |
WO2023137471A1 (en) | 2022-01-14 | 2023-07-20 | Tune Therapeutics, Inc. | Compositions, systems, and methods for programming t cell phenotypes through targeted gene activation |
WO2023137472A2 (en) | 2022-01-14 | 2023-07-20 | Tune Therapeutics, Inc. | Compositions, systems, and methods for programming t cell phenotypes through targeted gene repression |
WO2023144199A1 (en) | 2022-01-26 | 2023-08-03 | Vib Vzw | Plants having reduced levels of bitter taste metabolites |
WO2023147488A1 (en) | 2022-01-28 | 2023-08-03 | Iovance Biotherapeutics, Inc. | Cytokine associated tumor infiltrating lymphocytes compositions and methods |
WO2023150623A2 (en) | 2022-02-02 | 2023-08-10 | Regeneron Pharmaceuticals, Inc. | Anti-tfr:gaa and anti-cd63:gaa insertion for treatment of pompe disease |
WO2023150798A1 (en) | 2022-02-07 | 2023-08-10 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for defining optimal treatment timeframes in lysosomal disease |
WO2023154578A1 (en) | 2022-02-14 | 2023-08-17 | Sana Biotechnology, Inc. | Methods of treating patients exhibiting a prior failed therapy with hypoimmunogenic cells |
AU2023220128A1 (en) | 2022-02-17 | 2024-08-22 | Sana Biotechnology, Inc. | Engineered cd47 proteins and uses thereof |
TW202340457A (zh) | 2022-02-28 | 2023-10-16 | 美商凱特製藥公司 | 同種異體治療細胞 |
WO2023173123A1 (en) | 2022-03-11 | 2023-09-14 | Sana Biotechnology, Inc. | Genetically modified cells and compositions and uses thereof |
WO2023196877A1 (en) | 2022-04-06 | 2023-10-12 | Iovance Biotherapeutics, Inc. | Treatment of nsclc patients with tumor infiltrating lymphocyte therapies |
TW202404993A (zh) | 2022-04-11 | 2024-02-01 | 美商特納亞治療股份有限公司 | 具經工程化蛋白殼之腺相關病毒 |
WO2023201369A1 (en) | 2022-04-15 | 2023-10-19 | Iovance Biotherapeutics, Inc. | Til expansion processes using specific cytokine combinations and/or akti treatment |
WO2023220035A1 (en) | 2022-05-09 | 2023-11-16 | Synteny Therapeutics, Inc. | Erythroparvovirus compositions and methods for gene therapy |
WO2023220040A1 (en) | 2022-05-09 | 2023-11-16 | Synteny Therapeutics, Inc. | Erythroparvovirus with a modified capsid for gene therapy |
WO2023220043A1 (en) | 2022-05-09 | 2023-11-16 | Synteny Therapeutics, Inc. | Erythroparvovirus with a modified genome for gene therapy |
WO2023220608A1 (en) | 2022-05-10 | 2023-11-16 | Iovance Biotherapeutics, Inc. | Treatment of cancer patients with tumor infiltrating lymphocyte therapies in combination with an il-15r agonist |
EP4279085A1 (en) | 2022-05-20 | 2023-11-22 | Mnemo Therapeutics | Compositions and methods for treating a refractory or relapsed cancer or a chronic infectious disease |
WO2023240282A1 (en) | 2022-06-10 | 2023-12-14 | Umoja Biopharma, Inc. | Engineered stem cells and uses thereof |
WO2023250511A2 (en) | 2022-06-24 | 2023-12-28 | Tune Therapeutics, Inc. | Compositions, systems, and methods for reducing low-density lipoprotein through targeted gene repression |
US20240003871A1 (en) | 2022-06-29 | 2024-01-04 | FUJIFILM Cellular Dynamics, Inc. | Ipsc-derived astrocytes and methods of use thereof |
GB2621813A (en) | 2022-06-30 | 2024-02-28 | Univ Newcastle | Preventing disease recurrence in Mitochondrial replacement therapy |
WO2024015881A2 (en) | 2022-07-12 | 2024-01-18 | Tune Therapeutics, Inc. | Compositions, systems, and methods for targeted transcriptional activation |
WO2024013514A2 (en) | 2022-07-15 | 2024-01-18 | Pig Improvement Company Uk Limited | Gene edited livestock animals having coronavirus resistance |
WO2024026474A1 (en) | 2022-07-29 | 2024-02-01 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for transferrin receptor (tfr)-mediated delivery to the brain and muscle |
US20240067968A1 (en) | 2022-08-19 | 2024-02-29 | Tune Therapeutics, Inc. | Compositions, systems, and methods for regulation of hepatitis b virus through targeted gene repression |
TW202426633A (zh) | 2022-09-09 | 2024-07-01 | 美商艾歐凡斯生物治療公司 | 使用pd-1/tigit talen雙重基因減弱生成til產物之方法 |
TW202426634A (zh) | 2022-09-09 | 2024-07-01 | 美商艾歐凡斯生物治療公司 | 使用pd─1/tigit talen雙重基因減弱生成til產物之方法 |
WO2024064642A2 (en) | 2022-09-19 | 2024-03-28 | Tune Therapeutics, Inc. | Compositions, systems, and methods for modulating t cell function |
WO2024062138A1 (en) | 2022-09-23 | 2024-03-28 | Mnemo Therapeutics | Immune cells comprising a modified suv39h1 gene |
WO2024073606A1 (en) | 2022-09-28 | 2024-04-04 | Regeneron Pharmaceuticals, Inc. | Antibody resistant modified receptors to enhance cell-based therapies |
US20240182561A1 (en) | 2022-11-04 | 2024-06-06 | Regeneron Pharmaceuticals, Inc. | Calcium voltage-gated channel auxiliary subunit gamma 1 (cacng1) binding proteins and cacng1-mediated delivery to skeletal muscle |
WO2024098024A1 (en) | 2022-11-04 | 2024-05-10 | Iovance Biotherapeutics, Inc. | Expansion of tumor infiltrating lymphocytes from liquid tumors and therapeutic uses thereof |
WO2024098027A1 (en) | 2022-11-04 | 2024-05-10 | Iovance Biotherapeutics, Inc. | Methods for tumor infiltrating lymphocyte (til) expansion related to cd39/cd103 selection |
WO2024100604A1 (en) | 2022-11-09 | 2024-05-16 | Juno Therapeutics Gmbh | Methods for manufacturing engineered immune cells |
WO2024107765A2 (en) | 2022-11-14 | 2024-05-23 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for fibroblast growth factor receptor 3-mediated delivery to astrocytes |
WO2024107670A1 (en) | 2022-11-16 | 2024-05-23 | Regeneron Pharmaceuticals, Inc. | Chimeric proteins comprising membrane bound il-12 with protease cleavable linkers |
WO2024112711A2 (en) | 2022-11-21 | 2024-05-30 | Iovance Biotherapeutics, Inc. | Methods for assessing proliferation potency of gene-edited t cells |
WO2024137677A1 (en) | 2022-12-19 | 2024-06-27 | FUJIFILM Holdings America Corporation | Extracellular vesicle-enriched secretome composition derived from induced pluripotent stem cell derived-microglia and methods of use thereof |
WO2024151541A1 (en) | 2023-01-09 | 2024-07-18 | Sana Biotechnology, Inc. | Type-1 diabetes autoimmune mouse |
WO2024163678A2 (en) | 2023-02-01 | 2024-08-08 | Tune Therapeutics, Inc. | Fusion proteins and systems for targeted activation of frataxin (fxn) and related methods |
WO2024163683A2 (en) | 2023-02-01 | 2024-08-08 | Tune Therapeutics, Inc. | Systems, compositions, and methods for modulating expression of methyl-cpg binding protein 2 (mecp2) and x-inactive specific transcript (xist) |
WO2024161358A1 (en) | 2023-02-01 | 2024-08-08 | Dlf Seeds A/S | Beet yellows virus resistance |
WO2024161021A1 (en) | 2023-02-03 | 2024-08-08 | Juno Therapeutics Gmbh | Methods for non-viral manufacturing of engineered immune cells |
WO2024187174A2 (en) | 2023-03-09 | 2024-09-12 | Aadigen, Llc | Compositions for treating cancer with kras mutations and uses thereof |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6200759B1 (en) * | 1996-08-23 | 2001-03-13 | President And Fellows Of Harvard College | Interaction trap assay, reagents and uses thereof |
WO2010079430A1 (en) * | 2009-01-12 | 2010-07-15 | Ulla Bonas | Modular dna-binding domains and methods of use |
WO2011072246A2 (en) * | 2009-12-10 | 2011-06-16 | Regents Of The University Of Minnesota | Tal effector-mediated dna modification |
Family Cites Families (136)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4179337A (en) | 1973-07-20 | 1979-12-18 | Davis Frank F | Non-immunogenic polypeptides |
US4217344A (en) | 1976-06-23 | 1980-08-12 | L'oreal | Compositions containing aqueous dispersions of lipid spheres |
US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
US4186183A (en) | 1978-03-29 | 1980-01-29 | The United States Of America As Represented By The Secretary Of The Army | Liposome carriers in chemotherapy of leishmaniasis |
US4261975A (en) | 1979-09-19 | 1981-04-14 | Merck & Co., Inc. | Viral liposome particle |
US4485054A (en) | 1982-10-04 | 1984-11-27 | Lipoderm Pharmaceuticals Limited | Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV) |
US4535060A (en) | 1983-01-05 | 1985-08-13 | Calgene, Inc. | Inhibition resistant 5-enolpyruvyl-3-phosphoshikimate synthetase, production and use |
US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
US4761373A (en) | 1984-03-06 | 1988-08-02 | Molecular Genetics, Inc. | Herbicide resistance in plants |
US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US4774085A (en) | 1985-07-09 | 1988-09-27 | 501 Board of Regents, Univ. of Texas | Pharmaceutical administration systems containing a mixture of immunomodulators |
US4940835A (en) | 1985-10-29 | 1990-07-10 | Monsanto Company | Glyphosate-resistant plants |
CA1293460C (en) | 1985-10-07 | 1991-12-24 | Brian Lee Sauer | Site-specific recombination of dna in yeast |
US4810648A (en) | 1986-01-08 | 1989-03-07 | Rhone Poulenc Agrochimie | Haloarylnitrile degrading gene, its use, and cells containing the gene |
DE3765449D1 (de) | 1986-03-11 | 1990-11-15 | Plant Genetic Systems Nv | Durch gentechnologie erhaltene und gegen glutaminsynthetase-inhibitoren resistente pflanzenzellen. |
US4975374A (en) | 1986-03-18 | 1990-12-04 | The General Hospital Corporation | Expression of wild type and mutant glutamine synthetase in foreign hosts |
US5276268A (en) | 1986-08-23 | 1994-01-04 | Hoechst Aktiengesellschaft | Phosphinothricin-resistance gene, and its use |
US5273894A (en) | 1986-08-23 | 1993-12-28 | Hoechst Aktiengesellschaft | Phosphinothricin-resistance gene, and its use |
US5013659A (en) | 1987-07-27 | 1991-05-07 | E. I. Du Pont De Nemours And Company | Nucleic acid fragment encoding herbicide resistant plant acetolactate synthase |
US5422251A (en) | 1986-11-26 | 1995-06-06 | Princeton University | Triple-stranded nucleic acids |
US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
US5006333A (en) | 1987-08-03 | 1991-04-09 | Ddi Pharmaceuticals, Inc. | Conjugates of superoxide dismutase coupled to high molecular weight polyalkylene glycols |
US5162602A (en) | 1988-11-10 | 1992-11-10 | Regents Of The University Of Minnesota | Corn plants tolerant to sethoxydim and haloxyfop herbicides |
US5176996A (en) | 1988-12-20 | 1993-01-05 | Baylor College Of Medicine | Method for making synthetic oligonucleotides which bind specifically to target sites on duplex DNA molecules, by forming a colinear triplex, the synthetic oligonucleotides and methods of use |
US5501967A (en) | 1989-07-26 | 1996-03-26 | Mogen International, N.V./Rijksuniversiteit Te Leiden | Process for the site-directed integration of DNA into the genome of plants |
US5484956A (en) | 1990-01-22 | 1996-01-16 | Dekalb Genetics Corporation | Fertile transgenic Zea mays plant comprising heterologous DNA encoding Bacillus thuringiensis endotoxin |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
AU7979491A (en) | 1990-05-03 | 1991-11-27 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
US5204253A (en) | 1990-05-29 | 1993-04-20 | E. I. Du Pont De Nemours And Company | Method and apparatus for introducing biological substances into living cells |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
US5767366A (en) | 1991-02-19 | 1998-06-16 | Louisiana State University Board Of Supervisors, A Governing Body Of Louisiana State University Agricultural And Mechanical College | Mutant acetolactate synthase gene from Ararbidopsis thaliana for conferring imidazolinone resistance to crop plants |
US5420032A (en) | 1991-12-23 | 1995-05-30 | Universitge Laval | Homing endonuclease which originates from chlamydomonas eugametos and recognizes and cleaves a 15, 17 or 19 degenerate double stranded nucleotide sequence |
US5436150A (en) | 1992-04-03 | 1995-07-25 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease |
US5487994A (en) | 1992-04-03 | 1996-01-30 | The Johns Hopkins University | Insertion and deletion mutants of FokI restriction endonuclease |
US5356802A (en) | 1992-04-03 | 1994-10-18 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease |
US5792640A (en) | 1992-04-03 | 1998-08-11 | The Johns Hopkins University | General method to clone hybrid restriction endonucleases using lig gene |
US5792632A (en) | 1992-05-05 | 1998-08-11 | Institut Pasteur | Nucleotide sequence encoding the enzyme I-SceI and the uses thereof |
US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
US5591616A (en) | 1992-07-07 | 1997-01-07 | Japan Tobacco, Inc. | Method for transforming monocotyledons |
ATE239785T1 (de) | 1993-02-12 | 2003-05-15 | Univ Johns Hopkins | Funktionelle domänen der restriktionsendonukleasen aus -i(flavobakterium okeanokoites)(foki) |
WO1995019431A1 (en) | 1994-01-18 | 1995-07-20 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
US6242568B1 (en) | 1994-01-18 | 2001-06-05 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
US6140466A (en) | 1994-01-18 | 2000-10-31 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
WO1995025809A1 (en) | 1994-03-23 | 1995-09-28 | Ohio University | Compacted nucleic acids and their delivery to cells |
US5585245A (en) | 1994-04-22 | 1996-12-17 | California Institute Of Technology | Ubiquitin-based split protein sensor |
US6808904B2 (en) | 1994-06-16 | 2004-10-26 | Syngenta Participations Ag | Herbicide-tolerant protox genes produced by DNA shuffling |
US7285416B2 (en) | 2000-01-24 | 2007-10-23 | Gendaq Limited | Regulated gene expression in plants |
GB9824544D0 (en) | 1998-11-09 | 1999-01-06 | Medical Res Council | Screening system |
USRE45721E1 (en) | 1994-08-20 | 2015-10-06 | Gendaq, Ltd. | Relating to binding proteins for recognition of DNA |
US6326166B1 (en) | 1995-12-29 | 2001-12-04 | Massachusetts Institute Of Technology | Chimeric DNA-binding proteins |
US5789538A (en) | 1995-02-03 | 1998-08-04 | Massachusetts Institute Of Technology | Zinc finger proteins with high affinity new DNA binding specificities |
US5853973A (en) | 1995-04-20 | 1998-12-29 | American Cyanamid Company | Structure based designed herbicide resistant products |
US6084155A (en) | 1995-06-06 | 2000-07-04 | Novartis Ag | Herbicide-tolerant protoporphyrinogen oxidase ("protox") genes |
US5928638A (en) | 1996-06-17 | 1999-07-27 | Systemix, Inc. | Methods for gene transfer |
JPH10117776A (ja) | 1996-10-22 | 1998-05-12 | Japan Tobacco Inc | インディカイネの形質転換方法 |
GB9703369D0 (en) | 1997-02-18 | 1997-04-09 | Lindqvist Bjorn H | Process |
GB2338237B (en) | 1997-02-18 | 2001-02-28 | Actinova Ltd | In vitro peptide or protein expression library |
US6342345B1 (en) | 1997-04-02 | 2002-01-29 | The Board Of Trustees Of The Leland Stanford Junior University | Detection of molecular interactions by reporter subunit complementation |
GB9710807D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
GB9710809D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
US6410248B1 (en) | 1998-01-30 | 2002-06-25 | Massachusetts Institute Of Technology | General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites |
JP4309051B2 (ja) | 1998-03-02 | 2009-08-05 | マサチューセッツ インスティテュート オブ テクノロジー | 改善したリンカーを有するポリジンクフィンガータンパク質 |
GB9819693D0 (en) | 1998-09-10 | 1998-11-04 | Zeneca Ltd | Glyphosate formulation |
US6599692B1 (en) | 1999-09-14 | 2003-07-29 | Sangamo Bioscience, Inc. | Functional genomics using zinc finger proteins |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US7013219B2 (en) | 1999-01-12 | 2006-03-14 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US7070934B2 (en) | 1999-01-12 | 2006-07-04 | Sangamo Biosciences, Inc. | Ligand-controlled regulation of endogenous gene expression |
US6453242B1 (en) | 1999-01-12 | 2002-09-17 | Sangamo Biosciences, Inc. | Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites |
JP2002535995A (ja) | 1999-02-03 | 2002-10-29 | ザ チルドレンズ メディカル センター コーポレイション | 染色体標的部位での二本鎖dna切断の誘導を含む遺伝子修復 |
US6451732B1 (en) | 1999-06-04 | 2002-09-17 | Syngenta, Limited | Herbicidal compositions of glyphosate trimesium |
DE60023936T2 (de) | 1999-12-06 | 2006-05-24 | Sangamo Biosciences Inc., Richmond | Methoden zur verwendung von randomisierten zinkfingerprotein-bibliotheken zur identifizierung von genfunktionen |
KR100676989B1 (ko) | 2000-01-26 | 2007-01-31 | 다이니폰 인사츠 가부시키가이샤 | 히트실링장치, 히트실링방법, 엠보스성형방법, 워크압압장치 및 워크 |
EP1254369B1 (en) | 2000-02-08 | 2010-10-06 | Sangamo BioSciences, Inc. | Cells for drug discovery |
US20020061512A1 (en) | 2000-02-18 | 2002-05-23 | Kim Jin-Soo | Zinc finger domains and methods of identifying same |
EP1276859B1 (en) | 2000-04-28 | 2007-02-07 | Sangamo Biosciences Inc. | Targeted modification of chromatin structure |
CA2407745C (en) | 2000-04-28 | 2011-11-22 | Sangamo Biosciences, Inc. | Databases of regulatory sequences; methods of making and using same |
AU2001263155A1 (en) | 2000-05-16 | 2001-11-26 | Massachusetts Institute Of Technology | Methods and compositions for interaction trap assays |
US6919204B2 (en) | 2000-09-29 | 2005-07-19 | Sangamo Biosciences, Inc. | Modulation of gene expression using localization domains |
US6368227B1 (en) | 2000-11-17 | 2002-04-09 | Steven Olson | Method of swinging on a swing |
AU2002217929A1 (en) | 2000-11-28 | 2002-06-11 | Sangamo Biosciences, Inc. | Modulation of gene expression using insulator binding proteins |
US7067317B2 (en) | 2000-12-07 | 2006-06-27 | Sangamo Biosciences, Inc. | Regulation of angiogenesis with zinc finger proteins |
DK1353941T3 (da) | 2001-01-22 | 2013-06-17 | Sangamo Biosciences Inc | Modificerede zinkfingerbindingsproteiner |
GB0108491D0 (en) | 2001-04-04 | 2001-05-23 | Gendaq Ltd | Engineering zinc fingers |
US7262054B2 (en) | 2002-01-22 | 2007-08-28 | Sangamo Biosciences, Inc. | Zinc finger proteins for DNA binding and gene regulation in plants |
EP1476547B1 (en) | 2002-01-23 | 2006-12-06 | The University of Utah Research Foundation | Targeted chromosomal mutagenesis using zinc finger nucleases |
WO2009095742A1 (en) | 2008-01-31 | 2009-08-06 | Cellectis | New i-crei derived single-chain meganuclease and uses thereof |
CA2479153C (en) | 2002-03-15 | 2015-06-02 | Cellectis | Hybrid and single chain meganucleases and use thereof |
ATE531796T1 (de) | 2002-03-21 | 2011-11-15 | Sangamo Biosciences Inc | Verfahren und zusammensetzungen zur verwendung von zinkfinger-endonukleasen zur verbesserung der homologen rekombination |
US7361635B2 (en) | 2002-08-29 | 2008-04-22 | Sangamo Biosciences, Inc. | Simultaneous modulation of multiple genes |
EP2806025B1 (en) | 2002-09-05 | 2019-04-03 | California Institute of Technology | Use of zinc finger nucleases to stimulate gene targeting |
JP4966006B2 (ja) | 2003-01-28 | 2012-07-04 | セレクティス | カスタムメイドメガヌクレアーゼおよびその使用 |
US7888121B2 (en) | 2003-08-08 | 2011-02-15 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US8409861B2 (en) | 2003-08-08 | 2013-04-02 | Sangamo Biosciences, Inc. | Targeted deletion of cellular DNA sequences |
US7972854B2 (en) | 2004-02-05 | 2011-07-05 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US7189691B2 (en) | 2004-04-01 | 2007-03-13 | The Administrators Of The Tulane Educational Fund | Methods and compositions for treating leukemia |
US20060063231A1 (en) | 2004-09-16 | 2006-03-23 | Sangamo Biosciences, Inc. | Compositions and methods for protein production |
SG10201508995QA (en) | 2005-07-26 | 2015-11-27 | Sangamo Biosciences Inc | Targeted integration and expression of exogenous nucleic acid sequences |
EP2484758B1 (en) | 2005-10-18 | 2013-10-02 | Precision Biosciences | Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity |
WO2007060495A1 (en) | 2005-10-25 | 2007-05-31 | Cellectis | I-crei homing endonuclease variants having novel cleavage specificity and use thereof |
CA2650414A1 (en) | 2006-05-19 | 2007-11-29 | Sangamo Biosciences, Inc. | Methods and compositions for inactivation of dihydrofolate reductase |
US7951925B2 (en) | 2006-05-25 | 2011-05-31 | Sangamo Biosciences, Inc. | Methods and compositions for gene inactivation |
EP2213731B1 (en) | 2006-05-25 | 2013-12-04 | Sangamo BioSciences, Inc. | Variant foki cleavage half-domains |
WO2008010009A1 (en) | 2006-07-18 | 2008-01-24 | Cellectis | Meganuclease variants cleaving a dna target sequence from a rag gene and uses thereof |
PT2415872T (pt) | 2006-12-14 | 2016-07-07 | Sangamo Biosciences Inc | Proteínas com dedos de zinco não canónicas optimizadas |
DE602008003684D1 (de) | 2007-04-26 | 2011-01-05 | Sangamo Biosciences Inc | Gezielte integration in die ppp1r12c-position |
US8790345B2 (en) | 2007-08-21 | 2014-07-29 | Zimmer, Inc. | Titanium alloy with oxidized zirconium for a prosthetic implant |
CA2937438C (en) | 2007-09-27 | 2020-07-07 | Dow Agrosciences Llc | Engineered zinc finger proteins targeting 5-enolpyruvyl shikimate-3-phosphate synthase genes |
US8563314B2 (en) | 2007-09-27 | 2013-10-22 | Sangamo Biosciences, Inc. | Methods and compositions for modulating PD1 |
JP2010540534A (ja) | 2007-09-28 | 2010-12-24 | イントレキソン コーポレーション | 生体治療分子の発現のための治療遺伝子スイッチ構築物およびバイオリアクター、ならびにその使用 |
EP2235050A1 (en) | 2007-09-28 | 2010-10-06 | Two Blades Foundation | Bs3 resistance gene and methods of use |
US8936936B2 (en) | 2007-10-25 | 2015-01-20 | Sangamo Biosciences, Inc. | Methods and compositions for targeted integration |
AR075356A1 (es) | 2008-11-10 | 2011-03-30 | Two Blades Foundation | Promotores inducibles por patogenos y su uso en el mejoramiento de la resistencia a las enfermedades en plantas |
JP6215533B2 (ja) | 2009-04-09 | 2017-10-18 | サンガモ セラピューティクス, インコーポレイテッド | 幹細胞への標的組込み |
US8772008B2 (en) | 2009-05-18 | 2014-07-08 | Sangamo Biosciences, Inc. | Methods and compositions for increasing nuclease activity |
KR20100133319A (ko) | 2009-06-11 | 2010-12-21 | 주식회사 툴젠 | 표적 특이적인 게놈의 재배열을 위한 표적 특이적 뉴클레아제 및 이의 용도 |
EP2449135B1 (en) | 2009-06-30 | 2016-01-06 | Sangamo BioSciences, Inc. | Rapid screening of biologically active nucleases and isolation of nuclease-modified cells |
US20120178647A1 (en) | 2009-08-03 | 2012-07-12 | The General Hospital Corporation | Engineering of zinc finger arrays by context-dependent assembly |
NZ619886A (en) | 2009-08-11 | 2015-03-27 | Sangamo Biosciences Inc | Organisms homozygous for targeted modification |
BR112012009668B1 (pt) | 2009-10-22 | 2022-08-16 | Dow Agrosciences Llc | Proteína de dedo de zinco que não ocorre naturalmente e proteína de fusão compreendendo a mesma |
US8956828B2 (en) | 2009-11-10 | 2015-02-17 | Sangamo Biosciences, Inc. | Targeted disruption of T cell receptor genes using engineered zinc finger protein nucleases |
EP2504439B1 (en) | 2009-11-27 | 2016-03-02 | BASF Plant Science Company GmbH | Optimized endonucleases and uses thereof |
CN102762726A (zh) | 2009-11-27 | 2012-10-31 | 巴斯夫植物科学有限公司 | 嵌合内切核酸酶及其用途 |
WO2011064750A1 (en) | 2009-11-27 | 2011-06-03 | Basf Plant Science Company Gmbh | Chimeric endonucleases and uses thereof |
US20110203012A1 (en) | 2010-01-21 | 2011-08-18 | Dotson Stanton B | Methods and compositions for use of directed recombination in plant breeding |
PT2534173T (pt) | 2010-02-08 | 2019-10-31 | Sangamo Therapeutics Inc | Semidomínios de clivagem manipulados |
CA2788850C (en) | 2010-02-09 | 2019-06-25 | Sangamo Biosciences, Inc. | Targeted genomic modification with partially single-stranded donor molecules |
US8771985B2 (en) | 2010-04-26 | 2014-07-08 | Sangamo Biosciences, Inc. | Genome editing of a Rosa locus using zinc-finger nucleases |
CA2798988C (en) | 2010-05-17 | 2020-03-10 | Sangamo Biosciences, Inc. | Tal-effector (tale) dna-binding polypeptides and uses thereof |
EP2392208B1 (en) | 2010-06-07 | 2016-05-04 | Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) | Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use |
US20110201118A1 (en) | 2010-06-14 | 2011-08-18 | Iowa State University Research Foundation, Inc. | Nuclease activity of tal effector and foki fusion protein |
US9405700B2 (en) | 2010-11-04 | 2016-08-02 | Sonics, Inc. | Methods and apparatus for virtualization in an integrated circuit |
US9458205B2 (en) * | 2011-11-16 | 2016-10-04 | Sangamo Biosciences, Inc. | Modified DNA-binding proteins and uses thereof |
-
2011
- 2011-05-17 CA CA2798988A patent/CA2798988C/en active Active
- 2011-05-17 JP JP2013511148A patent/JP6208580B2/ja active Active
- 2011-05-17 EP EP11783865.6A patent/EP2571512B1/en active Active
- 2011-05-17 AU AU2011256838A patent/AU2011256838B2/en active Active
- 2011-05-17 US US13/068,735 patent/US8586526B2/en active Active
- 2011-05-17 EP EP16200664.7A patent/EP3156062A1/en not_active Ceased
- 2011-05-17 CN CN201180034243.1A patent/CN103025344B/zh active Active
- 2011-05-17 WO PCT/US2011/000885 patent/WO2011146121A1/en active Application Filing
- 2011-05-17 KR KR1020127032393A patent/KR101953237B1/ko active IP Right Grant
-
2012
- 2012-11-11 IL IL222961A patent/IL222961B/en active IP Right Grant
-
2013
- 2013-10-28 US US14/064,991 patent/US9322005B2/en active Active
- 2013-10-28 US US14/065,028 patent/US9493750B2/en active Active
- 2013-10-28 US US14/065,055 patent/US8912138B2/en active Active
-
2016
- 2016-07-08 JP JP2016135751A patent/JP2016182143A/ja active Pending
- 2016-10-03 US US15/284,164 patent/US9783827B2/en active Active
-
2017
- 2017-09-20 US US15/709,969 patent/US10253333B2/en active Active
-
2019
- 2019-02-12 US US16/274,024 patent/US11661612B2/en active Active
-
2021
- 2021-06-11 US US17/346,020 patent/US20220356493A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6200759B1 (en) * | 1996-08-23 | 2001-03-13 | President And Fellows Of Harvard College | Interaction trap assay, reagents and uses thereof |
WO2010079430A1 (en) * | 2009-01-12 | 2010-07-15 | Ulla Bonas | Modular dna-binding domains and methods of use |
WO2011072246A2 (en) * | 2009-12-10 | 2011-06-16 | Regents Of The University Of Minnesota | Tal effector-mediated dna modification |
Non-Patent Citations (3)
Title |
---|
Boch J. et al, Annu. Rev. Phytopathol. 48:419-36 (2010. 5.10.)..* * |
Boch J. et al, SCIENCE 326:pp.1509- 1512 (2009.12.11.).* * |
Szurek B. et al, Molecular Microbiology 46(1):pp.13-23 (2002).* * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170002542A (ko) * | 2014-05-07 | 2017-01-06 | 어드밴스드 진 앤드 셀 테크놀로지스 엘엘씨 (에이쥐씨티 엘엘씨) | Hiv 공동 수용체 ccr5의 표적화된 녹아웃을 위한 tal 이펙터 뉴클레아제 |
Also Published As
Publication number | Publication date |
---|---|
CN103025344A (zh) | 2013-04-03 |
US20170016030A1 (en) | 2017-01-19 |
JP6208580B2 (ja) | 2017-10-04 |
CA2798988A1 (en) | 2011-11-24 |
US11661612B2 (en) | 2023-05-30 |
IL222961A0 (en) | 2013-02-03 |
US9322005B2 (en) | 2016-04-26 |
EP2571512A4 (en) | 2013-11-20 |
US20110301073A1 (en) | 2011-12-08 |
EP2571512B1 (en) | 2017-08-23 |
KR101953237B1 (ko) | 2019-02-28 |
US8912138B2 (en) | 2014-12-16 |
US9783827B2 (en) | 2017-10-10 |
US20180010152A1 (en) | 2018-01-11 |
IL222961B (en) | 2018-08-30 |
AU2011256838A1 (en) | 2012-12-06 |
US20190169640A1 (en) | 2019-06-06 |
US9493750B2 (en) | 2016-11-15 |
AU2011256838B2 (en) | 2014-10-09 |
CN103025344B (zh) | 2016-06-29 |
CA2798988C (en) | 2020-03-10 |
US20140134740A1 (en) | 2014-05-15 |
EP2571512A1 (en) | 2013-03-27 |
JP2013529083A (ja) | 2013-07-18 |
US20220356493A1 (en) | 2022-11-10 |
US20140134723A1 (en) | 2014-05-15 |
WO2011146121A1 (en) | 2011-11-24 |
JP2016182143A (ja) | 2016-10-20 |
EP3156062A1 (en) | 2017-04-19 |
US8586526B2 (en) | 2013-11-19 |
US10253333B2 (en) | 2019-04-09 |
US20140134741A1 (en) | 2014-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101953237B1 (ko) | 신규 dna 결합 단백질 및 이의 용도 | |
AU2020289750B2 (en) | Engineered meganucleases with recognition sequences found in the human T cell receptor alpha constant region gene | |
AU774643B2 (en) | Compositions and methods for use in recombinational cloning of nucleic acids | |
AU2021204620A1 (en) | Central nervous system targeting polynucleotides | |
KR101982360B1 (ko) | 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도 | |
KR101320489B1 (ko) | 인간 세포주에서 재조합 인간 단백질의 무혈청의 안정한형질감염 및 생산 | |
AU2024205047A1 (en) | Genetically-modified cells comprising a modified human T cell receptor alpha constant region gene | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
DK2718440T3 (en) | NUCLEASE ACTIVITY PROTEIN, FUSION PROTEINS AND APPLICATIONS THEREOF | |
KR20230091894A (ko) | 부위 특이적 표적화 요소를 통한 프로그램 가능한 첨가(paste)를 사용하는 부위 특이적 유전 공학을 위한 시스템, 방법, 및 조성물 | |
KR102681113B1 (ko) | 조작된 캐스케이드 구성성분 및 캐스케이드 복합체 | |
AU2016343979A1 (en) | Delivery of central nervous system targeting polynucleotides | |
US20040003420A1 (en) | Modified recombinase | |
BRPI0806354A2 (pt) | plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados | |
KR102652494B1 (ko) | 전장 t-세포 수용체 오픈 리딩 프레임의 신속한 조립 및 다양화를 위한 2-성분 벡터 라이브러리 시스템 | |
KR101921698B1 (ko) | 재조합에 의해 제조된 인간 인자 ⅷ 및 ⅸ | |
KR20210151916A (ko) | 뒤시엔느 근육 이영양증의 치료를 위한 aav 벡터-매개된 큰 돌연변이 핫스팟의 결실 | |
CN111733174B (zh) | 一种分离的核酸分子及其用途 | |
PT1984512T (pt) | Sistema de expressão génica utilizando excisão-união em insetos | |
CN111094569A (zh) | 光控性病毒蛋白质、其基因及包含该基因的病毒载体 | |
CN110637090A (zh) | 用于表达大型核酸转基因的质粒载体 | |
KR20160003691A (ko) | Opa1 단상부족에 의해 원인이 되는 질병 치료를 위한 인공전사인자 | |
KR20140043890A (ko) | 조절된 유전자 발현 시스템 및 그의 작제물 | |
EP1395612A2 (en) | Modified recombinase | |
KR20240029020A (ko) | Dna 변형을 위한 crispr-트랜스포손 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |