KR20200091400A - 신규한 항원-결합 키메라 단백질 및 이의 방법 및 용도 - Google Patents
신규한 항원-결합 키메라 단백질 및 이의 방법 및 용도 Download PDFInfo
- Publication number
- KR20200091400A KR20200091400A KR1020207013860A KR20207013860A KR20200091400A KR 20200091400 A KR20200091400 A KR 20200091400A KR 1020207013860 A KR1020207013860 A KR 1020207013860A KR 20207013860 A KR20207013860 A KR 20207013860A KR 20200091400 A KR20200091400 A KR 20200091400A
- Authority
- KR
- South Korea
- Prior art keywords
- antigen
- protein
- binding
- domain
- scaffold
- Prior art date
Links
- 230000027455 binding Effects 0.000 title claims abstract description 652
- 239000000427 antigen Substances 0.000 title claims abstract description 596
- 108091007433 antigens Proteins 0.000 title claims abstract description 595
- 102000036639 antigens Human genes 0.000 title claims abstract description 595
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 333
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 333
- 238000000034 method Methods 0.000 title claims abstract description 61
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 claims abstract description 178
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 claims abstract description 178
- 101710204410 Scaffold protein Proteins 0.000 claims abstract description 178
- 230000004927 fusion Effects 0.000 claims abstract description 116
- 108060003951 Immunoglobulin Proteins 0.000 claims abstract description 96
- 102000018358 immunoglobulin Human genes 0.000 claims abstract description 96
- 238000012916 structural analysis Methods 0.000 claims abstract description 25
- 108090000623 proteins and genes Proteins 0.000 claims description 336
- 102000004169 proteins and genes Human genes 0.000 claims description 286
- 239000000203 mixture Substances 0.000 claims description 57
- 150000007523 nucleic acids Chemical class 0.000 claims description 49
- 239000013598 vector Substances 0.000 claims description 46
- 230000014509 gene expression Effects 0.000 claims description 42
- 102000039446 nucleic acids Human genes 0.000 claims description 41
- 108020004707 nucleic acids Proteins 0.000 claims description 41
- 239000002245 particle Substances 0.000 claims description 39
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 33
- 229910052799 carbon Inorganic materials 0.000 claims description 16
- 241000588724 Escherichia coli Species 0.000 claims description 14
- 239000000178 monomer Substances 0.000 claims description 14
- 239000003814 drug Substances 0.000 claims description 13
- 241000700605 Viruses Species 0.000 claims description 8
- 241000894006 Bacteria Species 0.000 claims description 6
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 claims description 5
- 230000005030 transcription termination Effects 0.000 claims description 4
- 238000002050 diffraction method Methods 0.000 claims description 3
- 238000011503 in vivo imaging Methods 0.000 claims description 3
- 239000000032 diagnostic agent Substances 0.000 claims 1
- 229940039227 diagnostic agent Drugs 0.000 claims 1
- 238000002424 x-ray crystallography Methods 0.000 abstract description 18
- 230000001225 therapeutic effect Effects 0.000 abstract description 15
- 229920002521 macromolecule Polymers 0.000 abstract description 12
- 238000003384 imaging method Methods 0.000 abstract description 9
- 235000018102 proteins Nutrition 0.000 description 209
- 108090000765 processed proteins & peptides Proteins 0.000 description 126
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 117
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 117
- 239000005090 green fluorescent protein Substances 0.000 description 117
- 125000005647 linker group Chemical group 0.000 description 90
- 102000004196 processed proteins & peptides Human genes 0.000 description 76
- 235000001014 amino acid Nutrition 0.000 description 68
- 229920001184 polypeptide Polymers 0.000 description 67
- 150000001413 amino acids Chemical class 0.000 description 53
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 49
- 210000004027 cell Anatomy 0.000 description 49
- 210000004899 c-terminal region Anatomy 0.000 description 41
- 150000001875 compounds Chemical class 0.000 description 40
- 239000012634 fragment Substances 0.000 description 35
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 34
- 125000003275 alpha amino acid group Chemical group 0.000 description 33
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 31
- 101710091045 Envelope protein Proteins 0.000 description 31
- 101710188315 Protein X Proteins 0.000 description 31
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 29
- 210000005253 yeast cell Anatomy 0.000 description 29
- 101710146995 Acyl carrier protein Proteins 0.000 description 24
- 230000003993 interaction Effects 0.000 description 24
- 238000002818 protein evolution Methods 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 19
- 239000000126 substance Substances 0.000 description 19
- 230000004048 modification Effects 0.000 description 18
- 238000012986 modification Methods 0.000 description 18
- 230000008901 benefit Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 17
- 238000013461 design Methods 0.000 description 16
- 102000025171 antigen binding proteins Human genes 0.000 description 15
- 108091000831 antigen binding proteins Proteins 0.000 description 15
- -1 complex Substances 0.000 description 15
- 238000012216 screening Methods 0.000 description 15
- 239000000243 solution Substances 0.000 description 15
- OVKKNJPJQKTXIT-JLNKQSITSA-N (5Z,8Z,11Z,14Z,17Z)-icosapentaenoylethanolamine Chemical compound CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)NCCO OVKKNJPJQKTXIT-JLNKQSITSA-N 0.000 description 14
- 238000003556 assay Methods 0.000 description 14
- 239000003446 ligand Substances 0.000 description 14
- 238000002835 absorbance Methods 0.000 description 13
- 238000004519 manufacturing process Methods 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- 239000000758 substrate Substances 0.000 description 13
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical class NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 12
- 239000003513 alkali Substances 0.000 description 12
- 230000001965 increasing effect Effects 0.000 description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 11
- 238000002965 ELISA Methods 0.000 description 11
- 102000016844 Immunoglobulin-like domains Human genes 0.000 description 11
- 108050006430 Immunoglobulin-like domains Proteins 0.000 description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 description 11
- 239000000556 agonist Substances 0.000 description 11
- 239000000539 dimer Substances 0.000 description 11
- 238000011534 incubation Methods 0.000 description 11
- HBYHYLBZPLCIEE-UHFFFAOYSA-N 2,4-dinitro-6-propan-2-ylphenol Chemical compound CC(C)C1=CC([N+]([O-])=O)=CC([N+]([O-])=O)=C1O HBYHYLBZPLCIEE-UHFFFAOYSA-N 0.000 description 10
- 108010006519 Molecular Chaperones Proteins 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 10
- KAKKHKRHCKCAGH-UHFFFAOYSA-L disodium;(4-nitrophenyl) phosphate;hexahydrate Chemical compound O.O.O.O.O.O.[Na+].[Na+].[O-][N+](=O)C1=CC=C(OP([O-])([O-])=O)C=C1 KAKKHKRHCKCAGH-UHFFFAOYSA-L 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 229940072221 immunoglobulins Drugs 0.000 description 10
- 229910052751 metal Inorganic materials 0.000 description 10
- 239000002184 metal Substances 0.000 description 10
- 239000000546 pharmaceutical excipient Substances 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 239000013078 crystal Substances 0.000 description 9
- 208000035475 disorder Diseases 0.000 description 9
- 229940088598 enzyme Drugs 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 239000008194 pharmaceutical composition Substances 0.000 description 9
- 239000013636 protein dimer Substances 0.000 description 9
- 239000000725 suspension Substances 0.000 description 9
- 239000003826 tablet Substances 0.000 description 9
- 108010007337 Azurin Proteins 0.000 description 8
- 108010052285 Membrane Proteins Proteins 0.000 description 8
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 238000000684 flow cytometry Methods 0.000 description 8
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 8
- 238000000338 in vitro Methods 0.000 description 8
- 230000000670 limiting effect Effects 0.000 description 8
- 229920001223 polyethylene glycol Polymers 0.000 description 8
- 235000002639 sodium chloride Nutrition 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 230000003612 virological effect Effects 0.000 description 8
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- 102000007474 Multiprotein Complexes Human genes 0.000 description 7
- 108010085220 Multiprotein Complexes Proteins 0.000 description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 230000000890 antigenic effect Effects 0.000 description 7
- 238000002425 crystallisation Methods 0.000 description 7
- 230000008025 crystallization Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 125000000524 functional group Chemical group 0.000 description 7
- 238000002823 phage display Methods 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 6
- 102000018697 Membrane Proteins Human genes 0.000 description 6
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 6
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000009510 drug design Methods 0.000 description 6
- 238000002523 gelfiltration Methods 0.000 description 6
- 108010037896 heparin-binding hemagglutinin Proteins 0.000 description 6
- 230000002209 hydrophobic effect Effects 0.000 description 6
- 238000002372 labelling Methods 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 102000014914 Carrier Proteins Human genes 0.000 description 5
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 102000005431 Molecular Chaperones Human genes 0.000 description 5
- 241000235648 Pichia Species 0.000 description 5
- 241000607720 Serratia Species 0.000 description 5
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 5
- 229930006000 Sucrose Natural products 0.000 description 5
- 239000004480 active ingredient Substances 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 239000011230 binding agent Substances 0.000 description 5
- 108091008324 binding proteins Proteins 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000021615 conjugation Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 239000003085 diluting agent Substances 0.000 description 5
- 238000010494 dissociation reaction Methods 0.000 description 5
- 230000005593 dissociations Effects 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 239000003937 drug carrier Substances 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 230000001976 improved effect Effects 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 230000004850 protein–protein interaction Effects 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 239000005720 sucrose Substances 0.000 description 5
- 229960004793 sucrose Drugs 0.000 description 5
- 230000001052 transient effect Effects 0.000 description 5
- 241001515965 unidentified phage Species 0.000 description 5
- 239000000080 wetting agent Substances 0.000 description 5
- 108010088751 Albumins Proteins 0.000 description 4
- 102000009027 Albumins Human genes 0.000 description 4
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 4
- 229920002261 Corn starch Polymers 0.000 description 4
- 102000002090 Fibronectin type III Human genes 0.000 description 4
- 108050009401 Fibronectin type III Proteins 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- 241000235058 Komagataella pastoris Species 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 102000016943 Muramidase Human genes 0.000 description 4
- 108010014251 Muramidase Proteins 0.000 description 4
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 4
- 241000589516 Pseudomonas Species 0.000 description 4
- 241000607142 Salmonella Species 0.000 description 4
- 241000187747 Streptomyces Species 0.000 description 4
- 239000012505 Superdex™ Substances 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 239000000969 carrier Substances 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 4
- 239000007859 condensation product Substances 0.000 description 4
- 239000010949 copper Substances 0.000 description 4
- 239000008120 corn starch Substances 0.000 description 4
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 235000014113 dietary fatty acids Nutrition 0.000 description 4
- 239000002270 dispersing agent Substances 0.000 description 4
- 239000000194 fatty acid Substances 0.000 description 4
- 229930195729 fatty acid Natural products 0.000 description 4
- 150000004665 fatty acids Chemical class 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 235000010335 lysozyme Nutrition 0.000 description 4
- 239000004325 lysozyme Substances 0.000 description 4
- 229960000274 lysozyme Drugs 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 150000002739 metals Chemical class 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000004091 panning Methods 0.000 description 4
- 230000006320 pegylation Effects 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 239000003755 preservative agent Substances 0.000 description 4
- 210000001236 prokaryotic cell Anatomy 0.000 description 4
- 238000000159 protein binding assay Methods 0.000 description 4
- 108020001580 protein domains Proteins 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 238000001542 size-exclusion chromatography Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 230000009870 specific binding Effects 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 3
- 235000002198 Annona diversifolia Nutrition 0.000 description 3
- 241000193830 Bacillus <bacterium> Species 0.000 description 3
- 241000282836 Camelus dromedarius Species 0.000 description 3
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 3
- 108090000695 Cytokines Proteins 0.000 description 3
- 102000004127 Cytokines Human genes 0.000 description 3
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 3
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 3
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 3
- 108010001267 Protein Subunits Proteins 0.000 description 3
- 102000002067 Protein Subunits Human genes 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 108010090804 Streptavidin Proteins 0.000 description 3
- 238000001042 affinity chromatography Methods 0.000 description 3
- 239000002775 capsule Substances 0.000 description 3
- 150000001768 cations Chemical class 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 229910052802 copper Inorganic materials 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000007877 drug screening Methods 0.000 description 3
- 239000003995 emulsifying agent Substances 0.000 description 3
- 239000000796 flavoring agent Substances 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000005847 immunogenicity Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 239000008101 lactose Substances 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 239000000314 lubricant Substances 0.000 description 3
- 238000001000 micrograph Methods 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 229910052759 nickel Inorganic materials 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 230000004481 post-translational protein modification Effects 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 239000003223 protective agent Substances 0.000 description 3
- 239000002287 radioligand Substances 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 239000000600 sorbitol Substances 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 239000004094 surface-active agent Substances 0.000 description 3
- 239000000375 suspending agent Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- 241000416162 Astragalus gummifer Species 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 241000606123 Bacteroides thetaiotaomicron Species 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 102000004506 Blood Proteins Human genes 0.000 description 2
- 108010017384 Blood Proteins Proteins 0.000 description 2
- 101710132601 Capsid protein Proteins 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 241000251730 Chondrichthyes Species 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 101710088194 Dehydrogenase Proteins 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 101100421450 Drosophila melanogaster Shark gene Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 241000588914 Enterobacter Species 0.000 description 2
- 241000709744 Enterobacterio phage MS2 Species 0.000 description 2
- 241000588698 Erwinia Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 241001646716 Escherichia coli K-12 Species 0.000 description 2
- 241000701959 Escherichia virus Lambda Species 0.000 description 2
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 2
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 2
- 101710113436 GTPase KRas Proteins 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 239000004366 Glucose oxidase Substances 0.000 description 2
- 108010015776 Glucose oxidase Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 2
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 2
- 241000853480 Helicobacter pylori G27 Species 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 229920001612 Hydroxyethyl starch Polymers 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 108090000862 Ion Channels Proteins 0.000 description 2
- 102000004310 Ion Channels Human genes 0.000 description 2
- 102000004195 Isomerases Human genes 0.000 description 2
- 108090000769 Isomerases Proteins 0.000 description 2
- 101100193693 Kirsten murine sarcoma virus K-RAS gene Proteins 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- 241000282838 Lama Species 0.000 description 2
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 2
- 240000007472 Leucaena leucocephala Species 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- QPCDCPDFJACHGM-UHFFFAOYSA-N N,N-bis{2-[bis(carboxymethyl)amino]ethyl}glycine Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(=O)O)CCN(CC(O)=O)CC(O)=O QPCDCPDFJACHGM-UHFFFAOYSA-N 0.000 description 2
- 241000320412 Ogataea angusta Species 0.000 description 2
- 101710116435 Outer membrane protein Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108010067902 Peptide Library Proteins 0.000 description 2
- 102000003992 Peroxidases Human genes 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 108700001094 Plant Genes Proteins 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 241000588769 Proteus <enterobacteria> Species 0.000 description 2
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 2
- 241000709749 Pseudomonas phage PP7 Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- 241000607768 Shigella Species 0.000 description 2
- 229920001615 Tragacanth Polymers 0.000 description 2
- 108010046334 Urease Proteins 0.000 description 2
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000009824 affinity maturation Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 239000007900 aqueous suspension Substances 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 229960000074 biopharmaceutical Drugs 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000013626 chemical specie Substances 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 230000009918 complex formation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- ZYGHJZDHTFUPRJ-UHFFFAOYSA-N coumarin Chemical compound C1=CC=C2OC(=O)C=CC2=C1 ZYGHJZDHTFUPRJ-UHFFFAOYSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 229940096118 ella Drugs 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 235000019634 flavors Nutrition 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 229940116332 glucose oxidase Drugs 0.000 description 2
- 235000019420 glucose oxidase Nutrition 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 229930004094 glycosylphosphatidylinositol Natural products 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 239000000710 homodimer Substances 0.000 description 2
- 229940050526 hydroxyethylstarch Drugs 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 229920001427 mPEG Polymers 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 229930014626 natural product Natural products 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 239000000346 nonvolatile oil Substances 0.000 description 2
- 238000006384 oligomerization reaction Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000004031 partial agonist Substances 0.000 description 2
- 229960003330 pentetic acid Drugs 0.000 description 2
- 108040007629 peroxidase activity proteins Proteins 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 239000006187 pill Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 2
- 239000000244 polyoxyethylene sorbitan monooleate Substances 0.000 description 2
- 229920000053 polysorbate 80 Polymers 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011321 prophylaxis Methods 0.000 description 2
- 230000012743 protein tagging Effects 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 2
- 239000012266 salt solution Substances 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 239000002562 thickening agent Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 201000008827 tuberculosis Diseases 0.000 description 2
- OOLLAFOLCSJHRE-ZHAKMVSLSA-N ulipristal acetate Chemical compound C1=CC(N(C)C)=CC=C1[C@@H]1C2=C3CCC(=O)C=C3CC[C@H]2[C@H](CC[C@]2(OC(C)=O)C(C)=O)[C@]2(C)C1 OOLLAFOLCSJHRE-ZHAKMVSLSA-N 0.000 description 2
- 239000013603 viral vector Substances 0.000 description 2
- 239000008215 water for injection Substances 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 1
- LNAZSHAWQACDHT-XIYTZBAFSA-N (2r,3r,4s,5r,6s)-4,5-dimethoxy-2-(methoxymethyl)-3-[(2s,3r,4s,5r,6r)-3,4,5-trimethoxy-6-(methoxymethyl)oxan-2-yl]oxy-6-[(2r,3r,4s,5r,6r)-4,5,6-trimethoxy-2-(methoxymethyl)oxan-3-yl]oxyoxane Chemical compound CO[C@@H]1[C@@H](OC)[C@H](OC)[C@@H](COC)O[C@H]1O[C@H]1[C@H](OC)[C@@H](OC)[C@H](O[C@H]2[C@@H]([C@@H](OC)[C@H](OC)O[C@@H]2COC)OC)O[C@@H]1COC LNAZSHAWQACDHT-XIYTZBAFSA-N 0.000 description 1
- WRIDQFICGBMAFQ-UHFFFAOYSA-N (E)-8-Octadecenoic acid Natural products CCCCCCCCCC=CCCCCCCC(O)=O WRIDQFICGBMAFQ-UHFFFAOYSA-N 0.000 description 1
- UCTWMZQNUQWSLP-VIFPVBQESA-N (R)-adrenaline Chemical compound CNC[C@H](O)C1=CC=C(O)C(O)=C1 UCTWMZQNUQWSLP-VIFPVBQESA-N 0.000 description 1
- 229930182837 (R)-adrenaline Natural products 0.000 description 1
- IXPNQXFRVYWDDI-UHFFFAOYSA-N 1-methyl-2,4-dioxo-1,3-diazinane-5-carboximidamide Chemical compound CN1CC(C(N)=N)C(=O)NC1=O IXPNQXFRVYWDDI-UHFFFAOYSA-N 0.000 description 1
- NFGXHKASABOEEW-UHFFFAOYSA-N 1-methylethyl 11-methoxy-3,7,11-trimethyl-2,4-dodecadienoate Chemical compound COC(C)(C)CCCC(C)CC=CC(C)=CC(=O)OC(C)C NFGXHKASABOEEW-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- YPGQBVBJFQCVKA-ORSZPIRQSA-N 2-[(2e)-3,7-dimethylocta-2,6-dienyl]-5-[(e)-2-phenylethenyl]benzene-1,3-diol Chemical compound C1=C(O)C(C/C=C(C)/CCC=C(C)C)=C(O)C=C1\C=C\C1=CC=CC=C1 YPGQBVBJFQCVKA-ORSZPIRQSA-N 0.000 description 1
- XSVWFLQICKPQAA-UHFFFAOYSA-N 2-[4,10-bis(carboxymethyl)-7-[2-(2,5-dioxopyrrolidin-1-yl)oxy-2-oxoethyl]-1,4,7,10-tetrazacyclododec-1-yl]acetic acid Chemical compound C1CN(CC(O)=O)CCN(CC(=O)O)CCN(CC(O)=O)CCN1CC(=O)ON1C(=O)CCC1=O XSVWFLQICKPQAA-UHFFFAOYSA-N 0.000 description 1
- JHALWMSZGCVVEM-UHFFFAOYSA-N 2-[4,7-bis(carboxymethyl)-1,4,7-triazonan-1-yl]acetic acid Chemical compound OC(=O)CN1CCN(CC(O)=O)CCN(CC(O)=O)CC1 JHALWMSZGCVVEM-UHFFFAOYSA-N 0.000 description 1
- UYDHNYKGXODDAV-UHFFFAOYSA-N 2-[4-(carboxymethyl)-7-[2-(2,5-dioxopyrrolidin-1-yl)oxy-2-oxoethyl]-1,4,7-triazonan-1-yl]acetic acid Chemical compound C1CN(CC(=O)O)CCN(CC(O)=O)CCN1CC(=O)ON1C(=O)CCC1=O UYDHNYKGXODDAV-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- LQJBNNIYVWPHFW-UHFFFAOYSA-N 20:1omega9c fatty acid Natural products CCCCCCCCCCC=CCCCCCCCC(O)=O LQJBNNIYVWPHFW-UHFFFAOYSA-N 0.000 description 1
- HUDPLKWXRLNSPC-UHFFFAOYSA-N 4-aminophthalhydrazide Chemical compound O=C1NNC(=O)C=2C1=CC(N)=CC=2 HUDPLKWXRLNSPC-UHFFFAOYSA-N 0.000 description 1
- QSBYPNXLFMSGKH-UHFFFAOYSA-N 9-Heptadecensaeure Natural products CCCCCCCC=CCCCCCCCC(O)=O QSBYPNXLFMSGKH-UHFFFAOYSA-N 0.000 description 1
- GJCOSYZMQJWQCA-UHFFFAOYSA-N 9H-xanthene Chemical compound C1=CC=C2CC3=CC=CC=C3OC2=C1 GJCOSYZMQJWQCA-UHFFFAOYSA-N 0.000 description 1
- 244000215068 Acacia senegal Species 0.000 description 1
- 235000006491 Acacia senegal Nutrition 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 241001672158 Acinetobacter phage AP205 Species 0.000 description 1
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 239000012099 Alexa Fluor family Substances 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- YPGQBVBJFQCVKA-UHFFFAOYSA-N Amorphastilbol Natural products C1=C(O)C(CC=C(C)CCC=C(C)C)=C(O)C=C1C=CC1=CC=CC=C1 YPGQBVBJFQCVKA-UHFFFAOYSA-N 0.000 description 1
- 244000303258 Annona diversifolia Species 0.000 description 1
- 108010083359 Antigen Receptors Proteins 0.000 description 1
- 102000006306 Antigen Receptors Human genes 0.000 description 1
- 108010024976 Asparaginase Proteins 0.000 description 1
- 102000015790 Asparaginase Human genes 0.000 description 1
- 241000194108 Bacillus licheniformis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 108010071023 Bacterial Outer Membrane Proteins Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 101100478981 Bacteroides thetaiotaomicron (strain ATCC 29148 / DSM 2079 / JCM 5827 / CCUG 10774 / NCTC 10582 / VPI-5482 / E50) susB gene Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000371430 Burkholderia cenocepacia Species 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 244000253759 Carya myristiciformis Species 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000700112 Chinchilla Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 235000019750 Crude protein Nutrition 0.000 description 1
- JPVYNHNXODAKFH-UHFFFAOYSA-N Cu2+ Chemical compound [Cu+2] JPVYNHNXODAKFH-UHFFFAOYSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101100239628 Danio rerio myca gene Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 235000019739 Dicalciumphosphate Nutrition 0.000 description 1
- BVTJGGGYKAMDBN-UHFFFAOYSA-N Dioxetane Chemical compound C1COO1 BVTJGGGYKAMDBN-UHFFFAOYSA-N 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 108010008165 Etanercept Proteins 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 241000724791 Filamentous phage Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 102000006395 Globulins Human genes 0.000 description 1
- 108010044091 Globulins Proteins 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 102100022624 Glucoamylase Human genes 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 229920002907 Guar gum Polymers 0.000 description 1
- 229920000084 Gum arabic Polymers 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 101001027128 Homo sapiens Fibronectin Proteins 0.000 description 1
- 101000619708 Homo sapiens Peroxiredoxin-6 Proteins 0.000 description 1
- 108010020056 Hydrogenase Proteins 0.000 description 1
- 241000257303 Hymenoptera Species 0.000 description 1
- 102100026120 IgG receptor FcRn large subunit p51 Human genes 0.000 description 1
- 101710177940 IgG receptor FcRn large subunit p51 Proteins 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 235000000177 Indigofera tinctoria Nutrition 0.000 description 1
- 235000014072 Juglans neotropica Nutrition 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- JWZZKOKVBUJMES-NSHDSACASA-N L-isoprenaline Chemical compound CC(C)NC[C@H](O)C1=CC=C(O)C(O)=C1 JWZZKOKVBUJMES-NSHDSACASA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 235000019687 Lamb Nutrition 0.000 description 1
- 102000019298 Lipocalin Human genes 0.000 description 1
- 108050006654 Lipocalin Proteins 0.000 description 1
- 108010028921 Lipopeptides Proteins 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 244000246386 Mentha pulegium Species 0.000 description 1
- 235000016257 Mentha pulegium Nutrition 0.000 description 1
- 235000004357 Mentha x piperita Nutrition 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 230000004989 O-glycosylation Effects 0.000 description 1
- 108010079246 OMPA outer membrane proteins Proteins 0.000 description 1
- 239000005642 Oleic acid Substances 0.000 description 1
- ZQPPMHVWECSIRJ-UHFFFAOYSA-N Oleic acid Natural products CCCCCCCCC=CCCCCCCCC(O)=O ZQPPMHVWECSIRJ-UHFFFAOYSA-N 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102000016979 Other receptors Human genes 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108010090127 Periplasmic Proteins Proteins 0.000 description 1
- 102100022239 Peroxiredoxin-6 Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108010053210 Phycocyanin Proteins 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920000954 Polyglycolide Polymers 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 229920001800 Shellac Polymers 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 235000021355 Stearic acid Nutrition 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- WDLRUFUQRNWCPK-UHFFFAOYSA-N Tetraxetan Chemical compound OC(=O)CN1CCN(CC(O)=O)CCN(CC(O)=O)CCN(CC(O)=O)CC1 WDLRUFUQRNWCPK-UHFFFAOYSA-N 0.000 description 1
- 238000012338 Therapeutic targeting Methods 0.000 description 1
- 102000036693 Thrombopoietin Human genes 0.000 description 1
- 108010041111 Thrombopoietin Proteins 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 108010028230 Trp-Ser- His-Pro-Gln-Phe-Glu-Lys Proteins 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 108010073429 Type V Secretion Systems Proteins 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 241000235017 Zygosaccharomyces Species 0.000 description 1
- WERKSKAQRVDLDW-ANOHMWSOSA-N [(2s,3r,4r,5r)-2,3,4,5,6-pentahydroxyhexyl] (z)-octadec-9-enoate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO WERKSKAQRVDLDW-ANOHMWSOSA-N 0.000 description 1
- 235000010489 acacia gum Nutrition 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- OIPILFWXSMYKGL-UHFFFAOYSA-N acetylcholine Chemical compound CC(=O)OCC[N+](C)(C)C OIPILFWXSMYKGL-UHFFFAOYSA-N 0.000 description 1
- 229960004373 acetylcholine Drugs 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical class C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 102000035181 adaptor proteins Human genes 0.000 description 1
- 108091005764 adaptor proteins Proteins 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 125000002947 alkylene group Chemical group 0.000 description 1
- 230000003281 allosteric effect Effects 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004164 analytical calibration Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 229960003272 asparaginase Drugs 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-M asparaginate Chemical compound [O-]C(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-M 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000002819 bacterial display Methods 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000010310 bacterial transformation Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 239000002585 base Substances 0.000 description 1
- OGBUMNBNEWYMNJ-UHFFFAOYSA-N batilol Chemical class CCCCCCCCCCCCCCCCCCOCC(O)CO OGBUMNBNEWYMNJ-UHFFFAOYSA-N 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000013378 biophysical characterization Methods 0.000 description 1
- 238000005460 biophysical method Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000001721 carbon Chemical class 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013522 chelant Substances 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000007958 cherry flavor Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- STJMRWALKKWQGH-UHFFFAOYSA-N clenbuterol Chemical compound CC(C)(C)NCC(O)C1=CC(Cl)=C(N)C(Cl)=C1 STJMRWALKKWQGH-UHFFFAOYSA-N 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 230000035071 co-translational protein modification Effects 0.000 description 1
- 238000012875 competitive assay Methods 0.000 description 1
- 230000009137 competitive binding Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 229910001431 copper ion Inorganic materials 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 229960000956 coumarin Drugs 0.000 description 1
- 235000001671 coumarin Nutrition 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000002338 cryopreservative effect Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 125000004093 cyano group Chemical group *C#N 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- NEFBYIFKOOEVPA-UHFFFAOYSA-K dicalcium phosphate Chemical class [Ca+2].[Ca+2].[O-]P([O-])([O-])=O NEFBYIFKOOEVPA-UHFFFAOYSA-K 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000000447 dimerizing effect Effects 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- BFMYDTVEBKDAKJ-UHFFFAOYSA-L disodium;(2',7'-dibromo-3',6'-dioxido-3-oxospiro[2-benzofuran-1,9'-xanthene]-4'-yl)mercury;hydrate Chemical compound O.[Na+].[Na+].O1C(=O)C2=CC=CC=C2C21C1=CC(Br)=C([O-])C([Hg])=C1OC1=C2C=C(Br)C([O-])=C1 BFMYDTVEBKDAKJ-UHFFFAOYSA-L 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000000804 electron spin resonance spectroscopy Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 229940073621 enbrel Drugs 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 229960005139 epinephrine Drugs 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 210000003495 flagella Anatomy 0.000 description 1
- ZFKJVJIDPQDDFY-UHFFFAOYSA-N fluorescamine Chemical compound C12=CC=CC=C2C(=O)OC1(C1=O)OC=C1C1=CC=CC=C1 ZFKJVJIDPQDDFY-UHFFFAOYSA-N 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 230000005714 functional activity Effects 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 102000005396 glutamine synthetase Human genes 0.000 description 1
- 108020002326 glutamine synthetase Proteins 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 238000005469 granulation Methods 0.000 description 1
- 230000003179 granulation Effects 0.000 description 1
- 239000000665 guar gum Substances 0.000 description 1
- 235000010417 guar gum Nutrition 0.000 description 1
- 229960002154 guar gum Drugs 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- FBPFZTCFMRRESA-UHFFFAOYSA-N hexane-1,2,3,4,5,6-hexol Chemical compound OCC(O)C(O)C(O)C(O)CO FBPFZTCFMRRESA-UHFFFAOYSA-N 0.000 description 1
- 235000001050 hortel pimenta Nutrition 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 229920002674 hyaluronan Polymers 0.000 description 1
- 229960003160 hyaluronic acid Drugs 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000036571 hydration Effects 0.000 description 1
- 238000006703 hydration reaction Methods 0.000 description 1
- 150000004678 hydrides Chemical class 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-M hydroxide Chemical compound [OH-] XLYOFNOQVPJJNP-UHFFFAOYSA-M 0.000 description 1
- 235000010979 hydroxypropyl methyl cellulose Nutrition 0.000 description 1
- 239000001866 hydroxypropyl methyl cellulose Substances 0.000 description 1
- 229920003088 hydroxypropyl methyl cellulose Polymers 0.000 description 1
- UFVKGYZPFZQRLF-UHFFFAOYSA-N hydroxypropyl methyl cellulose Chemical compound OC1C(O)C(OC)OC(CO)C1OC1C(O)C(O)C(OC2C(C(O)C(OC3C(C(O)C(O)C(CO)O3)O)C(CO)O2)O)C(CO)O1 UFVKGYZPFZQRLF-UHFFFAOYSA-N 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 229940097275 indigo Drugs 0.000 description 1
- COHYTHOBJLSHDF-UHFFFAOYSA-N indigo powder Natural products N1C2=CC=CC=C2C(=O)C1=C1C(=O)C2=CC=CC=C2N1 COHYTHOBJLSHDF-UHFFFAOYSA-N 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000007972 injectable composition Substances 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 229940125425 inverse agonist Drugs 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- FZWBNHMXJMCXLU-BLAUPYHCSA-N isomaltotriose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O)O1 FZWBNHMXJMCXLU-BLAUPYHCSA-N 0.000 description 1
- QXJSBBXBKPUZAA-UHFFFAOYSA-N isooleic acid Natural products CCCCCCCC=CCCCCCCCCC(O)=O QXJSBBXBKPUZAA-UHFFFAOYSA-N 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 229910052747 lanthanoid Inorganic materials 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 150000002611 lead compounds Chemical class 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 238000000670 ligand binding assay Methods 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000012669 liquid formulation Substances 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000008204 material by function Substances 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 235000010981 methylcellulose Nutrition 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 239000002062 molecular scaffold Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 210000004898 n-terminal fragment Anatomy 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 239000002086 nanomaterial Substances 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000001225 nuclear magnetic resonance method Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 229940054441 o-phthalaldehyde Drugs 0.000 description 1
- QIQXTHQIDYTFRH-UHFFFAOYSA-N octadecanoic acid Chemical compound CCCCCCCCCCCCCCCCCC(O)=O QIQXTHQIDYTFRH-UHFFFAOYSA-N 0.000 description 1
- OQCDKBAXFALNLD-UHFFFAOYSA-N octadecanoic acid Natural products CCCCCCCC(C)CCCCCCCCC(O)=O OQCDKBAXFALNLD-UHFFFAOYSA-N 0.000 description 1
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid Chemical compound CCCCCCCC\C=C/CCCCCCCC(O)=O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000003002 pH adjusting agent Substances 0.000 description 1
- 239000006179 pH buffering agent Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 230000004526 pharmaceutical effect Effects 0.000 description 1
- 239000008180 pharmaceutical surfactant Substances 0.000 description 1
- 238000009520 phase I clinical trial Methods 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- RXNXLAHQOVLMIE-UHFFFAOYSA-N phenyl 10-methylacridin-10-ium-9-carboxylate Chemical compound C12=CC=CC=C2[N+](C)=C2C=CC=CC2=C1C(=O)OC1=CC=CC=C1 RXNXLAHQOVLMIE-UHFFFAOYSA-N 0.000 description 1
- WVDDGKGOMKODPV-ZQBYOMGUSA-N phenyl(114C)methanol Chemical compound O[14CH2]C1=CC=CC=C1 WVDDGKGOMKODPV-ZQBYOMGUSA-N 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- ZWLUXSQADUDCSB-UHFFFAOYSA-N phthalaldehyde Chemical compound O=CC1=CC=CC=C1C=O ZWLUXSQADUDCSB-UHFFFAOYSA-N 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920000747 poly(lactic acid) Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 239000004633 polyglycolic acid Substances 0.000 description 1
- 239000004626 polylactic acid Substances 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 150000004804 polysaccharides Chemical class 0.000 description 1
- 229940068968 polysorbate 80 Drugs 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 239000008213 purified water Substances 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108010017584 romiplostim Proteins 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000001338 self-assembly Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- ZLGIYFNHBLSMPS-ATJNOEHPSA-N shellac Chemical compound OCCCCCC(O)C(O)CCCCCCCC(O)=O.C1C23[C@H](C(O)=O)CCC2[C@](C)(CO)[C@@H]1C(C(O)=O)=C[C@@H]3O ZLGIYFNHBLSMPS-ATJNOEHPSA-N 0.000 description 1
- 239000004208 shellac Substances 0.000 description 1
- 229940113147 shellac Drugs 0.000 description 1
- 235000013874 shellac Nutrition 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 235000010413 sodium alginate Nutrition 0.000 description 1
- 239000000661 sodium alginate Substances 0.000 description 1
- 229940005550 sodium alginate Drugs 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- BBMHARZCALWXSL-UHFFFAOYSA-M sodium dihydrogenphosphate monohydrate Chemical compound O.[Na+].OP(O)([O-])=O BBMHARZCALWXSL-UHFFFAOYSA-M 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007892 solid unit dosage form Substances 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 239000008117 stearic acid Substances 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- JGVWCANSWKRBCS-UHFFFAOYSA-N tetramethylrhodamine thiocyanate Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(SC#N)C=C1C(O)=O JGVWCANSWKRBCS-UHFFFAOYSA-N 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 102000003390 tumor necrosis factor Human genes 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000004304 visual acuity Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000009637 wintergreen oil Substances 0.000 description 1
- 229920001285 xanthan gum Polymers 0.000 description 1
- XOOUIPVCVHRTMJ-UHFFFAOYSA-L zinc stearate Chemical compound [Zn+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O XOOUIPVCVHRTMJ-UHFFFAOYSA-L 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/46—Hybrid immunoglobulins
- C07K16/461—Igs containing Ig-regions, -domains or -residues form different species
- C07K16/464—Igs containing CDR-residues from one specie grafted between FR-residues from another
- C07K16/465—Igs containing CDR-residues from one specie grafted between FR-residues from another with additional modified FR-residues
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/46—Hybrid immunoglobulins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/46—Hybrid immunoglobulins
- C07K16/468—Immunoglobulins having two or more different antigen binding sites, e.g. multifunctional antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/20—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6845—Methods of identifying protein-protein interactions in protein mixtures
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2299/00—Coordinates from 3D structures of peptides, e.g. proteins or enzymes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/20—Immunoglobulins specific features characterized by taxonomic origin
- C07K2317/22—Immunoglobulins specific features characterized by taxonomic origin from camelids, e.g. camel, llama or dromedary
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/50—Immunoglobulins specific features characterized by immunoglobulin fragments
- C07K2317/56—Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
- C07K2317/569—Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/60—Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
- C07K2317/62—Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/03—Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/30—Non-immunoglobulin-derived peptide or protein having an immunoglobulin constant or Fc region, or a fragment thereof, attached thereto
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2795/00—Bacteriophages
- C12N2795/00011—Details
- C12N2795/00022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2795/00—Bacteriophages
- C12N2795/00011—Details
- C12N2795/00023—Virus like particles [VLP]
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Gastroenterology & Hepatology (AREA)
- Wood Science & Technology (AREA)
- Pathology (AREA)
- Biotechnology (AREA)
- Hematology (AREA)
- Microbiology (AREA)
- Urology & Nephrology (AREA)
- Virology (AREA)
- Analytical Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Food Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Toxicology (AREA)
- Peptides Or Proteins (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
본 발명은 구조 생물학 분야에 관한 것이다. 보다 특히, 본 발명은 신규한 항원-결합 키메라 단백질, 거대분자의 3-차원 구조 분석, 예컨대 X-선 결정학 및 고분해능 Cryo-EM에서 그들 용도 및 방법, 및 치료, 진단 또는 영상화 도구로서 그들 용도에 관한 것이다. 보다 더 특히, 본 발명은 스캐폴드 단백질 및 항원-결합 도메인의 융합체에 관한 것으로서, 상기 융합체의 스캐폴드 단백질은 면역글로불린 도메인 토폴로지를 방해하여 강성 키메라를 형성시킨다.
Description
본 발명은 구조 생물학 분야에 관한 것이다. 보다 특히, 본 발명은 신규 항원-결합 키메라 단백질, 거대분자의 3차원 구조 분석, 예컨대 X-선 결정학 및 고분해능 Cryo-EM에서 그들의 용도 및 방법, 및 치료, 진단 또는 영상화 도구로서 그들 용도에 관한 것이다. 보다 더 특히, 본 발명은 스캐폴드 단백질 및 항원-결합 도메인의 융합체에 관한 것으로서, 상기 융합체의 스캐폴드 단백질은 면역글로불린 도메인 토폴로지를 방해하여 이의 항원-결합 능력을 보유하는 강성 키메라를 형성시킨다.
단백질 및 그들 복합체는 삶의 모든 양상에서 핵심적인 역할을 가지지만, 많은 이들 거대분자 성분의 3D-구조 분석은 여전히 어려운 채로 남아 있다. 회절 품질 결정의 제조도 거대분자 X-선 결정학에서 중대한 장애로 남아있다. 장래성을 갖는 접근법은 결정화 샤페론의 사용이다 (Hunte & Michel, 2002). 이들 결정화 샤페론은 소정 거대분자 표적에 특이적으로 결합하도록 조작된 항체 단편 또는 다른 단백질의 형태로 참여한다. 전략의 기반은 첫째로, 특이적 입체구조에 결합하여 표적 내 배좌 이질성을 최소화시키고, 두번째로 결정 격자 내 분자들 간 1차 접촉을 용이하게 할 수 있는 단백질 표면의 양을 보충하여 정렬된 결정을 수득할 확률을 증가시키는 것이다. 결정화 샤페론 접근법에 내재하는 추가의 속성은 샤페론이 초기 모델-기반 위상 조정 정보를 제공할 수 있다는 것이다 (Koide, 2009). Nanobodies®는 그들이 특이적 입체구조를 안정화시키므로 특히 그들 표적의 결정학을 위한, 구조 분석의 촉진자로서 광범위하게 사용되어 왔다 (Pardon et al., 2014; Rostislavleva et al., 2015). 일례로는 이들 도구가 어떻게 구조 연구를 추진할 수 있는 가를 입증하는 GPCR 결정화의 상황에서 강력한 Nanobody® 기술의 사용이다 (Manglick et al., 2017; Staus et al., 2016).
여전히, X-선 결정학은 본질적으로 고품질 정제 단백질에 대한 전제조건, 필요한 비교적 대량의 단백질, 및 많은 단백질의 회절 품질 결정을 수득하는 어려움과 같은, 몇가지 단점을 갖는다. 단일 입자 전자 저온현미경 (cryo-EM)이 최근에 원자 분해능으로 거대분자 복합체의 구조 분석을 위한 대안의 다재다능한 기술로 개발되었다 (Nogales, 2016). 데이터 분석을 위한 장비 및 방법이 꾸준히 개선되고 있지만, 소형 크기, 낮은 대칭성, 및 고도의 가요성 입자를 높은 분해능으로 분석하기 위한 도구는 없다. 소정 샘플의 균질성에 대한 전제조건이외에도, 3D 재구성의 최고로 달성가능한 분해능은 높은 정밀도로 각각의 개별 입자의 배향 변수를 반복적으로 정제하는 능력에 상당히 의존적이다. 특별한 영역이 우선적으로 공기-물 계면 또는 기재 지지체에 부착되게 하는 거대분자의 표면 성질에 기인한 바람직한 입자 배향은 cryo-EM에서 되풀이되는 문제를 대표한다. 따라서, 대형 분자는 노이즈 있는 냉동 수화 샘플의 저용량 이미지에서 비교적 인식되기 쉽고, 이들 입자는 그들 배향 변수의 정확한 결정을 용이하게 하는 충분한 구조적 특성을 갖지만 (Henderson, 1995), 소형 입자의 이미지를 수집하고 처리하는 방법은 훨씬 더 어렵다. 한가지 근본적인 한계는 유리화 얼음에 포매된 소형 단백질 또는 복합체의 이미지가 주로 이미지의 신호 대 노이즈 비율이 입자의 크기에 따라 감소되므로, 정확한 이미지 정렬을 위한 적절한 특성을 함유하지 않는다는 것이다. 이들 단백질에 화학 링커를 첨가하거나 또는 융합 단백질을 생성시켜서 이러한 한계들을 극복하려는 노력들이 이루어져 왔다. 예를 들어, 표적 단백질 및 다량체-형성 글루타민 신써타제 사이의 최적화된 접합부가 동종-올리고머로서 사용되어 대칭성이 획득되었고, 그리하여 cryo-EM에서 이들 소형 표적 단백질의 나노미터 분해능을 가능하게 하였다 (Coscia et al., 2016). 이러한 융합체를 사용하는 문제는 그들이 가요성 링커를 통해 만들어지므로, 그 결과 강성의 결여와 제한적인 배좌 균질성이 초래된다는 것이다. Zhang 등 (2015)은 인간화 효현제를 생성시키기 위해 사이토카인과 인간화 항체의 보다 강성인 융합체를 보고하였다. 이 강성 융합체는 소 Fab 구조 모티프를 기반으로 하는, 올바른 폴딩을 위한 코일드-코일 '줄기부' (coiled-coil stalk) 모티프를 사용하여 만들어졌다. 항체의 상보성 결정 영역 (CDR)이 존재하는 융합체의 이러한 줄기부 모티프에 커플링된 사이토카인은 사이토카인의 폴딩 및 생물학적 활성을 유지하는 것으로 보이지만, 항체의 항원 결합 능력은 상실하는 것으로 보인다. Fab (∼50 kDa)와 같은 항체 단편이 Cryo-EM을 통해서 소형 단백질의 구조를 규명하는데 적용되었다 (Wu et al., 2012; Lin et al., 2013). Fab 사용의 한가지 단점은 그들이 또한 선형 에피토프에 결합한다는 것인데, 이것은 낮은 강성을 초래하는 것으로 알려져 있어서, 강성 결합 및 구조적 용이함을 수득하는데 필요한 Fab의 적절한 선택을 요구한다. 게다가, Fab는 (그들의 가변 및 불변 도메인 사이에) 내부 가요성을 가지며, 여전히 크기가 비교적 작고, 나노바디와 비교하여 생산하기가 더 어렵다. 나노바디가 구조 분석을 위해 배좌 이질성을 감소시키는데 탁월한 도구이긴 하지만, Nb (15 kDa)도 역시 소형 단백질이고 결정 격자 내 분자 간 1차 접촉을 용이하게 하기 위한 대량의 단백질 표면을 공급하지 못한다. 그들이 너무 작기 때문에, 역시 소형 단백질의 고분해능 Cryo-EM을 위한 크기-관련 요건을 가능하게 맞추는 것이 신통치 않다.
X-선 결정학 또는 cryo-EM에 의한 정확한 구조 분석을 위해서, 강성 샤페론의 일반 프로토타입 용액이 요구된다. 그래서, 가요성 링커 대신에 강성 방법으로 융합된, 신규 키메라의 디자인은 거대한 입체구조적으로 안정한 단백질 구조를 구축하는데 유리할 수 있다. 종합해 보면, 결정화 또는 단일 입자 분석, 특히 cryo-EM을 통한 소형 단백질 또는 단백질 복합체, 또는 심지어 단백질-단백질 상호작용의 구조 분석을 가능하게 하는 차세대 사페론에 대한 분명한 요구가 존재한다. 표적의 감소된 입체구조적 가요성을 야기시키기 위해서 일반 방법을 통해 이러한 샤페론을 디자인하고 생성시키는 것이 유리할 것이다. 첫째로, 고분해능 구조를 수득하는 방식으로 분해능을 개선시키기 위해 표적에 정의된 특성을 부가하고/하거나 질량을 부가하기 위한 보조 도구로서이다. 따라서, 이것은 구조-기반 약물 디자인에 유리할 것이고 신규 화합물의 발굴 및 개발을 보조할 것이다. 두번째로, 또한 증가된 강성으로 이득을 얻는 진단 또는 치료 제품을 포함하여, 생물리, 의학을 비롯한 작물 보호 용도를 위한 새로운 유형의 작용제를 제공하는 것이다.
본 발명은 신규 기능성 항원-결합 키메라 단백질의 디자인 및 생성 및 이의 용도, 예컨대 구조 분석에서 차세대 샤페론으로서 그들 역할을 비롯하여, 치료 및 진단 분자로서 그들 용도에 관한 것이다. 특히, 면역글로불린 또는 면역글로불린-유사 도메인 및 스캐폴드 단백질을 포함하는 항원-결합 키메라 단백질은 항원-결합 성질을 포함하고 표적 상의 결합 입체구조 에피토프에 특이적인 면역글로불린 또는 면역글로불린-유사 도메인의 유리한 기능적 특성을, 이의 폴딩 또는 기능성을 간섭하지 않고 면역글로불린 도메인의 토폴로지를 방해하는 방식으로 면역글로불린 도메인에 다재다능한 방식으로 스캐폴드 단백질이 융합할 수 있게 하는 면역글로불린 도메인의 유리한 구조적 특성을 조합하여 디자인되었다. 최종 항원-결합 키메라 단백질은 스캐폴드, 또는 이의 단편이 항원-결합 도메인의 토폴로지 내에 삽입되도록 디자인된, 스캐폴드 단백질 및 상기 항원-결합 도메인 간 유전자 융합체의 발현을 통해 수득된다. 놀랍게도 최종 신규 항원-결합 키메라 단백질은 그들 융합 영역에서 높은 강성을 특징으로 하고 놀랍게도 그들의 전형적인 폴딩 및 기능성을 유지하며, 다시 말해서 그들이 그들 항원 또는 표적 단백질에 결합하는 높은 친화성을 유지한다는 것을 보여준다. 사실, 항원-결합 도메인 및 스캐폴드 단백질 간에 만들어진 유전자 융합체는 항원 결합을 위한 상보성 결정 영역 (CDR) 구조를 파괴하거나 또는 변경시키지 않는다. 따라서 본 발명은 디자인하는 것이 쉽지 않은, 스캐폴드 단백질과의 강성 비가요성 융합체를 가능하게 하기 위해, 항원-결합 도메인 내 노출된 영역(들)에 빈틈없이 선택된 부위를 가짐으로써 신규하고 독특한 유형의 항원-결합 키메라 단백질을 제공한다. 그리하여 항원-결합 키메라 단백질은 질량을 부가하고 구조적 특성을 공급하여 소형 단백질의 고분해능 cryo-EM 및 X-선 결정학 구조 분석을 용이하게 하기 위한 신규 도구를 제공한다. 실제로, 균질 샘플의 주로 대형 및 중간형-크기의 거대분자 조립체는 아직은 cryo-EM에서 원자 수준으로 특징규명할 수 있다. 그래서 본 발명의 항원-결합 키메라 단백질은 바람직한 입자 배향 (역시 스캐폴드에 의존적)을 다루는데서, 입자 크기를 증가시키는 것을 보조하게 될 것이고, 크기 제한 감소 및 분해능 증가를 야기시키도록 단편의 더 나은 정렬을 가능하게 할 것이다. 그리하여 임의의 가능한 항원 또는 표적의 구조 분석을 위한 이들 차세대 샤페론의 디자인 및 생성은 고분해능 구조를 수득하게 하는 방식으로 분해능을 개선시키기 위해 관심 표적에 질량을 부가하고/하거나 정의된 특성을 부가하기 위한 지지 도구로서 항원-결합 키메라 단백질을 적용할 수 있게 한다. 사실, 항원-결합 키메라 단백질이 구조 분석뿐만 아니라 구조-기반 약물 디자인 및 스크리닝에서의 도구로서 유리할뿐만 아니라, 신규 생물제제 및 소형 분자 작용제의 발굴 및 개발을 위한 부가가치가 된다. 뿐만 아니라, 이러한 강성 융합체를 만들고, 스캐폴드의 유형, 예를 들어 항원-결합 또는 IgG 도메인 그 자체를 포함하는 스캐폴드에 의존적일 때, 의학 분야의 활성 구성성분으로서 항원-결합 키메라를 적용하기 위한 새로운 적용분야는 예를 들어 신규 강성 융합 치료 분자로서, 또는 보호제를 제공하는 작물 보호 분야에서 생기게 된다. 항원-결합 키메라가 표지된 스캐폴드, 또는 심지어 표지된 항원-결합 도메인으로 만들어질 때, 예를 들어 표적의 비공유 프로빙을 통해, 예를 들어 생체내-영상화에서 기술적 개선을 가속시키는 새로운 진단 도구도 역시 본 발명에 포함된다.
본 발명의 제1 양상은 스캐폴드 또는 융합 파트너 단백질에 연결되는, 항원-결합 도메인을 포함하는 항원-결합 키메라 또는 융합 단백질에 관한 것으로서, 상기 스캐폴드 단백질은 상기 도메인의 표면에서 접근가능하거나 또는 노출되는 하나 이상의 아미노산 부위에서 상기 항원-결합 도메인에 커플링되어, 그 결과 상기 항원-결합 도메인의 토폴로지의 파괴가 초래된다. 상기 항원-결합 키메라 단백질은 상기 스캐폴드 단백질에 융합되지 않은 항원-결합 도메인과 비교하여 이의 항원-결합 기능성을 보유하는 것을 더욱 특징으로 한다. 다른 실시형태는 본 발명의 항원-결합 키메라 단백질을 개시하고, 여기서 스캐폴드 단백질 및 항원-결합 도메인의 융합은 항원-결합 도메인의 주요 토폴로지 파괴를 초래하여, 다른 단백지로가 융합되지 않은 항원-결합 단백질의 폴딩과 비교하여, 상기 항원-결합 도메인의 폴딩을 유지할 수 있게 한다.
본 발명의 특정 실시형태에서, 융합체는 직접 융합체일 수 있거나, 또는 링커 또는 링커 펩티드에 의해 만들어지는 융합체일 수 있으며, 상기 융합 부위는 강성, 비가요성 융합 단백질이 생성되도록 빈틈없이 디자인된다. 바람직하게, 링커는 10개, 9개, 8개, 7개, 6개, 5개, 4개, 3개, 또는 보다 바람직하게 2개, 보다 더 바람직하게 1개의 아미노산 잔기를 포함하거나, 또는 직접 융합체 (링커없음)이다. 다른 실시형태에서, 상기 항원-결합 키메라 단백질은 바람직하게 항원-결합 도메인의 베타 턴 (β-턴) 또는 루프인, 노출된 영역에 존재하는 적어도 하나 이상의 접근가능한 부위에서 융합된다. 항원-결합 도메인의 표면에서 하나 이상의 접근가능하거나 또는 노출된 부위에서 항원-결합 도메인에 커플링된 스캐폴드 단백질이 존재하는 상기 항원-결합 키메라 단백질은 상기 접근가능하거나 또는 노출된 부위가 이의 항원 결합 기능성을 보유한다는 것에 관해서, 항원-결합 루프 또는 CDR 루프와 상이하다는 것을 더욱 특징으로 한다. 일 실시형태에서, 상기 항원-결합 키메라 단백질은 IMGT® 국제 기준 명명법 (Lefranc, 2014; 도 25)에 따라 정의된 바와 같이, 적어도 7개의 역평행 β-스트랜드 (strand)와 상기 상기 β-스트랜드를 연결하는, 적어도 3개 β-턴 (turn)을 갖는 항원-결합 도메인을 포함한다. 특정 실시형태에서, 상기 항원-결합 키메라 단백질의 상기 항원-결합 도메인은 면역글로불린 (Ig) 도메인 또는 Ig 폴드를 포함한다. 특별한 실시형태에서, 항원-결합 키메라 단백질의 Ig 도메인은 VHH로부터 유래되거나, 또는 보다 바람직하게 면역글로불린 단일 가변 도메인 (ISVD)으로부터 유래되거나 또는 나노바디로부터 유래된다.
특정 실시형태에서, 항원-결합 키메라 단백질의 상기 항원-결합 도메인의 노출된 영역은 특히 IMGT 명명법 (도 25, [Lefranc, 2014]로부터 개조)에 따른, β-턴 AB, CC', C''D, DE, 또는 EF에 관한 것이다. 그래서, 스캐폴드 단백질은 다음과 같이 항원-결합 도메인 내에 삽입된다: 상기 항원-결합 도메인의 β-스트랜드 A 및 β-스트랜드 B를 연결하는 제1 β-턴; 또는 상기 항원-결합 도메인의 β-스트랜드 C 및 β-스트랜드 C'을 연결하는 β-턴; 또는 상기 항원-결합 도메인의 β-스트랜드 C'' 및 β-스트랜드 D를 연결하는 β-턴; 또는 상기 항원-결합 도메인의 β-스트랜드 D 및 β-스트랜드 E를 연결하는 β-턴; 또는 상기 항원-결합 도메인의 β-스트랜드 E 및 β-스트랜드 F를 연결하는 β-턴 (상기 β-턴은 [IMGT, LeFranc 2014]에 따라 정의됨). 특별한 실시형태에서, 항원-결합 키메라 단백질은 상기 항원-결합 도메인의 β-스트랜드 A 및 β-스트랜드 B를 연결하는, β-턴 AB를 포함하는 상기 도메인의 노출 영역 내 접근가능한 부위에 스캐폴드 단백질의 융합을 통해 생성된다.
본 발명의 다른 실시형태에서, 항원-결합 키메라 단백질을 생성시키는데 사용되는 스캐폴드 단백질은 원형으로 배열된 단백질이고, 보다 특히, 원형 배열은 상기 스캐폴드 단백질의 N-말단과 C-말단 사이에서 만들어질 수 있다. 일정 실시형태에서, 원형으로 배열된 스캐폴드 단백질은 Ig 도메인의 접근가능한 부위(들)에서의 융합을 위한 부위를 제공하기 위해, 상기 스캐폴드 단백질의 다른 접근가능한 부위에서 절단된다.
다른 실시형태는 항원-결합 키메라 단백질에 관한 것이고, 여기서 스캐폴드 단백질은 단량체 단백질이다. 대안적인 실시형태에서, 스캐폴드 단백질은 대칭 구조, 예컨대 다량체 또는 올리고머-형성 단백질 또는 바이러스-유사 입자 (VLP)와 같은 20면체 구조의 일부이거나 또는 그를 형성하는 단백질을 갖는다. 특정 실시형태에서, 스캐폴드가 다량체인, 상기 항원-결합 키메라 단백질은 상기 다량체 스캐폴드의 각각의 단량체를 통해 이의 접근가능한 부위(들)에서 Ig 도메인과 연결되거나 또는 융합된다. 다른 실시형태에서, 항원-결합 키메라 단백질의 항원-결합 도메인 및 스캐폴드 단백질은 항원-결합 도메인 및 스캐폴드 단백질 중 하나에 존재하는 2개 시스테인 잔기 사이에 공유적으로 형성된, 디술피드 결합을 통해 추가적으로 연결된다. 본 발명의 다른 실시형태는 스캐폴드 단백질(들)의 총 분자 질량이 적어도 30 kDa인, 항원-결합 키메라 단백질에 관한 것이다.
본 발명의 특정한 실시형태는 항원-결합 키메라 단백질에 관한 것으로서, 여기서 스캐폴드 단백질은 항원-결합을 포함한다. 특히, 상기 스캐폴드 단백질은 면역글로불린 도메인, 또는 보다 특히 VHH, ISVD, 또는 나노바디를 포함한다. 대안적으로, 상기 스캐폴드 단백질은 면역글로불린-유사 도메인, 보다 특히, 모노바디를 포함한다. 보다 특히, 항원-결합 키메라 단백질이 제공되고, 여기서 항원-결합 도메인을 비롯하여 항원-결합 도메인-함유 스캐폴드는 그들 항원 표적에 특이적으로 결합하는 기능성을 보유한다. 특별한 실시형태에서, 상기 항원-결합 도메인-함유 스캐폴드는 스캐폴드 단백질에 융합된 항원-결합 도메인과 상이한 표적에 결합된다. 대안적인 일 실시형태에서, 스캐폴드 단백질의 항원-결합 도메인의 항원 표적은 상기 스캐폴드 단백질과 융합된 항원-결합 단백질 도메인의 항원 표적과 동일하다. 보다 더 특히, 항원 표적은 항원-결합 키메라 단백질의 양쪽 항원-결합 도메인에 대해 동일한 단백질에 관한 것이지만, 항원 표적 상의 그들 에피토프는 상이하다.
다른 실시형태에서, 항원-결합 키메라 단백질의 스캐폴드 단백질은 표지된 단백질이다. 특별한 실시형태에서, 표지는 검출가능한 표지이다. 다른 실시형태에서, 항원-결합 키메라 단백질의 항원-결합 도메인은 표지된 항원-결합 도메인이다. 보다 특히, 항원-결합 도메인 또는 스캐폴드 단백질에 의해 융합 또는 연결 및/또는 제공되는 상기 표지는 신규 항원-결합 키메라 단백질의 항원-결합 도메인의 항원 표지의 생체 내 및/또는 비공유 검출 또는 표지화를 가능하게 한다. 특정 실시형태에서, 상기 표지된 항원-결합 키메라 단백질은 독성 표지를 포함할 수 있고, 치료 용도로 적용가능하다.
본 발명의 추가 양상은 상기 기술된 바와 같은 임의의 항원-결합 키메라 단백질을 코딩하는 핵산 분자에 관한 것이다. 대안적으로, 일 실시형태에서, 키메라 유전자는 적어도 프로모터, 항원-결합 키메라 단백질을 코딩하는 상기 핵산 분자, 및 전사 종결 신호를 함유하는 3' 말단 영역을 제공한다. 다른 실시형태는 상기 항원-결합 키메라 단백질을 코딩하거나, 또는 상기 항원-결합 키메라 단백질을 코딩하는 핵산 분자 또는 키메라 유전자를 포함하는 발현 카세트에 관한 것이다. 추가 실시형태는 본 발명의 항원-결합 키메라 단백질을 코딩하는 상기 발현 카세트 또는 핵산 분자를 포함하는 벡터에 관한 것이다. 특정 실시형태에서, 상기 벡터는 이. 콜라이, 또는 효모, 파지, 박테리아 또는 바이러스 (표면) 디스플레이에서 발현에 적합하다. 다른 실시형태에서, 본 발명의 항원-결합 키메라 단백질을 포함하는 숙주 세포를 개시한다. 대안적으로, 숙주 세포는 상기 항원-결합 키메라 단백질 및 이의 표적 항원을 공발현한다.
본 발명의 다른 양상은 상기 항원-결합 키메라 단백질, 및 이의 표적 단백질을 포함하는 복합체에 관한 것으로서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질에 특이적으로 결합된다. 보다 특히, 상기 표적 단백질은 상기 항원-결합 키메라 단백질의 항원-결합 도메인, 보다 특히 Ig 도메인, 보다 더 특히 상기 항원-결합 키메라 단백질의 Ig 도메인의 CDR에 결합된다.
다른 실시형태는 상기 항원-결합 키메라 단백질을 포함하는 조성물, 보다 특히 상기 항원-결합 키메라 단백질의 약학 조성물을 제공한다.
본 발명의 다른 실시형태는 본 발명에 따른 제1 및 제2 항원-결합 키메라 단백질 간에 형성된 복합체를 포함하는 조성물에 관한 것으로서, 상기 제2 항원-결합 키메라 단백질의 항원-결합 도메인은 제1 항원-결합 키메라 단백질의 스캐폴드 단백질에 특이적으로 결합하거나 또는 그를 인식한다.
다른 양상은 표적 또는 항원 단백질의 구조 분석을 위한, 본 발명의 항원-결합 키메라 단백질의 용도, 또는 핵산 분자, 키메라 유전자, 발현 카세트, 벡터, 복합체, 또는 조성물의 용도에 관한 것이다. 특히, 항원-결합 키메라 단백질의 용도에 관한 것으로서, 여기서 상기 표적 단백질은 상기 항원-결합 키메라 단백질에 결합되는 단백질이다. 특히 실시형태는 단일 입자 cryo-EM를 포함하거나 또는 결정학을 포함하는 구조 분석에서 항원-결합 키메라 단백질의 용도에 관한 것이다.
다른 실시형태는 진단 도구, 또는 보다 특히 생체내 영상화를 위한, 상기 항원-결합 키메라 단백질의 용도를 제공하고, 여기서 스캐폴드 단백질 또는 심지어 항원-결합 도메인은 표지된다.
대안적인 실시형태는 의약으로서 사용을 위한, 상기 기술된 바와 같은 상기 항원-결합 키메라 단백질, 또는 본 발명에서 제공되는 핵산 분자, 발현 카세트, 벡터, 복합체 또는 조성물의 용도를 제공한다.
특별한 실시형태는 본 발명의 항원-결합 키메라 단백질을 포함하는 바이러스-유사 입자 (VLP)에 관한 것이다.
본 발명의 제1 양상은 표적 또는 항원 단백질 또는 관심 단백질의 3-차원 구조를 결정하는 단계에 관한 것으로서, 하기 단계를 포함한다:
(i) 복합체를 형성하기 위해 본 발명의 항원-결합 키메라 단백질, 또는 본 발명의 항원-결합 키메라 단백질의 복합체를 포함하는 조성물, 및 표적 단백질을 제공하는 단계로서, 상기 표적 단백질은 항원-결합 키메라 단백질의 조성물에 특이적으로 결합하는 것인 단계,
또는 대안적으로, 본 발명의 복합체를 제공하는 단계; 및
(ii) 구조 분석을 위해, 적합한 조건 하에서 상기 믹스 또는 복합체를 디스플레이하는 단계,
여기서 상기 항원 또는 표적 단백질의 3D 구조는 고분해능으로 결정된다.
기술된 도면은 단지 개략적이며 제한되지 않는다. 도면에서, 일부 구성요소의 크기는 과장될 수 있으며 예시 목적을 위해 비율에 맞게 도시되지 않는다.
도 1. 강성 항원-결합 키메라 단백질과 비교한 가요성 융합 단백질
(A) 오직 하나의 직접 융합 또는 링커를 사용하는 스캐폴드 단백질 및 항원-결합 도메인의 N-말단 또는 C-말단에서의 가요성 융합체 또는 링커. (B) 항원-결합 도메인이 적어도 2개의 직접 융합 또는 항원-결합 도메인을 스캐폴드에 연결시키는 링커를 통해서 스캐폴드 단백질과 융합된 것인, 항원-결합 도메인 및 스캐폴드 단백질의 강성 융합체.
도 2. 나노바디의 β-스트랜드 A 및 B를 연결시키는 제1 β-턴에 삽입된 스캐폴드 단백질의 원형 배열 변이체로부터 구축된 항원-결합 키메라 단백질의 조작 원리.
이러한 계획은 나노바디 (Nb)가 항원-결합 도메인을 스캐폴드에 연결시키는 2개의 짧은 링커 또는 2개의 펩티드 결합을 통해 거대한 스캐폴드 단백질 상에 그라프트될 수 있는 방법을 도시한다. 가위표는 나노바디 및 스캐폴드에서 어떠한 노출 턴이 절단되어야 하는가를 표시한다. 파선은 스캐폴드 및 Nb의 나머지 부분이 항원-결합 키메라 단백질을 구축하기 위해서 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 어떻게 쇄상화되어야 하는가를 표시한다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT (도 25, [Lefranc, 2014]으로부터 개조)에 따라 정의된다.
도 3. GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결시키는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 모델
(A) 스캐폴드에 나노바디를 연결시키는 2개의 펩티드 결합 또는 링커를 통해서 에이치. 피로리 (H. pylori) (아래)의 HopQ의 어드헤신 도메인의 원형 배열 변이체 및 GFP-특이적 나노바디 (위)의 융합을 통해 만들어진 항원-결합 키메라 단백질의 모델. (B) 헬리코박터 피로리 (Helicobacter pylori) 균주 G27의 1형 HopQ의 어드헤신 도메인을 코딩하는 원형 배열 유전자 (아래, PDB 5LP2, SEQ ID NO:19, cHOPQ)는 β-스트랜드 A를 β-스트랜드 B에 연결시키는 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 제1 β-턴 (β-턴 AB)에 삽입되었다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (MbNb207 cHopQ, SEQ ID NO:20). 나노바디로부터 기원된 서열은 굵게 도시된다. HopQ로부터 기원된 서열은 밑줄표시되어 있다. 원형 배열체를 만들기 위해 HopQ의 N-말단 및 C-말단을 연결시키는 펩티드는 이탤릭체로 도시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 4. EBY100 효모 세포 표면 상의 항원-결합 키메라 단백질 Mb Nb207 cHopQ 디스플레이의 유세포측정 분석
단일 매개변수 히스토그램은 비형질전환된 EBY100 효모 세포 (아래)와 비교한 Aga2p 및 ACP (SEQ ID NO:22)에 융합된 항원-결합 키메라 단백질 MbNb207 cHopQ 를 코딩하는 pCTCON2 유도체로 형질전환된 EBY100 효모 세포 (위)의 상대적 형광 강도를 도시한다. 형질전환 및 비형질전환 효모 세포는 SFP 신타제 (1 μM)를 사용하여 CoA-647 (2 μM)로 직교적으로 염색되었다.
도 5. EBY100 효모 세포 표면 상에 디스플레이된 항원-결합 키메라 단백질 Mb Nb207 cHopQ 의 기능성의 유세포측정 분석
비형질전환된 EBY100 효모 세포 (아래)와 비교하여 Aga2p 및 ACP에 융합된 MbNb207 cHopQ 를 코딩하는 pCTCON2 유도체 (SEQ ID NO:22)로 형질전환된 개별 EBY100 효모 세포 (위)의 상대적 형광 강도를 나타내는 점 그래프. 형질전환 및 비형질전환 효모 세포는 SFP 신타제 (1 μM)를 사용하여 CoA-647 (2 μM)로 직교적으로 염색되었고 100 nM GFP와 인큐베이션되었다.
도 6. 크기 배제 크로마토그래피 및 SDS-PAGE에 의한 항원-결합 키메라 단백질 Mb Nb207 cHopQ 및 GFP 간 복합체의 형성의 분석 분석
MbNb207 cHopQ (SEQ ID NO:20) 및 녹색 형광 단백질 (GFP) 간 안정한 복합체의 형성을 확인하기 위한 Superdex 75 PG 컬럼 (16/90, GE Healthcare) 상에서의 분석적 겔 여과 실험 (Scholz et al., 2000). (A) SEC에 의한 복합체 형성의 분석. 회색선: UV 280 nm 흡광도를 통해 측정된 GFP를 단독으로 함유하는 샘플의 겔 여과 패턴. 검은색 파선: UV 280 nm 흡광도를 통해 측정된 1:4 몰비율로 MbNb207 cHopQ 및 GFP를 함유하는 샘플의 겔 여과 패턴. 검은색선: UV 488 nm 흡광도로 측정된 1:4 비율로 MbNb207 cHopQ 및 GFP를 함유하는 샘플의 겔 여과 패턴. (B) SDS-PAGE를 통한 항원-결합 키메라 단백질 MbNb207 cHopQ 및 GFP 간 안정한 복합체 형성의 확인. 1:4 몰비율로 MbNb207 cHopQ 및 GFP를 함유하는 샘플을 Superdex 75 PG 컬럼에 도포하였고 상대적 분획을 SDS-PAGE를 통해 분석하였다.
도 7. GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 X-선 결정 구조.
(A) 비대칭 유닛으로 10 GFP-결합 키메라 단백질의 정렬 (만화 도면). 비대칭 유닛으로 10개 분자를 갖는 공간군 P1에서 결정화된 58 kD 항원-결합 키메라 단백질 MbNb207 cHopQ (SEQ ID NO:20). 스캐폴드로서 사용된 HopQ (PDB 5LP2)의 어드헤신 도메인은 붉은색으로 도시되고, GFP-특이적 Nb는 녹색으로 도시된다. (B) 나노바디를 스캐폴드에 연결시키는 펩티드 (분자 A)는 1.0σ에서 등고선이 그려진 2Fo-Fc 전자 밀도 지도에서 분명하게 정의된다. (C) 비대칭 유닛으로 함유된 모든 항원-결합 키메라 단백질 MbNb207 cHopQ 의 구조적 정렬. 비대칭 유닛의 상이한 분자 간 RMSD는 0.3 내지 2.7Å 범위이다.
도 8. 스캐폴드 단백질 HopQ를 나노바디에 연결하는 링커 펩티드의 조성 및 길이의 최적화를 위한 효모 디스플레이 벡터
(A) 디스플레이 벡터의 개략도. LS: 효모에서 세포외 분비를 유도하는 효모 α-인자의 조작된 분비 신호, appS4 (Rakestraw et al. 2009). N: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), : 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), Aga2: Aga1p 단백질에 대한 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티닌 단백질 Aga2p의 Aga2p 부착 서브유닛 (Chao et al., 2006), ACP: 그 발현 수준을 모니터링하기 위해 디스플레이된 항원-결합 키메라 단백질의 직교적 표지화를 위한 아실 캐리어 단백질 (Johnsson et al., 2005). (B) 디스플레이된 항원-결합 키메라 단백질의 서열 다양성 (SEQ ID NO:34-37): 보통체의 AppS4 리더 서열, 굵은체로 표시된 무작위 링커를 갖는 메가바디 cHopQNb GFP 207, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 이탤릭체의 가요성 (GGGS) n 폴리펩티드 링커, 밑줄표시된 Aga2p 단백질 서열, , cMyc 태그. (C) 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커를 도입시키기 위해 2종의 전방향 (SEQ ID NO:126, SEQ ID NO:127) 및 2종의 역방향 PCR 프라이머 (SEQ ID NO:128, SEQ ID NO:129)의 등몰량 혼합물을 사용하여, 총 184.000 AA-서열 변이체를 코딩하는, 항원-결합 키메라 단백질 서열의 4개 풀을 생성시켰다 (각각 라이브러리의 25%를 나타냄).
도 9. 시험관내 선택을 통한 GFP-특이적 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 YgjK의 원형 배열 변이체로부터 구축된 100 kDa 항원-결합 키메라 단백질의 모델.
(A) GFP-특이적 나노바디 (위) 및 에스케리치아 콜라이 (Escherichia coli) K12 YgjK (아래)의 융합으로 만들어진 항원-결합 키메라 단백질의 모델. (B) 에스케리치아 콜라이 K12 YgjK를 코딩하는 원형 배열 유전자 (PDB 3W7S, SEQ ID NO:38)는 YgjK 단백질이 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커를 사용하여 β-스트랜드 A를 β-스트랜드 B에 연결하는 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 제1 β-턴 (β-턴 AB)에 삽입되어 융합되었다. (C) 100 kDa 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:39-42). 굵은체는 Nb GFP 207 서열, 이탤릭체는 원형 배열 링커, 밑줄표시된 Ygjk 서열, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. C-말단 태그는 6xhis 및 EPEA를 포함한다.
도 10. 스캐폴드에 나노바디를 연결하는 조작된 디술피드 결합에 의해 더욱 강성화된, GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD 항원-결합 키메라 단백질.
β-스트랜드 A를 β-스트랜드 B에 연결하는 GFP-특이적 나노바디 (SEQ ID NO:1)의 제1 β-턴 (AB β-턴)에 삽입된 헬리코박터 피로리 균주 G27 (아래, PDB 5LP2, SEQ ID NO:19)의 1형 HopQ의 어드헤신 도메인으로부터 구축된 항원-결합 키메라 단백질의 강성을 더욱 증가시키기 위해서, 나노바디를 스캐폴드에 연결시키는 추가 디술피드 결합을 조작하기 위해 부위-지정 돌연변이유발법을 사용하였다. (A) C357 및 C425 사이에 조작된 디술피드 브릿지를 함유하는 항원-결합 키메라 단백질 MbNb207 cHopQ 의 돌연변이체의 모델 (SEQ ID NO:48). (B) C358 및 C488 사이에 조작된 디술피드 브릿지를 함유하는 MbNb207 cHopQ의 돌연변이체의 모델 (SEQ ID NO:49). (C) C359 및 C490 사이에 조작된 디술피드 브릿지를 함유하는 MbNb207 cHopQ 의 돌연변이체의 모델 (SEQ ID NO:50). (D) C15 및 C534 사이에 조작된 디술피드 브릿지를 함유하는 MbNb207 cHopQ 의 돌연변이체의 모델 (SEQ ID NO:51).
도 11. 면역글로불린을 스캐폴드에 연결시키는 3개 펩티드 결합 또는 짧은 링커를 통한 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 스캐폴드 단백질로부터 구축된 항원-결합 키메라 단백질의 조작 원리
항원-결합 도메인은 3개의 직접 융합 또는 링커를 통해 만들어진 3개 융합을 통해서, 노출 영역 또는 β-턴 내 하나 이상의 접근가능한 부위, 및/또는 단백질 말단의 접근가능한 부위에서 스캐폴드 단백질에 융합될 수 있다. 이러한 계획에서, 3개 펩티드 결합 또는 짧은 링커를 통해서 스캐폴드에 Ig 도메인을 연결시키기 위해 나노바디의 C-말단부 및 β-턴 AB를 사용하였다. 가위표는 나노바디 및 스캐폴드에서 어떠한 노출된 턴을 절단시켜야 하는가를 의미한다. 파선은 이러한 항원-결합 키메라 단백질을 구축하기 위해 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 스캐폴드 및 Nb의 나머지 부분이 어떻게 쇄상화되어야 하는가를 보여준다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT에 따라 정의된다 (도 25, [Lefranc, 2014]로부터 개조).
도 12. 면역글로불린을 스캐폴드에 연결시키는 3개의 펩티드 결합 또는 짧은 링커를 통해서 GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 Cu ++ -결합 단백질 아주린으로부터 구축된 항원-결합 키메라 단백질의 모델.
(A) 3개 펩티드 링커를 통해서 슈도모나스 애루지노사 (Pseudomonas aeruginosa)의 아주린 (아래, PDB 2TSA, SEQ ID NO:52)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 융합을 통해 만들어진 항원-결합 키메라 단백질의 모델. 구리 이온은 파란색으로 도시된다. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 스캐폴드 단백질 (아주린)의 N-말단부가 후속되고, 그 다음으로 면역글로불린의 C-말단부가 후속되고, 이후에 스캐폴드 (아주린)의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:53-60): 굵은체는 Nb GFP 207 서열, 밑줄표시된 아주린 서열, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 13. 면역글로불린을 스캐폴드에 연결하는 3개 펩티드 결합 또는 링커를 통해서 GFP-특이적 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 전화성 글리코시드 히드롤라제 스캐폴드 단백질 SusB로부터 구축된 이중 대칭성의 이량체 항원-결합 키메라 단백질의 모델.
(A) 3개 펩티드 링커를 통해서 박테로이데스 테타이오타오미크론 (Bacteroides thetaiotaomicron) SusB의 전화성 글리코시드 히드롤라제 (아래, PDB 3WFA, SEQ ID NO:69)에 연결되는 GFP-특이적 나노바디 (위 좌측 및 우측, SEQ ID NO:1)의 융합으로 만들어진 항원-결합 키메라 단백질의 모델. SusB는 이중 대칭성을 갖는 절대 이량체이다. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 스캐폴드 단백질 (SusB)의 N-말단부가 후속되고, 그 다음으로 면역글로불린의 C-말단부가 후속된 다음에, 스캐폴드의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열. 굵은체는 Nb GFP 207 서열, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 밑줄표시된 susB 서열. C-말단 태그는 6xhis 및 EPEA를 포함한다.
도 14. 박테리오파지 PP7로부터 유래된 20면체 VLP 상에서 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 90카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 20면체 (VLP) (내부 분자)의 개략도. 야생형 20면체 PP7 바이러스는 180개의 동일한 카피의 PP7 외피 단백질로 구성된 T=3 쉘을 갖지만, 2개 외피 단백질은 N을 C에 융합시킬 수 있어서 90개의 공유 외피 단백질 이량체로 구성된 VLP를 생성시킬 수 있다 (O'Rourke et al., 2015). (B) 슈도모나스 애루지노사 (아래, PDB 1DWN)의 박테리오파지 PP7의 공유 외피 단백질 이량체의 원형 배열 변이체에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)를 포함하는 항원-결합 키메라 단백질의 모델. (C) PP7의 배열된 외피 단백질 이량체와 나노바디의 연결 개략도. PP7의 이러한 공유 외피 단백질 이량체를 코딩하는 원형 배열 유전자는 β-스트랜드 A를 β-스트랜드 B에 연결하는 나노바디의 제1 β-턴에 삽입되었다 (SEQ ID NO:3-6). (D) 항원-결합 키메라 외피 단백질의 아미노산 서열. 나노바디로부터 기원된 잔기는 굵은체로 도시된다. (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. PP7 외피 단백질에 상응하는 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 15. 박테리오파지 MS2로부터 유래된 20면체 VLP 상의 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 90카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 20면체 VLP (내부 분자)의 개략도. 야생형 MS2 바이러스는 180개의 동일한 카피의 MS2 외피 단백질로 구성된 20면체 쉘을 형성하지만, 2개 외피 단백질은 N을 C에 융합시킬 수 있어서 90개 공유 외피 단백질 이량체로 구성된 VLP를 생성시킬 수 있다 (O'Rourke et al., 2015). (B) 에스케리치아 콜라이의 박테리오파지 MS2의 공유 외피 단백질 이량체의 원형 배열 변이체 (아래, PDB 2MS2)에 연결된 리소자임-특이적 나노바디 (위, SEQ ID NO:7)를 포함하는 항원-결합 키메라 단백질의 모델. (C) MS2의 배열된 외피 단백질 이량체와 나노바디의 연결 개략도. MS2의 이러한 공유 외피 단백질 이량체를 코딩하는 원형 배열 유전자는 β-스트랜드 A를 β-스트랜드 B에 연결하는 나노바디의 제1 β-턴에 삽입되었다 (SEQ ID NO:9). (D) 항원-결합 키메라 외피 단백질의 아미노산 서열. 나노바디로부터 기원된 잔기는 굵은체로 도시된다. (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. MS2 외피 단백질에 상응하는 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 16. 항원-결합 도메인을 ACP에 연결하는 2개 펩티드 결합 또는 짧은 링커를 통해서 GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입되는 아실 캐리어 단백질로부터 구축된 항원-결합 키메라 단백질의 모델
(A) 2개 펩티드 링커를 통해서 이. 콜라이 유래 아실 캐리어 단백질 (아래, PDB 1T8K, SEQ ID NO:86)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 융합에 의해 만들어진 항원-결합 키메라 단백질의 3D 모델. 이러한 특정한 항원-결합 키메라 단백질에서, 야생형 ACP의 N-말단 및 C-말단이 서로 가깝게 있고 나노바디를 ACP에 연결하는 2개의 짧은 폴리펩티드 연결을 조작하기 위해 잘 위치되어 있기 때문에 스캐폴드 단백질의 원형 배열을 필요로 하지 않았다. 반응성 세린은 좌측 아래에 표시되어 있다. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 ACP가 후속되고, 그 다음으로 나노바디의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이고, ACP 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 17. 양쪽 면역글로불린 도메인을 연결하는 3개 펩티드 결합 또는 짧은 링커를 통해 다른 나노바디에 삽입되는 나노바디로부터 구축된 항원-결합 키메라 단백질의 조작 원리.
이러한 개략도는 나노바디 (Nb)가 하나의 항원-결합 도메인을 다른 것에 연결시키는 3개 펩티드 결합 또는 3개 짧은 링커를 통해서 다른 나노바디와 어떻게 융합될 수 있는가를 도시한다. 가위표는 어떠한 노출 턴이 연결하려는 나노바디에서 절단되어야 하는가를 표시한다. 파선은 이들 항원-결합 키메라 단백질을 구축하기 위해 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 양쪽 나노바디의 나머지 부분이 어떻게 쇄상화되어야 하는가를 표시한다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT에 따라 정의된다 (도 25, [Lefranc, 2014]로부터 개조).
도 18:나노2바디 항원-결합 키메라 단백질의 모델
(A) 도 17에 따른 3개 펩티드 링커를 통해서, 리소자임-결합 나노바디 (나노바디 A, SEQ ID NO:7)에 연결시킨 GFP-특이적 나노바디 (나노바디 B, SEQ ID NO:1)의 융합에 의해 만들어진 항원-결합 키메라 단백질의 3D 모델. (B) 나노바디 A와 나노바디 B의 연결 개략도. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:14).
, Nb GFP 207 서열은 굵은체이고, 리소자임-결합 나노바디 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 19: 나노2바디 항원-결합 키메라 단백질의 모델
(A) 도 17에 따른 3개 펩티드 링커를 통해서, FedF-결합 나노바디 (나노바디 A, SEQ ID NO:17)에 연결된 GFP-특이적 나노바디 (나노바디 B, SEQ ID NO:1)의 융합을 통해 만들어진 항원-결합 키메라 단백질의 3D 모델. (B) 나노바디 A와 나노바디 B의 연결 개략도. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:18).
, Nb GFP 207 서열은 굵은체이고, FedF-결합 나노바디 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 20. 파지 디스플레이 또는 효모 디스플레이를 통한 나노바디 면역 라이브러리로부터 유래된 항원-결합 키메라 단백질의 생성 및 선택을 위한 대표 벡터.
여기 도시된 벡터는 나노바디가 항원-결합 도메인을 스캐폴드에 연결시키는 2개 펩티드 결합 또는 2개 짧은 링커를 통해서 거대한 (임의로, 원형 배열) 스캐폴드 단백질과 융합된 항원-결합 키메라 단백질을 코딩한다. LS: 리터 서열. pIII: 사상 파지 M13의 부착 단백질. Aga2: 효모 세포 표면으로부터 돌출되는 Aga2p 메이팅 단백질. ACP: 그 발현 수준을 모니터링하기 위해 디스플레이된 항원-결합 키메라 단백질의 직교적 표지화를 위한 아실 캐리어 단백질. 거대 항원-결합 키메라 단백질 디스플레이 라이브러리는 예를 들어 나노바디의 경우에 면역화된 라마로부터 클로닝되거나 또는 합성 라이브러리로부터 수집될 수 있는 항원-결합 도메인-코딩 유전자의 컬렉션으로부터 C-말단부 (β-스트랜드 B 내지 G 포함)를 클로닝하여 구축될 수 있다.
도 21. 나노바디 면역 라이브러리로부터 유래되고 효모 디스플레이를 통해 선택된 후 FACS에 의한 GFP-특이적 항원-결합 키메라 단백질의 서열 분석
GFP로 면역화시킨 라마의 혈액 샘플로부터 클로닝시키고 그 다음에 HopQ와 융합된 나노바디로부터 출발하여 구축된 항원-결합 키메라 단백질로부터 효모 디스플레이를 통해 선택한 후에 FACS를 수행한 9종의 GFP-특이적 항원-결합 키메라 단백질 (SEQ ID NO:95-103)의 다중 아미노산 서열 정렬. β-스트랜드 B 내지 β-스트랜드 G를 포함하는 나노바디의 C-말단부만이 도시된다.
도 22. GFP-특이적 나노바디의 β-스트랜드 C 및 C'을 연결하는 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 모델.
(A) β-스트랜드 C 및 C'을 연결하는 β-턴을 통해 나노바디 상에 스캐폴드를 그라프트시키기 위한 조작 원리. 가위표는 나노바디 및 스캐폴드에서 어떠한 노출 턴이 절단되어야 하는가를 표시한다. 파선은 이들 항원-결합 키메라 단백질을 구축하기 위해 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 스캐폴드 및 나노바디의 나머지 부분이 어떻게 쇄상화되어야 하는가를 표시한다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT에 따라 정의된다 (도 25, [Lefranc, 2014]로부터 개조). (B) 2개 펩티드 링커를 통해서 HopQ (아래)에 연결된 GFP-특이적 나노바디 (위)의 융합으로 만들어진 항원-결합 키메라 단백질의 3D 모델. (C) 나노바디의 제3 β-스트랜드 (β-스트랜드 C)는 스캐폴드의 원형화 변이체가 후속되고, 그 다음으로 GFP-특이적 나노바디의 β-스트랜드 C' 내지 G가 후속된다. (D) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이고, 원형 배열 링커는 이탤릭체이며, HopQ 서열은 밑줄표시된다.
도 23. 모노바디 NS1의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 모델.
(A) 나노바디를 스캐폴드에 연결시키는 2개 펩티드 결합 또는 링커를 통해서 K-Ras 특이적 모노바디 NS1 (위) 및 에이치. 피로리 HopQ의 어드헤신 도메인의 원형 배열 변이체 (아래)의 융합으로 만들어진 항원-결합 키메라 단백질의 모델. (B) 헬리코박터 피로리 균주 G27의 1형 HopQ의 어드헤신 도메인을 코딩하는 원형 배열 유전자 (아래, PDB 5LP2, SEQ ID NO:19)는 β-스트랜드 A를 β-스트랜드 B에 연결시키는 K-RAS 특이적 모노바디 (위, SEQ ID NO:112)의 제1 β-턴 (β-턴 AB)에 삽입되었다. (C) NS1 및 HopQ로부터 구축된 항원-결합 키메라 단백질의 아미노산 서열. 나노바디로부터 기원된 서열은 굵은체로 도시된다. HopQ로부터 기원되는 서열은 밑줄표시되어 있다. 원형 배열체를 만들기 위해 HopQ의 N-말단 및 C-말단을 연결하는 펩티드는 이탤릭체로 도시되어 있으며, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성물의 짧은 펩티드 링커이다.
도 24. Octet 상에서 분석된 GFP와 항원-결합 키메라 단백질 Mb Nb207 cHopQ 및 Mb Nb207 cYgjkE2 의 상호작용의 운동학적 특징규명 .
생물층 간섭계를 통한 GFP와 GFP-결합 나노바디 NbGFP207 (SEQ ID NO:1), 항원-결합 키메라 단백질 MbNb207 cHopQ (SEQ ID NO:20) 및 MbNb207 cYgjkE2 (SEQ ID NO:141)의 실시간 운동학적 분석. 스트렙타비딘-코팅된 Octet ® 바이오센서는 바이오틴화된 GFP (0.75 ㎍/mL)를 포획하는데 사용하였고 몇몇 농도 (60 - 2.22 nM 범위)의 NbGFP207 (A), MbNb207 cHopQ (B) 및 MbNb207 cYgjkE2 (C)와 연관시켰다. 측정된 반응 (검은색선)은 단상성 1:1 결합 모델 (붉은색선)에 적합화시켰다. 어세이는 10 mM Tris-HCl, 140 mM NaCl, pH 7.3, 0.05% Tween20 및 1 mg/mL BSA에서 실시하였다. (D) 계산된 운동학적 값은 n = 3회의 독립 실험으로부터의 평균의 평균 표준 오차 (s.e.m)로서 표시된다.
도 25. [LeFranc (2014)]로부터 개조된 바와 같은, IMGT에 따른 면역글로불린 가변 도메인 구조 및 토폴로지
(A) IMGT 스트랜드 및 루프 한계의 3D 구조 리본 도면 (LFranc et al., 2003). (B) 수소 결합을 갖는 2개 층 상의 IMGT 콜리어 드 페를레 (Collier de Perles). 2개 층 상의 IMGT 콜리어 드 페를레는 최선두에, GFCC'C" 스트랜드 (IG의 계면 VH/VL에 위치된 시트를 형성), 및 뒷쪽에 ABED 스트랜드를 보여준다. 수소 결합을 갖는 IMGT 콜리어 드 페를레 (선 중에서 녹색선, 여기서는 오직 GFCC0C00 시트만을 도시)는 실험 3D 구조 데이터로부터, IMGT/3Dstructure-DB에 통합된 IMGT/Collier-de-Perles 도구를 통해 생성된다 (Kaas et al., 2004; Ehrenmann et al., 2010, Ehrenmann and LeFranc, 2011).
도 26. 다른 항원-결합 키메라 단백질에 결합하여 확장된 항원-결합 키메라 단백질의 개략도.
(A) MbNb60 c7HopQmut2 (SEQ ID NO:134) 또는 MbNb60 c7HopQmut3 (SEQ ID NO:134)은 다른 MbNb207 cHopQ (SEQ ID NO:20)에 결합하여 확장되어 116 kDa의 확장된 항원-결합 키메라 단백질을 생성한다. (B) MbNb60 cYgjK(SEQ ID NO:135)는 MbNb207 cHopQ (SEQ ID NO:20)에 결합 및 확장되어, 168 kDa 분자량의 확장된 항원-결합 키메라 단백질을 생성시킨다.
도 27. Mb Nb207 cHopQ 와 복합체의 Nb60의 결정 구조는 Mb Nb207 cHopQ 의 cHopQ에 함유된 스캐폴드 단백질 상의 Nb60의 에피토프를 밝혀준다.
도 28. 통합된 화학 링커 유닛을 사용해 스캐포로드 단백질에 연결된 항원-결합 도메인을 갖는, 항원-결합 키메라 단백질의 개략도.
도 29. Octet 상에서 분석된 Mb Nb207 cHopQ 와 폴리바디라고 하는 항원-결합 키메라 단백질의 상호작용의 운동학적 특징규명 .
생물층 간섭계에 의한 HopQ-특이적 나노바디 Nb60 (SEQ ID NO:132), HopQ-특이적 MbNb60 cHopQmut2 (SEQ ID NO:133), HopQ-특이적 MbNb60 cHopQmut3 (SEQ ID NO:134) 및 HopQ-특이적 MbNb60 cYgjkE2 (SEQ ID NO:135)와 MbNb207 cHopQ (SEQ ID NO:20)의 결합에 대한 실시간 운동적학 분석. 스트렙타비딘-코팅된 Octet ® 바이오센서가 바이오틴화된 MbNb207 cHopQ (0.25 ㎍/mL)를 포획하는데 사용되었다. 몇몇 농도 (1.67 내지 500 nM 범위)에서 결합 및 해리 등온선을 Nb60 (A), MbNb60 cHopQmut2 (B), MbNb60 cHopQmut3 (C) and MbNb60 cYgjkE2 (D)에 대해 모니터링하였다. 모든 어세이는 10 mM Tris-HCl, 140 mM NaCl, pH 7.3, 0.05% Tween20 및 1 mg/mL BSA에서 실시하였다.
도 30. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 cHopQ 변이체의 기능성의 유세포측정 분석.
MbNb207 cHopQ (SEQ ID NO:22) 및 대표적인 효모-디스플레이 선택된 MbNb207 cHopQ 변이체 (표 2)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이하였다. 개별 효모 클론을 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 CoA-647 (2 μM)로 직교적으로 염색시키고 100 nM GFP와 인큐베이션시켰다. MP1331_A9 메가 바디 변이체 (A) 및 MbNb207 cHopQ (B)를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 광도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용하여 각각의 개별 효모 클론에 대해 계산하였다. (C) MbNb207 cHopQ (SEQ ID NO:22) 및 각각의 개별 MbNb207 cHopQ 변이체에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프 (표 2).
도 31. 이. 콜라이 발현 및 니켈 친화성 크로마토그래피 정제 이후 Mb Nb207 c7HopQ 및 4종의 효모-디스플레이 선택된 Mb Nb207 c7HopQ 변이체의 크기 배제 크로마토그래피 특징규명.
효모 디스플레이에 의해 선택된 1-1 아미노산 펩티드 링커를 갖는 이. 콜라이 발현된 MbNb207 c7HopQ 변이체의 Superdex 200 PG 컬럼 (10/300, GE Healthcare) 상에서의 분취형 겔 여과 실험. MbNb207 c7HopQ (SEQ ID NO: 136) 클론은 야생형 연결 변이체를 나타내고 MbNb207 c7HopQ A5 (SEQ ID NO: 137), MbNb207 c7HopQ A12 (SEQ ID NO: 138), MbNb207 c7HopQ B7 (SEQ ID NO: 139), MbNb207 c7HopQ G10 (SEQ ID NO: 140)은 각각 표 2의 MP1331_A5, MP1331_A12, MP1331_B7, MP1331_G10 클론을 나타낸다.
도 32. ELISA에 의한 Mb Nb207 c7HopQ 및 4종의 효모-디스플레이 선택된 변이체의 GFP 결합 분석.
크기 배제 정제된 MbNb207 c7HopQ (SEQ ID NO: 136), 4종의 효모-디스플레이 선택된 MbNb207 c7HopQ A5, MbNb207 c7HopQ A12, MbNb207 c7HopQ B7, MbNb207 c7HopQ G10 변이체 (SEQ ID NO: 137-140) 및 MbNb38 cHopQ (SEQ ID NO: 131)는 고정된 GFP를 함유하는 웰 또는 비코팅된 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-태그) 항체를 사용해 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)와 인큐베이션 후에 측정하였다. 데이타는 삼중 (n = 3)으로 수행된 실험으로부터의 평균의 평균 표준 오차 (s.e.m)로서 표시된다.
도 33. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 cYgjk 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNb207 cYgjk 변이체 (표 3)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색하였고 100 nM GFP와 인큐베이션하였다. (A) MP1333_A2 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용해 각각의 개별 효모 클론에 대해 계산하였다. (B) 각각의 개별 MbNb207 cYgjk 변이체에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프 (표 3).
도 34. ELISA로 분석된, 4종의 효모-디스플레이 선택된 Mb Nb207 cYgjk 변이체의 GFP 결합.
상이한 Mb Nb207 cYgjk 변이체 (SEQ ID NO:141-144)를 함유하는 주변세포질 추출물: MbNb207 cYgjkE2, MbNb207 cYgjkA2, MbNb207 cYgjkC4, MbNb207 cYgjkF5 변이체를 MbNb38 cHopQ (SEQ ID NO: 131)와 비교하였다. 모든 샘플은 고정된 GFP를 함유하는 웰 또는 비코팅된 웰에서 인큐베이션하였다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-tag) 항체를 사용하여 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션한 후에 측정하였다.
도 35. 크기 배제 크로마토그래피에 의한 이. 콜라이에서 발현되고 니켈 친화성 크로마토그래피로 정제된 Mb Nb207 cYgjk E2 변이체의 특징규명.
(A) 이. 콜라이의 주변세포질에서 발현시키고 분취형 Superdex 200 PG 겔 여과 컬럼 (16/26, GE Healthcare) 상에서 니켈 친화성 크로마토그래피로 정제된 MbNb207 cYgjkE2 (SEQ ID NO:141)의 분석. (B) (A)에 기술된 크기 배제 실험으로부터의 '피크 1' 분획 중 MbNb207 cYgjkE2 메가바디 순도의 SDS-PAGE 분석. 정제된 MbNb207 cYgjkE2의 샘플 (좌측 라인: '피크 1)을 8% SDS-PAGE 겔에 적용하였고 약 100 kDa의 분자 질량을 분자 질량 마커 (우측 라인: M)와 비교하여 확인하였다.
도 36. 나노바디를 스캐폴드에 연결하는 조작된 디술피드 결합에 의해 더욱 강성화된 Mb Nb207 cHopQ 변이체의 기능성 및 생물리적 특징규명.
10종 MbNb207 cHopQ 변이체의 GfP 결합 분석은 ELISA를 통해 분석하였다. (A) 크기-배제 정제된 MbNb207 cHopQ (SEQ ID NO:20) 및 4종 MbNb207 cHopQ Cys1-4 변이체 (SEQ ID NO:48-51, 도 10 참조)는 고정된 GFP 함유 웰 또는 비코팅된 웰에서 인큐베이션시켰다. (B) 크기-배제 정제된 MbNb207 c7HopQ (SEQ ID NO:136) 및 4종의 MbNb207 c7HopQ Cys5-10 변이체 (SEQ ID NO:145-150)는 고정된 GFP 함유 웰 또는 비코팅된 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (CaptureSelect C-tag) 항체를 사용하여 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터의 평균의 평균 표준 오차 (s.e.m.)로서 표시된다. (C) MbNb207 cHopQ 변이체의 열안정성 분석은 열 이동 어세이 (TSA)를 통해 수행하였다. MbNb207 c7HopQ (SEQ ID NO: 136), MbNb207 cHopQ Cys4 (SEQ ID NO: 51), MbNb207 c7HopQCys5 (SEQ ID NO:145), MbNb207 c7HopQ Cys6 (SEQ ID NO:146) 및 MbNb207 c7HopQ Cys10 (SEQ ID NO:150) 변이체에 대한 정규화된 용융 프로파일 그래프. 계산된 용융 온도 (Tm) 값은 표 4에 열거되어 있다.
도 37. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 아주린 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNb207 아주린 변이체 (표 5)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색하였고 100 nM GFP와 인큐베이션시켰다. (A) MP1304_B2 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도는 Prism 7 소프트웨어 (GraphPad)를 가용해 각 개별 효모 클론에 대해 계산되었다. (B) 각각의 개별 MbNb207 아주린 변이체에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프 (표 5).
도 38. ELISA에 의한 8종 효모-디스플레이 선택된 Mb Nb207 아주린 변이체의 GFP 결합 분석.
상이한 MbNb207 아주린 변이체 (SEQ ID NO:151-158)를 함유하는 8종의 주변세포질 추출물 및 MbNb38 cHopQ (SEQ ID NO: 131)를 함유하는 하나의 추출물을 고정된 GFP를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 항-EPEA (CaptureSelect C-tag) 항체를 사용해 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터의 평균의 평균 표준 오차 (s.e.m.)로서 표시된다.
도 39. ELISA에 의한 GFP 결합 분석
상이한 MbNb207 cPP7x2L 키메라 단백질 (SEQ ID NO: NO:3-6)을 함유하는 주변세포질 추출물은 고정된 GFP (0,1 ㎍/웰)를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 키메라 cPP7 이량체의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (CaptureSelect C-tag) 항체를 사용해 수행하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후 측정하였다.
도 40: 박테리오파지 AP205로부터 유래된 20면체 VLP상에서 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 90 카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 20면체 VLP (내부 분자)의 개략도. (B) 아시네토박터 박테리아의 20면체 RNA 박테리오파지, AP205의 공유 외피 단백질 이량체 (아래, PDB 5FS4)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)를 포함하는 항원-결합 키메라 단백질의 모델. (C) AP205의 외피 단백질에 나노바디를 연결하는 개략도. (D) 항원-결합 키메라 외피 단백질의 아미노산 서열 (SEQ ID NO: 167). 나노바디로부터 기원된 잔기는 굵은체로 표시된다. X는 1개 아미노산의 짧은 무작위 펩티드 링커이다. AP205 외피 단백질에 상응하는 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 41. ELISA에 의한 372 클론의 GFP 결합 분석
MbNb207 AP205x2XX 이량체 (SEQ ID NO: 167)를 함유하는 주변세포질 추출물 (MP 번호로서 표시)은 고정된 GFP (0,1 ㎍/웰) 또는 비코팅 웰에서 인큐베이션시켰다. 키메라 AP205 이량체의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (CaptureSelect C-tag) 항체를 사용해 수행하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후에 측정하였다.
도 42: 이량체 항원-결합 키메라 단백질 상에서 나노바디의 강성 디스플레이.
(A) β-스트랜드 A 교환이 존재하는 이량체 항원 결합 키메라 단백질의 모델. AP205 단량체는 이량체로 조립된다. 기능성 항원 결합 키메라를 수득하기 위해서, 이량체 항원-결합 키메라 단백질로 조립되도록 제1 단량체의 GFP-결합 나노바디의 β-스트랜드 A는 제2 단량체의 GFP-결합 나노바디의 β-스트랜드 B 내지 G와 조합될 필요가 있고, 제2 단량체의 GFP-결합 나노바디의 β-스트랜드 B 내지 G는 제1 단량체의 GFP-결합 나노바디의 β-스트랜드 A와 조합될 필요가 있다. (B) 그들 각각이 AP205의 외피 단백질 단량체에 연결된 2종의 GFP-특이적 나노바디 (위, SEQ ID NO:1)를 포함하는 동일한 이량체 항원-결합 키메라 단백질 (90°회전)의 모델. (C) AP205의 외피 단백질에 나노바디를 연결하는 개략도. (D) 항원-결합 키메라 외피 단백질의 아미노산 서열 (SEQ ID NO: 173). 나노바디로부터 기원된 잔기는 굵은체로 표시된다. X는 1개 아미노산의 짧은 무작위 펩티드 링커이다. AP205 외피 단백질에 상응하는 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 43. ELISA에 의한 372 클론의 GFP 결합 분석
MbNb207 AP205XX (SEQ ID NO: 173)의 이량체를 함유하는 주변세포질 추출물 (MP 번호로서 표시)은 고정된 GFP (0,1 ㎍/웰) 또는 비코팅 웰에서 인큐베이션시켰다. AP205 이량체의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA 항체 (Capture select C-tag)를 사용해 수행되었다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후 측정되었다.
도 44. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 ACP 나노툴 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNb207 ACP 나노툴 (NanoTool) 변이체 (표 9)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도되었고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색되었고 100 nM GFP와 인큐베이션되었다. (A) MP1302_D10 나노툴 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (나노툴 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용해 각 개별 효모에 대해 계산되었다. (B) 각각의 개별 MbNb207 ACP 나노툴 변이체 (표 9)에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프.
도 45. ELISA에 의한 6종의 효모-디스플레이 선택된 Mb Nb207 ACP 나노툴 변이체의 GFP 결합 분석.
6종 MbNb207 ACP (SEQ ID NO:178-183) 변이체 및 MbNb38 cHopQ (SEQ ID NO: 131)를 함유하는 주변세포질 추출물을 고정된 GFP를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-tag) 항체를 사용해 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터 평균의 평균 표준 오차 (s.e.m.)로서 표시된다.
도 46. 나노2바디 항원-결합 키메라 단백질의 모델.
(A) 도 17에 다른 3개 펩티드 링커를 통해서, FedF-결합 나노바디 (나노바디 A, SEQ ID NO:17)에 연결된 GFP-특이적 나노바디 (나노바디 B, SEQ ID NO:1)의 융합을 통해 만들어진 에너지적으로 더 양호한 항원-결합 키메라 단백질의 3D 모델. (B) 나노바디 A를 나노바디 B에 연결하는 개략도. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:184-185).
, Nb GFP 207 서열은 굵은체이고, FedF-결합 나노바디 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 47. ELISA에 의한 대표적 클론의 GFP 및 FedF 결합 분석
반정제된 N2body 샘플 (SEQ ID NO: 186-191)은 고정된 GFP (0,5 ㎍/웰), 고정된 FedF (0,5 ㎍/웰) 또는 비코팅 웰에서 인큐베이션시켰다. 나노2바디의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA 항체 (Capture select C-tag)를 사용해 수행하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후에 측정하였다.
도 48. EBY100 효모 세포 표면 상에 디스플레이된 cHopQNb GFP 207 CC' 메가바디 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 cHopQNbGFP207X CC' 메가바디 변이체 (표 11)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색하였고 100 nM GFP와 인큐베이션시켰다. (A) MP1327_D5 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용해 각각의 개별 효모에 대해 계산하였다. (B) 각각의 개별cHopQNbGFP207CC' 메가바디 변이체 (표 11)에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프.
도 49. EBY100 효모 세포 표면 상에 디스플레이된 Mb NS1 cHopQ 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNS1 cHopQ 변이체 (표 12)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-488 (2 μM)로 염색하였고 100 nM의 Dylight-647-표지된 K-RAS와 인큐베이션시켰다. (A) MP1326_A11 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-488 형광도 (메가바디 디스플레이 수준) 및 상대적 Dylight-647 형광도 (K-Ras 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)을 사용하여 각 개별 효모 클론에 대해 계산하였다. (B) 각각의 개별 MbNS1 cHopQ 변이체 (표 12)에 대한 상대적 CoA-488 및 Dylight-647 형광도의 계산된 형광 강도 (MFI)의 그래프.
도 50. 엠. 튜버큘로시스 ( M. tuberculosis ) 유래 도데신 Rv1498A 상에서 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 12 카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 도데신 Rv1498A (내부 분자)의 개략도. (B) 2개 펩티드 링커를 통해서 Rv1498A 단량체 (아래, SEQ ID NO:192)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 융합에 의해 만들어진 항원-결합 키메라 단백질의 3D 모델. 이러한 특정 항원-결합 키메라 단백질에서, 야생형 Rv1498A의 N-말단 및 C-말단이 서로 가깝게 있고 나노바디를 Rv1498A에 연결시키는 2개의 짧은 폴리펩티드 연결을 조작하기 위해 잘 위치되어 있기 때문에 스캐폴드 단백질의 원형 배열을 필요로 하지 않는다. (C) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 Rv1498A가 후속되고, 그 다음으로 나노바디의 C-말단부가 후속된다. (D) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1 은 1개 아미노산 길이 및 혼합 조성물의 짧은 펩티드 링커이고, Rv1498A 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 51. ELISA를 통한 6종의 선택된 Mb Nb207 도데신 변이체의 GFP 결합 분석.
6종의 MbNb207 도데신 변이체 (표 13) 및 NbGFP207 나노바디 (SEQ ID NO:1)를 함유하는 주변세포질 추출물은 고정된 GFP를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-tag) 항체를 사용하여 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후에 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터 평균의 평균 표준 편차 (s.e.m.)로서 표시된다.
도 52. 비. 세노세파시아 ( B. cenocepacia ) 유래 디술피드-브릿지된 동종이량체 상에서 나노바디의 강성 디스플레이 .
(A) 2개 펩티드 링커를 통해서 GFP-특이적 나노바디 (외부 분자, SEQ ID NO:1)에 강성으로 융합된 4QYB의 동종이량체 (내부 분자, SEQ ID NO:200)의 개략도. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 4QYB가 후속되고, 그 다음으로 나노바디의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이고, 4QYB 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 53. Mb Nb80 cHopQ 존재 또는 부재 하에서 β2AR-wt의 리간드 결합 성질
Nb80 (검은색 사각형)의 존재 하에서, β2AR-wt 단독 (회색 원형)에서 또는 미관련 MbNb207 cHopQ (회색 삼각형)의 존재 하에서, β2AR-wt과 비교된 MbNb80 cHopQ (검은색 상향 삼각형)의 존재 하에서 β2AR-wt과의 결합에 대해 [3H]-디히드로알프레놀롤 ([3H]-DHA)과 경쟁하는 상이한 리간드의 방사리간드 치환 어세이. 경쟁 어세이는 각각 경쟁 리간드로서 천연 효현제 에피네프린 (A) 및 효현제 (-)-이소프로테레놀 (B)을 사용하여 β2AR-wt 수용체에 대해 수행하였다. 그래프는 Graphpad Prism의 표준 설정을 사용하여 경쟁적 결합에 대한 모델에 대해 비선형 회귀를 통해 적합화시켰다.
도 1. 강성 항원-결합 키메라 단백질과 비교한 가요성 융합 단백질
(A) 오직 하나의 직접 융합 또는 링커를 사용하는 스캐폴드 단백질 및 항원-결합 도메인의 N-말단 또는 C-말단에서의 가요성 융합체 또는 링커. (B) 항원-결합 도메인이 적어도 2개의 직접 융합 또는 항원-결합 도메인을 스캐폴드에 연결시키는 링커를 통해서 스캐폴드 단백질과 융합된 것인, 항원-결합 도메인 및 스캐폴드 단백질의 강성 융합체.
도 2. 나노바디의 β-스트랜드 A 및 B를 연결시키는 제1 β-턴에 삽입된 스캐폴드 단백질의 원형 배열 변이체로부터 구축된 항원-결합 키메라 단백질의 조작 원리.
이러한 계획은 나노바디 (Nb)가 항원-결합 도메인을 스캐폴드에 연결시키는 2개의 짧은 링커 또는 2개의 펩티드 결합을 통해 거대한 스캐폴드 단백질 상에 그라프트될 수 있는 방법을 도시한다. 가위표는 나노바디 및 스캐폴드에서 어떠한 노출 턴이 절단되어야 하는가를 표시한다. 파선은 스캐폴드 및 Nb의 나머지 부분이 항원-결합 키메라 단백질을 구축하기 위해서 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 어떻게 쇄상화되어야 하는가를 표시한다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT (도 25, [Lefranc, 2014]으로부터 개조)에 따라 정의된다.
도 3. GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결시키는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 모델
(A) 스캐폴드에 나노바디를 연결시키는 2개의 펩티드 결합 또는 링커를 통해서 에이치. 피로리 (H. pylori) (아래)의 HopQ의 어드헤신 도메인의 원형 배열 변이체 및 GFP-특이적 나노바디 (위)의 융합을 통해 만들어진 항원-결합 키메라 단백질의 모델. (B) 헬리코박터 피로리 (Helicobacter pylori) 균주 G27의 1형 HopQ의 어드헤신 도메인을 코딩하는 원형 배열 유전자 (아래, PDB 5LP2, SEQ ID NO:19, cHOPQ)는 β-스트랜드 A를 β-스트랜드 B에 연결시키는 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 제1 β-턴 (β-턴 AB)에 삽입되었다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (MbNb207 cHopQ, SEQ ID NO:20). 나노바디로부터 기원된 서열은 굵게 도시된다. HopQ로부터 기원된 서열은 밑줄표시되어 있다. 원형 배열체를 만들기 위해 HopQ의 N-말단 및 C-말단을 연결시키는 펩티드는 이탤릭체로 도시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 4. EBY100 효모 세포 표면 상의 항원-결합 키메라 단백질 Mb Nb207 cHopQ 디스플레이의 유세포측정 분석
단일 매개변수 히스토그램은 비형질전환된 EBY100 효모 세포 (아래)와 비교한 Aga2p 및 ACP (SEQ ID NO:22)에 융합된 항원-결합 키메라 단백질 MbNb207 cHopQ 를 코딩하는 pCTCON2 유도체로 형질전환된 EBY100 효모 세포 (위)의 상대적 형광 강도를 도시한다. 형질전환 및 비형질전환 효모 세포는 SFP 신타제 (1 μM)를 사용하여 CoA-647 (2 μM)로 직교적으로 염색되었다.
도 5. EBY100 효모 세포 표면 상에 디스플레이된 항원-결합 키메라 단백질 Mb Nb207 cHopQ 의 기능성의 유세포측정 분석
비형질전환된 EBY100 효모 세포 (아래)와 비교하여 Aga2p 및 ACP에 융합된 MbNb207 cHopQ 를 코딩하는 pCTCON2 유도체 (SEQ ID NO:22)로 형질전환된 개별 EBY100 효모 세포 (위)의 상대적 형광 강도를 나타내는 점 그래프. 형질전환 및 비형질전환 효모 세포는 SFP 신타제 (1 μM)를 사용하여 CoA-647 (2 μM)로 직교적으로 염색되었고 100 nM GFP와 인큐베이션되었다.
도 6. 크기 배제 크로마토그래피 및 SDS-PAGE에 의한 항원-결합 키메라 단백질 Mb Nb207 cHopQ 및 GFP 간 복합체의 형성의 분석 분석
MbNb207 cHopQ (SEQ ID NO:20) 및 녹색 형광 단백질 (GFP) 간 안정한 복합체의 형성을 확인하기 위한 Superdex 75 PG 컬럼 (16/90, GE Healthcare) 상에서의 분석적 겔 여과 실험 (Scholz et al., 2000). (A) SEC에 의한 복합체 형성의 분석. 회색선: UV 280 nm 흡광도를 통해 측정된 GFP를 단독으로 함유하는 샘플의 겔 여과 패턴. 검은색 파선: UV 280 nm 흡광도를 통해 측정된 1:4 몰비율로 MbNb207 cHopQ 및 GFP를 함유하는 샘플의 겔 여과 패턴. 검은색선: UV 488 nm 흡광도로 측정된 1:4 비율로 MbNb207 cHopQ 및 GFP를 함유하는 샘플의 겔 여과 패턴. (B) SDS-PAGE를 통한 항원-결합 키메라 단백질 MbNb207 cHopQ 및 GFP 간 안정한 복합체 형성의 확인. 1:4 몰비율로 MbNb207 cHopQ 및 GFP를 함유하는 샘플을 Superdex 75 PG 컬럼에 도포하였고 상대적 분획을 SDS-PAGE를 통해 분석하였다.
도 7. GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 X-선 결정 구조.
(A) 비대칭 유닛으로 10 GFP-결합 키메라 단백질의 정렬 (만화 도면). 비대칭 유닛으로 10개 분자를 갖는 공간군 P1에서 결정화된 58 kD 항원-결합 키메라 단백질 MbNb207 cHopQ (SEQ ID NO:20). 스캐폴드로서 사용된 HopQ (PDB 5LP2)의 어드헤신 도메인은 붉은색으로 도시되고, GFP-특이적 Nb는 녹색으로 도시된다. (B) 나노바디를 스캐폴드에 연결시키는 펩티드 (분자 A)는 1.0σ에서 등고선이 그려진 2Fo-Fc 전자 밀도 지도에서 분명하게 정의된다. (C) 비대칭 유닛으로 함유된 모든 항원-결합 키메라 단백질 MbNb207 cHopQ 의 구조적 정렬. 비대칭 유닛의 상이한 분자 간 RMSD는 0.3 내지 2.7Å 범위이다.
도 8. 스캐폴드 단백질 HopQ를 나노바디에 연결하는 링커 펩티드의 조성 및 길이의 최적화를 위한 효모 디스플레이 벡터
(A) 디스플레이 벡터의 개략도. LS: 효모에서 세포외 분비를 유도하는 효모 α-인자의 조작된 분비 신호, appS4 (Rakestraw et al. 2009). N: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), : 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), Aga2: Aga1p 단백질에 대한 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티닌 단백질 Aga2p의 Aga2p 부착 서브유닛 (Chao et al., 2006), ACP: 그 발현 수준을 모니터링하기 위해 디스플레이된 항원-결합 키메라 단백질의 직교적 표지화를 위한 아실 캐리어 단백질 (Johnsson et al., 2005). (B) 디스플레이된 항원-결합 키메라 단백질의 서열 다양성 (SEQ ID NO:34-37): 보통체의 AppS4 리더 서열, 굵은체로 표시된 무작위 링커를 갖는 메가바디 cHopQNb GFP 207, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 이탤릭체의 가요성 (GGGS) n 폴리펩티드 링커, 밑줄표시된 Aga2p 단백질 서열, , cMyc 태그. (C) 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커를 도입시키기 위해 2종의 전방향 (SEQ ID NO:126, SEQ ID NO:127) 및 2종의 역방향 PCR 프라이머 (SEQ ID NO:128, SEQ ID NO:129)의 등몰량 혼합물을 사용하여, 총 184.000 AA-서열 변이체를 코딩하는, 항원-결합 키메라 단백질 서열의 4개 풀을 생성시켰다 (각각 라이브러리의 25%를 나타냄).
도 9. 시험관내 선택을 통한 GFP-특이적 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 YgjK의 원형 배열 변이체로부터 구축된 100 kDa 항원-결합 키메라 단백질의 모델.
(A) GFP-특이적 나노바디 (위) 및 에스케리치아 콜라이 (Escherichia coli) K12 YgjK (아래)의 융합으로 만들어진 항원-결합 키메라 단백질의 모델. (B) 에스케리치아 콜라이 K12 YgjK를 코딩하는 원형 배열 유전자 (PDB 3W7S, SEQ ID NO:38)는 YgjK 단백질이 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커를 사용하여 β-스트랜드 A를 β-스트랜드 B에 연결하는 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 제1 β-턴 (β-턴 AB)에 삽입되어 융합되었다. (C) 100 kDa 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:39-42). 굵은체는 Nb GFP 207 서열, 이탤릭체는 원형 배열 링커, 밑줄표시된 Ygjk 서열, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. C-말단 태그는 6xhis 및 EPEA를 포함한다.
도 10. 스캐폴드에 나노바디를 연결하는 조작된 디술피드 결합에 의해 더욱 강성화된, GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD 항원-결합 키메라 단백질.
β-스트랜드 A를 β-스트랜드 B에 연결하는 GFP-특이적 나노바디 (SEQ ID NO:1)의 제1 β-턴 (AB β-턴)에 삽입된 헬리코박터 피로리 균주 G27 (아래, PDB 5LP2, SEQ ID NO:19)의 1형 HopQ의 어드헤신 도메인으로부터 구축된 항원-결합 키메라 단백질의 강성을 더욱 증가시키기 위해서, 나노바디를 스캐폴드에 연결시키는 추가 디술피드 결합을 조작하기 위해 부위-지정 돌연변이유발법을 사용하였다. (A) C357 및 C425 사이에 조작된 디술피드 브릿지를 함유하는 항원-결합 키메라 단백질 MbNb207 cHopQ 의 돌연변이체의 모델 (SEQ ID NO:48). (B) C358 및 C488 사이에 조작된 디술피드 브릿지를 함유하는 MbNb207 cHopQ의 돌연변이체의 모델 (SEQ ID NO:49). (C) C359 및 C490 사이에 조작된 디술피드 브릿지를 함유하는 MbNb207 cHopQ 의 돌연변이체의 모델 (SEQ ID NO:50). (D) C15 및 C534 사이에 조작된 디술피드 브릿지를 함유하는 MbNb207 cHopQ 의 돌연변이체의 모델 (SEQ ID NO:51).
도 11. 면역글로불린을 스캐폴드에 연결시키는 3개 펩티드 결합 또는 짧은 링커를 통한 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 스캐폴드 단백질로부터 구축된 항원-결합 키메라 단백질의 조작 원리
항원-결합 도메인은 3개의 직접 융합 또는 링커를 통해 만들어진 3개 융합을 통해서, 노출 영역 또는 β-턴 내 하나 이상의 접근가능한 부위, 및/또는 단백질 말단의 접근가능한 부위에서 스캐폴드 단백질에 융합될 수 있다. 이러한 계획에서, 3개 펩티드 결합 또는 짧은 링커를 통해서 스캐폴드에 Ig 도메인을 연결시키기 위해 나노바디의 C-말단부 및 β-턴 AB를 사용하였다. 가위표는 나노바디 및 스캐폴드에서 어떠한 노출된 턴을 절단시켜야 하는가를 의미한다. 파선은 이러한 항원-결합 키메라 단백질을 구축하기 위해 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 스캐폴드 및 Nb의 나머지 부분이 어떻게 쇄상화되어야 하는가를 보여준다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT에 따라 정의된다 (도 25, [Lefranc, 2014]로부터 개조).
도 12. 면역글로불린을 스캐폴드에 연결시키는 3개의 펩티드 결합 또는 짧은 링커를 통해서 GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 Cu ++ -결합 단백질 아주린으로부터 구축된 항원-결합 키메라 단백질의 모델.
(A) 3개 펩티드 링커를 통해서 슈도모나스 애루지노사 (Pseudomonas aeruginosa)의 아주린 (아래, PDB 2TSA, SEQ ID NO:52)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 융합을 통해 만들어진 항원-결합 키메라 단백질의 모델. 구리 이온은 파란색으로 도시된다. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 스캐폴드 단백질 (아주린)의 N-말단부가 후속되고, 그 다음으로 면역글로불린의 C-말단부가 후속되고, 이후에 스캐폴드 (아주린)의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:53-60): 굵은체는 Nb GFP 207 서열, 밑줄표시된 아주린 서열, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 13. 면역글로불린을 스캐폴드에 연결하는 3개 펩티드 결합 또는 링커를 통해서 GFP-특이적 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 전화성 글리코시드 히드롤라제 스캐폴드 단백질 SusB로부터 구축된 이중 대칭성의 이량체 항원-결합 키메라 단백질의 모델.
(A) 3개 펩티드 링커를 통해서 박테로이데스 테타이오타오미크론 (Bacteroides thetaiotaomicron) SusB의 전화성 글리코시드 히드롤라제 (아래, PDB 3WFA, SEQ ID NO:69)에 연결되는 GFP-특이적 나노바디 (위 좌측 및 우측, SEQ ID NO:1)의 융합으로 만들어진 항원-결합 키메라 단백질의 모델. SusB는 이중 대칭성을 갖는 절대 이량체이다. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 스캐폴드 단백질 (SusB)의 N-말단부가 후속되고, 그 다음으로 면역글로불린의 C-말단부가 후속된 다음에, 스캐폴드의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열. 굵은체는 Nb GFP 207 서열, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 밑줄표시된 susB 서열. C-말단 태그는 6xhis 및 EPEA를 포함한다.
도 14. 박테리오파지 PP7로부터 유래된 20면체 VLP 상에서 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 90카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 20면체 (VLP) (내부 분자)의 개략도. 야생형 20면체 PP7 바이러스는 180개의 동일한 카피의 PP7 외피 단백질로 구성된 T=3 쉘을 갖지만, 2개 외피 단백질은 N을 C에 융합시킬 수 있어서 90개의 공유 외피 단백질 이량체로 구성된 VLP를 생성시킬 수 있다 (O'Rourke et al., 2015). (B) 슈도모나스 애루지노사 (아래, PDB 1DWN)의 박테리오파지 PP7의 공유 외피 단백질 이량체의 원형 배열 변이체에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)를 포함하는 항원-결합 키메라 단백질의 모델. (C) PP7의 배열된 외피 단백질 이량체와 나노바디의 연결 개략도. PP7의 이러한 공유 외피 단백질 이량체를 코딩하는 원형 배열 유전자는 β-스트랜드 A를 β-스트랜드 B에 연결하는 나노바디의 제1 β-턴에 삽입되었다 (SEQ ID NO:3-6). (D) 항원-결합 키메라 외피 단백질의 아미노산 서열. 나노바디로부터 기원된 잔기는 굵은체로 도시된다. (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. PP7 외피 단백질에 상응하는 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 15. 박테리오파지 MS2로부터 유래된 20면체 VLP 상의 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 90카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 20면체 VLP (내부 분자)의 개략도. 야생형 MS2 바이러스는 180개의 동일한 카피의 MS2 외피 단백질로 구성된 20면체 쉘을 형성하지만, 2개 외피 단백질은 N을 C에 융합시킬 수 있어서 90개 공유 외피 단백질 이량체로 구성된 VLP를 생성시킬 수 있다 (O'Rourke et al., 2015). (B) 에스케리치아 콜라이의 박테리오파지 MS2의 공유 외피 단백질 이량체의 원형 배열 변이체 (아래, PDB 2MS2)에 연결된 리소자임-특이적 나노바디 (위, SEQ ID NO:7)를 포함하는 항원-결합 키메라 단백질의 모델. (C) MS2의 배열된 외피 단백질 이량체와 나노바디의 연결 개략도. MS2의 이러한 공유 외피 단백질 이량체를 코딩하는 원형 배열 유전자는 β-스트랜드 A를 β-스트랜드 B에 연결하는 나노바디의 제1 β-턴에 삽입되었다 (SEQ ID NO:9). (D) 항원-결합 키메라 외피 단백질의 아미노산 서열. 나노바디로부터 기원된 잔기는 굵은체로 도시된다. (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이다. MS2 외피 단백질에 상응하는 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 16. 항원-결합 도메인을 ACP에 연결하는 2개 펩티드 결합 또는 짧은 링커를 통해서 GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입되는 아실 캐리어 단백질로부터 구축된 항원-결합 키메라 단백질의 모델
(A) 2개 펩티드 링커를 통해서 이. 콜라이 유래 아실 캐리어 단백질 (아래, PDB 1T8K, SEQ ID NO:86)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 융합에 의해 만들어진 항원-결합 키메라 단백질의 3D 모델. 이러한 특정한 항원-결합 키메라 단백질에서, 야생형 ACP의 N-말단 및 C-말단이 서로 가깝게 있고 나노바디를 ACP에 연결하는 2개의 짧은 폴리펩티드 연결을 조작하기 위해 잘 위치되어 있기 때문에 스캐폴드 단백질의 원형 배열을 필요로 하지 않았다. 반응성 세린은 좌측 아래에 표시되어 있다. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 ACP가 후속되고, 그 다음으로 나노바디의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이고, ACP 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 17. 양쪽 면역글로불린 도메인을 연결하는 3개 펩티드 결합 또는 짧은 링커를 통해 다른 나노바디에 삽입되는 나노바디로부터 구축된 항원-결합 키메라 단백질의 조작 원리.
이러한 개략도는 나노바디 (Nb)가 하나의 항원-결합 도메인을 다른 것에 연결시키는 3개 펩티드 결합 또는 3개 짧은 링커를 통해서 다른 나노바디와 어떻게 융합될 수 있는가를 도시한다. 가위표는 어떠한 노출 턴이 연결하려는 나노바디에서 절단되어야 하는가를 표시한다. 파선은 이들 항원-결합 키메라 단백질을 구축하기 위해 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 양쪽 나노바디의 나머지 부분이 어떻게 쇄상화되어야 하는가를 표시한다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT에 따라 정의된다 (도 25, [Lefranc, 2014]로부터 개조).
도 18:나노2바디 항원-결합 키메라 단백질의 모델
(A) 도 17에 따른 3개 펩티드 링커를 통해서, 리소자임-결합 나노바디 (나노바디 A, SEQ ID NO:7)에 연결시킨 GFP-특이적 나노바디 (나노바디 B, SEQ ID NO:1)의 융합에 의해 만들어진 항원-결합 키메라 단백질의 3D 모델. (B) 나노바디 A와 나노바디 B의 연결 개략도. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:14).
, Nb GFP 207 서열은 굵은체이고, 리소자임-결합 나노바디 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 19: 나노2바디 항원-결합 키메라 단백질의 모델
(A) 도 17에 따른 3개 펩티드 링커를 통해서, FedF-결합 나노바디 (나노바디 A, SEQ ID NO:17)에 연결된 GFP-특이적 나노바디 (나노바디 B, SEQ ID NO:1)의 융합을 통해 만들어진 항원-결합 키메라 단백질의 3D 모델. (B) 나노바디 A와 나노바디 B의 연결 개략도. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:18).
, Nb GFP 207 서열은 굵은체이고, FedF-결합 나노바디 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 20. 파지 디스플레이 또는 효모 디스플레이를 통한 나노바디 면역 라이브러리로부터 유래된 항원-결합 키메라 단백질의 생성 및 선택을 위한 대표 벡터.
여기 도시된 벡터는 나노바디가 항원-결합 도메인을 스캐폴드에 연결시키는 2개 펩티드 결합 또는 2개 짧은 링커를 통해서 거대한 (임의로, 원형 배열) 스캐폴드 단백질과 융합된 항원-결합 키메라 단백질을 코딩한다. LS: 리터 서열. pIII: 사상 파지 M13의 부착 단백질. Aga2: 효모 세포 표면으로부터 돌출되는 Aga2p 메이팅 단백질. ACP: 그 발현 수준을 모니터링하기 위해 디스플레이된 항원-결합 키메라 단백질의 직교적 표지화를 위한 아실 캐리어 단백질. 거대 항원-결합 키메라 단백질 디스플레이 라이브러리는 예를 들어 나노바디의 경우에 면역화된 라마로부터 클로닝되거나 또는 합성 라이브러리로부터 수집될 수 있는 항원-결합 도메인-코딩 유전자의 컬렉션으로부터 C-말단부 (β-스트랜드 B 내지 G 포함)를 클로닝하여 구축될 수 있다.
도 21. 나노바디 면역 라이브러리로부터 유래되고 효모 디스플레이를 통해 선택된 후 FACS에 의한 GFP-특이적 항원-결합 키메라 단백질의 서열 분석
GFP로 면역화시킨 라마의 혈액 샘플로부터 클로닝시키고 그 다음에 HopQ와 융합된 나노바디로부터 출발하여 구축된 항원-결합 키메라 단백질로부터 효모 디스플레이를 통해 선택한 후에 FACS를 수행한 9종의 GFP-특이적 항원-결합 키메라 단백질 (SEQ ID NO:95-103)의 다중 아미노산 서열 정렬. β-스트랜드 B 내지 β-스트랜드 G를 포함하는 나노바디의 C-말단부만이 도시된다.
도 22. GFP-특이적 나노바디의 β-스트랜드 C 및 C'을 연결하는 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 모델.
(A) β-스트랜드 C 및 C'을 연결하는 β-턴을 통해 나노바디 상에 스캐폴드를 그라프트시키기 위한 조작 원리. 가위표는 나노바디 및 스캐폴드에서 어떠한 노출 턴이 절단되어야 하는가를 표시한다. 파선은 이들 항원-결합 키메라 단백질을 구축하기 위해 펩티드 결합 또는 짧은 펩티드 링커의 사용을 통해 스캐폴드 및 나노바디의 나머지 부분이 어떻게 쇄상화되어야 하는가를 표시한다. Nb의 CDR, 프레임워크 잔기 및 β-턴 영역은 IMGT에 따라 정의된다 (도 25, [Lefranc, 2014]로부터 개조). (B) 2개 펩티드 링커를 통해서 HopQ (아래)에 연결된 GFP-특이적 나노바디 (위)의 융합으로 만들어진 항원-결합 키메라 단백질의 3D 모델. (C) 나노바디의 제3 β-스트랜드 (β-스트랜드 C)는 스캐폴드의 원형화 변이체가 후속되고, 그 다음으로 GFP-특이적 나노바디의 β-스트랜드 C' 내지 G가 후속된다. (D) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이고, 원형 배열 링커는 이탤릭체이며, HopQ 서열은 밑줄표시된다.
도 23. 모노바디 NS1의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD GFP-결합 키메라 단백질의 모델.
(A) 나노바디를 스캐폴드에 연결시키는 2개 펩티드 결합 또는 링커를 통해서 K-Ras 특이적 모노바디 NS1 (위) 및 에이치. 피로리 HopQ의 어드헤신 도메인의 원형 배열 변이체 (아래)의 융합으로 만들어진 항원-결합 키메라 단백질의 모델. (B) 헬리코박터 피로리 균주 G27의 1형 HopQ의 어드헤신 도메인을 코딩하는 원형 배열 유전자 (아래, PDB 5LP2, SEQ ID NO:19)는 β-스트랜드 A를 β-스트랜드 B에 연결시키는 K-RAS 특이적 모노바디 (위, SEQ ID NO:112)의 제1 β-턴 (β-턴 AB)에 삽입되었다. (C) NS1 및 HopQ로부터 구축된 항원-결합 키메라 단백질의 아미노산 서열. 나노바디로부터 기원된 서열은 굵은체로 도시된다. HopQ로부터 기원되는 서열은 밑줄표시되어 있다. 원형 배열체를 만들기 위해 HopQ의 N-말단 및 C-말단을 연결하는 펩티드는 이탤릭체로 도시되어 있으며, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성물의 짧은 펩티드 링커이다.
도 24. Octet 상에서 분석된 GFP와 항원-결합 키메라 단백질 Mb Nb207 cHopQ 및 Mb Nb207 cYgjkE2 의 상호작용의 운동학적 특징규명 .
생물층 간섭계를 통한 GFP와 GFP-결합 나노바디 NbGFP207 (SEQ ID NO:1), 항원-결합 키메라 단백질 MbNb207 cHopQ (SEQ ID NO:20) 및 MbNb207 cYgjkE2 (SEQ ID NO:141)의 실시간 운동학적 분석. 스트렙타비딘-코팅된 Octet ® 바이오센서는 바이오틴화된 GFP (0.75 ㎍/mL)를 포획하는데 사용하였고 몇몇 농도 (60 - 2.22 nM 범위)의 NbGFP207 (A), MbNb207 cHopQ (B) 및 MbNb207 cYgjkE2 (C)와 연관시켰다. 측정된 반응 (검은색선)은 단상성 1:1 결합 모델 (붉은색선)에 적합화시켰다. 어세이는 10 mM Tris-HCl, 140 mM NaCl, pH 7.3, 0.05% Tween20 및 1 mg/mL BSA에서 실시하였다. (D) 계산된 운동학적 값은 n = 3회의 독립 실험으로부터의 평균의 평균 표준 오차 (s.e.m)로서 표시된다.
도 25. [LeFranc (2014)]로부터 개조된 바와 같은, IMGT에 따른 면역글로불린 가변 도메인 구조 및 토폴로지
(A) IMGT 스트랜드 및 루프 한계의 3D 구조 리본 도면 (LFranc et al., 2003). (B) 수소 결합을 갖는 2개 층 상의 IMGT 콜리어 드 페를레 (Collier de Perles). 2개 층 상의 IMGT 콜리어 드 페를레는 최선두에, GFCC'C" 스트랜드 (IG의 계면 VH/VL에 위치된 시트를 형성), 및 뒷쪽에 ABED 스트랜드를 보여준다. 수소 결합을 갖는 IMGT 콜리어 드 페를레 (선 중에서 녹색선, 여기서는 오직 GFCC0C00 시트만을 도시)는 실험 3D 구조 데이터로부터, IMGT/3Dstructure-DB에 통합된 IMGT/Collier-de-Perles 도구를 통해 생성된다 (Kaas et al., 2004; Ehrenmann et al., 2010, Ehrenmann and LeFranc, 2011).
도 26. 다른 항원-결합 키메라 단백질에 결합하여 확장된 항원-결합 키메라 단백질의 개략도.
(A) MbNb60 c7HopQmut2 (SEQ ID NO:134) 또는 MbNb60 c7HopQmut3 (SEQ ID NO:134)은 다른 MbNb207 cHopQ (SEQ ID NO:20)에 결합하여 확장되어 116 kDa의 확장된 항원-결합 키메라 단백질을 생성한다. (B) MbNb60 cYgjK(SEQ ID NO:135)는 MbNb207 cHopQ (SEQ ID NO:20)에 결합 및 확장되어, 168 kDa 분자량의 확장된 항원-결합 키메라 단백질을 생성시킨다.
도 27. Mb Nb207 cHopQ 와 복합체의 Nb60의 결정 구조는 Mb Nb207 cHopQ 의 cHopQ에 함유된 스캐폴드 단백질 상의 Nb60의 에피토프를 밝혀준다.
도 28. 통합된 화학 링커 유닛을 사용해 스캐포로드 단백질에 연결된 항원-결합 도메인을 갖는, 항원-결합 키메라 단백질의 개략도.
도 29. Octet 상에서 분석된 Mb Nb207 cHopQ 와 폴리바디라고 하는 항원-결합 키메라 단백질의 상호작용의 운동학적 특징규명 .
생물층 간섭계에 의한 HopQ-특이적 나노바디 Nb60 (SEQ ID NO:132), HopQ-특이적 MbNb60 cHopQmut2 (SEQ ID NO:133), HopQ-특이적 MbNb60 cHopQmut3 (SEQ ID NO:134) 및 HopQ-특이적 MbNb60 cYgjkE2 (SEQ ID NO:135)와 MbNb207 cHopQ (SEQ ID NO:20)의 결합에 대한 실시간 운동적학 분석. 스트렙타비딘-코팅된 Octet ® 바이오센서가 바이오틴화된 MbNb207 cHopQ (0.25 ㎍/mL)를 포획하는데 사용되었다. 몇몇 농도 (1.67 내지 500 nM 범위)에서 결합 및 해리 등온선을 Nb60 (A), MbNb60 cHopQmut2 (B), MbNb60 cHopQmut3 (C) and MbNb60 cYgjkE2 (D)에 대해 모니터링하였다. 모든 어세이는 10 mM Tris-HCl, 140 mM NaCl, pH 7.3, 0.05% Tween20 및 1 mg/mL BSA에서 실시하였다.
도 30. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 cHopQ 변이체의 기능성의 유세포측정 분석.
MbNb207 cHopQ (SEQ ID NO:22) 및 대표적인 효모-디스플레이 선택된 MbNb207 cHopQ 변이체 (표 2)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이하였다. 개별 효모 클론을 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 CoA-647 (2 μM)로 직교적으로 염색시키고 100 nM GFP와 인큐베이션시켰다. MP1331_A9 메가 바디 변이체 (A) 및 MbNb207 cHopQ (B)를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 광도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용하여 각각의 개별 효모 클론에 대해 계산하였다. (C) MbNb207 cHopQ (SEQ ID NO:22) 및 각각의 개별 MbNb207 cHopQ 변이체에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프 (표 2).
도 31. 이. 콜라이 발현 및 니켈 친화성 크로마토그래피 정제 이후 Mb Nb207 c7HopQ 및 4종의 효모-디스플레이 선택된 Mb Nb207 c7HopQ 변이체의 크기 배제 크로마토그래피 특징규명.
효모 디스플레이에 의해 선택된 1-1 아미노산 펩티드 링커를 갖는 이. 콜라이 발현된 MbNb207 c7HopQ 변이체의 Superdex 200 PG 컬럼 (10/300, GE Healthcare) 상에서의 분취형 겔 여과 실험. MbNb207 c7HopQ (SEQ ID NO: 136) 클론은 야생형 연결 변이체를 나타내고 MbNb207 c7HopQ A5 (SEQ ID NO: 137), MbNb207 c7HopQ A12 (SEQ ID NO: 138), MbNb207 c7HopQ B7 (SEQ ID NO: 139), MbNb207 c7HopQ G10 (SEQ ID NO: 140)은 각각 표 2의 MP1331_A5, MP1331_A12, MP1331_B7, MP1331_G10 클론을 나타낸다.
도 32. ELISA에 의한 Mb Nb207 c7HopQ 및 4종의 효모-디스플레이 선택된 변이체의 GFP 결합 분석.
크기 배제 정제된 MbNb207 c7HopQ (SEQ ID NO: 136), 4종의 효모-디스플레이 선택된 MbNb207 c7HopQ A5, MbNb207 c7HopQ A12, MbNb207 c7HopQ B7, MbNb207 c7HopQ G10 변이체 (SEQ ID NO: 137-140) 및 MbNb38 cHopQ (SEQ ID NO: 131)는 고정된 GFP를 함유하는 웰 또는 비코팅된 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-태그) 항체를 사용해 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)와 인큐베이션 후에 측정하였다. 데이타는 삼중 (n = 3)으로 수행된 실험으로부터의 평균의 평균 표준 오차 (s.e.m)로서 표시된다.
도 33. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 cYgjk 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNb207 cYgjk 변이체 (표 3)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색하였고 100 nM GFP와 인큐베이션하였다. (A) MP1333_A2 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용해 각각의 개별 효모 클론에 대해 계산하였다. (B) 각각의 개별 MbNb207 cYgjk 변이체에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프 (표 3).
도 34. ELISA로 분석된, 4종의 효모-디스플레이 선택된 Mb Nb207 cYgjk 변이체의 GFP 결합.
상이한 Mb Nb207 cYgjk 변이체 (SEQ ID NO:141-144)를 함유하는 주변세포질 추출물: MbNb207 cYgjkE2, MbNb207 cYgjkA2, MbNb207 cYgjkC4, MbNb207 cYgjkF5 변이체를 MbNb38 cHopQ (SEQ ID NO: 131)와 비교하였다. 모든 샘플은 고정된 GFP를 함유하는 웰 또는 비코팅된 웰에서 인큐베이션하였다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-tag) 항체를 사용하여 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션한 후에 측정하였다.
도 35. 크기 배제 크로마토그래피에 의한 이. 콜라이에서 발현되고 니켈 친화성 크로마토그래피로 정제된 Mb Nb207 cYgjk E2 변이체의 특징규명.
(A) 이. 콜라이의 주변세포질에서 발현시키고 분취형 Superdex 200 PG 겔 여과 컬럼 (16/26, GE Healthcare) 상에서 니켈 친화성 크로마토그래피로 정제된 MbNb207 cYgjkE2 (SEQ ID NO:141)의 분석. (B) (A)에 기술된 크기 배제 실험으로부터의 '피크 1' 분획 중 MbNb207 cYgjkE2 메가바디 순도의 SDS-PAGE 분석. 정제된 MbNb207 cYgjkE2의 샘플 (좌측 라인: '피크 1)을 8% SDS-PAGE 겔에 적용하였고 약 100 kDa의 분자 질량을 분자 질량 마커 (우측 라인: M)와 비교하여 확인하였다.
도 36. 나노바디를 스캐폴드에 연결하는 조작된 디술피드 결합에 의해 더욱 강성화된 Mb Nb207 cHopQ 변이체의 기능성 및 생물리적 특징규명.
10종 MbNb207 cHopQ 변이체의 GfP 결합 분석은 ELISA를 통해 분석하였다. (A) 크기-배제 정제된 MbNb207 cHopQ (SEQ ID NO:20) 및 4종 MbNb207 cHopQ Cys1-4 변이체 (SEQ ID NO:48-51, 도 10 참조)는 고정된 GFP 함유 웰 또는 비코팅된 웰에서 인큐베이션시켰다. (B) 크기-배제 정제된 MbNb207 c7HopQ (SEQ ID NO:136) 및 4종의 MbNb207 c7HopQ Cys5-10 변이체 (SEQ ID NO:145-150)는 고정된 GFP 함유 웰 또는 비코팅된 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (CaptureSelect C-tag) 항체를 사용하여 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터의 평균의 평균 표준 오차 (s.e.m.)로서 표시된다. (C) MbNb207 cHopQ 변이체의 열안정성 분석은 열 이동 어세이 (TSA)를 통해 수행하였다. MbNb207 c7HopQ (SEQ ID NO: 136), MbNb207 cHopQ Cys4 (SEQ ID NO: 51), MbNb207 c7HopQCys5 (SEQ ID NO:145), MbNb207 c7HopQ Cys6 (SEQ ID NO:146) 및 MbNb207 c7HopQ Cys10 (SEQ ID NO:150) 변이체에 대한 정규화된 용융 프로파일 그래프. 계산된 용융 온도 (Tm) 값은 표 4에 열거되어 있다.
도 37. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 아주린 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNb207 아주린 변이체 (표 5)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색하였고 100 nM GFP와 인큐베이션시켰다. (A) MP1304_B2 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도는 Prism 7 소프트웨어 (GraphPad)를 가용해 각 개별 효모 클론에 대해 계산되었다. (B) 각각의 개별 MbNb207 아주린 변이체에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프 (표 5).
도 38. ELISA에 의한 8종 효모-디스플레이 선택된 Mb Nb207 아주린 변이체의 GFP 결합 분석.
상이한 MbNb207 아주린 변이체 (SEQ ID NO:151-158)를 함유하는 8종의 주변세포질 추출물 및 MbNb38 cHopQ (SEQ ID NO: 131)를 함유하는 하나의 추출물을 고정된 GFP를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 항-EPEA (CaptureSelect C-tag) 항체를 사용해 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터의 평균의 평균 표준 오차 (s.e.m.)로서 표시된다.
도 39. ELISA에 의한 GFP 결합 분석
상이한 MbNb207 cPP7x2L 키메라 단백질 (SEQ ID NO: NO:3-6)을 함유하는 주변세포질 추출물은 고정된 GFP (0,1 ㎍/웰)를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 키메라 cPP7 이량체의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (CaptureSelect C-tag) 항체를 사용해 수행하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후 측정하였다.
도 40: 박테리오파지 AP205로부터 유래된 20면체 VLP상에서 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 90 카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 20면체 VLP (내부 분자)의 개략도. (B) 아시네토박터 박테리아의 20면체 RNA 박테리오파지, AP205의 공유 외피 단백질 이량체 (아래, PDB 5FS4)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)를 포함하는 항원-결합 키메라 단백질의 모델. (C) AP205의 외피 단백질에 나노바디를 연결하는 개략도. (D) 항원-결합 키메라 외피 단백질의 아미노산 서열 (SEQ ID NO: 167). 나노바디로부터 기원된 잔기는 굵은체로 표시된다. X는 1개 아미노산의 짧은 무작위 펩티드 링커이다. AP205 외피 단백질에 상응하는 서열은 밑줄표시된다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 41. ELISA에 의한 372 클론의 GFP 결합 분석
MbNb207 AP205x2XX 이량체 (SEQ ID NO: 167)를 함유하는 주변세포질 추출물 (MP 번호로서 표시)은 고정된 GFP (0,1 ㎍/웰) 또는 비코팅 웰에서 인큐베이션시켰다. 키메라 AP205 이량체의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (CaptureSelect C-tag) 항체를 사용해 수행하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후에 측정하였다.
도 42: 이량체 항원-결합 키메라 단백질 상에서 나노바디의 강성 디스플레이.
(A) β-스트랜드 A 교환이 존재하는 이량체 항원 결합 키메라 단백질의 모델. AP205 단량체는 이량체로 조립된다. 기능성 항원 결합 키메라를 수득하기 위해서, 이량체 항원-결합 키메라 단백질로 조립되도록 제1 단량체의 GFP-결합 나노바디의 β-스트랜드 A는 제2 단량체의 GFP-결합 나노바디의 β-스트랜드 B 내지 G와 조합될 필요가 있고, 제2 단량체의 GFP-결합 나노바디의 β-스트랜드 B 내지 G는 제1 단량체의 GFP-결합 나노바디의 β-스트랜드 A와 조합될 필요가 있다. (B) 그들 각각이 AP205의 외피 단백질 단량체에 연결된 2종의 GFP-특이적 나노바디 (위, SEQ ID NO:1)를 포함하는 동일한 이량체 항원-결합 키메라 단백질 (90°회전)의 모델. (C) AP205의 외피 단백질에 나노바디를 연결하는 개략도. (D) 항원-결합 키메라 외피 단백질의 아미노산 서열 (SEQ ID NO: 173). 나노바디로부터 기원된 잔기는 굵은체로 표시된다. X는 1개 아미노산의 짧은 무작위 펩티드 링커이다. AP205 외피 단백질에 상응하는 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 43. ELISA에 의한 372 클론의 GFP 결합 분석
MbNb207 AP205XX (SEQ ID NO: 173)의 이량체를 함유하는 주변세포질 추출물 (MP 번호로서 표시)은 고정된 GFP (0,1 ㎍/웰) 또는 비코팅 웰에서 인큐베이션시켰다. AP205 이량체의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA 항체 (Capture select C-tag)를 사용해 수행되었다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후 측정되었다.
도 44. EBY100 효모 세포 표면 상에 디스플레이된 Mb Nb207 ACP 나노툴 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNb207 ACP 나노툴 (NanoTool) 변이체 (표 9)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도되었고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색되었고 100 nM GFP와 인큐베이션되었다. (A) MP1302_D10 나노툴 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (나노툴 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용해 각 개별 효모에 대해 계산되었다. (B) 각각의 개별 MbNb207 ACP 나노툴 변이체 (표 9)에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프.
도 45. ELISA에 의한 6종의 효모-디스플레이 선택된 Mb Nb207 ACP 나노툴 변이체의 GFP 결합 분석.
6종 MbNb207 ACP (SEQ ID NO:178-183) 변이체 및 MbNb38 cHopQ (SEQ ID NO: 131)를 함유하는 주변세포질 추출물을 고정된 GFP를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-tag) 항체를 사용해 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터 평균의 평균 표준 오차 (s.e.m.)로서 표시된다.
도 46. 나노2바디 항원-결합 키메라 단백질의 모델.
(A) 도 17에 다른 3개 펩티드 링커를 통해서, FedF-결합 나노바디 (나노바디 A, SEQ ID NO:17)에 연결된 GFP-특이적 나노바디 (나노바디 B, SEQ ID NO:1)의 융합을 통해 만들어진 에너지적으로 더 양호한 항원-결합 키메라 단백질의 3D 모델. (B) 나노바디 A를 나노바디 B에 연결하는 개략도. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열 (SEQ ID NO:184-185).
, Nb GFP 207 서열은 굵은체이고, FedF-결합 나노바디 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 47. ELISA에 의한 대표적 클론의 GFP 및 FedF 결합 분석
반정제된 N2body 샘플 (SEQ ID NO: 186-191)은 고정된 GFP (0,5 ㎍/웰), 고정된 FedF (0,5 ㎍/웰) 또는 비코팅 웰에서 인큐베이션시켰다. 나노2바디의 C-말단에 존재하는 EPEA-태그의 검출은 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA 항체 (Capture select C-tag)를 사용해 수행하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과 인큐베이션 후에 측정하였다.
도 48. EBY100 효모 세포 표면 상에 디스플레이된 cHopQNb GFP 207 CC' 메가바디 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 cHopQNbGFP207X CC' 메가바디 변이체 (표 11)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-647 (2 μM)로 염색하였고 100 nM GFP와 인큐베이션시켰다. (A) MP1327_D5 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-647 형광도 (메가바디 디스플레이 수준) 및 상대적 GFP 형광도 (GFP 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)를 사용해 각각의 개별 효모에 대해 계산하였다. (B) 각각의 개별cHopQNbGFP207CC' 메가바디 변이체 (표 11)에 대한 상대적 CoA-647 및 GFP 형광도의 계산된 평균 형광 강도 (MFI)의 그래프.
도 49. EBY100 효모 세포 표면 상에 디스플레이된 Mb NS1 cHopQ 변이체의 기능성의 유세포측정 분석.
대표적인 효모-디스플레이 선택된 MbNS1 cHopQ 변이체 (표 12)는 Aga2p 및 ACP 융합체로서 EBY100 세포 상에 디스플레이되었다. 개별 효모 클론은 개별적으로 유도시켰고 SFP 신타제 (1 μM)를 사용하여 직교적으로 CoA-488 (2 μM)로 염색하였고 100 nM의 Dylight-647-표지된 K-RAS와 인큐베이션시켰다. (A) MP1326_A11 메가바디 변이체를 코딩하는 pCTCON2 유도체로 형질전환된 개별 EBY100 효모 세포의 상대적 형광 강도의 점 그래프. 상대적 CoA-488 형광도 (메가바디 디스플레이 수준) 및 상대적 Dylight-647 형광도 (K-Ras 결합)의 평균 형광 강도 (MFI)는 Prism 7 소프트웨어 (GraphPad)을 사용하여 각 개별 효모 클론에 대해 계산하였다. (B) 각각의 개별 MbNS1 cHopQ 변이체 (표 12)에 대한 상대적 CoA-488 및 Dylight-647 형광도의 계산된 형광 강도 (MFI)의 그래프.
도 50. 엠. 튜버큘로시스 ( M. tuberculosis ) 유래 도데신 Rv1498A 상에서 나노바디의 강성 디스플레이.
(A) 규칙적인 강성 어레이로 12 카피의 나노바디 (외부 분자)를 강성으로 디스플레이하는, 도데신 Rv1498A (내부 분자)의 개략도. (B) 2개 펩티드 링커를 통해서 Rv1498A 단량체 (아래, SEQ ID NO:192)에 연결된 GFP-특이적 나노바디 (위, SEQ ID NO:1)의 융합에 의해 만들어진 항원-결합 키메라 단백질의 3D 모델. 이러한 특정 항원-결합 키메라 단백질에서, 야생형 Rv1498A의 N-말단 및 C-말단이 서로 가깝게 있고 나노바디를 Rv1498A에 연결시키는 2개의 짧은 폴리펩티드 연결을 조작하기 위해 잘 위치되어 있기 때문에 스캐폴드 단백질의 원형 배열을 필요로 하지 않는다. (C) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 Rv1498A가 후속되고, 그 다음으로 나노바디의 C-말단부가 후속된다. (D) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1 은 1개 아미노산 길이 및 혼합 조성물의 짧은 펩티드 링커이고, Rv1498A 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 51. ELISA를 통한 6종의 선택된 Mb Nb207 도데신 변이체의 GFP 결합 분석.
6종의 MbNb207 도데신 변이체 (표 13) 및 NbGFP207 나노바디 (SEQ ID NO:1)를 함유하는 주변세포질 추출물은 고정된 GFP를 함유하는 웰 또는 비코팅 웰에서 인큐베이션시켰다. 메가바디의 C-말단에 존재하는 EPEA-태그는 스트렙타비딘-알칼리 접합체와 혼합된 바이오틴화된 항-EPEA (Capture select C-tag) 항체를 사용하여 검출하였다. 405 nm에서의 흡광도 (OD405)는 4-니트로페닐 포스페이트 디소듐 염 헥사히드레이트 기질 (DNPP)과의 인큐베이션 후에 측정하였다. 데이터는 삼중 (n = 3)으로 수행된 실험으로부터 평균의 평균 표준 편차 (s.e.m.)로서 표시된다.
도 52. 비. 세노세파시아 ( B. cenocepacia ) 유래 디술피드-브릿지된 동종이량체 상에서 나노바디의 강성 디스플레이 .
(A) 2개 펩티드 링커를 통해서 GFP-특이적 나노바디 (외부 분자, SEQ ID NO:1)에 강성으로 융합된 4QYB의 동종이량체 (내부 분자, SEQ ID NO:200)의 개략도. (B) 나노바디의 제1 β-스트랜드 (β-스트랜드 A)는 4QYB가 후속되고, 그 다음으로 나노바디의 C-말단부가 후속된다. (C) 최종 항원-결합 키메라 단백질의 아미노산 서열. Nb GFP 207 서열은 굵은체이고, (X)1-2 는 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커이고, 4QYB 서열은 밑줄표시되어 있다. C-말단 태그는 6xHis 및 EPEA를 포함한다.
도 53. Mb Nb80 cHopQ 존재 또는 부재 하에서 β2AR-wt의 리간드 결합 성질
Nb80 (검은색 사각형)의 존재 하에서, β2AR-wt 단독 (회색 원형)에서 또는 미관련 MbNb207 cHopQ (회색 삼각형)의 존재 하에서, β2AR-wt과 비교된 MbNb80 cHopQ (검은색 상향 삼각형)의 존재 하에서 β2AR-wt과의 결합에 대해 [3H]-디히드로알프레놀롤 ([3H]-DHA)과 경쟁하는 상이한 리간드의 방사리간드 치환 어세이. 경쟁 어세이는 각각 경쟁 리간드로서 천연 효현제 에피네프린 (A) 및 효현제 (-)-이소프로테레놀 (B)을 사용하여 β2AR-wt 수용체에 대해 수행하였다. 그래프는 Graphpad Prism의 표준 설정을 사용하여 경쟁적 결합에 대한 모델에 대해 비선형 회귀를 통해 적합화시켰다.
본 발명은 특정 실시형태 및 일정 도면을 참조하여 설명될 것이지만 본 발명은 이에 제한되는 것이 아니라 오직 청구항에 의해서만 제한된다. 청구항의 임의의 참조 부호는 범위를 제한하는 것으로 해석되어서는 않된다. 물론, 반드시 모든 양상 또는 장점이 본 발명의 임의 특정 실시형태에 따라 획득되지 않을 수 있다는 것을 이해해야 한다. 따라서, 예를 들어 당업자는 본 발명이 본 명세서에서 교시되거나 또는 제안할 수 있는 바와 같은 다른 양상 또는 장점을 반드시 획득하지 않고도 본 명세서에 교시된 바와 같은 한가지 장점 또는 장점군을 획득하거나 또는 최적화하는 방식으로 구체화될 수 있거나 또는 수행될 수 있다는 것을 인식하게 될 것이다.
그 특성 및 장점과 함께, 구성 및 실시 방법에 관한 본 발명은 첨부된 도면과 함께 읽을 때 하기 구체적인 설명을 참조하여 최선으로 이해될 수 있다. 본 발명의 양상 및 장점은 이하 기술된 실시형태(들)를 참조하여 자명해질 것이고 명확해질 것이다. "하나의 실시형태" 또는 "일 실시형태"에 대한 본 명세서 전반에서의 언급은 실시형태와 함께 기술된 특정한 특성, 구조 또는 특징이 본 발명의 적어도 하나의 실시형태에 포함된다는 것을 의미한다. 따라서, 이 명세서 전반의 다양한 위치에서 "하나의 실시형태에서" 또는 "일 실시형태에서"라는 어구의 출현은 그럴수도 있지만, 반드시 모두 동일한 실시형태를 언급하는 것이 아니다. 유사하게, 본 발명의 예시적인 실시형태의 설명에서, 본 발명의 다양한 특성은 때때로 본 개시를 간소화하고 하나 이상의 다양한 본 발명의 양상의 이해를 돕기 위한 목적으로 단일 실시형태, 도면, 또는 이의 설명으로 함께 그룹화된다는 것을 이해해야 한다. 그러나, 본 개시의 방법은 청구된 발명이 각 청구항에서 명확하게 명시한 것 이상의 특성을 요구한다는 의도를 반영하는 것으로 해석되어서는 안된다. 대신에, 하기 청구항이 반영하는 대로, 본 발명의 양상들은 단일한 앞서 개시된 실시형태의 모든 특성보다 적다.
정의
단수 명사를 언급할때 사용되는 부정 관사 또는 정관사, 예를 들어 "한" 또는 "하나", "그" 등이 언급되는 경우에, 이것은 특별히 다른 것을 명시하지 않으면 그 명사의 복수를 포함한다. 본 명세서 및 청구항에서 용어 "포함하는"이 사용되는 경우에, 다른 구성요소 또는 단계들을 배제하는 것이 아니다. 뿐만 아니라, 명세서 및 청구항에서 용어 제1, 제2, 제3 등은 유사한 구성요소를 구별하기 위해 사용되며, 반드시 순차 또는 연대기 순서를 설명하기 위해 사용되는 것은 아니다. 이렇게 사용되는 용어들은 적절한 상황 하에서 상호교환가능하고 본 명세서에 기술된 본 발명의 실시형태가 본 명세서에 기술되거나 또는 예시된 것 이외의 다른 순서로 작동될 수 있다는 것을 이해해야 할 것이다. 하기 용어 또는 정의는 오로지 본 발명의 이해를 돕기위해 제공된다. 본 명세서에서 특별히 정의하지 않으면, 본 명세서에서 사용되는 모든 용어는 본 발명의 당업자에게 동일한 의미를 갖는다. 당분야의 정의 및 용어에 관해 실시자는 특히 [Sambrook et al., Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012)]; 및 [Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016)]에 따른다. 본 명세서에서 제공하는 정의는 당업자가 이해하는 것 이하의 범위를 갖는 것으로 해석되어서는 안된다.
양, 시간 지속기간 등과 같은 측정가능한 수치에 대해 언급시 본 명세서에서 사용되는 "약"은 명시된 값으로부터 ± 20% 또는 ± 10%, 보다 바람직하게 ± 5%, 보다 더 바람직하게 ± 1%, 여전히 더 바람직하게 ± 0.1%의 변동을 포함하려는 의미로서, 그러한 변동이 개시된 방법을 수행하는데 적절하기 때문이다. 본 명세서에서 사용되는 '유사한'은 서로같은, 비슷한, 비교할만한, 상응하는 등과 상호교환적으로 사용되고, 같거나 또는 공통의 특징를 갖고/갖거나, 정량가능한 방식으로 최대 20%, 10%, 보다 바람직하게 5%, 또는 보다 더 바람직하게 1%, 또는 그 이하의 변동으로, 비슷한 결과를 보여주는 것을 의미한다.
본 명세서에서 사용되는 "뉴클레오티드 서열", "DNA 서열" 또는 "핵산 분자(들)"은 임의 길이의 뉴클레오티드의 중합체 형태, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드를 의미한다. 이 용어는 오직 분자의 1차 구조를 의미한다. 따라서, 이 용어는 이중 가닥 및 단일 가닥 DNA, 및 RNA를 포함한다. 또한 기지 유형의 변형, 예를 들어 메틸화, 하나 이상의 천연 발생 뉴클레오티드의 유사체에 의한 "캡" 치환을 포함한다. "핵산 구성체"란, 자연계에서 함께 존재하지 않는 하나 이상의 기능성 유닛을 포함하도록 구축된 핵산을 의미하는 것이다. 이러한 예는 원형, 선형, 이중 가닥, 염색체외 DNA 분자 (플라스미드), 코스미드 (람다 파지 유래 COS 서열 함유 플라스미드), 비천연 핵산 서열을 포함하는 바이러스 게놈 등을 포함한다.
"코딩 서열"은 적절한 조절 서열의 제어 하에 위치될 때 mRNA로 전사되고/되거나 폴리펩티드로 번역되는 뉴클레오티드 서열이다. 코딩 서열의 경계는 5'-말단에 번역 출발 코돈 및 3'-말단에 번역 중지 코돈으로 결정된다. 코딩 서열을 제한없이 mRNA, cDNA, 재조합 뉴클레오티드 서열 또는 게놈 DNA를 포함할 수 있는 한편, 인트론이 일정 상황 하에서 역시 존재할 수도 있다.
본 명세서에서 사용되는 "유전자의 프로모터 영역"은 코딩 서열에 작동적으로 연결되고 적절한 유도 조건 하에 가능하게 위치될 때, 상기 코딩 서열의 전사를 촉진하기에 충분한 기능성 DNA 서열 유닛을 의미한다. "작동적으로 연결된"은 그렇게 기술된 성분들이 그들의 의도하는 방식으로 기능하도록 허용하는 관계로 위치된 병치를 의미한다. 코딩 서열에 "작동적으로 연결된" 프로모터 서열은 코딩 서열의 발현이 프로모터 서열과 호환되는 조건 하에서 획득되는 방식으로 결찰된다. 본 명세서에서 사용되는 "유전자"는 유전자의 프로모터 영역뿐만 아니라 코딩 서열을 포함한다. 이것은 프로모터 서열에 작동적으로 연결된, 게놈 서열 (가능한 인트론 포함)을 비롯하여, 스플라이싱 메신저로부터 유래된 cDNA 둘 모두를 의미한다. 용어 "종결인자" 또는 "전사 종결 신호"는 1차 전사물의 3' 프로세싱 및 폴리아데닐화 및 전사 종결에 신호를 전달하는 전사 유닛의 말단에 있는 DNA 서열인 제어 서열을 포괄한다. 종결인자는 천연 유전자 유래, 다양한 다른 식물 유전자 유래, 또는 T-DNA 유래일 수 있다. 부가하려는 종결인자는 예를 들어, 노팔린 신타제 또는 옥토핀 신타제 유전자로부터 유래될 수 있거나, 또는 대안적으로 다른 식물 유전자로부터 유래될 수 있거나, 또는 덜 바람직하게는 임의의 다른 진핵생물 유전자로부터 유래될 수 있다.
"키메라 유전자" 또는 "키메라 구성체" 또는 "키메라 유전자 구성체"는 프로모터 또는 조절 핵산 서열이 mRNA를 코딩하는 핵산 서열에 작동적으로 연결되거나, 또는 그와 회합되어서, 조절 핵산 서열이 회합된 핵산 코딩 서열의 전사 또는 발현을 조절할 수 있는, 재조합 핵산 서열을 의미한다. 키메라 유전자의 조절 핵산 서열은 자연계에 존재하는 대로의 회합된 핵산 서열에 작동적으로 연결되지 않는다.
"발현 카세트"는 이 발현 카세트의 프로모터에 작동적으로 연결되는, 관심 유전자/코딩 서열의 발현을 유도할 수 있는 임의의 핵산 구성체를 포함한다. 발현 카세트는 일반적으로 바람직하게 (5' 내지 3'의 전사 방향으로) 프로모터 영역, 전사 개시 영역에 작동적으로 연결된 폴리뉴클레오티드 서열, 이의 상동체, 변이체 또는 단편, 및 RNA 중합효소를 위한 중지 신호 및 폴리아데닐화 종결 신호를 포함하는 서열을 포함하는 DNA 구성체이다. 이들 모든 영역은 형질전환시키려는, 생물학적 세포, 예컨대 원핵생물 또는 진핵생물 세포에서 작동할 수 있어야 한다는 것을 이해한다. 바람직하게 RNA 중합효소 결합 부위, 및 폴리아데닐화 신호를 포함하는, 전사 개시 영역을 포함하는 프로모터 영역은 형질전환시키려는 생물학적 세포에서 천연적인 것일 수 있거나 또는 대체 공급원으로부터 유래될 수 있고, 여기서 영역은 생물학적 세포에서 기능성이다. 이러한 카세트는 "벡터"로 구축될 수 있다.
본 명세서에서 사용되는 용어 "벡터", "벡터 구성체", "발현 벡터", 또는 "유전자 전달 벡터"는 연결된 다른 핵산 분자를 수송할 수 있는 핵산 분자를 의미하고자 하고, 제한없이, 플라스미드 벡터, 코스미드 벡터, 파지 벡터, 예컨대 람다 파지, 바이러스 벡터, 예컨대 아데노바이러스, AAV 또는 배큘로바이러스 벡터, 또는 인공 염색체 벡터 예컨대 박테리아 인공 염색체 (BAC), 효모 인공 염색체 (YAC), 또는 P1 인공 염색체 (PAC)를 포함하여, 임의의 적합한 유형을 포함하는, 당업자에게 공지된 임의 벡터를 포함한다. 발현 벡터는 플라스미드를 비롯하여 바이러스 벡터를 포함하고, 일반적으로 바람직한 코딩 서열 및 특정 숙주 유기체 (예를 들어, 박테리아, 효모, 식물, 곤충 또는 포유동물) 또는 시험관내 발현 시스템에서 작동적으로 연결된 코딩 서열의 발현에 필요한 적절한 DNA 서열을 함유한다. 발현 벡터는 그들이 도입되는 숙주 세포에서 자율 복제할 수 있다 (예를 들어, 숙주 세포에서 기능하는 복제 기원을 갖는 벡터). 다른 벡터는 숙주 세포에 도입 시 숙주 세포의 게놈에 통합될 수 있고, 그리하여 숙주 세놈과 함께 복제된다. 적합한 벡터는 특정 숙주 유기체 (예를 들어, 박테리아 세포, 효모 세포)에 따라서 바람직하게 조절 서열, 예컨대 프로모터, 인핸서, 종결인자 서열 등을 포함한다. 클로닝 벡터는 일반적으로 소정의 바람직한 DNA 단편을 조작하고 증폭시키는데 사용되고 바람직한 DNA 단편의 발현에 필요한 기능적 서열이 결여될 수 있다. 원핵생물 세포를 형질감염시키는데 사용을 위한 발현 벡터의 구축은 당분야에서 역시 충분히 공지되어 있으므로, 표준 기술을 퉁해 수행할 수 있다 (예를 들어, 당분야의 정의 및 용어의 경우 [Sambrook, et al. Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012)]; 및 [Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016)] 참조).
'숙주 세포'는 원핵생물일 수 있거나 또는 진핵생물일 수 있다. 세포는 일시적으로 또는 안정적으로 형질감염될 수 있다. 원핵생물 및 진핵생물 세포로 발현 벡터의 이러한 형질감염은 제한없이 표준 박테리아 형질전환, 칼슘 포스페이트 공침전법, 전기천공, 또는 리포솜 매개-, DEAE 덱스트란 매개-, 다가양이온 매개-, 또는 바이러스 매개 형질감염을 포함한, 당분야에 공지된 임의 기술을 통해 수행될 수 있다. 모든 표준 기술의 경우, 예를 들어, [Sambrook et al., Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Press, Plainsview, New York (2012)]; 및 [Ausubel et al., Current Protocols in Molecular Biology (Supplement 114), John Wiley & Sons, New York (2016)]를 참조한다. 본 명세서에서, 재조합 숙주 세포는 본 발명의 단리된 DNA 분자, 핵산 분자 또는 발현 구성체 또는 벡터를 함유하도록 유전자 변형된 것들이다. DNA는 제한없이, 형질전환, 리포펙션, 전기천공 또는 바이러스 매개 형질도입을 포함하여, 특정 세포 유형에 적절한 당분야에 공지된 임의 수단을 통해 도입될 수 있다. 본 발명의 키메라 단백질의 발현을 할 수 있게 하는 DNA 구성체는 클로닝, 하이브리드화 스크리닝 및 중합효소 연쇄 반응 (PCR)과 같이, 당분야에 공지된 기술을 통해 쉽게 제조될 수 있다. 클로닝, DNA 단리, 증폭 및 정제, DNA 리가제, DNA 중합효소, 제한 엔도뉴클레아제 등을 포함한 효소 반응, 및 다양한 분리 기술에 대한 표준 기술은 당업자에게 공지되어 있고 일반적으로 적용되는 것들이다. 다수의 표준 기술이 [Sambrook et al. (2012)], [Wu (ed.) (1993)] 및 [Ausubel et al. (2016)]에 기술되어 있다. 본 발명에서 사용할 수 있는 대표적인 숙주 세포는 제한없이 박테리아 세포, 효모 세포, 식물 세포 및 동물 세포를 포함한다. 본 발명에서 사용에 적합한 박테리아 숙주 세포는 에스케리치아 (Escherichia) spp. 세포, 바실러스 (Bacillus) spp. 세포, 스트렙토마이세스 (Streptomyces) spp. 세포, 어위니아 (Erwinia) spp. 세포, 클렙시엘라 (Klebsiella) spp. 세포, 세라티아 (Serratia) spp. 세포, 슈도모나스 (Pseudomonas) spp. 세포 및 살모넬라 (Salmonella) spp. 세포를 포함한다. 본 발명에 따라 사용에 적합한 동물 숙주 세포는 곤충 세포 및 포유동물 세포 (가장 특히, 중국 햄스터 유래 (예를 들어, CHO), 및 인간 세포주, 예컨대 HeLa를 포함한다. 본 발명에서 사용에 적합한 효모 숙주 세포는 사카로마이세스 (Saccharomyces), 스키조사카로마이세스 (Schizosaccharomyces), 클루이베로마이세스 (Kluyveromyces), 피키아 (Pichia) (예를 들어, 피키아 파스토리스 (Pichia pastoris)), 한세눌라 (Hansenula) (예를 들어, 한세눌라 폴리몰파 (Hansenula polymorpha)), 야로위아 (Yarowia), 슈와니오마이세스 (Schwaniomyces), 스키조사카로마이세스 (Schizosaccharomyces), 자이고사카로마이세스 (Zygosaccharomyces) 등에서의 종을 포함한다. 사카로마이세스 세레비지아 (Saccharomyces cerevisiae), 에스. 칼스베르젠시스 (S. carlsbergensis) 및 케이. 락티스 (K. lactis)가 가장 일반적으로 사용되는 효모 숙주이고, 편리한 진균 숙주이다. 숙주 세포는 현탁액 또는 플라스크 배양, 조직 배양, 장기 배양 등으로 제공될 수 있다. 대안적으로, 숙주 세포는 또한 유전자이식 동물일 수도 있다.
용어 "단백질", "폴리펩티드", "펩티드"는 아미노산 잔기의 중합체 및 이의 변이체 및 합성 유사체를 의미하기 위해서 본 명세서에서 상호교환적으로 사용된다. 따라서, 이들 용어는 하나 이상의 아미노산 잔기가 합성 비천연 발생 아미노산, 예컨대 상응하는 천연 발생 아미노산의 화학 유사체를 비롯하여, 천연 발생 아미노산 중합체인 아미노산 중합체에 적용된다. 이 용어는 또한 폴리펩티드의 번역후 변형, 예컨대 글리코실화, 인산화 및 아세틸화를 포함한다. 아미노산 서열 및 변형을 기반으로, 폴리펩티드의 원자 또는 분자 질량 또는 중량은 (킬로)달톤 (kDa)으로 표시된다. "재조합 폴리펩티드"란, 재조합 기술을 사용하여, 즉 재조합 또는 합성 폴리뉴클레오티드의 발현을 통해 만들어진 폴리펩티드를 의미한다. 키메라 폴리펩티드 또는 이의 생물학적 활성 부분이 재조합적으로 생산될 때, 이것은 또한 바람직하게 배양 배지가 실질적으로 없으며, 다시 말해서, 배양 배지는 단백질 제조 부피의 약 20% 미만, 보다 바람직하게 약 10% 미만, 가장 바람직하게 약 5% 미만을 나타낸다. "단리된"이란, 그의 천연 상태에서 정상적으로는 동반되는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다. 예를 들어, "단리된 폴리펩티드"는 천연 발생 상태에서 그에 측접되는 분자로부터 정제시킨 폴리펩티드를 의미하고, 예를 들어, 상기 폴리펩티드에 인접하는 생산 숙주에 존재하는 분자로부터 제거된 항원-결합 키메라 단백질을 의미한다. 단리된 키메라는 아미노산 화학 합성을 통해 생성시킬 수 있거나 또는 재조합 생산을 통해 생성될 수 있다. "이종성 단백질"이라는 표현은 단백질이 이 단백질을 디스플레이하거나 또는 발현시키는데 사용되는 동일 종 또는 균주로부터 유래되지 않는다는 것을 의미할 수 있다.
단백질의 "상동체", "상동체들"은 대상 비변형 단백질에 비해서 아미노산 치환, 결실 및/또는 삽입을 갖고 그들이 유래되는 비변형 단백질과 유사한 생물학적 및 기능적 활성을 갖는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포괄한다. 본 명세서에서 사용되는 용어 "아미노산 동일성"은 서열이 비교창 상에서 아미노산 대 아미노산 기반으로 동일한 정도를 의미한다. 따라서, "서열 동일성 백분율"은 비교창 상에서 2개의 최적으로 정렬된 서열을 비교하는 단계, 동일한 아미노산 잔기 (예를 들어, Ala, Pro, Ser, Thr, Gly, Val, Leu, Ile, Phe, Tyr, Trp, Lys, Arg, His, Asp, Glu, Asn, Gln, Cys 및 Met, 또한 본 명세서에서 1글자 코드로도 표시됨)가 양쪽 서열에 존재하는 위치의 개수를 결정하여 일치되는 위치의 수를 산출하는 단계, 비교창의 전체 위치 개수 (즉, 창 크기)로 일치되는 위치의 개수를 나누는 단계, 그 결과에 100을 곱해서 서열 동일성 백분율을 산출하는 단계에 의해 계산된다. 본 명세서에서 사용되는 "치환" 또는 "돌연변이"는 부모 단백질 또는 이의 단편의 아미노산 서열 또는 뉴클레오티드 서열과 각각 비교하여, 상이한 아미노산 또는 뉴클레오티드로 하나 이상의 아미노산 또는 뉴클레오티드의 치환에 의해 야기된다. 단백질 또는 이의 단편은 단백질의 활성에 실질적으로 효과를 갖지 않는 보존성 아미노산 치환을 가질 수 있다는 것을 이해한다.
용어 "야생형"은 천연 발생 공급원으로부터 단리된 유전자 또는 유전자 생성물을 의미한다. 야생형 유전자는 개체군에서 가장 빈번하게 관찰되고 따라서 유전자의 "정상" 또는 "야생형" 형태를 임의적으로 디자인하는 것이다. 대조적으로, 용어 "변형된", "돌연변이체" 또는 "변이체"는 야생형 유전자 또는 유전자 생성물과 비교했을 때 서열 내 변형, 번역후 변형 및/또는 기능적 성질의 변형 (즉, 변경된 특징)을 나타내는 유전자 또는 유전자 생성물이다. 천연 발생 돌연변이를 단리할 수 있다는 것을 유의하며, 이것은 그들이 야생형 유전자 또는 유전자 생성물과 비교했을 때 변경된 특징을 갖는다는 사실을 통해 확인된다.
"단백질 도메인"은 단백질 내 구별되는 기능 및/또는 구조 유닛이다. 일반적으로 단백질 도메인은 단백질의 전반적인 역할에 기여하는, 특정 기능 또는 상호작용을 담당한다. 도메인은 유사한 도메인이 상이한 기능을 갖는 단백질에 존재할 수 있는, 다양한 생물학적 상황에서 존재할 수 있다.
단백질 2차 구조 구성요소 (SSE)는 전형적으로 단백질이 이의 3차원적 3차 구조로 폴딩되기 전에 중간체로서 자발적으로 형성된다. 단백질의 2가지 가장 일반적인 2차 구조 구성요소는 알파 헬릭스 및 베타 (β) 시트이지만, β-턴 및 오메가 루프도 역시 존재한다. 베타 시트는 일반적으로 꼬이고, 주름잡힌 시트를 형성하는, 적어도 2개 또는 3개의 골격 수소 결합에 의해 측면으로 연결된 베타 스트랜드 (또한, β-스트랜드)로 이루어진다. β-스트랜드는 연장된 입체구조로 골격을 갖는 전형적으로 3개 내지 10개 아미노산 길이의 폴리펩티드 사슬 스트레치이다. β-턴은 폴리펩티드 사슬의 방향에 변화를 야기시키는 단백질의 비규칙적 2차 구조 유형이다. 베타 턴 (β 턴, β-턴, β-벤드, 타이트 턴, 리버스 턴)은 주로 β-스트랜드를 연결시키도록 제공되는 단백질 및 폴리펩티드 내 매우 일반적인 모티프이다. 가변 도메인에 존재하는 β-턴의 IMGTⓒ 정의의 경우, [LeFranc (2014)], 및 도 25를 또한 참조한다. β-턴은 전형적으로 4개 아미노산 잔기 (i, i+1, i+2 및 i+3로 표지)로 이루어지고, 2가지 방식으로 정의되거나: 또는 잔기 i의 CO 및 잔기 i+3의 NH 사이에 주쇄내 수소 결합의 보유에 의해; 또는 대안적으로, 잔기 i 및 i+3의 Cα 원자 사이에 7Å 미만의 거리를 가져서 정의된다. 수소 결합 기준은 부분적으로 4개의 별개 범주를 발생시키기 때문에, 매일 사용을 위해 가장 적절한 것이다.
용어 "단백질의 원형 배열 (circular permutation)" 또는 원형 배열 (circularly permutated) 단백질"은 야생형 단백질 서열과 비교하여, 이의 아미노산 서열에서 변화된 아미노산 순서를 갖는 단백질을 의미하며, 그 결과로서 단백질 구조는 상이한 연결성을 갖지만, 전반적으로는 유사한 3차원 (3D) 형상을 갖는다. 단백질의 원형 배열은 예를 들어, [Bliven and Prlic (2012)]에 기술된 바와 같이, 야생형 단백질의 제1 부분의 서열 (N-말단에 인접)이 최종 원형 배열 단백질의 제2 부분의 서열 (이의 C-말단 근처)과 관련된다는 의미에서, 환형 배열의 수학적 개념과 유사하다. 이의 야생형 단백질과 비교하여 단백질의 원형 배열은 단백질의 유전자 또는 인공 조작을 통해 수득되고, 그리하여 야생형 단백질의 N-말단 및 C-말단은 '연결되'고, 단백질 서열이 다른 부위에서 중단되어, 상기 단백질의 신규 N-말단 및 C-말단이 생성된다. 본 발명의 원형 배열 스캐폴드 단백질은 야생형 단백질 서열의 연결된 N-말단 및 C-말단, 및 상기 스캐폴드 단백질의 접근가능하거나 또는 노출된 부위 (우선적으로 β-턴 또는 루프)에서의 절단 또는 중단 서열의 결과이고, 그리하여 원형 배열 스캐폴드 단백질의 폴딩은 야생형 단백질의 폴딩과 비교하여 비슷하거나 또는 유지된다. 상기 원형 배열 스캐폴드 단백질에서 N-말단 및 C-말단의 상기 연결은 야생형 단백질이 펩티드 결합 또는 나머지 아미노산이 후속된다면 본래 N-말단 및 C-말단 근처 펩티드 스트레치의 결실 또는 펩티드 링커의 도입, 또는 펩티드 결합 연결의 결과일 수 있다.
본 명세서에서 사용되고, 본 명세서에서 "연결된", "접합된", "결찰된"과 상호교환적으로 사용되는 용어 "융합된"은 특히, 예를 들어 재조합 DNA 기술에 의한 "유전자 융합"을 비롯하여, 안정한 공유 연결을 야기하는 "화학적 및/또는 효소적 접합"을 의미한다.
용어 "키메라 폴리펩티드", "키메라 단백질", "키메라", "융합 폴리펩티드", "융합 단백질", 또는 "비천연 발생 단백질"은 본 명세서에서 상호교환적으로 사용되고 동일한 단백질로부터 기원할 수 있거나 또는 그렇지 않을 수 있는 적어도 2종의 개별 및 별개 폴리펩티드 성분을 포함하는 단백질을 의미한다. 이 용어는 또한 인간이 만든 것을 의미하는 비천연 발생 분자를 의미한다. (본 명세서에 정의된 바와 같은) 키메라 폴리펩티드를 언급할 때 용어 "융합된", 및 다른 문법적 동등어, 예컨대 "공유적으로 연결된", "연결된", "부착된", "결찰된", 접합된"은 둘 이상의 폴리펩티드 성분을 연결하기 위한 임의의 화학적 또는 재조합적 기전을 의미한다. 둘 이상의 폴리펩티드 성분의 융합은 서열의 직접 융합일 수 있거나 또는 예를 들어 개재 아미노산 서열 또는 링커 서열, 또는 화학적 링커에 의한 간접 융합일 수 있다. 본 명세서에 기술된 바와 같이, 2개 폴리펩티드 또는 항원-결합 도메인 및 스캐폴드 단백질의 융합은 또한 화학적 연결을 통해 수득되는 비공유 융합을 의미할 수도 있다. 예를 들어, 항원-결합 도메인의 A-스트랜드의 C-말단 및 B-스트랜드의 N-말단은 둘 모두가 이의 노출 또는 접근가능한 부위에서, 부분 또는 전체 길이 (원형 배열) 스캐폴드 단백질에 연결되거나 또는 융합된 상보적 화학 유닛 또는 결합 포켓에 결합할 수 있는, 화학 유닛에 연결될 수 있다 (도 28에 도시된 바와 같음).
본 명세서에서 사용되는 용어 "단백질 복합체" 또는 "복합체" 또는 "조립된 단백질(들)"은 둘 이상의 회합된 거대분자의 그룹을 의미하고, 거대분자의 적어도 하나는 단백질이다. 본 명세서에서 사용되는 단백질 복합체는 전형적으로 생리학적 조건 하에서 형성될 수 있는 거대분자의 회합체를 의미한다. 단백질 복합체의 개별 구성원은 비공유 상호작용을 통해 연결된다. 단백질 복합체는 오직 단백질의 비공유 상호작용일 수 있고, 그렇다면 단백질-단백질 복합체; 예를 들어, 2개 단백질, 3개 단백질, 4개 단백질의 비공유 상호작용 등일 수 있다. 보다 특히, 항원-결합 키메라 단백질 및 항원 자체의 복합체이다. 본 명세서에서 사용되는, 단백질 복합체는 또한 적어도 하나의 단백질 및 적어도 다른 거대분자, 예컨대 핵산의 비공유 상호작용일 수 있고, 그렇다면 단백질-핵산 복합체; 예를 들어, 하나의 단백질과 하나의 핵산, 2개의 단백질과 하나의 핵산, 2개 단백질과 2개 핵산의 비공유 상호작용이라고 한다. 단백질 복합체는 다량체일 수 있다는 것을 이해해야 한다. 단백질 복합체 조립은 동종-다량체 또는 이종-다량체 복합체의 형성을 일으킬 수 있다. 게다가, 상호작용은 안정할 수 있거나 또는 일시적일 수 있다. 용어 "다량체(들)", "다량체 복합체", 또는 "다량체 단백질(들)"은 다수의 동일하거나 또는 이종성인 폴리펩티드 다량체를 포함한다. 폴리펩티드는 다수의 단일 폴리펩티드 단량체의 자가 조립 (즉, "동동-다량체 조립")으로 형성된 다량체 조립 (즉, 이량체, 삼량체, 육량체, 오량체, 팔량체 등)으로 자가-조립될 수 있다. 본 명세서에서 사용되는 "다수"는 2 이상을 의미한다. 다량체 조립은 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 또는 그 이상의 폴리펩티드 단량체를 포함한다. 다량체 조립은 임의 목적으로 사용될 수 있고, 단백질 "나노재료"의 광범위 어레이를 개발하는 방법을 제공한다. 유한의, 케이지-유사 또는 쉘-유사 단백질 조립 이외에도, 그들은 적절한 표적 대칭 아키텍쳐를 선택하여 디자인될 수 있다. 본 발명의 단량체 및/또는 다량체 조립은 계층적 조립의 장점이 수반되는 고차원 조립의 디자인에서 사용될 수 있다. 최종 다량체 조립은 우수한 강성 및 단분산성을 갖는 고차원적 물질이고, 광범위한 적용성을 갖는 고급 기능성 물질 및 맞춤-디자인 분자 기계의 기초를 형성할 수 있다.
본 명세서에서 사용되는 용어 "결정하는", "측정하는", "평가하는" 및 "어세이하는"은 상호교환적으로 사용되고 정성 및 정량 결정 둘 모두를 포함한다.
용어 "적합한 조건"은 환경 인자, 예컨대 온도, 이동, 다른 성분, 및/또는 특히 "완충 조건(들)"을 의미하고, 여기서 "완충 조건"은 특히 어세이가 수행되는 용액의 조성물을 의미한다. 상기 조성은 완충된 용액 및/또는 용질, 예컨대 pH 완충 물질, 물, 염수, 생리학적 염 용액, 글리세롤, 보존제 등을 포함하고, 이에 대해서는 당업자가 최적 어세이 성능을 수득하는 적합성에 대해 알고있다.
"결합"은 간접적이거나 또는 직접적인 임의의 상호작용을 의미한다. 직접 상호작용은 결합 파트너 간 접촉을 의미한다. 간접 상호작용은 상호작용 파트너가 2개 초과 분자의 복합체로 상호작용하는 임의의 상호작용을 의미한다. 상호작용은 하나 이상의 브릿지 분자의 도움으로 완전히 간접적일 수 있거나, 또는 하나 이상의 분자의 추가적인 상호작용에 의해 안정화되는, 파트너간 직접 접촉이 여전히 존재하여, 부분적으로 간접적일 수 있다. 일반적으로, 결합 도메인은 면역글로불린-기반 또는 면역글로불린-유사일 수 있거나 또는 제한없이 미생물 단백질, 프로테아제 억제제, 독소, 피브로넥틴, 리포칼린, 단쇄 역평형 코일드 코일 단백질 또는 반복 모티프 단백질을 포함하는, 단백질에 존재하는 도메인을 기반으로 할 수 있다. 항원-결합, 면역글로불린, 면역글로불린-유사 도메인 또는 항체 도메인에 대해서 본 명세서에서 사용하는 용어 "특이적으로 결합하다"란, 특이적 항원을 인식하지만, 샘플 중 다른 분자는 실질적으로 인식하거나 또는 결합하지 않고, 또한 "항원-결합 도메인" 또는 "항원-결합 단백질"이라고도 하는 결합 도메인을 의미한다. 예를 들어, 하나의 종에서 유래된 항원에 특이적으로 결합하는 항체는 또한 하나 이상의 종에서 유래하는 항원에도 결합할 수 있다. 그러나, 이러한 교차-종 반응성은 특이적인 항체의 분류 자체를 변경하지는 않는다. 일부 예에서, 용어 "특이적 결합" 또는 "특이적으로 결합하다"는 상호작용이 화학종에서 특정 구조 (예를 들어, 항원성 결정부 또는 에피토프)의 존재에 의존적이고, 예를 들어, 항원-결합 단백질이 일반적으로 단백질 보다는 특이적 단백질 구조를 인식하여 결합한다는 것을 의미하기 위해서, 항체, 단백질, 또는 펩티드와 제2의 화학종의 상호작용을 참조하여 사용될 수 있다. 항원-결합 단백질이 에피토프 "A"에 특이적이라면, 표지된 "A" 및 항원-결합 단백질을 함유하는 반응에서, 에피토프 A (또는 유리, 미표지 A)를 함유하는 분자의 존재는 항원-결합 단백질에 결합된 표지된 A의 양을 감소시키게 될 것이다. 본 명세서에서 사용되는 용어 "특이성"은 다른 항원 대비 한 항원에 우선적으로 결합하는 결합 도메인, 특히 항원-결합 도메인, 면역글로불린, 또는 면역글로불린-유사 도메인, 또는 면역글로불린 단편, 예컨대 VHH 또는 나노바디의 능력을 의미하고, 반드시 고친화성을 의미하는 것은 아니다. 항원-결합 단백질의 추가 예는 또한 합성 결합 단백질, 항체 모방체, 또는 보다 특히 또는 모노바디를 포함한다 (예를 들어, 리뷰는 [Sha et al., 2017] 참조). 이러한 모노바디는 면역글로불린 폴드와 비교하여 그들의 유사한 구형 폴드때문에, 낙타과 단일 도메인 항체 (VHH)와 유사한 방식으로 표적 단백질에 특이적으로 결합하는 결합 단백질을 포함하는 피브로넥틴 III형 도메인으로서 정의된다. 모노바디는 이의 피브로넥틴 III형 도메인에 기인하여, 항체의 CDR과 유사한, 항원-결합 영역을 대표하는 FN3 루프 또는 β 턴이 도메인의 한면 상에서, 그리고 본 발명의 항원-결합 키메라 단백질을 형성하기 위해서, 스캐폴드 단백질을 융합시키기 위한 접근가능한 부위로서 제공될 수 있는 β 턴이 다른 면 상에서 연결되는, 항체의 가변 도메인과 같은, 7개의 β-스트랜드를 포함하는, 면역글로불린-유사 폴드를 의미하는 가장 광범위하게 사용된 비-항체 스캐폴드이다. 본 명세서에서 사용되는 "에피토프"는 폴리펩티드의 항원성 결정부를 의미한다. 에피토프는 에피토프에 고유한 공간적 입체구조로 3개 아미노산을 포함할 수 있다. 일반적으로, 에피토프는 적어도 4개, 5개, 6개, 7개의 이러한 아미노산으로 이루어지고, 보다 일반적으로, 적어도 8개, 9개, 10개의 이러한 아미노산으로 이루어진다. 아미노산의 공간적 입체구조를 결정하는 방법은 당분야에 공지되어 있고, 예를 들어, X-선 결정학 및 다차원 핵 자기 공명법을 포함한다. 본 명세서에서 사용되는 "입체구조적 에피토프"는 폴리펩티드의 폴딩된 3차원 입체구조에 고유한 공간적 입체구조로 아미노산을 포함하는 에피토프를 의미한다. 일반적으로, 입체구조적 에피토프는 선형 서열의 비연속적 아미노산으로 이루어지지만 단백질의 폴딩된 구조에서 함께 있게 된다. 그러나, 입체구조적 에피토프는 또한 폴리펩티드의 폴딩된 3-차원 입체구조에 고유한 (변성 상태에서는 존재하지 않는) 입체구조를 채택하는 아미노산의 선형 서열로 이루어질 수 있다. 단백질 복합체에서, 입체구조 에피토프는 상이한 폴딩된 폴리펩티드의 폴딩 및 고유한 4차원 구조로 그들 회합 시 함께 오게 되는 하나 이상의 폴리펩티드의 선형 서열에서 불연속적인 아미노산으로 이루어진다. 유사하게, 입체구조 에피토프는 함께 모여서 또한 4차원 구조에 고유한 입체구조를 채택하는 하나 이상의 폴리펩티드의 선형 서열로 이루어질 수 있다. 용어 단백질의 "입체구조" 또는 "입체구조적 상태"는 일반적으로 단백질이 임의 시점에 채택할 수 있는 다양한 구조를 의미한다. 당업자는 입체구조 또는 입체구조적 상태의 결정원이 단백질 주변 환경 및 단백질의 아미노산 서열 (변형 아미노산 포함)로 반영되는 단백질의 1차 구조를 포함한다는 것을 인식하게 될 것이다. 단백질의 입체구조 또는 입체구조적 상태는 또한 구조적 특성 예컨대 단백질 2차 구조 (예를 들어, 특히 α-헬릭스, β-시트), 3차 구조 (예를 들어, 폴리펩티드 사슬의 3차원 폴딩), 및 4차 구조 (예를 들어, 다른 단백질 서브유닛과 폴리펩티드 사슬의 상호작용)에 관한 것이다. 폴리펩티드 사슬에 대한 번역후 및 다른 변형 예컨대 리간드 결합, 인산화, 술페이트화, 글리소킬화 또는 특히 소수성 기의 부착은 단백질의 입체구조에 영향을 미칠 수 있다. 뿐만 아니라, 환경 인자, 예컨대 주변 용액의 pH, 염 농도, 이온 강도 및 삼투성, 및 특히 다른 단백질 및 보조인자와의 상호작용은 단백질 입체구조에 영향을 미칠 수 있다. 단백질의 입체구조적 상태는 다른 분자에 대한 결합 또는 활성에 대한 기능적 어세이 또는 특히 다른 방법 중에서도, X-선 결정학, NMR 또는 스핀 표지화와 같은 물리적 방법을 통해서 결정할 수 있다. 단백질 입체구조 및 입체구조적 상태에 관한 일반적인 고찰의 경우에, [Cantor and Schimmel, Biophysical Chemistry, Part I: The Conformation of Biological. Macromolecules,.W.H. Freeman and Company, 1980], 및 [Creighton, Proteins: Structures and Molecular Properties, W.H. Freeman and Company, 1993]를 참조한다.
본 명세서에서 사용되는 용어 "친화성"은 일반적으로 표적 단백질 및 리간드의 평형상태를 그들 결합에 의해 형성되는 복합체의 존재쪽으로 이동시키도록 표적 단백질에 (본 명세서에서 추가로 정의되는 바와 같은) 리간드가 결합하는 정도를 의미한다. 따라서, 예를 들어, 항원-결합 키메라 폴리펩티드 및 리간드가 비교적 동일한 농도로 배합되는 경우에, 고친화성 리간드는 형상태가 고농도의 최종 복합체쪽으로 이동하도록 항원-결합 키메라 폴리펩티드에 결합할 것이다. 해리 상수 Kd는 리간드와 표적 단백질 간 친화성을 설명하는데 일반적으로 사용된다. 전형적으로, 해리 상수는 10-5 M 미만의 값을 갖는다. 바람직하게, 해리 상수는 10-6 M 미만, 보다 바람직하게, 10-7 M 미만이다. 가장 바람직하게, 해리 상수는 10-8 M 미만이다. 리간드와 이의 표적 단백질 간 친화성을 설명하는 다른 방식은 결합 상수 (Ka), 억제 상수 (Ki), 또는 간접적으로 절반의 최대 억제 농도 (IC50) 또는 절단의 최대 유효 농도 (EC50)를 측정하여 리간드의 역가를 평가하는 것에 의한다. 본 발명의 범주 내에서, 용어 "친화성"은 표적 단백질의 (입체구조적) 에피토프에 결합하는 Ig 도메인을 포함하는 항원-결합 키메라 단백질, 보다 특히 상기 Ig 도메인의 CDR 영역을 통해 이의 표적에 결합하는 이의 "기능성"을 보유하는 항원-결합 키메라 단백질 Ig 도메인의 경우에 사용된다는 것을 이해하게 될 것이다.
따라서, 본 명세서에서 사용시, 본 발명의 상황에서, 용어 "기능성 항원-결합 단백질" 또는 "입체구조-선택적 항원-결합 도메인"은 임의로는 입체구조-선택적 방식으로, 이의 표적 단백질과의 결합에서 기능성인 상기 키메라 항원-결합 단백질의 Ig 도메인을 의미한다. 표적 단백질의 특정 입체구조에 선택적으로 결합하는 결합 도메인은 표적이 취할 수 있는 다른 입체구조이외의 입체구조 서브세트의 표적에 더 높은 친화성으로 결합하는 결합 도메인을 의미한다. 당업자는 표적의 특정 입체구조에 선택적으로 결합하는 결합 도메인은 이러한 특정 입체구조로 표적을 안정화시키거나 또는 유지시키게 된다는 것을 인식할 것이다. 예를 들어, 활성 상태의 입체구조-선택적 결합 도메인은 활성 입체구조적 상태의 표적에 우선적으로 결합하게 될 것이고 불활성 입체구조적 상태의 표적에는 적은 정도로 결합하거나 또는 전혀 결합하지 않을 것이고, 따라서 상기 활성 입체구조적 상태에 대해 더 높은 친화성을 가지게 될 것이거나, 또는 그 반대일 수도 있다. 용어 "특이적으로 결합하다", "선택적으로 결합하다", "우선적으로 결합하다", 및 이의 문법적 동등어는 본 명세서에서 상호교환적으로 사용된다. 용어 "입체구조적 특이적" 또는 "입체구조적 선택적"도 역시 본 명세서에서 상호교환적으로 사용된다.
본 명세서에서 사용되는 용어 "항체"는 항원과 특이적으로 결합하는, 면역글로불린 (Ig) 분자 또는 면역글로불린 (Ig) 도메인을 포함하는 분자를 의미한다. 항체는 천연 공급원으로부터 유래되거나 또는 재조합 공급원으로부터 유래되는 온전한 면역글로불린일 수 있고, 온전한 면역글로불린의 면역반응성 부분일 수도 있다. 항체는 전형적으로 면역글로불린 분자의 사량체이다. 본 명세서에서 사용되는 용어 "면역글로불린 (Ig) 도메인"은 항체 사슬의 구형 영역, 또는 이러한 구형 영역으로 본질적으로 이루어진 폴리펩티드를 의미한다. 면역글로불린 도메인은 그들이 임의로는 보존된 디술피드 결합에 의해 안정화되는, 2개 β-시트로 배열된 약 7개 내지 9개의 역평행 β-스트랜드의 2층 샌드위치로 이루어지는, 항체 분자를 특징으로 하는 면역글로불린 폴드 (본 명세서에서 Ig 폴드라고 명명)를 보유하는 것을 특징으로 한다. 용어 "면역글로불린 (Ig) 도메인"은 "면역글로불린 불변 도메인", 및 "면역글로불린 가변 도메인" ("IVD"로 축약)을 포함하고, 후자는 각각 "프레임워크 영역 1" 또는 "FR1"; "프레임워크 영역 2" 또는 "FR2"; "프레임워크 영역 3" 또는 "FR3"; 및 "프레임워크 영역 4" 또는 "FR4"라고 당분야 및 하기 본 명세서에서 언급하는 4개의 "프레임워크 영역"으로 본질적으로 이루어진 면역글로불린 도메인을 의미하고, 프레임워크 영역은 각각 "상보성 결정 영역 1" 또는 "CDR1"; "상보성 결정 영역 2" 또는 "CDR2"; 및 "상보성 결정 영역 3" 또는 "CDR3"으로서 당분야 및 이하 본 명세서에서 언급되는, 3개의 "상보성 결정 영역" 또는 "CDR"이 개재된다. 따라서, 면역글로불린 가변 도메인의 일반 구조 또는 서열은 다음과 같이 표시될 수 있다: FR1 - CDR1 - FR2 - CDR2 - FR3 - CDR3 - FR4. 항원-결합 부위를 보유하여 항원에 대한 항체의 특이성을 부여하는 것은 면역글로불린 가변 도메인(들) (IVD)이다. IMGT 분류에 따라서, 면역글로불린 가변 도메인 또는 V-도메인은 약 100 AA을 포함하고 β-턴 (AB,CC', C"D, DE, 및 EF)에 의해 연결된 9개 역평행 베타-스트랜드 (A,B,C,C', C", D, E, F, 및 G), 및 3개 루프 (또는 CDR) (BC, C'C", 및 FG)로 만들어져서, 2개 시트의 샌드위치 [ABED] [GFCC'C"]를 형성한다 (도 25, [Lefranc, 2014]로부터 개조). 시트는 소수성 코어를 제공하는 소수성 상호작용을 통해 서로에 대해 밀접하게 팩킹되고, β-스트랜드 B (제1 시트) 내 제1의 고도로 보존된 시스테인 (제1-Cys) 및 β-스트랜드 F (제2 시트) 내 제2의 동일하게 보존된 시스테인 (제2-Cys) 간 디술피드 브릿지에 의해 함께 연결된다. 본 명세서에서 사용되는 IMGT® 정의 시스템의 고유 번호매김은 문헌에 기술된 CDR과 대조적으로 정확하고 명확하게 한정한 CDR-IMGT를 제공한다. 대안적인 변호매김은 예를 들어, Kabat (Kabat et al., 1991) 또는 Chothia (Chothia and Lesk, 1987)를 참조한다. V-도메인의 경우에, CDR1-IMGT는 위치 27-38, CDR2-IMGT는 위치 56-65, 그리고 CDR3-IMGT는 위치 105-117을 포괄한다 (Lefranc, 2014). 본 발명의 Ig 도메인의 "노출된 영역" 또는 "노출된 루프"는 단백질의 표면에 노출된 영역 또는 폴리펩티드 사슬을 의미한다. Ig 도메인의 경우에, 상기 노출된 영역 또는 루프는 바람직하게는 β-턴, 가장 바람직하게는 Lefranc (2014)가 정의한 바와 같은 β-턴이다. CDR가 또한 IMGT 정의에 따라 "루프"로 간주되지만, 이것은 아마도 항원-결합의 파괴를 초래할 가능성이 높으므로, 기능성 항원-결합 키메라 단백질을 수득할 수 없게 하기 때문에, 스캐폴드의 융합을 위한 접근가능한 부위를 갖는, 본 발명의 "노출된 영역"에 대한 바람직한 후보로서 간주되지 않는다.
본 발명의 "면역글로불린 도메인"은 또한 용어 "단일 가변 도메인"과 동등한 "면역글로불린 단일 가변 도메인" ("ISVD"로 축약)을 포함하고, 항원 결합 부위가 존재하고, 단일 면역글로불린 도메인에 의해 형성되는 분자를 정의한다. 이것은 이것은 "통상의" 면역글로불린 또는 그들 단편을 제외하고 면역글로불린 단일 가변 도메인을 설정하며, 2개 면역글로불린 도메인, 특히 2개 가변 도메인은 상호작용하여 항원 결합 부위를 형성한다. 전형적으로, 통상의 면역글로불린에서, 중쇄 가변 도메인 (VH) 및 경쇄 가변 도메인 (VL)은 상호작용하여 항원 결합 부위를 형성한다. 이러한 경우에서, VH 및 VL 둘 모두의 상보성 결정 영역 (CDR)은 항원 결합 부위에 기여하게 될 것이고, 다시 말해 총 6개 CDR이 항원 결합 부위 형성에 관여하게 될 것이다. 상기 정의의 관점에서, 통상의 4개-사슬 항체 (예컨대 IgG, IgM, IgA, IgD 또는 IgE 분자; 당분야에 공지) 또는 Fab 단편, F(ab')2 단편, Fv 단편 예컨대 디술피드 연결된 Fv 또는 scFv 단편, 또는 이러한 통상의 4-사슬 항체 유래 디아바디 (모두 당분야에 공지됨)의 항원-결합 도메인은, 이들 경우에, 항원의 개별 에피토프의 결합이 보통은 하나 (단일)의 면역글로불린 도메인에 의해서가 아니라 (회합된) 면역글로불린 도메인 예컨대 경쇄 및 중쇄 가변 도메인의 쌍에 의해서, 즉 개별 항원의 에피토프에 함께 결합하는 면역글로불린 도메인의 VH-VL 쌍에 의해 일어나므로, 일반적으로 면역글로불린 단일 가변 도메인으로서 간주되지 않을 것이다. 대조적으로, 면역글로불린 단일 가변 도메인은 추가의 면역글로불린 가변 도메인과의 쌍형성없이 항원의 에피토프에 특이적으로 결합할 수 있다. 면역글로불린 단일 가변 도메인의 결합 부위는 단일 VH/VHH 또는 VL 도메인에 의해 형성된다. 그런 이유로, 면역글로불린 단일 가변 도메인의 항원 결합 부위는 3개 이하의 CDR에 의해 형성된다. 이와 같이, 단일 가변 도메인은 단일 항원 결합 유닛 (즉, 단일 항원 결합 도메인이 기능성 항원 결합 유닛을 형성하기 위해 다른 가변 도메인과 상호작용할 필요가 없도록, 단일 가변 도메인으로 본질적으로 이루어진 기능성 항원 결합 유닛)을 형성할 수 있는 한, 경쇄 가변 도메인 서열 (예를 들어, VL-서열) 또는 이의 적합한 단편일 수 있거나; 또는 중쇄 가변 도메인 서열 (예를 들어, VH-서열, 또는 VHH 서열) 또는 이의 적합한 단편일 수 있다. 본 발명의 일 실시형태에서, 면역글로불린 단일 가변 도메인은 중쇄 가변 도메인 서열 (예를 들어, VH-서열)이고; 보다 특히, 면역글로불린 단일 가변 도메인은 통상의 4-사슬 항체로부터 유래된 중쇄 가변 도메인 서열일 수 있거나 또는 중쇄 항체로부터 유래된 중쇄 가변 도메인 서열일 수 있다. 예를 들어, 면역글로불린 단일 가변 도메인은 (단일) 도메인 항체 (또는 (단일) 도메인 항체로서 사용에 적합한 아미노산 서열), "dAb" 또는 dAb (또는 dAb로서 사용에 적합한 아미노산 서열) 또는 나노바디 (본 명세서에 정의된 바와 같고, 제한없이 VHH를 포함); 다른 단일 가변 도메인, 또는 이의 어느 하나의 임의의 적합한 단편일 수 있다. 특히, 면역글로불린 단일 가변 도메인은 나노바디 (본 명세서에 정의된 바와 같음) 또는 이의 적합한 단편일 수 있다. 주: Nanobody®, Nanobodies® 및 Nanoclone® 은 Ablynx N.V의 등록 상표명이다. 나노바디의 일반적인 설명의 경우에, 하기 추가 설명을 비롯하여, 예컨대, 예를 들어 WO2008/020079에 기술된 바와 같은, 본 명세서에 인용된 종래 기술을 참조한다.
본 명세서의 면역글로불린 도메인은 또한 VHH, VHH 도메인, VHH 항체 단편, 및 VHH 항체로도 알려진, "VHH 도메인"을 포함하고, 본래는 "중쇄" 항체 (즉, "경쇄가 없는 항체"; Hamers-Casterman et al (1993) Nature 363: 446-448)의 항원-결합 면역글로불린 (Ig) (가변) 도메인으로서 기술되었었다. 용어 "VHH 도메인"은 이들 가변 도메인을 통상의 4-사슬 항체에 존재하는 중쇄 가변 도메인 (본 명세서에서 "VH 도메인"이라고 함) 및 통상의 4-사슬 항체에 존재하는 경쇄 가변 도메인 (본 명세서에서 "VL 도메인"이라고 함)과 구별하기 위해 선택되었다. VHH 및 나노바디의 추가 설명을 위해서, Muyldermans의 리뷰 논문 (Reviews in Molecular Biotechnology 74: 277-302, 2001)을 비롯하여, 일반 배경 기술로서 언급된 하기 특허 출원을 참조한다: Vrije Universiteit Brussel의 WO 94/04678, WO 95/04079 및 WO 96/34103; Unilever의 WO 94/25591, WO 99/37681, WO 00/40968, WO 00/43507, WO 00/65057, WO 01/40310, WO 01/44301, EP 1134231 및 WO 02/48193; Vlaams Instituut voor Biotechnologie (VIB)의 WO 97/49805, WO 01/21817, WO 03/035694, WO 03/054016 및 WO 03/055527; Algonomics N.V. 및 Ablynx N.V.의 WO 03/050531; National Research Council of Canada의 WO 01/90190; Institute of Antibodies의 WO 03/025020 (= EP 1433793)를 비롯하여; Ablynx N.V.의 WO 04/041867, WO 04/041862, WO 04/041865, WO 04/041863, WO 04/062551, WO 05/044858, WO 06/40153, WO 06/079372, WO 06/122786, WO 06/122787 및 WO 06/122825, 및 Ablynx N.V의 추가의 공개 특허 출원. 이들 참조에 기술된 바와 같이, 나노바디 (특히 VHH 서열 및 부분적으로 인간화된 나노바디)는 특히 하나 이상의 프레임워크 서열 내 하나 이상의 "홀마크 잔기"의 존재를 특징으로 할 수 있다. 나노바디의 인간화 및/또는 낙타화를 비롯하여, 나노바디의 반감기를 증가시키기 위한 다른 변형, 부분 또는 단편, 유도체 또는 "나노바디 융합체", 다가 구성체 (링커 서열의 일부 비제한적인 예 포함) 및 상이한 변형 및 그들 제조를 포함한 나노바디의 추가 설명은 예를 들어 WO 08/101985 및 WO 08/142164에서 확인할 수 있다.
"Dab", "도메인 항체", 및 "dAb"로도 공지된 "도메인 항체" (용어 "도메인 항체" 및 "dAb"는 GlaxoSmithKline group of companies의 상표명으로서 사용됨)는 예를 들어 EP 0368684, Ward 등 (Nature 341: 544-546, 1989), Holt 등 (Tends in Biotechnology 21: 484-490, 2003) 및 WO 03/002609를 비롯하여 예를 들어 WO 04/068820, WO 06/030220, WO 06/003388 및 Domantis Ltd의 다른 공개 특허 출원에 기술되어 있다. 도메인 항체는 본질적으로 비낙타과 포유동물, 특히 인간 4-사슬 항체의 VH 또는 VL 도메인에 상응한다. 단일 항원 결합 도메인으로서, 즉 각각 VL 또는 VH 도메인과의 쌍형성없이 에피토프에 결합시키기 위해서, 이러한 항원 결합 성질을 위한 특이적 선택은 예를 들어 인간 단일 VH 또는 VL 도메인 서열의 라이브러리 사용을 요구한다. 도메인 항체는 VHH 처럼, 대략 13 kDa 내지 대략 16 kDa의 분자량을 가지며, 완전한 인간 서열로부터 유래된다면, 예를 들어 인간에서 치료적 용도를 위해 인간화를 요구하지 않는다. 단일 가변 도메인은 상어의 소정 종으로부터 유래될 수 있다는 것을 역시 유의해야 한다 (예를 들어, 소위 "IgNAR 도메인", 예를 들어 WO 05/18629 참조).
면역글로불린 단일 가변 도메인 예컨대 도메인 항체 및 나노바디 (VHH 도메인 및 인간화 VHH 도메인 포함)는 그들 생산 시 성숙한 거대분자를 의미하지만, 그 변경이 개별 부모 분자와 비교하여 이의 개별 항원에 대한 최종 면역글로불린 단일 가변 도메인의 개선된 친화성을 야기시키는, 하나 이상의 변경을 하나 이상의 CDR의 아미노산에 도입시켜서 친화성 성숙화를 더 수행시킬 수 있다. 본 발명의 친화성-성숙된 면역글로불린 단일 가변 도메인 분자는 예를 들어, Marks 등 (Biotechnology 10:779-783, 1992), Barbas 등 (Proc. Nat. Acad. Sci, USA 91: 3809-3813, 1994), Shier 등 (Gene 169: 147-155, 1995), Yelton 등 (Immunol. 155: 1994-2004, 1995), Jackson 등 (J. Immunol. 154: 3310-9, 1995), Hawkins 등 (J. MoI. Biol. 226: 889 896, 1992), Johnson 및 Hawkins (Affinity maturation of antibodies using phage display, Oxford University Press, 1996)이 기술한 바와 같이, 당분야에 공지된 방법으로 제조할 수 있다. 면역글로불린 단일 가변 도메인 예컨대 도메인 항체 또는 나노바디로부터 출발하여, 폴리펩티드의 디자인/선택 및/또는 제조 방법은 또한 본 명세서에서 상기 면역글로불린 단일 가변 도메인의 "포맷팅 (formatting)"이라고 하며; 폴리펩티드의 일부를 만드는 면역글로불린 단일 가변 도메인은 상기 폴리펩티드"의 포맷으로" 되거나 또는 포맷된다고 한다. 면역글로불린 단일 가변 도메인이 포맷될 수 있는 방법의 예 및 예를 들어 글리코실화를 피하기 위한 이러한 포맷의 예는 본 명세서의 개시를 기반으로 당업자에게 자명해 질 것이다.
면역글로불린 단일 가변 도메인 예컨대 도메인 항체 및 나노바디 (VHH 도메인 포함)는 인간화될 수 있고, 다시 말해서 가장 가까운 인간 배선 서열과의 서열 동일성 정도를 증가시킬 수 있다. 특히, 인간화 면역글로불린 단일 가변 도메인, 예컨대 나노바디 (VHH 도메인 포함)는 이전 단락에서 일반적으로 정의된 바와 같이, 그러나 인간화 치환 (본 명세서에 정의된 바와 같음)이고/이거나 그에 상응하는 적어도 하나의 아미노산 잔기 (및 특히, 적어도 하나의 프레임워크 잔기)가 존재하는 면역글로불린 단일 가변 도메인일 수 있다. 잠재적으로 유용한 인간화 치환은 천연 발생 VHH 서열의 프레임워크 영역의 서열을 하나 이상의 밀접하게 관련된 인간 VH 서열의 상응하는 프레임워크 서열과 비교하여 확인할 수 있고, 그 이후에 이렇게 결정된 하나 이상의 잠재적으로 유용한 인간화 치환 (또는 이의 조합)이 (본 명세서에 더욱 기술된 바와 같이, 그 자체로 공지된 임의 방식으로) 상기 VHH 서열에 도입될 수 있고 최종 인간화 VHH 서열은 표적에 대한 친화성, 안정성, 발현 수준 및 용이함, 및/또는 다른 바람직한 성질에 대해 시험될 수 있다. 이러한 방식으로, 제한된 정도의 시행착오를 통해서, 다른 적합한 인간화 치환 (또는 이의 적합한 조합)은 당업자가 결정할 수 있다. 또한, 이전에 기술된 것을 기반으로, 면역글로불린 단일 가변 도메인, 예컨대 나노바디 (VHH 도메인 포함)(의 프레임워크 영역)는 부분적으로 인간화될 수 있거나 또는 완전히 인간화될 수 있다. 그들의 가장 넓은 의미로, 면역글로불린 단일 가변 도메인을 비롯하여, 본 발명의 항원-결합 키메라 단백질은 특별한 생물학적 공급원 또는 특별한 제조 방법에 국한되지 않는다는 것을 유의해야 한다. 예를 들어, 면역글로불린 단일 가변 도메인, 특히 본 발명의 항원-결합 키메라 단백질은 일반적으로 다음에 의해 수득될 수 있다: (1) 천연 발생 중쇄 항체의 VHH 도메인의 단리, 및 항원-결합 키메라 단백질을 수득하기 위한 서열의 추가 조작; (2) 항원-결합 키메라 단백질의 상기 스캐폴드 단백질에 융합된 포맷으로, 천연 발생 VHH 도메인을 코딩하는 뉴클레오티드 서열의 발현; (3) 천연 발생 VHH 도메인 및/또는 스캐폴드 단백질의 "인간화" 또는 이러한 인간화 VHH 도메인 및/또는 스캐폴드 단백질, 및/또는 항원-결합 키메라 단백질을 코딩하는 핵산의 발현; (4) 이미 존재하는 항체와의 결합을 감소시키기 위해 천연 발생 VHH 도메인의 "돌연변이" 또는 천연 VHH와 비교하여 이미 존재하는 항체에 대해 감소된 결합을 갖는 본 발명의 항원-결합 키메라 단백질을 수득하기 위해 스캐폴드 단백질 융합 부위의 조작; (5) 상기 스캐폴드 단백질과의 후속 융합을 위해, 임의 동물 종, 특히 포유동물 종, 예컨대 인간 유래 천연 발생 VH 도메인의 "낙타화"; 또는 (6) 그 자체로 공지된 단백질, 폴리펩티드 또는 다른 아미노산 서열을 제조하기 위한 합성 또는 반합성 기술. 적합한 돌연변이, 특히 치환은 이미 존재하는 항체와의 결합이 감소된 폴리펩티드를 생성시키기 위해 인간화 동안 (예를 들어, WO 2012/175741 및 WO2015/173325 참조), 예를 들어 위치: 11, 13, 14, 15, 40, 41, 42, 82, 82a, 82b, 83, 84, 85, 87, 88, 89, 103, 또는 108 중 적어도 하나에 도입될 수 있다. 대안적으로, 이미 존재하는 항체 결합에 민감한 위치는 항원-결합 키메라 단백질과의 결합을 방해하도록 스캐폴드 단백질과의 융합체를 디자인하여 입체적으로 차폐될 수 있다.
면역글로불린 도메인, 또는 Ig 수퍼패밀리 또는 "Ig-유사 도메인"에 대한 대안은 사실 각각 면역글로불린-도메인 및 Ig 폴드와 매우 유사한 서열 및 구조 내에 존재하는 도메인으로 구성된, 많은 단백질에 존재하지만, 면역글로불린 항체의 도메인 그 자체와 구별하기 위해 Ig-유사 도메인이라고 한다. 항원 인식에 특별한 것이라기 보다는, Ig 폴드가 상호작용을 매개하는데 특히 좋았고 널리 사용된 것으로 확인되었다. 면역글로불린-유사 도메인은 서열 패턴에 따라서 V, C1, C2, 및 I로 분류될 수 있다. 예를 들어 모노바디는 면역글로불린-유사 도메인을 포함한다.
본 명세서에서 사용되는 용어 "검출가능한 표지", "표지화" 또는 "태그"는 본 명세서에 기술된 단리 또는 정제된 (폴리-)펩티드의 검출, 가시화, 및/또는 단리, 정제 및/또는 고정화를 가능하게 하는 검출가능한 표지 또는 태그를 의미하고, 이들 목적을 위해 당분야에 공지된 임의의 표지/태그를 포함하는 것을 의미한다. 특히 바람직한 것은 친화성 태그, 예컨대 키틴 결합 단백질 (CBP), 말토스 결합 단백질 (MBP), 글루타티온-S-트랜스퍼라제 (GST), 폴리(His) (예를 들어, 6x His 또는 His6), Strep-태그®, Strep-태그 II® 및 Twin-Strep-태그®; 가용화 태그, 예컨대 티오리독신 (TRX), 폴리(NANP) 및 SUMO; 크로마토그래피 태그, 예컨대 FLAG-태그; 에피토프 태그, 예컨대 V5-태그, myc-태그 및 HA-태그; 형광성 표지 또는 태그 (즉, 형광색소/형광단), 예컨대 형광성 단백질 (예를 들어, GFP, YFP, RFP 등) 및 형광성 염료 (예를 들어, FITC, TRITC, 쿠마린 및 시아닌); 발광성 표지 또는 태그, 예컨대 루시퍼라제; 및 (다른) 효소 표지 (예를 들어, 퍼옥시다제, 알칼리 포스파타제, 베타-갈락토시다제, 우레아제 또는 글루코스 옥시다제)이다. 또한 임의의 전술한 표지 또는 태그의 조합이 포함된다. 항원-결합 키메라 단백질은 예를 들어 반감기 연장 모듈에 융합될 수 있거나 또는 접합될 수 있거나, 또는 그 자체로 반감기 연장 모듈로서 기능할 수 있다. 이러한 모듈은 당업자에게 공지되어 있고 예를 들어 알부민, 알부민-결합 도메인, 면역글로불린의 Fc 영역/도메인, 면역글로불린-결합 도메인, FcRn-결합 모티프 및 중합체를 포함한다. 특히 바람직한 중합체는 폴리에틸렌 글리콜 (PEG), 히드록시에틸 전분 (HES), 히알루론산, 폴리시알산 및 PEG-모방체 펩티드 서열을 포함한다. 단리된 (폴리-)펩티드의 응집을 예방하는 변형이 또한 당업자에게 공지되어 있고 예를 들어 하나 이상의 친수성 아미노산으로 하나 이상의 소수성 아미노산, 바람직하게 표면-노출 소수성 아미노산의 치환을 포함한다. 일 실시형태에서, 단리된 (폴리-)펩티드 또는 이의 면역원성 변이체 또는 임의의 전술한 것의 면역원성 단편은 친수성 아미노산으로 최대 10, 9, 8, 7, 6, 5, 4, 3 또는 2, 바람직하게 5, 4, 3 또는 2개 소수성 아미노산, 바람직하게 표면-노출 소수성 아미노산의 치환을 포함한다. 바람직하게, 단리된 (폴리-)펩티드의 다른 성질, 예를 들어 이의 면역원성, 항원-결합 기능성은 이러한 치환에 의해 약화되지 않는다.
본 발명의 목적을 위해서 "환자" 또는 "대상체"는 인간 및 다른 포유동물, 예를 들어 동물 예컨대 설치류, 토끼, 소, 양, 말, 개, 고양이, 라마, 돼지 또는 인간이외의 영장류 (예를 들어, 원숭이)를 포함한, 임의의 유기체, 예컨대 척추동물, 특히 임의 포유동물에 관한 것이다. 설치류는 마우스, 래트, 햄스터, 기니 피크 또는 친칠라일 수 있다. 일 실시형태에서, 대상체는 인간, 래트 또는 인간이외의 영장류이다. 바람직하게, 대상체는 인간이다. 일 실시형태에서, 대상체는 본 명세서에서 "환자"라고도 지칭되는, 질환 또는 장애를 갖거나 또는 갖는 것으로 의심되는 대상체이다.
본 명세서에서 사용되는 용어 "예방하는"은 (예를 들어, 예방학적 처치를 통해서) 질환 또는 장애의 개시를 중지/억제하는 것을 의미할 수 있다. 또한 (예를 들어, 예방적 처치를 통해서) 개시의 지연, 증상 빈도의 감소, 또는 질환 또는 장애와 연관된 증상의 중증도 감소를 의미할 수도 있다. 용어 "치료" 또는 "치료하는" 또는 "치료하다"는 상호교환적으로 사용될 수 있고 징후, 증상, 장애, 병태 또는 질환의 진행 또는 중증도를 완화, 방해, 중지, 통제, 중단, 감소 또는 반전시키는 치료적 중재술로 정의되지만, 반드시 전체 질환-관련 징후, 증상, 병태 또는 장애의 완전한 제거를 포함하지는 않는다.
상세한 설명
강성 융합된 항원-결합 도메인-함유 키메라 단백질의 디자인을 위한 신규 개념이 본 명세서에서 제공된다. 신규 항원-결합 키메라는 항원-결합 도메인 및 스캐폴드 단백질 간에 융합체 생성을 통해 기원되고, 스캐폴드 단백질은 항원-결합 단백질의 토폴로지를 방해하고, 이것은 비융합된 항원-결합 도메인과 비교하여 유사한 방식으로 항원 또는 표적 단백질에 특이적으로 결합하도록 기능하고 이의 전형적인 폴드를 여전히 놀랍게도 나타낸다. 이러한 개념은 보다 강성의 비가요성 연결을 입증하는 신규의 고유한 항원-결합 키메라를 생성시키기 위해서, 스캐폴드 단백질에 융합되는 면역글로불린 또는 면역글로불린-유사 도메인의 고유한 특성을 적용하는 특정 예를 중심으로 구축된다. 전형적으로 그들 천연 상태에서 비결합되어 있는, 폴리펩티드 성분의 전형적인 접합은 하나의 연속적인 폴리펩티드를 형성하기 위해 펩티드 연결을 통해서 또는 직접적으로 그들 각각의 아미노 (N-) 및 카르복실 (C-) 말단을 연결하여 수행된다. 이들 융합은 종종 가요성 링커를 통해 만들어지거나 또는 적어도 가요성 방식으로 연결되며, 이것은 융합 파트너가 서로에 대해 안정한 위치 또는 입체구조로 존재하지 않는다는 것을 의미한다. 도 1에 표시된 바와 같이, N-말단 및 C-말단을 통해서 단백질을 연결시킴으로서, 단순한 선형 쇄상화, 융합이 용이하지만, 안정하지 않을 수 있어서, 분해되는 경향이 있고, 따라서 일부 경우에 치료 용도로 적합하지 않다. 다른 한편으로, 둘 이상의 단백질의 주요 토폴로지 내에서 하나 이상의 융합점 또는 연결점을 갖는, 본 명세서에 제시되는 강성 키메라/융합 단백질은 적어도 하나의 비가요성 융합점을 보유한다 (도 1). 본 발명은 고유하게 항원-결합 키메라 단백질을 포함하고, 여기서 이의 융합 파트너에 반대인 한 단백질의 회전 또는 휘어짐이 몇몇 융합의 생성을 통해 금지된다. 동일 키메라 내 몇몇 융합체의 존재를 통해서, 본 발명의 신규 키메라의 개선된 강성이 수득되고, 이의 항원-결합 도메인 폴딩을 비롯하여, 이의 표적과 결합하는 이의 기능을 여전히 보유할 수 있는 융합을 허용하는 융합 부위의 완벽한 디자인의 결과이다. 단백질의 강성은 사실 신규 키메라의 경우에, 사실 단백질의 (3차) 구조에 내재한다. 증가된 강성은 기지 단백질 폴드의 토폴로지를 변경시켜 얻을 수 있는 것으로 확인되었다 (King et al., 2015). 본 발명의 항원-결합 키메라 단백질에서 생성되는 융합의 강성은 그러한 이유로 표적을 "지향" 또는 "고정"시키도록 충분하게 강한 강성을 제공하지만, 대부분의 강성은 여전히 표적 또는 항원 그 자체의 강성보다는 낮을 것이다. 그러나, 본 발명의 강성 항원-결합 키메라 단백질이 여전히 이의 항원-결합 기능성을 유지한다는 사실은 주요 토폴로지의 파괴가 도메인 또는 단백질 폴딩의 변화를 초래할 수 있어서, 3차 토폴로지 및 항원-결합에 영향을 미치므로, 놀라운 관찰이다. 주요 토폴로지의 파괴가 항원-결합에 영향을 미치지 않고, 항체 및 그들 표적 단백질을 포함한 분야에서 새로운 방안을 열어주었다는 것을 본 명세서에서 입증하였다. 본 발명은 단백질의 비공유 표적화를 허용하기 위해, 고친화성 및/또는 입체구조-선택적 항원-결합 잠재성, 및 고유한 차세대 융합 기술의 제공의 신규한 조합에 관한 것이다. 이러한 신규 유형의 항원-결합 키메라 단백질은 키메라의 생성에서 사용되는 스캐폴드 단백질 유형에 따라서 몇몇 가치있는 적용분야에서 도움이 된다. 예를 들어, 소형 단백질에 대해 고분해능 구조를 수득하기 위해 방지되는, 단편의 제한된 정렬, 바람직한 배향, 및 입자 크기 제한의 반복된 문제들을 해결함으로써, Cryo-EM 및 X-선 결정학을 용이하게 하는, 구조 생물학에서의 간편한 사용이라는 많은 장점들이 존재한다. 이러한 차세대 융합 기술을 사용하여, 강성 샤페론 도구가 이제 이용가능하고 또한 예컨대 신규 화합물의 구조-기반 스크리닝 및 구조-기반 약물 디자인을 통해서 개선되고, 보다 확고한 치료 및 진단 분자를 개발하기 위해 도구를 사용하기 위한 완전한 제공이 되므로, 구조 생물학에서 빠른 진보를 예상할 수 있다. 사실, 항원 또는 표적의 입체구조-선택적 인식이 사용될 때, 이들 도구는 기능적 입체구조, 예컨대 활성 입체구조, 보다 특히 효현제, 부분 효현제 또는 편향 효현제 입체구조로 표적을 안정화시키는 결합 모드에서도 역시 적용가능하다. 뿐만 아니라, FDA가 승인한 Enbrel® (종양 괴사 인자/Fc-IgG1), 및 Nplate® (트롬보포이어틴/Fc-IgG1)를 포함한 융합 단백질 약물의 몇몇 예가 공지되어 있다. 단일 도메인 항체의 치료적 개발 관점에서, 이미 존재하는 항체와의 결합이 일반적으로 알려진 장애였고, 이를 위해서 본 발명의 항원-결합 키메라가 독특한 해결책을 제공할 수 있다. 또한, 본 발명의 항원-결합 키메라 단백질은 생물제제 분야에서 새로운 해결법 및 또한 작물 보호 산업에서 보호제를 제공한다. 해충 및 병원체 필수 분자에 대해 유도된 낙타과 결합 도메인의 개발은 야생동물, 벌, 재배자 및 소비자에 대한 효과 위험성을 최소화하는 조합된 매우 특이적인 작용 방식을 입증한다. 본 발명의 항원-결합 키메라로부터 개발된 이러한 보호제는 대규모 제조의 비용 효율적인 방식을 유지하면서, 추가 장점을 제공한다.
본 발명의 항원-결합 키메라 단백질의 추가 적용분야는 경로-특이적 효현제의 스크리닝을 가능하게 하는 약물가능한 신호전달 입체구조를 특이적으로 안정화시키는 것으로 기술된 Nb를 기반으로 하는 항원-결합 도메인에서 확인된다.
생명공학에서 이러한 이술의 빠른 진보로, 본 발명이 현행 단백질 약물의 개선된 성능 및 신규 단백질 치료제의 생성에 영향을 미칠 것이라는 것을 예측가능하다.
제1 양상에서, 본 발명은 스캐폴드 단백질과 융합된 항원-결합 도메인을 포함하는 항원-결합 키메라 단백질에 관한 것으로서, 상기 스캐폴드 단백질은 상기 항원-결합 도메인에 결합되어서 상기-항원 결합 도메인 폴드에서 접근가능한 적어도 하나 이상의 아미노산 부위에서 융합을 통해 상기 항원-결합 도메인의 토폴로지를 방해한다. 상기 항원-결합 키메라 단백질은 이의 천연 또는 야생형 형태인, 상기 스캐폴드 단백질에 융합되지 않은 항원-결합 도메인과 비교하여 유사한 방식으로 이의 항원-결합 기능성을 보유한다는 것을 더욱 특징으로 한다. 그래서 일 실시형태에서, 상기 항원-결합 키메라 단백질은 입체구조-특이적 결합 도메인이다. 일 실시형태는 항원-결합 키메라 단백질을 제공하고 항원-결합 도메인은 스캐폴드 단백질이 항원-결합 도메인의 토폴로지를 "방해"하는 방식으로 스캐폴드 단백질과 융합된다. 일반적으로, 단백질의 "토폴로지 (topology)"는 3차원 공간에서 서로에 대한 규칙적인 2차 구조의 배향을 의미한다. 단백질 폴드는 폴리펩티드 사슬 토폴로지에 의해 주로 정의된다 (Orengo et al., 1994). 그래서 가장 기본적인 수준에서 '1차 토폴로지'는 단백질 폴드 인식 모티프, 및 그리하여 2차 및 3차 단백질/도메인 폴딩을 담당하는 2차 구조 구성요소 (SSE)의 서열로서 정의된다. 단백질 구조의 관점에서, 진짜 또는 1차 토폴로지는 SSE의 서열이고, 다시 말해서, 단백질 사슬의 N-말단부 및 C-말단부를 유지할 수 있고, 똑바로 당길 수 있다고 상상한다면, 토폴로지는 단백질이 어떻게 폴딩되었든지 변화되지 않는다. 단백질 폴드는 단백질의 1차 및 3차 구조와 유사하게, 3차 토폴로지로서 설명된다 (Martin, 2000). 그리하여, 본 발명의 항원-결합 키메라 단백질의 항원-결합 도메인은 스캐폴드 단백질 융합을 도입시켜, 이의 1차 토폴로지를 방해하지만, 예상치 않게도 상기 항원-결합 도메인은 이의 3차 구조를 유지하여 이의 기능성 항원-결합 능력을 보유할 수 있다.
"스캐폴드 단백질"은 본 명세서에 기술된 바와 같이, 다른 단백질, 특히 항원-결합 도메인과 융합을 허용하는 구조를 갖는 임의 유형의 단백질을 의미한다. 이러한 "스캐폴드", "접합" 또는 "융합 파트너" 단백질은 바람직하게 항원-결합 도메인에 대한 융합점으로서 절단하기 위한 적어도 하나의 접근가능한 부위를 제공하기 위해 이의 3차 구조에 적어도 하나의 노출 영역을 갖는다. 스캐폴드 폴리펩티드는 항원-결합 도메인과 조립하는데 사용되어서, 질량의 증가, 대칭성 제공, 및/또는 표지 제공, 및/또는 추가 항원-결합 부위 부가, 및/또는 반감기 증가, 및/또는 면역원성 감소, 및/또는 항원-결합 도메인에 대한 기능성 개성 또는 부가되도록 도킹된 구성의 항원-결합 키메라 단백질을 생성시킨다. 그래서, 사용되는 스캐폴드 단백질의 유형에 따라서, 최종 항원-결합 키메라 단백질의 상이한 목적이 예상된다. 스캐폴드 단백질의 유형 및 속성은 이것이 임의 단백질일 수 있다는 점에서 무관하고, 이의 구조, 크기, 기능 또는 존재에 따라서, 본 발명의 항원-결합 키메라 단백질에서처럼 상기 항원-결합 도메인과 융합된 스캐폴드 단백질은 상이한 적용 분야에서 사용될 것이다. 스캐폴드 단백질의 구조는 최종 키메라 구조에 영향을 미치게 되므로, 당업자는 스캐폴드 단백질에 대한 기지의 구조 정보를 제공해야 하고 스캐폴드 선택 시 합리적인 기대를 고려해야 한다. 스캐폴드 단백질의 본 출원의 실시에에 제공되고, 효소, 막 단백질, 수용체, 어댑터 단백질, 샤페론, 전사 인자, 핵 단백질, 항원-결합 단백질 자체, 예컨대 특히 나노바디인 비제한적인 수의 단백질이 본 발명의 항원-결합 키메라 단백질을 생성시키기 위한 스캐폴드 단백질로서 적용될 수 있다. 바람직한 실시형태에서, 상기 스캐폴드 단백질의 3D-구조는 당업자에게 공지되어 있거나 또는 예측할 수 있어서, 항원-결합 도메인과 융합시키기 위한 접근가능한 부위는 상기 당업자가 결정할 수 있다.
신규 키메라 단백질은 접합부가 키메라 단백질 구조 내 가요성의, 느슨하고 약한 연결/영역인 것을 피하는 독특한 방식으로 융합된다. 2개 폴리펩티드를 연결하거나 또는 융합시키는 편리한 방법은 고전적인 기지 방식으로, 제2 폴리펩티드를 코딩하는 제2 폴리뉴클레오티드에 작동적으로 연결된 제1 폴리펩티드를 코딩하는 제1 폴리뉴클레오티드를 포함하는, 재조합 핵산 분자로부터 융합 단백질로서 그들을 발현시키는 것에 의한다. 그러나, 본 발명의 재조합 핵산 분자에서, 상기 스캐폴드에 의한 항원-결합 도메인의 토폴로지의 방해가 또한 상기 항원-결합 키메라 단백질을 발현시키는 유전자 융합 디자인에 반영된다. 그래서, 일 실시형태에서, 항원-결합 키메라 단백질은 항원-결합 도메인을 코딩하는 유전자의 일부, 및 스캐폴드 단백질을 코딩하는 유전자의 일부를 조합하여 형성된 키메라 유전자에 의해 코딩되고, 상기 코딩된 스캐폴드 단백질은 코딩된 펩티드 링커에 의해 만들어진 융합 또는 적어도 둘 이상의 직접 융합을 통해 상기 도메인의 하나 이상의 접근가능한 부위에서 코딩된 항원-결합 도메인의 1차 토폴로지를 방해한다. 그래서, 융합시키려는 폴리펩티드를 코딩하는 폴리뉴클레오티드는 단편화되고 상기 단백질 간 강성의 비가요성 결합, 연결 또는 융합을 제공하는 항원-결합 키메라 단백질을 제공하는 방식으로 재조합된다. 신규 키메라는 항원-결합 도메인의 1차 토폴로지가 방해되는 방식으로 항원-결합 도메인과 스캐폴드 단백질을 융합시켜 만들어지고, 이것은 항원-결합 도메인의 아미노산 서열이 접근가능한 부위(들)에서 방해되고 스캐폴드 단백질의 접근가능한 아미노산(들)에 연결되어, 그 서열은 아마도 또한 방해된다. 접합은 분자내에서 만들어지는데, 달리 말해서 아미노산 서열 내에서 내부에서 만들어진다 (실시예 및 도면 참조). 본 발명의 재조합 융합은 그 결과로 오로지 N-말단 또는 C-말단에서 융합되지 않고, 적어도 하나의 내부 융합 부위를 포함하는 키메라가 생성되고, 여기서 그 부위는 직접적으로 융합되거나 또는 링커 펩티드를 통해 융합된다. 원형 배열 스캐폴드를 적용하여 항원-결합 키메라 단백질을 생산하는 경우에, 상기 스캐폴드 단백질의 아미노산 서열은 N-말단 및 C-말단을 연결한 후에, 항원-결합 도메인 부분의 아미노산 서열에 융합시키려는, 이의 3차 구조의 접근가능한 부위에 상응하는, 스캐폴드 단백질의 서열 내 다른 부위의 아미노산 서열의 절단 또는 분리를 후속하여 변화시키게 된다. 원형 배열을 수득하기 위한 상기 N-말단 및 C-말단 연결은 직접 융합, 링커 펩티드, 또는 심지어 N-말단 및 C-말단 근처 영역의 짧은 결실 후 말단의 펩티드 결합을 통할 수 있다.
용어 "접근가능한 부위(들)", "융합 부위(들)" 또는 "융합점" 또는 "연결 부위" 또는 "노출 부위"는 본 명세서에서 상호교환적으로 사용되고, 모두 구조적으로 접근가능한 단백질 서열의 아미노산 부위, 바람직하게 단백질의 표면 또는 표면에 노출된 위치를 의미한다. 당업자는 그들 부위를 결정할 수 있을 것이다. 항원-결합 도메인의 항원-결합 부위는 종종 예를 들어 Ig 도메인의 CDR과 같은 노출 영역을 고려한다. 그러나, 스캐폴드 단백질과 항원-결합 도메인의 융합을 위한 이들 부위의 방해는 본 발명의 항원-결합 키메라 단백질에 적합하지 않은, 항원-결합 능력의 손실을 초래할 수 있어서, 여기서는 접근가능한 융합 부위로서 적용하고자 하지 않는다. 그래서, 본 명세서에 기술된 바와 같은 '루프' 또는 '베타 턴'으로서 '접근가능한 부위' 및'노출 영역'은 항원-결합 부위 또는 영역이 아니고, 그러한 이유로 CDR이 아닌 부위 및 영역을 의미한다. 단백질의 N-말단 또는 C-말단은 대부분의 경우에 단백질 3D-구조의 "느슨한" 말단부이므로, 표면으로부터 접근가능하다. 이들은 항원-결합 도메인 내 적어도 하나의 다른 접근가능한 부위가 융합에 사용되어, 접근가능한 부위에서 방해/삽입, 토폴로지 방해를 초래한다는 조건에서, 이러한 후자의 접근가능한 부위 융합이 신규 키메라에 강성을 제공하게 될 것이므로, 본 발명의 키메라에서 접근가능한 부위로서 간주될 수 있다. 그러므로, 접근가능한 부위는 단백질의 아미노-말단 및/또는 카복시-말단 부위를 포함할 수 있지만, 키메라는 오로지 N-말단 또는 C-말단으로 만들어진 접근가능한 부위로부터의 융합을 기반으로 할 수 없다. 항원-결합 도메인의 적어도 하나 이상의 부위는 기지의 통상적인 도메인 폴드의 토포로지의 방해를 일으키도록 스캐폴드 단백질과의 융합에 사용된다. 일 실시형태에서 적어도 하나의 접근가능한 부위는 적어도 하나이고/이거나, 상기 도메인의 N-말단 또는 C-말단을 포함하지 않으면, 상기 도메인의 N-말단 및/또는 C-말단 부위가 아니다. 특정 실시형태에서, 적어도 하나의 부위는 상기 도메인의 N-말단 또는 C-말단 아미노산이 아니다. 다른 실시형태에서, 접근가능한 부위는 적어도 1개 초과의 부위가 스캐폴드 단백질과 융합되는데 사용될 때, 항원-결합 도메인의 N-말단 또는 C-말단 부위일 수 있다. 스캐폴드 단백질은 일 실시형태에서, 상기 적어도 하나의 부위가 스캐폴드 단백질의 N-말단부 또는 C-말단부가 아니고, 대안적인 실시형태에서, 적어도 하나의 부위가 상기 스캐폴드의 N-말단부 또는 C-말단부인, 역시 이의 3차 구조로부터 볼 수 있는 접근가능한 부위를 통해 융합된다.
일부 실시형태에서, 항원-결합 키메라는 상기 항원-결합 도메인의 노출 영역 내 방해시에 융합된 상기 스캐폴드 단백질의 N-말단 단편, 및 상기 항원-결합 도메인의 C-말단부에 융합된 상기 스캐폴드 단백질의 C-말단 단편을 포함한다.
본 발명의 일부 실시형태에서, 융합은 직접 융합일 수 있거나, 또는 링커 펩티드에 의해 만들어진 융합일 수 있고, 상기 융합 부위는 강성, 비가요성 융합 단백질을 생성시키도록 빈틈없이 디자인된다. 선택된 접근가능한 부위(들)의 위치이외에도, 링커 펩티드의 길이 및 유형은 최종 키메라 단백질의 강성에 기여한다. 본 발명의 상황 내에서, 항원-결합 키메라 단백질을 구성하는 폴리펩티드는 서로 직접적으로, 펩티드 결합을 통한 연결에 의해, 또는 간접적으로 융합되어서, 간접 커플링이 짧은 펩티드 링커를 통한 연결에 의해 2개 폴리펩티드를 조립시킨다. 바람직한 "링커 분자", "링커", 또는 "짧은 폴리펩티드 링커"는 최대 20개 아미노산 길이, 보다 좋게는 4개 아미노산 길이의 펩티드이고, 전형적으로는 오직 3개 아미노산 길이이지만, 바람직하게는 오직 2개 또는 더 바람직하게는 오직 1개 아미노산이어서, 접근가능한 부위에서 융합 접합에 대한 바람직한 강성을 제공한다. 적합한 링커 서열의 비제한적인 예는 무작위적일 수 있는 실시예 섹션에 기술되어 있으며, 여기서 링커는 구조 도메인 간 고정된 거리를 유지할 뿐만 아니라, 융합 파트너가 그들 독립 기능 (예를 들어, 항원-결합)을 유지하도록 성공적으로 선택되었다. 강성 링커의 사용과 관련된 실시형태에서, 이들은 일반적으로 α-헬릭스 구조를 채택하거나 또는 다수 프롤린 잔기를 함유하여 고유한 입체구조를 나타내는 것으로 알려져 있다. 많은 상황 하에서, 그들은 가요성 링커에 비해 보다 효율적으로 기능성 도메인을 분리시키고, 이것이 역시 적합할 수 있고, 바람직하게 오직 1-4개 아미노산의 짧은 길이일 수 있다.
일 실시형태에서, 항원-결합 도메인의 접근가능한 부위(들)는 도메인 폴드의 노출 영역 내에 있다. 상기 노출 영역은 주로 단백질의 표면, 및 구조의 모서리에 위치되는, 덜 고정된 아미노산 스트레치로서 확인된다. 바람직하게, 노출 영역은 단백질 구조의 루프 또는 β-턴으로서 존재한다.
특정 실시형태에서, 상기 항원-결합 키메라 단백질은 주로 β 시트(들)로 존재하는, 적어도 7개 역평행 β-스트랜드, 및 적어도 3개 β-턴을 갖는 항원-결합 도메인을 포함하고, 후자는 또한 노출 영역으로서 간주된다. 일 실시형태에서, 적어도 7 역평행 β-스트랜드, 및 적어도 3 β-턴의 상기 항원-결합 도메인은 면역글로불린-유사 도메인, 예컨대 특히 모노바디의 항원-결합 도메인을 포함한다. 모노바디는 분자 스캐폴드로서 피브로넥틴 III형 도메인 (FN3)을 사용하여 구축된 합성 결합 단백질이다. 천연 FN3 스캐폴드는 94개 아미노산으로 이루어졌고, 항체의 단일 가변 도메인의 크기와 비슷하게, 약 10 kDa의 분자량을 갖는다. 그들은 인간 피브로넥틴의 구조, 보다 특히 이의 10번째 세포외 III형 도메인을 기반으로 한다. 이 도메인은 항체 가변 도메인과 유사한 구조를 갖는데, 7개 β-스트랜드, 및 3개의 노출 루프가 각 측면 상에 존재한다. 다른 특정 실시형태에서, 상기 항원-결합 키메라 단백질은 면역글로불린 (Ig) 도메인인 항원-결합 도메인을 포함한다. 면역글로불린 (Ig) 도메인은 약 125개 아미노산으로 이루어진, 격자무늬 토폴로지를 갖는 2개 β-시트로 배열된 7-9개의 역평행 β-스트랜드의 2층 샌드위치로 이루어진 단백질 도메인 유형이다. 면역글로불린의 가변 (V) 및 불변 (C) 서브유닛은 2층을 형성하는 β 스트랜드의 개수 및 규칙성이 상이하고 C 도메인은 배열된 7개 β 스트랜드로부터 구축되어서 4개 스트랜드는 1개 β 시트를 형성하고 3개 스트랜드는 제2 시트를 형성하는 한편, V 도메인은 7개 대신에 9개 β 스트랜드를 함유한다. 하나의 β 시트의 모서리에 삽입된 V 도메인의 2개의 추가 스트랜드는 기능적으로 중요한데 그들이 항원-인식 부위의 형성에 직접적으로 관여하는 제2 초가변 영역을 한정하기 때문이다. 본 발명의 항원-결합 키메라 단백질을 수득하기 위해 항원-결합 도메인의 토폴로지를 방해함으로써, 놀랍게도, 표적 단백질 또는 항원에 결합하는 이의 기능성을 비롯하여, 면역글로불린 또는 면역글로불린-유사 폴드는 최종 키메라 단백질에서 유지되었다.
스캐폴드 단백질이 융합되는 항원-결합 도메인 또는 Ig 도메인-함유 단백질의 경우에, 항원-결합 또는 Ig 도메인의 항원 또는 표적의 속성은 임의 종류일 수 있다. 그러므로, 표적의 속성은 본 발명과 관련되지 않고, 각각 항원-결합 도메인, 또는 Ig 또는 Ig-유사 도메인의 CDR, 또는 항원-결합 부위에 특이적으로 결합하는 임의 에피토프가 타당한 표적 단백질로서 간주될 수 있다. 표적은 비제한적인 예로서, 단량체 단백질, 다른 거대분자 구조, 다량체, 단백질 복합체, 또는 일시적 단백질-단백질 상호작용일 수 있다. 표적은 또한 임의의 기능성을 가질 수 있으며, 예를 들어 제한없이 효소, 막단백질 예컨대 GPCR, 이온-채널로서의 기능을 가질 수 있을 분만 아니라, 특히, 핵 및 다른 수용체 단백질은 상기 항원-결합 도메인의 표적일 수 있다. 대안적으로, 표적의 공급원은 예를 들어 제한없이 특히 인간, 포유동물, 또는 동물뿐만 아니라, 박테리아, 바이러스, 곤충에 기원을 둔, 임의 기원의 것일 수 있다.
일 실시형태에서, 항원-결합 또는 Ig/ Ig-유사 도메인의 항원은 항원-결합 키메라 단백질을 야기시키기 위해 상기 항원-결합 또는 Ig/ Ig-유사 도메인에 융합된 스캐폴드 단백질이 아니다. 보다 바람직하게, 스캐폴드 단백질이 본 발명에서 기술된 바와 같이 항원-결합 또는 Ig 도메인에 융합 또는 연결되는데 사용될 때, 신규 항원-결합 키메라 단백질은 이의 단량체, 쳔연 또는 융합 형태로 존재하는 스캐폴드 단백질에 특이적으로 결합해서는 안된다. 대안적으로, 본 명세서에 기술된 바와 같은 제1 및 제2 항원-결합 키메라 단백질을 포함하는 항원-결합 키메라 단백질의 조성물이 본 명세서에서 개시되고, 상기 제2 항원-결합 키메라 단백질의 항원-결합 도메인은 제1 항원-결합 키메라 단백질의 스캐폴드 단백질에 특이적으로 결합한다. 그 자산의 스캐폴드에 결합하는 항원-결합 키메라 단백질의 사슬-반응 또는 응집을 피하기 위해서, 상기 제2 항원-결합 키메라 단백질의 스캐폴드는 상기 제1 항원-결합 키메라 단백질의 스캐폴드 단백질과 상이하다. 본 발명의 목적을 위해 본 명세서에서 '상이한'이란, 제2 항원-결합 키메라 단백질의 스캐폴드 단백질의 아미노산 돌연변이, 결실, 삽입 또는 치환 또는 변형이 제2 항원-결합 키메라 단백질의 상기 스캐폴드 단백질 부분에 대한 제2 항원-결합 키메라 단백질의 항원-결합 도메인의 비결합을 야기시키는 것을 의미한다. 다른 실시형태는 이의 항원 또는 표적 단백질과 결합된 복합체로, 항원-결합 키메라 단백질의 상기 조성물에 관한 것이다.
대안적인 실시형태에서, 항원-결합 키메라 단백질은 i) 면역글로불린 또는 Ig-유사 도메인의 보존된 N-말단 아미노산 서열, ii) 스캐폴드 단백질, 및 iii) i)의 상기 보존된 N-말단 아미노산 서열이 결여된 면역글로불린 도메인 서열을 포함하는 강성 융합 단백질로서 기술되고, 여기서 i) 및 iii)은 ii)의 상기 스캐폴드 단백질에 쇄상화된다. 바람직한 실시형태에서, 상기 강성 융합 단백질은 길이가 11 내지 15 잔기 (SEQ ID NO:1의 잔기 11 내지 15의 N-말단부의 끝, 즉 제1 베타턴 근처)인, SEQ ID NO:1에서의 잔기를 갖는 보존된 공통 서열을 포함하는, FR1 영역의 보존된 N-말단 도메인인 보존된 N-말단 아미노산 서열, 또는 이의 상동성 서열을 포함한다. 다른 실시형태에서, 항원-결합 키메라 단백질의 항원-결합 도메인은 헬릭스 2차 구조를 포함한다. 특히, 상기 항원-결합 도메인은 항체 모방체로서 항원-결합 도메인의 일부인 알파바디일 수 있거나, 또는 항원-결합 키메라 단백질을 생산하기 위해 본 명세서에 기술된 바와 같은 융합체에 적용가능한, 강성 헬릭스 링커의 디자인을 통해 역시 강성일 수 있는 디자인된 알파 헬릭스를 함유하므로 면역글로불린과 매우 상이한 구조를 갖는 항체 모방체인 DARPin일 수 있다. 그러나, 항체 모방체의 항원-결합 성질은 천연적으로 발생되지 않는, 합성적으로 생성 또는 예측된 결합 부위이고, 그러므로 예를 들어 단일 도메인 항체의 생체내 성숙된 항원-결합 부위와 비교하여 적용가능성이 덜할 수 있다. 게다가, 상기 헬릭스 구조 또는 코일드-코일을 사용해 강성 융합체를 생성하는 것은 토폴로지 간섭에 대해 β-턴을 포함하는 융합체와 비교하여 더 복잡할 수 있다.
Ig 도메인의 "노출 영역"의 가장 간단한 확인은 노출된 루프, 바람직하게 β 시트 샌드위치 3D-구조의 모서리에 위치하는 노출 루프인, β-턴이다.
추가 실시형태는 상기 항원-결합 도메인의 노출 영역이 IMGT (Lefranc, 2014)에 의해 정의된 바와 같은 β-턴을 포함한다는 것을 의미하고, 상기 스캐폴드 단백질은 a. 상기 항원-결합 도메인의 베타-스트랜드 A 및 B를 연결하는 제1 β-턴; 또는 b. 상기 항원-결합 도메인의 베타-스트랜드 C 및 C'을 연결하는 β-턴; 또는 c. 상기 항원-결합 도메인의 베타-스트랜드 C" 및 D를 연결하는 β-턴; 또는 d. 상기 항원-결합 도메인의 베타-스트랜드 D 및 E를 연결하는 β-턴; 또는 e. 상기 항원-결합 도메인의 베타-스트랜드 E 및 F를 연결하는 β-턴인, 면역글로불린 (가변) 도메인의 상기 노출 영역에 삽입되거나 또는 융합된다. 바람직한 실시형태에서, 접근가능한 부위(들)는 Ig 도메인의 A 및 B β-스트랜드를 연결하는 AB β-턴의 노출 영역에 존재한다. 대안적으로, 접근가능한 부위는 Ig 도메인의 C 및 C' β-스트랜드를 연결하는, CC' β-턴에 의해 한정되는 노출 영역에 위치된다. 다른 실시형태는 C"D β-턴, 또는 EF β-턴에 접근가능한 부위(들)를 갖는 노출 영역을 포함한다.
사실, 이들은 면역글로불린 폴드를 제공하기 위한 전형적인 샌드위치의 β시트를 구성하는, 각각 β-스트랜드 A 및 B, C 및 C', C" 및 D, 또는 E 및 F를 연결하는 표면 루프이다. 가장 바람직하게, 접근가능한 부위는 노출 영역, 루프 또는 β-턴에 존재하여서, Ig 도메인의 CDR은 표적 단백질의 에피토프에 결합하는 그들 능력을 보유한다. CDR 그 자체는 또한 노출 영역으로 간주될 수 있어서, 이론적으로 그들이 접근가능한 부위를 제공한다. 그러나, 항원-결합 키메라 단백질은 표적 단백질이 여전히 결합될 수 있을 때, 오직 기능적, 따라서 항원-결합하게 될 것이고, 이것은 아마도 CDR의 아미노산이 융합을 위한 접근가능한 부위로서 사용될 때는 그렇지 않을 것이다.
다른 실시형태에서, 항원-결합 도메인은 면역글로불린-유사 도메인, 예컨대 보다 특히 모노바디를 포함하고, 여기서 스캐폴드 단백질은 Ig 도메인에 대해, 보다 특히, [Koide et al. (2012)]에서 주석달린 구조에 따라 정의되는 바와 같은, 모노바디에 대해, 상기 제공된 선택안과 유사하게, 상기 Ig-유사 도메인의 β-스트랜드 A 및 B를 연결하는 제1 β-턴; 또는 상기 Ig-유사 도메인의 β-스트랜드 C 및 D를 연결하는 β-턴; 또는 상기 Ig-유사 도메인의 β-스트랜드 E 및 F를 연결하는 β-턴에, 삽입된다. 상기 명명법은 VHH Ig-폴드 주석을 기반으로 채택되었다.
다른 실시형태에서, 스캐폴드 단백질은 원형 배열을 갖는다. 바람직한 실시형태에서, 스캐폴드 단백질의 상기 원형 배열은 스캐폴드 단백질의 N-말단 및/또는 C-말단에 존재하거나, 또는 가장 바람직하게 스캐폴드 단백질의 N-말단과 C-말단 사이에 존재한다. 다른 실시형태는 적어도 2개의 역평행 β-스트랜드를 포함하는 스캐폴드 단백질을 제공한다.
일 실시형태에서, 융합 단백질 (2개 펩티드 결합 또는 2개의 짧은 링커)은 이의 구조의 노출 영역에 상응하는 서열에서 이의 절단된 접근가능한 부위에서 원형 배열 스캐폴드 단백질과의 융합을 통해서, AB 베타 턴에 상응하는 서열의 절단된 접근가능한 부위에서 Ig 또는 항원-결합 도메인 1차 토폴로지의 방해를 통해, 스캐폴드에 면역글로불린 또는 항원-결합 도메인을 연결시켜 수득된다 (상기 노출 또는 접근가능한 부위는 N-말단 또는 C-말단이 아님). 스캐폴드 단백질의 원형 배열이 N-말단 및 C-말단에 있는 특정 실시형태 (도 2)에서, 스캐폴드 단백질 서열은 전체로서 항원-결합 단백질 단편과 재조합적으로 융합될 수 있다 (도 8). 특정 실시형태에서, 상기 키메라는 항원-결합 또는 Ig 도메인 내, 바람직하게 β-스트랜드 A의 말단, 및 β-스트랜드 G의 말단에서, AB 베타 턴의 접근가능한 부위 근처에 위치하는 시스테인 잔기를 통해 형성된 강화 디술피드 브릿지의 추가 생성을 통해 증가된 강성을 갖는다. 일 실시형태에서, 항원-결합 도메인 및 스캐폴드는 항원-결합 키메라 단백질의 강성을 개선시키기 위해 디술피드 결합을 통해 더욱 연결된다. 가장 바람직하게 이들 부위는 β 스트랜드의 마지막 아미노산 (예를 들어 SEQ ID NO:1의 잔기 11-15 주변)이고, 상기 잔기는 시스테인으로 치환되고, Ig 도메인의 마지막 아미노산 중 하나가 역시 시스테인으로 돌연변이된다 (도 10 참조).
다른 실시형태에서, 스캐폴드에 면역글로불린을 연결시킨 상기 융합 단백질 (2개 펩티드 결합 또는 2개 짧은 링커 가짐)은 이의 서열 내 (N-말단 또는 C-말단이 아님) 위치된 이의 구조의 노출 영역 내 절단된 접근가능한 부위에서 원형 배열 스캐폴드 단백질과 융합을 통해, CC' 베타 턴 내 절단된 접근가능한 부위에서 Ig 도메인 토폴로지의 방해를 통해 수득된다. 그래서, 스캐폴드 단백질의 원형 배열이 N-말단 및 C-말단을 연결하여 만들어지는 특정 실시형태 (도 22)에서, 스캐폴드 단백질 서열은 전체로 Ig 단백질 단편과 재조합적으로 융합될 수 있다 (도 8).
다른 실시형태에서, 본 명세서에 기술된 바와 같은 스캐폴드 단백질은 동종- 또는 이종-올리고머, 및/또는 외피 단백질, 또는 바이러스-유사 입자 단백질, 또는 이의 단편일 수 있는, 절대 이량체 또는 다량체, 예컨대 12량체이다. 외피 단백질, 또는 바이러스-유사 입자 단백질는 다량체를 형성하고 대칭 구조로 자가 조립되어서, 상기 대칭 구조의 표면 상에 융합된 Ig 도메인의 디스플레이를 야기시킨다.
다른 실시형태에서, 면역글로불린을 스캐폴드에 연결하는 융합 또는 키메라 단백질 (3개 펩티드 결합 또는 3개 짧은 링커 가짐)은 이의 N-말단 아미노산에서 스캐폴드 단백질과의 융합을 통해, 이의 AB 베타 턴 내 절단된 접근가능한 부위에서 항원-결합 또는 Ig / Ig-유사 도메인 토폴로지의 방해를 통해 수득된다. 상기 스캐폴드 단백질은 또한 Ig 도메인의 β-스트랜드 B와 융합을 가능하게 하는 AB 베타 턴 부위로 다시 커플링되도록 절단되는, 이의 서열 내 구조적으로 접근가능한 부위를 요구한다. Ig 도메인의 제2 접근가능한 부위는 예를 들어 제한없이, 스캐폴드 단백질의 나머지 부분에 더욱 융합되는, 이의 C-말단 아미노산을 제공한다 (도 11 참조). 그래서, 스캐폴드 단백질이 항원-결합 또는 Ig/ Ig-유사 도메인의 2개의 상이한 접근가능한 부위에서 융합되는 특정 실시형태에서, 스캐폴드 단백질 서열은 2개 단편으로서 항원-결합 또는 Ig 도메인 단백질 단편에 재조합적으로 융합되는 것이 요구된다. 특정 실시형태에서, 면역글로불린을 스캐폴드에 연결하는 3개의 펩티드 결합 또는 짧은 링커를 갖는 상기 키메라 융합 단백질은 이의 강성이 Ig 도메인 내 위치되는 시스테인 잔기에 의해 형성되는 강화 디술피드 브릿지의 추가 생성을 통해 증가된다. 특정 실시형태에서, 상기 스캐폴드 단백질은 절대 이량체 또는 다량체이거나, 또는 외피 단백질 또는 바이러스-유사 입자, 또는 이의 단편일 수 있어서, 대칭성을 생성시킨다.
특별한 실시형태에서, 면역글로불린을 스캐폴드에 연결하는 융합 단백질 (3개 펩티드 결합 또는 짧은 링커 가짐)은 이종이량체를 형성하는 2개 스캐폴드 단백질을 포함한다. 상기 융합 단백질은 이후에 Ig 도메인으로 다시 β-스트랜드 B에 연결되게 하는 동일한 접근가능한 부위에 융합되는 이의 C-말단부에 존재하는, 이의 서열 (N-말단 또는 C-말단이 아님) 내에 위치하는 이의 구조의 노출 영역 내 이의 절단된 접근가능한 부위에서 제1의 원형 배열 스캐폴드 단백질과 융합을 통해, AB 베타 턴 내 절단된 접근가능한 부위에서 Ig 도메인 토폴로지의 방해를 통해 수득된다. Ig 도메인의 제2 접근가능한 부위는 제1 스캐폴드 단백질과 이량체화되어 증가된 강성을 생성시키는, 제2 스캐폴드 단백질의 N-말단과 최종적으로 융합되는, 이의 C-말단 아미노산에 의해 제공된다. 특정 실시형태에서, 스캐폴드 단백질의 원형 배열은 N-말단 및 C-말단에 있다. 그래서, 제1 스캐폴드 단백질의 원형 배열이 N-말단 및 C-말단에 존재하는 특정한 실시형태에서, 제1 스캐폴드 단백질의 원형 배열 서열은 Ig 서열의 N-말단 및 C-말단 부분 (AB 베타 턴 내에서 절단) 사이에 삽입되는 Ig 단백질 단편과 전체로서 재조합적으로 융합될 수 있고, 제2 스캐폴드 단백질은 Ig 도메인 서열의 C-말단과 N-말단에서 융합된다. 그리하여, 다량체 스캐폴드 단백질은 상기 다량체 스캐폴드의 단량체 각각을 통해서 이의 접근가능한 부위(들)에서 Ig 도메인과 연결 또는 융합된다.
특정 실시형태에서, 항원-결합 도메인을 스캐폴드에 연결하는 융합 단백질 (3개 펩티드 결합 또는 짧은 링커 가짐)의 스캐폴드는 제2 항원-결합 도메인을 포함한다. 상기 융합 단백질은 이의 N-말단 아미노산에서 (제2) 항원-결합 도메인-포함 스캐폴드 단백질과 융합을 통해, 이의 AB 베타 턴 내 절단된 접근가능한 부위에서 (제1) 항원-결합 도메인 토폴로지를 방해시켜 수득된다. 상기 (제2) 항원-결합 도메인-포함 스캐폴드 단백질은 특정 실시형태에서 Ig 도메인을 포함하고, 이의 서열 내에, 특히 (제1) 항원-결합 도메인의 β-스트랜드 B와 융합될 수 있게 하는 AB 베타 턴 부위로 다시 커플링되도록 절단되는, β-스트랜드 G의 C-말단부 근처에서, 구조적으로 접근가능한 부위를 제공한다. (제1) 항원-결합 도메인의 제2 접근가능한 부위는 스캐폴드 단백질을 포함하는 (제2) 항원-결합 Ig 도메인의 나머지 부분에 최종적으로 융합되는, 이의 C-말단 아미노산에 의해 제공된다 (도 17 참조). 그래서, 이러한 특정 실시형태에서, (제2) 항원-결합 도메인-포함 스캐폴드 단백질 서열은 2개 단편으로서 (제1) 항원-결합 단백질 단편에 재조합적으로 융합되는 것이 필요하다. 이 실시형태에 기술된 바와 같이, 서로 융합되는 2개 항원-결합 도메인은 특히 일 특정 실시형태에서 2개의 동일한 항원-결합 도메인으로서, 또는 동일 표적 단백질의 상이한 에피토프에 결합하는 상이한 항원-결합 도메인으로서, 또는 상이한 단백질을 표적화하는 2개 항원-결합 도메인으로서 개시된다. 그러나 Ig 도메인인 항원-결합 단백질의 CDR에 의해 결합되는 에피토프는 최종 항원-결합 키메라의 일부분인 다른 Ig 도메인에 존재해서는 안되거나, 또는 새롭게 형성된 항원 결합 키메라 그 자체에 존재해서는 안된다. 특정 실시형태에서, 상기 Ig 도메인은 2개 나노바디이고, 보다 특정한 실시형태에서, 2개의 동일한 Nb이거나, 또는 동일한 표적 단백질의 상이한 에피토프에 결합하는 상이한 Nb이거나, 또는 상이한 단백질을 표적화하는 2개 Nb이다. 그러나 Nb가 결합하는 에피토프는 최종 항원-결합 키메라의 일부분인 다른 Nb에 존재해서는 않되거나, 또는 새롭게 형성된 항원 결합 키메라 자체에 존재해서는 않된다.
일정 실시형태에서, 본 발명의 스캐폴드 단백질은 단량체 단백질이다. 다른 실시형태에서, 스캐폴드 단백질은 대칭성을 제공하는 단백질, 예컨대 다량체 스캐폴드 단백질, 또는 외피 단백질이거나 또는 바이러스-유사 입자로 자가 조립되는 단백질인 스캐폴드 단백질이다. 다량체 스캐폴드 단백질은 이종성- 또는 동종-올리고머화일 수 있는 올리고머화를 통해 대칭성을 제공하고, 절대적이거나 또는 영구적일 수 있고, 또한 일시적일 수 있다. 수득딘 대칭성은 임의 유형의 대칭성, 예컨대 예를 들어 제한없이, 환형, 입방체, 2면체, 6면체, 8면체, 20면체 등일 수 있다. 특히, 용어 "20면체"는 20개의 면을 갖는 다면체의 기하 형태를 의미하는, 20면체로부터 유래된 유형의 대칭성을 의미한다. 용어 "바이러스-유사 입자" (VLP), "20면체 VLP 단백질", "외피 단백질", 또는 "20면체 VLP를 형성하는 단백질"은 다량체 구조, VLP로 자가 조립될 수 있고, 바이러스로부터 유래되었지만, 비감염성이고, (20면체) 대칭성을 제공하는 단백질을 의미한다. 예를 들어 박테리오파지는 20면체 구조를 갖는 헤드를 갖는다. 뿐만 아니라, 이종성 단백질의 전부 또는 일부를 포함하는 키메라 표면 단백질의 디스플레이는 바이러스 입자를 생산하기 위한 역 유전자 시스템이 확립된 임의의 20면체 바이러스를 사용해 쉽게 가능하다. 키메라 표면 단백질은 본 발명에서 제공하는 바와 같이, 이종성 항원-결합 도메인에 융합되는 바이러스 표면 또는 외피 단백질을 포함한다. 바이러스 외피 단백질은 스캐폴드로서 제공되기 위해 펩티드 결합 또는 링커 서열을 통해 융합될 수 있다. 일부 예에서, 바이러스 외피 단백질의 일부분은 그에 융합되는 항원-결합 도메인 및/또는 링커를 더 잘 수행하기 위해 결실된다. 결실이 다시 코팅되는 바이러스 단백질의 능력에 영향을 미치는지 여부는 바이러스 입자의 존재 하에서 재조합적으로 발현된 바이러스 단백질을 인큐베이션시켜서 재코팅된 바이러스 입자의 형성을 관찰하여 평가할 수 있다.
본 발명의 추가 양상은 스캐폴드 단백질과 융합된 항원-결합 도메인을 포함하는 신규 항원-결합 키메라 단백질에 관한 것이고, 여기서 상기 스캐폴드 단백질은 상기 도메인의 토폴로지를 방해하고, 스캐폴드 단백질(들)의 총 질량 또는 분자량이 적어도 30 kDa이어서, 항원-결합 도메인의 표적에 대한 키메라의 결합에 의한 질량 부가가 상기 키메라에 비공유적으로 결합될 때 표적의 3-차원 구조 분석을 허용하기에 충분하고 상당하게 될 것이다. 다른 실시형태에서, 스캐폴드 단백질(들)의 총 질량 또는 분자량은 적어도 10 kDa, 적어도 20 kDa, 적어도 35 kDa, 적어도 40 kDa, 적어도 45 kDa, 적어도 50 kDa, 또는 적어도 60 kDa이다. 특정 크기 또는 질량 증가는 이미지의 신호 대 노이즈 비율을 감소시키는데 영향을 미칠 것이다. 두번째로, 키메라는 cryo-EM 및 X-ray 결정학을 사용하여 충분히 고분해능에 도달하도록 결정화시키는 것이 어렵거나 또는 작은 단백질에 대해 정확한 이미지 정렬을 위한 적절한 특성을 제공하여 구조 가이드를 제공하게 될 것이다.
본 발명의 다른 양상은 스캐폴드 단백질과 융합된 항원-결합 도메인을 포함하는 신규 항원-결합 키메라 단백질에 관한 것이고, 여기서 상기 스캐폴드 단백질은 상기 도메인의 토폴로지를 방해하고, 스캐폴드 단백질은 항원-결합 도메인을 더 포함하고, 특정 실시형태에서, 상기 스캐폴드 단백질은 Ig 도메인을 포함하고, VHH, 나노바디, 또는 항체 그 자체이다. 신규 항원-결합 키메라 단백질을 수득하기 위한 상기 융합은 적어도 2개의 항원-결합 부위를 갖는 항원-결합 키메라 단백질을 생성시키고, 여기서 항원-결합 모이어티는 융합되어 강성 키메라를 생성시키고, 그들 표적에 결합하는 그들 기능은 보유한다. 상기 적어도 2개의 항원-결합 부위는 한 표적의 동일한 에피토프 또는 상이한 에피토프를 표적으로 할 수 있어서, 친화성 및/또는 효능을 증가시킨다. 대안적으로, 본 발명에 따라 융합된 상기 2개의 항원-결합 도메인을 포함하는 상기 키메라의 2개 항원-결합 부위는 상이한 표적 단백질에 결합할 수 있고, 이것은 오직 하나의 강성 키메라를 사용하여 2개 단백질의 표적화를 허용한다. 키메라의 이러한 고유한 특성은 예를 들어 밀접하게 근접한 표적에 대해 강성 구조가 요구되고, 그렇지 않으면 도달하는 것이 어려운 이중특이성의 치료적 용도에 대한 해결안을 제공한다.
본 발명의 범주 내에는 또한 항원-결합 도메인을 포함하는 항원-결합 도메인 및/또는 스캐폴드 단백질이 포괄되고, 여기서 항원-결합 도메인은 "다가" 형태이고 둘 이상의 (1가) 항원-결합 도메인, 예컨대 Ig 도메인을 함께 재조합 DNA 기술에 의해서, 또는 화학적으로 결합시켜 형성된다. 다가 구성체의 비제한적인 예는 "2가" 구성체, "3가" 구성체, "4가" 구성체 등을 포함한다. 다가 구성체 내에 포함되는 면역글로불린 도메인은 동일할 수 있거나 또는 상이할 수 있다. 특히, 본 발명의 면역글로불린 도메인 또는 본 발명의 스캐폴드 단백질을 구성하는 Ig 도메인은 "다중특이적" 형태이고, 둘 이상의 면역글로불린 도메인을 연결시켜 형성되며, 이중에서 적어도 하나는 상이한 특이성을 갖는다. 다중특이적 구성체의 비제한적인 예는 "이중특이적" 구성체, "삼중특이적" 구성체, "사중특이적" 구성체 등을 포함한다. 이를 더욱 예시하기 위해서, 본 발명의 임의의 다가 또는 다중특이적 (본 명세서에 정의된 바와 같음) 면역글로불린 도메인은 동일 항원 상의 둘 이상의 상이한 에피토프에 대해서, 예를 들어 표적의 둘 이상의 상이한 에피토프에 대해서, 적합하게 유도될 수 있거나, 또는 둘 이상의 상이한 항원에 대해서, 예를 들어 표적의 에피토프 및 표적의 천연 결합 파트너의 에피토프에 대해 유도될 수 있다. 특히 본 발명의 1가 면역글로불린 도메인은 본 발명의 다가 또는 다중특이적 면역글로불린 단일 가변 도메인에 의해 부여되는 친화성보다 낮은 적은 친화성으로 표적에 결합하게 될 것이다. 특정 실시형태에서, 본 발명의 이러한 다가 또는 다중특이적 Ig 도메인은 Ig 도메인의 적어도 하나의 이의 토폴로지의 방해를 통해서, Ig 도메인 및 스캐폴드 단백질로서 서로 융합될 수 있다. 그렇지 않으면, 본 발명의 다가 또는 다중특이적 Ig 도메인은 그들 N-말단 및/또는 C-말단을 통해서 통상의 방식으로 융합될 수 있고, 또한 융합되는 Ig 도메인의 방해를 통해서, 또는 다가 또는 다중특이적 Ig 도메인 그 자체의 Ig 도메인의 방해를 통해서, 다른 Ig 도메인 및/또는 다른 스캐폴드에 융합되도록 전체로서 적용될 수 있다.
다른 실시형태는 비면역글로불린이지만, 다른 유형의 단백질에 결합하는 것으로 알려진 단백질인 스캐폴드 단백질을 제공하고, 그러므로 역시 치료적 표적화에 고려될 수 있다.
대안적인 양상에서, 본 발명의 항원-결합 키메라 단백질은 변형된 아미노산을 포함한다. 다른 실시형태는 변형된 형태로 존재하고/하거나, 다른 모이어티를 포함 (또는 그와 융합)하는 스캐폴드 단백질을 기술한다. 대안적인 실시형태는 변형된 형태로 존재하고/하거나, 다른 모이어티를 포함하는 항원-결합 키메라 단백질의 항원-결합 도메인을 기술한다. 변형의 예를 비롯하여, 변형할 수 있는 본 발명의 단백질 도메인 내 아미노산 잔기의 예 (즉, 단백질 골격, 바람직하게는 측쇄 상에 존재), 이러한 변형을 도입시키는데 사용될 수 있는 방법 및 기술 및 이러한 변형의 잠재적 용도 및 장점은 당업자에게 자명할 것이다. 예를 들어, 이러한 변형은 결합제 상에 또는 결합제에 하나 이상의 작용기, 잔기 또는 모이어티의 도입 (예를 들어, 공유 연결 또는 다른 적합한 방식에 의함)을 포함할 수 있다. 그들을 도입시키기 위한 이러한 작용기 및 기술의 예는 당업자에게 자명할 것이고, 일반적으로 당분야에서 언급하는 모든 작용기 및 기술을 비롯하여 약학 단백질의 변형, 특히 항체 또는 항체 단편 (ScFv 및 단일 도메인 항체 포함)의 변형을 위한 그 자체로 공지된 작용기 및 기술을 포함할 수 있고, 예를 들어 [Remington's Pharmaceutical Sciences, 16th ed., Mack Publishing Co., Easton, PA (1980)]를 참조한다. 이러한 작용기는 역시 당업자에게 자명한 바와 같이, 예를 들어 스캐폴드 단백질에 직접적으로 (예를 들어, 공유적으로), 또는 임의로는 적합한 링커 또는 스페이서를 통해 연결될 수 있다.
항원-결합 키메라 단백질이 잠재적으로 치료적 가치가 있는 경우에, 약학 단백질의 반감기 증가 및/또는 면역원성 감소를 위해 가장 광범위하게 사용되는 기술 중 하나는 적합한 약학적으로 허용가능한 중합체, 예컨대 폴리(에틸렌글리콜) (PEG) 또는 이의 유도체 (예컨대 메톡시폴리(에틸렌글리콜) 또는 mPEG)의 부착을 포함한다. 일반적으로, 임의의 적합한 형태의 PEG화, 예컨대 항체 및 항체 단편 (제한없이 (단일) 도메인 항체 및 scFv)에 대해 당분야에서 사용되는 PEG화를 사용할 수 있으며, 예를 들어 [Chapman, Nat. Biotechnol., 54, 531-545 (2002); by Veronese and Harris, Adv. Drug Deliv. Rev. 54, 453-456 (2003)], [Harris and Chess, Nat. Rev. Drug. Discov., 2, (2003)] 및 WO04060965를 참조한다. 단백질의 PEG화를 위한 다양한 시약은 또한 예를 들어 Nektar Therapeutics, USA에서 상업적으로 입수가능하다. 바람직하게, 부위-지정 PEG화는 특히, 시스테인-잔기를 통해서 사용된다 (예를 들어, [Yang et al., Protein Engineering, 16, 10, 761-770 (2003)] 참조). 예를 들어, 이러한 목적을 위해서, PEG는 스캐폴드에서 천연적으로 존재하는 시스테인 잔기에 부착될 수 있거나, 또는 스캐폴드 단백질은 PEG의 부착을 위한 하나 이상의 시스테인 잔기를 적합하게 도입시키도록 변형될 수 있거나, 또는 PEG의 부착을 위한 하나 이상의 시스테인 잔기를 포함하는 아미노산 잔기가 스캐폴드의 N-말단 및/또는 C-말단에 융합될 수 있으며, 단백질 조작의 모든 사용 기술은 그 자체로 당업자에게 공지되어 있다. 바람직하게, 본 발명의 신규 항원-결합 키메라 단백질의 스캐폴드 단백질의 경우에, 5000 초과, 예컨대 10,000 초과, 200,000 미만, 예컨대 100,000 미만; 예를 들어 20,000-80,000 범위의 분자량을 갖는 PEG가 사용된다. 일반적으로 덜 바람직한 다른 변형은 본 발명의 항원-결합 키메라 단백질을 발현시키는데 사용되는 숙주 세포에 따라서, 일반적으로 공번역 및/또는 번역후 변형의 일부로서, N-연결 또는 O-연결 글리코실화를 포함한다. 상기 항원-결합 키메라 단백질의 반감기를 증가시키기 위한 다른 기술은 펩티드 (예를 들어, 혈청 단백질 예컨대 알부민에 대한 펩티드)의 사용, 스캐폴드 단백질로서 또는 그를 통해서, 항원-결합 키메라 단백질의 추가 융합으로, 또는 이기능성 구성체 (예를 들어, 표적 1에 대한 하나의 항원-결합 도메인 및 혈청 단백질 예컨대 알부민에 대한 스캐폴드 단백질 내에 존재하는 하나의 항원-결합 도메인)로의 조작을 포함할 수 있다.
본 발명의 다른 측면은 스캐폴드 단백질과 융합된 항원-결합 도메인을 포함하는 신규 항원-결합 키메라 단백질에 관한 것으로서, 상기 스캐폴드 단백질은 상기 도메인의 토폴로지를 방해하고, 상기 스캐폴드 단백질은 표지된 단백질인, 변형된 단백질이다. 대안적으로, 상기 항원-결합 도메인은 표지된 단백질이다. 또 다른 변형은 표지된 항원-결합 키메라 단백질의 의도하는 용도에 따라서, 하나 이상의 검출가능한 표지 또는 다른 신호-발생기의 도입을 포함할 수 있다. 그들을 부착, 사용 및 검출하기 위해 적합한 표지 및 기술은 당업자에게 자명할 것이고, 예를 들어, 제한없이 형광성 표지, (예컨대 IRDye800, VivoTag800, 플루오레세인, 이소티오시아네이트, 로다민, 피코에리쓰린, 피코시아닌, 알로피코시아닌, o-프탈데히드, 및 플루오레카민 및 형광성 금속 예컨대 Eu 또는 란탄계 다른 금속), 인광성 표지, 화학발광성 표지 생물발광성 표지 (예컨대 루미날, 이소루미놀, 테로마틱 아크리디늄 에스테르, 이미다졸, 아크리디늄 염, 옥사레이트 에스테르, 디옥세탄 또는 GFP 및 이의 유사체), 방사성 동위원소, 금속, 금속 킬레이트 또는 금속계 양이온 또는 생체내, 시험관내 또는 제자리 진단 및 영상화에 특히 적합한 다른 금속 또는 금속계 양이온을 비롯하여 발색단 및 효소 (예컨대 말레이트 디히드로게나제, 스타필로코커스 뉴클레아제, 델타-V-스테로이드 이소머라제, 효모 알콜 디히드로게나제, 알파-글리세로포스페이트 디히드로게나제, 트리오스 포스페이트 이소머라제, 바이오틴아비딘 퍼옥시다제, 홀스래디쉬 퍼옥시다제, 알칼리 포스파타제, 아스파라기나제, 글루코스 옥시다제, 베타-갈락토시다제, 리보뉴클레아제, 우레아제, 카탈라제, 글루코스-VI-포스페이트 디히드로게나제, 글루코아밀라제 및 아세틸콜린 에스터라제)를 포함한다. 다른 적합한 표지는 당업자에게 자명할 것이고, 예를 들어 NMR 또는 ESR 분광법을 사용해 검출할 수 있는 모이어티를 포함한다. 이러한 본 발명의 표지된 항원-결합 키메라 단백질은 예를 들어 특별한 표지의 선택에 따라서, 시험관내, 생체내 또는 제자리 어세이 (그 자체로 공지된 면역어세이 예컨대 ELISA, RIA, EIA 및 기타 "샌드위치 어세이" 등 포함)를 비롯하여 생체내 진단 및 영상화 목적에 사용될 수 있다. 당업자에게 자명한 바와 같이, 다른 변형은 예를 들어 상기 언급된 금속 또는 금속계 양이온 중 하나를 킬레이트하기 위해, 킬레이트화 기의 도입을 포함할 수 있다. 예를 들어 적합한 킬레이트화 기는 제한없이, 2,2',2"-(10-(2-((2,5-디옥소피롤리딘-1-일)옥시)-2-옥소에틸)-1,4,7,10-테트라아자시클로도데칸-1,4,7-트리일)트리아세트산 (DOTA), 2,2'-(7-(2-((2,5-디옥소피롤리딘-1-일)옥시)-2-옥소에틸)-1,4,7-트리아조난-1,4-디일)디아세트산 (NOTA), 디에틸렌트리아민펜타아세트산 (DTPA) 또는 에틸렌디아민테트라아세트산 (EDTA)을 포함한다. 역시 다른 변형은 바이오틴-(스트렙)타비딘 결합 쌍과 같이, 특별한 결합쌍의 한 부분인 작용기의 도입을 포함할 수 있다. 이러한 작용기는 항원-결합 키메라 단백질을, 즉 결합쌍의 형성을 통해서, 결합쌍의 다른 절반에 결합하는 다른 단백질, 폴리펩티드 또는 화학적 화합물에 연결시키는데 사용될 수 있다. 예를 들어, 본 발명의 항원-결합 키메라 단백질은 바이오틴에 접합될 수 있고, 아비딘 또는 스트렙타비딘에 접합된 다른 단백질, 폴리펩티드, 화합물 또는 캐리어에 연결될 수 있다. 예를 들어, 이러한 접합된 항원-결합 키메라 단백질은 예를 들어 검출가능한 신호-생산제가 아비딘 또는 스트렙타비딘에 접합되는 진단 시스템에서 리포터로서 사용될 수 있다. 이러한 결합쌍은 예를 들어 또한 약학 목적에 적합한 캐리어를 포함하는, 캐리어에 본 발명의 항원-결합 키메라 단백질을 결합시키는데 사용될 수 있다. 비제한적인 일례는 [Cao and Suresh, Journal of Drug Targetting, 8, 4, 257 (2000)]에 기술된 리포솜 제제이다. 이러한 결합쌍은 또한 본 발명의 항원-결합 키메라 단백질에 치료적 활성제를 연결시키는데 사용될 수 있다. 또한, 페이-로드로서 사용하기 위한 독성 표지, 또는 방사성핵종의 사용이 또한 상기 항원-결합 키메라 단백질의 범주 내에 속한다. 마지막으로, 스캐폴드 단백질에 연결 또는 융합되는 "표지" 또는 "태그"의 사용은 Ig 도메인의 표적 단백질이 비공유적으로 표지될 수 있다는 장점을 제공한다.
본 발명의 추가 양상은 본 발명의 상기 항원-결합 키메라 단백질을 코딩하는 핵산 분자에 관한 것이다. 상기 핵산 분자는 상기 항원-결합 도메인 및 상기 스캐폴드 단백질(들), 및/또는 이의 단편의 코딩 서열을 포함하고, 상기 도메인의 방해된 토폴로지는 상기 도메인 서열이 스캐폴드 단백질 서열(들) (또는 원형 배열 서열, 또는 이의 단편)의 삽입을 함유하게 되어서, N-말단 항원-결합 도메인 단편 및 C-말단 항원-결합 도메인 단편이 상기 핵산 분자 내에서 스캐폴드 단백질 서열 또는 이의 단편에 의해 분리된다는 사실을 반영한다.
다른 실시형태에서, 키메라 유전자는 적어도 프로모터, 항원-결합 키메라 단백질을 코딩하는 상기 핵산 분자, 및 전사 종결 신호를 함유하는 3' 말단 영역을 갖는다고 기술된다. 다른 실시형태는 본 발명의 상기 항원-결합 키메라 단백질을 코딩하거나, 또는 상기 항원-결합 키메라 단백질을 코딩하는 핵산 분자 또는 키메라 유전자를 포함하는 발현 카세트에 관한 것이다. 일정 실시형태에서 상기 발현 카세트는 표적의 가장 적합한 결합제에 대해 선택하기 위한 Ig 도메인의 거대 세트를 함유하는, 면역 라이브러리로서 일반 포맷에 적용된다.
추가 실시형태는 상기 발현 카세트 또는 본 발명의 항원-결합 키메라 단백질을 코딩하는 핵산 분자를 포함하는 벡터에 관한 것이다. 특정 실시형태에서, 이. 콜라이에서 발현을 위한 벡터는 항원-결합 키메라 단백질을 생산하고 그들 표적 존재 또는 부재 하에서 그들을 정제할 수 있게 한다.
대안적인 실시형태는 본 발명의 항원-결합 키메라 단백질, 또는 본 발명의 항원-결합 키메라 단백질을 코딩하는 핵산 분자 또는 발현 카세트 또는 벡터를 포함하는, 숙주 세포에 관한 것이다. 특정 실시형태에서, 상기 숙주 세포는 상기 항원-결합 키메라 단백질의 항원-결합 도메인에 특이적으로 결합하는 항원 또는 표적 단백질을 또한 공발현시킨다.
다른 실시형태는 리간드 스크리닝, 약물 스크리닝, 단백질 포획 및 정제, 또는 생물리학적 연구를 위한, 상기 숙주 세포, 또는 이의 단리된 막 조제물, 또는 이로부터 단리된 단백질의 용도를 개시한다.
상기 벡터를 제공하는 본 발명은 일반 융합 벡터로 고속대량 클로닝을 위한 선택안을 포괄한다. 상기 일반 벡터는 추가 실시형태에 기술되어 있고, 상기 벡터는 효모, 파지, 박테리아 또는 바이러스에서의 표면 디스플레이에 특히 적합하다. 뿐만 아니라, 상기 벡터는 상이한 Ig 도메인의 거대 세트를 갖는 이러한 일반 벡터 또는 발현 카세트를 포함하는 면역 라이브러리의 선택 및 스크리닝에서의 적용분야를 확인할 수 있고, 보존된 Ig 도메인의 동일한 N-말단부, 및 스캐폴드 단백질은 라이브러리에 의해 제공된 나머지 Ig 도메인 서열과 융합된다. 그래서, 특이적 표적에 대한 신규 항원-결합 키메라 단백질의 스크리닝을 위해 구축된 상기 라이브러리 내 차등적 서열은 Ig 도메인 서열, 보다 특히 상기 Ig 도메인 라이브러리의 CDR 영역 내 차이를 통해 제공된다.
본 발명의 다른 실시형태는 (a) 벡터, 발현 카세트, 키메라 유전자 또는 본 발명의 핵산 서열을 포함하는 숙주를 항원-결합 키메라 단백질의 발현에 좋은 조건 하에서, 배양시키는 단계, 및 (b) 임의로는, 발현된 폴리펩티드를 회수하는 단계를 포함하는, 본 발명에 따른 항원-결합 키메라 단백질을 제조하는 방법에 관한 것이다.
일 실시형태에서, 본 발명의 벡터는 항원-결합 키메라 단백질의 컬렉션, 바람직하게 면역 라이브러리를 세포 개체군의 세포외 표면에 디스플레이하는 단계를 포함하는 방법에서 사용에 적합하다. 표면 디스플레이 방법은 Hoogenboom (2005; Nature Biotechnol 23, 1105-16)가 고찰하였고, 박테리아 디스플레이, 효모 디스플레이, (박테리오)파지 디스플레이를 포함한다. 바람직하게, 세포 개체군은 효모 세포이다. 상이한 효모 표면 디스플레이 방법은 모두 단백질을 코딩하는 플라스미드를 보유하는 효모 세포의 세포외 표면에 라이브러리에 의해 코딩되는 각각의 항원-결합 키메라 단백질을 단단히 연결시키는 수단을 제공한다. 지금까지 기술된 대부분의 효모 디스플레이 방법은 효모 사카로마이세스 세레비지아를 사용하지만, 다른 효모 종, 예를 들어 피키아 파스토리스도 역시 사용될 수 있다. 보다 특히, 일부 실시형태에서, 효모 균주는 사카로마이세스, 피키아, 한세눌라, 스키조사카로마이세스, 클루이베로마이세스, 야로위아, 및 칸디다로 이루어진 군으로부터 선택되는 속 유래이다. 일부 실시형태에서, 효모 종은 에스. 세레비지아 (S. cerevisiae), 피. 파스토리스 (P. pastoris), 에이치. 폴리몰파 (H. polymorpha), 에스. 폼베 (S. pombe), 케이, 락티스 (K. lactis), 와이, 리폴리티카 (Y. lipolytica), 및 씨. 알비칸스 (C. albicans)로 이루어진 군으로부터 선택된다. 대부분의 효모 발현 융합 단백질은 세포-표면 단백질의 표면 발현에서 중요한 역할을 하고 효모의 생존능에 필수적인 GPI (글리코실-포스파티딜-이노시톨) 앵커 단백질을 기반으로 한다. 이러한 한 단백질, 알파-글루티닌은 AGA1에 의해 코딩되는 코어 서브유닛으로 이루어지고 AGA2에 의해 코딩되는 소형 결합 서브유닛에 디술피드 브릿지를 통해 연결된다. 핵산 라이브러리를 통해 코딩되는 단백질은 AGA1의 N-말단 영역 또는 AGA2의 C-말단 또는 N-말단에 도입될 수 있다. 양쪽 융합 패턴은 효모 세포 표면 상에서 폴리펩티드의 디스플레이를 야기시키게 될 것이다.
본 명세서에 개시된 벡터는 또한 단백질을 표면 디스플레이 하기 위한 원핵생물 숙주 세포에 적합할 수 있다. 이러한 목적에 적합한 원핵생물은 유박테리아, 예컨대 그람 음성 또는 그람 양성 유기체, 예를 들어 엔테로박테리아과 (Enterobacteriaceae) 예컨대 에스케리치아 (Escherichia), 예를 들어 이. 콜라이 (E. coli), 엔테로박터 (Enterobacter), 어위니아 (Erwinia), 클렙시엘라 (Klebsiella), 프로테우스 (Proteus), 살모넬라 (Salmonella) 예를 들어, 살모넬라 티피뮤리움 (Salmonella typhimurium), 세라티아 (Serratia), 예를 들어, 세라티아 마르세칸스 (Serratia marcescans), 및 시겔라 (Shigella)를 비롯하여, 바실러스 (Bacilli) 예컨대 비. 서브틸리스 (B. subtilis) 및 비. 리체니포르미스 (B. licheniformis) (예를 들어, [DD 266,710 published Apr. 12, 1989]에 개시된 비. 리체니포르미스 41 P), 슈도모나스 (Pseudomonas) 예컨대 피. 애루지노사 (P. aeruginosa), 및 스트렙토마이세스 (Streptomyces)를 포함한다. 바람직한 이. 콜라이 클로닝 숙주 하나는 이. 콜라이 294 (ATCC 31,446)이지만, 다른 균주 예컨대 이. 콜라이 B, 이. 콜라이 X1776 (ATCC 31,537), 및 이. 콜라이 W3110 (ATCC 27,325)이 적합하다. 이들 예는 제한적이라기 보다는 예시적이다. 숙주 세포가 원핵생물 세포일 때, 적합한 세포 표면 단백질의 예는 적합한 박테리아 외부 막 단백질을 포함한다. 이러한 외부 막 단백질은 필리 및 플라겔라, 리포단백질, 빙핵 단백질, 및 오토트랜스포터를 포함한다. 이종성 단백질 디스플레이에 사용되는 예시적인 박테리아 단백질은 LamB (Charbit et al., EMBO J, 5(11): 3029-37 (1986)), OmpA (Freudl, Gene, 82(2): 229-36 (1989)) 및 인티민 (Wentzel et al., J Biol Chem, 274(30): 21037-43, (1999))을 포함한다. 추가의 예시적인 외부 막 단백질은 제한없이 FliC, 풀룰루나제, OprF, OprI, PhoE, MisL, 및 시토리신을 포함한다. 표면 디스플레이에 사용되는 박테리아 막 단백질의 광범위한 목록은 [Lee et al., Trends Biotechnol, 21(1): 45-52 (2003)], [Jose, Appl Microbiol Biotechnol, 69(6): 607-14 (2006)], 및 [Daugherty, Curr Opin Struct Biol, 17(4): 474-80 (2007)]에 상술되어 있다.
뿐만 아니라, 심층 스크리닝 선택을 허용하기 위해서, 벡터는 효모 및/또는 파지 디스플레이에 적용된 후에, 각각 FACS 및 패닝이 후속될 수 있다. 예를 들어 형광-활성화 세포 분류법 (FACS)의 분해력과 조합하여 효모 세포 상에서 항원-결합 키메라의 디스플레이는 바람직한 선택 방법을 제공한다. 효모 디스플레이에서 각각의 항원-결합 단백질은 예를 들어 단일 세포 표면 상에 ∼50.000 카피수로 Aga2p 단백질과의 융합체로서 디스플레이된다. FACS에 의한 선택을 위해서, 상이한 형광성 염료에 의한 표지화는 선택 과정을 결정하게 될 것이다. 항원-결합 키메라-디스플레이 효모 라이브러리는 다음에 사용된 형광성 단백질의 혼합물로 염색될 수 있다. 그 다음으로 2-색 FACS는 개별 세포 개체군을 분해하기 위해 특별한 효모 세포 상에 디스플레이되는 각각의 항원-결합 키메라의 성질을 분석하는데 사용될 수 있다. 관심 단백질을 표적화하는데 매우 적합한 항원-결합 키메라를 디스플레이하는 효모 세포가 결합하게 되고 2-색 FACS에서 대각선을 따라 분류될 수 있다. 이러한 선택 방법에서 벡터의 사용은 예를 들어 일시적 단백질-단백질 상호작용 또는 입체구조-선택적 결합을 특이적으로 표적화하는 항원-결합 키메라 단백질의 스크리닝이 바람직할 때 가장 바람직하다. 유사하게, 파지 디스플레이용 벡터가 적용되고, 박테리오파지 상에서 항원-결합 키메라의 디스플레이에 사용된 후에, 패닝이 후속된다. 디스플레이는 예를 들어 상기 일반 벡터 내에, 파지 외피 단백질 III과 항원-결합 키메라의 융합을 통해 M13 입자 상에서 수행될 수 있다 (Hoogenboom, 2000; Immunology today. 5699:371-378). 예를 들어, 일정 입체구조 및/또는 일시적 단백질-단백질 상호작용에 특이적으로 결합하는 항원-결합 단백질의 선택을 위해서, 오직 하나의 상호작용 프로토머가 고체상에 고정된다. 파지-디스플레이된 항원-결합 키메라의 패닝에 의한 생물-선택은 과량의 나머지 가용성 프로토머의 존재 하에서 수행된다. 임의로는, 고체상에 고정된 가교된 복합체 또는 단백질 상에서의 패닝 라운드로 시작될 수 있다.
본 발명의 다른 양상은 상기 항원-결합 키메라 단백질을 포함하거나, 또는 항원-결합 키메라 단백질, 및 항원 또는 표적 단백질(들)의 조성물을 포함하는 복합체에 관한 것이고, 상기 표적 단백질은 항원-결합 키메라 단백질 또는 항원-결합 키메라 단백질의 조성물에 특이적으로 결합한다. 보다 특히, 상기 표적 단백질은 상기 항원-결합 키메라 단백질의 항원-결합 도메인에 결합되고, 보다 더 특히, 일 실시형태에서, 상기 항원-결합 도메인은 Ig 도메인, 상기 항원-결합 키메라 단백질의 Ig 도메인의 CDR이다. 일 실시형태는 본 명세서에 기술된 바와 같은 복합체를 개시하고, 여기서 항원-결합 도메인은 입체구조 선택적 결합 도메인이다. 보다 특히, 복합체는 항원-결합 도메인이 기능적 입체구조의 표적 단백질을 안정화시키는 것이 개시된다. 보다 특히 상기 기능적 입체구조는 효현제 입체구조를 포함할 수 있거나, 부분 효현제 입체구조를 포함할 수 있거나, 특히 편향 효현제 입체구조를 포함할 수 있다. 대안적으로, 본 발명의 복합체는 항원-결합 도메인이 기능적 입체구조인 표적 단백질을 안정화시키는 것이 개시되고, 상기 기능적 입체구조는 불활성 입체구조이거나, 또는 상기 구조적 입체구조는 역 효현제 입체구조를 포함한다.
본 발명의 추가 양상은 상기 항원-결합 키메라 단백질을 포함하는 조성물에 관한 것이다. 본 발명의 "조성물"은 동결건조된 항원-결합 키메라 단백질을 포함하는 제1 용기 및 동결건조된 단백질의 재현탁을 위한 용액을 포함하는 제2 용기를 포함하는 키트의 형태로 제공될 수 있다. 단백질 분말은 동결건조 동안 단백질을 안정화시키기 위해서 하나 이상의 저온보존제 예컨대 수크로스, 덱스트란, 솔비톨 및 아미노산을 포함할 수 있다. 대안적으로, 조성물은 현탁액 또는 용액에 항원-결합 키메라 단백질을 포함하는 단일 용기로 제공된다. 각 용액은 하나 이상의 부형제(들)를 함유할 수 있다. 전형적으로 용액은 물-기반이다. 그러므로, 정제수가 주요 부형제를 형성할 수 있다. 예를 들어, 바람직한 최종 농도를 제공하기 위한 단백질의 희석은 일반적으로 주사용 수 (WFI)로 수행될 것이다. 전형적으로 용액은 완충제를 함유한다. 그러므로, 추가 부형제는 완충제 및 pH 조절제 예컨대 소듐 시트레이트, 소듐 디히드로겐 포스페이트 모노히드레이트, 및 소듐 히드록시드를 포함한다. 일부 예에서, 증점제 예컨대 잔탄이 추가 부형제로서 존재할 수 있다. 계면활성제, 특히 비이온성 계면활성제 예컨대 폴리솔베이트 80이 또한 존재할 수 있다. 다른 부형제는 수크로스, 솔비톨, 무기 염, 아미노산 및 비타민을 포함한다.
본 발명은 또한 본 발명의 하나 이상의 화합물, 특히, 항원-결합 키메라 단백질 및 약학적으로 허용가능한 담체 또는 희석제를 포함하는 "약학 조성물"에 관한 것이다. 이들 약학 조성물은 이를 필요로 하는 환자에게 투여되어 바람직한 약학 효과를 달성하는데 이용될 수 있다. 본 발명은 약학적으로 허용가능한 담체 및 본 발명의 화합물 또는 이의 염의 약학적 유효량을 포함하는 약학 조성물을 포함한다. 화합물의 약학적 유효량은 바람직하게 치료하려는 특정 병태에 영향력을 발휘하거나 또는 결과를 일으키는 양이다. 일반적으로, "치료적 유효량", "치료적 유효 용량" 및 "유효량"은 바람직한 결과 또는 결과들을 달성하는데 필요한 양을 의미한다. 당업자는 역가 및 따라서 "유효량"이 본 발명의 화합물의 정체성 및 구조에 따라 가변적일 수 있다는 것을 인식하게 될 것이다. 당업자는 화합물의 역가를 쉽게 평가할 수 있다. "약학적으로 허용가능한"이란 생물학적이지 않거나 또는 달리 바람직하지 않은 물질을 의미하고, 다시 말해서, 물질이 그것이 함유된 약학 조성물의 임의의 다른 성분과 유해한 방식으로 상호작용하거나 또는 임의의 바람직하지 않은 생물학적 효과를 야기시키지 않고 화합물과 함께 개체에게 투여될 수 있다. 약학적으로 허용가능한 담체는 바람직하게 담체에 기인한 임의의 부작용이 활성 성분의 유익한 효과를 손상시키지 않도록 활성 성분의 유효한 활성과 일관되는 농도에서 환자에게 비교적 무독성이고 무해한 담체이다. 적합한 담체 또는 보조제는 전형적으로 하기의 비제한적인 목록에 포함되는 화합물 중 하나 이상을 포함한다: 거대한 서서히 대사되는 거대분자 예컨대 단백질, 폴리사카라이드, 폴리락트산, 폴리글리콜산, 중합체 아미노산, 아미노산 공중합체 및 불활성 바이러스 입자. 이러한 성분 및 절차는 하기 참조에 기술된 것들을 포함하고, 각각은 참조로 본 명세서에 편입된다: Powell, M. F. et al. ("Compendium of excipients for Parenteral Formulations" PDA Journal of Pharmaceutical Science & Technology 1998, 52(5), 238-311), Strickley, R.G ("Parenteral Formulations of Small Molecule Therapeutics Marketed in the United States (1999)-Part-1" PDA Journal of Pharmaceutical Science & Technology 1999, 53(6), 324-349), 및 Nema, S. et al. ("Excipients and Their Use in Injectable Products" PDA Journal of Pharmaceutical Science & Technology 1997, 51 (4), 166-171).
본 명세서에서 사용되는 용어 "부형제"는 약학 조성물에 존재할 수 있고 활성 성분이 아닌 모든 물질, 예컨대 염, 결합제 (예를 들어, 락토스, 덱스트로스, 수크로스, 트레할로스, 솔비톨, 만니톨), 윤활제, 증점제, 계면 활성제, 보존제, 유화제, 완충 물질, 안정화제, 풍미제 또는 착색제를 포함하고자 한다. "희석제", 특히 "약학적으로 허용가능한 비히클"은 비히클, 예컨대 물, 염수, 생리적 염 용액, 글리세롤, 에탄올 등을 포함한다. 보조 물질 예컨대 습윤제 또는 유화제, pH 완충 물질, 보존제가 이러한 비히클에 포함될 수 있다.
본 발명의 항원-결합 키메라 단백질 및 약학적으로 허용가능한 담체는 즉시, 지연 및 정기 방출 조제물을 포함한, 임의의 유효한 통상의 제형을 사용해 충분히 공지된 약학적으로 허용가능한 담체와 투여될 수 있고, 임의의 적합한 경로 예컨대 당업자에게 일반적으로 공지된 임의의 것들로 투여될 수 있다. 요법의 경우, 본 발명의 약학 조성물은 표준 기술에 따라 임의 환자에게 투여될 수 있다.
경구 투여의 경우, 화합물은 액상 또는 고상 조제물, 예컨대 캡슐, 알약, 정제, 트로키, 로진제, 멜트, 분말, 용액, 현탁액 또는 에멀션으로 제제화될 수 있고, 약학 조성물의 제조를 위해 당분야에 공지된 방법에 따라 제조될 수 있다. 고형 단위 제형은 예를 들어, 계면활성제, 윤활제, 및 불활성 충전제 예컨대 락토스, 수크로스, 칼슘 포스페이트, 및 옥수수 전분을 함유하는 통상의 경질 또는 연질-제피 젤라틴 유형의 캡슐일 수 있다. 다른 실시형태에서, 본 발명의 화합물은 통상의 정제 베이스 예컨대 락토스, 수크로스 및 옥수수 전분을 결합제 예컨대 아카시아, 옥수수 전분 또는 젤라틴, 투여 후 정제의 분해 및 용해를 보조하고자 하는 붕해제 예컨대 감자 전분, 알긴산, 옥수수 전분, 및 구아르 검, 검 트라가칸트, 아카시아, 정제 과립화의 흐름을 개선시키고 정제 다이스 및 펀치 표면에 정제 물질의 부착을 방지하고자 하는 윤활제, 예를 들어 탈크, 스테아르산, 또는 마그네슘, 칼슘 또는 아연 스테아레이트, 염료, 착색제, 및 풍미제 예컨대 페퍼민트, 윈터그린 오일, 또는 정제의 심미적 품질을 향상시키고 환자에게 보다 수용가능하게 만드는 체리향과 조합하여 타정될 수 있다. 경구 액상 제형에 사용을 위해 적합한 부형제는 약학적으로 허용가능한 계면활성제, 현탁제 또는 유화제의 첨가와 함께 또는 첨가없이, 디칼슘 포스페이트 및 희석제 예컨대 물 및 알콜, 예를 들어 에탄올, 벤질 알콜, 및 폴리에틸렌 알콜을 포함한다. 다양한 다른 물질이 제피로서 존재할 수 있거나 또는 달리 단위 제형의 물리적 형태를 변형시키기 위해 존재할 수 있다. 예를 들어, 정제, 알약 또는 캡슐은 셀락, 당류 또는 둘 모두로 피복될 수 있다. 분산가능한 분말 및 과립이 수성 현탁액의 제조에 적합하다. 그들은 분산제 또는 습윤제, 현탁제 및 하나 이상의 보존제와 혼합하여 활성 성분을 제공한다. 적합한 분산제 또는 습윤제 및 현탁제는 이미 상기에 언급된 것들로 유화된다. 추가 부형제, 예를 들어, 상기 기술된 감미제, 풍미제 및 착색제가 또한 존재할 수 있다.
약학 조성물은 멸균된 주사가능한 수성 현탁액의 형태일 수 있다. 이러한 현탁액은 적합한 분산제 또는 습윤제 및 현탁제 예컨대, 예를 들어 소듐 카복시메틸셀룰로스, 메틸셀룰로스, 히드록시프로필메틸-셀룰로스, 소듐 알기네이트, 폴리비닐피롤리돈, 검 트라가칸트 및 검 아카시아; 천연 발생 포스파티드 예컨대 레시틴, 알킬렌 옥시드와 지방산의 축합 산물, 예를 들어, 폴리옥시에틸렌 스테아레이트, 에틸렌 옥시드와 장쇄 지방족 알콜의 축합 산물, 예를 들어 헵타데카에틸렌옥시세타놀, 에틸렌 옥시드와 지방산 및 헥시톨 유래 부분 에스테르의 축합 산물 예컨대 폴리옥시에틸렌 솔비톨 모노올레에이트, 또는 에틸렌 옥시드와 지방산 및 헥시톨 무수물 유래 부분 에스테르의 축합 산물, 예를 들어 폴리옥시에틸렌 솔비탄 모노올레에이트일 수 있는 분산제 또는 습윤제를 사용하여 공지 방법에 따라 제제화될 수 있다. 멸균 주사가능한 조제물은 또한 무독성의 비경구로 허용가능한 희석제 또는 용매 중 멸균 주사가능한 용액 또는 현탁액일 수 있다. 적용할 수 있는 희석제 및 용매는 예를 들어, 물, 링거액, 등장성 소듐 클로라이드 용액 및 등장성 글루코스 용액이다. 또한, 멸균 고정유가 용매 또는 현탁 매질로서 통상적으로 적용된다. 이러한 목적을 위해서, 합성 모노글리세리드 또는 디글리세리드를 포함한 임의 블랜드, 고정유가 적용될 수 있다. 또한, 지방산 예컨대 올레산이 주사가능한 조제물에 사용될 수 있다.
다른 양상은 표적 단백질의 구조 분석에서, 본 발명의 항원-결합 키메라 단백질 또는 핵산 분자, 키메라 유전자, 발현 카세트, 벡터, 복합체, 또는 조성물의 용도에 관한 것이다. 특히, 표적 단백질의 구조 분석에서 항원-결합 키메라 단백질의 용도로서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질에 특이적으로 결합하는 단백질이다. 본 명세서에서 사용되는 "구조 분해" 또는 "구조 분석"은 단백질의 원자 배열 또는 원자 좌표의 결정을 의미하고, 종종 생물리적 방법, 예컨대 X-선 결정학 또는 저온 전자 현미경 (cryo-EM)으로 수행된다. 특히, 실시형태는 단일 입자 cryo-EM을 포함하거나 또는 결정학을 포함하는 구조 분석에서의 용도에 관한 것이다. 구조 생물학에서 본 발명의 항원-결합 키메라 단백질의 용도는 결정화 보조제로서 제공되고, 즉 결정 접촉부로서 역할을 하고 대칭성을 증가시키고, 보다 더욱 거대 구조를 분해하는데 매우 가치있지만 주로 오늘날 대항되는 크기 장벽을 감소시키고, 최종적으로는 역시 대칭성을 증가시키는 주요 장점을 제공한다.
구조 결정에서 cryo-EM의 사용은 보다 전통적인 접근법 예컨대 X-선 결정학보다 몇몇 장점을 갖는다. 특히, cryo-EM은 순도, 균질성 및 분량에 대해 분석하려는 샘플에 덜 엄격한 요건을 갖는다. 중요하게, cryo-EM은 구조 결정을 위해 적합한 결정을 형성하지 않는 표적에 적용될 수 있다. 다른 단백질성 분자 예컨대 항원-결합 키메라 단백질 또는 비단백질성 분자 예컨대 핵산과의 복합체로 또는 단독으로, 정제 또는 미정제 단백질의 현탁액이 cryo-EM에 의한 영상화를 위한 탄소 격자로 적용될 수 있다. 코팅된 격자는 냉동-수화 상태로 현탁액 중에 입자를 보존하기 위해, 일반적으로 액상 에탄에서 급속 냉동된다. 더 큰 입자는 저온고정을 통해 유리화된다. 유리화된 샘플은 저온박편절단기에서 얇은 절편 (전형적으로 40 내지 200 nm 두께)으로 절단되고, 절편이 영상화를 위해 전자 현미경 격자 상에 위치될 수 있다. 이미지로부터 수득된 데이터의 품질은 ∼3.3Å정도로 높은 분해능을 수득하기 위해 더 나은 현미경 정렬 및 평행 조사를 사용해 개선될 수 있다. 이러한 높은 분해능에서, 전체 원자 구조의 초기 모델 구축이 가능하다. 그러나, 저분해능 영상화는 선택되거나 또는 밀접하게 관련된 표적 단백질에 대한 원자 분해능에서의 구조 데이터 및 선택된 이종성 단백질 또는 가까운 상동체가 제한된 비교 모델링에 이용가능한 경우에 충분할 수 있다. 데이터 품질을 더 개선시키기 위해서, 현미경은 영상화를 위해 사용되는 동일 조건 하에서 기록되는 탄소 필름 이미지의 퓨리에 전환에서 1/3 Å-1 를 넘는 가시적인 대비 전달 함수 (contrast transfer function) (CTF) 고리를 밝히도록 조심스럽게 정렬될 수 있다. 각 마이크로그래프에 대한 디포커스 값은 소프트웨어 예컨대 CTFFIND를 사용해 결정될 수 있다.
본 발명의 다른 양상은 표적 단백질 또는 관심 단백질의 3-차원 구조를 결정하는 방법에 관한 것으로서, 하기 단계를 포함한다:
(i) 복합체를 형성하도록, 항원-결합 키메라 단백질 또는 본 발명의 항원-결합 키메라 단백질의 조성물, 및 표적 단백질을 제공하는 단계로서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질 또는 조성물에 특이적으로 결합하는 것인 단계,
또는 본 발명의 복합체를 제공하는 단계; 및
(ii) 구조 분석을 위해 적합한 조건 하에서 상기 믹스 또는 복합체를 디스플레이하는 단계,
여기서 상기 표적 단백질의 3D 구조는 고분해능에서 결정된다.
특별한 실시형태에서, 상기 구조 분석은 X-선 결정학을 통해 수행된다. 다른 실시형태에서, 상기 3D 분석은 Cryo-EM을 포함한다. 보다 특히, Cryo-EM 분석을 위한 방법론은 하기와 같이 본 명세서에 기술된다. 샘플 (예를 들어, 관심 표적과 복합체로 선택된 메가바디 단백질)은 블롯팅 전에 선택된 최고 성능 방출 격자 (탄소-코팅된 구리 격자, C-Flat, 1.2/1.3 200-mesh: Electron Microscopy Sciences; gold R1.2/1.3 300 mesh UltraAuFoil grids: Quantifoil; 등)에 적용되고 나서, 액상 에탄에 플런지-냉동된다 (Vitrobot Mark IV (FEI) 또는 기타 선택 플런저). 단일 격자의 데이터는 선택 검출기 (예로서 Falcon 3EC 직접 검출기)가 장착된 300kV 전자 현미경 (선택 위상판이 제공된 예로서 Krios 300kV)에서 수집된다. 마이크로그래프는 예상되는 메가바디-항원 복합체 크기에 적합한 적절한 배율에서 전자-계측 모드로 수집된다. 수집된 마이크로그래프는 추가 이미지 처리 전에 수동으로 검토된다. 선택 소프트웨어 (예로서, RELION, SPHIRE 패키지)에 의해 계기 보정, 빔 유도 방식, 용량-가중, CTF 적합화 상 이동 추정이 적용된다. 선택 소프트웨어를 사용하여 입자를 선택하고 그들을 2D 분류에 사용한다. 2D 클래스를 수동으로 조사하고 거짓 양성을 제거한다. 데이터 수집 설정에 따라 입자를 저장한다. 적절한 저역 필터를 적용하고 다수 (예로서 6)의 3D 클래스를 생성시켜서 초기 3D 기준 모델을 생성시킨다. 3D 정밀화 (필요하면 소프트 마스크 사용)를 위해 본래 입자를 사용한다. FSC (Fourier Shell Correlation) = 0.143 기준을 사용하여 재구성 분해능을 추정한다. 국소 분해는 Scipion의 MonoRes 구현을 통해 계산하였다. 재구성된 cryo-EM 지도는 UCSF Chimera 및 Coot 소프트웨어를 사용하여 분석하였다. 디자인 모델은 UCSF Chimera를 사용해 초기에 적합화시키고 선택 소프트웨어 (UCSF Chimera, PyMOL 또는 Coot)로 분석하였다.
본 발명의 방법의 다른 장점은 통상의 방식에서 고도로 순수한 단백질에 의해서만 오직 가능한, 구조 분석이 항원-결합 키메라 단백질의 사용 덕분에 순도 요건에 덜 엄격하다는 것이다. 이러한 항원-결합 단백질은 특히 나노바디의 경우에, 복합체 혼합물 내에서, 이에 에피토프와의 결합을 통해 관심 단백질을 특이적으로 걸러내게 된다. 표적 단백질을 이러한 방식으로 포획, 냉동하고 cryo-EM을 통해 분석할 수 있다.
대안적인 실시형태에서 상기 방법은 3D 분석에 적합하고 여기서 표적 단백질은 일시적 단백질-단백질 복합체이다. 추가로, 상기 키메라 항원-결합 분자는 또한 표적이 그들 구조 분석을 허용하게 일시적 단백질-단백질 상호작용을 안정화시키기 위한 표적의 3-차원 구조를 결정하기 위한 방법에 적용될 수 있다.
다른 실시형태는 하기 단계를 포함하는, 동일 표적 단백질의 상이한 에피토프에 결합하는 항원-결합 키메라 단백질의 패널에 대한 선택 또는 스크리닝 방법에 관한 것이다: (i) 표적 단백질에 결합하는 항원-결합 키메라 단백질의 면역 라이브러리를 디자인하는 단계, 및 (ii) 상기 표적의 몇몇 에피토프에 결합하는 단백질을 포함하는 항원-결합 키메라 단백질 패널을 수득하기 위해서 표면 효모 디스플레이, 파지 디스플레이 또는 박테리오파지를 통해 항원-결합 키메라 단백질을 선택하는 단계로서, 그리하여 표적 단백질의 몇몇 입체구조가 별개 이미지로 예를 들어 cryo-EM에서 분석될 수 있게 된다.
다른 실시형태에서, 본 발명의 상기 방법 및 상기 항원-결합 키메라 단백질은 구조-기반 약물 디자인 및 구조-기반 약물 스크리닝에 사용된다. 구조-기반 약물 디자인의 반복 과정은 종종 최적화된 선두체가 제I상 임상 시험으로 가기 전에 다수 사이클을 통해 진행된다. 제1 사이클은 클로닝, 정제, 및 3개 주요 방법: X-ray 결정학, NMR, 또는 상동성 모델링 중 하나를 통해서 표적 단백질 또는 핵산의 구조 결정을 포함한다. 컴퓨터 알고리즘을 사용하여, 데이터베이스의 화합물 또는 화합물의 단편이 구조의 선택된 영역에 위치된다. 본 발명의 항원-결합 키메라 단백질을 사용하여 표적의 일정 구조적 입체구조를 고정 또는 안정화시킬 수 있다. 선택된 화합물은 이 표적 부위와 그들의 입체적 및 정전기적 상호작용을 기반으로 채점되어 등급분류되고, 최고 화합물이 생화학 어세이에서 시험된다. 제2 사이클에서, 시험관내에서 적어도 마이크로몰로 억제했던 하나로서, 제1 사이클로부터의 유망한 선두체와 복합체로서 표적의 구조 결정은, 역가를 증가시키기 위해 최적화시킬 수 있는 화합물 상의 부위를 밝혀준다. 또한 이 시점에, 본 발명의 항원-결합 키메라 단백질은 이것이 일정한 입체구조적 상태에서 상기 표적의 구조 분석을 용이하게 하므로, 작용하게 될 것이다. 추가 사이클은 최적 선두체의 합성, 새로운 표적: 선두체 복합체의 구조 결정, 및 선두 화합물의 추가 최적화를 포함한다. 약물 디자인 과정의 몇몇 사이클 이후에, 최적 화합물은 일반적으로 결합, 및 종종 표적에 대한 특이성에서 두드러진 개선을 보인다. 라이브러리 스크리닝은 구조 정보뿐만 아니라, 구조-활성-상관성 분석을 위한 의약 화학에 필수적인, 선두체로 더욱 개발되는, 히트를 야기시킨다.
다른 실시형태에서, 본 발명의 방법에서 사용되는 상기 항원-결합 키메라 단백질의 항원-결합 도메인은 나노바디 Ig 도메인을 포함하고, 그리하여, 나노바디를 사용하는 디스플레이된 항원-결합 키메라에 대한 선택이 입체구조적 에피토프에 대한 대개의 결합제를 밝혀주기 때문에 올바르게 폴딩된 표적 단백질의 평균 이미지만을 포함하게 되는 상기 방법의 추가 장점을 제공한다.
다른 실시형태는 하기 단계들을 포함하는, (입체구조-선택적) 화합물을 동정하는 방법에 관한 것이다:
i) 표적 단백질 및 상기 표적 단백질에 특이적으로 결합하는 항원-결합 키메라 단백질을 제공하는 단계;
ii) 시험 화합물을 제공하는 단계;
iii) 표적 단백질에 대한 시험 화합물의 선택적 결합을 평가하는 단계.
특히 바람직한 실시형태에 따라서, 입체구조-선택적 화합물을 동정하는 상기 기술된 방법은 리간드 결합 어세이 또는 경쟁 어세이, 보다 더 바람직하게 방사리간드 결합 또는 경쟁 어세이를 통해 수행된다. 가장 바람직하게, 입체구조-선택적 화합물을 동정하는 상기 기술된 방법은 실시예 섹션에서 더욱 예시하는, 비교 어세이, 보다 특히 비교 리간드 경쟁 어세이, 보다 더 특히 비교 방사리간드 경쟁 어세이로 수행된다.
시험하려는 화합물은 임의의 소형 화합물, 또는 거대분자, 예컨대 단백질, 당류, 핵산 또는 지질일 수 있다. 전형적으로, 시험 화합물은 소형 화학 화합물, 펩티드, 항체 또는 이의 단편이게 될 것이다. 일부 예에서 시험 화합물은 시험 화합물의 라이브러리일 수 있다는 것을 이해할 것이다. 특히, 효현제, 길항제 또는 역효현제 및/또는 조절제와 같은 치료 화합물에 대한 대량고속 스크리닝 어세이가 본 발명의 일부를 형성한다. 대량 고속 목적의 경우, 화합물 라이브러리 또는 조합 라이브러리, 예컨대 알로스테릭 화합물 라이브러리, 펩티드 라이브러리, 항체 라이브러리, 단편-기반 라이브러리, 합성 화합물 라이브러리, 천연 화합물 라이브러리, 파지-디스플레이 라이브러리 등이 사용될 수 있다. 이러한 라이브러리를 제조 및 스크리닝하는 방법론은 당업자에게 공지되어 있다. 시험 화합물은 임의로는 검출가능한 표적에 공유적으로 또는 비공유적으로 연결될 수 있다. 그들을 부착시켜서, 사용하고 검출하기 위한 적합한 검출가능한 표지 및 기술은 당업자에게 자명할 것이고, 제한없이, 분광법, 광화학, 생화학, 면역화학, 전기, 광학 또는 화학 수단을 통해 검출가능한 임의의 조성물을 포함한다. 유용한 표지는 자성 비드 (예를 들어, dynabead), 형광성 염료 (예를 들어, 모든 Alexa Fluor 염료, 플루오레세인 이소티오시아네이트, 텍사스 레드, 로다민, 녹색 형광성 단백질 등), 방사능표지 (e.g. 3H, 125I, 35S, 14C, 또는 32P), 효소 (예를 들어, 홀스 래디쉬 퍼옥시다제, 알칼리 포스파타제), 및 비색 표지 예컨대 콜로이드 금 또는 유색 유리 또는 플라스틱 (예를 들어, 폴리스티렌, 폴리프로필렌, 라텍스 등) 비드를 포함한다. 이러한 표지를 검출하는 수단은 당업자에게 충분히 공지되어 있다. 따라서, 예를 들어, 방사능표지는 사진 필름 또는 섬광 계측기를 사용해 검출될 수 있고, 형광 마커는 방출 조명을 검출하기 위해 광검출기를 사용해 검출할 수 있다. 효소 표지는 전형적으로 효소에 기질을 제공하고 기질에 대한 효소의 작용으로 생산된 반응 산물을 검출하여 검출되며, 비색 표지는 유색 표지를 간단히 가시화하여 검출된다. 다른 적합한 검출가능한 표지는 본 발명의 키메라 폴리펩티드에 관한 본 발명의 제1 양상의 내용에서 앞서 기술하였다. 따라서, 특별한 실시형태에 따라서, 상기 임의의 스크리닝 방법에서 사용되는 시험 화합물은 앞서 본 명세서에 정의된 바와 같은, 폴리펩티드, 펩티드, 소형 분자, 천연 산물, 펩티드모방체, 핵산, 지질, 리포펩티드, 탄수화물, 항체 또는 이로부터 유래된 임의 단편, 예컨대 Fab, Fab' 및 F(ab')2, Fd, 단쇄 Fvs (scFv), 단쇄 항체, 디술피드-연결 Fv (dsFv) 및 VL 또는 VH 도메인을 포함하는 단계, 중쇄 항체 (hcAb), 단일 도메인 항체 (sdAb), 미니바디, 낙타과 중쇄 항체로부터 유래된 가변 도메인 (VHH 또는 나노바디), 상어 항체로부터 유래된 신규 항원 수용체의 가변 도메인 (VNAR), 알파바디를 포함하는 단백질 스캐폴드, 단백질 A, 단백질 G, 디자인된 앵키린-반복 도메인 (DARPin), 피브로넥틴 III형 반복부, 안티칼신, 노틴, 조작된 CH2 도메인 (나노항체)을 포함하는 군에서 선택된다. 바람직한 일 실시형태에서, 대량고석 스크리닝 방법은 많은 잠재적 치료 리간드를 함유하는 조합 화학 또는 펩티드 라이브러리를 제공하는 단계를 포함한다. 이러한 "조합 라이브러리" 또는 "화합물 라이브러리"는 바람직한 특징적인 활성을 디스플레이 하는 라이브러리 구성원 (특히 화학종 또는 하위부류)을 동정하기 위해, 본 명세서에 기술된 바와 같은, 하나 이상의 어세이에서 스크리닝된다. "화학 라이브러리"는 궁극적으로 대량고속 스크리닝에서 일반적으로 사용되는 저장된 화학물의 컬렉션이다. "조합 라이브러리"는 다수의 화학적 "빌딩 블록"을 조합하여, 화학 합성 또는 생물학적 합성으로 생성시킨 다양한 화학 화합물의 컬렉션이다. 조합 라이브러리의 제조 및 스크리닝은 당업자에게 충분히 공지되어 있다. 따라서 동정된 화합물은 통상적으로 "선두 화합물"로서 제공될 수 있거나 또는 그들 자체가 잠재적이거나 또는 실제의 치료제로서 사용될 수 있다.
다른 양상은 진단 도구, 또는 보다 특히 생체내 영상화를 위한, 상기 항원-결합 키메라 단백질의 용도를 제공하고, 여기서 스캐폴드 단백질은 표지된 단백질이다.
그리고 마지막 양상은 의약으로서 사용을 위한, 상기 항원-결합 키메라 단백질 또는 핵산, 벡터, 복합체, 또는 조성물을 제공한다. 본 명세서에서 용어 "의약"은 요법, 즉 질환 또는 장애의 예방 또는 치료에서 사용되는 물질/조성물을 의미한다. 본 발명에 따라서, 용어 "질환" 또는 "장애"는 임의의 병리학적 상태, 특히 본 명세서에 정의된 바와 같은 질환 또는 장애를 의미한다.
특정 실시형태, 특정 구성을 비롯한 물질 및/또는 분자가 본 발명에 따른 조작된 세포 및 방법을 위해 본 명세서에서 논의되었지만, 본 발명의 정신 및 범주를 벗어나지 않고 형태 및 상세한 내용에서 다양한 변화 또는 변형이 만들어질 수 있다는 것을 이해한다. 하기 실시예는 특정 실시형태를 보다 잘 예시하기 위해 제공되며, 그들이 본 출원을 제한하는 것으로 간주되어서는 안된다. 본 출원은 오직 청구항에 의해서만 제한된다.
실시예
일반
우리는 항원-결합 도메인 및 스캐폴드 단백질에 의해 구축된 강성 항원-결합 키메라 단백질을 디자인하였고, 여기서 항원-결합 도메인은 2개 또는 3개의 짧은 링커를 통해서, 또는 2개 또는 3개의 직접 연결을 통해 스캐폴드 단백질에 연결된다. 스캐폴드의 성질에 따라서, 이들 강성 항원-결합 키메라 단백질은 상이한 적용분야를 제공한다.
예로서, 본 명세서에서 제시하는 '항원-결합 키메라 단백질'은 또한 '메가바디' (Mb 또는 Mgb)라고도 하며 스캐폴드 단백질, 특히 거대 단량체 스캐폴드 상에 그라프트된 나노바디, VHH 또는 모노바디를 함유하는 면역글로불린- 또는 면역글로불린-유사 도메인으로부터 구축된다. 이들 항원-결합 키메라 또는 특히 본 명세서에서 사용되는 메가바디는 (소형) 단백질의 단백질 구조를 결정하기 위해 중요하고, X-선 결정학 및 cryo-EM 적용분야를 포함해 몇몇 적용에서 도움이 된다. Mb는 표적의 입체구조적 가요성을 감소시키고 결정 접촉부를 형성시키는 경향이 있는 표면을 연장시킬뿐만 아니라, 추가의 위상 정보를 제공하여 차세대 결정화 샤페론으로서 기능한다. 뿐만 아니라, 혁신적인 보조 도구로서 이들 키메라를 사용하여, Cryo-EM을 사용해 고분해능 구조를 수득하기 위해 크기-장벽을 감소시켰다. 특이적 메가바디 항원-결합 키메라 단백질과 이의 표적을 혼합하여, 그들 특이적 결합 상호작용은 "질량" 부가를 획득하고 입자에 대해 정해진 특성이 유리화 얼음에 포매되어서, 정확한 이미지 정렬을 촉진하고 3D 재구성의 분해능을 개선시킨다. 이러한 항원-결합 키메라 단백질 예컨대 Mb의 사용의 추가 장점은 그들이 1 대 1 비율로 입체구조적 에피토프에 선택적으로 결합하여, 입자 분류를 촉진하여 분류된 입자의 구조/입체구조 균질성을 개선시키고 3D 재구성의 분해능을 개선시킨다는 것이다. 유사하지만, 동일 단백질 상의 상이한 에피토프에 결합하는 상이한 Mb의 상당한 세트가 동일 거대분자 복합체로부터 상이한 입자를 제조하는데 사용/조합될 수 있다.
이러한 접근법의 개념의 증거로서, 우리는 도 2에 따라 GFP-특이적 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 HopQ (에이치. 피로리 유래 주변세포질 단백질, PDB 5LP2)의 어드헤신 도메인을 코딩하는 유전자의 원형 배열 변이체 (cHopQ)를 삽입시켰다 (실시예 1). 우리는 이 키메라를 이. 콜라이의 주변세포질에서 분비 단백질로서 발현시켰고 mg 양의 균질성으로 정제하였다 (실시예 2). 다음으로, 이 키메라 항체를 GFP에 결합시키고 이의 구조를 X-ray 결정학을 통해 분해시켜 확인하였다 (실시예 3). 동일한 스캐폴드를 사용하여, 또한 단백질 복합체를 안정화시키는 항원-결합 키메라 단백질 (실시예 4), GPCR에 결합하는 항원-결합 키메라 단백질 (실시예 5) 및 이온 채널에 결합하는 항원-결합 키메라 단백질 (실시예 6; 및 실시예 22)을 만들었다. 게다가, 실시예 5는 입체구조-특이적 안정화를 수득할 수 있어서, 메가바디를 구축시킨 항원-결합 도메인 또는 Nb의 모든 기능적 성질을 보존한다는 것을 밝혀주었다. 또한 링커 길이 및 링커 조성이 다양한 2개의 짧은 폴리펩티드 연결을 통해서 다른 기능성 HopQ-기반 메가바디를 디자인하기 위해 시험관내 진화 기술을 사용하였다 (실시예 7). 다른 거대 스캐폴드 단백질이 메가바디를 구축하는데 사용될 수 있다는 것을 보여주기 위해서, 다음으로 길이 및 조성이 상이한 2개의 짧은 폴리펩티드 연결을 통해서 GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 이. 콜라이의 86 kDa 주변세포질 단백질인 YgjK (PDB 3W7S)를 코딩하는 유전자의 원형 배열 변이체를 삽입시켰다 (실시예 8). 또한 메가바디를 강성화시키기 위해서 나노바디의 C-말단 및 링커 펩티드 중 하나 사이에 디술피드 결합을 조작할 수 있다는 것을 보여주었다 (실시예 9). 보다 복잡한 연결 계획을 통해서 스캐폴드에 연결된 Nb로부터 구축된 다른 강성 항체 키메라를 또한 구축하였다. 시험관내 진화를 사용하여, 길이 및 조성이 다양한 3개의 짧은 폴리펩티드 연결부를 통해서 GFP-특이적 나노바디를 아주린 (PDB 2TSA)에 융합시켰다. 아주린은 X-선 결정학에서 변칙 산란에 의한 위상조절에 사용하기 위한 구리 함유 단일 도메인 단백질이다 (실시예 10). 메가바디로서 본 명세서에 기술된 최종 항원-결합 키메라 단백질은 X-선 결정학 및 단일 입자 cryo-EM에 의한 단백질 또는 복합체의 구조적 연구를 가능하게 한다는 것이 확인되었다. 유사하게, 항원-결합 도메인은 구조적 대칭성을 갖는 다량체 스캐폴드에 강성으로 커플링되어서 구조적 대칭성을 갖는 다량체 항원-결합 키메라 단백질 또는 다량체 메가바디를 생성시킬 수 있다. 이러한 원리를 증명하기 위해서, 리소자임-결합 Nb를 나노바디를 스캐폴드에 연결시키는 3개의 짧은 폴리펩티드 링커를 통해서, 비. 테타이오타오미크론 (B. thetaiotaomicron) (PDB 3WFA)의 전화성 글리코시다제 히드롤라제 동종 이량체, SusB 상에 그라프트시켰다 (실시예 11). 2-폴드 대칭성을 갖는 이러한 동종-이량체 Mb는 cryo-EM 또는 X-ray 결정학에서 대칭 제약을 활용할 수 있게 하여 고분해능으로 단백질 구조의 결정을 촉진한다. 다른 예에서, 천연 발생 원형 배열 PP7인, AP205 또는 PP7의 외피 단백질에 강성으로 융합된 Nb로부터 구축된 항원-결합 키메라 단백질로부터 나노바디를 디스플레이 하는 바이러스-유사 입자 (VLP)를 제조하였다. PP7는 피. 애루지노사 (P. Aeruginosa)의 20면체 박테리오파지이다. PP7로부터 유래된 VLP는 그들 합성을 유도하는 mRNA를 캡슐화시켜서, 항원 특이적 Nb의 친화성-선택된 서열에 필요한 유전자형/표현형 연결을 확립시킨다. 따라서, 우리는 고도의 대칭 배열로 그들 표면 상에서 90 Nb를 디스플레이하는 강건한 VLP의 디자인을 위한 시험관내 진화 기술을 적용하였다 (실시예 12 - 15). 이들 나노바디-디스플레이 VLP는 cryo-EM에 의한 소형 단백질의 구조를 분해하는데 탁월한 도구이다.
항원-결합 도메인 예컨대 면역글로불린은 진단, 영상화 또는 다른 생물리적 적용분야에서 사용하려는 형광단, 염료, 이온 또는 금속으로 표지될 수 있는 스캐폴드 상에 강건하게 그라프트될 수 있다. 실시예 10에서, 우리는 X-선 결정학에서 변칙 산란을 통해 위상조절을 위해 사용하려는 구리 함유 단일 도메인 단백질인 아주린 (PDB 2TSA)에 GFP-특이적 나노바디를 융합시켰다. 우리는 또한 GFP-결합 나노바디를 아실 캐리어 단백질 (ACP)에 강성으로 그라프트시켰다 (실시예 16). ACP는 공유 형광단으로 단일 효소 단계에서 직교적으로 표지될 수 있는 단백질이다.
면역글로불린 도메인은 또한 3개의 짧은 펩티드 링커를 통해서 동일한 Ig 도메인 또는 상이한 Ig 도메인 (또는 상이한 치료적 스캐폴드)에 강성으로 융합되어 각각 2가 또는 이중특이적 항원-결합 키메라 단백질을 생성시킬 수 있다 (나노2바디, N2b, 실시예 17 및 18). 2가 또는 이중특이적 항원-결합 키메라 단백질은 X-선 결정학 또는 cryo-EM에서 샤페론으로서 사용될 수 있지만 생물리학적 적용분야, 영상화, 진단 및 요법에서 다수의 적용성을 갖는다.
β-스트랜드 A가 모든 Nb에 공통인 고도로 보존된 N-말단 서열에 함유되므로 (Harmsen et al., 2000), 완전한 생체 내-성숙된 나노바디 레파토리가 편리하게 강성 항원-결합 키메라 단백질 라이브러리 (메가바디, 나노툴 또는 나노2바디로서 본 명세서에서 명명하는 바와 같은 항원-결합 키메라 단백질 포함)로서 클로닝될 수 있고 결합제에 대한 표준 방법으로 스크리닝될 수 있다. 기능성 항원-결합 키메라 단백질은 파지 디스플레이, 효모 디스플레이 또는 바이러스 디스플레이를 통해 선택될 수 있다 (실시예 19).
우리는 또한 GFP-특이적 나노바디 (실시예 20)의 제2 노출 β-턴 (β-스트랜드 C 및 C' 연결)에 삽입되는 HopQ의 어드헤신 도메인을 코딩하는 유전자의 원형 배열 변이체 (에이치. 피로리 유래 주변세포질 단백질; 본 명세서에서 'cHopQ'라고 하는 원형 배열 변이체)로부터 강성 항원-결합 키메라 단백질을 구축하였고 모노바디같은 합성 면역글로불린-유사 항원-결합 단백질로부터 구축된 항원-결합 키메라 단백질을 생성시켰다 (실시예 21).
게다가, 몇몇 디자인되고 생성된 항원-결합 키메라 단백질은 다루기 힘든 막-결합 복합체 예컨대 GPCR, 이온 채널, 및 티로신 수용체 키나제의 구조 분석에 적용하였다 (실시예 22).
다른 실시예는 cHopQ 스캐폴드 단백질에 결합하는 메가바디로부터 유래되는 항원-결합 키메라 단백질 또는 메가바디를 생산함으로써, 스캐폴드 크기를 더욱 확장시키기 위해서, 항원-결합 키메라 단백질 또는 '폴리바디'의 일정 조성물을 형성한다는 것을 입증하였다 (실시예 23).
실시예 24는 다량체 항원-결합 키메라 단백질이 Nb의 제1 β-스트랜드 AB에 삽입된 도데신 단백질로부터 구축될 수 있다는 것을 보여준다. 그리고, 마지막으로, 또한 디술피드-브릿지된 동종이량체가 증가된 질량 및 대칭성으로 항원-결합 키메라 단백질의 다른 포맷을 생성시키기 위한 스캐폴드 단백질로서 시험되었다 (실시예 25).
실시예 1: GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kD 항원-결합 키메라 단백질의 디자인 및 생성.
강성 항원-결합 키메라 단백질, 예컨대 메가바디를 얻기 위한 개념의 제1 증거로서, 나노바디는 강성 메가바디를 구축하기 위해 도 2에 따라서 나노바디를 스캐폴드에 연결하는 2개 펩티드 결합을 통해 거대 스캐폴드 단백질 상에 그라프트시켰다.
여기 기술된 58 kDa 메가바디는 도 2 및 3에 따라서 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 부분들로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린 도메인은 SEQ ID NO:1에 도시된 바와 같은 GFP-결합 나노바디이다. 스캐폴드 단백질은 HopQ라고 하는 헬리코박터 피롤리 균주 G27의 어드헤신 도메인 (PDB: 5LP2, SEQ ID NO:19)이다 (Javaheri et al, 2016). HopQ의 N-말단 및 C-말단은 cHopQ라고 하는 HopQ의 원형 배열 변이체의 생성을 허용하도록 연결되었고, 서열의 절단은 이의 서열 내 임의의 위치에서 만들어졌다. MbNb207 cHopQ 구성체를 디자인하기 위해서, 모든 부분은 펩티드 결합 (SEQ ID NO:20)을 통해 다음의 소정 순서로 아미노 (N-)에서 카복시 (C-) 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO: 1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체 cHopQ를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis 태그 및 EPEA 태그 (US 9518084 B2; SEQ ID NO:209).
MbNb207 cHopQ (SEQ ID NO:20)가 충분히 폴딩된 기능성 단ㄷ백질로서 발현될 수 있다는 것을 입증하기 위해서, 우리는 이 단백질을 효모 표면 상에서 디스플레이시켰고 (Boder, 1997), 유세포측정법을 통해 이 메가바디를 디스플레이하는 효모 세포에 대한 동족 항원 (GFP)의 특이적 결합을 조사하였다. 효모 상에서 MbNb207 cHopQ 를 디스플레이시키기 위해서, 우리는 하기 다수의 보조 펩티드 및 단백질 (SEQ ID NO:22)과의 융합체로서 메가바디를 코딩하는 오픈 리딩 프레임을 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), MbNb207 cHopQ, 가요성 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착되는 효모 어글루티닌 단백질 Aga2p의 Aga2p 어드헤신 서브유닛, 디스플레이된 융합 단백질의 직교성 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005), 이어서 cMyc 태그. 이러한 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하에 pCTCON2 벡터 (Chao, 2006)로 넣어져서 효모 균주 EBY100에 도입시켰다.
이 플라스미드를 보유하는 EBY100 효모 세포는 MbNb207 cHopQ-Aga2p-ACP 융합체의 발현 및 분비를 촉발시키기 위해 갈락토스-풍부 배지에서 밤새 성장 및 유도시켰다. ACP의 직교적 염색을 위해서, 세포는 형광 표지된 CoA 유사체 (coA-647, 2μM) 및 촉매량의 SFP 신타제 (1μM)의 존재 하에서 1시간 동안 인큐베이션시켰다. 우리는 효모 세포 상에서 MbNb207 cHopQ 의 발현을 글루코스-풍부 배지에서 갈락토스-풍부 배지로 성장 조건을 변화시켜 유도시킨다 (도 4). 표면 디스플레이 수준은 유세포측정법으로 쉽게 정량적으로 분석할 수 있다. 이들 실험에서, 유도된 효모 세포를 세척하고 유세포측정법을 수행하여 메가바디를 디스플레이하지만 동일한 방식으로 직교적으로 염색된 효모 세포와 CoA647-형광 수준을 비교하여 각 세포의 Mb 디스플레이 수준을 측정하였다. CoA647-형광 신호가 높은 구별가능한 효모 세포는 MbNb207 cHopQ 를 발현하는 배양물에서만 검출되어서, 메가바디가 효율적으로 디스플레이될 수 있고 효모 표면 상에서 직교적으로 염색될 수 있다는 것을 의미한다 (도 4).
디스플레이된 메가바디의 기능성을 분석하기 위해서, 유세포측정을 통해 동족 항원 (GFP)과 이의 결합을 조사하였다. EBY100 효모 세포를 유도시켰고 CoA647로 직교적으로 형광 염색시켜서 상기 기술된 바와 같이 MbNb207 cHopQ-Aga2p-ACP 융합체 디스플레이를 모니터링하였다. 이들 직교적으로 염색된 효모 세포를 다음으로 100 nM GFP의 존재 하에서 1시간 동안 인큐베이션시켰다 (Scholz et al., 2000). 이들 세포의 세척 후에, 디스플레이된 MbNb207 cHopQ 에 결합된 GFP의 검출가능한 양을 검출하였고, 이것은 효모 표면 상에서 MbNb207 cHopQ 의 발현 수준에 선형으로 상관되어야 한다. 실제로, 2-차원 유세포측정 분석은 GFP (높은 GFP-형광 수준)가 상당한 메가바디 디스플레이 수준 (높은 CoA647-형광 수준)으로 오직 효모 세포에 결합한다는 것을 확인하였다 (도 5). 대조적으로, GFP는 동일한 방식으로 염색하였지만 MbNb207 cHopQ 를 발현하지 않는 야생형 효모 세포에는 결합하지 않는다. 이들 실험으로부터 MbNb207 cHopQ 가 충분히 잘 폴딩되고 기능성인 항원-결합 (GFP-결합) 키메라 단백질을 효모 표면 상에서 발현시킬 수 있다고 결론내었다.
실시예 2: GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kD 항원-결합 키메라 단백질의 발현, 정제 및 특징규명.
다음으로, 우리는 이. 콜라이의 주변세포질에서 이 58 kDa MbNb207 cHopQ 를 발현시키도록 하였고, 이것을 균질하게 정제하여 이의 성질을 결정하였다. 이. 콜라이의 주변세포질에서 MbNb207 cHopQ (SEQ ID NO:20)와 같은 메가바디를 발현시키기 위해서, 우리는 임의 나노바디의 매우 보존된 β-스트랜드 A, 및 β-스트랜드 B를 연결하는 제1 β-턴에 삽입된 HopQ (의 원형 배열 변이체)로부터 구축된 임의의 바람직한 메가바디의 발현을 허용하는 클로닝 벡터 (pMESD2라고 함)를 구축하기 위해 표준 방법을 사용하였다. 이 벡터는 pMES4의 유도체 (Pardon, 2014)이고 하기 폴리펩티드를 코딩하는 오픈 리딩 프레임을 함유한다: 이. 콜라이의 주변세포질로 메가바디의 분비를 유도하는 DsbA 리더 서열, 나노바디의 극도로 보존된 FR1을 대표하는 NbGFP207의 β-스트랜드 A, cHopQ라고 하는 HopQ의 원형 배열 변이체, 6xHis 태그 및 EPEA 태그, 이어서 앰버 중지 코돈. 임의의 나노바디의 C-말단 부분 (β-스트랜드 B 내지 β-스트랜드 G)은 이 벡터에 SapI 단편으로서 클로닝된다.
이. 콜라이의 주변세포질에서 MbNb207 cHopQ 를 발현시키고 균질하게 이 재조합 단백질을 정제하기 위해서, β-스트랜드 B 내지 G의 NbGFP207을 코딩하는 DNA 단편 (SEQ ID NO:121의 뉴클레오티드 52-378)을 PCR (프라이머 SEQ ID NO:122 및 SEQ ID NO:123 사용)로 증폭시켰고, Plac 프로모터의 전사 제어 하에서 이. 콜라이의 주변세포질에서 His-태그화 및 EPEA-태그화 MbNb207 cHopQ 의 발현을 유도하는 pMESD2 벡터에 SapI 단편으로서 클로닝하였다.
WK6 박테리아 세포 (WK6는 su- 비억제 균주임)는 6 L TB 배지 중에 37℃에서 성장시켰고, 세포가 대수-성장기에 도달했을 때 IPTG로 유도시켰다. His-태그화 및 EPEA-태그화 MbNb207 cHopQ 의 주변세포질 발현을 밤새 28℃에서 계속하였다. 세포는 원심분리를 통해 회수하였고 재조합 MbNb207 cHopQ 는 삼투압 충격을 사용해 주변세포질로부터 방출시켰다 (Pardon et al., 2014). 다음으로 재조합 메가바디는 원심분리를 통해 원형질체로부터 분리하였고 HisTrap FF 5 mL의 사전충전 컬럼 상에서 맑은 상청액으로부터 회수하였다. 다음으로 단백질은 500 mM 이미다졸을 적용하여 NiNTA 레진에서 용리시켰고 컷오프가 3 kDa인 NMWL 필터 (Nominal Molecular Weight Limit)를 사용하여 원심분리를 통해 농축시켰다. 다음으로 농축된 샘플을 Superdex 200 PG 16/90 크기 배제 컬럼에 도포하여 겉보기 분자량이 약 60 kDa인 가용성 단백질로서 24 mg의 재조합 메가바디를 회수하였다.
다음으로 정제된 재조합 MbNb207 cHopQ 의 기능적 성질은 크기 배제 크로마토그래피 (SEC)를 통해 분석하였다. 메가바디는 4배-몰 과량의 GFP와 30분 동안 4℃에서 인큐베이션시켰고 Superdex 75 PG 16/90 컬럼 상에 도포하였다. 정제된 GFP 단독을 동일한 크기 배제 컬럼 상에 개별적으로 도포하였다 (도 6). 상이한 단백질의 용리는 280 nm (임의 단백질에 의한 흡광) 및 488 nm (GFP에 의한 흡광)에서 UV 흡광도를 측정하여 모니터링하였다. 도 6에 도시된 용리 스펙트럼은 메가바디 및 과량의 GFP를 함유하는 혼합물이 2개의 대칭 피크 (파란색 및 붉은색 흡광 프로파일)로 용리된다는 것을 예시한다. 제1 용리 피크 (최고 분자량)는 488 nm에서 흡광하여, GFP를 함유한다는 것을 의미한다. 제2 피크는 GFP 단독 (녹색 흡광 프로파일)의 동일 용리 부피에서 용리되고, 역시 488 nm에서 흡광된다. 상응하는 용리 분획의 SDS-폴리아크릴아미드 전기영동은 메가바디 및 과량의 GFP를 함유하는 혼합물의 제1 용리 피크가 메가바디 및 GFP를 함유하는 한편, 제2 피크는 GFP 만을 함유한다는 것을 확인해 준다. 모든 이들 데이터는 정제된 재조합 MbNb207 cHopQ 가 크기 배제 크로마토그래피에 의한 분리를 저지하는 GFP와의 복합체를 만든다는 것을 의미한다. 뿐만 아니라, GFP에 대한 MbNb207 cHopQ 의 특이적 결합의 실시간 운동학적 분석은 생물층 간섭계를 통해 수행하였다. 스트렙타비딘-코팅된 Octet ® 바이오센서가 바이오틴화된 GFP를 포획하는데 사용되었고 상이한 농도의 MbNb207 cHopQ 와 회합되었다. 도 24에 도시된 데이터는 MbNb207 cHopQ 를 사용한 GFP에 대한 친화성이 NbGFP207을 단독으로 사용할 때 친화성과 유사하였다는 것을 입증한다 (도 24B).
실시예 3. GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 50 kD 항원-결합 키메라 단백질의 X-선 결정학에 의한 구조 결정.
실시예 1 및 2에 기술된 58 kDa 키메라 MbNb207 cHopQ 를 발현 및 정제할 수 있었으므로, 우리는 이 메가바디를 결정화하고 X-선 결정학을 통해 이의 구조를 분해하는 것을 수행하였다.
MbNb207 cHopQ 는 실시예 2에 기술된 바와 같이 복합체로서 SEC를 통해 정제하였고 (도 6), 48 mg/mL로 농축하였으며 0.1 ㎕의 모액이 보충된 0.1 ㎕의 정착 액적 (lying drop) 중의 다수의 상업적 스파스-매트릭스 결정화 스크린 (JSCG/Proplex/PEGion/Wizard12/Morpheus)에 가하였다. 0J0SCG 스크린 A2 조건 (0.1 M 소듐 시트레이트, pH 5.5, 20% w/v PEG3000)에서 수득된 소형 결정을 씨딩 최적화 접근법에 사용하였다. JSCG A2 결정으로부터 씨딩된, 충분히 회절된 결정은 0.2 M 암모늄 시트레이트, 17% PEG3350, 10% 글리세롤 48 mg/mL Mb207로 수득하였다. 데이터는 다이아몬드의 I3 광원 (UK)에서 수집하였고 구조는 2.6Å 분해능까지 정밀화하였다 (표 1).
메가바디는 비대칭 유닛 당 10개 분자의 P1에서 결정화하였다. 비대칭 유닛의 상이한 결정 간 RMSD는 0.3 내지 2.7Å 범위여서, 나노바디가 나노바디를 스캐폴드에 연결하는 2개 펩티드 결합을 통해서 스캐폴드에 강성으로 연결된다는 것을 의미한다 (도 7).
실시예 4: 단백질 복합체 안정화 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kD 항원-결합 키메라 단백질의 발현 및 정제.
제2 항원-결합 키메라 단백질 실시예로서, 우리는 β2 아드레날린성 수용체-Gs 단백질 복합체의 Gβ 및 Gα 서브유닛 계면에서 결합하는 Nb35의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kDa 항원-결합 키메라 단백질을 발현 및 정제하는 것을 수행하였다 (Rasmussen et al, 2011a).
MbNb35 cHopQ 라고 불리는 58 kDa 메가바디는 도 2 및 3에 따라서 연결된 단일-도메인 면역글로불린의 일부분 및 스캐폴드 단백질의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린 도메인은 β2 아드레날린성 수용체-Gs 단백질 복합체의 Gβ 및 Gα 서브유닛의 계면에 결합하는 나노바디 (Rasmussen et al, 2011a)로서, CDR1은 주로 Gβ와 상호작용하고 장형 CDR3 루프는 SEQ ID NO:24에 도시된 바와 같이 Gβ 및 Gα 서브유닛 둘 모두와 상호작용한다. 모든 부분은 펩티드 결합 (SEQ ID NO:25)을 통해서 다음의 소정 순서로 아미노 말단에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), 나노바디의 스트랜드 B 내지 G (SEQ ID NO:24의 잔기 16-128), 6xHis/EPEA 태그.
이. 콜라이의 주변세포질에서 MbNb35 cHopQ 를 발현시키고 균질하게 재조합 다백질을 정제하기 위해서, β-스트랜드 B 내지 G로부터의 Nb35를 코딩하는 DNA 단편을 PCR (프라이머 SEQ ID NO:122 및 SEQ ID NO:123 사용)을 통해 증폭시켰고, PLac 프로모터의 전사 제어 하에서 이. 콜라이의 주변세포질에서 His-태그화 및 EPEA-태그화 cHopQNb35 메가바디 (SEQ ID NO:25)의 발현을 유도하는 pMESD2 벡터에 SapI 단편으로서 클로닝하였다.
MbNb35 cHopQ 는 또한 실시예 2에 기술된 바와 같이, 이. 콜라이의 주변세포질에 발현되고 그로부터 균질하게 정제되었다. 게다가, 정제된 cHopQNb35는 β2 아드레날린성 수용체-Gs 단백질 복합체의 Gβ 및 Gα 서브유닛의 계면에 선택적으로 결합한다.
실시예 5: GPCR-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kDa 항원-결합 키메라 단백질의 발현 및 정제.
추가 실시예로서, 인간 β2 아드레날린성 수용체에 결합하고 G 단백질-유사 양태를 나타내는 Nb80의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 cHopQ로부터 구축된 다른 58 kD 항원-결합 키메라 단백질을 발현시키고 정제하기 위해 수행하였다 (Rasmussen et al, 2011b). 이러한 나노바디에 대한 대안은 예를 들어 WO2012/007593 (표 1,2 참조), WO2012/175643 (표 2, 3 참조), WO2014/122183 (표 1 및 2 참조), 및 WO2015/110449 (표 2 및 3 참조)에 기술되었다. 그러므로, 본 발명은 이들 인용된 특허 출원에 열거된 (상기 표에 열거된) 상기 Nb의 서열을 기반으로, 본 발명에 기술된 바와 같이 디자인되고 생산된 모든 항원-결합 키메라 단백질을 포함한다. 대안적으로, 상기 Nb의 CDR은 기술된 바와 같은 표적화된 GPCR 복합체 단백질의 특이적 안정화를 수득하기에 충분하며, 그러므로 또한 본 발명은 본 명세서에 기술된 바와 같이 디자인되고 생산된 항원-결합 키메라 단백질을 포함하고, 여기서 상기 인용된 GPCR-복합체 특이적 Nb로부터의 CDR은 상기 GPCR-복합체 결합 항원-결합 키메라 단백질의 항원-결합 도메인의 CDR을 기반으로 한다.
MbNb80 cHopQ 라고 하는 58 kDa 메가바디는 도 2 및 3에 따라 연결된 단일-도메인 면역글로불린의 부분 및 스캐폴드 단백질의 부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린 도메인은 Nb80 (SEQ ID NO:26), β2 아드레날린성 수용체의 세포질 측면에서 결합하는 나노바디이다. 이의 CDR3의 8-아미노산 서열은 수용체의 TM 절편 3, 5, 6 및 7로부터의 아미노산에 의해 형성된 소수성 포켓으로 침투된다. 이의 CDR의 4-아미노산 서열은 TM 절편 5 및 6의 세포질 말단과의 추가적인 안정화 상호작용을 제공한다 (Rasmussen et al, 2011b). 이의 CDR3은 β2AR-Gs 단백질 복합체에서 Gs의 카복시-말단 펩티드와 유사한 위치를 차지한다 (Rasmussen et al, 2011a). 모든 부분은 펩티드 결합 (SEQ ID NO:27)에 의해 다음의 소정 순서로 아미노 말단에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체를 생산하기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), Nb80의 β-스트랜드 B 내지 G (SEQ ID NO:27의 잔기 16-120), 6xHis/EPEA 태그.
이. 콜라이의 주변세포질에서 MbNb80 cHopQ 를 발현시키고 이 재조합 단백질을 균질하게 정제하기 위해서, β-스트랜드 B 내지 G의 Nb80을 코딩하는 DNA 단편은 PCR (프라이머 SEQ ID NO:122 및 SEQ ID NO:123 사용)을 통해 증폭시켰고, 실시예 4에 기술된 바와 같이 SapI 단편으로서 pMESD2 벡터에 클로닝하였다. 이 플라스미드는 Plac 프로모터의 전사 제어 하에서 이. 콜라이의 주변세포질에서 His-태그화 및 EPEA-태그화 MbNb80 cHopQ (SEQ ID NO:27)의 발현을 유도한다.
이전 실시예의 메가바디와 유사하게, 또한 MbNb80 cHopQ 는 실시예 2에 기술된 바와 같이 이. 콜라이의 주변세포질에서 발현되어 그로부터 균질하게 정제될 수 있다. 게다가, 정제된 MbNb80 cHopQ 는 β2AR의 활성 상태 입체구조에 선택적으로 결합하여 안정화시킨다. WO2012/007593에 기술된 실시예와 유사하게, 우리는 β2AR-야생형 (wt) 수용체의 약학적 성질을 Nb80 또는 MbNb80 cHopQ 의 존재 하에서 β2AR-wt 단독의 성질 및 미관련 메가바디 MbNb207 cHopQ 의 존재 하에서 β2AR-wt 성질과 비교하였다 (도 53). Nb80은 효현제 결합된 β2AR에 특택적으로 결합하고, G 단백질-유사 양태를 나타내는 나노바디이므로, 효현제·β2AR·Nb 80 복합체에서 수용체의 활성-상태 입체구조를 안정화시킨다 (Rasmussen et al., 2011). 우리는 인간 β2 아드레날린성 수용체에 결합하고 G 단백질-유사 양태를 나타내는 Nb80의 성질 (Rasmussen et al, 2011b)이 방사성-리간드 어세이를 통해 MbNb80 cHopQ 에서 유지되는지 여부를 조사하였다. MbNb207 cHopQ 와 유사하게 GFP에 특이적으로 결합하고, β2AR에 대한 친화성을 갖지 않는, 나노바디, NbGFP207이 음성 대조군으로서 사용되었고, β2AR에 대한 친화성을 보이지 않았다 (도 53).
β2AR에 대한 Nb80 또는 MbNb80 cHopQ 의 약학적 효과를 비교할 수 있기 위해서, 우리는 다음과 같이 방사리간드 어세이를 수행하였다. β2AR 야생형 (wt) 수용체를 발현시키기 위해서, 1 ㎍의 pFastBac1-β2ARwt 구성체는 Bac-to-Bac® 배큘로바이러스 발현 시스템을 제조사의 설명서에 따라 사용하여 DH10BacTM 세포로 형질전환시켰고 (Invitrogen, cat. Nr. 10359-016), 50 ㎍/mL 카나마이신, 7 ㎍/mL 젠타마이신, 10 ㎍/mL 테트라사이클린, 100 ㎍/mL X-gal 및 40 ㎍/mL IPTG가 보충된 신선한 LB 한천 플레이트 상에 플레이팅하였다. 흰색 콜로니를 선택하여, 백미드를 정제하였고 오픈 리딩 프레임의 서열은 시퀀싱을 통해 확인하였다. 재조합 배큘로바이러스는 2 ㎍ 백미드 DNA를 형질감염 시약으로서 8 ㎕의 셀펙틴과 함께 6웰 플레이트 포맷으로 Sf9 세포에 형질감염시켜 생산하였다. 세포는 27℃에서 인큐베이션시켰고 P1 바이러스는 3일 후에 수집하였다. 바이러스는 이후에 연속 계대를 통해 증폭시켰고 P3 바이러스를 수집하였다. 2-3x106 세포/mL 농도의 Sf9 세포를 0.5의 M.O.I로 배큘로바이러스로 감염시켰고, 세포를 27℃에서 72시간 동안 수용체를 발현시켰다. 수용체의 발현 및 세포 표면 국재화는 수용체의 N-말단 세포외 부분에서 FLAG 펩티드를 인식하는 1차 항체로서 마우스 항-FLAG M2 항체 (1:100), 및 2차 항체로서 항-마우스 DyLight405 (1:100)를 사용하는 유세포측정을 통해 평가하였다. 1000xg에서 30분 동안 세포를 스핀 다운시키고 최종 펠렛을 프로테아제 억제제 (cOmpleteTM EDTA-무함유 프로테아제 억제제 칵테일 정제, Roche)가 보충된 TME 결합 완충액 (75 mM Tris/HCl pH7.4, 12.5 mM MgCl2, 1 mM EDTA)에 재현탁시켜서 이들 세포로부터 막을 제조하였다. 세포는 최대 속도의 Ultra turrax 균질기를 사용하여 6회 10-초 버스트를 통해 용해시켰다. 막을 함유하는 용해물은 40.000xg로 40분 동안 4℃에서 원심분리시켰고, 상청액을 버리고, 막 펠렛을 10% 사카로스가 보충된 TME 결합 완충액에 재현탁시켰다. 막은 추가 사용까지 -80℃에서 저장하였다. 전체 막 단백질 함량은 제조사의 설명서에 따라서 Pierce BCA 단백질 어세이 키트 (Thermo Scientific)를 사용해 추산하였다. 추가 분석을 위해 전체 막 단백질 농도에 따라 데이터를 정규화시키기 위해서, 모든 샘플은 0.2 mg/mL의 최종 농도로 희석하였다. 방사리간드 경쟁 결합 어세이를 위해서, β2AR-wt를 발현하는 10 ㎍의 막을 2 nM [3H]-디히드로알프레놀롤의 존재 및 5 μM NbNb80 cHopQ, MbNb207 cHopQ 의 존재 또는 나노바디 부재에서 10-11 M 내지 10-4 M 범위의 에피네프린 (천연 효현제, Sigma cat. Nr E4250) 또는 (-)-이소프로테레놀 히드로클로라이드 (전체 효현제, Sigma cat. Nr I6504)의 증가 농도와 인큐베이션시켰다. 비특이적 결합은 10 μM 알프레놀롤의 존재 하에서 결정하였다. 샘플은 진탕 플랫폼 상에 실온에서 2시간 동안 인큐베이션시켰고, 수용체-결합 방사리간드는 96-웰 FilterMate harvester (Perkin Elmer)를 사용해 Whatman GF/C unifilter (Perkin Elmer, cat nr 6005174) 상에서 여과를 통해 유리 방사리간드로부터 분리하였다. 여과 이후에, 필터 플레이트 상에 유지된 막은 빙냉 세척 완충액 (20 mM Tris-HCl pH7.4)으로 세척하였고, 필터를 1시간 동안 50℃에서 건조시켰다. 35 ㎕의 섬광액 (MicroScint™-O, Perkin Elmer)을 첨가한 후에, 필터 상에 유지된 방사능(cpm)은 Wallac MicroBeta TriLux 섬광 계측기에서 측정하였다. 데이터는 이중으로 수행된 각 실험의 평균 ± s.e로 표시된다. IC50 값은 Prism (GraphPad Software, San Diego, CA)을 사용하여 비선형 회귀 분석을 통해 결정하였다.
도 53에 도시된 바와 같이, 우리는 MbNb80 cHopQ 의 존재 하에서 β2AR-wt의 약학적 성질이 Nb80의 존재 하에서 β2AR-wt의 약학적 성질과 매우 유사하고 β2AR-wt 단독 또는 MbNb207 cHopQ 의 존재 하에서 β2AR-wt 의 성질과 상당히 상이하다는 것을 확인하였다. β2AR-wt 단독과 비교하여, G 단백질-유사 양태를 갖는 MbNb80 cHopQ (cfr Nb80) 존재 하에서 β2AR-wt 수용체는 효현제 (에피네프린, 이소프로테레놀)에 대해 증가된 친화성을 나타내서, MbNb80 cHopQ 의 존재하에서 수용체가 활성-상태 입체구조를 채택한다는 것을 보여준다 (Rasmussen et al, 2011b). 대조군 β2AR-wt와 비교하여, MbNb80 cHopQ 의 존재 하에서, 천연 효현제 에피네프린에 대한 β2AR-wt의 증가된 친화성은 β2AR-wt 단독에 대한 에피테프린의 IC50을 MbNb80 cHopQ 존재하의 β2AR-wt에 대한 에피테프린의 IC50high 를 나누어서, 도 53 (A)에 도시된 경쟁적 결합 실험으로부터의 IC50 값의 비율로부터 계산되었고, 2000의 겉보기 역가 이동을 야기하였다. MbNb80 cHopQ 의 존재 하에서 합성 효현제 이소프로테네롤에 대한 β2AR-wt의 증가된 친화성은 β2AR-wt에 대한 이소프로테네롤의 IC50을 MbNb80 cHopQ 존재 하의 β2AR-wt에 대한 이소프로테네롤의 IC50high 를 나누어서 도 53 (B)에 도시된 경쟁적 결합 실험으로부터의 IC50 값의 비율로부터 계산할 수 있었고, 2000의 겉보기 역가 이동이 야기되었다. 결론적으로, 우리는 Nb80의 기능성이 MbNb80 cHopQ 포맷에서 유지되었고, 게다가 β2AR 표적에 대해 유지된 이의 항원-결합 친화성으로 인해서, β2AR 활성-상태 입체구조를 안정화시키고, Nb80와 유사하게 입체구조 선택적 항원 결합을 제공한다는 사실을 입증하였다.
실시예 6: 이온-채널-결합 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ 스캐폴드로부터 구축된 58 kD 항원-결합 키메라 단백질의 발현 및 정제.
추가 실시예로서, 우리는 5량체 리간드-게이팅 이온 채널 GABAA 에 결합하는 Nb25의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 cHopQ로부터 구축된 다른 58 kD 항원-결합 키메라 단백질을 발현시키고 정제하는 것을 수행하였다 (Miller et al, 2017).
MbNb25 cHopQ 라고 불리는 58 kDa 메가바디는 도 2 및 3에 따라서 연결된 단일-도메인 면역글로불린의 일부분 및 스캐폴드 단백질의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서 사용된 면역글로불린 도메인은 GABAA 3β 서브유닛의 세포외 도메인에 결합하는 나노바디, Nb25 (SEQ ID NO:28)이다 (Miller et al, 2017). 모든 부분은 펩티드 결합 (SEQ ID NO:29)을 통해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP- 나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), Nb25의 β-스트랜드 B 내지 G (SEQ ID NO:28의 잔기 16-125), 6xHis/EPEA 태그.
이. 콜라이의 주변세포질에서 MbNb25 cHopQ 를 발현시키고 균질하게 이 재조합 다백질을 정제하기 위해서, β-스트랜드 B 내지 G의 Nb25를 코딩하는 DNA 단편을 PCR (프라이머 SEQ ID NO:122 및 SEQ ID NO:123 사용)을 통해 증폭시켰고 실시예 4에 기술된 바와 같이 SapI 단편으로서 pMESD2 벡터에 클로닝시켰다. 이 플라스미드는 Plac 프로모터의 전사 제어 하에서 이. 콜라이의 주변세포질에서 His-태그화 및 EPEA-태그화 MbNb25 cHopQ (SEQ ID NO:29)의 발현을 유도시킨다.
이전 실시예의 메가바디와 유사하게, MbNb25 cHopQ 가 실시예 2에 기술된 바와 같이 이. 콜라이의 주변세포질에서 발현되었고 균질하게 정제할 수 있었다. 게다가, 정제된 MbNb25 cHopQ 는 GABAA 3β 서브유닛의 세포외 도메인에 결합한다.
실시예 7. GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴로 삽입된 c7HopQ로부터 구축된 다른 58 kD 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
폴딩되는 능력을 비롯하여, 메가바디의 안정성 및 강성이 스캐폴드에 면역글로불린을 연결시키는 폴리펩티드 연결부의 조성 및 길이에 의존할 수 있으므로, 우리는 필요하다면 특정 메가바디 포맷의 미세조율을 위해 시험관내 진화 기술을 도입시켰다. 실시예 1에 기술된 메가바디로부터 출발하여, 우리는 시험관내 선택에서 처리가능한, 가변 길이 및 혼합 아미노산 조성의 짧은 2개 펩티드가 도 2에 따른 스캐폴드에 나노바디를 연결하는 유사한 디자인으로 메가바디를 코딩하는 라이브러리를 구축하였다.
여기 기술된 58 kDa 메가바디는 도 2에 따라 짧은 폴리펩티드 연결부를 통해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린은 SEQ ID NO:1에 도시된 바와 같은 GFP-결합 나노바디이다. 모든 부분은 펩티드 결합 (SEQ ID NO:30-33)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 무작위 조성을 갖는 하나 또는 2개 아미노산의 펩티드 링커, HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186 ), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 11-126), 6xHis 태그 및 EPEA 태그.
효모 상에서 스캐폴드에 나노바디를 연결시키는 링커의 조성 및 길이가 상이한 실시예 1, 2 및 3에 기술된 메가바디의 기능성 변이체를 디스플레이하고 선택하기 위해서, 우리는 도 8에 따라서 다수의 보조 펩티드 및 단백질 (SEQ ID NO:34-37)과의 융합체로 다양한 메가바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 11-126), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하의 pCTCON2 벡터 (Chao, 2006)에 두어서, 실시예 1, 2 및 3에 기술된 184.000개의 상이한 메가바디 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다 (도 8 참조).
시험관내 선택을 위해서, 이 라이브러리는 효모 균주 EBY100에 도입시켰다. 형질도입된 세포를 성장시켰고 갈락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색하였고, 100 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고, 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정 메가바디 (높은 CoA-647 형광도)를 디스플레이하고 항원 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합 나노바디를 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 후속 선택 라운드를 수행하였다.
1 라운드의 선택이후에, CoA-647 및 GFP 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 스캐폴드 단백질에 나노바디를 연결시키는 대표적인 번호의 펩티드 링커의 서열을 결정하기 위해 DNA 시퀀싱을 수행하였다. 1-1, 1-2, 2-1 및 2-2 아미노산의 짧은 링커 변이체를 갖는 각 유형의 링커의 4개의 대표적 클론 (표 2)이 FACS 실험으로 100 nM GFP에 결합하는 것이 확인되었다 (도 30). 이것은 항원-결합 도메인 및 스캐폴드 단백질 간 상이한 짧은 펩티드 연결이 시험관내 선택에 의해 메가바디 라이브러리로부터 선택될 수 있고 기능성 항원-결합 키메라 단백질로서 디스플레이될 수 있다는 것을 입증한다. 효모 표면 상에 메가바디의 기능성 변이체를 디스플레이 할 수 있었으므로 (상기), 우리는 이. 콜라이의 주변세포질에서 4종의 1-1 아미노산의 짧은 링커를 대표하는 메가바디 클론 (표 2의 MP1331_A5, MP1331_A12, MP1331_B7 및 MP1331_G10)을 발현시켰고, 균질하게 이들 키메라를 정제하였으며 이의 성질을 결정하였다. 메가바디 MbNb207 c7HopQ 의 4종의 변이체 (MbNb207 c7HopQ A5, MbNb207 c7HopQ A12, MbNb207 c7HopQ B7, MbNb207 c7HopQ G10) 및 짧은 (c7; 실시예 23 참조) 원형 배열을 갖는 야생형 (MbNb207 c7HopQ)은 본질적으로 실시예 22:MbNb207 c7HopQ (SEQ ID NO:136)에 기술된 대로 생성시켰다: 항-GFP-나노바디의 보존된 N-말단의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-411), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 18-186), 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis 태그 및 EPEA 태그.
4종 MbNb207 c7HopQ 변이체 (SEQ ID NO:137-140): 항-GFP-나노바디의 보존된 N-말단의 β-스트랜드 A (SEQ ID NO:1의 1-12), 1개의 아미노산 링커 (표 2), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-411), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 18-185), 1개의 아미노산 링커 (표 2), 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 6xHis/EPEA 태그.
이들 메가바디 (SEQ ID NO:136-140)는 실시예 2에 기술된 바와 같이, 이. 콜라이에서 발현시켰고 정제하였다. 다음으로 농축된 샘플을 Superdex 200 PG 10/300 크기 배제 컬럼에 도포하였고, 약 60 kDa의 겉보기 분자량을 갖는 균질한, 가용성 단백질을 용리하였다 (도 31). 정제된 재조합 메가바디 (SEQ ID NO:136-140)의 기능적 성질은 효소-연결 면역흡착 어세이 (ELISA)로 분석하였다. 정제된 GFP는 소듐 바이카보네이트 완충액 pH 중 0,1 ㎍/웰의 농도로 maxisorp 마이크로타이터 플레이트 (Nunc)의 웰에 고정시켰다. 웰 내 잔류 단백질 결합 부위는 PBS 중 우유를 사용해 실온에서 2시간 동안 차단시켰다. 정제된 메가바디 샘플은 GFP 코팅 및 비코팅 웰에서 인큐베이션시켰다. 세척 단계 후에, GFP에 대한 메가바디의 결합은 메가바디 상에만 존재하는 EPEA-태그를 특이적으로 인식하는 CaptureSelect 바이오틴화 항체 (Life Technologies)를 사용해 조사하였다. Capture Select 바이오틴화 항체의 후속 검출은 스트렙타비딘-알칼리 포스파타제 (Promega)를 사용해 수행하였다. 405 nm의 흡광도는 효소 기질 p-니트로페닐 포스페이트를 첨가하여 측정하였다. 검출된 신호는 고정된 GFP가 존재하는 조건을 GFP 부재 조건과 비교하여 각 메가바디에 대해 적어도 10배의 더 높은 신호를 보인다. ELISA 및 SEC 데이터는 정제된 재조합 메가바디 (SEQ ID NO:136-140)가 균질하게 정제될 수 있고 GFP와 복합체를 형성할 수 있다는 것을 의미한다 (도 31 및 32 참조).
실시예 8: GFP-특이적 나노바디의 제1 노출 β-턴 (β-스트랜드 A 및 B를 연결)에 삽입된 cYgjK로부터 구축된 100 kDa 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
대안적으로, 메가바디는 보다 큰 스캐폴드에 연결된 나노바디로부터 구축되게 디자인되었다. 도 2 및 9에 따라서 2개 짧은 펩티드가 나노바디를 다른 스캐폴드에 연결시킨 메가바디 변이체를 코딩하는 라이브러리가 시험관내 선택을 위해 구축되었다.
디자인된 100 kDa 메가바디는 도 2에 따라서 짧은 폴리펩티드 링커에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터쇄상화된 키메라 폴리펩티드이다. 사용된 면역글로불린은 SEQ ID NO:1로 표시된 바와 같은 GFP-결합 나노바디이다. 사용된 대안적인 스캐폴드 단백질은 이. 콜라이의 86 kDa 주변세포질 단백질, YgjK (PDB 3W7S, SEQ ID NO: 38)였다. 모든 부분은 펩티드 결합 (SEQ ID NO:39-42)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (잔기 SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드의 원형 배열체를 생성시키기 위해 YgjK의 C-말단 및 N-말단을 연결시키는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126).
효모 상에서 나노바디를 스캐폴드에 연결시키는 링커의 조성 및 길이가 상이한 MbNb207 cYgjkQ 무작위 링커 (SEQ ID NO:39-42)의 기능성 변이체를 디스플레이하고 선택하기 위해서, 우리는 다수의 보조 펩티드 및 단백질 (SEQ ID NO:44-47)과의 융합체로 다양한 메가바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드의 원형 배열체를 생성시키기 위해 Ygjk의 C-말단 및 N-말단을 연결시키는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질과의 디술피드 결합을 통해서 효모 세포벽에 부착된 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하에서 pCTCON2 벡터 (Chao, 2006)에 두어서, MbNb207 cYgjkQ 무작위 링커 (SEQ ID NO:39-42)의 184.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입시켰다. 형질전환된 세포를 성장시켰고 갈락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색시켰고, 100 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고 2-매개변수 FACS 분석을 수행하여 높은 수준의 메가바디 (높은 CoA-647 형광도)를 디스플레이하고 항원 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합 나노바디를 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석을 통해 후속 선택 라운드를 수행하였다.
2회 선택 라운드 이후에, CoA-647 및 GFP 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 나노바디를 스캐폴드 단백질에 연결시키는 대표적인 번호의 펩티드 링커의 서열을 결정하였다. 각 링커 유형 (길이)의 1-1, 1-2, 2-1 및 2-2 아미노산의 짧은 링커 변이체의 1 또는 2개의 대표적인 클론 (표 3)을 FACS 실험에서 100 nM GFP에 결합한다는 것을 확인하였다 (도 33). 이것은 항원-결합 도메인 및 스캐폴드 단백질 간 상이한 짧은 펩티드 연결을 시험관내 선택을 통해 메가바디 라이브러리로부터 선택할 수 있었고 기능성 항원-결합 키메라 단백질로서 디스플레이할 수 있다는 것을 입증한다. 효모 표면 상에서 MbNb207 cYgjkQ 의 기능성 변이체를 디스플레이할 수 있었으므로 (상기), 우리는 이. 콜라이의 주변세포질에서 각 아미노산의 짧은 링커를 대표하는 메가바디 클론 (표 3의 MP1333_E2, MP1333_A2, MP1333_C4 및 MP1333_F5) 중 한 클론을 발현시키는 것을 수행하였다. 효모 디스플레이에 의해 선택된 MbNb207 cYgjkQ 의 4개 변이체를 하기 아미노산 서열을 갖는 키메라 폴리펩티드로서 생성시켰다: MbNb207 cYgjkE2 (SEQ ID NO:141): 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), Tyr 1개 아미노산 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 YgjK의 C-말단 및 N-말단을 연결시키는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), Asp 1개 아미노산 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 6xHis/EPEA 태그.
유사한 구성체가 링커 정체에 차이가 존재하는, 다른 메가바디에 대해 수득되었다: MbNb207 cYgjkA2 (SEQ ID NO:142): Glu 1-아미노산 링커, Gly-Asp 2-아미노산 링커; MbNb207 cYgjkC4 (SEQ ID NO:143): Met-Tyr 2-아미노산 링커, Asn 1-아미노산 링커, MbNb207 cYgjkF5 (SEQ ID NO:144): Trp-Thr 2-아미노산 링커, Gly-Ala 2- 아미노산 링커.
MbNb207 cYgjk 변이체 (SEQ ID NO: 141-144)는 실시예 2에 기술된 바와 같이, 이. 콜라이에서 발현시켰고, 변형된 pMESD2 벡터를 적용하였다. 이러한 새로운 벡터 (pMESP3이라고 함)는 하기 폴리펩티드를 코딩하는 오픈 리딩 프레임을 함유한다: 이. 콜라이의 주변세포질로 메가바디의 분비를 유도하는 pelB 리더 서열, NbGFP207의 β-스트랜드 A, YgjK의 원형 배열된 변이체, 임의 나노바디의 C-말단 부분 (β-스트랜드 B 내지 β-스트랜드 G), 6xHis 태그 및 EPEA 태그, 이어서 앰버 중지 코돈.
발현된 메가바디의 기능성 성질은 4개 MbNb207 cYgjk 변이체 각각의 주변세포질 추출물을 사용하여, 실시예 7에 기술된 바와 같이 ELISA를 통해 분석하였다. 고정된 GFP의 존재 및 부재에서 샘플에 대해 검출된 신호의 비교 (도 34)는 기능성 MbNb207 cYgjk 변이체 (SEQ ID NO:141-144)의 주변세포질 발현을 확인하였다.
1-1 아미노산의 짧은 링커 변이체를 대표하는 MbNb207 cYgjkE2 (SEQ ID NO:141)는 실시예 2에 기술된 바와 같이 IMAC 이후 SEC를 사용하여 균질하게 더 정제하였다 (도 35). 정제된 MbNb207 cYgjkE2 (SEQ ID NO:141)의 GFP에 대한 결합 운동학은 Octet® 를 통해 측정하였고 NbGFP207 나노바디 (SEQ ID NO:1) 및 MbNb207 cHopQ (SEQ ID NO:20)와 비교하였다 (도 24). 계산된 결합 친화성은 원형 배열된 HopQ 또는 YgjK 스캐폴드 단백질로부터 구축된, 항원-결합 키메라 단백질이 본래 단일-도메인 면역글로불린의 결합 성질을 간섭하지 않는다는 것을 확인하였다.
실시예 9: 스캐폴드를 나노바디에 연결시키는 추가 디술피드에 의해 더욱 강성화된, GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 c/c7HopQ로부터 구축된 58 kDa 항원-결합 키메라 단백질의 디자인 및 생성.
우리는 도 10에 따라서 스캐폴드에 항원-결합 도메인, 여기서 면역글로불린 도메인을 연결시키는 추가 디술피드 결합을 조작시켜서 보다 더 강성인 항원-결합 키메라 단백질을 더 개발하였다. 따라서, 우리는 도 2 및 10에 따라서 2개의 짧은 펩티드 및 디술피드 결합이 나노바디를 스캐폴드에 연결시키는 MbNb207 cHopQ 의 돌연변이체를 생성시키기 위해 부위 지정 돌연변이유발법을 사용하였다.
여기 기술된 58 kDa 메가바디는 도 2 및 도 10에 따라서 짧은 폴리펩티드 연결 및 디술피드 결합을 통해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린은 SEQ ID NO:1에 표시된 바와 같은 GFP-결합 나노바디이다. 스캐폴드 단백질은 HopQ라고 하는 헬리코박터 피로리 균주 G27의 어드헤신 도메인 (PDB: 5LP2, SEQ ID NO:19)이다. 모든 부분은 펩티드 결합 (SEQ ID NO:48-50)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체 (cHopQ)를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), 하나의 잔기가 시스테인으로 치환된 HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그. SEQ ID NO:51은 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO: 1의 1-13), 한 잔기가 시스테인으로 치환된 HopQ의 C-말단 부분 (SEQ ID NO:1의 잔기 192-414), 스캐폴드 단백질의 원형 배열체 (cHopQ)를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), 한 잔기가 시스테인으로 치환된 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그로부터 구축되었다.
추가 구성체는 스캐폴드로서 더 짧은 c7HopQ 원형 배열체 (c7HopQ: 실시예 23 참조)를 적용하여 디자인되었다: SEQ ID NO: 146-150은 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-411), 한 잔기가 시스테인으로 치환된 HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 18-186), 한 잔기가 시스테인으로 치환된 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis 태그 및 EPEA 태그로부터 구축되었다. SEQ ID NO:145는 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO: 1의 1-13), 한 잔기가 시스테인으로 치환된 HopQ의 C-말단 부분 (SEQ ID NO:1의 잔기 192-411), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 18-186), 한 잔기가 시스테인으로 치환된 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis 태그 및 EPEA로부터 구축되었다.
총 10개 메가바디 변이체 (MbNb207 cHopQ Cys1-4 (SEQ ID NO:48-51) 및 MbNb207 c7HopQ Cys5-10 (SEQ ID NO:145-150)은 실시예 2이 기술된 바와 같이 이. 콜라이에서 발현시키고 정제하였다. 이들 정제된 재조합 메가바디의 기능적 성질은 실시예 7에 기술된 바와 같이 ELISA를 통해 분석하였다. 고정된 GFP의 존재 및 부재에서 샘플에 대해 검출된 신호의 비교 (도 36)는 이. 콜라이의 주변세포질로부터 정제된, MbNb207 cHopQ Cys1-4 (SEQ ID NO:48-51) 및 MbNb207 c7HopQ Cys5-10 (SEQ ID NO:145-150)의 기능성을 명확하게 확인하였다.
이들 조작된 메가바디 변이체의 열안정성에 대한 도입된 추가의 디술피드의 기여도를 측정하기 위해서, 우리는 열 이동 어세이 (TSA)를 수행하였고 이전에 기술된 바와 같이 각 메가바디 변이체의 용융 온도 (Tm)를 계산하였다 (Hunynh et al., 2015). 따라서, 0.2 mg/mL의 각각의 겔-여과 정제된 메가바디 변이체를 140 mM NaCl 및 10 mM Tris pH 7.3 완충액 중 SYPRO 오렌지 염료 (Sigma)와 혼합하였다. 다음으로, 20 ㎕ 샘플의 형광도는 25 내지 100℃ 범위 온도의 Bio-Rad CFX96 기계에서 실시간 PCR을 통해 삼중으로 측정하였다. 개별 Tm 값은 볼츠만 (Boltzmnann) 방정식을 사용하여 GraphPad Prism 소프트웨어를 통해 계산하였다 (표 4). 용융 온도는 각각 MbNb207 cHopQ C15-C534 (SEQ ID NO:51), MbNb207 c7HopQ C14-C512 (SEQ ID NO:145), MbNb207 c7HopQ C316-C472 (SEQ ID NO:147) 및 MbNb207 c7HopQ C314-C472 (SEQ ID NO:148)에 대해 야생형 메가바디와 비교하여, 10.9℃, 3.43℃, 4.29℃ 및 6.14℃만큼 증가되었고, 이들 디술피드 결합이 형성되어 메가바디를 강성화시킨다는 것을 의미한다.
실시예 10: 아주린 상에 그라프트된 GFP-특이적 나노바디로부터 구축된 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
강성 항원-결합 키메라 단백질을 생성시키기 위한 다른 방식은 대안적인 연결 계획을 통해 그들 스캐폴드에 면역글로불린을 연결시키는 것이다. 따라서, 도 11에 예시된 바와 같이 스캐폴드에 나노마디를 연결시키는 3개 폴리펩티드 연결을 통해서 스캐폴드 단백질 상에 그라프트된 나노바디로부터 구축된 메가바디를 코딩하는 라이브러리를 구축하였고 시험관내 선택으로 처리한다.
여기 기술된 강성 항원-결합 키메라 단백질은 도 11에 따라 3개의 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 사용된 면역글로불린은 SEQ ID NO:1에 표시된 바와 같은 GFP-결합 나노바디이다. 사용된 스캐폴드 단백질은 슈도모나스 애루지노사의 소형 구리 함유 단일 도메인 단백질, 아주린 (PDB 2TSA, SEQ ID NO: 52, 피. 애루지노사 단백질과 비교된 M121A 돌연변이)이다. 모든 부분은 펩티드 결합 (SEQ ID NO:53-60)에 의해 다음 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 아주린의 N-말단 부분 (SEQ ID NO:52의 잔기 3-22), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 아주린의 C-말단 부분 (SEQ ID NO:52의 잔기 31-128), 6xHis 및 EPEA 태그.
3개의 짧은 펩티드가 나노바디를 스캐폴드에 연결시키는 이들 금속-결합 메가바디 (SEQ ID NO:53-60)의 기능성 대표물을 효모 상에 디스플레이하고 선택하기 위해서, 우리는 다수의 보조 펩티드 및 단백질 (SEQ ID NO:61-68)과 융합체로 다양한 메가바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 아주린의 N-말단 부분 (SEQ ID NO:52의 잔기 3-22), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 아주린의 C-말단 부분 (SEQ ID NO:52의 잔기 31-128), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질에 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서, 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 제어 하에 pCTCON2 벡터 (Chao, 2006)에 두어서, 도 12에 따라 3개의 짧은 펩티드가 나노바디를 아주린에 연결시킨 메가바디의 77.280.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
효모 디스플레이 및 FACS에 의한 시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입시켰다. 형질전환된 세포를 성장시켰고 밤새 갈락토스-풍부 배지에서 Cu++ 의 존재 하에 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색하였고, 100 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고, 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정 메가바디 (높은 CoA-647 형광도)를 디스플레이하고 항원 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. GFP 결합 나노바디를 높은 수준으로 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켰고 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 후속 선별 라운드를 후속하였다.
2 라운드의 선택 이후에, CoA-647 및 GFP 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 나노바디를 스캐폴드 단백질에 연결시키는 대표적인 번호의 펩티드 링커의 서열을 결정하였다. 2개의 대표적인 클론의 링커 유형 1-2-1, 2-2-1, 1-2-2, 및 2-2-2 아미노산의 짧은 링켜 변이체 (표 5)는 FACS 실험으로 100 nM GFP에 결합한다는 것을 확인하였다 (도 37). 이것은 3개의 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 메가바디가 시험관내 선택에 의해 메가바디 라이브러리로부터 선택될 수 있고 기능성 항원-결합 키메라 단백질로서 디스플레이될 수 있다는 것을 입증한다.
MbNb207 아주린 의 기능성 변이체를 효모 세포 상에서 디스플레이시킬 수 있었으므로 (상기), 우리는 이. 콜라이의 주변세포질에서 이들 항원-결합 키메라 단백질을 발현시켰다. 효모 디스플레이에 의해 선택된 8종의 MbNb207 아주린 변이체 (표 5)는 하기 아미노산 서열을 갖는 키메라 폴리펩티드로서 생성시켰다: MbNb207 아주린 변이체 (SEQ ID NO:151-158), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), 아미노산 링커 (표 5), 아주린의 N-말단 부분 (SEQ ID NO:52의 잔기 3-22), 아미노산 링커 (표 5), 항-GFP-나노바디의 스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 아미노산 링커 (표 5), 아주린의 C-말단 부분 (SEQ ID NO:52의 잔기 31-128), 6xHis/EPEA 태그.
이. 콜라이의 주변세포질에서 MbNb207 아주린 변이체 (SEQ ID NO:151-158)와 같은 메가바디를 발현시키기 위해서, 우리는 실시예 2에 기술된 pMESD2 벡터를 변형시켰다. 이러한 새로운 벡터 (pMESP5라고 함)는 하기 폴리펩티드를 코딩하는 오픈 리딩 프레임을 함유한다: 이. 콜라이의 주변세포질로 메가바디의 분비를 유도하는pelB 리더 서열, NbGFP207의 β-스트랜드 A, 아주린의 N-말단 부분, 임의 나노바디의 C-말단 부분 (β-스트랜드 B 내지 β-스트랜드 G), 아주린의 C-말단 부분, 6xHis 태그 및 EPEA 태그, 이어서 앰버 중지 코돈. 8종 MbNb207 아주린 변이체 (SEQ ID NO: 151-158)는 실시예 2에 기술된 바와 같이 이. 콜라이의 주변세포질에서 발현시켰다. 발현된 메가바디의 기능적 성질은 8종 MbNb207 아주린 변이체 각각의 주변세포질 추출물을 사용하여 실시예 7에 기술된 바와 같이 ELISA를 통해 분석하였다. 고정된 GFP의 존재 및 부재에서 샘플에 대해 검출된 신호의 비교 (도 38)는 기능성 MbNb207 아주린 변이체 (SEQ ID NO: 151-158)의 주변세포질 발현을 분명하게 확인하였다. 이것은 3개의 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 메가바디가 이. 콜라이의 주변세포질에서 기능적으로 발현될 수 있다는 것을 입증한다.
실시예 11: 시험관내 선택에 의해 구조적 대칭성을 갖는 동종이량체 메가바디를 생성시키기 위해 GFP-특이적 나노바디의 제1 노출 β-턴에 삽입된 전화성 글리코시드 히드롤라제의 원형 배열 변이체로부터 구축된 항원-결합 키메라 단백질의 시험관내 선택에 의해 디자인 및 생성.
우리는 구조적 대칭성을 갖는 다량체 스캐폴드 단백질의 서브유닛 상에 Nb를 그라프팅시켜서 다량체 메가바디를 더욱 디자인하였다. 도 11에 따라서 나노바디를 스캐폴드를 연결시키는 3개 짧은 폴리펩티드 연결을 통해서 거대 동종이량체 스캐폴드 단백질의 서브유닛 상에 그라프트시킨 나노바디로부터 구축된 메가바디를 코딩하는 라이브러리는 효모 디스플레이 및 FACS를 통해 2-배 대칭성을 갖는 강성 동종이량체 메가바디를 동정하기 위해 구축하였다.
여기 기술된 동종이량체 메가바디 (이량체 당 191 kDa)는 도 11에 따라서 3개 짧은 폴리펩티드 링커를 통해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 사용된 면역글로불린은 SEQ ID NO:1에 표시된 바와 같은 항-GFP-나노바디이다. 사용된 스캐폴드 단백질은 비. 테타이오타오미크론의 동종이량체 글루칸 1,4-알파-글루코시다제, SusB (PDB 3WFA, SEQ ID NO:69)였다. 모든 부분은 다음의 소정 순서 (SEQ ID NO:70-77)로 아미노에서 카복시 말단으로 서로 연결되었다: 도 13에 따라서, 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-14), 세린, 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, SusB의 N-말단 부분 (SEQ ID NO:69의 잔기 1-68), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 15-125), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, SusB의 C-말단 부분 (SEQ ID NO:69의 잔기 76-718), 6xHis/EPEA 태그.
3개의 짧은 펩티드가 나노바디를 동종이량체 스캐폴드의 각 서브유닛 (SEQ ID NO:70-77)에 연결시킨 이들 동종이량체 메가바디의 기능성 대표물을 효모 상에 디스플레이하고 선택하기 위해서, 우리는 다수의 부속 펩티드 및 단백질 (SEQ ID NO:78-85)과 융합체로 다양한 메가바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-14), 세린, 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, SusB의 N-말단 부분 (SEQ ID NO:69의 잔기 1-68), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 15-125), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, SusB의 C-말단 부분 (SEQ ID NO:69의 잔기 76-738), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티닌 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 플레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하의 pCTCON2 벡터 (Chao, 2006)에 두어서 도 11에 따른 3개의 짧은 펩티드가 나노바디를 동종이량체 스캐폴드의 각 서브유닛에 연결시키는 메가바디의 77.280.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
효모 디스플레이 및 FACS를 통한 시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입시켰다. 형질전환된 세포를 성장시켰고 밤새 갈락토스-풍부 배지에서 Ca++ 의 존재 하에 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색시켰고, 100 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고, 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정 메가바디 (높은 CoA-647 형광도)를 디스플레이하고 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합을 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석을 통한 후속 선택 라운드를 수행하였다.
다수 선택 라운드 이후에, CoA-647 및 GFP 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고, DNA 시퀀싱을 수행하여 높은 수준으로 디스플레이되고 항원에 결합하는 다수 메가바디 변이체에서 나노바디를 SusB에 연결하는 링커의 길이 및 조성을 분석하였고, 그들이 충분히 발현되고, 세포 분비되고 기능성 GFP-결합 키메라 단백질로 폴딩될 수 있다는 것을 의미한다.
이들 동종이량체 메가바디 중 하나는 이. 콜라이의 주변세포질에서 발현시키고 그로부터 균질하게 정제하였다. 정제된 단백질을 결정화하였고 이의 구조는 GFP와 복합체로 분해하였다.
실시예 12: GFP-특이적 나노바디의 제1 노출 β-턴에 삽입된 PP7의 바이러스 외피 단백질의 원형 배열 변이체로부터 구축된 나노바디-디스플레이 20면체 바이러스-유사 입자의 시험관내 선택에 의한 디자인 및 생성.
cryo-EM에 의한 3-차원 구조 결정은 입사 전자빕에 대해 가변적으로 기원하는, 개별 입자의 다수 카피의 2D 투사 이미지에 존재하는 정보의 평균화를 포함한다. 20면체 바이러스의 경우에, 개별 비리온이 입자로 간주될 수 있지만, 이들 구조의 대칭성은 많은 동일한 카피의 비대칭 유닛이 각 입자에 포함되어, 구조를 결정하기 위해 평균낸 유효한 수의 유닛의 많은 폴드에 의해 증가된다. 따라서, 외피 단백질에 의해 부여되는 대칭성 이후에 강건하게 어레이된 나노바디는 Cryo-EM에 의해 소형 단백질 및 그들 복합체의 구조를 분해하기 위한 궁극의 도구가 될 것이다.
여기서 우리는 바이러스-유사 입자 (VLP)로 자가 조립되는 20면체 박테리오파지의 외피 단백질 상에 Nb를 그라프트시켜서 나노바디-디스플레이 20면체 바이러스-유사 입자를 디자인하였다. 피. 애루지노사의 20면체 박테리오파지 PP7의 외피 단백질의 쇄상화된 이량체의 90 카피 또는 180 외피 단백질은 이. 콜라이에서 과발현시 자가 조립되어 20면체 바이러스 유사 입자 (VLP)를 생성시킬 수 있다는 것이 확인되었다 (O'Rourke et al., 2015). 이들 VLP에서, 외피 단백질은 섞여짜여진 단량체의 C-말단에 매우 밀접한 한 단량체의 N-말단과 쌍형성 방식으로 엮여진다. 펩티드가 상응하는 VLP의 표면 상에 이 펩티드를 디스플레이하도록 이러한 이량체의 노출 루프에 삽입될 수 있다는 것이 또한 입증되었다. 따라서, 우리는 도 2에 따라서 2개 짧은 펩티드가 나노바디를 스캐폴드에 연결시키는 PP7 외피 단백질의 쇄상화된 이량체 상에 그라프트된 나노바디로부터 구축된 강성 항체 키메라를 코딩하는 무작위 라이브러리를 구축하였다. 여기 기술된 3.9 MDa의 20면체 바이러스-유사 입자는 도 14에 따라서 직접 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가-조립된다. 사용되는 면역글로불린은 SEQ ID NO:1에 표시된 바와 같은 GFP-결합 나노바디이다. 사용된 스캐폴드 단백질은 PP7의 외피 단백질의 공유 이량체의 원형 배열된 형태 (PDB: 1DWN, SEQ ID NO:2)이다. PP7은 피. 애루지노사의 20면체 RNA 박테리오파지이다. 모든 부분은 다음의 소정 순서 (SEQ ID NO:3-6)로 아미노에서 카복시 말단으로 서로 연결되었다: 출발 코돈에 의해 코딩된 메티오닌, 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-13), PP7 외피 단백질 (SEQ ID NO:2의 잔기 12-128), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 글리신, PP7 외피 단백질 (SEQ ID NO:2의 잔기 2-128), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 글리신, PP7 외피 단백질 (SEQ ID NO:2의 잔기 2-8), GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그. 이러한 강성 항원-결합 키메라 단백질은 이의 표면 상에 90 카피의 나노바디를 디스플레이하는 20면체 VLP (NanoVLP)로 자가 조립된다 (도 14).
NanoVLP로 자가 조립되는 조작된 이들 GFP-결합 외피 단백질의 기능성 대표물을 선택하기 위해서, 우리는 메티오닌, 항 GFP-나노바디의 β-스트랜드 A, 원형 배열 이량체 PP7 외피 단백질, GFP-결합 나노바디의 β-스트랜드 B 내지 G, 6xHis/EPEA 태그를 포함하는 오픈 리딩 프레임 (SEQ ID NO:3-6)의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이들 DNA 단편은 NdeI-EcoRI 단편으로서 pMESP 벡터 (ref CA12729, pMES4의 유도체, GenBank GQ907248로서 LguI 부위가 제거됨)에 클로닝되어, pelB 신호 펩티드, 임의의 Nb 서열, 및 유전자3을 포함하는 모든 검출 태그를 대체시켰다. 이러한 새롭게 생성된 라이브러리를 pcPP72NbGFP207L이라고 한다.
20면체 바이러스-유사 입자를 형성시키기 위해 시험관내에서 재조합적으로 발현 및 조립시킬 수 있는 재조합 GFP-결합 PP7 외피 단백질을 선택하기 위해서, 키메라 이량체의 라이브러리를 플라스미드 수준에서 구축된다. 이들 라이브러리는 이. 콜라이 세포를 형질전환시키는데 사용된다. NanoVLP로 조립시킬 수 있는 키메라 이량체를 이. 콜라이에서 발현시켰고 크로마토그래피 선택을 수행하였다. IMAC 정제는 키메라 이량체를 발현시키고 VLP로 조립시킬 수 있는 이들 클론을 선택하기 위한 라이브러리에 대해 수행하였다. 각각의 조립-컴피턴트 VLP가 이의 쉘에 나노바디-외피 단백질을 코딩하는 핵산을 캡슐화시켰으므로, 우리는 NanoVLP로부터 유래된 RNA의 RT-PCR을 통해 클론을 증폭시켰다. 항원-결합 키메라 단백질을 발현하는 몇몇 클론은 단일 콜로니로서 성장시켰고 제1 PP7 외피 단백질을 다음 PP7에 연결시키는 펩티드 링커의 서열을 결정하고 원형 배열 펩티드 링커의 서열을 결정하기 위해 DNA 시퀀싱을 수행하였다. 전체 길이 구성체를 보유하는 개별 클론에 대해서 실시예 7에 기술된 바와 같이 ELISA를 수행항 GFP에 결합하는 클론을 동정하였다 (도 39). 이것은 폴리펩티드 연결에 의해 연결된 (원형 배열) PP7 외피 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 항원-결합 키메라 단백질이 기능성 항원-결합 키메라 단백질로서 라이브러리로부터 선택될 수 있다는 것을 입증한다. 상이한 링커 변이체의 대표적인 클론은 표 6에 제공된다.
실시예 13: 리소자임-특이적 나노바디의 제1 노출 β-턴에 삽입된 MS2의 바이러스 외피 단백질의 원형 배열 변이체로부터 구축된 나노바디-디스플레이 20면체 바이러스-유사 입자의 시험관내 선택에 의한 디자인 및 생성.
여기 기술된 3.9 MDa 20면체 바이러스-유사 입자는 도 15에 따라 짧은 폴리펩티드 링커를 통해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로빈의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가-조립된다. 사용된 면역글로불린은 리소자임-결합 나노바디 (PDB: 1MEL, SEQ ID NO:7)이다. 사용된 스캐폴드 단백질은 MS2의 외피 단백질의 공유 이량체의 원형 배열 형태 (PDB: 2MS2, SEQ ID NO:2)였다. MS2는 에스케리치아 콜라이의 20면체 RNA 박테리오파지이다. 모든 부분은 다음의 소정 순서 (SEQ ID NO:9-13)로 아미노에서 카복시 말단으로 서로 연결되었다: 출발 코돈에 의해 코딩되는 메티오닌, 나노바디 β-스트랜드 A (항-GFP-나노바디의 β-스트랜드 A, 잔기 1-12), 무작위 조성의 2개 아미노산의 원형 배열 링커, MS2 외피 단백질 (SEQ ID NO:8의 잔기 17-130; 이후 SEQ ID NO:8의 잔기 2-130 및 SEQ ID NO:8의 잔기 2-14), 리소자임-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:7의 잔기 17-133), 6xHis/EPEA 태그. 이러한 강성 항원-결합 키메라 단백질은 이의 표면에 90 카피의 나노바디를 디스플레이하는 20면체 VLP로 자가 조립된다 (도 15).
NanoVLP로 자가 조립되는 이들 조작된 리소자임-결합 외피 단백질의 기능적 대표물을 선택하기 위해서, 우리는 메티오닌, 항 GFP-나노바디의 β-스트랜드 A, 원형 배열 이량체 MS2 외피 단백질, 리소자임-결합 나노바디의 β-스트랜드 B 내지 G, 6xHis/EPEA 태그를 포함하는 오픈 리딩 프레임 (SEQ ID NO:9-13)의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이들 DNA 단편은 NdeI-EcoRI 단편으로서 pMESP 벡터 (ref CA12729)에 클로닝하였다. 이러한 새롭게 생성된 플라스미드 라이브러리는 pcMS22cAbLys3L이라고 하였다.
20면체 바이러스-유사 입자를 형성시키기 위해 시험관내에서 재조합적으로 발현시킬 수 있고 조립할 수 있는 재조합 리소자임-결합 MS2 외피 단백질을 선택하기 위해서, NanoVLP의 라이브러리를 플라스미드 수준에서 구축한다. 이들 라이브러리는 이. 콜라이 세포를 형질전환시키는데 사용된다. NanoVLP를 이. 콜라이에서 발현시켰고 VLP 조립을 위해 크로마토그래피 선택을 수행하였다. 이러한 각각의 조립-컴피턴트 VLP가 이의 쉘에서 나노바디-외피 단백질을 코딩하는 핵산을 캡슐화시켰으므로, 침전 후 크기 배제 크로마토그래피를 통해 정제할 수 있는 NanoVLP로부터 유래된 RNA의 RT-PCR에 의한 시퀀싱은 조립을 위해 선택을 통해 농축된 유전자를 밝혀준다. 리소자임을 사용한 친화성 선택 시, RNA는 리소자임에 특이적으로 결합하는 NanoVLP로부터 단리 및 증폭된다.
이들 리소자임-결합 MS2 외피 단백질로부터 구축된 일부 조립-컴피턴트 리소자입 특이적 NanoVLP는 균질하게 정제되었고 리소자임의 존재 및 부재 하에서 단일 입자 cryo-EM에 의해 분석되었다.
실시예 14: GFP-특이적 나노바디의 제1 노출 β-턴에 삽입된 AP205의 천연 배열 바이러스 외피 단백질로부터 구축된 나노바디-디스플레이 20면체 바이러스-유사 입자의 시험관내 선택에 의한 디자인 및 생성.
여기 기술된 이량체는 도 40에 따라 짧은 폴리펩티드 링커에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가-조립된다. 사용된 면역글로불린은 GFP-결합 나노바디 (SEQ ID NO:1)이다. 사용된 스캐폴드 단백질은 AP205의 외피 단백질의 공유 이량체였다 (PDB: 5FS4, SEQ ID NO: 166). AP205는 아시네토박터 박테리아의 20면체 RNA 박테리오파지이다. AP205 외피 단백질 이량체는 다른 기지의 단일-가닥 RNA 파지에서 베타-헤어핀을 형성하는, N-말단 영역을 제외하고 보존된 레비바이러스과 외피 단백질을 채택한다. AP205는 N-말단 및 C-말단 베타-스트랜드에 의해 형성된 동일 위치에서 유사한 구조를 가져서, 다른 외피 단백질과 비교하여 원형 배열체를 만든다. 그 배열은 외피 단백질 말단에서 조립된 입자의 대부분의 표면-노출 부분으로 이동하고, 이것은 긴 N-말단 및 C-말단 융합체에 대해 증가된 이의 내성을 설명해 준다 (Shishovs et al., 2016).
모든 부분은 다음의 소정 순서 (SEQ ID NO:167)로 아미노에서 카복시 말단으로 서로 연결되었다: 출발 코돈에 의해 코딩되는 메티오닌, 나노바디 β-스트랜드 A (항-GFP-나노바디의 β-스트랜드 A, 잔기 1-11), 1개 아미노산의 무작위 링커, AP205 외피 단백질 이량체 (SEQ ID NO:166의 잔기 4-128; 이후 SEQ ID NO:166의 잔기 4-126), GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그. 이러한 항원-결합 키메라 단백질의 기능성 대표물을 선택하기 위해서, 우리는 메티오닌, 항 GFP-나노바디의 β-스트랜드 A, 이량체 AP205 외피 단백질, GFP-결합 나노바디의 β-스트랜드 B 내지 G, 6xHis/EPEA 태그를 포함하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이들 DNA 단편은 NdeI-EcoRI 단편로서 pMESP 벡터 (ref CA12729)에 클로닝하였다. 이러한 새롭게 생성된 플라스미드는 pMESAP2052XXPNbGFP207이라고 하였다. 시험관내에서 재조합적으로 발현시키고 올바르게 조립시킬 수 있는 항원-결합 키메라 (AP205) 단백질을 선택하기 위해서, 항원-결합 키메라 단백질의 라이브러리는 플라스미드 수준에서 구축된다. 이들 라이브러리는 이. 콜라이 세포를 형질전환시키는데 사용된다. 키메라 이량체로서 올바르게 조립되는 키메라 단백질을 동정하기 위해서, 개별 클론은 이. 콜라이에서 발현되었고 GFP에 결합하는 클론에 대해 스크리닝하기 위해 실시예 7에 기술된 바와 같은 ELISA를 수행하였다 (도 41). GFP에 결합하는 MbNb207 AP205x2XX를 발현시키는 몇몇 클론은 단일 콜로니로서 성장시켰고 나노바디를 스캐폴드 단백질에 연결시키는 펩티드 링커의 서열을 결정하기 위해 DNA 시퀀싱을 수행하였다. 이것은 2개의 짧은 폴리펩티드 연결에 의해 연결된 바이러스 AP205 외피 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 항원-결합 키메라 단백질이 기능성 항원-결합 키메라 단백질로서 라이브러리로부터 선택될 수 있다는 것을 입증한다. 1-1 아미노산의 짧은 링커 변이체의 대표적인 클론은 표 7에 제공된다. 우리는 이들 항원-결합 키메라 단백질의 일부가 표면 상에 90 카피의 나노바디를 디스플레이하는 20면체 VLP로 자가 조립된다는 것을 확인하였다.
실시예 15: GFP-특이적 나노바디의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 AP205의 외피 단백질로부터 구축된 2개 폴리펩티드로 구성된 이량체 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
여기 기술된 이량체는 도 42에 따라서 짧은 폴리펩티드 링커에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가 조립된다. 사용된 면역글로불린은 GFP-결합 나노바디 (SEQ ID NO:1)이다. 사용된 스캐폴드 단백질은 AP205 (PDB: 5FS4, SEQ ID NO: 166)였다. AP205 단량체가 이량체 또는 VLP로 조립되었을 때, 한 단량체의 N-말단은 제2 단량체의 C-말단에 밀접하게 근접하여 오게되고 그반대도 마찬가지이다. 기능성 항원 결합 키메라를 얻기 위해서, 이량체 항원-결합 키메라 단백질로 조립되기 위해, 제1 단량체의 β-스트랜드 A는 제2 단량체의 GFP-결합 나노바디의 β-스트랜드 B 내지 G를 조합시킬 필요가 있고 제2 단량체의 GFP-결합 나노바디의 β-스트랜드 B 내지 G는 제1 단량체의 β-스트랜드 A와 조합될 필요가 있다.
모든 부분은 다음의 소정 순서 (SEQ ID NO:173)로 아미노에서 카복시 말단으로 서로 연결되었다: 출발 코돈에 의해 코딩되는 메티오닌, 나노바디 β-스트랜드 A (항-GFP-나노바디의 β-스트랜드 A, 잔기 1-11), 1개 아미노산의 무작위 링커, AP205 외피 단백질 (SEQ ID NO:166의 잔기 4-126), GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA.
이러한 이량체 항원-결합 키메라 단백질의 기능적 대표물을 선택하기 위해서, 우리는 메티오닌, 항 GFP-나노바디의 β-스트랜드 A, 단량체 AP205 외피 단백질, GFP-결합 나노바디의 β-스트랜드 B 내지 G, 6xHis/EPEA 태그를 포함하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이들 DNA 단편은 NdeI-EcoRI 단편으로서 pMESP 벡터에 클로닝되었다. 이러한 새롭게 생성된 플라스미드 pMESAP2051XXPNbGFP207이라고 하였다.
시험관내에서 재조합적으로 발현시키고 올바르게 조립시킬 수 있는 이량체 항원-결합 키메라 단백질을 선택하기 위해서, 이량체 항원-결합 키메라 단백질의 이들 라이브러리를 플라스미드 수준에서 구축한다. 이들 라이브러리는 이. 콜라이 세포를 형질전환시키는데 사용된다. 이량체로서 올바르게 조립된 키메라 단백질을 동정하기 위해서, 개별 클론은 이. 콜라이에서 발현시켰고 GFP에 결합하는 클론을 스크리닝하기 위해서 실시예 7에 기술된 대로 ELISA를 수행하였다 (도 43). GFP에 결합하는 MbNb207 AP205XX의 이량체를 발현시키는 몇몇 클론은 단일 콜로니로서 성장시켰고 나노바디를 스캐폴드 단백질에 연결하는 펩티드 링커의 서열을 결정하기 위해 DNA 시퀀싱을 수행하였다. 이것은 2개의 짧은 폴리펩티드 연결에 의해 연결된 바이러스 AP205 외피 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 이량체 항원-결합 키메라 단백질을 이량체 항원-결합 키메라 단백질로서 라이브러리로부터 선택할 수 있다는 것을 입증한다. 1-1 아미노산의 짧은 링커 변이체의 대표적인 클론은 표 8에 제공된다.
하나는 예를 들어, GFP-결합 나노바디 및 FedF-결합 나노바디인, 상이한 항원 결합 도메인을 갖는 2개 항원-결합 키메라 단백질이 세포에서 공발현되면, 그들은 이종이량체 키메라 단백질로서 조립될 수 있다.
실시예 16: GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 ACP로부터 구축된 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
우리의 최초 메가바디의 성공적인 디자인을 구축하여, 우리는 또한 면역글로불린 도메인이 진단, 영상화 또는 다른 생물리학적 적용분야에서 사용되도록 형광단, 염료, 이온 또는 금속으로 표지될 수 있는 스캐폴드 상에 강성으로 그라프트될 수 있는지를 시험하였다. 따라서, 우리는 CoA 및 SFP 신타제의 형광성 유도체의 사용을 통해 특이적 세린 (도 16)에 직교적으로 표지될 수 있는 강성 항원-결합 키메라 단백질을 생성시키기 위해서 도 2에 따라서 2개 짧은 펩티드가 스캐폴드에 나노바디를 연결한 (그러나 스캐폴드의 원형 배열은 필요없음) ACP 상에 그라프트된 나노바디로부터 구축된 강성 항체 키메라를 코딩하는 무작위 라이브러리를 구축하였다 (Yin et al, 2006).
여기 기술된 나노툴은 도 2에 따라 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 이러한 특정한 메가바디에서, 야생형 ACP의 N-말단 및 C-말단이 서로 가까이 있고 나노바디를 ACP에 연결시키는 2개의 짧은 폴리펩티드 연결을 조작하기 위해 잘 위치되었기 때문에 스캐폴드 단백질의 원형 배열을 요구하지 않았다 (도 16). 사용된 면역글로불린은 SEQ ID NO:1로 표시된 바와 같은 GFP-결합 나노바디이다. 스캐폴드 단백질은 ACP로 축약된 에스케리치아 콜라이의 아실 캐리어 단백질 (PDB:1T8K, SEQ ID NO:86)이다. 모든 부분은 펩티드 결합 (SEQ ID NO:87-90)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 도 2에 따라서, 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-11), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, ACP (SEQ ID NO:86의 잔기 2-76), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 6xHis/EPEA 태그.
2개 짧은 펩티드가 나노바디를 ACP (SEQ ID NO:87-90)에 연결시키는 이들 나노툴의 기능성 대표물을 효모 상에 디스플레이시키고 선택하기 위해서, 우리는 다수의 부속 펩티드 및 단백질 (SEQ ID NO:91-94)과 융합체로 다양한 MbNb207 ACP 툴바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-11), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, ACP (SEQ ID NO:86의 잔기 2-76), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질와의 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 제어 하에서 pCTCON2 벡터 (Chao, 2006)에 두어서 도 16에 따라 2개 짧은 펩티드가 나노바디를 ACP 스캐폴드에 연결시키는 나노툴의 77.280.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
효모 디스플레이 및 FACS에 의한 시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입하였다. 형질전환된 세포를 성장시켰고 락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색하였고 100 nM의 GFP와 인큐베이션시켰다. 다음으로 이들 세포를 세척하였고 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정 나노툴 (높은 CoA-647 형광도)을 디스플레이하고 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합을 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 후속 선택 라운드를 수행하였다.
1 라운드의 선택 후에, CoA-647 및 GFP 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 나노바디를 스캐폴드 단백질에 연결하는 대표적인 번호의 펩티드 링커의 서열을 결정하였다. 1-1, 2-1 및 2-2 아미노산의 짧은 링커 변이체의 대표적인 2개 클론 (표 9)은 FACS 실험에서 100 nM GFP에 결합한다는 것을 확인하였다 (도 44). 이것은 2개의 짧은 폴리펩티드 연결에 의해 연결된 아실 캐리어 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 나노툴을 메가바디 라이브러리로부터 선택할 수 있고 기능성 항원-결합 키메라 단백질로서 디스플레이할 수 있다는 것을 입증한다. 우리가 MbNb207 ACP 나노툴의 기능성 변이체를 효모의 표면 상에 디스플레이할 수 있었으므로 (상기), 우리는 이들 항원-결합 키메라 단백질을 이. 콜라이의 주변세포질에서 발현시키도록 하였다. 효모 디스플레이에 의해 선택된 6종 MbNb207 ACP 나노툴 변이체는 하기 아미노산 서열을 갖는 키메라 폴리펩티드로서 생성시켰다: MbNb207 ACP 변이체 (SEQ ID NO:178-183): 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-11), 아미노산 링커 (연결부#1 표 9), ACP (SEQ ID NO:86의 잔기 2-76), 아미노산 링커 (연결부#2 표 9), 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 6xHis/EPEA 태그.
이. 콜라이에서 이들 변이체를 발현시키기 위해서, 실시예 2에 기술된, pMESD2 벡터를 변형시켰다. 이러한 새로운 벡터 (pMESP6이라고 함)는 하기 폴리펩티드를 코딩하는 오픈 리딩 프레임을 함유한다: 이. 콜라이의 주변세포질로 나노툴의 분비를 유도하는 pelB 리더 서열, NbGFP207의 β-스트랜드 A, ACP, 임의의 나노바디의 C-말단 부분 (β-스트랜드 B 내지 β-스트랜드 G), 6xHis/EPEA 태그, 이어서 앰버 중지 코돈. 6종의 MbNb207 ACP 나노툴 변이체 (SEQ ID NO:178-182)는 실시예 2에 기술된 대로 발현시켰다. 다음으로 발현된 나노툴의 기능적 성질은 각각의 6종 MbNb207 ACP 나노툴 변이체의 주변세포질 추출물을 사용해, 실시예 7에 기술된 바와 같이 ELISa를 통해 분석하였다. 고정된 GFP 존재 및 부재에서 샘플에 대해 검출된 신호의 비교 (도 45)는 기능성 MbNb207 ACP 나노툴 변이체의 주변세포질 발현을 분명히 확인하였다. 이것은 2개 짧은 폴리펩티드 연결에 의해 연결된 아실 캐리어 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 나노툴이 이. 콜라이의 주변세포질에서 기능적으로 발현될 수 있다는 것을 입증한다.
실시예 17: 파지 디스플레이를 사용한 시험관내 선택에 의한 리소자임-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 GFP-특이적 나노바디로부터 구축된 항원-결합 키메라 단백질의 디자인 및 생성.
나노바디 자체가 스캐폴드 단백질로서 적용될 수 있는지 여부, 그래서, 나노바디가 또한 동일하거나 또는 상이한 나노바디에 강성으로 융합되어 2가 또는 이중특이적 항원-결합 키메라 단백질를 생성시킬 수 있는지 여부를 더욱 조사하였다. 따라서, 나노바디는 강성 Nb-Nb 키메라 (나노2바디)를 구축하기 위해 도 17에 따라 스캐폴드에 나노바디를 연결하는 3개 폴리펩티드 연결을 통해 다른 나노바디에 그라프트되었다. 이러한 연결은 양쪽 Nb의 파라토프가 그들의 개별 항원에 결합하는 것이 자유롭도록 수행되었다. 따라서, 이러한 융합체는 나노2바디의 양쪽 나노바디가 동일한 항원에 결합한다면 더 높은 화합력으로 결합할 수 있거나 또는 나노2바디의 각 나노바디가 상이한 항원에 결합한다면 2개의 상이한 항원에 결합하여 가교될 수 있을 것이다.
여기 기술된 나노2바디 (도 18)는 도 17에 따라서 짧은 폴리펩티드 연결에 의해 연결된 제1 나노바디의 일부분 및 다른 (상이한) 나노바디의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 사용된 제1 나노바디는 SEQ ID NO:1로 표시된 바와 같은 GFP-결합 나노바디 (NbGFP207)이다. 제2 나노바디는 흰계란 리소자임 (cAbLys3, PDB 1MEL, SEQ ID NO:7)에 결합한다 (Desmyter A et al., 1996). 모든 부분은 도 18에 도시된 바와 같이 펩티드 결합 (SEQ ID NO:14)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A NbGFP207 (잔기 1-15, SEQ ID NO: EP1), 무작위 조성의 3개 아미노산의 펩티드 링커, 글리신, NbGFP207 (잔기 2-118, SEQ ID NO:1), 무작위 조성의 2개 아미노산의 펩티드 링커, 리소자임-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:7의 잔기 16-133), 무작위 조성의 3개 아미노산의 펩티드 링커, NbGFP207의 G-스트랜드의 마지막 부분 (SEQ ID NO:1의 잔기 117-126), 6xHis/EPEA 태그.
이들 나노2바디 (SEQ ID NO: 14)의 기능성 대표물을 사상 파지 상에 디스플레이하고 선택하기 위해서, 우리는 다수의 보조 펩티드 및 단백질과의 융합체로 다양한 나노2바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이를 위해서, 둘 모두 β-스트랜드 A를 함유하는, pelB 신호를 보유하는 pMESP1 벡터 및 DsbA 신호 펩티드를 보유하는 pMESD1 벡터는 2개 나노바디가 다음의 나노2바디를 생성시키도록 삽입될 수 있는 방식으로 개조되었다: SEQ ID NO:15: 이. 콜라이의 주변세포질로 융합 단백질의 분비를 유도하는 PelB 리더 서열, 항-GFP-나노바디 NbGFP207의 β-스트랜드 A (잔기 1-15, SEQ ID NO:1), 무작위 조성의 3개 아미노산의 펩티드 링커, 글리신, NbGFP207 (잔기 2-118, SEQ ID NO:1), 무작위 조성의 2개 아미노산의 펩티드 링커, 리소자임-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:7이 잔기 16-133), 무작위 조성의 3개 아미노산의 펩티드 링커, NbGFP207의 G-스트랜드의 마지막 부분 (SEQ ID NO:1의 잔기 117-126), 6xHis/EPEA 태그, 앰버 중지 코돈, HA 태그 및 M13 파지의 단백질 3. 또는 나노2바디 SEQ ID NO:16: 이. 콜라이의 주변세포질로 융합 단백질의 분비를 유도하는 DsbA 리더 서열, 항-GFP-나노바디 NbGFP207의 β-스트랜드 A (잔기 1-15, SEQ ID NO:1), 무작위 조성의 3개 아미노산의 펩티드 링커, 글리신, NbGFP207 (잔기 2-118, SEQ ID NO:1), 무작위 조성의 2개 아미노산의 펩티드 링커, 리소자임-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:7의 잔기 16-133), 무작위 조성의 3개 아미노산의 펩티드 링커, NbGFP207의 G-스트랜드의 마지막 부분 (SEQ ID NO:1의 잔기 117-126), 6xHis 태그/EPEA 태그, 앰버 중지 코돈, HA 태그 및 M13 파지의 단백질 3.
실시예 18:
파지 디스플레이를 사용한 시험관내 선택에 의한 FedF-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 GFP-특이적 나노바디로부터 구축된 항원-결합 키메라 단백질의 디자인 및 생성.
우리는 또한 나노바디가 동일하거나 또는 상이한 나노바디에 강성으로 융합되어 2가 또는 이중특이적 항원-결합 키메라 단백질을 생성시킬 수 있는가를 시험하였다. 따라서, 나노바디는 강성 Nb-Nb 키메라 (나노2바디; N2b)를 구축하기 위해 도 17에 따라 스캐폴드에 나노바디를 연결하는 3개 폴리펩티드 연결을 통해 다른 나노바디 상에 그라프트되었다. 연결은 양쪽 Nb의 파라토프가 그들 개별 항체에 자유롭게 결합하도록 수행되었다. 따라서, 이러한 융합은 양쪽 단량체가 동일 항원에 결합하면 더 높은 화합력으로 결합할 수 있을 것이거나 또는 각 단량체가 상이한 항원에 결합하면 2종의 상이한 항원에 결합할 수 있을 것이다.
여기 기술된 나노2바디 (도 19)는 도 19에 따라 짧은 폴리펩티드 연결에 의해 연결된 제1 나노바디의 일부분 및 다른 (상이한) 나노바디의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 사용된 제1 나노바디는 SEQ ID NO:1로 표시된 GFP-결합 나노바디 (NbGFP207)이다. 제2 나노바디는 F18 핌브리아 어드헤신 FedF의 렉틴 도메인 (NbFedF9, SEQ ID NO:17)을 인식한다 (Moonens et al.,2014). 모든 부분은 도 10에 도시된 바와 같이 펩티드 결합 (SEQ ID NO:18)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로에 연결되었다: 항-GFP-나노바디 NbGFP207의 β-스트랜드 A (잔기 1-15, SEQ ID NO: 1), 무작위 조성의 3개 아미노산의 펩티드 링커, 글리신, NbGFP207 (잔기 2-118, SEQ ID NO:1), 무작위 조성의 2개 아미노산의 펩티드 링커, FedF-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:17의 잔기 16-129), 무작위 조성의 3개 아미노산의 펩티드 링커, NbGFP207의 G-스트랜드의 마지막 부분 (SEQ ID NO:1의 잔기 117-126), 6xHis/EPEA 태그.
고도로 보존된 N-말단 서열 및 고도로 보존된 C-말단 서열이 모든 Nb에 공통이므로, 생체내-성숙된 나노바디 레파토리는 매우 유사한 방식으로 편리하게 클로닝될 수 있다.
나노2바디의 2개 형태를 만들 수 있다: 제1 결합 도메인으로서 NbGFP207 및 제2 결합 도메인으로서 NbFedF9 및 그 반대.
스크리닝을 단순화시키기 위해서, 우리는 도 46에 도시된 바와 같이 에너지적으로 안정한 구성체 (SEQ ID NO: 184-185)로부터 시작하기 위해 컴퓨터 모델링을 사용하였다. 사상 파지 상에서 이들 나노2바디의 기능성 대표물을 디스플레이하고 선택하기 위해서, 우리는 다수의 보조 펩티드 및 단백질과 융합체로 다양한 나노2바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이를 위해서 그 둘 모두 β-스트랜드 A를 함유하는, pelB 신호 펩티드를 보유하는 pMESP1 벡터 및 DsbA 신호 펩티드를 보유하는 pMESD1 벡터는 2개 나노바디가 나노2바디: SEQ ID NO: 184-185를 생성하도록 삽입될 수 있는 방식으로 개조되었다. pMESP 구성체에서 PelB 리더 서열은 이. 콜라이의 주변세포질로 항원-결합 키메라 단백질의 분비를 유도하고, pMESD 구성체에서 DsbA 리더 서열은 이. 콜라이의 주변세포질로 항원-결합 키메라 단백질의 분비를 유도한다. 모든 부분은 펩티드 결합에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로에 연결되었다: 신호 펩티드, 항-GFP-나노바디 NbGFP207의 β-스트랜드 A (잔기 1-13, SEQ ID NO:1), 4개 아미노산의 펩티드 링커: TENH (잔기 14-17, SEQ ID NO: 184-185), NbGFP207 (잔기 3-116, SEQ ID NO:1, 잔기 5에 V에서 Q 돌연변이 존재), 무작위 조성의 4개 아미노산의 펩티드 링커, FedF-결합 나노바디의 β-스트랜드 B 내지 G (SEQ NO:17의 잔기 16-128), 3개 아미노산의 펩티드 링커: GQE (SEQ ID NO:184의 잔기 249-251) 또는 GQQ (SEQ ID NO:185의 잔기 249-251), NbGFP207의 G-스트랜드의 마지막 부분 (SEQ ID NO:1의 잔기 117-126), 6xHis/EPEA 태그, 앰버 중지 코돈, HA 태그 및 M13 파지의 단백질 3.
시험관내에서 재조합적으로 발현될 수 있는 항원-결합 키메라 단백질을 선택하기 위해서, 항원-결합 키메라 단백질의 라이브러리는 플라스미드 수준에서 구축된다. pMESP 벡터에 클로닝된 DNA 단편의 라이브러리는 pMESPNIIbGFP207XFedF9라고 하였고, pMESP 벡터에 클로닝된 DNA 단편의 라이브러리는 pMESDNIIbGFP207XFedF9라고 하였다. 이들 라이브러리는 이. 콜라이 세포를 형질전환시키는데 사용되었다. 올바르게 조립된 키메라 단백질을 동정하기 위해서, 우리는 FedF 상에서 파지 디스플레이 (Pardon et al., 2014)를 통해 1 또는 2 라운드의 시험관내 선택을 수행한 후에 GFP 상에서 1 라운드의 선택을 수행하였다. 선택 후, 개별 클론을 선택하였고 관심 DNA 단편을 PCR하였으며, 각 클론의 크기를 1% 아가로스 겔 상에서 검토하였다. 올바른 크기의 DNA 단편을 보유하는 몇개 클론을 서열 분석하여 상이한 나노바디 단편을 연결하는 펩티드 링커의 서열을 결정하였다. 올바른 클론을 이. 콜라이에서 발현시켰고, IMAC를 사용해 반정제하였으며 ELISA를 수행하여 다음과 같이 발현되어 GFP 및 FedF에 결합하는 클론을 스크리닝하였다 (도 47): 정제된 GFP 및 FedF는 소듐 바이카보네이트 완충액 pH 8.2 중 0,5 ㎍/웰 농도로 maxisorp 마이크로타이터 플레이트 (Nunc)의 웰에 개별적으로 고정시켰다. 웰 내 잔류 단백질 결합 부위는 PBS 중 우유를 사용해 실온에서 2시간 동안 차단시켰다. IMAC 정제된 나노2바디 샘플은 GFP 코팅, FedF 코팅 및 비코팅 웰에서 인큐베이션시켰다. 세척 단계 이후에, GFP에 대한 나노2바디의 결합은 나노2바디에만 존재하는, EPEA-태그를 특이적으로 인식하는 CaptureSelect C-태그 바이오틴화된 항체 (Life Technologies)를 사용하여 조사하였다. CaptureSelect 바이오틴화된 항체의 후속 검출은 스트렙타비딘-알칼리 포스파타제 (Promega)로 수행하였다. 405 nm에서의 흡광도는 효소 기질 p-니트로페닐 포스페이트의 부가 후 측정하였다. 검출된 신호는 일부 이들 항원-결합 키메라 단백질이 GFP 및 FedF를 인식할 수 있다는 것을 보여준다. 이것은 3개의 짧은 폴리펩티드 연결에 의해 연결된 단일-도메인 면역글로불린의 일부분 및 상이한 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 나노2바디가 기능성 항원-결합 키메라 단백질로서 라이브러리로부터 선택될 수 있다는 것을 입증한다. 4-4-3 아미노산의 짧은 링커 변이체의 대표적인 클론은 표 10에 제공된다.
실시예 19: 효모 디스플레이 또는 파지 디스플레이에 의해 면역 라이브러리로부터 GFP-특이적 항원-결합 키메라 단백질의 선택을 위한 디스플레이 벡터.
면역글로불린 폴드의 프레임워크의 일부로서, N-말단 아미노산 서열 (β-스트랜드 A 내지 B를 연결하는 β-턴을 형성하는 잔기 및 β-스트랜드 A 포함)은 상이한 낙타과 항체 중에서 고도로 보존적이다 (Harmsen, 2000). 결론적으로, 하나의 대표적인 나노바디를 스캐폴드에 연결시키는 링커 펩티드의 길이 및 서열이 최적화되었으면, 동일 링커는 임의 나노바디의 β-스트랜드 A 내지 B를 연결하는 제1 β-턴에 특정한 스캐폴드를 삽입시켜 잘 폴딩된 안정한 메가바디를 생성시키는데 사용될 수 있다 (앞의 실시예들 참조). 유사하게, 상이한 낙타과 항체의 C-말단 서열이 고도로 보존적이다. 따라서, 대표적인 한 나노바디를 스캐폴드에 연결시키는 이러한 링커 펩티드의 길이 및 서열이 최적화되면, 동일한 링커가 나노바디의 C-말단을 스캐폴드에 연결시키는데 사용될 수 있다.
나노바디의 생체내 성숙된 라이브러리는 특히 도 2 또는 11에 제시된 연결 계획에 따라서 강성 항원-결합 키메라 단백질의 거대 라이브러리를 클로닝시키는데 편리하게 사용될 수 있다고 결론내려진다. 이들 라이브러리는 예상되는 적용분야에 따라서, 특정 디자인의 기능성 메가바디, 대칭성을 갖는 다량체 메가바디, VLP, 나노툴 또는 나노2바디에 대해 파지 디스플레이, 효모 디스플레이 또는 바이러스 디스플레이에 의해 스크리닝될 수 있다. 이러한 개념을 증명하기 위해서, 나노바디 면역 라이브러리는 동일 스캐폴드 상에 그라프트된 상이한 나노바디로부터 조립되는 강성 항원-결합 키메라 단백질의 거대 레파토리의 디스플레이를 위한 라이브러리를 구축하기 위해서 도 2에 따라 스캐폴드에 나노바디를 연결하는 2개 펩티드 결합을 통해 스캐폴드 단백질 HopQ 상에 그라프트되었다 (도 20). 여기 기술된 메가바디는 도 2에 따라 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 면역글로불린은 [Pardon et al. (2014)]에 기술된 바와 같이 GFP로 면역화된 라마의 혈액 샘플로부터 클로닝된 나노바디이다. 모든 부분은 펩티드 결합에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), GFP로 면역화된 라마로부터 유래된 나노바디의 β-스트랜드 B 내지 G. 나노바디-코팅 유전자는 [Pardon et al. (2014)]에 기술된 바와 같이 이러한 면역화된 동물로부터 클로닝되었다. 2개의 짧은 펩티드가 다른 GFP-특이적 나노바디를 스캐폴드에 연결시킨 신규한 기능성 GFP-결합 메가바디를 효모 상에 디스플레이하고 선택하기 위해서, 우리는 프라이머 TU64 (SEQ ID NO:124) 및 TU65 (SEQ ID NO:125)를 사용하여 나노바디-코딩 유전자를 증폭시켰고 도 8에 따라서 다수의 보조 펩티드 및 단백질과 융합체로 이들 메가바디를 코딩하는 오픈 리딩 프레임의 하기 라이브러리를 구축하기 위해 효모에서 GAP 복구 상동성 재조합을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), cHopQNb_from_immune_library 메가바디 라이브러리, 가요성 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티닌 단백질 Aga2p의 Aga2p 부착 서브유닛, 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005), 이어서 cMyc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하에서 pCTCON2 벡터 (Chao, 2006)에 두어서 2개의 짧은 펩티드가 면역 라이브러리 유래 나노바디를 HopQ에 연결시킨 107 의 상이한 메가바디를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
효모 디스플레이 및 FACS에 의한 시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입하였다. 형질전환된 세포를 성장시켰고 락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색하였고 200 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정 메가바디 (높은 CoA-647 형광도)를 디스플레이하고 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합을 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 후속 선별 라운드 (100 nM, 10 nM 및 1 nM의 낮은 GFP 농도)를 수행하였다.
다수 라운드의 선별 이후에, CoA-647 및 GFP 채널에서 대표 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 높은 수준으로 디스플레이되고 GFP에 결합하는 대표적인 번호의 메가바디의 서열을 결정하였다. FACS 실험에서 100 nM GFP에 결합하는 9종의 상이한 GFP-특이적 메가바디 (SEQ ID NO: 95-103, 도 21 참조)를 동정하였고, 항원-결합 키메라 단백질은 면역 라이브러리로부터 유래된 메가바디 라이브러리로부터 선택될 수 있다는 것을 입증한다.
실시예 20. 시험관내 선택에 의한 GFP-특이적 나노바디의 제2 β-스트랜드 CC'-연결 β-턴에 삽입된 HopQ의 원형 배열 변이체로부터 구축된 58 kD 항원-결합 키메라 단백질의 디자인 및 생성.
실시예 1-17은 항원-결합 키메라 단백질이 β-스트랜드 A 내지 B를 연결하는 나노바디의 제1 β-턴에 삽입된 스캐폴드로부터 구축될 수 있다는 것을 예시한다. 스캐폴드가 다른 턴을 통해서 또한 면역글로불린 도메인에 연결될 수 있다는 것을 입증하기 위해서, 우리는 또한 시험관내 선택을 통해서 GFP-특이적 나노바디의 제2 노출 β-턴 (β-스트랜드 C 및 C'을 연결)에 삽입된 cHopQ 스캐폴드 단백질로부터 항원-결합 키메라 단백질을 구축하였다.
여기서 기술된 58 kDa 메가바디는 도 22에 따라 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 사용된 면역글로불린은 SEQ ID NO:1로 표시된 바와 같은 GFP-결합 나노바디이다. 모든 부분은 펩티드 결합 (SEQ ID NO:104-107)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 β-스트랜드 A 내지 C (SEQ ID NO:1의 1-39), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 C' 내지 G (SEQ ID NO:1의 잔기 46-126), / EPEA 태그.
HopQ의 원형 배열체가 GFP-특이적 나노바디의 제2 β-턴에 삽입된 메가바디의 기능성 변이체를 효모 상에서 디스플레이하고 선택하기 위해서, 우리는 다수의 보조 펩티드 및 단백질 (SEQ ID NO:108-111)과의 융합체로 다양한 메가바디를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 효모에서 세포외 분비를 유도하는 appS4 리더 서열 (Rakestraw, 2009), 항-GFP-나노바디의 β-스트랜드 A 내지 C (SEQ ID NO:1의 1-39), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커 HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 항-GFP-나노바디의 β-스트랜드 C' 내지 G (SEQ ID NO:1의 잔기 46-126), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착되는 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 서브유닛, 이어서, 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하에 pCTCON2 벡터 (Chao, 2006)에 두어서 도 22에 기술된 메가바디의 184.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입하였다. 형질전환된 세포를 성장시켰고 락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 coA-647 (2 μM)로 직교적으로 염색하였고 100 nM의 GFP와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고 2-매개변수 FACS 분석을 수행하여 높은 수준의 특한 메가바디 (높은 CoA-647 형광도) 및 항원 GFP (높은 GFP 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 GFP 결합 나노바디를 디스플레이하는 세포를 분류하였고 포도당-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 선택의 후속 라운드를 수행하였다.
1 라운드의 선별이후에, CoA-647 및 GFP 채널에서 대표적 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 스캐폴드에 나노바디를 연결하는 대표 번호의 펩티드 링커의 서열을 결정하였다. 1-1, 2-1, 1-2 및 2-2 아미노산의 짧은 링커 변이체의 1개 또는 2개의 대표적인 클론 (표 11)은 FACS 실험에서 100 nM GFP에 결합한다는 것이 확인되었다 (도 48). 이것은 스캐폴드 단백질이 단일-도메인 면역글로불린의 제2 노출 β-턴 (β-스트랜드 C 및 C' 연결)에 삽입되고 2개 짧은 폴리펩티드 연결에 의해 연결된, 메가바디는 시험관내 선택을 통해 메가바디 라이브러리로부터 선택할 수 있고 기능성 항원-결합 키메라 단백질로서 디스플레이될 수 있다는 것을 입증한다.
실시예 21. K-Ras-특이적 모노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 cHopQ로부터 구축된 다른 58 kD 항원-결합 키메라 단백질의 시험관내 선택에 의한
디자인 및 생성.
여기서 우리는 합성 항원-결합 도메인을 기반으로 하는 항원-결합 키메라 단백질, 예컨대 모노바디를 기술한다. 메가바디는 H-RAS 및 K-RAS-특이적 모노바디 NS1의 β-스트랜드 A 및 B를 연결하는 제1 β-턴에 삽입된 cHopQ 스캐폴드 단백질로부터 구축하였다 (Spencer-Smith et al, 2017).
여기에 기술되는 58 kDa 메가바디 MbNS1 cHopQ 는 NS1의 일부분, 합성 결합 단백질 (모노바디) 및 도 2에 따라 짧은 폴리펩티드 연결에 의해 연결된 스캐폴드 단백질의 일부분으로부터 쇄상화된 키메라 폴리펩티드이다. 여기서, 합성 결합 단백질은 SEQ ID NO:112로 표시된 바와 같은 H-Ras 및 K-Ras 결합 모노바디 NS1 (Spencer-Smith et al, 2017)이다. 모노바디는 피브로넥틴 III형 도메인을 기반으로 구축된, 합성 단백질이다. 수용체의 세포외 도메인, 키나제, 스테로이드 호르몬 수용체 및 모듈 단백질 도메인을 포함한, 표적의 다양한 어레이에 대해 높은 친화성으로 결합하는 모노바디가 단리되었다 (Koide, 2012). 모든 부분은 도 23에 도시된 바와 같이 펩티드 결합 (SEQ ID NO:113-116)에 의해 다음 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: NS1의 β-스트랜드 A (SEQ ID NO:112의 1-13), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, NS1 모노바디의 β-스트랜드 B 내지 G (SEQ ID NO:112의 잔기 16-94), 6xHis/EPEA 태그.
모노바디를 스캐폴드에 연결하는 링커의 조성 및 길이가 상이한 기능성 메가바디 MbNS1 cHopQ 를 효모 상에서 디스플레이 및 선택하기 위해서, 우리는 다양한 보조 펩티드 및 단백질 (SEQ ID NO:117-120)과의 융합체로 다양한 MbNS1 cHopQ 를 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: NS1의 β-스트랜드 A (SEQ ID NO:112의 1-13), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 193-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 15-186), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, NS1 모노바디의 β-스트랜드 B 내지 G (SEQ ID NO:112의 잔기 16-94), 가요성 (GGSG)n 펩티드 링커, Aga1p 단백질과 디술피드 결합을 통해 효모 세포벽에 부착된 효모 어글루티딘 단백질 Aga2p의 Aga2p 부착 유닛, 이어서, 디스플레이된 융합 단백질의 직교적 형광 염색을 위한 아실 캐리어 단백질 (Johnsson, 2005) 및 myc 태그. 이들 오픈 리딩 프레임은 갈락토스-유도성 GAL1/10 프로모터의 전사 제어 하에 pCTCON2 벡터 (Chao, 2006)에 두어서 모노바디 NS1 및 스캐폴드 HopQ로부터 구축된 메가바디의 184.000의 상이한 변이체를 코딩하는 효모 디스플레이 라이브러리를 구축하였다.
시험관내 선택을 위해서, 이 라이브러리를 효모 균주 EBY100에 도입하였다. 형질전환된 세포를 성장시켰고 락토스-풍부 배지에서 밤새 유도시켰다. 유도된 세포는 SFP 신타제 (1 μM)를 사용하여 CoA-488 (2 μM)로 직교적으로 염색되었고 100 nM의 Dylight-647-표지된 K-RAS와 인큐베이션시켰다. 다음으로, 이들 세포를 세척하였고, 2-매개변수 FACS 분석을 수행하여 높은 수준의 특정한 메가바디 (높은 CoA-488 형광도)를 디스플레이하고 K-RAS (높은 Dylight-647 형광도)에 결합하는 효모 세포를 동정하였다. 높은 수준의 K-RAS 결합 모노바디를 디스플레이하는 세포를 분류하였고 글루코스-풍부 배지에서 증폭시켜서 효모 디스플레이 및 2-매개변수 FACS 분석에 의한 후속 선택 라운드를 수행하였다.
1 라운드의 선택 이후에, CoA-488 및 Dylight-647 채널에서 대표적인 번호의 높은 형광 세포를 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 스케폴드 단백질에 모노바디 NS1을 연결하는 펩티드 링커의 대표적인 번호의 서열을 결정하였다. 1-1 및 2-2 아미노산의 짧은 링커 변이체의 3종의 대표적인 클론 (표 12)은 FACS 실험에서 100 nM K-Ras에 결합하는 것을 확인하였다 (도 49). 제시된 높은 디스플레이 수준 및 항원에 대한 결합은 이들 메가바디가 세포 분비를 수행할 수 있고 기능성 K-RAS-결합 키메라 단백질로서 디스플레이될 수 있다는 것을 의미한다.
실시예 22. 다루기 힘든 막-결합 복합체 예컨대 GPCR, 이온 채널, 및 티로신 수용체 키나제의 구조 분석을 위한 항원-결합 키메라 단백질의 디자인 및 생성.
소위 '다루기 힘든' 표적에 특이적으로 결합하는, 본 명세서에 기술된 바와 같은 항원-결합 키메라 단백질의 적용은 그들의 정밀한 구조 분석을 촉진한다. 이미 실시예 4-6에 예시한 바와 같이, 58 kDa 메가바디를 디자인하고, 생산하였으며, GPCR, G 단백질, 또는 이온 채널의 구조 결정에 사용하였다. 실시예 4에서, β2 아드레날린성 수용체-G 단백질 복합체의 Gβ 및 Gα 서브유닛의 계면에 특이적으로 결합하는, Nb35 기반 Mb35 구성체; 실시예 5에서, 인간 β2 아드레날린성 수용체에 특이적으로 결합하는 Nb80 기반 Mb80 구성체; 실시예 6에서, 5량체 리간드-게이팅 이온 채널 GABAA 에 특이적으로 결합하는, Nb25 기반 Mb25 구성체 (Miller et al, 2017). 또한, GABAA 이온 채널 β1 서브유닛 (Miller et al. 2018)의 세포외 도메인에 특이적으로 결합하는, 나노바디 Nb38 (SEQ ID NO:130)를 기반으로 하는 MbNb38 cHopQ 를 생산하였고, 이러한 막-결합 단백질의 고분해능 구조를 결정할 수 있게 하였다. MbNb38 cHopQ 는 실시예 6에 기술된 대로 생성되었다. 여기서, Nb38 (SEQ ID NO:130)의 면역글로불린 도메인은 스캐폴드 단백질 cHopQ와 연결되었다. 모든 부분은 펩티드 결합 (SEQ ID NO:131)에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다: 항-GFP-나노바디의 보존된 N-말단의 β-스트랜드 A (SEQ ID NO:1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-414), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 HopQ의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:21), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 14-186), Nb38의 β-스트랜드 B 내지 G (SEQ ID NO:130의 잔기 16-123), 6xHis/EPEA 태그.
이. 콜라이에서 MbNb38 cHopQ 구성체의 발현 및 균질한 정제는 니켈 친화성 크로마토그래피, 및 크기 배제 크로마토그래피를 사용해 수행하였고, 최종적으로 샘플을 15 mg/mL로 -80℃에 저장하였다. 정제된 MbNb38 cHopQ (SEQ ID NO: 131)는 경쟁적 길항제 비쿨쿨린, 채널 차단제 피크로톡신, 효현제 GABA 및 고전적인 벤조디아제핀 알프라졸람 (Xanax) 및 디아제팜 (Valium)에 각각 결합된 지질 나노디스크에서 전체 길이 인간 α1β3γ2 GABAA 수용체의 고분해능 cryo-EM 구조를 분해하는데 사용되었다. A형 γ-아미노부티르산 수용체 (GABAARs)를 통한 이온향성 신호전달은 포유동물 신경계에서 빠른 억제성 신경전달을 구동시킨다. 결론적으로, GABAAR은 사실상 뇌 기능의 모든 측면에서 결정적이며 중요한 약물 표적을 대표한다.
대안적으로, 100 kDa 항원-결합 키메라 단백질은 이러한 다루기 힘든 막-결합 복합체의 구조 분석을 용이하게 하기 위해서, 상기 나노바디를 기반으로, cYgjK 스캐폴드를 적용하여 디자인되고 생산되었다. 이것은 YgjK의 원형 배열된 형태 상에 Nb35, Nb80, Nb25 및 Nb38의 그라프트시켜 본 명세서에서 입증하였다. 이들 메가바디 클론은 본질적으로 실시예 8에 기술된 대로 생성되었다: MbNb35 cYgjk E2 (SEQ ID NO:194): 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), Tyr 1개 아미노산 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 YgjK의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), Asp 1개 아미노산 링커, Nb35 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:24의 잔기 17-128), 6xHis/EPEA 태그. Nb80 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:26의 잔기 17-120)를 사용하여, MbNb80 cYgjk E2 (SEQ ID NO:195); Nb25 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:28의 잔기 17-125)를 사용하여, MbNb25 cYgjk E2 (SEQ ID NO:196); Nb38 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:130의 잔기 17-123)를 사용하여, MbNb38 cYgjk E2 (SEQ ID NO:197)를 디자인하고 생산하기 위해 유사한 구성을 따랐다.
또한, 트로포미오신-관련 키나제 수용체 B (TrkB)에 특이적으로 결합하는 Nb22 나노바디 (SEQ ID NO:198) 기반의 MbNb22 cYgjk E2 는 이러한 막-결합 수용체의 고분해능 구조의 결정을 허용하도록 생산되었다. MbNb22 cYgjk E2 도 역시 실시예 8에 기술된 대로 생성되었다: MbNb22 cYgjk E2 (SEQ ID NO:199): 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), Tyr 1개 아미노산 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 YgjK의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), Asp 1개 아미노산 링커, Nb22 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:198의 잔기 17-124), 6xHis/EPEA 태그. 이들 메가바디 (SEQ ID NO: 194-195-196-197-199)의 주변세포질 발현 및 균질한 정제는 본질적으로 실시예 8에 기술된 대로 수행하였다.
예로서, MbNb22 cYgjk E2 (SEQ ID NO:199)는 트로포미오신-관련 키나제 수용체 B (TrkB)에 결합된 인간 뇌-유래 신경영양 인자 (BDNF)를 결정화시키기 위한 결정화 샤페론으로서 사용되었고 X-선 결정학을 통해 TrkB-BDNF-cYgjkE2Nb22 3원 복합체의 고분해능 구조를 분해하였다. BDNF는 뉴런 생존, 시냅스 생성, 시냅스 전달 및 시냅스 가소성을 촉진하여 회로의 기능적 조절 및 발생에 관여하는 신경영양 인자이다. BDNF는 TrkB와의 결합을 통해 작용한다 (Yoshii and Constantine-Paton, 2010).
실시예 23: 항원-결합 키메라 단백질 스캐폴드에 결합하여 더욱 연장시키기 위해, cHopQ-함유 항원-결합 키메라 단백질의 cHopQ 스캐폴드에 특이적으로 결합할 수 있는, 항원-결합 키메라 단백질의 디자인 및 생성.
도 26에 개략적으로 제시된 바와 같이, 다른 항원-결합 키메라 단백질은 도 2의 융합에 따라서, 스캐폴드 단백질 상에 그라프트된, cHopQ-특이적 나노바디 (Nb60)를 포함하는 것을 생성시켰다. 항원-결합 키메라 단백질, 또는 '조립된 항원-결합 키메라 단백질', 또는 '폴리바디' 또는 '확대된 항원-결합 키메라 단백질 스캐폴드'의 최종 조성물은 이러한 특이적 '항-Mb-스캐폴드 메가바디'를 사용하여 본 발명의 항원-결합 키메라 단백질의 크기를 더욱 증가시킬 수 있게 한다. 이러한 '폴리바디'는 예를 들어 응집을 초래하는 자기-상호작용을 피하도록, Nb60 cHopQ 결합 부위에 결합하지 않는 돌연변이된 cHopoQ 단백질을 스캐폴드 단백질로서 포함할 수 있다. 폴리바디에 사용되는 스캐폴드는 또한 상기 자기-결합을 피하기 위해서, 본 명세서에 기술된 cYgjK 스캐폴드 단백질과 같은 상이한 스캐폴드로 구성될 수 있다. 첫째로, cHopQ에 결합하는 Nb60 (SEQ ID NO:132)은 생성되어 MbNb207 cHopQ (SEQ ID NO:20)의 존재 하에서 결정화에 사용되었다. 분해된 결정 구조를 기반으로 MbNb207 cHopQ 의 cHopQ의 3개 잔기 (T289, N296 및 E197)가 Nb60-cHopQ 상호작용을 위한 주요 기여인자로서 확인되었다 (도 27). 게다가, cHopQ-기반 메가바디 디자인의 보다 짧은 형태로서, MbNb207 cHopQ 결정 구조의 전자 밀도에서 전혀 완전히 볼 수 없는 루프로서 항상 나타나는 원형 배열 영역 (c7HopQ라고 함)을 절단한 것이 제안될 수 있었다.
MbNb60 c7HopQ 는 펩티드 결합에 의해 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결된, 다음의 부분들로 구성된다: 항-GFP 나노바디의 β-스트랜드 A (SEQ ID NO: 1의 1-13), HopQ의 C-말단 부분 (SEQ ID NO:19의 잔기 192-411), HopQ의 N-말단 부분 (SEQ ID NO:19의 잔기 18-186), c7HopQ-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:132의 잔기 16-133), 6xHis/EPEA 태그. 그러나, c/c7HopQ-함유 메가바디에 결합하지만 그 자체에 결합 (자가 중합)하지 않는 MbNb60 c7HopQ 메가바디를 생성시키기 위해서, MbNb60 c7HopQ 의 2종의 상이한 돌연변이체가 사용되었다:
· N277K, T270R (MbNb60 c7HopQ mut2, SEQ ID NO:133)
· N277K, T270R, E197R (MbNb60 c7HopQmut3, SEQ ID NO:134)
MbNb60 c7HopQ 의 이들 돌연변이체는 실시예 2에 기술된 바와 같이 이. 콜라이의 주변세포질에서 발현되었고, 균질하게 정제되었다. 다음으로, Octet 측정 (도 29)은 도 24에 도시된 바와 유사한 측정을 사용하여, 이들 2종의 MbNb60 c7HopQ 돌연변이체 메가바디가 야생형 cHopQ 스캐폴드 단백질을 함유하는 메가바디에 결합할 수 있다는 증거를 제공하였다. 바이오틴화된 MbNb207 cHopQ (SEQ ID NO:20)는 스트렙타비딘 바이오센서 상에 고정되었다. 상이한 농도의 Nb60 (SEQ ID NO:132), MbNb60 c7HopQ mut 2 (SEQ ID NO:133) 및 MbNb60 c7HopQ mut 3 (SEQ ID NO:134)을 고정된 MbNb207 cHopQ 와의 결합에 대해 조사하였다. Nb60 및 2종 MbNb60 c7HopQ 돌연변이체의 경우 MbNb207 cHopQ 와의 결합이 확인되었다.
cHopQ-돌연변이체-기반 접근법과 유사하게, 다른 스캐폴드 단백질은 항원-결합 키메라 단백질의 조성물 또는 폴리바디를 생성시키는데 사용될 수 있다. 따라서, 대안적인 스캐폴드 단백질 YgjK, 이. 콜라이의 86 kDa 주변세포질 단백질 (PDB 3W7S, SEQ ID NO: 38)이 사용되었다 (도 26, B). MbNb60 cYgjk E2 는 실시예 8에 기술된 대로 생성되었다: MbNb60 cYgjk E2 (SEQ ID NO:135): 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 1-12), Tyr 1개 아미노산 링커, YgjK의 C-말단 부분 (SEQ ID NO:38의 잔기 464-760), 스캐폴드 단백질의 원형 배열체를 생성시키기 위해 YgjK의 C-말단 및 N-말단을 연결하는 짧은 펩티드 링커 (SEQ ID NO:43), YgjK의 N-말단 부분 (SEQ ID NO:38의 잔기 1-461), Asp 1개 아미노산 링커, Nb60 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:132의 잔기 17-133), 6xHis/EPEA 태그.
이러한 메가바디는 실시예 8에 기술된 대로 발현시키고 정제하였다. 다음으로, MbNb207 cHopQ 에 대한 MbNb60 cYgjk E2 의 결합은 상기 기술된 대로 Octet 측정으로 검증하였다 (도 29).
실시예 24: GFP-특이적 나노바디의 제1 β-스트랜드 AB-연결 β-턴에 삽입된 도데신으로부터 구축된 다량체 항원-결합 키메라 단백질의 시험관내 선택에 의한 디자인 및 생성.
여기서 우리는 면역글로불린 도메인이 또한 어떻게 도데신 Rv1498A 상에 강건하게 그라프트될 수 있는가를 입증한다. 고세균 미코박테리움 튜버큘로시스 (Mycobacterium tuberculosis) 유래의 이러한 소형 플라보단백질은 12개 단량체의 조립체이다. 단량체의 12 카피가 이. 콜라이에서 과발현시 자가-조립되어 고도로 열안정된 도데신을 형성할 수 있다는 것이 확인되었다 (Liu et al., 2011). 도데신에서, 각 단량체의 N-말다는 동일 단량체의 C-말단에 매우 가깝다. 따라서, 우리는 도 2에 따라 2개 짧은 펩티드가 나노바디를 스캐폴드에 연결한 도데신 단량체 상에 그라프트된 나노바디로부터 구축된 강성 항원-결합 키메라 단백질을 코딩하는 무작위 라이브러리를 구축하였다.
여기에 기술된 258 kDa MbNb207 도데신 분자는 도 50에 따라 직접 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가 조립된다. 사용된 면역글로불린은 SEQ ID NO:1로 표시된 GFP-결합 나노바디이다. 사용된 스캐폴드 단백질은 엠. 튜버큘로시스의 도데신 Rv1498A의 단량체 (GenBank 등록 번호: 3205040, SEQ ID NO:192)였다. 모든 부분은 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다 (SEQ ID NO:193): 출발 코돈에 의해 코딩되는 메티오닌, 항-GFP-나노바디의 β-스트랜드 A (SEQ ID NO:1의 잔기 1-11), 무작위 조성의 1개 아미노산의 펩티드 링커, 도데신 Rv1498A 단백질 (SEQ ID NO:192의 잔기 5-66), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 17-126), 6xHis/EPEA 태그. 이러한 항원-결합 키메라 단백질은 12 카피의 메가바디를 함유하는 도데신 다량체로 자가 조립된다 (도 50).
2개 짧은 펩티드가 나노바디를 도데신 (SEQ ID NO:193)에 연결한 이들 항원-결합 키메라 단백질의 기능적 대표물을 선택하기 위해서, 우리는 상기 기술된, 항원-결합 키메라 단백질 (SEQ ID NO:193)을 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다. 이들 DNA 단편은 HindIII-SpI 단편으로서 pMESP 벡터에 클로닝된다. 이렇게 새롭게 생성된 플라스미드는 pMESP도데신XNbGFP207이라고 하였다. 재조합적으로 발현되고 시험관내에서 올바르게 조립된 항원-결합 키메라 MbNb207 도데신 단백질을 선택하기 위해서, 항원-결합 키메라 단백질의 라이브러리는 플라스미드 수준에서 구축하였다. 이들 라이브러리를 이. 콜라이 세포를 형질전환시키는데 사용하였다. 도데신으로 올바르게 조립된 키메라 단백질을 동정하기 위해서, 개별 클론을 이. 콜라이에서 발현시켰고, 실시예 7에 기술된 대로 ELISA를 수행하여 GFP에 결합하는 클론을 스크리닝하였다 (도 51). 항원-결합 키메라 단백질을 발현하고 GFP에 결합하는 몇몇 클론을 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 나노바디를 스캐폴드 단백질에 연결하는 펩티드 링커의 서열을 결정하였다. 이것은 2개 짧은 폴리펩티드 연결에 의해 연결된 단일-도메인 면역글로불린의 일부분 및 도데신으로부터의 쇄상화된 항원-결합 키메라 단백질이 기능성 항원-결합 키메라 단백질로서 라이브러리로부터 선택될 수 있다는 것을 입증한다. 1-1 아미노산의 짧은 링커 변이체의 대표적인 클론은 표 13에 제공된다. 이것은 도데신 Rv1498A의 단량체 상에 그라프트된 나노바디로부터 구축된 이들 항원-결합 키메라 단백질이 이. 콜라이에서 기능적으로 발현될 수 있다는 것을 의미한다.
실시예 25: 시험관내 선택에 의한 GFP-특이적 나노바디의 제1 노출 β-턴에 삽입된 디술피드-브릿지된 동종이량체로부터 구축된 메가바디의 디자인 및 생성.
여기서 면역글로불린 도메인이 또한 어떻게 4QYB라고 하는 동종이량체 상에 강성으로 그라프트될 수 있는지를 설명한다. 버크홀데리아 세노파시아 (Burkholderia cenocepacia) J2315 유래의 미지 기능의 이러한 소형 단백질은 이 단백질의 보소된 결정 구조를 통해 확인된 바와 같이, 2개 단량체가 단일 분자내 디술피드 브릿지를 통해 연결된 동종이량체이다 (Halavaty et. al. Unpublished data, PDB code 4QYB). 추가로, 한 단량체의 N-말단은 동일 단량체의 C-말단에 매우 가깝다. 따라서, 우리는 도 2에 따라 2개 짧은 펩티드가 나노바디를 스캐폴드에 연결한 4QYB 단량체 상에 그라프트된 나노바디로부터 구축된 강성 항체 키메라를 코딩하는 무작위 라이브러리를 구축하였다.
여기 기술된 51 kDa 동종이량체 MbNb207 4QYB 는 도 52에 따라 직접적으로 연결된 스캐폴드 단백질의 일부분 및 단일-도메인 면역글로불린의 일부분으로부터 구축된 키메라 폴리펩티드로부터 자가 조립된다. 사용된 면역글로불린은 SEQ ID NO:1로 표시된 GFP-결합 나노바디이다. 사용된 스캐폴드 단백질은 비. 세노세파시아 J2315 유래 4QYB의 단량체 (PDB 4QYB, SEQ ID NO:200)였다. 모든 부분은 다음의 소정 순서로 아미노에서 카복시 말단으로 서로 연결되었다 (SEQ ID NO:201-204): 항-GFP-나노바디의 β-스트랜드 A (잔기 SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 4QYB 단백질 (SEQ ID NO:200의 잔기 8-121), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그. 이러한 강성 항원-결합 키메라 단백질은 2 카피의 나노바디를 함유하는 디술피드-브릿지된 동종이량체로 자가 조립된다 (도 52).
2개 짧은 펩티드 (SEQ ID NO:201-204)가 나노바디를 스캐폴드에 연결시킨 이들 항원-결합 키메라 단백질의 기능적 대표물을 선택하고, 그들을 이. 콜라이의 주변세포질에서 발현시키기 위해, 우리는 상기 기술된 항원-결합 키메라 단백질 (SEQ ID NO:205-208)을 코딩하는 오픈 리딩 프레임의 라이브러리를 구축하기 위해 표준 방법을 사용하였다: 이. 콜라이의 주변세포질로 융합 단백질의 분비를 유도하는 PelB 리더 서열, 항-GFP-나노바디의 β-스트랜드 A (잔기 SEQ ID NO:1의 1-12), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, 4QYB 단백질 (SEQ ID NO:200의 잔기 8-121), 무작위 조성의 1개 또는 2개 아미노산의 펩티드 링커, GFP-결합 나노바디의 β-스트랜드 B 내지 G (SEQ ID NO:1의 잔기 16-126), 6xHis/EPEA 태그. 이들 DNA 단편은 HindIII-SpI 단편으로서 pMESP 벡터에 클로닝된다. 이렇게 새롭게 생성된 플라스미드는 pMESP4QYBXXNbGFP207이라고 하였다.
재조합적으로 발현되어 시험관내에서 올바르게 조립된 MbNb207 4QYB 단백질을 선택하기 위해서, 항원-결합 키메라 단백질의 라이브러리는 플라스미드 수준에서 구축되었다. 이들 라이브러리는 올바르게 조립된 동종이량체의 동정을 위해서, 이. 콜라이 세포를 형질전환시키는데 사용된다. 개별 클론은 이. 콜라이에서 발현시켰고, 실시예 7에 기술된 대로 ELISA를 수행하여 GFP에 결합하는 클론을 스크리닝하였다. 항원-결합 키메라 단백질을 발현하고 GFP에 결합하는 몇몇 클론은 단일 콜로니로서 성장시켰고 DNA 시퀀싱을 수행하여 나노바디를 스캐폴드에 연결하는 펩티드 링커의 서열을 결정하였다.
서열 목록
>SEQ ID NO:1: NbGFP207 GFP-특이적 나노바디 = Nb207
>SEQ ID NO:2: 피. 애루지노사의 박테리오 파지 PP7 외피 단백질 단량체
>SEQ ID NO:3-6: MbNb207 cPP7x2L 이량체
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, PP7 서열: 밑줄, (X)1-2: 가변 길이 (1개 또는 2개 아미노산)의 짧은 펩티드 링커, 태그: 소문자)
>SEQ ID NO:7: cAbLys3 흰계란 리소자임 특이적 나노바디 (PDB 1MEL)
>SEQ ID NO:8: 에스케리치아 콜라이의 박테리오파지 외피 단백질 단량체 (PDB 2MS2)
>SEQ ID NO:9: MbcAbLys3 cMS2x2L 이량체
(Nb GFP 207 스트랜드 A 및 cAb Lys 3, 서열: 굵은체, 원형 배열 링커: 이탤릭체, MS2 서열: 밑줄, 태그: 소문자)
>SEQ ID NO:10-13: MbcAbLys3 cMS2x2L 이량체
>SEQ ID NO:14: N2bNb207 cAbLys3L 나노2바디
>SEQ ID NO:15: PelB_ N2bNb207 cAbLys3L_태그, 앰버 중지 코돈(*)_단백질3 나노2바디
>SEQ ID NO:16: DsbA_ N2bNb207 cAbLys3L_태그, 앰버 중지 코돈(*)_단백질3 나노2바디
>SEQ ID NO:17: NbFEDF9 F18 핌브리아 어드헤신 FedF의 렉틴 도메인 특이적 나노바디 (PDB 4W6Y)
>SEQ ID NO:18: N2bNb207 NbFEDF9L 나노2바디
>SEQ ID NO:19: 헬리코박터 피로리 균주 G27 HopQ 어드헤신 도메인 단백질 (PDB 5LP2)
>SEQ ID NO:20: MbNb207 cHopQ
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄)
>SEQ ID NO:21: cHopQ 원형 배열 링커 펩티드
>SEQ ID NO:22: MbNb207 cHopQ_Aga2p_ACP 단백질 서열
>SEQ ID NO:23: DsbA-MbNb207 cHopQ
>SEQ ID NO:24: Nb35 β2 아드레날린성 수용체-Gs 단백질 복합체의 Gβ/Gα 서브유닛-특이적 나노바디
>SEQ ID NO:25: MbNb35 cHopQ
>SEQ ID NO:26: Nb80 β2 아드레날린성 수용체-특이적 나노바디
>SEQ ID NO:27: MbNb80 cHopQ
>SEQ ID NO:28: Nb25 GABAA-특이적 나노바디
>SEQ ID NO:29: MbNb25 cHopQ
>SEQ ID NO:30-33: MbNb207 cHopQ무작위 링커
(Nb GFP 207 서열: 굵은체, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄)
>SEQ ID NO:34-37: MbNb207 cHopQ무작위 링커_Aga2p_ACP 단백질 서열
(appS4 리더 서열, 메가바디 cHopQNb GFP 207무작위 링커: 굵은체, (X)1-2: 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 가요성 (GGGS) n 폴리펩티드 링커: 이탤릭체, Aga2p 단백질 서열: 밑줄, , cMyc 태그)
>SEQ ID NO:38: 이. 콜라이 Ygjk 단백질 (PDB 3WFS)
>SEQ ID NO:39-42: MbNb207 cYgjkQ무작위 링커
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, Ygjk 서열: 밑줄, (X)1-2: 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 6xHis & EPEA 태그)
>SEQ ID NO:43: cYgjk 원형 배열 링커 펩티드
>SEQ ID NO:44-47: MbNb207 cYgjk무작위 링커_Aga2p_ACP 단백질 서열
(appS4 리더 서열, 메가바디 cYgjkQNb GFP 207무작위 링커 라이브러리: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄, , cMyc 태그)
>SEQ ID NO:48: MbNb207 cHopQC357-C425
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄,
>SEQ ID NO:49: MbNb207 cHopQC358-C488
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄,
>SEQ ID NO:50: MbNb207 cHopQC359-C490
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄,
>SEQ ID NO:51: MbNb207 cHopQC15-C534
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄)
>SEQ ID NO:52: 피. 애루지노사 아주린 (PDB 2TSA) M121A 돌연변이체 단백질
>SEQ ID NO:53-60: MbNb207 아주린Q 무작위 링커
(Nb GFP 207 서열: 굵은체, 아주린 서열: 밑줄, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커)
>SEQ ID NO:61-68: MbNb207 아주린Q 연결 라이브러리_Aga2p_ACP 단백질 서열
(appS4 리더 서열, 메가바디 아주린Nb GFP 207_무작위 링커 라이브러리: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄, , cMyc 태그)
>SEQ ID NO:69: 박테로이데스 테타이오타오미크론 SusB 단백질 (PDB3wfa)
>SEQ ID NO:70-77: MbNb207 SusB 무작위 링커 메가바디 라이브러리 단백질 서열
(Nb GFP 207 서열: 굵은체, (X)1-2: 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, susB 서열: 밑줄)
>SEQ ID NO:78-85: 동종-이량체 메가바디 MbNb207 SusB 무작위 링커_Aga2p_ACP 단백질 서열
(appS4 리더 서열, susBNb GFP 207무작위 링커 메가바디 라이브러리: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄, , cMyc 태그)
>SEQ ID NO:86: 이. 콜라이 아실 캐리어 단백질 (PDB1T8K)
>SEQ ID NO:87-90: 나노툴 MbNb207 ACP 무작위 링커
(Nb GFP 207 서열: 굵은체, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, ACP 서열: 밑줄)
>SEQ ID NO:91-94: 나노툴 MbNb207 ACP무작위 링커_Aga2p 단백질 서열
(appS4 리더 서열,나노툴 ACPNb GFP 207무작위 링커, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄, )
>SEQ ID NO:95: MbNb207 cHopQMP1251_A7
>SEQ ID NO:96: MbNb207 cHopQMP1252_D10
>SEQ ID NO:97: MbNb207 cHopQMP1251_D10
>SEQ ID NO:98: MbNb207 cHopQMP1251_A10
>SEQ ID NO:99: MbNb207 cHopQMP1251_D4
>SEQ ID NO:100: MbNb207 cHopQMP1252_C10
>SEQ ID NO:101: MbNb207 cHopQMP1251_H6
>SEQ ID NO:102: MbNb207 cHopQMP1251_A5
>SEQ ID NO:103: MbNb207 cHopQMP1263_C9
>SEQ ID NO:104-107: MbNb207 cHopQ_β턴CC'_무작위 링커 단백질 서열
(, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, 원형 배열 링커: 이탤릭체, HopQ 서열: 밑줄, Nb207 β-스트랜드 C' 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
>SEQ ID NO:108-111: MbNb207 cHopQ_β턴CC'_무작위 링커_Aga2p_ACP 단백질 서열
(appS4 리더 서열, 메가바디 cHopQNb GFP 207_β턴CC'_무작위 링커 라이브러리 도시: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄, , cMyc 태그)
>SEQ ID NO:112: 데이노코커스 라디오두란스 모노바디 NS1 (PDB5E59 유래)
>SEQ ID NO:113-116: MbNS1 cHopQ_무작위 링커
(, (X)1-2 : 가변 길이 (1개 또는 2개 아미노산) 및 혼합 조성의 짧은 펩티드 링커, HopQ 서열: 밑줄, 원형 배열 링커: 이탤릭체, NS1 β-스트랜드 B 내지 G: 굵은체, 6xHis 태그, EPEA 태그)
>SEQ ID NO:117-120: MbNS1 cHopQ_무작위 링커_Aga2p_ACP 단백질 서열
(appS4 리더 서열, cHopQNS1_무작위 링커 메가바디 라이브러리 도시: 굵은체, 가요성 (GGGS)n 폴리펩티드 링커, Aga2p 단백질 서열: 밑줄, , cMyc 태그)
>SEQ ID NO:121: NbGFP207 (DNA) = Nb207
>SEQ ID NO:122: TU89 전방향 프라이머 (SapI 분해 부위) (DNA)
>SEQ ID NO:123: EP230 역방향 프라이머 (SapI 분해 부위) (DNA)
>SEQ ID NO:124: TU64 프라이머 (DNA)
>SEQ ID NO:125: TU65 프라이머 (DNA)
>SEQ ID NO:126: TU131 프라이머 (DNA)
>SEQ ID NO:127: TU132 프라이머 (DNA)
>SEQ ID NO:128: TU133 프라이머 (DNA)
>SEQ ID NO:129: TU134 프라이머 (DNA)
>SEQ ID NO: 130: Nb38 GABAA-특이적 나노바디
>SEQ ID NO: 131: MbNb38 cHopQ
>SEQ ID NO: 132: Nb60 HopQ-특이적 나노바디
>SEQ ID NO: 133: MbNb60 c7HopQ N277K T270R
>SEQ ID NO:134: MbNb60 c7HopQ N277K T270R E197R
>SEQ ID NO:135: MbNb60 cYgjkQE2
(Nb GFP 207 서열: 굵은체, 원형 배열 링커: 이탤릭체, Ygjk 서열: 밑줄, 1개 아미노산 링커, 6xHis & EPEA 태그)
>SEQ ID NO:136: MbNb207 c7HopQ
>SEQ ID NO: 137-140: MbNb207 c7HopQ A5 , A12, B7, 및 G10, resp.
>SEQ ID NO:141: MbNb207 cYgjkE2
(Nb GFP 207 서열: 굵은체, 짧은 펩티드 링커, YgjK 서열: 밑줄, 원형 배열 링커: 이탤릭체, YgjK 서열: 밑줄, 짧은 펩티드 링커, 6xHis & EPEA 태그)
>SEQ ID NO:142-144: MbNb207 cYgjkA2, C4 및 F5, resp.
>SEQ ID NO: 145: MbNb207 c7HopQ C14-C512
>SEQ ID NO: 146: MbNb207 c7HopQ C402-C474
>SEQ ID NO: 147: MbNb207 c7HopQ C316-C472
>SEQ ID NO: 148: MbNb207 c7HopQ C314-C472
>SEQ ID NO: 149: MbNb207 c7HopQ C312-C453
>SEQ ID NO: 150: MbNb207 c7HopQ C349-C452
>SEQ ID NO: 151-158: MbNb207 아주린 A8, D9, D10, D11, G6, B8, B2, 및 C8, resp.
>SEQ ID NO: 159: MbNb207 cPP7x2A3 (MP1403_A3)
(Nb GFP 207 서열: 굵은체, 링커: 이탤릭체, PP7 서열: 밑줄, 태그: 소문자)
>SEQ ID NO: 160-165: MbNb207 cPP7x2 D3, G5, E6, D7, A9, B9, resp. (MP1403)
>SEQ ID NO:166: AP205 아시네토박터 파지 외피 단백질 NP_085472.1
>SEQ ID NO: 167: MbNb207 AP205x2 XX
(Nb GFP 207 서열: 굵은체, 무작위 링커: 이탤릭체, X: 짧은 펩티드 링커 (1개 아미노산), AP205 서열: 밑줄, 태그: 소문자)
>SEQ ID NO: 168-172: MbNb207 AP205x2C5, B7, B8, D3, A4, resp.
>SEQ ID NO: 173: MbNb207 AP205 XX
(Nb GFP 207 서열: 굵은체, 무작위 링커: 이탤릭체, X: 짧은 펩티드 링커 (1개 아미노산), AP205 서열: 밑줄, 태그: 소문자)
>SEQ ID NO: 174-183: MbNb207 AP205 C12, A4, E8, D10, A3, A10, D10, D2, C10, F1, resp.
>SEQ ID NO: 184: N2bNb207 NbFedF9E
>SEQ ID NO: 185: N2bNb207 NbFedF9Q
>SEQ ID NO: 186: N2bNb207 NbFedF9 CA14543 (MP1411_B3)
>SEQ ID NO: 187: N2bNb207 NbFedF9 CA14544 (MP1411_C6)
>SEQ ID NO: 188: N2bNb207 NbFedF9 CA14546 (MP1438_A5)
>SEQ ID NO: 189: N2bNb207 NbFedF9 CA14548 (MP1438_B11)
>SEQ ID NO: 190: N2bNb207 NbFedF9 CA14550 (MP1438_D2)
>SEQ ID NO: 191: N2bNb207 NbFedF9 CA14552 (MP1440_C5)
>SEQ ID NO:192: 미코박테리움 튜버큘로시스 도데신 Rv1498A 단백질 (GenBank 등록 번호: 3205040)
>SEQ ID NO: 193: MbNb207 도데신 무작위 링커 메가바디
>SEQ ID NO:194: MbNb35 cYgjk E2
>SEQ ID NO:195: MbNb80 cYgjk E2
>SEQ ID NO:196: MbNb25 cYgjk E2
>SEQ ID NO:197: MbNb38 cYgjk E2
>SEQ ID NO: 198: Nb22 트로포미오신-관련 키나제 수용체 B (TrkB)-특이적 나노바디
>SEQ ID NO: 199: MbNb22 cYgjk E2
>SEQ ID NO:200: 버크홀데리아 세노세파시아 4QYB 단백질 (PDB 4QYB)
>SEQ ID NO:201-204: MbNb207 4QYB 무작위 링커
(Nb GFP 207 서열: 굵은체, (X)1-2: 혼합 조성의 짧은 펩티드 링커 (1개 또는 2개 아미노산), 4QYB 단백질 서열: 밑줄, 6xHis 태그, EPEA 태그)
>SEQ ID NO:205-208: PelB_MbNb207 4QYB 무작위 링커
( , Nb GFP 207 서열: 굵은체, (X)1-2: 혼합 조성의 짧은 펩티드 링커 (1개 또는 2개 아미노산), 4QYB 단백질 서열: 밑줄, 6xHis 태그, EPEA 태그)
>SEQ ID NO:209: 친화성 태그 (US 9518084 B2)
EPEA
>SEQ ID NO:210-213: 도 8C의 서열.
참조문헌
<110> VIB VZW
VRIJE UNIVERSITEIT BRUSSEL
<120> Novel antigen-binding chimeric proteins and methods and uses
thereof
<130> JaSt/MEGABO/613
<150> EP 17199472.6
<151> 2017-10-31
<150> EP 18199709.9
<151> 2018-10-10
<160> 220
<170> PatentIn version 3.5
<210> 1
<211> 126
<212> PRT
<213> Artificial Sequence
<220>
<223> NbGFP207 GFP-specific Nanobody
<400> 1
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala
20 25 30
Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val
35 40 45
Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr
65 70 75 80
Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu
100 105 110
Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
115 120 125
<210> 2
<211> 128
<212> PRT
<213> Artificial Sequence
<220>
<223> bacteriophage of P. Aeruginosa PP7 coat protein monomer
<400> 2
Met Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala Thr Arg Thr Leu
1 5 10 15
Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu Glu Lys Val
20 25 30
Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu Arg Gln Asn
35 40 45
Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp Gln Ala Asp
50 55 60
Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro Lys Val Arg
65 70 75 80
Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala Asn Ser Thr
85 90 95
Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser Leu Val Ala
100 105 110
Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro Leu Gly Arg
115 120 125
<210> 3
<211> 390
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2L dimer
<220>
<221> MISC_FEATURE
<222> (132)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (261)
<223> Xaa can be any naturally occurring amino acid
<400> 3
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Xaa Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala
130 135 140
Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe
145 150 155 160
Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser
165 170 175
Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu
180 185 190
Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu
195 200 205
Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val
210 215 220
Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys
225 230 235 240
Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val
245 250 255
Pro Leu Gly Arg Xaa Gly Ser Lys Thr Ile Val Leu Ser Gly Ser Leu
260 265 270
Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met
275 280 285
Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly
290 295 300
Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly
305 310 315 320
Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln
325 330 335
Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala
340 345 350
Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp
355 360 365
Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His His
370 375 380
His His Glu Pro Glu Ala
385 390
<210> 4
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2L dimer
<220>
<221> MISC_FEATURE
<222> (132)..(133)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (262)
<223> Xaa can be any naturally occurring amino acid
<400> 4
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Xaa Xaa Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu
130 135 140
Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile
145 150 155 160
Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala
165 170 175
Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys
180 185 190
Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu
195 200 205
Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile
210 215 220
Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr
225 230 235 240
Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu
245 250 255
Val Pro Leu Gly Arg Xaa Gly Ser Lys Thr Ile Val Leu Ser Gly Ser
260 265 270
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
275 280 285
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
290 295 300
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
305 310 315 320
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
325 330 335
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
340 345 350
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
355 360 365
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His
370 375 380
His His His Glu Pro Glu Ala
385 390
<210> 5
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2L dimer
<220>
<221> MISC_FEATURE
<222> (132)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (261)..(262)
<223> Xaa can be any naturally occurring amino acid
<400> 5
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Xaa Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala
130 135 140
Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe
145 150 155 160
Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser
165 170 175
Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu
180 185 190
Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu
195 200 205
Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val
210 215 220
Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys
225 230 235 240
Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val
245 250 255
Pro Leu Gly Arg Xaa Xaa Gly Ser Lys Thr Ile Val Leu Ser Gly Ser
260 265 270
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
275 280 285
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
290 295 300
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
305 310 315 320
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
325 330 335
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
340 345 350
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
355 360 365
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His
370 375 380
His His His Glu Pro Glu Ala
385 390
<210> 6
<211> 392
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2L dimer
<220>
<221> MISC_FEATURE
<222> (132)..(133)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (262)..(263)
<223> Xaa can be any naturally occurring amino acid
<400> 6
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Xaa Xaa Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu
130 135 140
Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile
145 150 155 160
Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala
165 170 175
Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys
180 185 190
Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu
195 200 205
Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile
210 215 220
Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr
225 230 235 240
Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu
245 250 255
Val Pro Leu Gly Arg Xaa Xaa Gly Ser Lys Thr Ile Val Leu Ser Gly
260 265 270
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala
275 280 285
Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val
290 295 300
Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala
305 310 315 320
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr
325 330 335
Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys
340 345 350
Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu
355 360 365
Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His
370 375 380
His His His His Glu Pro Glu Ala
385 390
<210> 7
<211> 133
<212> PRT
<213> Artificial Sequence
<220>
<223> cAbLys3 hen egg-white lysozyme specific Nanobody (PDB 1MEL)
<400> 7
Asp Val Gln Leu Gln Ala Ser Gly Gly Gly Ser Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr
20 25 30
Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val
35 40 45
Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr
65 70 75 80
Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys
85 90 95
Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly
100 105 110
Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln
115 120 125
Val Thr Val Ser Ser
130
<210> 8
<211> 130
<212> PRT
<213> Artificial Sequence
<220>
<223> bacteriophage of Escherichia coli coat protein monomer (PDB 2MS2)
<400> 8
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr
130
<210> 9
<211> 400
<212> PRT
<213> Artificial Sequence
<220>
<223> MbcAbLys3cMS2x2 L dimer
<220>
<221> MISC_FEATURE
<222> (14)..(15)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (272)..(273)
<223> Xaa can be any naturally occurring amino acid
<400> 9
Met Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Xaa Xaa Gly
1 5 10 15
Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp
20 25 30
Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val
35 40 45
Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val
50 55 60
Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala
65 70 75 80
Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala
85 90 95
Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu
100 105 110
Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile
115 120 125
Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
130 135 140
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
145 150 155 160
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
165 170 175
Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu
180 185 190
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
195 200 205
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
210 215 220
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
225 230 235 240
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
245 250 255
Ile Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Xaa
260 265 270
Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro
275 280 285
Tyr Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly
290 295 300
Val Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser
305 310 315 320
Val Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val
325 330 335
Tyr Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr
340 345 350
Cys Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His
355 360 365
Gly Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr
370 375 380
Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
385 390 395 400
<210> 10
<211> 398
<212> PRT
<213> Artificial Sequence
<220>
<223> MbcAbLys3cMS2x2 L dimer
<220>
<221> MISC_FEATURE
<222> (14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (271)
<223> Xaa can be any naturally occurring amino acid
<400> 10
Met Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Xaa Gly Asp
1 5 10 15
Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp Ile
20 25 30
Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val Arg
35 40 45
Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val Pro
50 55 60
Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala Ala
65 70 75 80
Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala Thr
85 90 95
Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu Lys
100 105 110
Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile Tyr
115 120 125
Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr Gly
130 135 140
Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp
145 150 155 160
Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val
165 170 175
Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val
180 185 190
Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala
195 200 205
Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala
210 215 220
Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu
225 230 235 240
Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile
245 250 255
Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Xaa Ser
260 265 270
Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr Cys
275 280 285
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val Ala
290 295 300
Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val Lys
305 310 315 320
Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr Leu
325 330 335
Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys Ala
340 345 350
Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly Leu
355 360 365
Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln Val
370 375 380
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
385 390 395
<210> 11
<211> 399
<212> PRT
<213> Artificial Sequence
<220>
<223> MbcAbLys3cMS2x2 L dimer
<220>
<221> MISC_FEATURE
<222> (14)..(15)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (272)
<223> Xaa can be any naturally occurring amino acid
<400> 11
Met Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Xaa Xaa Gly
1 5 10 15
Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp
20 25 30
Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val
35 40 45
Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val
50 55 60
Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala
65 70 75 80
Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala
85 90 95
Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu
100 105 110
Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile
115 120 125
Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
130 135 140
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
145 150 155 160
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
165 170 175
Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu
180 185 190
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
195 200 205
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
210 215 220
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
225 230 235 240
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
245 250 255
Ile Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Xaa
260 265 270
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr
275 280 285
Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val
290 295 300
Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val
305 310 315 320
Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr
325 330 335
Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys
340 345 350
Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly
355 360 365
Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln
370 375 380
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
385 390 395
<210> 12
<211> 399
<212> PRT
<213> Artificial Sequence
<220>
<223> MbcAbLys3cMS2x2 L dimer
<220>
<221> MISC_FEATURE
<222> (14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (271)..(272)
<223> Xaa can be any naturally occurring amino acid
<400> 12
Met Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Xaa Gly Asp
1 5 10 15
Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp Ile
20 25 30
Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val Arg
35 40 45
Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val Pro
50 55 60
Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala Ala
65 70 75 80
Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala Thr
85 90 95
Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu Lys
100 105 110
Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile Tyr
115 120 125
Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr Gly
130 135 140
Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp
145 150 155 160
Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val
165 170 175
Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val
180 185 190
Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala
195 200 205
Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala
210 215 220
Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu
225 230 235 240
Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile
245 250 255
Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Xaa Xaa
260 265 270
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr
275 280 285
Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val
290 295 300
Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val
305 310 315 320
Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr
325 330 335
Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys
340 345 350
Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly
355 360 365
Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln
370 375 380
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
385 390 395
<210> 13
<211> 400
<212> PRT
<213> Artificial Sequence
<220>
<223> MbcAbLys3cMS2x2 L dimer
<220>
<221> MISC_FEATURE
<222> (14)..(15)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (272)..(273)
<223> Xaa can be any naturally occurring amino acid
<400> 13
Met Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Xaa Xaa Gly
1 5 10 15
Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp
20 25 30
Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val
35 40 45
Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val
50 55 60
Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala
65 70 75 80
Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala
85 90 95
Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu
100 105 110
Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile
115 120 125
Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
130 135 140
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
145 150 155 160
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
165 170 175
Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu
180 185 190
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
195 200 205
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
210 215 220
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
225 230 235 240
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
245 250 255
Ile Tyr Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Xaa
260 265 270
Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro
275 280 285
Tyr Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly
290 295 300
Val Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser
305 310 315 320
Val Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val
325 330 335
Tyr Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr
340 345 350
Cys Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His
355 360 365
Gly Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr
370 375 380
Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
385 390 395 400
<210> 14
<211> 279
<212> PRT
<213> Artificial Sequence
<220>
<223> N2bNb207cAbLys3 Nano2body
<220>
<221> MISC_FEATURE
<222> (16)..(18)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (137)..(138)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (257)..(259)
<223> Xaa can be any naturally occurring amino acid
<400> 14
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Xaa
1 5 10 15
Xaa Xaa Gly Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala
20 25 30
Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser
35 40 45
Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp
50 55 60
Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp
65 70 75 80
Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr
85 90 95
Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr
100 105 110
Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala
115 120 125
Asn Glu Tyr Asp Tyr Trp Gly Gln Xaa Xaa Gly Ser Leu Arg Leu Ser
130 135 140
Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr Cys Met Gly Trp Phe
145 150 155 160
Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val Ala Ala Ile Asn Met
165 170 175
Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr
180 185 190
Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr Leu Leu Met Asn Ser
195 200 205
Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys Ala Ala Asp Ser Thr
210 215 220
Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly Leu Ser Thr Gly Gly
225 230 235 240
Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
245 250 255
Xaa Xaa Xaa Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His
260 265 270
His His His Glu Pro Glu Ala
275
<210> 15
<211> 720
<212> PRT
<213> Artificial Sequence
<220>
<223> PelB__N2bNb207cAbLys3L_tags, amberstopcodon(*)_protein3 Nano2body
<220>
<221> MISC_FEATURE
<222> (38)..(40)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (159)..(160)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (279)..(281)
<223> Xaa can be any naturally occurring amino acid
<400> 15
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
1 5 10 15
Ala Gln Pro Ala Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly
20 25 30
Leu Val Gln Ala Gly Xaa Xaa Xaa Gly Val Gln Leu Val Glu Ser Gly
35 40 45
Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala
50 55 60
Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala
65 70 75 80
Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly
85 90 95
Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg
100 105 110
Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro
115 120 125
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr
130 135 140
Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Xaa Xaa
145 150 155 160
Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro
165 170 175
Tyr Cys Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly
180 185 190
Val Ala Ala Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser
195 200 205
Val Lys Gly Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val
210 215 220
Tyr Leu Leu Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr
225 230 235 240
Cys Ala Ala Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His
245 250 255
Gly Leu Ser Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr
260 265 270
Gln Val Thr Val Ser Ser Xaa Xaa Xaa Gly Gln Gly Thr Gln Val Thr
275 280 285
Val Ser Ser His His His His His His Glu Pro Glu Ala Tyr Pro Tyr
290 295 300
Asp Val Pro Asp Tyr Gly Ser Thr Val Glu Ser Cys Leu Ala Lys Pro
305 310 315 320
His Thr Glu Asn Ser Phe Thr Asn Val Trp Lys Asp Asp Lys Thr Leu
325 330 335
Asp Arg Tyr Ala Asn Tyr Glu Gly Cys Leu Trp Asn Ala Thr Gly Val
340 345 350
Val Val Cys Thr Gly Asp Glu Thr Gln Cys Tyr Gly Thr Trp Val Pro
355 360 365
Ile Gly Leu Ala Ile Pro Glu Asn Glu Gly Gly Gly Ser Glu Gly Gly
370 375 380
Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly Thr Lys Pro Pro Glu
385 390 395 400
Tyr Gly Asp Thr Pro Ile Pro Gly Tyr Thr Tyr Ile Asn Pro Leu Asp
405 410 415
Gly Thr Tyr Pro Pro Gly Thr Glu Gln Asn Pro Ala Asn Pro Asn Pro
420 425 430
Ser Leu Glu Glu Ser Gln Pro Leu Asn Thr Phe Met Phe Gln Asn Asn
435 440 445
Arg Phe Arg Asn Arg Gln Gly Ala Leu Thr Val Tyr Thr Gly Thr Val
450 455 460
Thr Gln Gly Thr Asp Pro Val Lys Thr Tyr Tyr Gln Tyr Thr Pro Val
465 470 475 480
Ser Ser Lys Ala Met Tyr Asp Ala Tyr Trp Asn Gly Lys Phe Arg Asp
485 490 495
Cys Ala Phe His Ser Gly Phe Asn Glu Asp Pro Phe Val Cys Glu Tyr
500 505 510
Gln Gly Gln Ser Ser Asp Leu Pro Gln Pro Pro Val Asn Ala Gly Gly
515 520 525
Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu
530 535 540
Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly
545 550 555 560
Gly Gly Ser Gly Gly Gly Ser Gly Ser Gly Asp Phe Asp Tyr Glu Lys
565 570 575
Met Ala Asn Ala Asn Lys Gly Ala Met Thr Glu Asn Ala Asp Glu Asn
580 585 590
Ala Leu Gln Ser Asp Ala Lys Gly Lys Leu Asp Ser Val Ala Thr Asp
595 600 605
Tyr Gly Ala Ala Ile Asp Gly Phe Ile Gly Asp Val Ser Gly Leu Ala
610 615 620
Asn Gly Asn Gly Ala Thr Gly Asp Phe Ala Gly Ser Asn Ser Gln Met
625 630 635 640
Ala Gln Val Gly Asp Gly Asp Asn Ser Pro Leu Met Asn Asn Phe Arg
645 650 655
Gln Tyr Leu Pro Ser Leu Pro Gln Ser Val Glu Cys Arg Pro Tyr Val
660 665 670
Phe Gly Ala Gly Lys Pro Tyr Glu Phe Ser Ile Asp Cys Asp Lys Ile
675 680 685
Asn Leu Phe Arg Gly Val Phe Ala Phe Leu Leu Tyr Val Ala Thr Phe
690 695 700
Met Tyr Val Phe Ser Thr Phe Ala Asn Ile Leu Arg Asn Lys Glu Ser
705 710 715 720
<210> 16
<211> 717
<212> PRT
<213> Artificial Sequence
<220>
<223> DsbA_N2bNb207cAbLys3L_tags, amberstopcodon(*)_protein3 Nano2body
<220>
<221> MISC_FEATURE
<222> (35)..(37)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (156)..(157)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (276)..(278)
<223> Xaa can be any naturally occurring amino acid
<400> 16
Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser
1 5 10 15
Ala Ser Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Ala Gly Xaa Xaa Xaa Gly Val Gln Leu Val Glu Ser Gly Gly Gly Leu
35 40 45
Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg
50 55 60
Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys
65 70 75 80
Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr
85 90 95
Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
100 105 110
Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr
115 120 125
Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro
130 135 140
Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Xaa Xaa Gly Ser Leu
145 150 155 160
Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Ile Gly Pro Tyr Cys Met
165 170 175
Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val Ala Ala
180 185 190
Ile Asn Met Gly Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly
195 200 205
Arg Phe Thr Ile Ser Gln Asp Asn Ala Lys Asn Thr Val Tyr Leu Leu
210 215 220
Met Asn Ser Leu Glu Pro Glu Asp Thr Ala Ile Tyr Tyr Cys Ala Ala
225 230 235 240
Asp Ser Thr Ile Tyr Ala Ser Tyr Tyr Glu Cys Gly His Gly Leu Ser
245 250 255
Thr Gly Gly Tyr Gly Tyr Asp Ser Trp Gly Gln Gly Thr Gln Val Thr
260 265 270
Val Ser Ser Xaa Xaa Xaa Gly Gln Gly Thr Gln Val Thr Val Ser Ser
275 280 285
His His His His His His Glu Pro Glu Ala Tyr Pro Tyr Asp Val Pro
290 295 300
Asp Tyr Gly Ser Thr Val Glu Ser Cys Leu Ala Lys Pro His Thr Glu
305 310 315 320
Asn Ser Phe Thr Asn Val Trp Lys Asp Asp Lys Thr Leu Asp Arg Tyr
325 330 335
Ala Asn Tyr Glu Gly Cys Leu Trp Asn Ala Thr Gly Val Val Val Cys
340 345 350
Thr Gly Asp Glu Thr Gln Cys Tyr Gly Thr Trp Val Pro Ile Gly Leu
355 360 365
Ala Ile Pro Glu Asn Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu
370 375 380
Gly Gly Gly Ser Glu Gly Gly Gly Thr Lys Pro Pro Glu Tyr Gly Asp
385 390 395 400
Thr Pro Ile Pro Gly Tyr Thr Tyr Ile Asn Pro Leu Asp Gly Thr Tyr
405 410 415
Pro Pro Gly Thr Glu Gln Asn Pro Ala Asn Pro Asn Pro Ser Leu Glu
420 425 430
Glu Ser Gln Pro Leu Asn Thr Phe Met Phe Gln Asn Asn Arg Phe Arg
435 440 445
Asn Arg Gln Gly Ala Leu Thr Val Tyr Thr Gly Thr Val Thr Gln Gly
450 455 460
Thr Asp Pro Val Lys Thr Tyr Tyr Gln Tyr Thr Pro Val Ser Ser Lys
465 470 475 480
Ala Met Tyr Asp Ala Tyr Trp Asn Gly Lys Phe Arg Asp Cys Ala Phe
485 490 495
His Ser Gly Phe Asn Glu Asp Pro Phe Val Cys Glu Tyr Gln Gly Gln
500 505 510
Ser Ser Asp Leu Pro Gln Pro Pro Val Asn Ala Gly Gly Gly Ser Gly
515 520 525
Gly Gly Ser Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly
530 535 540
Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser Glu Gly Gly Gly Ser
545 550 555 560
Gly Gly Gly Ser Gly Ser Gly Asp Phe Asp Tyr Glu Lys Met Ala Asn
565 570 575
Ala Asn Lys Gly Ala Met Thr Glu Asn Ala Asp Glu Asn Ala Leu Gln
580 585 590
Ser Asp Ala Lys Gly Lys Leu Asp Ser Val Ala Thr Asp Tyr Gly Ala
595 600 605
Ala Ile Asp Gly Phe Ile Gly Asp Val Ser Gly Leu Ala Asn Gly Asn
610 615 620
Gly Ala Thr Gly Asp Phe Ala Gly Ser Asn Ser Gln Met Ala Gln Val
625 630 635 640
Gly Asp Gly Asp Asn Ser Pro Leu Met Asn Asn Phe Arg Gln Tyr Leu
645 650 655
Pro Ser Leu Pro Gln Ser Val Glu Cys Arg Pro Tyr Val Phe Gly Ala
660 665 670
Gly Lys Pro Tyr Glu Phe Ser Ile Asp Cys Asp Lys Ile Asn Leu Phe
675 680 685
Arg Gly Val Phe Ala Phe Leu Leu Tyr Val Ala Thr Phe Met Tyr Val
690 695 700
Phe Ser Thr Phe Ala Asn Ile Leu Arg Asn Lys Glu Ser
705 710 715
<210> 17
<211> 129
<212> PRT
<213> Artificial Sequence
<220>
<223> NbFEDF9 the lectin domain of the F18 fimbrial adhesin FedF
specific Nanobody (PDB 4W6Y)
<400> 17
Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Ser Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Tyr Thr Tyr Ser Ser Asn
20 25 30
Cys Met Ala Trp Phe Arg Gln Val Pro Gly Lys Glu Arg Glu Gly Val
35 40 45
Ala Ser Ile Asn Thr Arg Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Ser
65 70 75 80
Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Thr Tyr Tyr Cys
85 90 95
Ala Ala Val Arg Glu Ala Thr Tyr Ser Asp Asn Arg Cys Ser Val Arg
100 105 110
Ser Tyr Thr Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
115 120 125
Ser
<210> 18
<211> 275
<212> PRT
<213> Artificial Sequence
<220>
<223> N2bNb207NbFEDF9L Nano2body
<220>
<221> MISC_FEATURE
<222> (16)..(18)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (137)..(138)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (253)..(255)
<223> Xaa can be any naturally occurring amino acid
<400> 18
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Xaa
1 5 10 15
Xaa Xaa Gly Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala
20 25 30
Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser
35 40 45
Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp
50 55 60
Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp
65 70 75 80
Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr
85 90 95
Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr
100 105 110
Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala
115 120 125
Asn Glu Tyr Asp Tyr Trp Gly Gln Xaa Xaa Gly Ser Leu Arg Leu Ser
130 135 140
Cys Ala Ala Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe
145 150 155 160
Arg Gln Val Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr
165 170 175
Arg Gly Gly Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr
180 185 190
Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser
195 200 205
Leu Lys Pro Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu
210 215 220
Ala Thr Tyr Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp
225 230 235 240
Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Xaa Xaa Gly
245 250 255
Gln Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu
260 265 270
Pro Glu Ala
275
<210> 19
<211> 434
<212> PRT
<213> Artificial Sequence
<220>
<223> Helicobacter pylori strain G27 HopQ adhesin domain protein (PDB
5LP2)
<400> 19
Met Ala Val Gln Lys Val Lys Asn Ala Asp Lys Val Gln Lys Leu Ser
1 5 10 15
Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr
20 25 30
Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu
35 40 45
Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala
50 55 60
Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn
65 70 75 80
Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly
85 90 95
Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly
100 105 110
Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser
115 120 125
Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser
130 135 140
Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys
145 150 155 160
Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys
165 170 175
Leu Glu Ala His Val Thr Thr Ser Lys Tyr Gln Gln Asp Asn Gln Thr
180 185 190
Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu
195 200 205
Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro
210 215 220
Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala
225 230 235 240
Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala
245 250 255
Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala
260 265 270
Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys
275 280 285
Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu
290 295 300
Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu
305 310 315 320
Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser
325 330 335
Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile
340 345 350
Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn
355 360 365
Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala
370 375 380
Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu
385 390 395 400
Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Asn Met
405 410 415
Gly Met Ile Ala Ser Ser Thr Thr Asn Asn Gly Ala His His His His
420 425 430
His His
<210> 20
<211> 542
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQ
<400> 20
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
450 455 460
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
500 505 510
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 21
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> cHopQ circular permutation linker peptide
<400> 21
Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10
<210> 22
<211> 821
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQ_Aga2p_ACP protein sequence
<400> 22
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Thr Lys Thr Thr Thr Ser Val Ile Asp Thr
100 105 110
Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn
115 120 125
Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser
130 135 140
Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly
145 150 155 160
Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala
165 170 175
Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln
180 185 190
Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn
195 200 205
Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys
210 215 220
Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu
225 230 235 240
Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly
245 250 255
Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn
260 265 270
Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln
275 280 285
Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln
290 295 300
Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly
305 310 315 320
Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser
325 330 335
Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn
340 345 350
Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala
355 360 365
Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr
370 375 380
Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu
385 390 395 400
Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr
405 410 415
Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu
420 425 430
Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn
435 440 445
Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn
450 455 460
Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln
465 470 475 480
Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser
485 490 495
Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Gly Ser
500 505 510
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
515 520 525
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
530 535 540
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
545 550 555 560
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
565 570 575
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
580 585 590
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
595 600 605
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly
610 615 620
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
625 630 635 640
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
645 650 655
Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu
660 665 670
Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys
675 680 685
Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser
690 695 700
Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn
705 710 715 720
Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile
725 730 735
Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln
740 745 750
Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp
755 760 765
Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp
770 775 780
Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala
785 790 795 800
Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile
805 810 815
Ser Glu Glu Asp Leu
820
<210> 23
<211> 561
<212> PRT
<213> Artificial Sequence
<220>
<223> DsbA- MbNb207cHopQ
<400> 23
Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser
1 5 10 15
Ala Ser Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Thr Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn
35 40 45
Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys
50 55 60
Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn
65 70 75 80
Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys
85 90 95
Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn
100 105 110
Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro
115 120 125
Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser
130 135 140
Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala
145 150 155 160
Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu
165 170 175
Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala
180 185 190
Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly
195 200 205
Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser
210 215 220
Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn
225 230 235 240
Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala
245 250 255
Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr
260 265 270
Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser
275 280 285
Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu
290 295 300
Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln
305 310 315 320
Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met
325 330 335
Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn
340 345 350
Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr
355 360 365
Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn
370 375 380
Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu
385 390 395 400
Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu
405 410 415
Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu
420 425 430
Ala His Val Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala
435 440 445
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
450 455 460
Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val
465 470 475 480
Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser
485 490 495
Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys
500 505 510
Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe
515 520 525
Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly
530 535 540
Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu
545 550 555 560
Ala
<210> 24
<211> 128
<212> PRT
<213> Artificial Sequence
<220>
<223> Nb35 Gbeta/Galpha subunit of the beta2 adrenergic receptor-Gs
protein complex-specific Nanobody
<400> 24
Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr
20 25 30
Lys Met Asn Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Asp Ile Ser Gln Ser Gly Ala Ser Ile Ser Tyr Thr Gly Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Arg Cys Pro Ala Pro Phe Thr Arg Asp Cys Phe Asp Val Thr Ser
100 105 110
Thr Thr Tyr Ala Tyr Arg Gly Gln Gly Thr Gln Val Thr Val Ser Ser
115 120 125
<210> 25
<211> 544
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb35cHopQ
<400> 25
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Phe Thr Phe Ser Asn Tyr Lys Met Asn Trp Val Arg Gln Ala Pro Gly
435 440 445
Lys Gly Leu Glu Trp Val Ser Asp Ile Ser Gln Ser Gly Ala Ser Ile
450 455 460
Ser Tyr Thr Gly Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Arg Cys Pro Ala Pro Phe Thr Arg Asp
500 505 510
Cys Phe Asp Val Thr Ser Thr Thr Tyr Ala Tyr Arg Gly Gln Gly Thr
515 520 525
Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 26
<211> 120
<212> PRT
<213> Artificial Sequence
<220>
<223> Nb80 beta2 adrenergic receptor-specific Nanobody
<400> 26
Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Ser Ile Phe Ser Ile Asn
20 25 30
Thr Met Gly Trp Tyr Arg Gln Ala Pro Gly Lys Gln Arg Glu Leu Val
35 40 45
Ala Ala Ile His Ser Gly Gly Ser Thr Asn Tyr Ala Asn Ser Val Lys
50 55 60
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Ala Asn Thr Val Tyr Leu
65 70 75 80
Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn
85 90 95
Val Lys Asp Tyr Gly Ala Val Leu Tyr Glu Tyr Asp Tyr Trp Gly Gln
100 105 110
Gly Thr Gln Val Thr Val Ser Ser
115 120
<210> 27
<211> 536
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb80cHopQ
<400> 27
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Ser Ile Phe Ser Ile Asn Thr Met Gly Trp Tyr Arg Gln Ala Pro Gly
435 440 445
Lys Gln Arg Glu Leu Val Ala Ala Ile His Ser Gly Gly Ser Thr Asn
450 455 460
Tyr Ala Asn Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
465 470 475 480
Ala Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr
485 490 495
Ala Val Tyr Tyr Cys Asn Val Lys Asp Tyr Gly Ala Val Leu Tyr Glu
500 505 510
Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His
515 520 525
His His His His Glu Pro Glu Ala
530 535
<210> 28
<211> 125
<212> PRT
<213> Artificial Sequence
<220>
<223> Nb25 GABAA-specific Nanobody
<400> 28
Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly His Thr Phe Asn Tyr Pro
20 25 30
Ile Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Phe Val
35 40 45
Gly Ala Ile Ser Trp Ser Gly Gly Ser Thr Ser Tyr Ala Asp Ser Val
50 55 60
Lys Asp Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr
65 70 75 80
Leu Glu Met Asn Asn Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Ala Lys Gly Arg Tyr Ser Gly Gly Leu Tyr Tyr Pro Thr Asn Tyr
100 105 110
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
115 120 125
<210> 29
<211> 541
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb25cHopQ
<400> 29
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
His Thr Phe Asn Tyr Pro Ile Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Glu Phe Val Gly Ala Ile Ser Trp Ser Gly Gly Ser Thr
450 455 460
Ser Tyr Ala Asp Ser Val Lys Asp Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Val Tyr Leu Glu Met Asn Asn Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Lys Gly Arg Tyr Ser Gly Gly Leu
500 505 510
Tyr Tyr Pro Thr Asn Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr
515 520 525
Val Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 30
<211> 540
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (420)
<223> Xaa can be any naturally occurring amino acid
<400> 30
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Lys Thr Thr
1 5 10 15
Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln
20 25 30
Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile
35 40 45
Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro
50 55 60
Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly
65 70 75 80
Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile
85 90 95
Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr
100 105 110
Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu
115 120 125
Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys
130 135 140
Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His
145 150 155 160
Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala
165 170 175
Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala
180 185 190
Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe
195 200 205
Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr
210 215 220
Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly
225 230 235 240
Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu
245 250 255
Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala
260 265 270
Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr
275 280 285
Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu
290 295 300
Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val
305 310 315 320
Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp
325 330 335
Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly
340 345 350
Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr
355 360 365
Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys
370 375 380
Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly
385 390 395 400
Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr
405 410 415
Thr Ser Lys Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr
420 425 430
Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu
435 440 445
Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr
450 455 460
Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys
465 470 475 480
Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala
485 490 495
Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr
500 505 510
Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
515 520 525
Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 31
<211> 541
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (421)
<223> Xaa can be any naturally occurring amino acid
<400> 31
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg
420 425 430
Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys
435 440 445
Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr
450 455 460
Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
465 470 475 480
Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr
485 490 495
Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro
500 505 510
Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr
515 520 525
Val Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 32
<211> 541
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (420)..(421)
<223> Xaa can be any naturally occurring amino acid
<400> 32
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Lys Thr Thr
1 5 10 15
Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln
20 25 30
Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile
35 40 45
Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro
50 55 60
Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly
65 70 75 80
Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile
85 90 95
Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr
100 105 110
Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu
115 120 125
Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys
130 135 140
Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His
145 150 155 160
Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala
165 170 175
Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala
180 185 190
Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe
195 200 205
Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr
210 215 220
Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly
225 230 235 240
Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu
245 250 255
Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala
260 265 270
Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr
275 280 285
Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu
290 295 300
Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val
305 310 315 320
Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp
325 330 335
Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly
340 345 350
Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr
355 360 365
Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys
370 375 380
Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly
385 390 395 400
Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr
405 410 415
Thr Ser Lys Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg
420 425 430
Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys
435 440 445
Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr
450 455 460
Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
465 470 475 480
Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr
485 490 495
Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro
500 505 510
Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr
515 520 525
Val Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 33
<211> 542
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (421)..(422)
<223> Xaa can be any naturally occurring amino acid
<400> 33
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
450 455 460
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
500 505 510
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 34
<211> 819
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQrandomlinkers_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (509)
<223> Xaa can be any naturally occurring amino acid
<400> 34
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr
100 105 110
Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr
115 120 125
Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn
130 135 140
Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly
145 150 155 160
Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser
165 170 175
Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu
180 185 190
Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu
195 200 205
Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn
210 215 220
Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser
225 230 235 240
Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys
245 250 255
Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln
260 265 270
Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser
275 280 285
Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile
290 295 300
Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn
305 310 315 320
Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
325 330 335
Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp
340 345 350
Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val
355 360 365
Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn
370 375 380
Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly
385 390 395 400
Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys
405 410 415
Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn
420 425 430
Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly
435 440 445
Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val
450 455 460
Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile
465 470 475 480
Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys
485 490 495
Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Xaa Ser Leu Arg
500 505 510
Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly
515 520 525
Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile
530 535 540
Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg
545 550 555 560
Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met
565 570 575
Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg
580 585 590
Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr
595 600 605
Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly Ser
610 615 620
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
625 630 635 640
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Glu
645 650 655
Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser Thr
660 665 670
Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala Met
675 680 685
Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn Cys
690 695 700
Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr Gln
705 710 715 720
Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu Glu
725 730 735
Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu
740 745 750
Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu
755 760 765
Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu
770 775 780
Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile
785 790 795 800
Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser Glu
805 810 815
Glu Asp Leu
<210> 35
<211> 820
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQrandomlinkers_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)..(103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (510)
<223> Xaa can be any naturally occurring amino acid
<400> 35
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr
100 105 110
Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn
115 120 125
Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser
130 135 140
Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly
145 150 155 160
Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala
165 170 175
Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln
180 185 190
Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn
195 200 205
Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys
210 215 220
Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu
225 230 235 240
Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly
245 250 255
Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn
260 265 270
Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln
275 280 285
Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln
290 295 300
Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly
305 310 315 320
Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser
325 330 335
Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn
340 345 350
Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala
355 360 365
Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr
370 375 380
Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu
385 390 395 400
Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr
405 410 415
Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu
420 425 430
Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn
435 440 445
Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn
450 455 460
Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln
465 470 475 480
Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser
485 490 495
Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Xaa Ser Leu
500 505 510
Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met
515 520 525
Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly
530 535 540
Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly
545 550 555 560
Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln
565 570 575
Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala
580 585 590
Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp
595 600 605
Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly
610 615 620
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
625 630 635 640
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln
645 650 655
Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser
660 665 670
Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala
675 680 685
Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn
690 695 700
Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr
705 710 715 720
Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu
725 730 735
Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu
740 745 750
Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser
755 760 765
Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr
770 775 780
Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala
785 790 795 800
Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser
805 810 815
Glu Glu Asp Leu
820
<210> 36
<211> 820
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQrandomlinkers_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (509)..(510)
<223> Xaa can be any naturally occurring amino acid
<400> 36
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr
100 105 110
Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr
115 120 125
Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn
130 135 140
Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly
145 150 155 160
Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser
165 170 175
Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu
180 185 190
Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu
195 200 205
Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn
210 215 220
Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser
225 230 235 240
Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys
245 250 255
Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln
260 265 270
Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser
275 280 285
Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile
290 295 300
Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn
305 310 315 320
Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
325 330 335
Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp
340 345 350
Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val
355 360 365
Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn
370 375 380
Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly
385 390 395 400
Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys
405 410 415
Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn
420 425 430
Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly
435 440 445
Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val
450 455 460
Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile
465 470 475 480
Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys
485 490 495
Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Xaa Xaa Ser Leu
500 505 510
Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met
515 520 525
Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly
530 535 540
Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly
545 550 555 560
Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln
565 570 575
Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala
580 585 590
Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp
595 600 605
Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly
610 615 620
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
625 630 635 640
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln
645 650 655
Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser
660 665 670
Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala
675 680 685
Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn
690 695 700
Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr
705 710 715 720
Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu
725 730 735
Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu
740 745 750
Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser
755 760 765
Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr
770 775 780
Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala
785 790 795 800
Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser
805 810 815
Glu Glu Asp Leu
820
<210> 37
<211> 821
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQrandomlinkers_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)..(103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (510)..(511)
<223> Xaa can be any naturally occurring amino acid
<400> 37
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr
100 105 110
Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn
115 120 125
Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser
130 135 140
Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly
145 150 155 160
Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala
165 170 175
Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln
180 185 190
Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn
195 200 205
Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys
210 215 220
Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu
225 230 235 240
Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly
245 250 255
Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn
260 265 270
Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln
275 280 285
Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln
290 295 300
Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly
305 310 315 320
Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser
325 330 335
Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn
340 345 350
Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala
355 360 365
Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr
370 375 380
Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu
385 390 395 400
Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr
405 410 415
Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu
420 425 430
Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn
435 440 445
Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn
450 455 460
Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln
465 470 475 480
Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser
485 490 495
Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Xaa Xaa Ser
500 505 510
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
515 520 525
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
530 535 540
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
545 550 555 560
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
565 570 575
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
580 585 590
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
595 600 605
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly
610 615 620
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
625 630 635 640
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
645 650 655
Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu
660 665 670
Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys
675 680 685
Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser
690 695 700
Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn
705 710 715 720
Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile
725 730 735
Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln
740 745 750
Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp
755 760 765
Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp
770 775 780
Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala
785 790 795 800
Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile
805 810 815
Ser Glu Glu Asp Leu
820
<210> 38
<211> 760
<212> PRT
<213> Escherichia coli
<400> 38
Asn Ala Asp Asn Tyr Lys Asn Val Ile Asn Arg Thr Gly Ala Pro Gln
1 5 10 15
Tyr Met Lys Asp Tyr Asp Tyr Asp Asp His Gln Arg Phe Asn Pro Phe
20 25 30
Phe Asp Leu Gly Ala Trp His Gly His Leu Leu Pro Asp Gly Pro Asn
35 40 45
Thr Met Gly Gly Phe Pro Gly Val Ala Leu Leu Thr Glu Glu Tyr Ile
50 55 60
Asn Phe Met Ala Ser Asn Phe Asp Arg Leu Thr Val Trp Gln Asp Gly
65 70 75 80
Lys Lys Val Asp Phe Thr Leu Glu Ala Tyr Ser Ile Pro Gly Ala Leu
85 90 95
Val Gln Lys Leu Thr Ala Lys Asp Val Gln Val Glu Met Thr Leu Arg
100 105 110
Phe Ala Thr Pro Arg Thr Ser Leu Leu Glu Thr Lys Ile Thr Ser Asn
115 120 125
Lys Pro Leu Asp Leu Val Trp Asp Gly Glu Leu Leu Glu Lys Leu Glu
130 135 140
Ala Lys Glu Gly Lys Pro Leu Ser Asp Lys Thr Ile Ala Gly Glu Tyr
145 150 155 160
Pro Asp Tyr Gln Arg Lys Ile Ser Ala Thr Arg Asp Gly Leu Lys Val
165 170 175
Thr Phe Gly Lys Val Arg Ala Thr Trp Asp Leu Leu Thr Ser Gly Glu
180 185 190
Ser Glu Tyr Gln Val His Lys Ser Leu Pro Val Gln Thr Glu Ile Asn
195 200 205
Gly Asn Arg Phe Thr Ser Lys Ala His Ile Asn Gly Ser Thr Thr Leu
210 215 220
Tyr Thr Thr Tyr Ser His Leu Leu Thr Ala Gln Glu Val Ser Lys Glu
225 230 235 240
Gln Met Gln Ile Arg Asp Ile Leu Ala Arg Pro Ala Phe Tyr Leu Thr
245 250 255
Ala Ser Gln Gln Arg Trp Glu Glu Tyr Leu Lys Lys Gly Leu Thr Asn
260 265 270
Pro Asp Ala Thr Pro Glu Gln Thr Arg Val Ala Val Lys Ala Ile Glu
275 280 285
Thr Leu Asn Gly Asn Trp Arg Ser Pro Gly Gly Ala Val Lys Phe Asn
290 295 300
Thr Val Thr Pro Ser Val Thr Gly Arg Trp Phe Ser Gly Asn Gln Thr
305 310 315 320
Trp Pro Trp Asp Thr Trp Lys Gln Ala Phe Ala Met Ala His Phe Asn
325 330 335
Pro Asp Ile Ala Lys Glu Asn Ile Arg Ala Val Phe Ser Trp Gln Ile
340 345 350
Gln Pro Gly Asp Ser Val Arg Pro Gln Asp Val Gly Phe Val Pro Asp
355 360 365
Leu Ile Ala Trp Asn Leu Ser Pro Glu Arg Gly Gly Asp Gly Gly Asn
370 375 380
Trp Asn Glu Arg Asn Thr Lys Pro Ser Leu Ala Ala Trp Ser Val Met
385 390 395 400
Glu Val Tyr Asn Val Thr Gln Asp Lys Thr Trp Val Ala Glu Met Tyr
405 410 415
Pro Lys Leu Val Ala Tyr His Asp Trp Trp Leu Arg Asn Arg Asp His
420 425 430
Asn Gly Asn Gly Val Pro Glu Tyr Gly Ala Thr Arg Asp Lys Ala His
435 440 445
Asn Thr Glu Ser Gly Glu Met Leu Phe Thr Val Lys Lys Gly Asp Lys
450 455 460
Glu Glu Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys
465 470 475 480
Gly Gln Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp
485 490 495
Glu Ser Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu
500 505 510
Gln Leu Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr
515 520 525
Val Lys Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr
530 535 540
Ser Leu Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp
545 550 555 560
Asn His Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu
565 570 575
Ala Lys Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn
580 585 590
Thr Cys Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile
595 600 605
Glu Asp Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu
610 615 620
Arg Gly Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala
625 630 635 640
Thr Gln Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys
645 650 655
Glu Phe Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro
660 665 670
Ala Phe Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln
675 680 685
Phe Trp Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp
690 695 700
Ala Leu Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr
705 710 715 720
Ala Asp Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln
725 730 735
Gln Gly Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu
740 745 750
Tyr Asn Asp Phe Phe Arg Lys Gln
755 760
<210> 39
<211> 909
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (789)
<223> Xaa can be any naturally occurring amino acid
<400> 39
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Lys Glu Glu
1 5 10 15
Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln
20 25 30
Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser
35 40 45
Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu
50 55 60
Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys
65 70 75 80
Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu
85 90 95
Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His
100 105 110
Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys
115 120 125
Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys
130 135 140
Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp
145 150 155 160
Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly
165 170 175
Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln
180 185 190
Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe
195 200 205
Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe
210 215 220
Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp
225 230 235 240
Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu
245 250 255
Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp
260 265 270
Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly
275 280 285
Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn
290 295 300
Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
305 310 315 320
Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile
325 330 335
Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp
340 345 350
His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His
355 360 365
Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala
370 375 380
Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg
385 390 395 400
Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala
405 410 415
Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val
420 425 430
Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu
435 440 445
Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly
450 455 460
Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp
465 470 475 480
Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala
485 490 495
Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp
500 505 510
Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu
515 520 525
Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His
530 535 540
Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr
545 550 555 560
Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala
565 570 575
Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr
580 585 590
Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg
595 600 605
Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro
610 615 620
Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg
625 630 635 640
Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala
645 650 655
Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg
660 665 670
Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln
675 680 685
Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu
690 695 700
Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser
705 710 715 720
Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys
725 730 735
Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp
740 745 750
Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly
755 760 765
Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe
770 775 780
Thr Val Lys Lys Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg
785 790 795 800
Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys
805 810 815
Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr
820 825 830
Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
835 840 845
Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr
850 855 860
Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro
865 870 875 880
Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr
885 890 895
Val Ser Ser His His His His His His Glu Pro Glu Ala
900 905
<210> 40
<211> 910
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (790)
<223> Xaa can be any naturally occurring amino acid
<400> 40
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Lys Glu
1 5 10 15
Glu Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly
20 25 30
Gln Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu
35 40 45
Ser Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln
50 55 60
Leu Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val
65 70 75 80
Lys Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser
85 90 95
Leu Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn
100 105 110
His Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala
115 120 125
Lys Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr
130 135 140
Cys Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu
145 150 155 160
Asp Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg
165 170 175
Gly Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr
180 185 190
Gln Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu
195 200 205
Phe Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala
210 215 220
Phe Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe
225 230 235 240
Trp Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala
245 250 255
Leu Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala
260 265 270
Asp Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln
275 280 285
Gly Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr
290 295 300
Asn Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly
305 310 315 320
Gly Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val
325 330 335
Ile Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp
340 345 350
Asp His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly
355 360 365
His Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val
370 375 380
Ala Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp
385 390 395 400
Arg Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu
405 410 415
Ala Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp
420 425 430
Val Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu
435 440 445
Leu Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp
450 455 460
Gly Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser
465 470 475 480
Asp Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser
485 490 495
Ala Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr
500 505 510
Trp Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser
515 520 525
Leu Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala
530 535 540
His Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu
545 550 555 560
Thr Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu
565 570 575
Ala Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu
580 585 590
Tyr Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr
595 600 605
Arg Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser
610 615 620
Pro Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly
625 630 635 640
Arg Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln
645 650 655
Ala Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile
660 665 670
Arg Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro
675 680 685
Gln Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro
690 695 700
Glu Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro
705 710 715 720
Ser Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp
725 730 735
Lys Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp
740 745 750
Trp Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr
755 760 765
Gly Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu
770 775 780
Phe Thr Val Lys Lys Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
785 790 795 800
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
805 810 815
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
820 825 830
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
835 840 845
Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp
850 855 860
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
865 870 875 880
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
885 890 895
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
900 905 910
<210> 41
<211> 910
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (789)..(790)
<223> Xaa can be any naturally occurring amino acid
<400> 41
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Lys Glu Glu
1 5 10 15
Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln
20 25 30
Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser
35 40 45
Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu
50 55 60
Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys
65 70 75 80
Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu
85 90 95
Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His
100 105 110
Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys
115 120 125
Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys
130 135 140
Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp
145 150 155 160
Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly
165 170 175
Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln
180 185 190
Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe
195 200 205
Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe
210 215 220
Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp
225 230 235 240
Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu
245 250 255
Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp
260 265 270
Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly
275 280 285
Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn
290 295 300
Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
305 310 315 320
Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile
325 330 335
Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp
340 345 350
His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His
355 360 365
Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala
370 375 380
Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg
385 390 395 400
Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala
405 410 415
Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val
420 425 430
Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu
435 440 445
Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly
450 455 460
Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp
465 470 475 480
Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala
485 490 495
Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp
500 505 510
Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu
515 520 525
Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His
530 535 540
Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr
545 550 555 560
Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala
565 570 575
Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr
580 585 590
Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg
595 600 605
Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro
610 615 620
Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg
625 630 635 640
Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala
645 650 655
Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg
660 665 670
Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln
675 680 685
Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu
690 695 700
Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser
705 710 715 720
Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys
725 730 735
Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp
740 745 750
Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly
755 760 765
Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe
770 775 780
Thr Val Lys Lys Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
785 790 795 800
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
805 810 815
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
820 825 830
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
835 840 845
Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp
850 855 860
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
865 870 875 880
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
885 890 895
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
900 905 910
<210> 42
<211> 911
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (790)..(791)
<223> Xaa can be any naturally occurring amino acid
<400> 42
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Lys Glu
1 5 10 15
Glu Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly
20 25 30
Gln Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu
35 40 45
Ser Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln
50 55 60
Leu Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val
65 70 75 80
Lys Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser
85 90 95
Leu Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn
100 105 110
His Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala
115 120 125
Lys Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr
130 135 140
Cys Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu
145 150 155 160
Asp Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg
165 170 175
Gly Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr
180 185 190
Gln Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu
195 200 205
Phe Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala
210 215 220
Phe Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe
225 230 235 240
Trp Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala
245 250 255
Leu Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala
260 265 270
Asp Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln
275 280 285
Gly Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr
290 295 300
Asn Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly
305 310 315 320
Gly Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val
325 330 335
Ile Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp
340 345 350
Asp His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly
355 360 365
His Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val
370 375 380
Ala Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp
385 390 395 400
Arg Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu
405 410 415
Ala Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp
420 425 430
Val Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu
435 440 445
Leu Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp
450 455 460
Gly Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser
465 470 475 480
Asp Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser
485 490 495
Ala Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr
500 505 510
Trp Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser
515 520 525
Leu Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala
530 535 540
His Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu
545 550 555 560
Thr Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu
565 570 575
Ala Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu
580 585 590
Tyr Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr
595 600 605
Arg Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser
610 615 620
Pro Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly
625 630 635 640
Arg Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln
645 650 655
Ala Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile
660 665 670
Arg Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro
675 680 685
Gln Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro
690 695 700
Glu Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro
705 710 715 720
Ser Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp
725 730 735
Lys Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp
740 745 750
Trp Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr
755 760 765
Gly Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu
770 775 780
Phe Thr Val Lys Lys Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser
785 790 795 800
Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro
805 810 815
Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser
820 825 830
Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp
835 840 845
Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu
850 855 860
Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu
865 870 875 880
Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln
885 890 895
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
900 905 910
<210> 43
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> cYgjk circular permutation linker peptide
<400> 43
Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
Gly
<210> 44
<211> 1188
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkrandomlinkers_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (878)
<223> Xaa can be any naturally occurring amino acid
<400> 44
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Lys Glu Glu Thr Gln Ser Gly Leu Asn Asn
100 105 110
Tyr Ala Arg Val Val Glu Lys Gly Gln Tyr Asp Ser Leu Glu Ile Pro
115 120 125
Ala Gln Val Ala Ala Ser Trp Glu Ser Gly Arg Asp Asp Ala Ala Val
130 135 140
Phe Gly Phe Ile Asp Lys Glu Gln Leu Asp Lys Tyr Val Ala Asn Gly
145 150 155 160
Gly Lys Arg Ser Asp Trp Thr Val Lys Phe Ala Glu Asn Arg Ser Gln
165 170 175
Asp Gly Thr Leu Leu Gly Tyr Ser Leu Leu Gln Glu Ser Val Asp Gln
180 185 190
Ala Ser Tyr Met Tyr Ser Asp Asn His Tyr Leu Ala Glu Met Ala Thr
195 200 205
Ile Leu Gly Lys Pro Glu Glu Ala Lys Arg Tyr Arg Gln Leu Ala Gln
210 215 220
Gln Leu Ala Asp Tyr Ile Asn Thr Cys Met Phe Asp Pro Thr Thr Gln
225 230 235 240
Phe Tyr Tyr Asp Val Arg Ile Glu Asp Lys Pro Leu Ala Asn Gly Cys
245 250 255
Ala Gly Lys Pro Ile Val Glu Arg Gly Lys Gly Pro Glu Gly Trp Ser
260 265 270
Pro Leu Phe Asn Gly Ala Ala Thr Gln Ala Asn Ala Asp Ala Val Val
275 280 285
Lys Val Met Leu Asp Pro Lys Glu Phe Asn Thr Phe Val Pro Leu Gly
290 295 300
Thr Ala Ala Leu Thr Asn Pro Ala Phe Gly Ala Asp Ile Tyr Trp Arg
305 310 315 320
Gly Arg Val Trp Val Asp Gln Phe Trp Phe Gly Leu Lys Gly Met Glu
325 330 335
Arg Tyr Gly Tyr Arg Asp Asp Ala Leu Lys Leu Ala Asp Thr Phe Phe
340 345 350
Arg His Ala Lys Gly Leu Thr Ala Asp Gly Pro Ile Gln Glu Asn Tyr
355 360 365
Asn Pro Leu Thr Gly Ala Gln Gln Gly Ala Pro Asn Phe Ser Trp Ser
370 375 380
Ala Ala His Leu Tyr Met Leu Tyr Asn Asp Phe Phe Arg Lys Gln Ala
385 390 395 400
Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
405 410 415
Asn Ala Asp Asn Tyr Lys Asn Val Ile Asn Arg Thr Gly Ala Pro Gln
420 425 430
Tyr Met Lys Asp Tyr Asp Tyr Asp Asp His Gln Arg Phe Asn Pro Phe
435 440 445
Phe Asp Leu Gly Ala Trp His Gly His Leu Leu Pro Asp Gly Pro Asn
450 455 460
Thr Met Gly Gly Phe Pro Gly Val Ala Leu Leu Thr Glu Glu Tyr Ile
465 470 475 480
Asn Phe Met Ala Ser Asn Phe Asp Arg Leu Thr Val Trp Gln Asp Gly
485 490 495
Lys Lys Val Asp Phe Thr Leu Glu Ala Tyr Ser Ile Pro Gly Ala Leu
500 505 510
Val Gln Lys Leu Thr Ala Lys Asp Val Gln Val Glu Met Thr Leu Arg
515 520 525
Phe Ala Thr Pro Arg Thr Ser Leu Leu Glu Thr Lys Ile Thr Ser Asn
530 535 540
Lys Pro Leu Asp Leu Val Trp Asp Gly Glu Leu Leu Glu Lys Leu Glu
545 550 555 560
Ala Lys Glu Gly Lys Pro Leu Ser Asp Lys Thr Ile Ala Gly Glu Tyr
565 570 575
Pro Asp Tyr Gln Arg Lys Ile Ser Ala Thr Arg Asp Gly Leu Lys Val
580 585 590
Thr Phe Gly Lys Val Arg Ala Thr Trp Asp Leu Leu Thr Ser Gly Glu
595 600 605
Ser Glu Tyr Gln Val His Lys Ser Leu Pro Val Gln Thr Glu Ile Asn
610 615 620
Gly Asn Arg Phe Thr Ser Lys Ala His Ile Asn Gly Ser Thr Thr Leu
625 630 635 640
Tyr Thr Thr Tyr Ser His Leu Leu Thr Ala Gln Glu Val Ser Lys Glu
645 650 655
Gln Met Gln Ile Arg Asp Ile Leu Ala Arg Pro Ala Phe Tyr Leu Thr
660 665 670
Ala Ser Gln Gln Arg Trp Glu Glu Tyr Leu Lys Lys Gly Leu Thr Asn
675 680 685
Pro Asp Ala Thr Pro Glu Gln Thr Arg Val Ala Val Lys Ala Ile Glu
690 695 700
Thr Leu Asn Gly Asn Trp Arg Ser Pro Gly Gly Ala Val Lys Phe Asn
705 710 715 720
Thr Val Thr Pro Ser Val Thr Gly Arg Trp Phe Ser Gly Asn Gln Thr
725 730 735
Trp Pro Trp Asp Thr Trp Lys Gln Ala Phe Ala Met Ala His Phe Asn
740 745 750
Pro Asp Ile Ala Lys Glu Asn Ile Arg Ala Val Phe Ser Trp Gln Ile
755 760 765
Gln Pro Gly Asp Ser Val Arg Pro Gln Asp Val Gly Phe Val Pro Asp
770 775 780
Leu Ile Ala Trp Asn Leu Ser Pro Glu Arg Gly Gly Asp Gly Gly Asn
785 790 795 800
Trp Asn Glu Arg Asn Thr Lys Pro Ser Leu Ala Ala Trp Ser Val Met
805 810 815
Glu Val Tyr Asn Val Thr Gln Asp Lys Thr Trp Val Ala Glu Met Tyr
820 825 830
Pro Lys Leu Val Ala Tyr His Asp Trp Trp Leu Arg Asn Arg Asp His
835 840 845
Asn Gly Asn Gly Val Pro Glu Tyr Gly Ala Thr Arg Asp Lys Ala His
850 855 860
Asn Thr Glu Ser Gly Glu Met Leu Phe Thr Val Lys Lys Xaa Ser Leu
865 870 875 880
Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met
885 890 895
Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly
900 905 910
Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly
915 920 925
Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln
930 935 940
Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala
945 950 955 960
Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp
965 970 975
Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly
980 985 990
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
995 1000 1005
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln
1010 1015 1020
Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser
1025 1030 1035 1040
Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala
1045 1050 1055
Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn
1060 1065 1070
Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr
1075 1080 1085
Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu
1090 1095 1100
Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu
1105 1110 1115 1120
Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser
1125 1130 1135
Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr
1140 1145 1150
Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala
1155 1160 1165
Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser
1170 1175 1180
Glu Glu Asp Leu
1185
<210> 45
<211> 1189
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkrandomlinkers_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)..(103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (879)
<223> Xaa can be any naturally occurring amino acid
<400> 45
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Xaa Lys Glu Glu Thr Gln Ser Gly Leu Asn
100 105 110
Asn Tyr Ala Arg Val Val Glu Lys Gly Gln Tyr Asp Ser Leu Glu Ile
115 120 125
Pro Ala Gln Val Ala Ala Ser Trp Glu Ser Gly Arg Asp Asp Ala Ala
130 135 140
Val Phe Gly Phe Ile Asp Lys Glu Gln Leu Asp Lys Tyr Val Ala Asn
145 150 155 160
Gly Gly Lys Arg Ser Asp Trp Thr Val Lys Phe Ala Glu Asn Arg Ser
165 170 175
Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu Leu Gln Glu Ser Val Asp
180 185 190
Gln Ala Ser Tyr Met Tyr Ser Asp Asn His Tyr Leu Ala Glu Met Ala
195 200 205
Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys Arg Tyr Arg Gln Leu Ala
210 215 220
Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys Met Phe Asp Pro Thr Thr
225 230 235 240
Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp Lys Pro Leu Ala Asn Gly
245 250 255
Cys Ala Gly Lys Pro Ile Val Glu Arg Gly Lys Gly Pro Glu Gly Trp
260 265 270
Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln Ala Asn Ala Asp Ala Val
275 280 285
Val Lys Val Met Leu Asp Pro Lys Glu Phe Asn Thr Phe Val Pro Leu
290 295 300
Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe Gly Ala Asp Ile Tyr Trp
305 310 315 320
Arg Gly Arg Val Trp Val Asp Gln Phe Trp Phe Gly Leu Lys Gly Met
325 330 335
Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu Lys Leu Ala Asp Thr Phe
340 345 350
Phe Arg His Ala Lys Gly Leu Thr Ala Asp Gly Pro Ile Gln Glu Asn
355 360 365
Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly Ala Pro Asn Phe Ser Trp
370 375 380
Ser Ala Ala His Leu Tyr Met Leu Tyr Asn Asp Phe Phe Arg Lys Gln
385 390 395 400
Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
405 410 415
Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile Asn Arg Thr Gly Ala Pro
420 425 430
Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp His Gln Arg Phe Asn Pro
435 440 445
Phe Phe Asp Leu Gly Ala Trp His Gly His Leu Leu Pro Asp Gly Pro
450 455 460
Asn Thr Met Gly Gly Phe Pro Gly Val Ala Leu Leu Thr Glu Glu Tyr
465 470 475 480
Ile Asn Phe Met Ala Ser Asn Phe Asp Arg Leu Thr Val Trp Gln Asp
485 490 495
Gly Lys Lys Val Asp Phe Thr Leu Glu Ala Tyr Ser Ile Pro Gly Ala
500 505 510
Leu Val Gln Lys Leu Thr Ala Lys Asp Val Gln Val Glu Met Thr Leu
515 520 525
Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu Glu Thr Lys Ile Thr Ser
530 535 540
Asn Lys Pro Leu Asp Leu Val Trp Asp Gly Glu Leu Leu Glu Lys Leu
545 550 555 560
Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp Lys Thr Ile Ala Gly Glu
565 570 575
Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala Thr Arg Asp Gly Leu Lys
580 585 590
Val Thr Phe Gly Lys Val Arg Ala Thr Trp Asp Leu Leu Thr Ser Gly
595 600 605
Glu Ser Glu Tyr Gln Val His Lys Ser Leu Pro Val Gln Thr Glu Ile
610 615 620
Asn Gly Asn Arg Phe Thr Ser Lys Ala His Ile Asn Gly Ser Thr Thr
625 630 635 640
Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr Ala Gln Glu Val Ser Lys
645 650 655
Glu Gln Met Gln Ile Arg Asp Ile Leu Ala Arg Pro Ala Phe Tyr Leu
660 665 670
Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr Leu Lys Lys Gly Leu Thr
675 680 685
Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg Val Ala Val Lys Ala Ile
690 695 700
Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro Gly Gly Ala Val Lys Phe
705 710 715 720
Asn Thr Val Thr Pro Ser Val Thr Gly Arg Trp Phe Ser Gly Asn Gln
725 730 735
Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala Phe Ala Met Ala His Phe
740 745 750
Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg Ala Val Phe Ser Trp Gln
755 760 765
Ile Gln Pro Gly Asp Ser Val Arg Pro Gln Asp Val Gly Phe Val Pro
770 775 780
Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu Arg Gly Gly Asp Gly Gly
785 790 795 800
Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser Leu Ala Ala Trp Ser Val
805 810 815
Met Glu Val Tyr Asn Val Thr Gln Asp Lys Thr Trp Val Ala Glu Met
820 825 830
Tyr Pro Lys Leu Val Ala Tyr His Asp Trp Trp Leu Arg Asn Arg Asp
835 840 845
His Asn Gly Asn Gly Val Pro Glu Tyr Gly Ala Thr Arg Asp Lys Ala
850 855 860
His Asn Thr Glu Ser Gly Glu Met Leu Phe Thr Val Lys Lys Xaa Ser
865 870 875 880
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
885 890 895
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
900 905 910
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
915 920 925
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
930 935 940
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
945 950 955 960
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
965 970 975
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly
980 985 990
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
995 1000 1005
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1010 1015 1020
Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu
1025 1030 1035 1040
Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys
1045 1050 1055
Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser
1060 1065 1070
Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn
1075 1080 1085
Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile
1090 1095 1100
Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln
1105 1110 1115 1120
Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp
1125 1130 1135
Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp
1140 1145 1150
Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala
1155 1160 1165
Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile
1170 1175 1180
Ser Glu Glu Asp Leu
1185
<210> 46
<211> 1189
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkrandomlinkers_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (878)..(879)
<223> Xaa can be any naturally occurring amino acid
<400> 46
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Lys Glu Glu Thr Gln Ser Gly Leu Asn Asn
100 105 110
Tyr Ala Arg Val Val Glu Lys Gly Gln Tyr Asp Ser Leu Glu Ile Pro
115 120 125
Ala Gln Val Ala Ala Ser Trp Glu Ser Gly Arg Asp Asp Ala Ala Val
130 135 140
Phe Gly Phe Ile Asp Lys Glu Gln Leu Asp Lys Tyr Val Ala Asn Gly
145 150 155 160
Gly Lys Arg Ser Asp Trp Thr Val Lys Phe Ala Glu Asn Arg Ser Gln
165 170 175
Asp Gly Thr Leu Leu Gly Tyr Ser Leu Leu Gln Glu Ser Val Asp Gln
180 185 190
Ala Ser Tyr Met Tyr Ser Asp Asn His Tyr Leu Ala Glu Met Ala Thr
195 200 205
Ile Leu Gly Lys Pro Glu Glu Ala Lys Arg Tyr Arg Gln Leu Ala Gln
210 215 220
Gln Leu Ala Asp Tyr Ile Asn Thr Cys Met Phe Asp Pro Thr Thr Gln
225 230 235 240
Phe Tyr Tyr Asp Val Arg Ile Glu Asp Lys Pro Leu Ala Asn Gly Cys
245 250 255
Ala Gly Lys Pro Ile Val Glu Arg Gly Lys Gly Pro Glu Gly Trp Ser
260 265 270
Pro Leu Phe Asn Gly Ala Ala Thr Gln Ala Asn Ala Asp Ala Val Val
275 280 285
Lys Val Met Leu Asp Pro Lys Glu Phe Asn Thr Phe Val Pro Leu Gly
290 295 300
Thr Ala Ala Leu Thr Asn Pro Ala Phe Gly Ala Asp Ile Tyr Trp Arg
305 310 315 320
Gly Arg Val Trp Val Asp Gln Phe Trp Phe Gly Leu Lys Gly Met Glu
325 330 335
Arg Tyr Gly Tyr Arg Asp Asp Ala Leu Lys Leu Ala Asp Thr Phe Phe
340 345 350
Arg His Ala Lys Gly Leu Thr Ala Asp Gly Pro Ile Gln Glu Asn Tyr
355 360 365
Asn Pro Leu Thr Gly Ala Gln Gln Gly Ala Pro Asn Phe Ser Trp Ser
370 375 380
Ala Ala His Leu Tyr Met Leu Tyr Asn Asp Phe Phe Arg Lys Gln Ala
385 390 395 400
Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
405 410 415
Asn Ala Asp Asn Tyr Lys Asn Val Ile Asn Arg Thr Gly Ala Pro Gln
420 425 430
Tyr Met Lys Asp Tyr Asp Tyr Asp Asp His Gln Arg Phe Asn Pro Phe
435 440 445
Phe Asp Leu Gly Ala Trp His Gly His Leu Leu Pro Asp Gly Pro Asn
450 455 460
Thr Met Gly Gly Phe Pro Gly Val Ala Leu Leu Thr Glu Glu Tyr Ile
465 470 475 480
Asn Phe Met Ala Ser Asn Phe Asp Arg Leu Thr Val Trp Gln Asp Gly
485 490 495
Lys Lys Val Asp Phe Thr Leu Glu Ala Tyr Ser Ile Pro Gly Ala Leu
500 505 510
Val Gln Lys Leu Thr Ala Lys Asp Val Gln Val Glu Met Thr Leu Arg
515 520 525
Phe Ala Thr Pro Arg Thr Ser Leu Leu Glu Thr Lys Ile Thr Ser Asn
530 535 540
Lys Pro Leu Asp Leu Val Trp Asp Gly Glu Leu Leu Glu Lys Leu Glu
545 550 555 560
Ala Lys Glu Gly Lys Pro Leu Ser Asp Lys Thr Ile Ala Gly Glu Tyr
565 570 575
Pro Asp Tyr Gln Arg Lys Ile Ser Ala Thr Arg Asp Gly Leu Lys Val
580 585 590
Thr Phe Gly Lys Val Arg Ala Thr Trp Asp Leu Leu Thr Ser Gly Glu
595 600 605
Ser Glu Tyr Gln Val His Lys Ser Leu Pro Val Gln Thr Glu Ile Asn
610 615 620
Gly Asn Arg Phe Thr Ser Lys Ala His Ile Asn Gly Ser Thr Thr Leu
625 630 635 640
Tyr Thr Thr Tyr Ser His Leu Leu Thr Ala Gln Glu Val Ser Lys Glu
645 650 655
Gln Met Gln Ile Arg Asp Ile Leu Ala Arg Pro Ala Phe Tyr Leu Thr
660 665 670
Ala Ser Gln Gln Arg Trp Glu Glu Tyr Leu Lys Lys Gly Leu Thr Asn
675 680 685
Pro Asp Ala Thr Pro Glu Gln Thr Arg Val Ala Val Lys Ala Ile Glu
690 695 700
Thr Leu Asn Gly Asn Trp Arg Ser Pro Gly Gly Ala Val Lys Phe Asn
705 710 715 720
Thr Val Thr Pro Ser Val Thr Gly Arg Trp Phe Ser Gly Asn Gln Thr
725 730 735
Trp Pro Trp Asp Thr Trp Lys Gln Ala Phe Ala Met Ala His Phe Asn
740 745 750
Pro Asp Ile Ala Lys Glu Asn Ile Arg Ala Val Phe Ser Trp Gln Ile
755 760 765
Gln Pro Gly Asp Ser Val Arg Pro Gln Asp Val Gly Phe Val Pro Asp
770 775 780
Leu Ile Ala Trp Asn Leu Ser Pro Glu Arg Gly Gly Asp Gly Gly Asn
785 790 795 800
Trp Asn Glu Arg Asn Thr Lys Pro Ser Leu Ala Ala Trp Ser Val Met
805 810 815
Glu Val Tyr Asn Val Thr Gln Asp Lys Thr Trp Val Ala Glu Met Tyr
820 825 830
Pro Lys Leu Val Ala Tyr His Asp Trp Trp Leu Arg Asn Arg Asp His
835 840 845
Asn Gly Asn Gly Val Pro Glu Tyr Gly Ala Thr Arg Asp Lys Ala His
850 855 860
Asn Thr Glu Ser Gly Glu Met Leu Phe Thr Val Lys Lys Xaa Xaa Ser
865 870 875 880
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
885 890 895
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
900 905 910
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
915 920 925
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
930 935 940
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
945 950 955 960
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
965 970 975
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly
980 985 990
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
995 1000 1005
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1010 1015 1020
Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu
1025 1030 1035 1040
Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys
1045 1050 1055
Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser
1060 1065 1070
Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn
1075 1080 1085
Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile
1090 1095 1100
Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln
1105 1110 1115 1120
Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp
1125 1130 1135
Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp
1140 1145 1150
Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala
1155 1160 1165
Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile
1170 1175 1180
Ser Glu Glu Asp Leu
1185
<210> 47
<211> 1190
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkrandomlinkers_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)..(103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (879)..(880)
<223> Xaa can be any naturally occurring amino acid
<400> 47
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Xaa Lys Glu Glu Thr Gln Ser Gly Leu Asn
100 105 110
Asn Tyr Ala Arg Val Val Glu Lys Gly Gln Tyr Asp Ser Leu Glu Ile
115 120 125
Pro Ala Gln Val Ala Ala Ser Trp Glu Ser Gly Arg Asp Asp Ala Ala
130 135 140
Val Phe Gly Phe Ile Asp Lys Glu Gln Leu Asp Lys Tyr Val Ala Asn
145 150 155 160
Gly Gly Lys Arg Ser Asp Trp Thr Val Lys Phe Ala Glu Asn Arg Ser
165 170 175
Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu Leu Gln Glu Ser Val Asp
180 185 190
Gln Ala Ser Tyr Met Tyr Ser Asp Asn His Tyr Leu Ala Glu Met Ala
195 200 205
Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys Arg Tyr Arg Gln Leu Ala
210 215 220
Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys Met Phe Asp Pro Thr Thr
225 230 235 240
Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp Lys Pro Leu Ala Asn Gly
245 250 255
Cys Ala Gly Lys Pro Ile Val Glu Arg Gly Lys Gly Pro Glu Gly Trp
260 265 270
Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln Ala Asn Ala Asp Ala Val
275 280 285
Val Lys Val Met Leu Asp Pro Lys Glu Phe Asn Thr Phe Val Pro Leu
290 295 300
Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe Gly Ala Asp Ile Tyr Trp
305 310 315 320
Arg Gly Arg Val Trp Val Asp Gln Phe Trp Phe Gly Leu Lys Gly Met
325 330 335
Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu Lys Leu Ala Asp Thr Phe
340 345 350
Phe Arg His Ala Lys Gly Leu Thr Ala Asp Gly Pro Ile Gln Glu Asn
355 360 365
Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly Ala Pro Asn Phe Ser Trp
370 375 380
Ser Ala Ala His Leu Tyr Met Leu Tyr Asn Asp Phe Phe Arg Lys Gln
385 390 395 400
Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
405 410 415
Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile Asn Arg Thr Gly Ala Pro
420 425 430
Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp His Gln Arg Phe Asn Pro
435 440 445
Phe Phe Asp Leu Gly Ala Trp His Gly His Leu Leu Pro Asp Gly Pro
450 455 460
Asn Thr Met Gly Gly Phe Pro Gly Val Ala Leu Leu Thr Glu Glu Tyr
465 470 475 480
Ile Asn Phe Met Ala Ser Asn Phe Asp Arg Leu Thr Val Trp Gln Asp
485 490 495
Gly Lys Lys Val Asp Phe Thr Leu Glu Ala Tyr Ser Ile Pro Gly Ala
500 505 510
Leu Val Gln Lys Leu Thr Ala Lys Asp Val Gln Val Glu Met Thr Leu
515 520 525
Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu Glu Thr Lys Ile Thr Ser
530 535 540
Asn Lys Pro Leu Asp Leu Val Trp Asp Gly Glu Leu Leu Glu Lys Leu
545 550 555 560
Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp Lys Thr Ile Ala Gly Glu
565 570 575
Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala Thr Arg Asp Gly Leu Lys
580 585 590
Val Thr Phe Gly Lys Val Arg Ala Thr Trp Asp Leu Leu Thr Ser Gly
595 600 605
Glu Ser Glu Tyr Gln Val His Lys Ser Leu Pro Val Gln Thr Glu Ile
610 615 620
Asn Gly Asn Arg Phe Thr Ser Lys Ala His Ile Asn Gly Ser Thr Thr
625 630 635 640
Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr Ala Gln Glu Val Ser Lys
645 650 655
Glu Gln Met Gln Ile Arg Asp Ile Leu Ala Arg Pro Ala Phe Tyr Leu
660 665 670
Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr Leu Lys Lys Gly Leu Thr
675 680 685
Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg Val Ala Val Lys Ala Ile
690 695 700
Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro Gly Gly Ala Val Lys Phe
705 710 715 720
Asn Thr Val Thr Pro Ser Val Thr Gly Arg Trp Phe Ser Gly Asn Gln
725 730 735
Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala Phe Ala Met Ala His Phe
740 745 750
Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg Ala Val Phe Ser Trp Gln
755 760 765
Ile Gln Pro Gly Asp Ser Val Arg Pro Gln Asp Val Gly Phe Val Pro
770 775 780
Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu Arg Gly Gly Asp Gly Gly
785 790 795 800
Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser Leu Ala Ala Trp Ser Val
805 810 815
Met Glu Val Tyr Asn Val Thr Gln Asp Lys Thr Trp Val Ala Glu Met
820 825 830
Tyr Pro Lys Leu Val Ala Tyr His Asp Trp Trp Leu Arg Asn Arg Asp
835 840 845
His Asn Gly Asn Gly Val Pro Glu Tyr Gly Ala Thr Arg Asp Lys Ala
850 855 860
His Asn Thr Glu Ser Gly Glu Met Leu Phe Thr Val Lys Lys Xaa Xaa
865 870 875 880
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala
885 890 895
Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val
900 905 910
Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala
915 920 925
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr
930 935 940
Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys
945 950 955 960
Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu
965 970 975
Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly
980 985 990
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
995 1000 1005
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
1010 1015 1020
Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu
1025 1030 1035 1040
Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly
1045 1050 1055
Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val
1060 1065 1070
Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile
1075 1080 1085
Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr
1090 1095 1100
Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys
1105 1110 1115 1120
Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala
1125 1130 1135
Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe
1140 1145 1150
Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln
1155 1160 1165
Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu
1170 1175 1180
Ile Ser Glu Glu Asp Leu
1185 1190
<210> 48
<211> 542
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQC357-C425
<400> 48
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Cys Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Cys Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
450 455 460
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
500 505 510
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 49
<211> 542
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQC358-C488
<400> 49
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Cys Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
450 455 460
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Val Tyr Leu Cys Met Asp Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
500 505 510
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 50
<211> 542
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQC359-C490
<400> 50
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Cys Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
450 455 460
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Val Tyr Leu Gln Met Cys Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
500 505 510
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 51
<211> 544
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQC15-C534
<400> 51
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Cys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
450 455 460
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
500 505 510
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser Gly Cys His His His His His His Glu Pro Glu Ala
530 535 540
<210> 52
<211> 128
<212> PRT
<213> Artificial Sequence
<220>
<223> P.aeruginosa Azurin (PDB 2TSA) M121A mutant protein
<400> 52
Ala Glu Cys Ser Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn
1 5 10 15
Thr Asn Ala Ile Thr Val Asp Lys Ser Cys Lys Gln Phe Thr Val Asn
20 25 30
Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp
35 40 45
Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met
50 55 60
Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val
65 70 75 80
Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr
85 90 95
Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys
100 105 110
Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys
115 120 125
<210> 53
<211> 253
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (34)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (145)
<223> Xaa can be any naturally occurring amino acid
<400> 53
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Cys Ser Val
1 5 10 15
Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr
20 25 30
Val Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser
35 40 45
Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp
50 55 60
Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp
65 70 75 80
Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr
85 90 95
Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr
100 105 110
Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala
115 120 125
Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
130 135 140
Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met Gly
145 150 155 160
His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr
165 170 175
Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp
180 185 190
Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp
195 200 205
Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met
210 215 220
Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu
225 230 235 240
Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250
<210> 54
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (35)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (146)
<223> Xaa can be any naturally occurring amino acid
<400> 54
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Cys Ser
1 5 10 15
Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile
20 25 30
Thr Val Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
35 40 45
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
50 55 60
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
65 70 75 80
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
115 120 125
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
130 135 140
Ser Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met
145 150 155 160
Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val
165 170 175
Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp
180 185 190
Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys
195 200 205
Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr
210 215 220
Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr
225 230 235 240
Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250
<210> 55
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (34)..(35)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (146)
<223> Xaa can be any naturally occurring amino acid
<400> 55
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Cys Ser Val
1 5 10 15
Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr
20 25 30
Val Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
35 40 45
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
50 55 60
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
65 70 75 80
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
115 120 125
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
130 135 140
Ser Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met
145 150 155 160
Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val
165 170 175
Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp
180 185 190
Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys
195 200 205
Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr
210 215 220
Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr
225 230 235 240
Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250
<210> 56
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (34)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (145)..(146)
<223> Xaa can be any naturally occurring amino acid
<400> 56
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Cys Ser Val
1 5 10 15
Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr
20 25 30
Val Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser
35 40 45
Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp
50 55 60
Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp
65 70 75 80
Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr
85 90 95
Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr
100 105 110
Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala
115 120 125
Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
130 135 140
Xaa Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met
145 150 155 160
Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val
165 170 175
Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp
180 185 190
Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys
195 200 205
Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr
210 215 220
Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr
225 230 235 240
Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250
<210> 57
<211> 255
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (34)..(35)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (146)..(147)
<223> Xaa can be any naturally occurring amino acid
<400> 57
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Cys Ser Val
1 5 10 15
Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr
20 25 30
Val Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
35 40 45
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
50 55 60
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
65 70 75 80
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
115 120 125
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
130 135 140
Ser Xaa Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val
145 150 155 160
Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val
165 170 175
Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro
180 185 190
Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu
195 200 205
Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln
210 215 220
Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly
225 230 235 240
Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250 255
<210> 58
<211> 255
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (35)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (146)..(147)
<223> Xaa can be any naturally occurring amino acid
<400> 58
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Cys Ser
1 5 10 15
Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile
20 25 30
Thr Val Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
35 40 45
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
50 55 60
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
65 70 75 80
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
115 120 125
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
130 135 140
Ser Xaa Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val
145 150 155 160
Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val
165 170 175
Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro
180 185 190
Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu
195 200 205
Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln
210 215 220
Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly
225 230 235 240
Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250 255
<210> 59
<211> 255
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (35)..(36)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (147)
<223> Xaa can be any naturally occurring amino acid
<400> 59
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Cys Ser
1 5 10 15
Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile
20 25 30
Thr Val Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr
35 40 45
Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu
50 55 60
Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr
65 70 75 80
Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys
85 90 95
Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala
100 105 110
Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr
115 120 125
Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
130 135 140
Ser Ser Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val
145 150 155 160
Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val
165 170 175
Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro
180 185 190
Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu
195 200 205
Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln
210 215 220
Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly
225 230 235 240
Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250 255
<210> 60
<211> 256
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (35)..(36)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (147)..(148)
<223> Xaa can be any naturally occurring amino acid
<400> 60
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Cys Ser
1 5 10 15
Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile
20 25 30
Thr Val Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr
35 40 45
Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu
50 55 60
Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr
65 70 75 80
Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys
85 90 95
Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala
100 105 110
Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr
115 120 125
Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
130 135 140
Ser Ser Xaa Xaa Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn
145 150 155 160
Val Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly
165 170 175
Val Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys
180 185 190
Pro Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly
195 200 205
Glu Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu
210 215 220
Gln Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys
225 230 235 240
Gly Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250 255
<210> 61
<211> 533
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (123)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (234)
<223> Xaa can be any naturally occurring amino acid
<400> 61
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp Gln
100 105 110
Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Ser Leu Arg Leu Ser
115 120 125
Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe
130 135 140
Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp
145 150 155 160
Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr
165 170 175
Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser
180 185 190
Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg
195 200 205
Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly
210 215 220
Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Val Asn Leu Ser His Pro
225 230 235 240
Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu Ser Thr
245 250 255
Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser Gly Leu
260 265 270
Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala His Thr
275 280 285
Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp Val Ser
290 295 300
Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe Pro Gly
305 310 315 320
His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu Gly Gly
325 330 335
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
340 345 350
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
355 360 365
Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu
370 375 380
Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys
385 390 395 400
Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser
405 410 415
Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn
420 425 430
Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile
435 440 445
Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln
450 455 460
Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp
465 470 475 480
Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp
485 490 495
Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala
500 505 510
Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile
515 520 525
Ser Glu Glu Asp Leu
530
<210> 62
<211> 534
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)..(103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (124)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (235)
<223> Xaa can be any naturally occurring amino acid
<400> 62
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp
100 105 110
Gln Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Ser Leu Arg Leu
115 120 125
Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp
130 135 140
Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr
145 150 155 160
Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe
165 170 175
Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp
180 185 190
Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg
195 200 205
Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp
210 215 220
Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Val Asn Leu Ser His
225 230 235 240
Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu Ser
245 250 255
Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser Gly
260 265 270
Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala His
275 280 285
Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp Val
290 295 300
Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe Pro
305 310 315 320
Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu Gly
325 330 335
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
340 345 350
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
355 360 365
Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu
370 375 380
Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly
385 390 395 400
Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val
405 410 415
Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile
420 425 430
Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr
435 440 445
Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys
450 455 460
Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala
465 470 475 480
Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe
485 490 495
Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln
500 505 510
Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu
515 520 525
Ile Ser Glu Glu Asp Leu
530
<210> 63
<211> 534
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (123)..(124)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (235)
<223> Xaa can be any naturally occurring amino acid
<400> 63
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp Gln
100 105 110
Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Xaa Ser Leu Arg Leu
115 120 125
Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp
130 135 140
Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr
145 150 155 160
Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe
165 170 175
Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp
180 185 190
Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg
195 200 205
Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp
210 215 220
Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Val Asn Leu Ser His
225 230 235 240
Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu Ser
245 250 255
Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser Gly
260 265 270
Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala His
275 280 285
Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp Val
290 295 300
Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe Pro
305 310 315 320
Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu Gly
325 330 335
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
340 345 350
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
355 360 365
Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu
370 375 380
Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly
385 390 395 400
Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val
405 410 415
Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile
420 425 430
Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr
435 440 445
Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys
450 455 460
Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala
465 470 475 480
Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe
485 490 495
Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln
500 505 510
Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu
515 520 525
Ile Ser Glu Glu Asp Leu
530
<210> 64
<211> 534
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (123)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (234)..(235)
<223> Xaa can be any naturally occurring amino acid
<400> 64
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp Gln
100 105 110
Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Ser Leu Arg Leu Ser
115 120 125
Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe
130 135 140
Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp
145 150 155 160
Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr
165 170 175
Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser
180 185 190
Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg
195 200 205
Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly
210 215 220
Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Xaa Val Asn Leu Ser His
225 230 235 240
Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu Ser
245 250 255
Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser Gly
260 265 270
Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala His
275 280 285
Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp Val
290 295 300
Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe Pro
305 310 315 320
Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu Gly
325 330 335
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
340 345 350
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
355 360 365
Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu
370 375 380
Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly
385 390 395 400
Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val
405 410 415
Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile
420 425 430
Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr
435 440 445
Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys
450 455 460
Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala
465 470 475 480
Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe
485 490 495
Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln
500 505 510
Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu
515 520 525
Ile Ser Glu Glu Asp Leu
530
<210> 65
<211> 535
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (123)..(124)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (235)..(236)
<223> Xaa can be any naturally occurring amino acid
<400> 65
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp Gln
100 105 110
Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Xaa Ser Leu Arg Leu
115 120 125
Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp
130 135 140
Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr
145 150 155 160
Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe
165 170 175
Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp
180 185 190
Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg
195 200 205
Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp
210 215 220
Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Xaa Val Asn Leu Ser
225 230 235 240
His Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu
245 250 255
Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser
260 265 270
Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala
275 280 285
His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp
290 295 300
Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe
305 310 315 320
Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu
325 330 335
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
340 345 350
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
355 360 365
Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr
370 375 380
Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn
385 390 395 400
Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe
405 410 415
Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro
420 425 430
Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser
435 440 445
Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val
450 455 460
Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly
465 470 475 480
Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu
485 490 495
Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val
500 505 510
Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys
515 520 525
Leu Ile Ser Glu Glu Asp Leu
530 535
<210> 66
<211> 535
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)..(103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (124)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (235)..(236)
<223> Xaa can be any naturally occurring amino acid
<400> 66
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp
100 105 110
Gln Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Ser Leu Arg Leu
115 120 125
Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp
130 135 140
Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr
145 150 155 160
Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe
165 170 175
Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp
180 185 190
Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg
195 200 205
Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp
210 215 220
Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Xaa Val Asn Leu Ser
225 230 235 240
His Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu
245 250 255
Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser
260 265 270
Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala
275 280 285
His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp
290 295 300
Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe
305 310 315 320
Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu
325 330 335
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
340 345 350
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
355 360 365
Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr
370 375 380
Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn
385 390 395 400
Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe
405 410 415
Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro
420 425 430
Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser
435 440 445
Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val
450 455 460
Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly
465 470 475 480
Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu
485 490 495
Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val
500 505 510
Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys
515 520 525
Leu Ile Ser Glu Glu Asp Leu
530 535
<210> 67
<211> 535
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)..(103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (124)..(125)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (236)
<223> Xaa can be any naturally occurring amino acid
<400> 67
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp
100 105 110
Gln Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Xaa Ser Leu Arg
115 120 125
Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly
130 135 140
Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile
145 150 155 160
Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg
165 170 175
Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met
180 185 190
Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg
195 200 205
Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr
210 215 220
Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Val Asn Leu Ser
225 230 235 240
His Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val Leu
245 250 255
Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser
260 265 270
Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile Ala
275 280 285
His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe Asp
290 295 300
Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr Phe
305 310 315 320
Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser Leu
325 330 335
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
340 345 350
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
355 360 365
Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr
370 375 380
Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn
385 390 395 400
Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe
405 410 415
Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro
420 425 430
Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser
435 440 445
Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val
450 455 460
Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly
465 470 475 480
Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu
485 490 495
Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val
500 505 510
Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys
515 520 525
Leu Ile Ser Glu Glu Asp Leu
530 535
<210> 68
<211> 536
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinQconnection library_Aga2p_ACP protein sequence
<220>
<221> MISC_FEATURE
<222> (102)..(103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (124)..(125)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (236)..(237)
<223> Xaa can be any naturally occurring amino acid
<400> 68
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Xaa Xaa Cys Ser Val Asp Ile Gln Gly Asn Asp
100 105 110
Gln Met Gln Phe Asn Thr Asn Ala Ile Thr Val Xaa Xaa Ser Leu Arg
115 120 125
Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly
130 135 140
Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile
145 150 155 160
Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg
165 170 175
Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met
180 185 190
Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg
195 200 205
Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr
210 215 220
Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Xaa Xaa Val Asn Leu
225 230 235 240
Ser His Pro Gly Asn Leu Pro Lys Asn Val Met Gly His Asn Trp Val
245 250 255
Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala
260 265 270
Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Ser Arg Val Ile
275 280 285
Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys Asp Ser Val Thr Phe
290 295 300
Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr Met Phe Phe Cys Thr
305 310 315 320
Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr Leu Thr Leu Lys Ser
325 330 335
Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
340 345 350
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
355 360 365
Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro
370 375 380
Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala
385 390 395 400
Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr
405 410 415
Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser
420 425 430
Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met
435 440 445
Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly
450 455 460
Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu
465 470 475 480
Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu
485 490 495
Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr
500 505 510
Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln
515 520 525
Lys Leu Ile Ser Glu Glu Asp Leu
530 535
<210> 69
<211> 726
<212> PRT
<213> Bacteroides thetaiotaomicron
<400> 69
Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr Phe
1 5 10 15
Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn
20 25 30
Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu
35 40 45
Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu Thr
50 55 60
Lys Leu Asp Ser Lys Thr Asn Leu Tyr Asp Gly Phe Glu Val Lys Asp
65 70 75 80
Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu
85 90 95
Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr
100 105 110
Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn
115 120 125
Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn
130 135 140
Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp
145 150 155 160
His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp
165 170 175
Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala
180 185 190
Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln
195 200 205
Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His
210 215 220
Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp
225 230 235 240
Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp
245 250 255
Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile
260 265 270
Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn
275 280 285
Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro
290 295 300
Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser
305 310 315 320
Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp
325 330 335
Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn
340 345 350
Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val
355 360 365
Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser
370 375 380
Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val
385 390 395 400
Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met
405 410 415
His His Glu Thr Ser Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp
420 425 430
Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser
435 440 445
Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln
450 455 460
Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr
465 470 475 480
Lys Ile Met Val Asn Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys
485 490 495
Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu
500 505 510
Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro
515 520 525
Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe
530 535 540
Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg
545 550 555 560
Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro
565 570 575
Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp
580 585 590
Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn
595 600 605
Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala
610 615 620
Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly
625 630 635 640
His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr
645 650 655
Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn
660 665 670
Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys
675 680 685
Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys
690 695 700
Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu Lys Arg Leu Leu Glu
705 710 715 720
His His His His His His
725
<210> 70
<211> 850
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207SusBrandomlinkers Megabody library protein sequences
<220>
<221> MISC_FEATURE
<222> (16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (85)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (197)
<223> Xaa can be any naturally occurring amino acid
<400> 70
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa
1 5 10 15
Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr Phe
20 25 30
Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn
35 40 45
Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu
50 55 60
Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu Thr
65 70 75 80
Lys Leu Asp Ser Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser
85 90 95
Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro
100 105 110
Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser
115 120 125
Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp
130 135 140
Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu
145 150 155 160
Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu
165 170 175
Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln
180 185 190
Val Thr Val Ser Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala Thr Phe
195 200 205
Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile Arg Asn
210 215 220
His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn Asp Arg
225 230 235 240
Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg
245 250 255
Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu
260 265 270
Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe Trp Ile
275 280 285
Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu
290 295 300
Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn Ser Ser
305 310 315 320
Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met Met Lys
325 330 335
Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu Val Asp
340 345 350
Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val Phe Glu
355 360 365
Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr
370 375 380
Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp Ala Arg
385 390 395 400
Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys
405 410 415
Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile Gly Val
420 425 430
Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu
435 440 445
Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro
450 455 460
Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp
465 470 475 480
Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly Trp Asn
485 490 495
Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp
500 505 510
Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His Arg Tyr
515 520 525
Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr Ser Ala
530 535 540
Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln Phe Met
545 550 555 560
Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly Asn Ile
565 570 575
Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn His Tyr
580 585 590
Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val Asn Ala
595 600 605
His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu
610 615 620
Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly
625 630 635 640
Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu Val Gly
645 650 655
Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys Asn Lys
660 665 670
Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala Arg Gln
675 680 685
Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala Ala Asp
690 695 700
Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe Ile Lys
705 710 715 720
Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro
725 730 735
Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp
740 745 750
Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys Leu Val
755 760 765
Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala
770 775 780
Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile
785 790 795 800
Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His Ala Ala
805 810 815
Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp Lys Ser
820 825 830
Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His Glu Pro
835 840 845
Glu Ala
850
<210> 71
<211> 851
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207SusBrandomlinkers Megabody library protein sequences
<220>
<221> MISC_FEATURE
<222> (16)..(17)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (86)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (198)
<223> Xaa can be any naturally occurring amino acid
<400> 71
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa
1 5 10 15
Xaa Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr
20 25 30
Phe Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys
35 40 45
Asn Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys
50 55 60
Glu Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu
65 70 75 80
Thr Lys Leu Asp Ser Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala
85 90 95
Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala
100 105 110
Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly
115 120 125
Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg
130 135 140
Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro
145 150 155 160
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr
165 170 175
Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr
180 185 190
Gln Val Thr Val Ser Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala Thr
195 200 205
Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile Arg
210 215 220
Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn Asp
225 230 235 240
Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe
245 250 255
Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys
260 265 270
Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe Trp
275 280 285
Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg
290 295 300
Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn Ser
305 310 315 320
Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met Met
325 330 335
Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu Val
340 345 350
Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val Phe
355 360 365
Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln
370 375 380
Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp Ala
385 390 395 400
Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys
405 410 415
Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile Gly
420 425 430
Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp
435 440 445
Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys
450 455 460
Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile
465 470 475 480
Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly Trp
485 490 495
Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe
500 505 510
Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His Arg
515 520 525
Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr Ser
530 535 540
Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln Phe
545 550 555 560
Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly Asn
565 570 575
Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn His
580 585 590
Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val Asn
595 600 605
Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn
610 615 620
Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly
625 630 635 640
Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu Val
645 650 655
Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys Asn
660 665 670
Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala Arg
675 680 685
Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala Ala
690 695 700
Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe Ile
705 710 715 720
Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu
725 730 735
Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp
740 745 750
Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys Leu
755 760 765
Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr
770 775 780
Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr
785 790 795 800
Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His Ala
805 810 815
Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp Lys
820 825 830
Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His Glu
835 840 845
Pro Glu Ala
850
<210> 72
<211> 851
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207SusBrandomlinkers Megabody library protein sequences
<220>
<221> MISC_FEATURE
<222> (16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (85)..(86)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (198)
<223> Xaa can be any naturally occurring amino acid
<400> 72
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa
1 5 10 15
Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr Phe
20 25 30
Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn
35 40 45
Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu
50 55 60
Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu Thr
65 70 75 80
Lys Leu Asp Ser Xaa Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala
85 90 95
Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala
100 105 110
Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly
115 120 125
Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg
130 135 140
Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro
145 150 155 160
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr
165 170 175
Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr
180 185 190
Gln Val Thr Val Ser Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala Thr
195 200 205
Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile Arg
210 215 220
Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn Asp
225 230 235 240
Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe
245 250 255
Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys
260 265 270
Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe Trp
275 280 285
Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg
290 295 300
Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn Ser
305 310 315 320
Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met Met
325 330 335
Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu Val
340 345 350
Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val Phe
355 360 365
Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln
370 375 380
Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp Ala
385 390 395 400
Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys
405 410 415
Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile Gly
420 425 430
Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp
435 440 445
Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys
450 455 460
Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile
465 470 475 480
Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly Trp
485 490 495
Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe
500 505 510
Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His Arg
515 520 525
Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr Ser
530 535 540
Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln Phe
545 550 555 560
Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly Asn
565 570 575
Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn His
580 585 590
Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val Asn
595 600 605
Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn
610 615 620
Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly
625 630 635 640
Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu Val
645 650 655
Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys Asn
660 665 670
Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala Arg
675 680 685
Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala Ala
690 695 700
Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe Ile
705 710 715 720
Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu
725 730 735
Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp
740 745 750
Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys Leu
755 760 765
Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr
770 775 780
Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr
785 790 795 800
Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His Ala
805 810 815
Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp Lys
820 825 830
Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His Glu
835 840 845
Pro Glu Ala
850
<210> 73
<211> 851
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207SusBrandomlinkers Megabody library protein sequences
<220>
<221> MISC_FEATURE
<222> (16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (85)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (197)..(198)
<223> Xaa can be any naturally occurring amino acid
<400> 73
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa
1 5 10 15
Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr Phe
20 25 30
Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn
35 40 45
Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu
50 55 60
Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu Thr
65 70 75 80
Lys Leu Asp Ser Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser
85 90 95
Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro
100 105 110
Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser
115 120 125
Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp
130 135 140
Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu
145 150 155 160
Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu
165 170 175
Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln
180 185 190
Val Thr Val Ser Xaa Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala Thr
195 200 205
Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile Arg
210 215 220
Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn Asp
225 230 235 240
Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe
245 250 255
Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys
260 265 270
Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe Trp
275 280 285
Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg
290 295 300
Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn Ser
305 310 315 320
Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met Met
325 330 335
Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu Val
340 345 350
Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val Phe
355 360 365
Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln
370 375 380
Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp Ala
385 390 395 400
Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys
405 410 415
Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile Gly
420 425 430
Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp
435 440 445
Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys
450 455 460
Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile
465 470 475 480
Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly Trp
485 490 495
Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe
500 505 510
Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His Arg
515 520 525
Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr Ser
530 535 540
Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln Phe
545 550 555 560
Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly Asn
565 570 575
Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn His
580 585 590
Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val Asn
595 600 605
Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn
610 615 620
Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly
625 630 635 640
Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu Val
645 650 655
Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys Asn
660 665 670
Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala Arg
675 680 685
Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala Ala
690 695 700
Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe Ile
705 710 715 720
Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu
725 730 735
Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp
740 745 750
Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys Leu
755 760 765
Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr
770 775 780
Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr
785 790 795 800
Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His Ala
805 810 815
Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp Lys
820 825 830
Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His Glu
835 840 845
Pro Glu Ala
850
<210> 74
<211> 852
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207SusBrandomlinkers Megabody library protein sequences
<220>
<221> MISC_FEATURE
<222> (16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (85)..(86)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (198)..(199)
<223> Xaa can be any naturally occurring amino acid
<400> 74
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa
1 5 10 15
Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr Phe
20 25 30
Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn
35 40 45
Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu
50 55 60
Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu Thr
65 70 75 80
Lys Leu Asp Ser Xaa Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala
85 90 95
Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala
100 105 110
Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly
115 120 125
Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg
130 135 140
Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro
145 150 155 160
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr
165 170 175
Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr
180 185 190
Gln Val Thr Val Ser Xaa Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala
195 200 205
Thr Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile
210 215 220
Arg Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn
225 230 235 240
Asp Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly
245 250 255
Phe Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile
260 265 270
Lys Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe
275 280 285
Trp Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser
290 295 300
Arg Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn
305 310 315 320
Ser Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met
325 330 335
Met Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu
340 345 350
Val Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val
355 360 365
Phe Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met
370 375 380
Gln Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp
385 390 395 400
Ala Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro
405 410 415
Cys Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile
420 425 430
Gly Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr
435 440 445
Asp Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr
450 455 460
Lys Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr
465 470 475 480
Ile Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly
485 490 495
Trp Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val
500 505 510
Phe Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His
515 520 525
Arg Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr
530 535 540
Ser Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln
545 550 555 560
Phe Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly
565 570 575
Asn Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn
580 585 590
His Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val
595 600 605
Asn Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro
610 615 620
Asn Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe
625 630 635 640
Gly Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu
645 650 655
Val Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys
660 665 670
Asn Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala
675 680 685
Arg Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala
690 695 700
Ala Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe
705 710 715 720
Ile Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala
725 730 735
Glu Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp
740 745 750
Asp Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys
755 760 765
Leu Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val
770 775 780
Tyr Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr
785 790 795 800
Thr Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His
805 810 815
Ala Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp
820 825 830
Lys Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His
835 840 845
Glu Pro Glu Ala
850
<210> 75
<211> 852
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207SusBrandomlinkers Megabody library protein sequences
<220>
<221> MISC_FEATURE
<222> (16)..(17)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (86)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (198)..(199)
<223> Xaa can be any naturally occurring amino acid
<400> 75
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa
1 5 10 15
Xaa Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr
20 25 30
Phe Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys
35 40 45
Asn Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys
50 55 60
Glu Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu
65 70 75 80
Thr Lys Leu Asp Ser Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala
85 90 95
Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala
100 105 110
Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly
115 120 125
Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg
130 135 140
Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro
145 150 155 160
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr
165 170 175
Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr
180 185 190
Gln Val Thr Val Ser Xaa Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala
195 200 205
Thr Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile
210 215 220
Arg Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn
225 230 235 240
Asp Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly
245 250 255
Phe Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile
260 265 270
Lys Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe
275 280 285
Trp Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser
290 295 300
Arg Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn
305 310 315 320
Ser Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met
325 330 335
Met Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu
340 345 350
Val Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val
355 360 365
Phe Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met
370 375 380
Gln Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp
385 390 395 400
Ala Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro
405 410 415
Cys Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile
420 425 430
Gly Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr
435 440 445
Asp Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr
450 455 460
Lys Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr
465 470 475 480
Ile Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly
485 490 495
Trp Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val
500 505 510
Phe Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His
515 520 525
Arg Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr
530 535 540
Ser Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln
545 550 555 560
Phe Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly
565 570 575
Asn Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn
580 585 590
His Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val
595 600 605
Asn Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro
610 615 620
Asn Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe
625 630 635 640
Gly Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu
645 650 655
Val Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys
660 665 670
Asn Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala
675 680 685
Arg Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala
690 695 700
Ala Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe
705 710 715 720
Ile Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala
725 730 735
Glu Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp
740 745 750
Asp Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys
755 760 765
Leu Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val
770 775 780
Tyr Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr
785 790 795 800
Thr Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His
805 810 815
Ala Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp
820 825 830
Lys Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His
835 840 845
Glu Pro Glu Ala
850
<210> 76
<211> 852
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207SusBrandomlinkers Megabody library protein sequences
<220>
<221> MISC_FEATURE
<222> (16)..(17)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (86)..(87)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (199)
<223> Xaa can be any naturally occurring amino acid
<400> 76
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa
1 5 10 15
Xaa Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr
20 25 30
Phe Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys
35 40 45
Asn Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys
50 55 60
Glu Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu
65 70 75 80
Thr Lys Leu Asp Ser Xaa Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala
85 90 95
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
100 105 110
Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val
115 120 125
Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser
130 135 140
Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys
145 150 155 160
Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe
165 170 175
Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly
180 185 190
Thr Gln Val Thr Val Ser Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala
195 200 205
Thr Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu Ile
210 215 220
Arg Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met Asn
225 230 235 240
Asp Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly
245 250 255
Phe Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile
260 265 270
Lys Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala Phe
275 280 285
Trp Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser
290 295 300
Arg Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro Asn
305 310 315 320
Ser Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu Met
325 330 335
Met Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala Leu
340 345 350
Val Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met Val
355 360 365
Phe Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met
370 375 380
Gln Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp Asp
385 390 395 400
Ala Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro
405 410 415
Cys Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr Ile
420 425 430
Gly Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr
435 440 445
Asp Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr
450 455 460
Lys Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr
465 470 475 480
Ile Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu Gly
485 490 495
Trp Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val
500 505 510
Phe Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile His
515 520 525
Arg Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu Thr
530 535 540
Ser Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr Gln
545 550 555 560
Phe Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly
565 570 575
Asn Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn Asn
580 585 590
His Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met Val
595 600 605
Asn Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro
610 615 620
Asn Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe
625 630 635 640
Gly Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg Leu
645 650 655
Val Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His Cys
660 665 670
Asn Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile Ala
675 680 685
Arg Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met Ala
690 695 700
Ala Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe
705 710 715 720
Ile Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala
725 730 735
Glu Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp
740 745 750
Asp Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser Lys
755 760 765
Leu Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val
770 775 780
Tyr Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr
785 790 795 800
Thr Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu His
805 810 815
Ala Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp
820 825 830
Lys Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His His
835 840 845
Glu Pro Glu Ala
850
<210> 77
<211> 853
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207SusBrandomlinkers Megabody library protein sequences
<220>
<221> MISC_FEATURE
<222> (16)..(17)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (86)..(87)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (199)..(200)
<223> Xaa can be any naturally occurring amino acid
<400> 77
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Ser Xaa
1 5 10 15
Xaa Met Gln Gln Lys Leu Thr Ser Pro Asp Asn Asn Leu Val Met Thr
20 25 30
Phe Gln Val Asp Ser Lys Gly Ala Pro Thr Tyr Glu Leu Thr Tyr Lys
35 40 45
Asn Lys Val Val Ile Lys Pro Ser Thr Leu Gly Leu Glu Leu Lys Lys
50 55 60
Glu Asp Asn Thr Arg Thr Asp Phe Asp Trp Val Asp Arg Arg Asp Leu
65 70 75 80
Thr Lys Leu Asp Ser Xaa Xaa Gly Gly Ser Leu Arg Leu Ser Cys Ala
85 90 95
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
100 105 110
Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val
115 120 125
Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser
130 135 140
Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys
145 150 155 160
Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe
165 170 175
Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly
180 185 190
Thr Gln Val Thr Val Ser Xaa Xaa Phe Glu Val Lys Asp Thr Gln Thr
195 200 205
Ala Thr Phe Asp Glu Thr Trp Gln Pro Val Trp Gly Glu Glu Lys Glu
210 215 220
Ile Arg Asn His Tyr Asn Glu Leu Ala Val Thr Leu Tyr Gln Pro Met
225 230 235 240
Asn Asp Arg Ser Ile Val Ile Arg Phe Arg Leu Phe Asn Asp Gly Leu
245 250 255
Gly Phe Arg Tyr Glu Phe Pro Gln Gln Lys Ser Leu Asn Tyr Phe Val
260 265 270
Ile Lys Glu Glu His Ser Gln Phe Gly Met Asn Gly Asp His Ile Ala
275 280 285
Phe Trp Ile Pro Gly Asp Tyr Asp Thr Gln Glu Tyr Asp Tyr Thr Ile
290 295 300
Ser Arg Leu Ser Glu Ile Arg Gly Leu Met Lys Glu Ala Ile Thr Pro
305 310 315 320
Asn Ser Ser Gln Thr Pro Phe Ser Gln Thr Gly Val Gln Thr Ala Leu
325 330 335
Met Met Lys Thr Asp Asp Gly Leu Tyr Ile Asn Leu His Glu Ala Ala
340 345 350
Leu Val Asp Tyr Ser Cys Met His Leu Asn Leu Asp Asp Lys Asn Met
355 360 365
Val Phe Glu Ser Trp Leu Thr Pro Asp Ala Lys Gly Asp Lys Gly Tyr
370 375 380
Met Gln Thr Pro Cys Asn Thr Pro Trp Arg Thr Ile Ile Val Ser Asp
385 390 395 400
Asp Ala Arg Asn Ile Leu Ala Ser Arg Ile Thr Leu Asn Leu Asn Glu
405 410 415
Pro Cys Lys Ile Ala Asp Ala Ala Ser Trp Val Lys Pro Val Lys Tyr
420 425 430
Ile Gly Val Trp Trp Asp Met Ile Thr Gly Lys Gly Ser Trp Ala Tyr
435 440 445
Thr Asp Glu Leu Thr Ser Val Lys Leu Gly Glu Thr Asp Tyr Ser Lys
450 455 460
Thr Lys Pro Asn Gly Lys His Ser Ala Asn Thr Ala Asn Val Lys Arg
465 470 475 480
Tyr Ile Asp Phe Ala Ala Ala His Gly Phe Asp Ala Val Leu Val Glu
485 490 495
Gly Trp Asn Glu Gly Trp Glu Asp Trp Phe Gly Asn Ser Lys Asp Tyr
500 505 510
Val Phe Asp Phe Val Thr Pro Tyr Pro Asp Phe Asp Val Lys Glu Ile
515 520 525
His Arg Tyr Ala Ala Arg Lys Gly Ile Lys Met Met Met His His Glu
530 535 540
Thr Ser Ala Ser Val Arg Asn Tyr Glu Arg His Met Asp Lys Ala Tyr
545 550 555 560
Gln Phe Met Ala Asp Asn Gly Tyr Asn Ser Val Lys Ser Gly Tyr Val
565 570 575
Gly Asn Ile Ile Pro Arg Gly Glu His His Tyr Gly Gln Trp Met Asn
580 585 590
Asn His Tyr Leu Tyr Ala Val Lys Lys Ala Ala Asp Tyr Lys Ile Met
595 600 605
Val Asn Ala His Glu Ala Thr Arg Pro Thr Gly Ile Cys Arg Thr Tyr
610 615 620
Pro Asn Leu Ile Gly Asn Glu Ser Ala Arg Gly Thr Glu Tyr Glu Ser
625 630 635 640
Phe Gly Gly Asn Lys Val Tyr His Thr Thr Ile Leu Pro Phe Thr Arg
645 650 655
Leu Val Gly Gly Pro Met Asp Tyr Thr Pro Gly Ile Phe Glu Thr His
660 665 670
Cys Asn Lys Met Asn Pro Ala Asn Asn Ser Gln Val Arg Ser Thr Ile
675 680 685
Ala Arg Gln Leu Ala Leu Tyr Val Thr Met Tyr Ser Pro Leu Gln Met
690 695 700
Ala Ala Asp Ile Pro Glu Asn Tyr Glu Arg Phe Met Asp Ala Phe Gln
705 710 715 720
Phe Ile Lys Asp Val Ala Leu Asp Trp Asp Glu Thr Asn Tyr Leu Glu
725 730 735
Ala Glu Pro Gly Glu Tyr Ile Thr Ile Ala Arg Lys Ala Lys Asp Thr
740 745 750
Asp Asp Trp Tyr Val Gly Cys Thr Ala Gly Glu Asn Gly His Thr Ser
755 760 765
Lys Leu Val Phe Asp Phe Leu Thr Pro Gly Lys Gln Tyr Ile Ala Thr
770 775 780
Val Tyr Ala Asp Ala Lys Asp Ala Asp Trp Lys Glu Asn Pro Gln Ala
785 790 795 800
Tyr Thr Ile Lys Lys Gly Ile Leu Thr Asn Lys Ser Lys Leu Asn Leu
805 810 815
His Ala Ala Asn Gly Gly Gly Tyr Ala Ile Ser Ile Lys Glu Val Lys
820 825 830
Asp Lys Ser Glu Ala Lys Gly Leu Lys Arg Leu His His His His His
835 840 845
His Glu Pro Glu Ala
850
<210> 78
<211> 1130
<212> PRT
<213> Artificial Sequence
<220>
<223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein
seuqences
<220>
<221> MISC_FEATURE
<222> (105)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (174)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (286)
<223> Xaa can be any naturally occurring amino acid
<400> 78
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Ser Xaa Met Gln Gln Lys Leu Thr Ser
100 105 110
Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly Ala
115 120 125
Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro Ser
130 135 140
Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp Phe
145 150 155 160
Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Gly Gly
165 170 175
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala
180 185 190
Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val
195 200 205
Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala
210 215 220
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr
225 230 235 240
Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys
245 250 255
Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu
260 265 270
Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Phe Glu
275 280 285
Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln Pro Val
290 295 300
Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu Ala Val
305 310 315 320
Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg Phe Arg
325 330 335
Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln Gln Lys
340 345 350
Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe Gly Met
355 360 365
Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp Thr Gln
370 375 380
Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly Leu Met
385 390 395 400
Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser Gln Thr
405 410 415
Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu Tyr Ile
420 425 430
Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His Leu Asn
435 440 445
Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro Asp Ala
450 455 460
Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro Trp Arg
465 470 475 480
Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser Arg Ile
485 490 495
Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala Ser Trp
500 505 510
Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile Thr Gly
515 520 525
Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys Leu Gly
530 535 540
Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser Ala Asn
545 550 555 560
Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His Gly Phe
565 570 575
Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp Trp Phe
580 585 590
Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr Pro Asp
595 600 605
Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly Ile Lys
610 615 620
Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr Glu Arg
625 630 635 640
His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr Asn Ser
645 650 655
Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu His His
660 665 670
Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys Lys Ala
675 680 685
Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg Pro Thr
690 695 700
Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser Ala Arg
705 710 715 720
Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His Thr Thr
725 730 735
Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr Thr Pro
740 745 750
Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn Asn Ser
755 760 765
Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val Thr Met
770 775 780
Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr Glu Arg
785 790 795 800
Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp Trp Asp
805 810 815
Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr Ile Ala
820 825 830
Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr Ala Gly
835 840 845
Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr Pro Gly
850 855 860
Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala Asp Trp
865 870 875 880
Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu Thr Asn
885 890 895
Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr Ala Ile
900 905 910
Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu Lys Arg
915 920 925
Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
930 935 940
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
945 950 955 960
Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro
965 970 975
Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile
980 985 990
Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser
995 1000 1005
Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys
1010 1015 1020
Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr
1025 1030 1035 1040
Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln
1045 1050 1055
Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu
1060 1065 1070
Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu
1075 1080 1085
Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile
1090 1095 1100
Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser
1105 1110 1115 1120
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1125 1130
<210> 79
<211> 1131
<212> PRT
<213> Artificial Sequence
<220>
<223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein
seuqences
<220>
<221> MISC_FEATURE
<222> (105)..(106)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (175)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (287)
<223> Xaa can be any naturally occurring amino acid
<400> 79
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Ser Xaa Xaa Met Gln Gln Lys Leu Thr
100 105 110
Ser Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly
115 120 125
Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro
130 135 140
Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp
145 150 155 160
Phe Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Gly
165 170 175
Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr
180 185 190
Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe
195 200 205
Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser
210 215 220
Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val
225 230 235 240
Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
245 250 255
Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn
260 265 270
Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Phe
275 280 285
Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln Pro
290 295 300
Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu Ala
305 310 315 320
Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg Phe
325 330 335
Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln Gln
340 345 350
Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe Gly
355 360 365
Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp Thr
370 375 380
Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly Leu
385 390 395 400
Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser Gln
405 410 415
Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu Tyr
420 425 430
Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His Leu
435 440 445
Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro Asp
450 455 460
Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro Trp
465 470 475 480
Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser Arg
485 490 495
Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala Ser
500 505 510
Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile Thr
515 520 525
Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys Leu
530 535 540
Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser Ala
545 550 555 560
Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His Gly
565 570 575
Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp Trp
580 585 590
Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr Pro
595 600 605
Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly Ile
610 615 620
Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr Glu
625 630 635 640
Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr Asn
645 650 655
Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu His
660 665 670
His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys Lys
675 680 685
Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg Pro
690 695 700
Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser Ala
705 710 715 720
Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His Thr
725 730 735
Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr Thr
740 745 750
Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn Asn
755 760 765
Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val Thr
770 775 780
Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr Glu
785 790 795 800
Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp Trp
805 810 815
Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr Ile
820 825 830
Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr Ala
835 840 845
Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr Pro
850 855 860
Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala Asp
865 870 875 880
Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu Thr
885 890 895
Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr Ala
900 905 910
Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu Lys
915 920 925
Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
930 935 940
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
945 950 955 960
Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile
965 970 975
Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr
980 985 990
Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys
995 1000 1005
Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser
1010 1015 1020
Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser
1025 1030 1035 1040
Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu
1045 1050 1055
Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val
1060 1065 1070
Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala
1075 1080 1085
Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys
1090 1095 1100
Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala
1105 1110 1115 1120
Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1125 1130
<210> 80
<211> 1131
<212> PRT
<213> Artificial Sequence
<220>
<223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein
seuqences
<220>
<221> MISC_FEATURE
<222> (105)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (174)..(175)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (287)
<223> Xaa can be any naturally occurring amino acid
<400> 80
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Ser Xaa Met Gln Gln Lys Leu Thr Ser
100 105 110
Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly Ala
115 120 125
Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro Ser
130 135 140
Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp Phe
145 150 155 160
Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Xaa Gly
165 170 175
Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr
180 185 190
Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe
195 200 205
Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser
210 215 220
Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val
225 230 235 240
Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
245 250 255
Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn
260 265 270
Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Phe
275 280 285
Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln Pro
290 295 300
Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu Ala
305 310 315 320
Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg Phe
325 330 335
Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln Gln
340 345 350
Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe Gly
355 360 365
Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp Thr
370 375 380
Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly Leu
385 390 395 400
Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser Gln
405 410 415
Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu Tyr
420 425 430
Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His Leu
435 440 445
Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro Asp
450 455 460
Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro Trp
465 470 475 480
Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser Arg
485 490 495
Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala Ser
500 505 510
Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile Thr
515 520 525
Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys Leu
530 535 540
Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser Ala
545 550 555 560
Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His Gly
565 570 575
Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp Trp
580 585 590
Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr Pro
595 600 605
Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly Ile
610 615 620
Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr Glu
625 630 635 640
Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr Asn
645 650 655
Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu His
660 665 670
His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys Lys
675 680 685
Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg Pro
690 695 700
Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser Ala
705 710 715 720
Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His Thr
725 730 735
Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr Thr
740 745 750
Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn Asn
755 760 765
Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val Thr
770 775 780
Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr Glu
785 790 795 800
Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp Trp
805 810 815
Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr Ile
820 825 830
Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr Ala
835 840 845
Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr Pro
850 855 860
Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala Asp
865 870 875 880
Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu Thr
885 890 895
Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr Ala
900 905 910
Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu Lys
915 920 925
Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
930 935 940
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
945 950 955 960
Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile
965 970 975
Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr
980 985 990
Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys
995 1000 1005
Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser
1010 1015 1020
Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser
1025 1030 1035 1040
Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu
1045 1050 1055
Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val
1060 1065 1070
Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala
1075 1080 1085
Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys
1090 1095 1100
Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala
1105 1110 1115 1120
Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1125 1130
<210> 81
<211> 1131
<212> PRT
<213> Artificial Sequence
<220>
<223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein
seuqences
<220>
<221> MISC_FEATURE
<222> (105)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (174)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (286)..(287)
<223> Xaa can be any naturally occurring amino acid
<400> 81
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Ser Xaa Met Gln Gln Lys Leu Thr Ser
100 105 110
Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly Ala
115 120 125
Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro Ser
130 135 140
Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp Phe
145 150 155 160
Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Gly Gly
165 170 175
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala
180 185 190
Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val
195 200 205
Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala
210 215 220
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr
225 230 235 240
Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys
245 250 255
Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu
260 265 270
Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Xaa Phe
275 280 285
Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln Pro
290 295 300
Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu Ala
305 310 315 320
Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg Phe
325 330 335
Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln Gln
340 345 350
Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe Gly
355 360 365
Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp Thr
370 375 380
Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly Leu
385 390 395 400
Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser Gln
405 410 415
Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu Tyr
420 425 430
Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His Leu
435 440 445
Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro Asp
450 455 460
Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro Trp
465 470 475 480
Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser Arg
485 490 495
Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala Ser
500 505 510
Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile Thr
515 520 525
Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys Leu
530 535 540
Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser Ala
545 550 555 560
Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His Gly
565 570 575
Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp Trp
580 585 590
Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr Pro
595 600 605
Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly Ile
610 615 620
Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr Glu
625 630 635 640
Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr Asn
645 650 655
Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu His
660 665 670
His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys Lys
675 680 685
Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg Pro
690 695 700
Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser Ala
705 710 715 720
Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His Thr
725 730 735
Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr Thr
740 745 750
Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn Asn
755 760 765
Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val Thr
770 775 780
Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr Glu
785 790 795 800
Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp Trp
805 810 815
Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr Ile
820 825 830
Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr Ala
835 840 845
Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr Pro
850 855 860
Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala Asp
865 870 875 880
Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu Thr
885 890 895
Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr Ala
900 905 910
Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu Lys
915 920 925
Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
930 935 940
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
945 950 955 960
Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile
965 970 975
Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr
980 985 990
Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys
995 1000 1005
Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser
1010 1015 1020
Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser
1025 1030 1035 1040
Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu
1045 1050 1055
Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val
1060 1065 1070
Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala
1075 1080 1085
Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys
1090 1095 1100
Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala
1105 1110 1115 1120
Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1125 1130
<210> 82
<211> 1132
<212> PRT
<213> Artificial Sequence
<220>
<223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein
seuqences
<220>
<221> MISC_FEATURE
<222> (105)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (174)..(175)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (287)..(288)
<223> Xaa can be any naturally occurring amino acid
<400> 82
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Ser Xaa Met Gln Gln Lys Leu Thr Ser
100 105 110
Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly Ala
115 120 125
Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro Ser
130 135 140
Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp Phe
145 150 155 160
Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Xaa Gly
165 170 175
Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr
180 185 190
Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe
195 200 205
Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser
210 215 220
Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val
225 230 235 240
Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
245 250 255
Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn
260 265 270
Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Xaa
275 280 285
Phe Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln
290 295 300
Pro Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu
305 310 315 320
Ala Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg
325 330 335
Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln
340 345 350
Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe
355 360 365
Gly Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp
370 375 380
Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly
385 390 395 400
Leu Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser
405 410 415
Gln Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu
420 425 430
Tyr Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His
435 440 445
Leu Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro
450 455 460
Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro
465 470 475 480
Trp Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser
485 490 495
Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala
500 505 510
Ser Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile
515 520 525
Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys
530 535 540
Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser
545 550 555 560
Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His
565 570 575
Gly Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp
580 585 590
Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr
595 600 605
Pro Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly
610 615 620
Ile Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr
625 630 635 640
Glu Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr
645 650 655
Asn Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu
660 665 670
His His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys
675 680 685
Lys Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg
690 695 700
Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser
705 710 715 720
Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His
725 730 735
Thr Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr
740 745 750
Thr Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn
755 760 765
Asn Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val
770 775 780
Thr Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr
785 790 795 800
Glu Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp
805 810 815
Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr
820 825 830
Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr
835 840 845
Ala Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr
850 855 860
Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala
865 870 875 880
Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu
885 890 895
Thr Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr
900 905 910
Ala Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu
915 920 925
Lys Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
930 935 940
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
945 950 955 960
Gly Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln
965 970 975
Ile Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr
980 985 990
Thr Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr
995 1000 1005
Lys Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr
1010 1015 1020
Ser Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser
1025 1030 1035 1040
Ser Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly
1045 1050 1055
Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe
1060 1065 1070
Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met
1075 1080 1085
Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu
1090 1095 1100
Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln
1105 1110 1115 1120
Ala Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1125 1130
<210> 83
<211> 1132
<212> PRT
<213> Artificial Sequence
<220>
<223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein
seuqences
<220>
<221> MISC_FEATURE
<222> (105)..(106)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (175)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (287)..(288)
<223> Xaa can be any naturally occurring amino acid
<400> 83
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Ser Xaa Xaa Met Gln Gln Lys Leu Thr
100 105 110
Ser Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly
115 120 125
Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro
130 135 140
Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp
145 150 155 160
Phe Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Gly
165 170 175
Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr
180 185 190
Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe
195 200 205
Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser
210 215 220
Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val
225 230 235 240
Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
245 250 255
Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn
260 265 270
Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa Xaa
275 280 285
Phe Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln
290 295 300
Pro Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu
305 310 315 320
Ala Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg
325 330 335
Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln
340 345 350
Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe
355 360 365
Gly Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp
370 375 380
Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly
385 390 395 400
Leu Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser
405 410 415
Gln Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu
420 425 430
Tyr Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His
435 440 445
Leu Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro
450 455 460
Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro
465 470 475 480
Trp Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser
485 490 495
Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala
500 505 510
Ser Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile
515 520 525
Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys
530 535 540
Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser
545 550 555 560
Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His
565 570 575
Gly Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp
580 585 590
Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr
595 600 605
Pro Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly
610 615 620
Ile Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr
625 630 635 640
Glu Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr
645 650 655
Asn Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu
660 665 670
His His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys
675 680 685
Lys Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg
690 695 700
Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser
705 710 715 720
Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His
725 730 735
Thr Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr
740 745 750
Thr Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn
755 760 765
Asn Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val
770 775 780
Thr Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr
785 790 795 800
Glu Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp
805 810 815
Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr
820 825 830
Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr
835 840 845
Ala Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr
850 855 860
Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala
865 870 875 880
Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu
885 890 895
Thr Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr
900 905 910
Ala Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu
915 920 925
Lys Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
930 935 940
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
945 950 955 960
Gly Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln
965 970 975
Ile Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr
980 985 990
Thr Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr
995 1000 1005
Lys Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr
1010 1015 1020
Ser Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser
1025 1030 1035 1040
Ser Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly
1045 1050 1055
Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe
1060 1065 1070
Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met
1075 1080 1085
Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu
1090 1095 1100
Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln
1105 1110 1115 1120
Ala Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1125 1130
<210> 84
<211> 1132
<212> PRT
<213> Artificial Sequence
<220>
<223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein
seuqences
<220>
<221> MISC_FEATURE
<222> (105)..(106)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (175)..(176)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (288)
<223> Xaa can be any naturally occurring amino acid
<400> 84
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Ser Xaa Xaa Met Gln Gln Lys Leu Thr
100 105 110
Ser Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly
115 120 125
Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro
130 135 140
Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp
145 150 155 160
Phe Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Xaa
165 170 175
Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser
180 185 190
Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp
195 200 205
Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp
210 215 220
Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr
225 230 235 240
Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr
245 250 255
Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala
260 265 270
Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa
275 280 285
Phe Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp Gln
290 295 300
Pro Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu Leu
305 310 315 320
Ala Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile Arg
325 330 335
Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro Gln
340 345 350
Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln Phe
355 360 365
Gly Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr Asp
370 375 380
Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg Gly
385 390 395 400
Leu Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe Ser
405 410 415
Gln Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly Leu
420 425 430
Tyr Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met His
435 440 445
Leu Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr Pro
450 455 460
Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr Pro
465 470 475 480
Trp Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala Ser
485 490 495
Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala Ala
500 505 510
Ser Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met Ile
515 520 525
Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val Lys
530 535 540
Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His Ser
545 550 555 560
Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala His
565 570 575
Gly Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu Asp
580 585 590
Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro Tyr
595 600 605
Pro Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys Gly
610 615 620
Ile Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn Tyr
625 630 635 640
Glu Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly Tyr
645 650 655
Asn Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly Glu
660 665 670
His His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val Lys
675 680 685
Lys Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr Arg
690 695 700
Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu Ser
705 710 715 720
Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr His
725 730 735
Thr Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp Tyr
740 745 750
Thr Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala Asn
755 760 765
Asn Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr Val
770 775 780
Thr Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn Tyr
785 790 795 800
Glu Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu Asp
805 810 815
Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile Thr
820 825 830
Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys Thr
835 840 845
Ala Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu Thr
850 855 860
Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp Ala
865 870 875 880
Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile Leu
885 890 895
Thr Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly Tyr
900 905 910
Ala Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly Leu
915 920 925
Lys Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
930 935 940
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
945 950 955 960
Gly Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln
965 970 975
Ile Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr
980 985 990
Thr Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr
995 1000 1005
Lys Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr
1010 1015 1020
Ser Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser
1025 1030 1035 1040
Ser Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly
1045 1050 1055
Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe
1060 1065 1070
Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met
1075 1080 1085
Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu
1090 1095 1100
Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln
1105 1110 1115 1120
Ala Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1125 1130
<210> 85
<211> 1133
<212> PRT
<213> Artificial Sequence
<220>
<223> homo-dimeric Megabody MbNb207SusBrandomlinkers_Aga2p_ACP protein
seuqences
<220>
<221> MISC_FEATURE
<222> (105)..(106)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (175)..(176)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (288)..(289)
<223> Xaa can be any naturally occurring amino acid
<400> 85
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Ser Xaa Xaa Met Gln Gln Lys Leu Thr
100 105 110
Ser Pro Asp Asn Asn Leu Val Met Thr Phe Gln Val Asp Ser Lys Gly
115 120 125
Ala Pro Thr Tyr Glu Leu Thr Tyr Lys Asn Lys Val Val Ile Lys Pro
130 135 140
Ser Thr Leu Gly Leu Glu Leu Lys Lys Glu Asp Asn Thr Arg Thr Asp
145 150 155 160
Phe Asp Trp Val Asp Arg Arg Asp Leu Thr Lys Leu Asp Ser Xaa Xaa
165 170 175
Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser
180 185 190
Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp
195 200 205
Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp
210 215 220
Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr
225 230 235 240
Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr
245 250 255
Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala
260 265 270
Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Xaa
275 280 285
Xaa Phe Glu Val Lys Asp Thr Gln Thr Ala Thr Phe Asp Glu Thr Trp
290 295 300
Gln Pro Val Trp Gly Glu Glu Lys Glu Ile Arg Asn His Tyr Asn Glu
305 310 315 320
Leu Ala Val Thr Leu Tyr Gln Pro Met Asn Asp Arg Ser Ile Val Ile
325 330 335
Arg Phe Arg Leu Phe Asn Asp Gly Leu Gly Phe Arg Tyr Glu Phe Pro
340 345 350
Gln Gln Lys Ser Leu Asn Tyr Phe Val Ile Lys Glu Glu His Ser Gln
355 360 365
Phe Gly Met Asn Gly Asp His Ile Ala Phe Trp Ile Pro Gly Asp Tyr
370 375 380
Asp Thr Gln Glu Tyr Asp Tyr Thr Ile Ser Arg Leu Ser Glu Ile Arg
385 390 395 400
Gly Leu Met Lys Glu Ala Ile Thr Pro Asn Ser Ser Gln Thr Pro Phe
405 410 415
Ser Gln Thr Gly Val Gln Thr Ala Leu Met Met Lys Thr Asp Asp Gly
420 425 430
Leu Tyr Ile Asn Leu His Glu Ala Ala Leu Val Asp Tyr Ser Cys Met
435 440 445
His Leu Asn Leu Asp Asp Lys Asn Met Val Phe Glu Ser Trp Leu Thr
450 455 460
Pro Asp Ala Lys Gly Asp Lys Gly Tyr Met Gln Thr Pro Cys Asn Thr
465 470 475 480
Pro Trp Arg Thr Ile Ile Val Ser Asp Asp Ala Arg Asn Ile Leu Ala
485 490 495
Ser Arg Ile Thr Leu Asn Leu Asn Glu Pro Cys Lys Ile Ala Asp Ala
500 505 510
Ala Ser Trp Val Lys Pro Val Lys Tyr Ile Gly Val Trp Trp Asp Met
515 520 525
Ile Thr Gly Lys Gly Ser Trp Ala Tyr Thr Asp Glu Leu Thr Ser Val
530 535 540
Lys Leu Gly Glu Thr Asp Tyr Ser Lys Thr Lys Pro Asn Gly Lys His
545 550 555 560
Ser Ala Asn Thr Ala Asn Val Lys Arg Tyr Ile Asp Phe Ala Ala Ala
565 570 575
His Gly Phe Asp Ala Val Leu Val Glu Gly Trp Asn Glu Gly Trp Glu
580 585 590
Asp Trp Phe Gly Asn Ser Lys Asp Tyr Val Phe Asp Phe Val Thr Pro
595 600 605
Tyr Pro Asp Phe Asp Val Lys Glu Ile His Arg Tyr Ala Ala Arg Lys
610 615 620
Gly Ile Lys Met Met Met His His Glu Thr Ser Ala Ser Val Arg Asn
625 630 635 640
Tyr Glu Arg His Met Asp Lys Ala Tyr Gln Phe Met Ala Asp Asn Gly
645 650 655
Tyr Asn Ser Val Lys Ser Gly Tyr Val Gly Asn Ile Ile Pro Arg Gly
660 665 670
Glu His His Tyr Gly Gln Trp Met Asn Asn His Tyr Leu Tyr Ala Val
675 680 685
Lys Lys Ala Ala Asp Tyr Lys Ile Met Val Asn Ala His Glu Ala Thr
690 695 700
Arg Pro Thr Gly Ile Cys Arg Thr Tyr Pro Asn Leu Ile Gly Asn Glu
705 710 715 720
Ser Ala Arg Gly Thr Glu Tyr Glu Ser Phe Gly Gly Asn Lys Val Tyr
725 730 735
His Thr Thr Ile Leu Pro Phe Thr Arg Leu Val Gly Gly Pro Met Asp
740 745 750
Tyr Thr Pro Gly Ile Phe Glu Thr His Cys Asn Lys Met Asn Pro Ala
755 760 765
Asn Asn Ser Gln Val Arg Ser Thr Ile Ala Arg Gln Leu Ala Leu Tyr
770 775 780
Val Thr Met Tyr Ser Pro Leu Gln Met Ala Ala Asp Ile Pro Glu Asn
785 790 795 800
Tyr Glu Arg Phe Met Asp Ala Phe Gln Phe Ile Lys Asp Val Ala Leu
805 810 815
Asp Trp Asp Glu Thr Asn Tyr Leu Glu Ala Glu Pro Gly Glu Tyr Ile
820 825 830
Thr Ile Ala Arg Lys Ala Lys Asp Thr Asp Asp Trp Tyr Val Gly Cys
835 840 845
Thr Ala Gly Glu Asn Gly His Thr Ser Lys Leu Val Phe Asp Phe Leu
850 855 860
Thr Pro Gly Lys Gln Tyr Ile Ala Thr Val Tyr Ala Asp Ala Lys Asp
865 870 875 880
Ala Asp Trp Lys Glu Asn Pro Gln Ala Tyr Thr Ile Lys Lys Gly Ile
885 890 895
Leu Thr Asn Lys Ser Lys Leu Asn Leu His Ala Ala Asn Gly Gly Gly
900 905 910
Tyr Ala Ile Ser Ile Lys Glu Val Lys Asp Lys Ser Glu Ala Lys Gly
915 920 925
Leu Lys Arg Leu Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
930 935 940
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
945 950 955 960
Gly Gly Ser Gly Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu
965 970 975
Gln Ile Pro Ser Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr
980 985 990
Thr Thr Ile Leu Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr
995 1000 1005
Tyr Lys Ser Val Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr
1010 1015 1020
Thr Ser Lys Gly Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn
1025 1030 1035 1040
Ser Ser Thr Ser Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile
1045 1050 1055
Gly Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser
1060 1065 1070
Phe Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val
1075 1080 1085
Met Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala
1090 1095 1100
Glu Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His
1105 1110 1115 1120
Gln Ala Ser Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1125 1130
<210> 86
<211> 77
<212> PRT
<213> Escherichia coli
<400> 86
Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly
1 5 10 15
Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu
20 25 30
Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu
35 40 45
Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr
50 55 60
Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala
65 70 75
<210> 87
<211> 208
<212> PRT
<213> Artificial Sequence
<220>
<223> Nanotool MbNb207ACPrandomlinkers
<220>
<221> MISC_FEATURE
<222> (12)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (88)
<223> Xaa can be any naturally occurring amino acid
<400> 87
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Thr Ile Glu Glu
1 5 10 15
Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu
20 25 30
Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu
35 40 45
Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu
50 55 60
Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile
65 70 75 80
Asp Tyr Ile Asn Gly His Gln Xaa Ser Leu Arg Leu Ser Cys Ala Ala
85 90 95
Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala
100 105 110
Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly
115 120 125
Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg
130 135 140
Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro
145 150 155 160
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr
165 170 175
Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr
180 185 190
Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
195 200 205
<210> 88
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Nanotool MbNb207ACPrandomlinkers
<220>
<221> MISC_FEATURE
<222> (12)..(13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (89)
<223> Xaa can be any naturally occurring amino acid
<400> 88
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Xaa Thr Ile Glu
1 5 10 15
Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu
20 25 30
Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser
35 40 45
Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr
50 55 60
Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala
65 70 75 80
Ile Asp Tyr Ile Asn Gly His Gln Xaa Ser Leu Arg Leu Ser Cys Ala
85 90 95
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
100 105 110
Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val
115 120 125
Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser
130 135 140
Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys
145 150 155 160
Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe
165 170 175
Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly
180 185 190
Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu
195 200 205
Ala
<210> 89
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Nanotool MbNb207ACPrandomlinkers
<220>
<221> MISC_FEATURE
<222> (12)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (88)..(89)
<223> Xaa can be any naturally occurring amino acid
<400> 89
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Thr Ile Glu Glu
1 5 10 15
Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu
20 25 30
Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu
35 40 45
Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu
50 55 60
Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile
65 70 75 80
Asp Tyr Ile Asn Gly His Gln Xaa Xaa Ser Leu Arg Leu Ser Cys Ala
85 90 95
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
100 105 110
Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val
115 120 125
Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser
130 135 140
Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys
145 150 155 160
Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe
165 170 175
Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly
180 185 190
Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu
195 200 205
Ala
<210> 90
<211> 210
<212> PRT
<213> Artificial Sequence
<220>
<223> Nanotool MbNb207ACPrandomlinkers
<220>
<221> MISC_FEATURE
<222> (12)..(13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (89)..(90)
<223> Xaa can be any naturally occurring amino acid
<400> 90
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Xaa Thr Ile Glu
1 5 10 15
Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu
20 25 30
Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser
35 40 45
Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr
50 55 60
Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala
65 70 75 80
Ile Asp Tyr Ile Asn Gly His Gln Xaa Xaa Ser Leu Arg Leu Ser Cys
85 90 95
Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg
100 105 110
Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr
115 120 125
Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile
130 135 140
Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu
145 150 155 160
Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly
165 170 175
Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln
180 185 190
Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro
195 200 205
Glu Ala
210
<210> 91
<211> 408
<212> PRT
<213> Artificial Sequence
<220>
<223> Nanotool MbNb207ACPrandomlinkers _Aga2p protein sequences
<220>
<221> MISC_FEATURE
<222> (101)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (177)
<223> Xaa can be any naturally occurring amino acid
<400> 91
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Xaa Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly
100 105 110
Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe
115 120 125
Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met
130 135 140
Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu
145 150 155 160
Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln
165 170 175
Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr
180 185 190
Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe
195 200 205
Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser
210 215 220
Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val
225 230 235 240
Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
245 250 255
Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn
260 265 270
Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu
275 280 285
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
290 295 300
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
305 310 315 320
Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr
325 330 335
Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn
340 345 350
Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe
355 360 365
Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro
370 375 380
Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Glu Gln
385 390 395 400
Lys Leu Ile Ser Glu Glu Asp Leu
405
<210> 92
<211> 409
<212> PRT
<213> Artificial Sequence
<220>
<223> Nanotool MbNb207ACPrandomlinkers _Aga2p protein sequences
<220>
<221> MISC_FEATURE
<222> (101)..(102)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (178)
<223> Xaa can be any naturally occurring amino acid
<400> 92
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Xaa Xaa Thr Ile Glu Glu Arg Val Lys Lys Ile Ile
100 105 110
Gly Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser
115 120 125
Phe Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val
130 135 140
Met Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala
145 150 155 160
Glu Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His
165 170 175
Gln Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser
180 185 190
Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp
195 200 205
Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp
210 215 220
Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr
225 230 235 240
Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr
245 250 255
Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala
260 265 270
Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
275 280 285
Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
290 295 300
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
305 310 315 320
Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro
325 330 335
Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala
340 345 350
Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr
355 360 365
Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser
370 375 380
Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Glu
385 390 395 400
Gln Lys Leu Ile Ser Glu Glu Asp Leu
405
<210> 93
<211> 409
<212> PRT
<213> Artificial Sequence
<220>
<223> Nanotool MbNb207ACPrandomlinkers _Aga2p protein sequences
<220>
<221> MISC_FEATURE
<222> (101)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (177)..(178)
<223> Xaa can be any naturally occurring amino acid
<400> 93
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Xaa Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly
100 105 110
Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe
115 120 125
Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met
130 135 140
Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu
145 150 155 160
Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln
165 170 175
Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser
180 185 190
Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp
195 200 205
Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp
210 215 220
Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr
225 230 235 240
Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr
245 250 255
Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala
260 265 270
Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
275 280 285
Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
290 295 300
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
305 310 315 320
Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro
325 330 335
Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala
340 345 350
Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr
355 360 365
Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser
370 375 380
Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Glu
385 390 395 400
Gln Lys Leu Ile Ser Glu Glu Asp Leu
405
<210> 94
<211> 410
<212> PRT
<213> Artificial Sequence
<220>
<223> Nanotool MbNb207ACPrandomlinkers _Aga2p protein sequences
<220>
<221> MISC_FEATURE
<222> (101)..(102)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (178)..(179)
<223> Xaa can be any naturally occurring amino acid
<400> 94
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Xaa Xaa Thr Ile Glu Glu Arg Val Lys Lys Ile Ile
100 105 110
Gly Glu Gln Leu Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser
115 120 125
Phe Val Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val
130 135 140
Met Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala
145 150 155 160
Glu Lys Ile Thr Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His
165 170 175
Gln Xaa Xaa Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
180 185 190
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
195 200 205
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
210 215 220
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
225 230 235 240
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
245 250 255
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
260 265 270
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
275 280 285
Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
290 295 300
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
305 310 315 320
Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser
325 330 335
Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu
340 345 350
Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val
355 360 365
Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly
370 375 380
Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser
385 390 395 400
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
405 410
<210> 95
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQMP1251_A7
<400> 95
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Val Ser Asn Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Val Phe Val Ala Ala Ile Gly Trp Thr Thr Gly Ser Thr
450 455 460
Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Thr Lys Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Arg Cys Ala Ala Arg Arg Arg Gly Tyr Ser Arg Val
500 505 510
Pro Met Thr Pro Asp Glu Tyr Glu Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser
530
<210> 96
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQMP1252_D10
<400> 96
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Leu Ser Met Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Glu Phe Val Ala Gly Ile Ser Trp Ser Arg Gly Ser Thr
450 455 460
Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Thr Lys Asn Thr Val Ile Leu Gln Met Asn Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Val Cys Ala Ala Arg Arg Arg Gly Tyr Ile Ser Ile
500 505 510
Pro Thr Thr Pro Asp Glu Phe Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser
530
<210> 97
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQMP1251_D10
<400> 97
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
450 455 460
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
500 505 510
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser
530
<210> 98
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQMP1251_A10
<400> 98
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Ile Ser Leu Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Glu Phe Val Ala Gly Ile Gly Trp Ser Thr Gly Asn Thr
450 455 460
Tyr Tyr Ser Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Ile Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Trp Gly Pro Ile
500 505 510
Pro Thr Met Glu Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser
530
<210> 99
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQMP1251_D4
<400> 99
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Met Ser Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Asp Phe Thr Ala Leu Ile Thr Trp Ser Val Gly Ser Pro
450 455 460
Ser Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Ser
465 470 475 480
Ala Lys Asn Thr Met Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Ala Gly Tyr Val Arg Leu
500 505 510
Pro Thr Arg Glu Asp Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser
530
<210> 100
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQMP1252_C10
<400> 100
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Met Ser Ala Val Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Glu Phe Ile Ala Leu Ile Ser Trp Thr Val Gly Arg Pro
450 455 460
Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Met Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Ala Gly Tyr Ser Arg Val
500 505 510
Pro Thr Arg Glu Tyr Asp Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser
530
<210> 101
<211> 532
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQMP1251_H6
<400> 101
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Gly Thr Phe Ser Ile Ser Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Glu Phe Ile Ala Leu Ile Ser Trp Asn Val Gly Arg Pro
450 455 460
Tyr Tyr Glu Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Met Phe Leu Gln Ile His Ser Leu Lys Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Gly Arg Arg Ala Gly Tyr Phe Gly Met
500 505 510
Pro Thr Arg Glu Tyr Glu Tyr Glu Tyr Trp Gly Gln Gly Thr Gln Val
515 520 525
Thr Val Ser Ser
530
<210> 102
<211> 531
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQMP1251_A5
<400> 102
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Ser Ser Asn Asn His Met Ala Trp Phe Arg Gln Gly Pro Arg
435 440 445
Lys Glu Arg Glu Phe Val Ala Ala Ile Ser Trp Ser Arg Asp Phe Thr
450 455 460
Lys Tyr Ala Asp Ser Val Glu Gly Arg Phe Ile Ile Ser Arg Asp Asn
465 470 475 480
Ala Lys Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Ser Pro Glu Asp
485 490 495
Thr Ala Val Tyr Tyr Cys Ala Ala Ala Pro Trp Gly Thr Asn Trp Arg
500 505 510
Val Lys Glu Ser Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr
515 520 525
Val Ser Ser
530
<210> 103
<211> 531
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQMP1263_C9
<400> 103
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Ser Ser Asp Ala Val Gly Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Glu Phe Val Ala Tyr Ile Ser Trp Ser Asn Ala Ile Thr
450 455 460
Tyr Tyr Ala Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn
465 470 475 480
Ala Glu Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Lys Ala Glu Asp
485 490 495
Thr Ala Ile Tyr Tyr Cys Ala Gly Gly Leu Asn Ser Tyr Gly Ser Thr
500 505 510
Trp Ala Pro Gln Ser Tyr Ala Val Trp Gly Gln Gly Thr Gln Val Thr
515 520 525
Val Ser Ser
530
<210> 104
<211> 539
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQ_betaturnCC'_randomlinkers protein sequences
<220>
<221> MISC_FEATURE
<222> (40)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (448)
<223> Xaa can be any naturally occurring amino acid
<400> 104
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala
20 25 30
Ala Met Gly Trp Phe Arg Gln Xaa Lys Thr Thr Thr Ser Val Ile Asp
35 40 45
Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val
50 55 60
Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser
65 70 75 80
Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala
85 90 95
Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala
100 105 110
Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln
115 120 125
Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu
130 135 140
Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu
145 150 155 160
Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val
165 170 175
Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile
180 185 190
Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln
195 200 205
Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr
210 215 220
Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro
225 230 235 240
Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu
245 250 255
Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
260 265 270
Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr
275 280 285
Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln
290 295 300
Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr
305 310 315 320
Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val
325 330 335
Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr
340 345 350
Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp
355 360 365
Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser
370 375 380
Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys
385 390 395 400
Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr
405 410 415
Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn
420 425 430
Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa
435 440 445
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
450 455 460
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
465 470 475 480
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
485 490 495
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
500 505 510
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
515 520 525
Ser His His His His His His Glu Pro Glu Ala
530 535
<210> 105
<211> 540
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQ_betaturnCC'_randomlinkers protein sequences
<220>
<221> MISC_FEATURE
<222> (40)..(41)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (449)
<223> Xaa can be any naturally occurring amino acid
<400> 105
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala
20 25 30
Ala Met Gly Trp Phe Arg Gln Xaa Xaa Lys Thr Thr Thr Ser Val Ile
35 40 45
Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile
50 55 60
Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser
65 70 75 80
Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr
85 90 95
Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser
100 105 110
Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr
115 120 125
Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn
130 135 140
Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met
145 150 155 160
Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln
165 170 175
Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr
180 185 190
Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met
195 200 205
Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu
210 215 220
Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr
225 230 235 240
Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu
245 250 255
Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly
260 265 270
Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu
275 280 285
Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn
290 295 300
Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly
305 310 315 320
Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser
325 330 335
Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly
340 345 350
Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr
355 360 365
Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn
370 375 380
Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp
385 390 395 400
Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala
405 410 415
Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu
420 425 430
Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr
435 440 445
Xaa Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr
450 455 460
Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys
465 470 475 480
Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala
485 490 495
Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr
500 505 510
Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
515 520 525
Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 106
<211> 540
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQ_betaturnCC'_randomlinkers protein sequences
<220>
<221> MISC_FEATURE
<222> (40)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (448)..(449)
<223> Xaa can be any naturally occurring amino acid
<400> 106
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala
20 25 30
Ala Met Gly Trp Phe Arg Gln Xaa Lys Thr Thr Thr Ser Val Ile Asp
35 40 45
Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val
50 55 60
Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser
65 70 75 80
Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala
85 90 95
Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala
100 105 110
Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln
115 120 125
Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu
130 135 140
Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu
145 150 155 160
Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val
165 170 175
Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile
180 185 190
Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln
195 200 205
Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr
210 215 220
Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro
225 230 235 240
Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu
245 250 255
Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
260 265 270
Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr
275 280 285
Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln
290 295 300
Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr
305 310 315 320
Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val
325 330 335
Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr
340 345 350
Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp
355 360 365
Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser
370 375 380
Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys
385 390 395 400
Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr
405 410 415
Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn
420 425 430
Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa
435 440 445
Xaa Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr
450 455 460
Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys
465 470 475 480
Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala
485 490 495
Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr
500 505 510
Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
515 520 525
Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 107
<211> 541
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQ_betaturnCC'_randomlinkers protein sequences
<220>
<221> MISC_FEATURE
<222> (40)..(41)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (449)..(450)
<223> Xaa can be any naturally occurring amino acid
<400> 107
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala
20 25 30
Ala Met Gly Trp Phe Arg Gln Xaa Xaa Lys Thr Thr Thr Ser Val Ile
35 40 45
Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile
50 55 60
Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser
65 70 75 80
Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr
85 90 95
Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser
100 105 110
Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr
115 120 125
Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn
130 135 140
Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met
145 150 155 160
Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln
165 170 175
Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr
180 185 190
Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met
195 200 205
Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu
210 215 220
Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr
225 230 235 240
Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu
245 250 255
Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly
260 265 270
Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu
275 280 285
Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn
290 295 300
Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly
305 310 315 320
Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser
325 330 335
Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly
340 345 350
Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr
355 360 365
Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn
370 375 380
Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp
385 390 395 400
Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala
405 410 415
Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu
420 425 430
Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr
435 440 445
Xaa Xaa Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr
450 455 460
Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
465 470 475 480
Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr
485 490 495
Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro
500 505 510
Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr
515 520 525
Val Ser Ser His His His His His His Glu Pro Glu Ala
530 535 540
<210> 108
<211> 818
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQ_betaturnCC'_randomlinkers_Aga2p_ACP protein
sequences
<220>
<221> MISC_FEATURE
<222> (129)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (537)
<223> Xaa can be any naturally occurring amino acid
<400> 108
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala
100 105 110
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
115 120 125
Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn
130 135 140
Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys
145 150 155 160
Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn
165 170 175
Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys
180 185 190
Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn
195 200 205
Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro
210 215 220
Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser
225 230 235 240
Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala
245 250 255
Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu
260 265 270
Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala
275 280 285
Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly
290 295 300
Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser
305 310 315 320
Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn
325 330 335
Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala
340 345 350
Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr
355 360 365
Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser
370 375 380
Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu
385 390 395 400
Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln
405 410 415
Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met
420 425 430
Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn
435 440 445
Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr
450 455 460
Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn
465 470 475 480
Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu
485 490 495
Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu
500 505 510
Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu
515 520 525
Ala His Val Thr Thr Ser Lys Tyr Xaa Asp Phe Val Ala Gly Ile Tyr
530 535 540
Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe
545 550 555 560
Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp
565 570 575
Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg
580 585 590
Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp
595 600 605
Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly Ser Gly
610 615 620
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
625 630 635 640
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Glu Leu
645 650 655
Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser Thr Pro
660 665 670
Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala Met Gln
675 680 685
Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn Cys Gly
690 695 700
Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr Gln Tyr
705 710 715 720
Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu Glu Arg
725 730 735
Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu Val
740 745 750
Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu Asp
755 760 765
Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu Ile
770 775 780
Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile Asp
785 790 795 800
Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser Glu Glu
805 810 815
Asp Leu
<210> 109
<211> 819
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQ_betaturnCC'_randomlinkers_Aga2p_ACP protein
sequences
<220>
<221> MISC_FEATURE
<222> (129)..(130)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (538)
<223> Xaa can be any naturally occurring amino acid
<400> 109
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala
100 105 110
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
115 120 125
Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln
130 135 140
Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr
145 150 155 160
Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn
165 170 175
Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser
180 185 190
Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn
195 200 205
Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln
210 215 220
Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser
225 230 235 240
Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln
245 250 255
Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys
260 265 270
Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser
275 280 285
Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp
290 295 300
Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr
305 310 315 320
Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln
325 330 335
Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg
340 345 350
Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp
355 360 365
Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn
370 375 380
Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn
385 390 395 400
Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr
405 410 415
Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser
420 425 430
Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu
435 440 445
Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr
450 455 460
Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr
465 470 475 480
Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile
485 490 495
Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala
500 505 510
Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu
515 520 525
Glu Ala His Val Thr Thr Ser Lys Tyr Xaa Asp Phe Val Ala Gly Ile
530 535 540
Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg
545 550 555 560
Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met
565 570 575
Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg
580 585 590
Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr
595 600 605
Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly Ser
610 615 620
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
625 630 635 640
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Glu
645 650 655
Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser Thr
660 665 670
Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala Met
675 680 685
Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn Cys
690 695 700
Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr Gln
705 710 715 720
Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu Glu
725 730 735
Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu
740 745 750
Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu
755 760 765
Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu
770 775 780
Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile
785 790 795 800
Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser Glu
805 810 815
Glu Asp Leu
<210> 110
<211> 819
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQ_betaturnCC'_randomlinkers_Aga2p_ACP protein
sequences
<220>
<221> MISC_FEATURE
<222> (129)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (537)..(538)
<223> Xaa can be any naturally occurring amino acid
<400> 110
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala
100 105 110
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
115 120 125
Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn
130 135 140
Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys
145 150 155 160
Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn
165 170 175
Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys
180 185 190
Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn
195 200 205
Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro
210 215 220
Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser
225 230 235 240
Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala
245 250 255
Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu
260 265 270
Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala
275 280 285
Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly
290 295 300
Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser
305 310 315 320
Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn
325 330 335
Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala
340 345 350
Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr
355 360 365
Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser
370 375 380
Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu
385 390 395 400
Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln
405 410 415
Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met
420 425 430
Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn
435 440 445
Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr
450 455 460
Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn
465 470 475 480
Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu
485 490 495
Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu
500 505 510
Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu
515 520 525
Ala His Val Thr Thr Ser Lys Tyr Xaa Xaa Asp Phe Val Ala Gly Ile
530 535 540
Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg
545 550 555 560
Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met
565 570 575
Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg
580 585 590
Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr
595 600 605
Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly Ser
610 615 620
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
625 630 635 640
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Glu
645 650 655
Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser Thr
660 665 670
Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala Met
675 680 685
Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn Cys
690 695 700
Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr Gln
705 710 715 720
Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu Glu
725 730 735
Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu
740 745 750
Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu
755 760 765
Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu
770 775 780
Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile
785 790 795 800
Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser Glu
805 810 815
Glu Asp Leu
<210> 111
<211> 820
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cHopQ_betaturnCC'_randomlinkers_Aga2p_ACP protein
sequences
<220>
<221> MISC_FEATURE
<222> (129)..(130)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (538)..(539)
<223> Xaa can be any naturally occurring amino acid
<400> 111
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Gln Val Gln Leu Val Glu Ser
85 90 95
Gly Gly Gly Leu Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala
100 105 110
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
115 120 125
Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln
130 135 140
Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr
145 150 155 160
Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn
165 170 175
Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser
180 185 190
Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn
195 200 205
Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln
210 215 220
Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser
225 230 235 240
Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln
245 250 255
Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys
260 265 270
Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser
275 280 285
Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp
290 295 300
Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr
305 310 315 320
Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln
325 330 335
Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg
340 345 350
Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp
355 360 365
Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn
370 375 380
Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn
385 390 395 400
Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr
405 410 415
Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser
420 425 430
Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu
435 440 445
Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr
450 455 460
Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr
465 470 475 480
Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile
485 490 495
Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala
500 505 510
Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu
515 520 525
Glu Ala His Val Thr Thr Ser Lys Tyr Xaa Xaa Asp Phe Val Ala Gly
530 535 540
Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly
545 550 555 560
Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln
565 570 575
Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala
580 585 590
Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp
595 600 605
Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser Leu Gly Gly Gly
610 615 620
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
625 630 635 640
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln
645 650 655
Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr Leu Glu Ser
660 665 670
Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn Gly Lys Ala
675 680 685
Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe Val Ser Asn
690 695 700
Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro Ile Asn Thr
705 710 715 720
Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser Thr Ile Glu
725 730 735
Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu
740 745 750
Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser
755 760 765
Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr
770 775 780
Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala
785 790 795 800
Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys Leu Ile Ser
805 810 815
Glu Glu Asp Leu
820
<210> 112
<211> 94
<212> PRT
<213> Artificial Sequence
<220>
<223> Deinococcus radiodurans Monobody NS1 (from PDB5E59)
<400> 112
Ser Ser Val Pro Thr Lys Leu Glu Val Val Ala Ala Thr Pro Thr Ser
1 5 10 15
Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Asp Tyr Tyr Val
20 25 30
Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Lys Phe Glu
35 40 45
Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro Gly
50 55 60
Val Asp Tyr Thr Ile Thr Val Tyr Ala Trp Gly Trp His Gly Gln Val
65 70 75 80
Tyr Tyr Tyr Met Gly Ser Pro Ile Ser Ile Asn Tyr Arg Thr
85 90
<210> 113
<211> 511
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNS1cHopQ_randomlinkers
<220>
<221> MISC_FEATURE
<222> (14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (422)
<223> Xaa can be any naturally occurring amino acid
<400> 113
Ser Ser Val Pro Thr Lys Leu Glu Val Val Ala Ala Thr Xaa Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Xaa Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala
420 425 430
Val Thr Val Asp Tyr Tyr Val Ile Thr Tyr Gly Glu Thr Gly Gly Asn
435 440 445
Ser Pro Val Gln Lys Phe Glu Val Pro Gly Ser Lys Ser Thr Ala Thr
450 455 460
Ile Ser Gly Leu Lys Pro Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala
465 470 475 480
Trp Gly Trp His Gly Gln Val Tyr Tyr Tyr Met Gly Ser Pro Ile Ser
485 490 495
Ile Asn Tyr Arg Thr His His His His His His Glu Pro Glu Ala
500 505 510
<210> 114
<211> 512
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNS1cHopQ_randomlinkers
<220>
<221> MISC_FEATURE
<222> (14)..(15)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (423)
<223> Xaa can be any naturally occurring amino acid
<400> 114
Ser Ser Val Pro Thr Lys Leu Glu Val Val Ala Ala Thr Xaa Xaa Lys
1 5 10 15
Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu
20 25 30
Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile
35 40 45
Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn
50 55 60
Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr
65 70 75 80
Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln
85 90 95
Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn
100 105 110
Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr
115 120 125
Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile
130 135 140
Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser
145 150 155 160
Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser
165 170 175
Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly
180 185 190
Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala
195 200 205
Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala
210 215 220
Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly
225 230 235 240
Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu
245 250 255
Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr
260 265 270
Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala
275 280 285
Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr
290 295 300
Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr
305 310 315 320
Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln
325 330 335
Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn
340 345 350
Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr
355 360 365
Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr
370 375 380
Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln
385 390 395 400
Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His
405 410 415
Val Thr Thr Ser Lys Tyr Xaa Ser Leu Leu Ile Ser Trp Asp Ala Pro
420 425 430
Ala Val Thr Val Asp Tyr Tyr Val Ile Thr Tyr Gly Glu Thr Gly Gly
435 440 445
Asn Ser Pro Val Gln Lys Phe Glu Val Pro Gly Ser Lys Ser Thr Ala
450 455 460
Thr Ile Ser Gly Leu Lys Pro Gly Val Asp Tyr Thr Ile Thr Val Tyr
465 470 475 480
Ala Trp Gly Trp His Gly Gln Val Tyr Tyr Tyr Met Gly Ser Pro Ile
485 490 495
Ser Ile Asn Tyr Arg Thr His His His His His His Glu Pro Glu Ala
500 505 510
<210> 115
<211> 512
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNS1cHopQ_randomlinkers
<220>
<221> MISC_FEATURE
<222> (14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (422)..(423)
<223> Xaa can be any naturally occurring amino acid
<400> 115
Ser Ser Val Pro Thr Lys Leu Glu Val Val Ala Ala Thr Xaa Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Xaa Xaa Ser Leu Leu Ile Ser Trp Asp Ala Pro
420 425 430
Ala Val Thr Val Asp Tyr Tyr Val Ile Thr Tyr Gly Glu Thr Gly Gly
435 440 445
Asn Ser Pro Val Gln Lys Phe Glu Val Pro Gly Ser Lys Ser Thr Ala
450 455 460
Thr Ile Ser Gly Leu Lys Pro Gly Val Asp Tyr Thr Ile Thr Val Tyr
465 470 475 480
Ala Trp Gly Trp His Gly Gln Val Tyr Tyr Tyr Met Gly Ser Pro Ile
485 490 495
Ser Ile Asn Tyr Arg Thr His His His His His His Glu Pro Glu Ala
500 505 510
<210> 116
<211> 513
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNS1cHopQ_randomlinkers
<220>
<221> MISC_FEATURE
<222> (14)..(15)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (423)..(424)
<223> Xaa can be any naturally occurring amino acid
<400> 116
Ser Ser Val Pro Thr Lys Leu Glu Val Val Ala Ala Thr Xaa Xaa Lys
1 5 10 15
Thr Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu
20 25 30
Thr Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile
35 40 45
Leu Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn
50 55 60
Thr Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr
65 70 75 80
Phe Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln
85 90 95
Lys Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn
100 105 110
Ile Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr
115 120 125
Ala Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile
130 135 140
Leu Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser
145 150 155 160
Gly His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser
165 170 175
Ser Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly
180 185 190
Cys Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala
195 200 205
Asp Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala
210 215 220
Asn Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly
225 230 235 240
Gly Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu
245 250 255
Gln Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr
260 265 270
Ser Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala
275 280 285
Lys Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr
290 295 300
Leu Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr
305 310 315 320
Ala Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln
325 330 335
Lys Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn
340 345 350
Cys Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr
355 360 365
Asn Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr
370 375 380
Glu Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln
385 390 395 400
Ala Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His
405 410 415
Val Thr Thr Ser Lys Tyr Xaa Xaa Ser Leu Leu Ile Ser Trp Asp Ala
420 425 430
Pro Ala Val Thr Val Asp Tyr Tyr Val Ile Thr Tyr Gly Glu Thr Gly
435 440 445
Gly Asn Ser Pro Val Gln Lys Phe Glu Val Pro Gly Ser Lys Ser Thr
450 455 460
Ala Thr Ile Ser Gly Leu Lys Pro Gly Val Asp Tyr Thr Ile Thr Val
465 470 475 480
Tyr Ala Trp Gly Trp His Gly Gln Val Tyr Tyr Tyr Met Gly Ser Pro
485 490 495
Ile Ser Ile Asn Tyr Arg Thr His His His His His His Glu Pro Glu
500 505 510
Ala
<210> 117
<211> 790
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNS1cHopQ_randomlinkers _Aga2p_ACP protein sequences
<220>
<221> MISC_FEATURE
<222> (103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (511)
<223> Xaa can be any naturally occurring amino acid
<400> 117
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Ser Ser Val Pro Thr Lys Leu
85 90 95
Glu Val Val Ala Ala Thr Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr
100 105 110
Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn
115 120 125
Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser
130 135 140
Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly
145 150 155 160
Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala
165 170 175
Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln
180 185 190
Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn
195 200 205
Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys
210 215 220
Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu
225 230 235 240
Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly
245 250 255
Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn
260 265 270
Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln
275 280 285
Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln
290 295 300
Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly
305 310 315 320
Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser
325 330 335
Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn
340 345 350
Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala
355 360 365
Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr
370 375 380
Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu
385 390 395 400
Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr
405 410 415
Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu
420 425 430
Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn
435 440 445
Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn
450 455 460
Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln
465 470 475 480
Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser
485 490 495
Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa Ser
500 505 510
Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Asp Tyr Tyr Val
515 520 525
Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Lys Phe Glu
530 535 540
Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro Gly
545 550 555 560
Val Asp Tyr Thr Ile Thr Val Tyr Ala Trp Gly Trp His Gly Gln Val
565 570 575
Tyr Tyr Tyr Met Gly Ser Pro Ile Ser Ile Asn Tyr Arg Thr Ser Leu
580 585 590
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
595 600 605
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
610 615 620
Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro Thr
625 630 635 640
Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala Asn
645 650 655
Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr Phe
660 665 670
Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser Pro
675 680 685
Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met Ser
690 695 700
Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val
705 710 715 720
Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly
725 730 735
Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu
740 745 750
Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val
755 760 765
Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln Lys
770 775 780
Leu Ile Ser Glu Glu Asp
785 790
<210> 118
<211> 791
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNS1cHopQ_randomlinkers _Aga2p_ACP protein sequences
<220>
<221> MISC_FEATURE
<222> (103)..(104)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (512)
<223> Xaa can be any naturally occurring amino acid
<400> 118
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Ser Ser Val Pro Thr Lys Leu
85 90 95
Glu Val Val Ala Ala Thr Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp
100 105 110
Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val
115 120 125
Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser
130 135 140
Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala
145 150 155 160
Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala
165 170 175
Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln
180 185 190
Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu
195 200 205
Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu
210 215 220
Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val
225 230 235 240
Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile
245 250 255
Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln
260 265 270
Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr
275 280 285
Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro
290 295 300
Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu
305 310 315 320
Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
325 330 335
Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr
340 345 350
Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln
355 360 365
Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr
370 375 380
Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val
385 390 395 400
Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr
405 410 415
Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp
420 425 430
Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser
435 440 445
Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys
450 455 460
Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr
465 470 475 480
Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn
485 490 495
Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa
500 505 510
Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Asp Tyr Tyr
515 520 525
Val Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Lys Phe
530 535 540
Glu Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro
545 550 555 560
Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Trp Gly Trp His Gly Gln
565 570 575
Val Tyr Tyr Tyr Met Gly Ser Pro Ile Ser Ile Asn Tyr Arg Thr Ser
580 585 590
Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
595 600 605
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
610 615 620
Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro
625 630 635 640
Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala
645 650 655
Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr
660 665 670
Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser
675 680 685
Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met
690 695 700
Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly
705 710 715 720
Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu
725 730 735
Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu
740 745 750
Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr
755 760 765
Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln
770 775 780
Lys Leu Ile Ser Glu Glu Asp
785 790
<210> 119
<211> 791
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNS1cHopQ_randomlinkers _Aga2p_ACP protein sequences
<220>
<221> MISC_FEATURE
<222> (103)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (511)..(512)
<223> Xaa can be any naturally occurring amino acid
<400> 119
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Ser Ser Val Pro Thr Lys Leu
85 90 95
Glu Val Val Ala Ala Thr Xaa Lys Thr Thr Thr Ser Val Ile Asp Thr
100 105 110
Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val Asn
115 120 125
Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser Ser
130 135 140
Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala Gly
145 150 155 160
Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala Ala
165 170 175
Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln Gln
180 185 190
Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu Asn
195 200 205
Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu Lys
210 215 220
Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val Glu
225 230 235 240
Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile Gly
245 250 255
Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln Asn
260 265 270
Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr Gln
275 280 285
Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro Gln
290 295 300
Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu Gly
305 310 315 320
Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser
325 330 335
Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr Asn
340 345 350
Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln Ala
355 360 365
Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr Thr
370 375 380
Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val Leu
385 390 395 400
Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr Thr
405 410 415
Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp Glu
420 425 430
Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser Asn
435 440 445
Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys Asn
450 455 460
Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr Gln
465 470 475 480
Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn Ser
485 490 495
Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa Xaa
500 505 510
Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Asp Tyr Tyr
515 520 525
Val Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Lys Phe
530 535 540
Glu Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys Pro
545 550 555 560
Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Trp Gly Trp His Gly Gln
565 570 575
Val Tyr Tyr Tyr Met Gly Ser Pro Ile Ser Ile Asn Tyr Arg Thr Ser
580 585 590
Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
595 600 605
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
610 615 620
Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser Pro
625 630 635 640
Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu Ala
645 650 655
Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val Thr
660 665 670
Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly Ser
675 680 685
Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser Met
690 695 700
Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly
705 710 715 720
Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu
725 730 735
Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu
740 745 750
Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr
755 760 765
Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu Gln
770 775 780
Lys Leu Ile Ser Glu Glu Asp
785 790
<210> 120
<211> 792
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNS1cHopQ_randomlinkers _Aga2p_ACP protein sequences
<220>
<221> MISC_FEATURE
<222> (103)..(104)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (512)..(513)
<223> Xaa can be any naturally occurring amino acid
<400> 120
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Val Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Ala Asn Thr Thr Ala Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Gly Leu Glu Gly Asp Ser
35 40 45
Asp Val Ala Ala Leu Pro Leu Ser Asp Ser Thr Asn Asn Gly Ser Leu
50 55 60
Ser Thr Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Gln Leu Asp Lys Arg Glu Ala Glu Ala Ser Ser Val Pro Thr Lys Leu
85 90 95
Glu Val Val Ala Ala Thr Xaa Xaa Lys Thr Thr Thr Ser Val Ile Asp
100 105 110
Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln Ala Gln Thr Ile Val
115 120 125
Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile Ala Lys Ser Ser Ser
130 135 140
Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro Ser Trp Gln Thr Ala
145 150 155 160
Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly Ala Glu Phe Ser Ala
165 170 175
Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile Val Gln Glu Thr Gln
180 185 190
Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr Gln Pro His Asn Leu
195 200 205
Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu Ala Gln Lys Met Leu
210 215 220
Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys Leu Ala Asn Gln Val
225 230 235 240
Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His Leu Lys Asp Tyr Ile
245 250 255
Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala Asn Met Thr Met Gln
260 265 270
Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala Gly Val Glu Glu Thr
275 280 285
Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe Asn Asn Gln Thr Pro
290 295 300
Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr Leu Ile Gln Glu Leu
305 310 315 320
Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
325 330 335
Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln Leu Ser Arg Leu Leu Thr
340 345 350
Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile Asn Gln
355 360 365
Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly Gly Thr
370 375 380
Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg Ser Val
385 390 395 400
Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly Gly Tyr
405 410 415
Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr Thr Asp
420 425 430
Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr Asn Ser
435 440 445
Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala Asp Lys
450 455 460
Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu Ala Tyr
465 470 475 480
Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro Leu Asn
485 490 495
Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys Tyr Xaa
500 505 510
Xaa Ser Leu Leu Ile Ser Trp Asp Ala Pro Ala Val Thr Val Asp Tyr
515 520 525
Tyr Val Ile Thr Tyr Gly Glu Thr Gly Gly Asn Ser Pro Val Gln Lys
530 535 540
Phe Glu Val Pro Gly Ser Lys Ser Thr Ala Thr Ile Ser Gly Leu Lys
545 550 555 560
Pro Gly Val Asp Tyr Thr Ile Thr Val Tyr Ala Trp Gly Trp His Gly
565 570 575
Gln Val Tyr Tyr Tyr Met Gly Ser Pro Ile Ser Ile Asn Tyr Arg Thr
580 585 590
Ser Leu Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
595 600 605
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
610 615 620
Gly Gly Gly Ser Gln Glu Leu Thr Thr Ile Cys Glu Gln Ile Pro Ser
625 630 635 640
Pro Thr Leu Glu Ser Thr Pro Tyr Ser Leu Ser Thr Thr Thr Ile Leu
645 650 655
Ala Asn Gly Lys Ala Met Gln Gly Val Phe Glu Tyr Tyr Lys Ser Val
660 665 670
Thr Phe Val Ser Asn Cys Gly Ser His Pro Ser Thr Thr Ser Lys Gly
675 680 685
Ser Pro Ile Asn Thr Gln Tyr Val Phe Lys Asp Asn Ser Ser Thr Ser
690 695 700
Met Ser Thr Ile Glu Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu
705 710 715 720
Gly Val Lys Gln Glu Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp
725 730 735
Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu
740 745 750
Glu Glu Phe Asp Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr
755 760 765
Thr Val Gln Ala Ala Ile Asp Tyr Ile Asn Gly His Gln Ala Ser Glu
770 775 780
Gln Lys Leu Ile Ser Glu Glu Asp
785 790
<210> 121
<211> 378
<212> DNA
<213> Artificial Sequence
<220>
<223> NbGFP207
<400> 121
caggtgcagc tggtggagtc tggaggagga ttggtgcagg ctgggggctc tctgagactc 60
tcctgtgcag cctctggacg caccttcagt accgctgcca tgggctggtt ccgccaggct 120
ccaggaaagg agcgtgactt cgtagcaggt atttactgga ctgttggcag cacatactat 180
gcagactccg cgaagggccg attcaccatc tccagagaca acgccaagaa cacggtgtat 240
ctgcaaatgg acagcctgaa accagaggac acggccgttt attactgtgc agctaggcgg 300
aggggcttta ctttagcccc tactcgagca aatgaatatg actactgggg tcaggggacc 360
caggtcaccg tctccagc 378
<210> 122
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> TU89 Forward primer (SapI digestion site)
<400> 122
ccttgagctc ttcgtccctg agactctcct g 31
<210> 123
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> EP230 Reverse primer (SapI digestion site)
<400> 123
aggactgctc ttccactgga gacggtgacc tgggt 35
<210> 124
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> TU64 primer
<400> 124
ccctccacca gagccacctc ccaagcttga gacggtgacc tgggt 45
<210> 125
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> TU65 primer
<400> 125
gcatgtaacc acatcaaagt atggatccct gagactctcc tg 42
<210> 126
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> TU131 primer
<220>
<221> misc_feature
<222> (28)..(29)
<223> n is a, c, g, or t
<400> 126
ctggtggagt ctgggggagg actagtannk aaaacaacaa cttctgttat tg 52
<210> 127
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> TU132 primer
<220>
<221> misc_feature
<222> (28)..(29)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (31)..(32)
<223> n is a, c, g, or t
<400> 127
ctggtggagt ctgggggagg actagtannk nnkaaaacaa caacttctgt tattg 55
<210> 128
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> TU133 primer
<220>
<221> misc_feature
<222> (29)..(30)
<223> n is a, c, g, or t
<400> 128
agaggctgca caggagagtc tcagggamnn ctttgatgtg gttacatgtg c 51
<210> 129
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> TU134 primer
<220>
<221> misc_feature
<222> (29)..(30)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (32)..(33)
<223> n is a, c, g, or t
<400> 129
agaggctgca caggagagtc tcagggamnn mnnctttgat gtggttacat gtgc 54
<210> 130
<211> 123
<212> PRT
<213> Artificial Sequence
<220>
<223> Nb38 GABAA-specific Nanobody
<400> 130
Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly
1 5 10 15
Ser Leu Arg Val Ser Cys Ala Ala Ser Gly Arg Thr Phe Thr Thr Tyr
20 25 30
Ile Met Ala Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Phe Leu
35 40 45
Ala Ala Met Asp Gln Gly Arg Ile Gln Tyr Tyr Gly Asp Ser Val Arg
50 55 60
Gly Arg Phe Thr Ile Ser Arg Asp Tyr Ala Lys Asn Ser Val Asp Leu
65 70 75 80
Gln Leu Asp Gly Leu Arg Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
85 90 95
Ala Gly Ala Gly Phe Trp Gly Leu Arg Thr Ala Ser Ser Tyr His Tyr
100 105 110
Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
115 120
<210> 131
<211> 539
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb38cHopQ
<400> 131
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Pro Phe Arg Ala Ser Gly Gly
225 230 235 240
Gly Ser Gly Gly Gly Gly Ser Gly Lys Leu Ser Asp Thr Tyr Glu Gln
245 250 255
Leu Ser Arg Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser
260 265 270
Ala Gln Ala Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys
275 280 285
Thr Leu Ala Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu
290 295 300
Leu Ala Leu Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala
305 310 315 320
Val Ile Cys Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys
325 330 335
Asp Phe His Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys
340 345 350
Gly Gly Ser Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn
355 360 365
Thr Leu Lys Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu
370 375 380
Lys Ile His Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala
385 390 395 400
Gly Leu Ala Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val
405 410 415
Thr Thr Ser Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
420 425 430
Arg Thr Phe Thr Thr Tyr Ile Met Ala Trp Phe Arg Gln Ala Pro Gly
435 440 445
Lys Glu Arg Glu Phe Leu Ala Ala Met Asp Gln Gly Arg Ile Gln Tyr
450 455 460
Tyr Gly Asp Ser Val Arg Gly Arg Phe Thr Ile Ser Arg Asp Tyr Ala
465 470 475 480
Lys Asn Ser Val Asp Leu Gln Leu Asp Gly Leu Arg Pro Glu Asp Thr
485 490 495
Ala Val Tyr Tyr Cys Ala Ala Gly Ala Gly Phe Trp Gly Leu Arg Thr
500 505 510
Ala Ser Ser Tyr His Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
515 520 525
Ser His His His His His His Glu Pro Glu Ala
530 535
<210> 132
<211> 133
<212> PRT
<213> Artificial Sequence
<220>
<223> Nb60 HopQ-specific Nanobody
<400> 132
Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Arg Tyr
20 25 30
Ala Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Pro Glu Trp Val
35 40 45
Ser Ala Ile Asn Ser Pro Gly Gly Ser Thr Ser Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Lys Pro Asp Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Lys Tyr Glu Arg Ala Thr Glu Trp Gly His Thr Ile Val Ala Val
100 105 110
Thr Pro Leu Leu Asp Gly Val His Asp Tyr Trp Gly Gln Gly Thr Gln
115 120 125
Val Thr Val Ser Ser
130
<210> 133
<211> 530
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb60c7HopQ N277K T270R
<400> 133
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg
225 230 235 240
Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala
245 250 255
Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Arg Leu Ala
260 265 270
Gly Gly Thr Thr Lys Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu
275 280 285
Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys
290 295 300
Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His
305 310 315 320
Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser
325 330 335
Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys
340 345 350
Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His
355 360 365
Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala
370 375 380
Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser
385 390 395 400
Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
405 410 415
Ser Arg Tyr Ala Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Pro
420 425 430
Glu Trp Val Ser Ala Ile Asn Ser Pro Gly Gly Ser Thr Ser Tyr Ala
435 440 445
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
450 455 460
Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Asp Asp Thr Ala Val
465 470 475 480
Tyr Tyr Cys Ala Lys Tyr Glu Arg Ala Thr Glu Trp Gly His Thr Ile
485 490 495
Val Ala Val Thr Pro Leu Leu Asp Gly Val His Asp Tyr Trp Gly Gln
500 505 510
Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro
515 520 525
Glu Ala
530
<210> 134
<211> 530
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb60c7HopQ N277K T270R E197R
<400> 134
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Arg Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg
225 230 235 240
Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala
245 250 255
Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Arg Leu Ala
260 265 270
Gly Gly Thr Thr Lys Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu
275 280 285
Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys
290 295 300
Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His
305 310 315 320
Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser
325 330 335
Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys
340 345 350
Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His
355 360 365
Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala
370 375 380
Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser
385 390 395 400
Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
405 410 415
Ser Arg Tyr Ala Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Pro
420 425 430
Glu Trp Val Ser Ala Ile Asn Ser Pro Gly Gly Ser Thr Ser Tyr Ala
435 440 445
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
450 455 460
Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Asp Asp Thr Ala Val
465 470 475 480
Tyr Tyr Cys Ala Lys Tyr Glu Arg Ala Thr Glu Trp Gly His Thr Ile
485 490 495
Val Ala Val Thr Pro Leu Leu Asp Gly Val His Asp Tyr Trp Gly Gln
500 505 510
Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro
515 520 525
Glu Ala
530
<210> 135
<211> 916
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb60cYgjkQE2
<400> 135
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu
1 5 10 15
Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln
20 25 30
Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser
35 40 45
Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu
50 55 60
Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys
65 70 75 80
Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu
85 90 95
Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His
100 105 110
Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys
115 120 125
Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys
130 135 140
Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp
145 150 155 160
Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly
165 170 175
Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln
180 185 190
Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe
195 200 205
Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe
210 215 220
Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp
225 230 235 240
Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu
245 250 255
Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp
260 265 270
Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly
275 280 285
Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn
290 295 300
Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
305 310 315 320
Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile
325 330 335
Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp
340 345 350
His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His
355 360 365
Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala
370 375 380
Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg
385 390 395 400
Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala
405 410 415
Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val
420 425 430
Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu
435 440 445
Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly
450 455 460
Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp
465 470 475 480
Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala
485 490 495
Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp
500 505 510
Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu
515 520 525
Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His
530 535 540
Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr
545 550 555 560
Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala
565 570 575
Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr
580 585 590
Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg
595 600 605
Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro
610 615 620
Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg
625 630 635 640
Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala
645 650 655
Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg
660 665 670
Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln
675 680 685
Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu
690 695 700
Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser
705 710 715 720
Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys
725 730 735
Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp
740 745 750
Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly
755 760 765
Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe
770 775 780
Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe
785 790 795 800
Thr Phe Ser Arg Tyr Ala Met Ser Trp Val Arg Gln Ala Pro Gly Lys
805 810 815
Gly Pro Glu Trp Val Ser Ala Ile Asn Ser Pro Gly Gly Ser Thr Ser
820 825 830
Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
835 840 845
Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Asp Asp Thr
850 855 860
Ala Val Tyr Tyr Cys Ala Lys Tyr Glu Arg Ala Thr Glu Trp Gly His
865 870 875 880
Thr Ile Val Ala Val Thr Pro Leu Leu Asp Gly Val His Asp Tyr Trp
885 890 895
Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His His His His
900 905 910
Glu Pro Glu Ala
915
<210> 136
<211> 523
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQ
<400> 136
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg
225 230 235 240
Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala
245 250 255
Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala
260 265 270
Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu
275 280 285
Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys
290 295 300
Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His
305 310 315 320
Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser
325 330 335
Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys
340 345 350
Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His
355 360 365
Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala
370 375 380
Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser
385 390 395 400
Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
405 410 415
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
420 425 430
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
435 440 445
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
450 455 460
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
465 470 475 480
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
485 490 495
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
500 505 510
Ser His His His His His His Glu Pro Glu Ala
515 520
<210> 137
<211> 521
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQA5
<400> 137
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Ala Lys Thr Thr
1 5 10 15
Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln
20 25 30
Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile
35 40 45
Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro
50 55 60
Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly
65 70 75 80
Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile
85 90 95
Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr
100 105 110
Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu
115 120 125
Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys
130 135 140
Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His
145 150 155 160
Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala
165 170 175
Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala
180 185 190
Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe
195 200 205
Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr
210 215 220
Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg Leu
225 230 235 240
Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile
245 250 255
Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly
260 265 270
Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg
275 280 285
Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly
290 295 300
Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr
305 310 315 320
Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr
325 330 335
Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala
340 345 350
Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu
355 360 365
Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro
370 375 380
Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys
385 390 395 400
Met Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr
405 410 415
Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe
420 425 430
Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser
435 440 445
Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val
450 455 460
Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
465 470 475 480
Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn
485 490 495
Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His
500 505 510
His His His His His Glu Pro Glu Ala
515 520
<210> 138
<211> 521
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQA12
<400> 138
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Arg Lys Thr Thr
1 5 10 15
Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln
20 25 30
Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile
35 40 45
Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro
50 55 60
Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly
65 70 75 80
Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile
85 90 95
Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr
100 105 110
Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu
115 120 125
Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys
130 135 140
Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His
145 150 155 160
Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala
165 170 175
Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala
180 185 190
Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe
195 200 205
Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr
210 215 220
Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg Leu
225 230 235 240
Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile
245 250 255
Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly
260 265 270
Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg
275 280 285
Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly
290 295 300
Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr
305 310 315 320
Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr
325 330 335
Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala
340 345 350
Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu
355 360 365
Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro
370 375 380
Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys
385 390 395 400
Pro Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr
405 410 415
Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe
420 425 430
Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser
435 440 445
Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val
450 455 460
Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
465 470 475 480
Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn
485 490 495
Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His
500 505 510
His His His His His Glu Pro Glu Ala
515 520
<210> 139
<211> 521
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQB7
<400> 139
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Thr Thr
1 5 10 15
Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln
20 25 30
Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile
35 40 45
Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro
50 55 60
Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly
65 70 75 80
Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile
85 90 95
Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr
100 105 110
Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu
115 120 125
Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys
130 135 140
Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His
145 150 155 160
Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala
165 170 175
Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala
180 185 190
Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe
195 200 205
Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr
210 215 220
Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg Leu
225 230 235 240
Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile
245 250 255
Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly
260 265 270
Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg
275 280 285
Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly
290 295 300
Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr
305 310 315 320
Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr
325 330 335
Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala
340 345 350
Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu
355 360 365
Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro
370 375 380
Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys
385 390 395 400
Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr
405 410 415
Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe
420 425 430
Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser
435 440 445
Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val
450 455 460
Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
465 470 475 480
Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn
485 490 495
Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His
500 505 510
His His His His His Glu Pro Glu Ala
515 520
<210> 140
<211> 521
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQG10
<400> 140
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Leu Lys Thr Thr
1 5 10 15
Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr Gln
20 25 30
Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu Ile
35 40 45
Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr Pro
50 55 60
Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe Gly
65 70 75 80
Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys Ile
85 90 95
Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile Thr
100 105 110
Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala Leu
115 120 125
Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu Lys
130 135 140
Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly His
145 150 155 160
Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser Ala
165 170 175
Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys Ala
180 185 190
Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp Phe
195 200 205
Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn Thr
210 215 220
Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg Leu
225 230 235 240
Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala Ile
245 250 255
Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala Gly
260 265 270
Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu Arg
275 280 285
Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys Gly
290 295 300
Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His Tyr
305 310 315 320
Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser Thr
325 330 335
Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys Ala
340 345 350
Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His Glu
355 360 365
Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala Pro
370 375 380
Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser Lys
385 390 395 400
Ser Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr
405 410 415
Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe
420 425 430
Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser
435 440 445
Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val
450 455 460
Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
465 470 475 480
Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn
485 490 495
Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His
500 505 510
His His His His His Glu Pro Glu Ala
515 520
<210> 141
<211> 909
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkE2
<400> 141
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu
1 5 10 15
Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln
20 25 30
Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser
35 40 45
Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu
50 55 60
Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys
65 70 75 80
Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu
85 90 95
Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His
100 105 110
Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys
115 120 125
Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys
130 135 140
Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp
145 150 155 160
Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly
165 170 175
Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln
180 185 190
Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe
195 200 205
Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe
210 215 220
Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp
225 230 235 240
Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu
245 250 255
Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp
260 265 270
Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly
275 280 285
Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn
290 295 300
Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
305 310 315 320
Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile
325 330 335
Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp
340 345 350
His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His
355 360 365
Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala
370 375 380
Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg
385 390 395 400
Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala
405 410 415
Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val
420 425 430
Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu
435 440 445
Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly
450 455 460
Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp
465 470 475 480
Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala
485 490 495
Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp
500 505 510
Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu
515 520 525
Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His
530 535 540
Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr
545 550 555 560
Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala
565 570 575
Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr
580 585 590
Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg
595 600 605
Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro
610 615 620
Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg
625 630 635 640
Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala
645 650 655
Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg
660 665 670
Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln
675 680 685
Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu
690 695 700
Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser
705 710 715 720
Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys
725 730 735
Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp
740 745 750
Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly
755 760 765
Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe
770 775 780
Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg
785 790 795 800
Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys
805 810 815
Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr
820 825 830
Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
835 840 845
Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr
850 855 860
Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro
865 870 875 880
Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr
885 890 895
Val Ser Ser His His His His His His Glu Pro Glu Ala
900 905
<210> 142
<211> 910
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkA2
<400> 142
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Glu Lys Glu Glu
1 5 10 15
Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln
20 25 30
Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser
35 40 45
Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu
50 55 60
Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys
65 70 75 80
Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu
85 90 95
Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His
100 105 110
Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys
115 120 125
Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys
130 135 140
Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp
145 150 155 160
Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly
165 170 175
Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln
180 185 190
Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe
195 200 205
Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe
210 215 220
Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp
225 230 235 240
Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu
245 250 255
Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp
260 265 270
Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly
275 280 285
Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn
290 295 300
Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
305 310 315 320
Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile
325 330 335
Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp
340 345 350
His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His
355 360 365
Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala
370 375 380
Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg
385 390 395 400
Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala
405 410 415
Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val
420 425 430
Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu
435 440 445
Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly
450 455 460
Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp
465 470 475 480
Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala
485 490 495
Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp
500 505 510
Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu
515 520 525
Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His
530 535 540
Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr
545 550 555 560
Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala
565 570 575
Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr
580 585 590
Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg
595 600 605
Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro
610 615 620
Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg
625 630 635 640
Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala
645 650 655
Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg
660 665 670
Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln
675 680 685
Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu
690 695 700
Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser
705 710 715 720
Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys
725 730 735
Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp
740 745 750
Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly
755 760 765
Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe
770 775 780
Thr Val Lys Lys Gly Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
785 790 795 800
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
805 810 815
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
820 825 830
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
835 840 845
Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp
850 855 860
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
865 870 875 880
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
885 890 895
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
900 905 910
<210> 143
<211> 910
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkC4
<400> 143
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Met Tyr Lys Glu
1 5 10 15
Glu Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly
20 25 30
Gln Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu
35 40 45
Ser Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln
50 55 60
Leu Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val
65 70 75 80
Lys Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser
85 90 95
Leu Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn
100 105 110
His Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala
115 120 125
Lys Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr
130 135 140
Cys Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu
145 150 155 160
Asp Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg
165 170 175
Gly Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr
180 185 190
Gln Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu
195 200 205
Phe Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala
210 215 220
Phe Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe
225 230 235 240
Trp Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala
245 250 255
Leu Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala
260 265 270
Asp Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln
275 280 285
Gly Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr
290 295 300
Asn Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly
305 310 315 320
Gly Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val
325 330 335
Ile Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp
340 345 350
Asp His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly
355 360 365
His Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val
370 375 380
Ala Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp
385 390 395 400
Arg Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu
405 410 415
Ala Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp
420 425 430
Val Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu
435 440 445
Leu Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp
450 455 460
Gly Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser
465 470 475 480
Asp Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser
485 490 495
Ala Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr
500 505 510
Trp Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser
515 520 525
Leu Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala
530 535 540
His Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu
545 550 555 560
Thr Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu
565 570 575
Ala Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu
580 585 590
Tyr Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr
595 600 605
Arg Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser
610 615 620
Pro Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly
625 630 635 640
Arg Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln
645 650 655
Ala Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile
660 665 670
Arg Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro
675 680 685
Gln Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro
690 695 700
Glu Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro
705 710 715 720
Ser Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp
725 730 735
Lys Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp
740 745 750
Trp Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr
755 760 765
Gly Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu
770 775 780
Phe Thr Val Lys Lys Asn Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
785 790 795 800
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
805 810 815
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
820 825 830
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
835 840 845
Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp
850 855 860
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
865 870 875 880
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
885 890 895
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
900 905 910
<210> 144
<211> 911
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cYgjkF5
<400> 144
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Trp Thr Lys Glu
1 5 10 15
Glu Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly
20 25 30
Gln Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu
35 40 45
Ser Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln
50 55 60
Leu Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val
65 70 75 80
Lys Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser
85 90 95
Leu Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn
100 105 110
His Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala
115 120 125
Lys Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr
130 135 140
Cys Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu
145 150 155 160
Asp Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg
165 170 175
Gly Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr
180 185 190
Gln Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu
195 200 205
Phe Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala
210 215 220
Phe Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe
225 230 235 240
Trp Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala
245 250 255
Leu Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala
260 265 270
Asp Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln
275 280 285
Gly Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr
290 295 300
Asn Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly
305 310 315 320
Gly Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val
325 330 335
Ile Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp
340 345 350
Asp His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly
355 360 365
His Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val
370 375 380
Ala Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp
385 390 395 400
Arg Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu
405 410 415
Ala Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp
420 425 430
Val Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu
435 440 445
Leu Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp
450 455 460
Gly Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser
465 470 475 480
Asp Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser
485 490 495
Ala Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr
500 505 510
Trp Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser
515 520 525
Leu Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala
530 535 540
His Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu
545 550 555 560
Thr Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu
565 570 575
Ala Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu
580 585 590
Tyr Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr
595 600 605
Arg Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser
610 615 620
Pro Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly
625 630 635 640
Arg Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln
645 650 655
Ala Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile
660 665 670
Arg Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro
675 680 685
Gln Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro
690 695 700
Glu Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro
705 710 715 720
Ser Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp
725 730 735
Lys Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp
740 745 750
Trp Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr
755 760 765
Gly Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu
770 775 780
Phe Thr Val Lys Lys Gly Ala Ser Leu Arg Leu Ser Cys Ala Ala Ser
785 790 795 800
Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro
805 810 815
Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser
820 825 830
Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp
835 840 845
Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu
850 855 860
Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu
865 870 875 880
Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln
885 890 895
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
900 905 910
<210> 145
<211> 523
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQ C14-C512
<400> 145
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Cys Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg
225 230 235 240
Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala
245 250 255
Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala
260 265 270
Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu
275 280 285
Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys
290 295 300
Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His
305 310 315 320
Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser
325 330 335
Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys
340 345 350
Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His
355 360 365
Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala
370 375 380
Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser
385 390 395 400
Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
405 410 415
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
420 425 430
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
435 440 445
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
450 455 460
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
465 470 475 480
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
485 490 495
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Cys
500 505 510
Ser His His His His His His Glu Pro Glu Ala
515 520
<210> 146
<211> 523
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQ C402-C474
<400> 146
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg
225 230 235 240
Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala
245 250 255
Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala
260 265 270
Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu
275 280 285
Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys
290 295 300
Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His
305 310 315 320
Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser
325 330 335
Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys
340 345 350
Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His
355 360 365
Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala
370 375 380
Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser
385 390 395 400
Lys Cys Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
405 410 415
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
420 425 430
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
435 440 445
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
450 455 460
Thr Val Tyr Leu Gln Met Asp Ser Leu Cys Pro Glu Asp Thr Ala Val
465 470 475 480
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
485 490 495
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
500 505 510
Ser His His His His His His Glu Pro Glu Ala
515 520
<210> 147
<211> 523
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQ C316-C472
<400> 147
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg
225 230 235 240
Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala
245 250 255
Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala
260 265 270
Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu
275 280 285
Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys
290 295 300
Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Cys Lys Asp Phe His
305 310 315 320
Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser
325 330 335
Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys
340 345 350
Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His
355 360 365
Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala
370 375 380
Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser
385 390 395 400
Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
405 410 415
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
420 425 430
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
435 440 445
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
450 455 460
Thr Val Tyr Leu Gln Met Asp Cys Leu Lys Pro Glu Asp Thr Ala Val
465 470 475 480
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
485 490 495
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
500 505 510
Ser His His His His His His Glu Pro Glu Ala
515 520
<210> 148
<211> 523
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQ C314-C472
<400> 148
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg
225 230 235 240
Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala
245 250 255
Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala
260 265 270
Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu
275 280 285
Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys
290 295 300
Gly Gly Tyr Thr Lys Ser Pro Gly Glu Cys Asn Gln Lys Asp Phe His
305 310 315 320
Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser
325 330 335
Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys
340 345 350
Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His
355 360 365
Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala
370 375 380
Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser
385 390 395 400
Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
405 410 415
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
420 425 430
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
435 440 445
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
450 455 460
Thr Val Tyr Leu Gln Met Cys Ser Leu Lys Pro Glu Asp Thr Ala Val
465 470 475 480
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
485 490 495
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
500 505 510
Ser His His His His His His Glu Pro Glu Ala
515 520
<210> 149
<211> 523
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQ C312-C453
<400> 149
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg
225 230 235 240
Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala
245 250 255
Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala
260 265 270
Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu
275 280 285
Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys
290 295 300
Gly Gly Tyr Thr Lys Ser Pro Cys Glu Asn Asn Gln Lys Asp Phe His
305 310 315 320
Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser
325 330 335
Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Asn Thr Leu Lys
340 345 350
Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His
355 360 365
Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala
370 375 380
Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser
385 390 395 400
Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
405 410 415
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
420 425 430
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
435 440 445
Asp Ser Ala Lys Cys Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
450 455 460
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
465 470 475 480
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
485 490 495
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
500 505 510
Ser His His His His His His Glu Pro Glu Ala
515 520
<210> 150
<211> 523
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207c7HopQ C349-C452
<400> 150
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Lys Thr
1 5 10 15
Thr Thr Ser Val Ile Asp Thr Thr Asn Asp Ala Gln Asn Leu Leu Thr
20 25 30
Gln Ala Gln Thr Ile Val Asn Thr Leu Lys Asp Tyr Cys Pro Ile Leu
35 40 45
Ile Ala Lys Ser Ser Ser Ser Asn Gly Gly Thr Asn Asn Ala Asn Thr
50 55 60
Pro Ser Trp Gln Thr Ala Gly Gly Gly Lys Asn Ser Cys Ala Thr Phe
65 70 75 80
Gly Ala Glu Phe Ser Ala Ala Ser Asp Met Ile Asn Asn Ala Gln Lys
85 90 95
Ile Val Gln Glu Thr Gln Gln Leu Ser Ala Asn Gln Pro Lys Asn Ile
100 105 110
Thr Gln Pro His Asn Leu Asn Leu Asn Ser Pro Ser Ser Leu Thr Ala
115 120 125
Leu Ala Gln Lys Met Leu Lys Asn Ala Gln Ser Gln Ala Glu Ile Leu
130 135 140
Lys Leu Ala Asn Gln Val Glu Ser Asp Phe Asn Lys Leu Ser Ser Gly
145 150 155 160
His Leu Lys Asp Tyr Ile Gly Lys Cys Asp Ala Ser Ala Ile Ser Ser
165 170 175
Ala Asn Met Thr Met Gln Asn Gln Lys Asn Asn Trp Gly Asn Gly Cys
180 185 190
Ala Gly Val Glu Glu Thr Gln Ser Leu Leu Lys Thr Ser Ala Ala Asp
195 200 205
Phe Asn Asn Gln Thr Pro Gln Ile Asn Gln Ala Gln Asn Leu Ala Asn
210 215 220
Thr Leu Ile Gln Glu Leu Gly Asn Asn Thr Tyr Glu Gln Leu Ser Arg
225 230 235 240
Leu Leu Thr Asn Asp Asn Gly Thr Asn Ser Lys Thr Ser Ala Gln Ala
245 250 255
Ile Asn Gln Ala Val Asn Asn Leu Asn Glu Arg Ala Lys Thr Leu Ala
260 265 270
Gly Gly Thr Thr Asn Ser Pro Ala Tyr Gln Ala Thr Leu Leu Ala Leu
275 280 285
Arg Ser Val Leu Gly Leu Trp Asn Ser Met Gly Tyr Ala Val Ile Cys
290 295 300
Gly Gly Tyr Thr Lys Ser Pro Gly Glu Asn Asn Gln Lys Asp Phe His
305 310 315 320
Tyr Thr Asp Glu Asn Gly Asn Gly Thr Thr Ile Asn Cys Gly Gly Ser
325 330 335
Thr Asn Ser Asn Gly Thr His Ser Tyr Asn Gly Thr Cys Thr Leu Lys
340 345 350
Ala Asp Lys Asn Val Ser Leu Ser Ile Glu Gln Tyr Glu Lys Ile His
355 360 365
Glu Ala Tyr Gln Ile Leu Ser Lys Ala Leu Lys Gln Ala Gly Leu Ala
370 375 380
Pro Leu Asn Ser Lys Gly Glu Lys Leu Glu Ala His Val Thr Thr Ser
385 390 395 400
Lys Tyr Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
405 410 415
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
420 425 430
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
435 440 445
Asp Ser Ala Cys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
450 455 460
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
465 470 475 480
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
485 490 495
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
500 505 510
Ser His His His His His His Glu Pro Glu Ala
515 520
<210> 151
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinA8
<400> 151
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Asn Cys Ser Val
1 5 10 15
Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr
20 25 30
Val Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
35 40 45
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
50 55 60
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
65 70 75 80
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
115 120 125
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
130 135 140
Ser Ala Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met
145 150 155 160
Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val
165 170 175
Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp
180 185 190
Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys
195 200 205
Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr
210 215 220
Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr
225 230 235 240
Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250
<210> 152
<211> 254
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinD9
<400> 152
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Pro Cys Ser Val
1 5 10 15
Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr
20 25 30
Val Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
35 40 45
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
50 55 60
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
65 70 75 80
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
115 120 125
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
130 135 140
Ser Pro Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met
145 150 155 160
Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val
165 170 175
Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp
180 185 190
Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys
195 200 205
Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr
210 215 220
Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly Thr
225 230 235 240
Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250
<210> 153
<211> 255
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinD10
<400> 153
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gly Asn Cys Ser
1 5 10 15
Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile
20 25 30
Thr Val Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr
35 40 45
Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu
50 55 60
Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr
65 70 75 80
Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys
85 90 95
Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala
100 105 110
Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr
115 120 125
Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
130 135 140
Ser Ser Lys Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val
145 150 155 160
Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val
165 170 175
Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro
180 185 190
Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu
195 200 205
Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln
210 215 220
Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly
225 230 235 240
Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250 255
<210> 154
<211> 255
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinD11
<400> 154
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gly Glu Cys Ser
1 5 10 15
Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile
20 25 30
Thr Val Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr
35 40 45
Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu
50 55 60
Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr
65 70 75 80
Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys
85 90 95
Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala
100 105 110
Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr
115 120 125
Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
130 135 140
Ser Ser Asn Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val
145 150 155 160
Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val
165 170 175
Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro
180 185 190
Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu
195 200 205
Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln
210 215 220
Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly
225 230 235 240
Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250 255
<210> 155
<211> 255
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinG6
<400> 155
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gly Cys Ser Val
1 5 10 15
Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr
20 25 30
Val Ser Thr Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
35 40 45
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
50 55 60
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
65 70 75 80
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
115 120 125
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
130 135 140
Ser Asp Gly Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val
145 150 155 160
Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val
165 170 175
Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro
180 185 190
Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu
195 200 205
Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln
210 215 220
Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly
225 230 235 240
Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250 255
<210> 156
<211> 255
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinB8
<400> 156
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gly Cys Ser Val
1 5 10 15
Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr
20 25 30
Val Ser Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
35 40 45
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
50 55 60
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
65 70 75 80
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
115 120 125
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
130 135 140
Ser Thr Met Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val
145 150 155 160
Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val
165 170 175
Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro
180 185 190
Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu
195 200 205
Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln
210 215 220
Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys Gly
225 230 235 240
Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250 255
<210> 157
<211> 256
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinB2
<400> 157
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gly Gly Cys Ser
1 5 10 15
Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile
20 25 30
Thr Val Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr
35 40 45
Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu
50 55 60
Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr
65 70 75 80
Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys
85 90 95
Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala
100 105 110
Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr
115 120 125
Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
130 135 140
Ser Ser Pro Pro Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn
145 150 155 160
Val Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly
165 170 175
Val Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys
180 185 190
Pro Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly
195 200 205
Glu Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu
210 215 220
Gln Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys
225 230 235 240
Gly Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250 255
<210> 158
<211> 256
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AzurinC8
<400> 158
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Arg Ile Cys Ser
1 5 10 15
Val Asp Ile Gln Gly Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile
20 25 30
Thr Val Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr
35 40 45
Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu
50 55 60
Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr
65 70 75 80
Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys
85 90 95
Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala
100 105 110
Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr
115 120 125
Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
130 135 140
Ser Ser Asn Tyr Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn
145 150 155 160
Val Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly
165 170 175
Val Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys
180 185 190
Pro Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly
195 200 205
Glu Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu
210 215 220
Gln Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Ala Lys
225 230 235 240
Gly Thr Leu Thr Leu Lys His His His His His His Glu Pro Glu Ala
245 250 255
<210> 159
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2A3 (MP1403_A3)
<400> 159
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Gly Leu Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu
130 135 140
Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile
145 150 155 160
Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala
165 170 175
Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys
180 185 190
Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu
195 200 205
Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile
210 215 220
Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr
225 230 235 240
Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu
245 250 255
Val Pro Leu Gly Arg Arg Gly Ser Lys Thr Ile Val Leu Ser Gly Ser
260 265 270
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
275 280 285
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
290 295 300
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
305 310 315 320
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
325 330 335
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
340 345 350
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
355 360 365
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His
370 375 380
His His His Glu Pro Glu Ala
385 390
<210> 160
<211> 390
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2D3 (MP1403_D3)
<400> 160
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Gly Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Arg Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala
130 135 140
Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe
145 150 155 160
Glu Glu Lys Ala Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser
165 170 175
Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu
180 185 190
Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu
195 200 205
Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val
210 215 220
Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys
225 230 235 240
Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Ser Leu Val
245 250 255
Pro Leu Gly Arg Pro Gly Ser Lys Thr Ile Val Leu Ser Gly Ser Leu
260 265 270
Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met
275 280 285
Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly
290 295 300
Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly
305 310 315 320
Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln
325 330 335
Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala
340 345 350
Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp
355 360 365
Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His His
370 375 380
His His Glu Pro Glu Ala
385 390
<210> 161
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2G5 (MP1403_G5)
<400> 161
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Gly Val Gly Ser Lys Ile Ile Val Leu Ser Val Gly Glu
130 135 140
Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile
145 150 155 160
Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala
165 170 175
Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys
180 185 190
Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu
195 200 205
Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile
210 215 220
Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr
225 230 235 240
Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu
245 250 255
Val Pro Leu Gly Arg Leu Gly Ser Lys Thr Ile Val Leu Ser Gly Ser
260 265 270
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Arg Thr Ala Ala
275 280 285
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
290 295 300
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
305 310 315 320
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
325 330 335
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
340 345 350
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
355 360 365
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His
370 375 380
His His His Glu Pro Glu Ala
385 390
<210> 162
<211> 390
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2E6 (MP1403_E6)
<400> 162
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Trp Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala
130 135 140
Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe
145 150 155 160
Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser
165 170 175
Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu
180 185 190
Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu
195 200 205
Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val
210 215 220
Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys
225 230 235 240
Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val
245 250 255
Pro Leu Gly Arg Pro Gly Ser Lys Thr Ile Val Leu Ser Gly Ser Leu
260 265 270
Arg Leu Ser Cys Ala Ala Ser Glu Arg Thr Phe Ser Thr Ala Ala Met
275 280 285
Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly
290 295 300
Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly
305 310 315 320
Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln
325 330 335
Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala
340 345 350
Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp
355 360 365
Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His His
370 375 380
His His Glu Pro Glu Ala
385 390
<210> 163
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2D7 (MP1403_D7)
<400> 163
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Arg Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala
130 135 140
Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe
145 150 155 160
Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser
165 170 175
Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu
180 185 190
Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu
195 200 205
Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val
210 215 220
Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys
225 230 235 240
Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val
245 250 255
Pro Leu Gly Arg Gly Pro Gly Ser Lys Thr Ile Val Leu Ser Gly Ser
260 265 270
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
275 280 285
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
290 295 300
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
305 310 315 320
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
325 330 335
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
340 345 350
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
355 360 365
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His
370 375 380
His His His Glu Pro Glu Ala
385 390
<210> 164
<211> 391
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2A9 (MP1403_A9)
<400> 164
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Gln Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Cys Arg Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu
130 135 140
Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile
145 150 155 160
Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala
165 170 175
Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys
180 185 190
Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu
195 200 205
Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile
210 215 220
Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr
225 230 235 240
Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu
245 250 255
Val Pro Leu Gly Arg Arg Gly Ser Lys Thr Ile Val Leu Ser Gly Ser
260 265 270
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
275 280 285
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
290 295 300
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
305 310 315 320
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
325 330 335
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
340 345 350
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
355 360 365
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His
370 375 380
His His His Glu Pro Glu Ala
385 390
<210> 165
<211> 392
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207cPP7x2B9 (MP1403_B9)
<400> 165
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Ala Thr
1 5 10 15
Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Leu Ile Phe Glu
20 25 30
Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu
35 40 45
Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp
50 55 60
Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro
65 70 75 80
Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala
85 90 95
Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser
100 105 110
Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro
115 120 125
Leu Gly Arg Arg Val Gly Ser Lys Thr Ile Val Leu Ser Val Gly Glu
130 135 140
Ala Thr Arg Thr Leu Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile
145 150 155 160
Phe Glu Glu Lys Val Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala
165 170 175
Ser Leu Arg Gln Asn Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys
180 185 190
Leu Asp Gln Ala Asp Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu
195 200 205
Leu Pro Lys Val Arg Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile
210 215 220
Val Ala Asn Ser Thr Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr
225 230 235 240
Lys Ser Leu Val Ala Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu
245 250 255
Val Pro Leu Gly Arg Pro Leu Gly Ser Lys Thr Ile Val Leu Ser Gly
260 265 270
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala
275 280 285
Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val
290 295 300
Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala
305 310 315 320
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr
325 330 335
Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys
340 345 350
Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu
355 360 365
Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His
370 375 380
His His His His Glu Pro Glu Ala
385 390
<210> 166
<211> 131
<212> PRT
<213> Acinetobacter bacterial phage protein
<400> 166
Met Ala Asn Lys Pro Met Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile
1 5 10 15
Val Trp Ser Asp Pro Thr Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu
20 25 30
Leu Arg Gln Arg Val Lys Val Gly Ile Ala Glu Leu Asn Asn Val Ser
35 40 45
Gly Gln Tyr Val Ser Val Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly
50 55 60
Cys Ala Asp Ala Cys Val Ile Met Pro Asn Glu Asn Gln Ser Ile Arg
65 70 75 80
Thr Val Ile Ser Gly Ser Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu
85 90 95
Trp Glu Thr His Lys Arg Asn Val Asp Thr Leu Phe Ala Ser Gly Asn
100 105 110
Ala Gly Leu Gly Phe Leu Asp Pro Thr Ala Ala Ile Val Ser Ser Asp
115 120 125
Thr Thr Ala
130
<210> 167
<211> 383
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205x2 XX
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (262)
<223> Xaa can be any naturally occurring amino acid
<400> 167
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Lys Pro Met
1 5 10 15
Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr
20 25 30
Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys
35 40 45
Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val
50 55 60
Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val
65 70 75 80
Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser
85 90 95
Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg
100 105 110
Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu
115 120 125
Asp Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile
130 135 140
Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser
145 150 155 160
Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile
165 170 175
Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg
180 185 190
Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro
195 200 205
Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn
210 215 220
Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp
225 230 235 240
Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr
245 250 255
Ala Ala Ile Val Ser Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser
260 265 270
Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro
275 280 285
Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser
290 295 300
Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp
305 310 315 320
Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu
325 330 335
Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu
340 345 350
Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln
355 360 365
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
370 375 380
<210> 168
<211> 382
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205x2C5
<400> 168
Met Val Gln Leu Val Glu Ser Gly Gly Gly Leu Tyr Lys Pro Met Gln
1 5 10 15
Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg
20 25 30
Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val
35 40 45
Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr
50 55 60
Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile
65 70 75 80
Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala
85 90 95
Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn
100 105 110
Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp
115 120 125
Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile Thr
130 135 140
Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser Thr
145 150 155 160
Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile Ala
165 170 175
Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg Pro
180 185 190
Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro Asn
195 200 205
Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn Leu
210 215 220
Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp Thr
225 230 235 240
Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr Ala
245 250 255
Ala Ile Val Ser Asn Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly
260 265 270
Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly
275 280 285
Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr
290 295 300
Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn
305 310 315 320
Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp
325 330 335
Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala
340 345 350
Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val
355 360 365
Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
370 375 380
<210> 169
<211> 383
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205x2B7
<400> 169
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys Pro Met
1 5 10 15
Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr
20 25 30
Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys
35 40 45
Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val
50 55 60
Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val
65 70 75 80
Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser
85 90 95
Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg
100 105 110
Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu
115 120 125
Asp Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile
130 135 140
Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser
145 150 155 160
Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile
165 170 175
Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg
180 185 190
Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro
195 200 205
Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn
210 215 220
Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp
225 230 235 240
Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr
245 250 255
Ala Ala Ile Val Ser Pro Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser
260 265 270
Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro
275 280 285
Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser
290 295 300
Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp
305 310 315 320
Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu
325 330 335
Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu
340 345 350
Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln
355 360 365
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
370 375 380
<210> 170
<211> 383
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205x2B8
<400> 170
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ser Lys Pro Met
1 5 10 15
Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr
20 25 30
Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys
35 40 45
Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val
50 55 60
Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val
65 70 75 80
Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser
85 90 95
Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg
100 105 110
Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu
115 120 125
Asp Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile
130 135 140
Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser
145 150 155 160
Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile
165 170 175
Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg
180 185 190
Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro
195 200 205
Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn
210 215 220
Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp
225 230 235 240
Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr
245 250 255
Ala Ala Ile Val Ser Leu Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser
260 265 270
Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro
275 280 285
Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser
290 295 300
Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp
305 310 315 320
Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu
325 330 335
Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu
340 345 350
Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln
355 360 365
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
370 375 380
<210> 171
<211> 383
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205x2D3
<400> 171
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Leu Lys Pro Met
1 5 10 15
Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr
20 25 30
Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys
35 40 45
Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val
50 55 60
Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val
65 70 75 80
Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser
85 90 95
Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg
100 105 110
Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu
115 120 125
Asp Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile
130 135 140
Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser
145 150 155 160
Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile
165 170 175
Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg
180 185 190
Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro
195 200 205
Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn
210 215 220
Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp
225 230 235 240
Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr
245 250 255
Ala Ala Ile Val Ser Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser
260 265 270
Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro
275 280 285
Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser
290 295 300
Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp
305 310 315 320
Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu
325 330 335
Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu
340 345 350
Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln
355 360 365
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
370 375 380
<210> 172
<211> 383
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205x2A4
<400> 172
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Arg Lys Pro Met
1 5 10 15
Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr
20 25 30
Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys
35 40 45
Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val
50 55 60
Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val
65 70 75 80
Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser
85 90 95
Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg
100 105 110
Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu
115 120 125
Asp Pro Thr Ala Ala Ile Val Ser Ser Asp Lys Pro Met Gln Pro Ile
130 135 140
Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr Arg Leu Ser
145 150 155 160
Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys Val Gly Ile
165 170 175
Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val Tyr Lys Arg
180 185 190
Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val Ile Met Pro
195 200 205
Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser Ala Glu Asn
210 215 220
Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg Asn Val Asp
225 230 235 240
Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu Asp Pro Thr
245 250 255
Ala Ala Ile Val Ser Ser Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser
260 265 270
Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro
275 280 285
Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser
290 295 300
Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp
305 310 315 320
Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu
325 330 335
Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu
340 345 350
Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln
355 360 365
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
370 375 380
<210> 173
<211> 258
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205 XX
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (137)
<223> Xaa can be any naturally occurring amino acid
<400> 173
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Lys Pro Met
1 5 10 15
Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr
20 25 30
Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys
35 40 45
Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val
50 55 60
Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val
65 70 75 80
Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser
85 90 95
Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg
100 105 110
Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu
115 120 125
Asp Pro Thr Ala Ala Ile Val Ser Xaa Gly Ser Leu Arg Leu Ser Cys
130 135 140
Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg
145 150 155 160
Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr
165 170 175
Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile
180 185 190
Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu
195 200 205
Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly
210 215 220
Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln
225 230 235 240
Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro
245 250 255
Glu Ala
<210> 174
<211> 258
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205C12
<400> 174
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Trp Lys Pro Met
1 5 10 15
Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr
20 25 30
Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys
35 40 45
Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val
50 55 60
Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val
65 70 75 80
Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser
85 90 95
Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg
100 105 110
Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu
115 120 125
Asp Pro Thr Ala Ala Ile Val Ser Ser Gly Ser Leu Arg Leu Ser Cys
130 135 140
Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg
145 150 155 160
Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr
165 170 175
Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile
180 185 190
Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu
195 200 205
Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly
210 215 220
Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln
225 230 235 240
Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro
245 250 255
Glu Ala
<210> 175
<211> 258
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205A4
<400> 175
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Met Lys Pro Met
1 5 10 15
Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr
20 25 30
Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys
35 40 45
Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val
50 55 60
Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val
65 70 75 80
Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser
85 90 95
Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg
100 105 110
Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu
115 120 125
Asp Pro Thr Ala Ala Ile Val Ser Gly Gly Ser Leu Arg Leu Ser Cys
130 135 140
Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg
145 150 155 160
Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr
165 170 175
Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile
180 185 190
Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu
195 200 205
Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly
210 215 220
Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln
225 230 235 240
Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro
245 250 255
Glu Ala
<210> 176
<211> 258
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205E8
<400> 176
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Arg Lys Pro Met
1 5 10 15
Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr
20 25 30
Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys
35 40 45
Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val
50 55 60
Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val
65 70 75 80
Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser
85 90 95
Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg
100 105 110
Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu
115 120 125
Asp Pro Thr Ala Ala Ile Val Ser Ile Gly Ser Leu Arg Leu Ser Cys
130 135 140
Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg
145 150 155 160
Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr
165 170 175
Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile
180 185 190
Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu
195 200 205
Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly
210 215 220
Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln
225 230 235 240
Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro
245 250 255
Glu Ala
<210> 177
<211> 258
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207AP205D10
<400> 177
Met Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ser Lys Pro Met
1 5 10 15
Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile Val Trp Ser Asp Pro Thr
20 25 30
Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu Leu Arg Gln Arg Val Lys
35 40 45
Val Gly Ile Ala Glu Leu Asn Asn Val Ser Gly Gln Tyr Val Ser Val
50 55 60
Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly Cys Ala Asp Ala Cys Val
65 70 75 80
Ile Met Pro Asn Glu Asn Gln Ser Ile Arg Thr Val Ile Ser Gly Ser
85 90 95
Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu Trp Glu Thr His Lys Arg
100 105 110
Asn Val Asp Thr Leu Phe Ala Ser Gly Asn Ala Gly Leu Gly Phe Leu
115 120 125
Asp Pro Thr Ala Ala Ile Val Ser His Gly Ser Leu Arg Leu Ser Cys
130 135 140
Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg
145 150 155 160
Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr
165 170 175
Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile
180 185 190
Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu
195 200 205
Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly
210 215 220
Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln
225 230 235 240
Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro
245 250 255
Glu Ala
<210> 178
<211> 208
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207ACPA3
<400> 178
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Gly Thr Ile Glu Glu
1 5 10 15
Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu
20 25 30
Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu
35 40 45
Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu
50 55 60
Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile
65 70 75 80
Asp Tyr Ile Asn Gly His Gln Tyr Ser Leu Arg Leu Ser Cys Ala Ala
85 90 95
Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala
100 105 110
Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly
115 120 125
Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg
130 135 140
Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro
145 150 155 160
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr
165 170 175
Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr
180 185 190
Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
195 200 205
<210> 179
<211> 208
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207ACPA10
<400> 179
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Lys Thr Ile Glu Glu
1 5 10 15
Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu Glu
20 25 30
Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser Leu
35 40 45
Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr Glu
50 55 60
Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala Ile
65 70 75 80
Asp Tyr Ile Asn Gly His Gln Arg Ser Leu Arg Leu Ser Cys Ala Ala
85 90 95
Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala
100 105 110
Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly
115 120 125
Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg
130 135 140
Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro
145 150 155 160
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr
165 170 175
Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr
180 185 190
Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
195 200 205
<210> 180
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207ACPD10
<400> 180
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Arg Thr Thr Ile Glu
1 5 10 15
Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu
20 25 30
Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser
35 40 45
Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr
50 55 60
Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala
65 70 75 80
Ile Asp Tyr Ile Asn Gly His Gln Pro Ser Leu Arg Leu Ser Cys Ala
85 90 95
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
100 105 110
Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val
115 120 125
Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser
130 135 140
Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys
145 150 155 160
Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe
165 170 175
Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly
180 185 190
Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu
195 200 205
Ala
<210> 181
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207ACPD2
<400> 181
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ile Phe Thr Ile Glu
1 5 10 15
Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu
20 25 30
Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser
35 40 45
Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr
50 55 60
Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala
65 70 75 80
Ile Asp Tyr Ile Asn Gly His Gln Ser Ser Leu Arg Leu Ser Cys Ala
85 90 95
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
100 105 110
Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val
115 120 125
Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser
130 135 140
Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys
145 150 155 160
Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe
165 170 175
Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly
180 185 190
Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu
195 200 205
Ala
<210> 182
<211> 210
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207ACPC10
<400> 182
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Leu Glu Thr Ile Glu
1 5 10 15
Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu
20 25 30
Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser
35 40 45
Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr
50 55 60
Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala
65 70 75 80
Ile Asp Tyr Ile Asn Gly His Gln Asn Leu Ser Leu Arg Leu Ser Cys
85 90 95
Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg
100 105 110
Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr
115 120 125
Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile
130 135 140
Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu
145 150 155 160
Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly
165 170 175
Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln
180 185 190
Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro
195 200 205
Glu Ala
210
<210> 183
<211> 210
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207ACPF1
<400> 183
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Trp Tyr Thr Ile Glu
1 5 10 15
Glu Arg Val Lys Lys Ile Ile Gly Glu Gln Leu Gly Val Lys Gln Glu
20 25 30
Glu Val Thr Asn Asn Ala Ser Phe Val Glu Asp Leu Gly Ala Asp Ser
35 40 45
Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu Glu Glu Phe Asp Thr
50 55 60
Glu Ile Pro Asp Glu Glu Ala Glu Lys Ile Thr Thr Val Gln Ala Ala
65 70 75 80
Ile Asp Tyr Ile Asn Gly His Gln Asn Leu Ser Leu Arg Leu Ser Cys
85 90 95
Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg
100 105 110
Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr
115 120 125
Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile
130 135 140
Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu
145 150 155 160
Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly
165 170 175
Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln
180 185 190
Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro
195 200 205
Glu Ala
210
<210> 184
<211> 271
<212> PRT
<213> Artificial Sequence
<220>
<223> N2bNb207NbFedF9E
<220>
<221> MISC_FEATURE
<222> (132)..(135)
<223> Xaa can be any naturally occurring amino acid
<400> 184
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn
1 5 10 15
His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser
20 25 30
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
35 40 45
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
50 55 60
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
65 70 75 80
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
85 90 95
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
100 105 110
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
115 120 125
Asp Tyr Trp Xaa Xaa Xaa Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala
130 135 140
Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val
145 150 155 160
Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly
165 170 175
Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg
180 185 190
Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro
195 200 205
Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr
210 215 220
Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly
225 230 235 240
Gln Gly Thr Gln Val Thr Val Ser Gly Gln Glu Gly Gln Gly Thr Gln
245 250 255
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 185
<211> 271
<212> PRT
<213> Artificial Sequence
<220>
<223> N2bNb207NbFedF9Q
<220>
<221> MISC_FEATURE
<222> (132)..(135)
<223> Xaa can be any naturally occurring amino acid
<400> 185
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn
1 5 10 15
His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser
20 25 30
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
35 40 45
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
50 55 60
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
65 70 75 80
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
85 90 95
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
100 105 110
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
115 120 125
Asp Tyr Trp Xaa Xaa Xaa Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala
130 135 140
Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val
145 150 155 160
Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly
165 170 175
Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg
180 185 190
Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro
195 200 205
Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr
210 215 220
Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly
225 230 235 240
Gln Gly Thr Gln Val Thr Val Ser Gly Gln Gln Gly Gln Gly Thr Gln
245 250 255
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 186
<211> 271
<212> PRT
<213> Artificial Sequence
<220>
<223> N2bNb207NbFedF9 CA14543 (MP1411_B3)
<400> 186
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn
1 5 10 15
His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser
20 25 30
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
35 40 45
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
50 55 60
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
65 70 75 80
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
85 90 95
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
100 105 110
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
115 120 125
Asp Tyr Trp Trp Gly Ser Leu Gly Ser Leu Arg Leu Ser Cys Ala Ala
130 135 140
Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val
145 150 155 160
Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly
165 170 175
Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg
180 185 190
Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro
195 200 205
Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr
210 215 220
Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly
225 230 235 240
Gln Gly Thr Gln Val Thr Val Ser Gly Gln Glu Gly Gln Gly Thr Gln
245 250 255
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 187
<211> 271
<212> PRT
<213> Artificial Sequence
<220>
<223> N2bNb207NbFedF9 CA14544 (MP1411_C6)
<400> 187
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn
1 5 10 15
His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser
20 25 30
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
35 40 45
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
50 55 60
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
65 70 75 80
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
85 90 95
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
100 105 110
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
115 120 125
Asp Tyr Trp Gly Val Leu Leu Gly Ser Leu Arg Leu Ser Cys Ala Ala
130 135 140
Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val
145 150 155 160
Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly
165 170 175
Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg
180 185 190
Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro
195 200 205
Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr
210 215 220
Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly
225 230 235 240
Gln Gly Thr Gln Val Thr Val Ser Gly Gln Gln Gly Gln Gly Thr Gln
245 250 255
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 188
<211> 271
<212> PRT
<213> Artificial Sequence
<220>
<223> N2bNb207NbFedF9 CA14546 (MP1438_A5)
<400> 188
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn
1 5 10 15
His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser
20 25 30
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
35 40 45
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
50 55 60
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
65 70 75 80
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
85 90 95
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
100 105 110
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
115 120 125
Asp Tyr Trp Ala Gln Trp Met Gly Ser Leu Arg Leu Ser Cys Ala Ala
130 135 140
Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val
145 150 155 160
Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly
165 170 175
Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg
180 185 190
Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro
195 200 205
Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr
210 215 220
Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly
225 230 235 240
Gln Gly Thr Gln Val Thr Val Ser Gly Gln Gln Gly Gln Gly Thr Gln
245 250 255
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 189
<211> 271
<212> PRT
<213> Artificial Sequence
<220>
<223> N2bNb207NbFedF9 CA14548 (MP1438_B11)
<400> 189
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn
1 5 10 15
His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser
20 25 30
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
35 40 45
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
50 55 60
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
65 70 75 80
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
85 90 95
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
100 105 110
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
115 120 125
Asp Tyr Trp Ser Glu Val Arg Gly Ser Leu Arg Leu Ser Cys Ala Ala
130 135 140
Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val
145 150 155 160
Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly
165 170 175
Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg
180 185 190
Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro
195 200 205
Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr
210 215 220
Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly
225 230 235 240
Gln Gly Thr Gln Val Thr Val Ser Gly Gln Glu Gly Gln Gly Thr Gln
245 250 255
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 190
<211> 271
<212> PRT
<213> Artificial Sequence
<220>
<223> N2bNb207NbFedF9 CA14550 (MP1438_D2)
<400> 190
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn
1 5 10 15
His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser
20 25 30
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
35 40 45
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
50 55 60
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
65 70 75 80
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
85 90 95
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
100 105 110
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
115 120 125
Asp Tyr Trp Arg Ala Ala Ala Gly Ser Leu Arg Leu Ser Cys Ala Ala
130 135 140
Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val
145 150 155 160
Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly
165 170 175
Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg
180 185 190
Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro
195 200 205
Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr
210 215 220
Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly
225 230 235 240
Gln Gly Thr Gln Val Thr Val Ser Gly Gln Glu Gly Gln Gly Thr Gln
245 250 255
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 191
<211> 271
<212> PRT
<213> Artificial Sequence
<220>
<223> N2bNb207NbFedF9 CA14552 (MP1440_C5)
<400> 191
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Thr Glu Asn
1 5 10 15
His Gln Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Ala Gly Gly Ser
20 25 30
Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala
35 40 45
Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala
50 55 60
Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys
65 70 75 80
Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu
85 90 95
Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala
100 105 110
Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr
115 120 125
Asp Tyr Trp Val Glu Ala Ala Gly Ser Leu Arg Leu Ser Cys Ala Ala
130 135 140
Ser Gly Tyr Thr Tyr Ser Ser Asn Cys Met Ala Trp Phe Arg Gln Val
145 150 155 160
Pro Gly Lys Glu Arg Glu Gly Val Ala Ser Ile Asn Thr Arg Gly Gly
165 170 175
Ile Thr Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg
180 185 190
Asp Asn Ala Lys Asn Thr Val Ser Leu Gln Met Asn Ser Leu Lys Pro
195 200 205
Glu Asp Thr Ala Thr Tyr Tyr Cys Ala Ala Val Arg Glu Ala Thr Tyr
210 215 220
Ser Asp Asn Arg Cys Ser Val Arg Ser Tyr Thr Tyr Asp Tyr Trp Gly
225 230 235 240
Gln Gly Thr Gln Val Thr Val Ser Gly Gln Gln Gly Gln Gly Thr Gln
245 250 255
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 192
<211> 70
<212> PRT
<213> Mycobacterium tuberculosis
<400> 192
Met Ser Asn His Thr Tyr Arg Val Ile Glu Ile Val Gly Thr Ser Pro
1 5 10 15
Asp Gly Val Asp Ala Ala Ile Gln Gly Gly Leu Ala Arg Ala Ala Gln
20 25 30
Thr Met Arg Ala Leu Asp Trp Phe Glu Val Gln Ser Ile Arg Gly His
35 40 45
Leu Val Asp Gly Ala Val Ala His Phe Gln Val Thr Met Lys Val Gly
50 55 60
Phe Arg Leu Glu Asp Ser
65 70
<210> 193
<211> 195
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb207Dodecinrandomlinkers Megabody
<220>
<221> MISC_FEATURE
<222> (12)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (75)
<223> Xaa can be any naturally occurring amino acid
<400> 193
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Xaa Thr Tyr Arg Val
1 5 10 15
Ile Glu Ile Val Gly Thr Ser Pro Asp Gly Val Asp Ala Ala Ile Gln
20 25 30
Gly Gly Leu Ala Arg Ala Ala Gln Thr Met Arg Ala Leu Asp Trp Phe
35 40 45
Glu Val Gln Ser Ile Arg Gly His Leu Val Asp Gly Ala Val Ala His
50 55 60
Phe Gln Val Thr Met Lys Val Gly Phe Arg Xaa Ser Leu Arg Leu Ser
65 70 75 80
Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe
85 90 95
Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp
100 105 110
Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr
115 120 125
Ile Ser Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser
130 135 140
Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg
145 150 155 160
Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly
165 170 175
Gln Gly Thr Gln Val Thr Val Ser Ser His His His His His His Glu
180 185 190
Pro Glu Ala
195
<210> 194
<211> 911
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb35cYgjkE2
<400> 194
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu
1 5 10 15
Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln
20 25 30
Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser
35 40 45
Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu
50 55 60
Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys
65 70 75 80
Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu
85 90 95
Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His
100 105 110
Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys
115 120 125
Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys
130 135 140
Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp
145 150 155 160
Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly
165 170 175
Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln
180 185 190
Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe
195 200 205
Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe
210 215 220
Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp
225 230 235 240
Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu
245 250 255
Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp
260 265 270
Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly
275 280 285
Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn
290 295 300
Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
305 310 315 320
Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile
325 330 335
Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp
340 345 350
His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His
355 360 365
Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala
370 375 380
Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg
385 390 395 400
Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala
405 410 415
Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val
420 425 430
Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu
435 440 445
Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly
450 455 460
Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp
465 470 475 480
Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala
485 490 495
Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp
500 505 510
Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu
515 520 525
Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His
530 535 540
Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr
545 550 555 560
Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala
565 570 575
Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr
580 585 590
Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg
595 600 605
Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro
610 615 620
Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg
625 630 635 640
Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala
645 650 655
Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg
660 665 670
Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln
675 680 685
Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu
690 695 700
Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser
705 710 715 720
Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys
725 730 735
Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp
740 745 750
Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly
755 760 765
Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe
770 775 780
Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe
785 790 795 800
Thr Phe Ser Asn Tyr Lys Met Asn Trp Val Arg Gln Ala Pro Gly Lys
805 810 815
Gly Leu Glu Trp Val Ser Asp Ile Ser Gln Ser Gly Ala Ser Ile Ser
820 825 830
Tyr Thr Gly Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala
835 840 845
Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr
850 855 860
Ala Val Tyr Tyr Cys Ala Arg Cys Pro Ala Pro Phe Thr Arg Asp Cys
865 870 875 880
Phe Asp Val Thr Ser Thr Thr Tyr Ala Tyr Arg Gly Gln Gly Thr Gln
885 890 895
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
900 905 910
<210> 195
<211> 903
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb80cYgjkE2
<400> 195
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu
1 5 10 15
Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln
20 25 30
Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser
35 40 45
Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu
50 55 60
Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys
65 70 75 80
Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu
85 90 95
Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His
100 105 110
Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys
115 120 125
Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys
130 135 140
Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp
145 150 155 160
Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly
165 170 175
Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln
180 185 190
Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe
195 200 205
Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe
210 215 220
Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp
225 230 235 240
Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu
245 250 255
Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp
260 265 270
Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly
275 280 285
Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn
290 295 300
Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
305 310 315 320
Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile
325 330 335
Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp
340 345 350
His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His
355 360 365
Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala
370 375 380
Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg
385 390 395 400
Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala
405 410 415
Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val
420 425 430
Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu
435 440 445
Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly
450 455 460
Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp
465 470 475 480
Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala
485 490 495
Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp
500 505 510
Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu
515 520 525
Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His
530 535 540
Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr
545 550 555 560
Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala
565 570 575
Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr
580 585 590
Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg
595 600 605
Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro
610 615 620
Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg
625 630 635 640
Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala
645 650 655
Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg
660 665 670
Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln
675 680 685
Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu
690 695 700
Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser
705 710 715 720
Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys
725 730 735
Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp
740 745 750
Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly
755 760 765
Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe
770 775 780
Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Ser
785 790 795 800
Ile Phe Ser Ile Asn Thr Met Gly Trp Tyr Arg Gln Ala Pro Gly Lys
805 810 815
Gln Arg Glu Leu Val Ala Ala Ile His Ser Gly Gly Ser Thr Asn Tyr
820 825 830
Ala Asn Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Ala
835 840 845
Asn Thr Val Tyr Leu Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala
850 855 860
Val Tyr Tyr Cys Asn Val Lys Asp Tyr Gly Ala Val Leu Tyr Glu Tyr
865 870 875 880
Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His His His
885 890 895
His His His Glu Pro Glu Ala
900
<210> 196
<211> 908
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb25cYgjkE2
<400> 196
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu
1 5 10 15
Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln
20 25 30
Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser
35 40 45
Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu
50 55 60
Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys
65 70 75 80
Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu
85 90 95
Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His
100 105 110
Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys
115 120 125
Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys
130 135 140
Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp
145 150 155 160
Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly
165 170 175
Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln
180 185 190
Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe
195 200 205
Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe
210 215 220
Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp
225 230 235 240
Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu
245 250 255
Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp
260 265 270
Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly
275 280 285
Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn
290 295 300
Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
305 310 315 320
Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile
325 330 335
Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp
340 345 350
His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His
355 360 365
Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala
370 375 380
Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg
385 390 395 400
Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala
405 410 415
Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val
420 425 430
Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu
435 440 445
Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly
450 455 460
Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp
465 470 475 480
Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala
485 490 495
Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp
500 505 510
Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu
515 520 525
Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His
530 535 540
Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr
545 550 555 560
Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala
565 570 575
Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr
580 585 590
Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg
595 600 605
Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro
610 615 620
Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg
625 630 635 640
Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala
645 650 655
Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg
660 665 670
Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln
675 680 685
Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu
690 695 700
Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser
705 710 715 720
Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys
725 730 735
Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp
740 745 750
Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly
755 760 765
Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe
770 775 780
Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly His
785 790 795 800
Thr Phe Asn Tyr Pro Ile Met Gly Trp Phe Arg Gln Ala Pro Gly Lys
805 810 815
Glu Arg Glu Phe Val Gly Ala Ile Ser Trp Ser Gly Gly Ser Thr Ser
820 825 830
Tyr Ala Asp Ser Val Lys Asp Arg Phe Thr Ile Ser Arg Asp Asn Ala
835 840 845
Lys Asn Thr Val Tyr Leu Glu Met Asn Asn Leu Lys Pro Glu Asp Thr
850 855 860
Ala Val Tyr Tyr Cys Ala Ala Lys Gly Arg Tyr Ser Gly Gly Leu Tyr
865 870 875 880
Tyr Pro Thr Asn Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
885 890 895
Ser Ser His His His His His His Glu Pro Glu Ala
900 905
<210> 197
<211> 906
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb38cYgjkE2
<400> 197
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu
1 5 10 15
Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln
20 25 30
Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser
35 40 45
Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu
50 55 60
Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys
65 70 75 80
Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu
85 90 95
Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His
100 105 110
Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys
115 120 125
Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys
130 135 140
Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp
145 150 155 160
Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly
165 170 175
Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln
180 185 190
Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe
195 200 205
Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe
210 215 220
Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp
225 230 235 240
Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu
245 250 255
Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp
260 265 270
Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly
275 280 285
Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn
290 295 300
Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
305 310 315 320
Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile
325 330 335
Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp
340 345 350
His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His
355 360 365
Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala
370 375 380
Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg
385 390 395 400
Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala
405 410 415
Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val
420 425 430
Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu
435 440 445
Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly
450 455 460
Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp
465 470 475 480
Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala
485 490 495
Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp
500 505 510
Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu
515 520 525
Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His
530 535 540
Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr
545 550 555 560
Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala
565 570 575
Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr
580 585 590
Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg
595 600 605
Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro
610 615 620
Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg
625 630 635 640
Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala
645 650 655
Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg
660 665 670
Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln
675 680 685
Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu
690 695 700
Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser
705 710 715 720
Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys
725 730 735
Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp
740 745 750
Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly
755 760 765
Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe
770 775 780
Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg
785 790 795 800
Thr Phe Thr Thr Tyr Ile Met Ala Trp Phe Arg Gln Ala Pro Gly Lys
805 810 815
Glu Arg Glu Phe Leu Ala Ala Met Asp Gln Gly Arg Ile Gln Tyr Tyr
820 825 830
Gly Asp Ser Val Arg Gly Arg Phe Thr Ile Ser Arg Asp Tyr Ala Lys
835 840 845
Asn Ser Val Asp Leu Gln Leu Asp Gly Leu Arg Pro Glu Asp Thr Ala
850 855 860
Val Tyr Tyr Cys Ala Ala Gly Ala Gly Phe Trp Gly Leu Arg Thr Ala
865 870 875 880
Ser Ser Tyr His Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
885 890 895
His His His His His His Glu Pro Glu Ala
900 905
<210> 198
<211> 124
<212> PRT
<213> Artificial Sequence
<220>
<223> Nb22 Tropomyosin-Related Kinase receptor B (TrkB)-specific
Nanobody
<400> 198
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Thr Ala Ser Gly Phe Thr Phe Asp Asn Tyr
20 25 30
Ala Ile Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Glu Gly Val
35 40 45
Ser Cys Ile Ser Arg Ser Gly Arg Ser Thr Tyr Tyr Ala Asp Ser Val
50 55 60
Lys Gly Arg Val Thr Ile Ala Lys Glu Lys Asn Thr Val Leu Leu Gln
65 70 75 80
Met Asn Asp Leu Gln Pro Asp Asp Thr Ala Val Tyr Tyr Cys Ala Ala
85 90 95
Gly Thr Val Thr Val Val Gly Ser Ala Cys Pro Ser Thr Ala Arg Arg
100 105 110
Leu Trp Gly Arg Gly Thr Gln Val Thr Val Ser Ser
115 120
<210> 199
<211> 907
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb22cYgjkE2
<400> 199
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Tyr Lys Glu Glu
1 5 10 15
Thr Gln Ser Gly Leu Asn Asn Tyr Ala Arg Val Val Glu Lys Gly Gln
20 25 30
Tyr Asp Ser Leu Glu Ile Pro Ala Gln Val Ala Ala Ser Trp Glu Ser
35 40 45
Gly Arg Asp Asp Ala Ala Val Phe Gly Phe Ile Asp Lys Glu Gln Leu
50 55 60
Asp Lys Tyr Val Ala Asn Gly Gly Lys Arg Ser Asp Trp Thr Val Lys
65 70 75 80
Phe Ala Glu Asn Arg Ser Gln Asp Gly Thr Leu Leu Gly Tyr Ser Leu
85 90 95
Leu Gln Glu Ser Val Asp Gln Ala Ser Tyr Met Tyr Ser Asp Asn His
100 105 110
Tyr Leu Ala Glu Met Ala Thr Ile Leu Gly Lys Pro Glu Glu Ala Lys
115 120 125
Arg Tyr Arg Gln Leu Ala Gln Gln Leu Ala Asp Tyr Ile Asn Thr Cys
130 135 140
Met Phe Asp Pro Thr Thr Gln Phe Tyr Tyr Asp Val Arg Ile Glu Asp
145 150 155 160
Lys Pro Leu Ala Asn Gly Cys Ala Gly Lys Pro Ile Val Glu Arg Gly
165 170 175
Lys Gly Pro Glu Gly Trp Ser Pro Leu Phe Asn Gly Ala Ala Thr Gln
180 185 190
Ala Asn Ala Asp Ala Val Val Lys Val Met Leu Asp Pro Lys Glu Phe
195 200 205
Asn Thr Phe Val Pro Leu Gly Thr Ala Ala Leu Thr Asn Pro Ala Phe
210 215 220
Gly Ala Asp Ile Tyr Trp Arg Gly Arg Val Trp Val Asp Gln Phe Trp
225 230 235 240
Phe Gly Leu Lys Gly Met Glu Arg Tyr Gly Tyr Arg Asp Asp Ala Leu
245 250 255
Lys Leu Ala Asp Thr Phe Phe Arg His Ala Lys Gly Leu Thr Ala Asp
260 265 270
Gly Pro Ile Gln Glu Asn Tyr Asn Pro Leu Thr Gly Ala Gln Gln Gly
275 280 285
Ala Pro Asn Phe Ser Trp Ser Ala Ala His Leu Tyr Met Leu Tyr Asn
290 295 300
Asp Phe Phe Arg Lys Gln Ala Ser Gly Gly Gly Ser Gly Gly Gly Gly
305 310 315 320
Ser Gly Gly Gly Gly Ser Gly Asn Ala Asp Asn Tyr Lys Asn Val Ile
325 330 335
Asn Arg Thr Gly Ala Pro Gln Tyr Met Lys Asp Tyr Asp Tyr Asp Asp
340 345 350
His Gln Arg Phe Asn Pro Phe Phe Asp Leu Gly Ala Trp His Gly His
355 360 365
Leu Leu Pro Asp Gly Pro Asn Thr Met Gly Gly Phe Pro Gly Val Ala
370 375 380
Leu Leu Thr Glu Glu Tyr Ile Asn Phe Met Ala Ser Asn Phe Asp Arg
385 390 395 400
Leu Thr Val Trp Gln Asp Gly Lys Lys Val Asp Phe Thr Leu Glu Ala
405 410 415
Tyr Ser Ile Pro Gly Ala Leu Val Gln Lys Leu Thr Ala Lys Asp Val
420 425 430
Gln Val Glu Met Thr Leu Arg Phe Ala Thr Pro Arg Thr Ser Leu Leu
435 440 445
Glu Thr Lys Ile Thr Ser Asn Lys Pro Leu Asp Leu Val Trp Asp Gly
450 455 460
Glu Leu Leu Glu Lys Leu Glu Ala Lys Glu Gly Lys Pro Leu Ser Asp
465 470 475 480
Lys Thr Ile Ala Gly Glu Tyr Pro Asp Tyr Gln Arg Lys Ile Ser Ala
485 490 495
Thr Arg Asp Gly Leu Lys Val Thr Phe Gly Lys Val Arg Ala Thr Trp
500 505 510
Asp Leu Leu Thr Ser Gly Glu Ser Glu Tyr Gln Val His Lys Ser Leu
515 520 525
Pro Val Gln Thr Glu Ile Asn Gly Asn Arg Phe Thr Ser Lys Ala His
530 535 540
Ile Asn Gly Ser Thr Thr Leu Tyr Thr Thr Tyr Ser His Leu Leu Thr
545 550 555 560
Ala Gln Glu Val Ser Lys Glu Gln Met Gln Ile Arg Asp Ile Leu Ala
565 570 575
Arg Pro Ala Phe Tyr Leu Thr Ala Ser Gln Gln Arg Trp Glu Glu Tyr
580 585 590
Leu Lys Lys Gly Leu Thr Asn Pro Asp Ala Thr Pro Glu Gln Thr Arg
595 600 605
Val Ala Val Lys Ala Ile Glu Thr Leu Asn Gly Asn Trp Arg Ser Pro
610 615 620
Gly Gly Ala Val Lys Phe Asn Thr Val Thr Pro Ser Val Thr Gly Arg
625 630 635 640
Trp Phe Ser Gly Asn Gln Thr Trp Pro Trp Asp Thr Trp Lys Gln Ala
645 650 655
Phe Ala Met Ala His Phe Asn Pro Asp Ile Ala Lys Glu Asn Ile Arg
660 665 670
Ala Val Phe Ser Trp Gln Ile Gln Pro Gly Asp Ser Val Arg Pro Gln
675 680 685
Asp Val Gly Phe Val Pro Asp Leu Ile Ala Trp Asn Leu Ser Pro Glu
690 695 700
Arg Gly Gly Asp Gly Gly Asn Trp Asn Glu Arg Asn Thr Lys Pro Ser
705 710 715 720
Leu Ala Ala Trp Ser Val Met Glu Val Tyr Asn Val Thr Gln Asp Lys
725 730 735
Thr Trp Val Ala Glu Met Tyr Pro Lys Leu Val Ala Tyr His Asp Trp
740 745 750
Trp Leu Arg Asn Arg Asp His Asn Gly Asn Gly Val Pro Glu Tyr Gly
755 760 765
Ala Thr Arg Asp Lys Ala His Asn Thr Glu Ser Gly Glu Met Leu Phe
770 775 780
Thr Val Lys Lys Asp Ser Leu Arg Leu Ser Cys Thr Ala Ser Gly Phe
785 790 795 800
Thr Phe Asp Asn Tyr Ala Ile Gly Trp Phe Arg Gln Ala Pro Gly Lys
805 810 815
Glu Arg Glu Gly Val Ser Cys Ile Ser Arg Ser Gly Arg Ser Thr Tyr
820 825 830
Tyr Ala Asp Ser Val Lys Gly Arg Val Thr Ile Ala Lys Glu Lys Asn
835 840 845
Thr Val Leu Leu Gln Met Asn Asp Leu Gln Pro Asp Asp Thr Ala Val
850 855 860
Tyr Tyr Cys Ala Ala Gly Thr Val Thr Val Val Gly Ser Ala Cys Pro
865 870 875 880
Ser Thr Ala Arg Arg Leu Trp Gly Arg Gly Thr Gln Val Thr Val Ser
885 890 895
Ser His His His His His His Glu Pro Glu Ala
900 905
<210> 200
<211> 125
<212> PRT
<213> Burkholderia cenocepacia
<400> 200
Met His His His His His His Met Gln Val Gln Asp Leu Thr Gly Ala
1 5 10 15
Ala Leu Asp Tyr Trp Val Ala Thr Ala Glu Gly His Glu Val Pro Arg
20 25 30
Ala Asp Ala Ser Gly Cys Thr Ser Ile Arg Glu Pro Gly Gly Val Pro
35 40 45
Thr Pro Phe Ala Pro Ser Ser Ser Trp Ala Asp Gly Gly Pro Ile Val
50 55 60
Glu Arg Leu Pro Phe Ala Gly Phe Glu Arg Asp Gly Gly Arg Gly Ala
65 70 75 80
Trp Arg Ala Val Leu His Arg Ala Val Pro Ala Ala Gly Glu Arg Cys
85 90 95
Thr Phe Asn Gln Ser Gly Pro Thr Leu Leu Ile Ala Ala Met Arg Thr
100 105 110
Leu Val Ala Ser Thr Phe Gly Asp Asp Val Pro Asp Leu
115 120 125
<210> 201
<211> 249
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb2074QYBrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (128)
<223> Xaa can be any naturally occurring amino acid
<400> 201
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Met Gln Val
1 5 10 15
Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr Trp Val Ala Thr Ala Glu
20 25 30
Gly His Glu Val Pro Arg Ala Asp Ala Ser Gly Cys Thr Ser Ile Arg
35 40 45
Glu Pro Gly Gly Val Pro Thr Pro Phe Ala Pro Ser Ser Ser Trp Ala
50 55 60
Asp Gly Gly Pro Ile Val Glu Arg Leu Pro Phe Ala Gly Phe Glu Arg
65 70 75 80
Asp Gly Gly Arg Gly Ala Trp Arg Ala Val Leu His Arg Ala Val Pro
85 90 95
Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln Ser Gly Pro Thr Leu Leu
100 105 110
Ile Ala Ala Met Arg Thr Leu Val Ala Ser Thr Phe Gly Asp Asp Xaa
115 120 125
Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser Thr
130 135 140
Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp Phe
145 150 155 160
Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp Ser
165 170 175
Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Val
180 185 190
Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr
195 200 205
Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala Asn
210 215 220
Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser His
225 230 235 240
His His His His His Glu Pro Glu Ala
245
<210> 202
<211> 251
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb2074QYBrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (129)..(130)
<223> Xaa can be any naturally occurring amino acid
<400> 202
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Met Gln
1 5 10 15
Val Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr Trp Val Ala Thr Ala
20 25 30
Glu Gly His Glu Val Pro Arg Ala Asp Ala Ser Gly Cys Thr Ser Ile
35 40 45
Arg Glu Pro Gly Gly Val Pro Thr Pro Phe Ala Pro Ser Ser Ser Trp
50 55 60
Ala Asp Gly Gly Pro Ile Val Glu Arg Leu Pro Phe Ala Gly Phe Glu
65 70 75 80
Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala Val Leu His Arg Ala Val
85 90 95
Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln Ser Gly Pro Thr Leu
100 105 110
Leu Ile Ala Ala Met Arg Thr Leu Val Ala Ser Thr Phe Gly Asp Asp
115 120 125
Xaa Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe
130 135 140
Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg
145 150 155 160
Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala
165 170 175
Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
180 185 190
Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val
195 200 205
Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg
210 215 220
Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser
225 230 235 240
Ser His His His His His His Glu Pro Glu Ala
245 250
<210> 203
<211> 250
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb2074QYBrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (129)
<223> Xaa can be any naturally occurring amino acid
<400> 203
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Xaa Met Gln
1 5 10 15
Val Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr Trp Val Ala Thr Ala
20 25 30
Glu Gly His Glu Val Pro Arg Ala Asp Ala Ser Gly Cys Thr Ser Ile
35 40 45
Arg Glu Pro Gly Gly Val Pro Thr Pro Phe Ala Pro Ser Ser Ser Trp
50 55 60
Ala Asp Gly Gly Pro Ile Val Glu Arg Leu Pro Phe Ala Gly Phe Glu
65 70 75 80
Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala Val Leu His Arg Ala Val
85 90 95
Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln Ser Gly Pro Thr Leu
100 105 110
Leu Ile Ala Ala Met Arg Thr Leu Val Ala Ser Thr Phe Gly Asp Asp
115 120 125
Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser
130 135 140
Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp
145 150 155 160
Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp
165 170 175
Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr
180 185 190
Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr
195 200 205
Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala
210 215 220
Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
225 230 235 240
His His His His His His Glu Pro Glu Ala
245 250
<210> 204
<211> 250
<212> PRT
<213> Artificial Sequence
<220>
<223> MbNb2074QYBrandomlinkers
<220>
<221> MISC_FEATURE
<222> (13)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (128)..(129)
<223> Xaa can be any naturally occurring amino acid
<400> 204
Gln Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Xaa Met Gln Val
1 5 10 15
Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr Trp Val Ala Thr Ala Glu
20 25 30
Gly His Glu Val Pro Arg Ala Asp Ala Ser Gly Cys Thr Ser Ile Arg
35 40 45
Glu Pro Gly Gly Val Pro Thr Pro Phe Ala Pro Ser Ser Ser Trp Ala
50 55 60
Asp Gly Gly Pro Ile Val Glu Arg Leu Pro Phe Ala Gly Phe Glu Arg
65 70 75 80
Asp Gly Gly Arg Gly Ala Trp Arg Ala Val Leu His Arg Ala Val Pro
85 90 95
Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln Ser Gly Pro Thr Leu Leu
100 105 110
Ile Ala Ala Met Arg Thr Leu Val Ala Ser Thr Phe Gly Asp Asp Xaa
115 120 125
Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg Thr Phe Ser
130 135 140
Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys Glu Arg Asp
145 150 155 160
Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser Thr Tyr Tyr Ala Asp
165 170 175
Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr
180 185 190
Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr
195 200 205
Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu Ala Pro Thr Arg Ala
210 215 220
Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln Val Thr Val Ser Ser
225 230 235 240
His His His His His His Glu Pro Glu Ala
245 250
<210> 205
<211> 271
<212> PRT
<213> Artificial Sequence
<220>
<223> PelB_MbNb2074QYBrandomlinkers
<220>
<221> MISC_FEATURE
<222> (35)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (150)
<223> Xaa can be any naturally occurring amino acid
<400> 205
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
1 5 10 15
Ala Gln Pro Ala Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly
20 25 30
Leu Val Xaa Met Gln Val Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr
35 40 45
Trp Val Ala Thr Ala Glu Gly His Glu Val Pro Arg Ala Asp Ala Ser
50 55 60
Gly Cys Thr Ser Ile Arg Glu Pro Gly Gly Val Pro Thr Pro Phe Ala
65 70 75 80
Pro Ser Ser Ser Trp Ala Asp Gly Gly Pro Ile Val Glu Arg Leu Pro
85 90 95
Phe Ala Gly Phe Glu Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala Val
100 105 110
Leu His Arg Ala Val Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln
115 120 125
Ser Gly Pro Thr Leu Leu Ile Ala Ala Met Arg Thr Leu Val Ala Ser
130 135 140
Thr Phe Gly Asp Asp Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser
145 150 155 160
Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala Pro
165 170 175
Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly Ser
180 185 190
Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg Asp
195 200 205
Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro Glu
210 215 220
Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr Leu
225 230 235 240
Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr Gln
245 250 255
Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 206
<211> 273
<212> PRT
<213> Artificial Sequence
<220>
<223> PelB_MbNb2074QYBrandomlinkers
<220>
<221> MISC_FEATURE
<222> (35)..(36)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (151)..(152)
<223> Xaa can be any naturally occurring amino acid
<400> 206
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
1 5 10 15
Ala Gln Pro Ala Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly
20 25 30
Leu Val Xaa Xaa Met Gln Val Gln Asp Leu Thr Gly Ala Ala Leu Asp
35 40 45
Tyr Trp Val Ala Thr Ala Glu Gly His Glu Val Pro Arg Ala Asp Ala
50 55 60
Ser Gly Cys Thr Ser Ile Arg Glu Pro Gly Gly Val Pro Thr Pro Phe
65 70 75 80
Ala Pro Ser Ser Ser Trp Ala Asp Gly Gly Pro Ile Val Glu Arg Leu
85 90 95
Pro Phe Ala Gly Phe Glu Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala
100 105 110
Val Leu His Arg Ala Val Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn
115 120 125
Gln Ser Gly Pro Thr Leu Leu Ile Ala Ala Met Arg Thr Leu Val Ala
130 135 140
Ser Thr Phe Gly Asp Asp Xaa Xaa Gly Ser Leu Arg Leu Ser Cys Ala
145 150 155 160
Ala Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln
165 170 175
Ala Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val
180 185 190
Gly Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser
195 200 205
Arg Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys
210 215 220
Pro Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe
225 230 235 240
Thr Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly
245 250 255
Thr Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu
260 265 270
Ala
<210> 207
<211> 272
<212> PRT
<213> Artificial Sequence
<220>
<223> PelB_MbNb2074QYBrandomlinkers
<220>
<221> MISC_FEATURE
<222> (35)..(36)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (151)
<223> Xaa can be any naturally occurring amino acid
<400> 207
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
1 5 10 15
Ala Gln Pro Ala Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly
20 25 30
Leu Val Xaa Xaa Met Gln Val Gln Asp Leu Thr Gly Ala Ala Leu Asp
35 40 45
Tyr Trp Val Ala Thr Ala Glu Gly His Glu Val Pro Arg Ala Asp Ala
50 55 60
Ser Gly Cys Thr Ser Ile Arg Glu Pro Gly Gly Val Pro Thr Pro Phe
65 70 75 80
Ala Pro Ser Ser Ser Trp Ala Asp Gly Gly Pro Ile Val Glu Arg Leu
85 90 95
Pro Phe Ala Gly Phe Glu Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala
100 105 110
Val Leu His Arg Ala Val Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn
115 120 125
Gln Ser Gly Pro Thr Leu Leu Ile Ala Ala Met Arg Thr Leu Val Ala
130 135 140
Ser Thr Phe Gly Asp Asp Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala
145 150 155 160
Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala
165 170 175
Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly
180 185 190
Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg
195 200 205
Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro
210 215 220
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr
225 230 235 240
Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr
245 250 255
Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 208
<211> 272
<212> PRT
<213> Artificial Sequence
<220>
<223> PelB_MbNb2074QYBrandomlinkers
<220>
<221> MISC_FEATURE
<222> (35)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (150)..(151)
<223> Xaa can be any naturally occurring amino acid
<400> 208
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
1 5 10 15
Ala Gln Pro Ala Met Ala Gln Val Gln Leu Val Glu Ser Gly Gly Gly
20 25 30
Leu Val Xaa Met Gln Val Gln Asp Leu Thr Gly Ala Ala Leu Asp Tyr
35 40 45
Trp Val Ala Thr Ala Glu Gly His Glu Val Pro Arg Ala Asp Ala Ser
50 55 60
Gly Cys Thr Ser Ile Arg Glu Pro Gly Gly Val Pro Thr Pro Phe Ala
65 70 75 80
Pro Ser Ser Ser Trp Ala Asp Gly Gly Pro Ile Val Glu Arg Leu Pro
85 90 95
Phe Ala Gly Phe Glu Arg Asp Gly Gly Arg Gly Ala Trp Arg Ala Val
100 105 110
Leu His Arg Ala Val Pro Ala Ala Gly Glu Arg Cys Thr Phe Asn Gln
115 120 125
Ser Gly Pro Thr Leu Leu Ile Ala Ala Met Arg Thr Leu Val Ala Ser
130 135 140
Thr Phe Gly Asp Asp Xaa Xaa Gly Ser Leu Arg Leu Ser Cys Ala Ala
145 150 155 160
Ser Gly Arg Thr Phe Ser Thr Ala Ala Met Gly Trp Phe Arg Gln Ala
165 170 175
Pro Gly Lys Glu Arg Asp Phe Val Ala Gly Ile Tyr Trp Thr Val Gly
180 185 190
Ser Thr Tyr Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Arg
195 200 205
Asp Asn Ala Lys Asn Thr Val Tyr Leu Gln Met Asp Ser Leu Lys Pro
210 215 220
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Ala Arg Arg Arg Gly Phe Thr
225 230 235 240
Leu Ala Pro Thr Arg Ala Asn Glu Tyr Asp Tyr Trp Gly Gln Gly Thr
245 250 255
Gln Val Thr Val Ser Ser His His His His His His Glu Pro Glu Ala
260 265 270
<210> 209
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> affinity tag
<400> 209
Glu Pro Glu Ala
1
<210> 210
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> antigenbinding chimeric protein
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 210
Leu Val Xaa Xaa Lys Thr
1 5
<210> 211
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> antigen-binding chimeric protein
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa can be any naturally occurring amino acid
<400> 211
Ser Lys Xaa Xaa Ser Leu
1 5
<210> 212
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> antigen-binding chimeric protein
<220>
<221> MISC_FEATURE
<222> (3)
<223> Xaa can be any naturally occurring amino acid
<400> 212
Ser Lys Xaa Ser Leu
1 5
<210> 213
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> antigen-binding chimeric protein
<220>
<221> MISC_FEATURE
<222> (3)
<223> Xaa can be any naturally occurring amino acid
<400> 213
Leu Val Xaa Lys Thr
1 5
<210> 214
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> linker peptide
<400> 214
Thr Glu Asn His
1
<210> 215
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> linker peptide
<400> 215
Trp Gly Ser Leu
1
<210> 216
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> linker peptide
<400> 216
Gly Val Leu Leu
1
<210> 217
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> linker peptide
<400> 217
Ala Gln Trp Met
1
<210> 218
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> linker peptide
<400> 218
Ser Glu Val Arg
1
<210> 219
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> linker peptide
<400> 219
Arg Ala Ala Ala
1
<210> 220
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> linker peptide
<400> 220
Val Glu Ala Ala
1
Claims (33)
- 스캐폴드 단백질과 융합된 항원-결합 도메인을 포함하는 항원-결합 키메라 단백질로서, 상기 스캐폴드 단백질은 상기 도메인의 하나 이상의 접근가능한 부위에서 항원-결합 도메인의 토폴로지를 방해하는 것인 항원-결합 키메라 단백질.
- 제1항에 있어서, 스캐폴드 단백질은 적어도 둘 이상의 직접 융합 또는 링커에 의해 만들어진 융합을 통해서, 상기 도메인의 하나 이상의 접근가능한 부위에서 상기 항원-결합 도메인에 융합되는 것인 항원-결합 키메라 단백질.
- 제1항 또는 제2항에 있어서, 상기 하나 이상의 접근가능한 부위는 상기 도메인의 노출된 영역에 존재하는 것인 항원-결합 키메라 단백질.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 항원-결합 도메인은 적어도 7개의 역평행 β-스트랜드 및 적어도 3개의 β-턴을 포함하고, 상기 β-스트랜드 및 β-턴은 IMGT 명명법에 따라 정의되는 것인 항원-결합 키메라 단백질.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 항원-결합 도메인은 면역글로불린 (Ig) 도메인을 포함하는 것인 항원-결합 키메라 단백질.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 스캐폴드 단백질은 다음과 같이 삽입되는 것인 항원-결합 키메라 단백질:
a. 상기 항원-결합 도메인의 β-스트랜드 A 및 B를 연결하는 제1 β-턴 내; 또는
b. 상기 항원-결합 도메인의 β-스트랜드 C 및 C'을 연결하는 β-턴 내; 또는
c. 상기 항원-결합 도메인의 β-스트랜드 C" 및 D를 연결하는 β-턴 내; 또는
d. 상기 항원-결합 도메인의 β-스트랜드 D 및 E를 연결하는 β-턴 내; 또는
e. 상기 항원-결합 도메인의 β-스트랜드 E 및 F를 연결하는 β-턴 내
(여기서 β-스트랜드는 IMGT 명명법에 따라 정의됨). - 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 스캐폴드 단백질은 원형 배열 단백질인 항원-결합 키메라 단백질.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 스캐폴드 단백질은 단량체 단백질인 항원-결합 키메라 단백질.
- 제1항 내지 제7항 중 어느 한 항에 있어서, 스캐폴드 단백질은 대칭성 단백질, 예컨대 다량체 스캐폴드 또는 바이러스-유사 입자 형성 단백질인 항원-결합 키메라 단백질.
- 제9항에 있어서, 상기 다량체의 각각의 단량체는 상기 항원-결합 도메인에 연결되는 것인 항원-결합 키메라 단백질.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 항원-결합 도메인 및 스캐폴드는 디술피드 결합을 통해 더욱 연결되는 것인 항원-결합 키메라 단백질.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 스캐폴드 단백질은 적어도 30 kDa의 총 분자 질량을 갖는 것인 항원-결합 키메라 단백질.
- 제1항 내지 제12항 중 어느 한 항에 있어서, 스캐폴드 단백질은 항원-결합 도메인, 예컨대 VHH를 포함하는 것인 항원-결합 키메라 단백질.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 스캐폴드 단백질은 표지된 단백질인 항원-결합 키메라 단백질.
- 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질을 코딩하는 핵산 분자.
- 프로모터, 제15항의 핵산 분자, 및 전사 종결 신호를 포함하는 3' 말단 영역을 포함하는 키메라 유전자.
- 제15항의 핵산 분자, 또는 제16항의 키메라 유전자를 포함하는, 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질을 코딩하는 발현 카세트.
- 제17항의 발현 카세트, 제16항의 키메라 유전자 또는 제15항의 핵산 분자를 포함하는 벡터.
- 제18항에 있어서, 이. 콜라이에서 발현을 위한 것인 벡터.
- 제18항에 있어서, 효모, 파지, 박테리아 또는 바이러스에서 표면 디스플레이를 위한 것인 벡터.
- 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질을 포함하는, 숙주 세포.
- 제21항에 있어서, 상기 항원-결합 키메라 단백질 및 표적 항원은 공발현되는 것인 숙주 세포.
- (i) 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 및
(ii) 표적 단백질
을 포함하는 복합체로서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질에 특이적으로 결합하는 것인 복합체. - 제23항에 있어서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질의 항원-결합 도메인에 결합되는 것인 복합체.
- 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질을 포함하는 조성물.
- 제1항 내지 제14항 중 어느 한 항의 제1 및 제2 항원-결합 키메라 단백질을 포함하는 조성물로서, 상기 제2 항원-결합 키메라 단백질의 항원-결합 도메인은 제1 항원-결합 키메라 단백질의 스캐폴드 단백질에 특이적으로 결합하는 것인 조성물.
- 표적 단백질의 구조 분석을 위한, 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 제15항의 핵산 분자, 제16항의 키메라 유전자, 제17항의 발현 카세트, 제18항 내지 제20항 중 어느 한 항의 벡터, 제21항 또는 제22항의 숙주 세포, 제23항 또는 제24항의 복합체, 또는 제25항 또는 제26항의 조성물의 용도.
- 제27항에 있어서, 상기 구조 분석은 단일 입자 cryo-EM 또는 결정학을 포함하는 것인 용도.
- 표적 단백질의 3-차원 구조를 결정하는 방법으로서,
(i) 복합체를 형성하도록 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 또는 제26항의 항원-결합 키메라 단백질의 조성물, 및 표적 단백질을 제공하는 단계로서, 상기 표적 단백질은 상기 항원-결합 키메라 단백질에 특이적으로 결합하는 것인 단계,
또는 제23항 또는 제24항에 따른 복합체를 제공하는 단계;
(ii) 구조 분석에 적합한 조건에서 상기 복합체를 디스플레이하는 단계
를 포함하고,
상기 표적 단백질의 3D 구조는 고분해능에서 결정되는 것인 결정 방법. - 진단제로서의, 제1항 내지 제14항 어느 한 항의 항원-결합 키메라 단백질, 제15항의 핵산 분자, 제16항의 키메라 유전자, 제17항의 발현 카세트, 제18항 내지 제20항 중 어느 한 항의 벡터, 제21항 또는 제22항의 숙주 세포, 제23항 또는 제24항의 복합체, 또는 제25항 또는 제26항의 조성물의 용도.
- 생체내 영상화를 위한, 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 제15항의 핵산 분자, 제16항의 키메라 유전자, 제17항의 발현 카세트, 제18항 내지 제20항 중 어느 한 항의 벡터, 제21항 또는 제22항의 숙주 세포, 제23항 또는 제24항의 복합체, 또는 제25항 또는 제26항의 조성물의 용도.
- 의약으로서 사용을 위한, 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 또는 제25항 또는 제26항의 조성물.
- 제1항 내지 제14항 중 어느 한 항의 항원-결합 키메라 단백질, 또는 제26항에 따른 조성물을 포함하는 바이러스-유사 입자.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17199472.6 | 2017-10-31 | ||
EP17199472 | 2017-10-31 | ||
EP18199709 | 2018-10-10 | ||
EP18199709.9 | 2018-10-10 | ||
PCT/EP2018/079891 WO2019086548A1 (en) | 2017-10-31 | 2018-10-31 | Novel antigen-binding chimeric proteins and methods and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20200091400A true KR20200091400A (ko) | 2020-07-30 |
Family
ID=64308706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207013860A KR20200091400A (ko) | 2017-10-31 | 2018-10-31 | 신규한 항원-결합 키메라 단백질 및 이의 방법 및 용도 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11873347B2 (ko) |
EP (1) | EP3704160A1 (ko) |
JP (2) | JP2021502063A (ko) |
KR (1) | KR20200091400A (ko) |
CN (1) | CN111315784A (ko) |
CA (1) | CA3076791A1 (ko) |
WO (1) | WO2019086548A1 (ko) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2019408420A1 (en) * | 2018-12-21 | 2021-07-08 | Vib Vzw | Fusion protein with a toxin and scaffold protein |
WO2020127983A1 (en) * | 2018-12-21 | 2020-06-25 | Vib Vzw | Fusion proteins comprising a cytokine and scaffold protein |
EP3986437A4 (en) * | 2019-06-18 | 2023-06-07 | Musc Foundation for Research Development | COMPOSITIONS AND METHODS TARGETING THE NON-NUCLEOTIDE ASSOCIATED STATE OF RAS TO BLOCK ONCOGENIC SIGNALING PATHWAYS AND TRANSFORMATION |
EP4034146A4 (en) * | 2019-09-26 | 2024-03-06 | Orionis Biosciences, Inc. | CONJUGATED CHIMERIC PROTEINS |
EP3799881A1 (en) | 2019-10-04 | 2021-04-07 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. | Single domain antibodies specifically binding globo - series glycans |
CN110982824B (zh) * | 2019-10-09 | 2022-04-15 | 天津大学 | 拮抗pd-1的抗体类似物bp基因及蛋白和应用 |
EP4048703A1 (en) | 2019-10-21 | 2022-08-31 | Vib Vzw | Nanodisc-specific antigen-binding chimeric proteins |
EP4077372A1 (en) | 2019-12-20 | 2022-10-26 | Vib Vzw | Nanobody exchange chromatography |
EP3845553A1 (en) * | 2019-12-30 | 2021-07-07 | Johann Wolfgang Goethe-Universität | Carrier matrix comprising dodecin protein |
CN111518180B (zh) * | 2020-04-10 | 2023-01-03 | 四川大学 | 一种结核病候选疫苗融合蛋白 |
WO2022066923A1 (en) * | 2020-09-24 | 2022-03-31 | The Regents Of The University Of California | Multimeric protein complexes as antibody substitutes for neutralization of viral pathogens in prophylactic and therapeutic applications |
EP4323397A1 (en) * | 2021-04-12 | 2024-02-21 | Saiba AG | Modified virus-like particles of bacteriophage ap205 |
US20240287501A1 (en) | 2021-06-23 | 2024-08-29 | Vib Vzw | Means and Methods for Selection of Specific Binders |
US12050189B2 (en) * | 2021-09-10 | 2024-07-30 | President And Fellows Of Harvard College | Compositions and methods relating to structural determination of small proteins |
CN114540328A (zh) * | 2022-02-18 | 2022-05-27 | 浙江工业大学 | 一种温度敏感型α-淀粉酶及其制备方法与应用 |
CN115819599B (zh) * | 2022-11-29 | 2024-01-16 | 江苏耀海生物制药有限公司 | 一种利用重组大肠杆菌分泌表达纳米抗体Cablivi的方法 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0368684B2 (en) | 1988-11-11 | 2004-09-29 | Medical Research Council | Cloning immunoglobulin variable domain sequences. |
EP2192131A1 (en) | 1992-08-21 | 2010-06-02 | Vrije Universiteit Brussel | Immunoglobulins devoid of light chains |
US6838254B1 (en) | 1993-04-29 | 2005-01-04 | Conopco, Inc. | Production of antibodies or (functionalized) fragments thereof derived from heavy chain immunoglobulins of camelidae |
FR2708622B1 (fr) | 1993-08-02 | 1997-04-18 | Raymond Hamers | Vecteur recombinant contenant une séquence d'un gène de lipoprotéine de structure pour l'expression de séquences de nucléotides. |
EP0739981A1 (en) | 1995-04-25 | 1996-10-30 | Vrije Universiteit Brussel | Variable fragments of immunoglobulins - use for therapeutic or veterinary purposes |
DK0937140T3 (da) * | 1996-06-27 | 2008-01-28 | Vlaams Interuniv Inst Biotech | Antistofmolekyler, som interagerer specifikt med et målmolekyles aktive sted eller klöft |
AU3596599A (en) | 1998-01-26 | 1999-08-09 | Unilever Plc | Method for producing antibody fragments |
AU3041100A (en) | 1999-01-05 | 2000-07-24 | Unilever Plc | Binding of antibody fragments to solid supports |
DE60013767T3 (de) | 1999-01-19 | 2009-07-09 | Unilever N.V. | Verfahren zur herstellung von antikörperfragmenten |
WO2000065057A1 (en) | 1999-04-22 | 2000-11-02 | Unilever Plc | Inhibition of viral infection using monovalent antigen-binding proteins |
US6479280B1 (en) | 1999-09-24 | 2002-11-12 | Vlaams Interuniversitair Institutuut Voor Biotechnologie Vzw | Recombinant phages capable of entering host cells via specific interaction with an artificial receptor |
WO2001044301A1 (en) | 1999-11-29 | 2001-06-21 | Unilever Plc | Immobilized single domain antigen-binding molecules |
AU1859201A (en) | 1999-11-29 | 2001-06-12 | Unilever Plc | Immobilisation of proteins |
ES2324280T3 (es) | 2000-03-14 | 2009-08-04 | Unilever N.V. | Dominios variables de la cadena pesada de anticuerpos frente a lipasas dieteticas humanas y sus usos. |
US20030190598A1 (en) | 2000-05-26 | 2003-10-09 | Jasmid Tanha | Single-domain antigen-binding antibody fragments derived from llama antibodies |
AU2002229639A1 (en) | 2000-12-13 | 2002-06-24 | De Haard, Johannes Joseph Wilhelmus | Camelidae antibody arrays |
DK1399484T3 (da) | 2001-06-28 | 2010-11-08 | Domantis Ltd | Dobbelt-specifik ligand og anvendelse af denne |
US20060073141A1 (en) | 2001-06-28 | 2006-04-06 | Domantis Limited | Compositions and methods for treating inflammatory disorders |
US7371849B2 (en) | 2001-09-13 | 2008-05-13 | Institute For Antibodies Co., Ltd. | Methods of constructing camel antibody libraries |
JP2005289809A (ja) | 2001-10-24 | 2005-10-20 | Vlaams Interuniversitair Inst Voor Biotechnologie Vzw (Vib Vzw) | 突然変異重鎖抗体 |
AU2002351896A1 (en) | 2001-12-11 | 2003-06-23 | Ablynx N.V. | Method for displaying loops from immunoglobulin domains in different contexts |
AU2002360068B2 (en) | 2001-12-21 | 2009-09-03 | Vlaams Interuniversitair Instituut Voor Biotechnologie Vzw | Method for cloning of variable domain sequences |
CA2471645A1 (en) | 2002-01-03 | 2003-07-10 | Vlaams Interuniversitair Instituut Voor Biotechnologie Vzw | Immunoconjugates useful for treatment of tumours |
AU2003286004A1 (en) | 2002-11-08 | 2004-06-07 | Ablynx N.V. | Single domain antibodies directed against interferon- gamma and uses therefor |
JP2006520584A (ja) | 2002-11-08 | 2006-09-14 | アブリンクス エン.ヴェー. | 安定化単一ドメイン抗体 |
KR101025143B1 (ko) | 2002-12-31 | 2011-04-01 | 넥타르 테라퓨틱스 | 가수분해상으로 안정한 말레이미드-종결 중합체 |
CN101412759A (zh) | 2003-01-10 | 2009-04-22 | 埃博灵克斯股份有限公司 | 治疗性多肽,其同源物、其片段及其在调节血小板介导的聚集方面的应用 |
US7461263B2 (en) | 2003-01-23 | 2008-12-02 | Unspam, Llc. | Method and apparatus for a non-revealing do-not-contact list system |
WO2005018629A1 (en) | 2003-08-12 | 2005-03-03 | Yarbrough William M | Treatment for acne vulgaris and method of use |
ES2352697T3 (es) | 2003-11-07 | 2011-02-22 | Ablynx N.V. | Anticuerpos de dominio único de camelidae vhh dirigidos contra el receptor del factor de crecimiento epidérmico y usos de los mismos. |
US7563443B2 (en) | 2004-09-17 | 2009-07-21 | Domantis Limited | Monovalent anti-CD40L antibody polypeptides and compositions thereof |
CA2583017A1 (en) | 2004-10-13 | 2006-04-20 | Ablynx N.V. | Single domain camelide anti-amyloid beta antibodies and polypeptides comprising the same for the treatment and diagnosis of degenerative neural diseases such as alzheimer's disease |
CA2595682A1 (en) | 2005-01-31 | 2006-08-03 | Ablynx N.V. | Method for generating variable domain sequences of heavy chain antibodies |
EP2172484A3 (en) | 2005-05-18 | 2010-05-19 | Ablynx N.V. | Serum albumin binding proteins |
CN101213214B (zh) | 2005-05-20 | 2014-06-25 | 埃博灵克斯股份有限公司 | 针对冯威勒布兰特因子的单一结构域vhh抗体 |
AU2007285695B2 (en) | 2006-08-18 | 2012-05-24 | Ablynx N.V. | Amino acid sequences directed against IL-6R and polypeptides comprising the same for the treatment of diseases and disorders associated with IL-6-mediated signalling |
AU2008219216A1 (en) | 2007-02-21 | 2008-08-28 | Ablynx N.V. | Amino acid sequences directed against vascular endothelial growth factor and polypeptides comprising the same for the treatment of conditions and diseases characterized by excessive and/or pathological angiogenesis or neovascularization |
CA2687903C (en) | 2007-05-24 | 2016-09-13 | Ablynx N.V. | Amino acid sequences directed against rank-l and polypeptides comprising the same for the treatment of bone diseases and disorders |
GB201008682D0 (en) | 2010-05-25 | 2010-07-07 | Vib Vzw | Epitope tag for affinity based applications |
GB201014715D0 (en) | 2010-09-06 | 2010-10-20 | Vib Vzw | Nanobodies stabilizing functional conformational states of GPCRS |
ES2662372T3 (es) * | 2011-06-21 | 2018-04-06 | Vib Vzw | Dominios de unión dirigidos contra complejos GPCR:proteína G y usos derivados de los mismos |
EP2723769B2 (en) | 2011-06-23 | 2022-06-15 | Ablynx NV | Techniques for predicting, detecting and reducing aspecific protein interference in assays involving immunoglobulin single variable domains |
PL2951201T3 (pl) * | 2013-01-30 | 2018-03-30 | Vib Vzw | Nowe polipeptydy chimeryczne do celów badań przesiewowych i odkrywania leków |
JP2016512954A (ja) | 2013-02-05 | 2016-05-12 | フエー・イー・ベー・フエー・ゼツト・ウエー | ムスカリン性アセチルコリン受容体の結合剤およびそれらの使用 |
PL3097197T3 (pl) | 2014-01-21 | 2021-06-28 | Vrije Universiteit Brussel | Mięśniowo-specyficzne elementy regulatorowe kwasów nukleinowych oraz sposoby i ich zastosowanie |
HUE050007T2 (hu) | 2014-05-16 | 2020-11-30 | Ablynx Nv | Immunglobulin variábilis domének |
-
2018
- 2018-10-31 JP JP2020524000A patent/JP2021502063A/ja active Pending
- 2018-10-31 CA CA3076791A patent/CA3076791A1/en active Pending
- 2018-10-31 CN CN201880071396.5A patent/CN111315784A/zh active Pending
- 2018-10-31 US US16/760,394 patent/US11873347B2/en active Active
- 2018-10-31 WO PCT/EP2018/079891 patent/WO2019086548A1/en unknown
- 2018-10-31 EP EP18803339.3A patent/EP3704160A1/en active Pending
- 2018-10-31 KR KR1020207013860A patent/KR20200091400A/ko not_active Application Discontinuation
-
2023
- 2023-06-30 JP JP2023107875A patent/JP2023138991A/ja active Pending
- 2023-11-21 US US18/516,777 patent/US20240174767A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3704160A1 (en) | 2020-09-09 |
WO2019086548A1 (en) | 2019-05-09 |
CA3076791A1 (en) | 2019-05-09 |
US11873347B2 (en) | 2024-01-16 |
US20240174767A1 (en) | 2024-05-30 |
JP2023138991A (ja) | 2023-10-03 |
US20210206880A1 (en) | 2021-07-08 |
JP2021502063A (ja) | 2021-01-28 |
CN111315784A (zh) | 2020-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240174767A1 (en) | Novel Antigen-Binding Chimeric Proteins and Methods and Uses Thereof | |
JP6356748B2 (ja) | 安定したフィブロネクチンドメイン組成物、方法及び用途 | |
US11014977B2 (en) | Synthetic single domain antibody | |
JP2019505206A (ja) | 多様性を変化させた足場ドメインを有する結合メンバー | |
AU2011245225A1 (en) | Stabilized fibronectin domain compositions, methods and uses | |
US20110189183A1 (en) | Antibodies against candida, collections thereof and methods of use | |
JP2009520468A (ja) | 融合タンパク質ライブラリーの作製法およびスクリーニング法、ならびにそれらの使用 | |
US11628222B2 (en) | CD71 binding fibronectin type III domains | |
JP7010491B2 (ja) | ヒト化抗rage抗体 | |
Fu et al. | The humanized nanobody RBD-1-2G tolerates the spike N501Y mutation to neutralize SARS-CoV-2 | |
AU2017202915B2 (en) | Stabilized fibronectin domain compositions, methods and uses | |
CA3204634A1 (en) | Recombinant plant-derived antibodies and fc variants and related methods | |
AU2019408420A1 (en) | Fusion protein with a toxin and scaffold protein | |
US20230330239A1 (en) | Epcam binding fibronectin type iii domains | |
Gera | Hyperthermophilic Protein Scaffolds for Engineering Biomolecular Recognition | |
Jakkaraju | The thermodynamic dissection and design of high-affinity antibodies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |