MXPA97002657A - Materiales para la produccion de estructuras nanometricas y uso de las mismas - Google Patents
Materiales para la produccion de estructuras nanometricas y uso de las mismasInfo
- Publication number
- MXPA97002657A MXPA97002657A MXPA/A/1997/002657A MX9702657A MXPA97002657A MX PA97002657 A MXPA97002657 A MX PA97002657A MX 9702657 A MX9702657 A MX 9702657A MX PA97002657 A MXPA97002657 A MX PA97002657A
- Authority
- MX
- Mexico
- Prior art keywords
- protein
- bacteriophage
- polypeptide
- isolated
- oligomer
- Prior art date
Links
- 238000004519 manufacturing process Methods 0.000 title claims description 15
- 239000000463 material Substances 0.000 title description 16
- 101710013542 MDV050 Proteins 0.000 claims abstract description 92
- 241000701533 Escherichia virus T4 Species 0.000 claims abstract description 54
- 101710003544 EFP_031 Proteins 0.000 claims abstract description 38
- 239000002086 nanomaterial Substances 0.000 claims abstract description 35
- 102000004169 proteins and genes Human genes 0.000 claims description 81
- 108090000623 proteins and genes Proteins 0.000 claims description 81
- 229920001184 polypeptide Polymers 0.000 claims description 69
- 241001515965 unidentified phage Species 0.000 claims description 69
- 108060008178 tfa Proteins 0.000 claims description 61
- 101710014175 36 Proteins 0.000 claims description 54
- 101700070201 GPJ Proteins 0.000 claims description 54
- 101710005652 gp36 Proteins 0.000 claims description 54
- 101710043749 37 Proteins 0.000 claims description 49
- 101710039943 Mup37 Proteins 0.000 claims description 49
- 150000001413 amino acids Chemical class 0.000 claims description 49
- 101710014070 35 Proteins 0.000 claims description 47
- 101710043752 Mup35 Proteins 0.000 claims description 47
- 229920003013 deoxyribonucleic acid Polymers 0.000 claims description 33
- 230000003993 interaction Effects 0.000 claims description 28
- 101700035315 FIBP Proteins 0.000 claims description 26
- 101700041551 IR11 Proteins 0.000 claims description 26
- 101710043203 P23p89 Proteins 0.000 claims description 26
- 102100011846 TNFSF4 Human genes 0.000 claims description 26
- 101710025695 TNFSF4 Proteins 0.000 claims description 26
- 101700053043 PER34 Proteins 0.000 claims description 22
- 108020001507 fusion proteins Proteins 0.000 claims description 17
- 102000037240 fusion proteins Human genes 0.000 claims description 17
- 239000000539 dimer Substances 0.000 claims description 16
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 16
- 239000007787 solid Substances 0.000 claims description 15
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 12
- 125000000539 amino acid group Chemical group 0.000 claims description 5
- 101700037508 psaK Proteins 0.000 claims description 5
- 239000002184 metal Substances 0.000 claims description 4
- 229910052751 metal Inorganic materials 0.000 claims description 4
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 3
- 229960002685 biotin Drugs 0.000 claims description 3
- 235000020958 biotin Nutrition 0.000 claims description 3
- 239000011616 biotin Substances 0.000 claims description 3
- 150000002500 ions Chemical class 0.000 claims description 3
- 102000018358 Immunoglobulins Human genes 0.000 claims description 2
- 108060003951 Immunoglobulins Proteins 0.000 claims description 2
- 101710043195 T4 Proteins 0.000 claims 1
- 101710033879 XXXIV Proteins 0.000 claims 1
- 150000001412 amines Chemical class 0.000 claims 1
- 125000001909 leucine group Chemical class [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 claims 1
- 238000004806 packaging method and process Methods 0.000 claims 1
- 238000010276 construction Methods 0.000 abstract description 12
- 235000018102 proteins Nutrition 0.000 description 66
- 239000000835 fiber Substances 0.000 description 47
- 235000001014 amino acid Nutrition 0.000 description 34
- 229920000642 polymer Polymers 0.000 description 31
- 230000015572 biosynthetic process Effects 0.000 description 26
- 241000209134 Arundinaria Species 0.000 description 22
- 230000001580 bacterial Effects 0.000 description 22
- 241000588724 Escherichia coli Species 0.000 description 21
- 101710043065 GTF2H3 Proteins 0.000 description 20
- 210000004027 cells Anatomy 0.000 description 19
- 238000005755 formation reaction Methods 0.000 description 19
- 230000035772 mutation Effects 0.000 description 19
- 230000001629 suppression Effects 0.000 description 17
- 239000003999 initiator Substances 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 15
- 238000006471 dimerization reaction Methods 0.000 description 14
- 239000000284 extract Substances 0.000 description 14
- 238000006116 polymerization reaction Methods 0.000 description 14
- 108090001123 antibodies Proteins 0.000 description 13
- 102000004965 antibodies Human genes 0.000 description 13
- 238000000338 in vitro Methods 0.000 description 13
- 239000000203 mixture Substances 0.000 description 13
- 241000880493 Leptailurus serval Species 0.000 description 11
- 239000002245 particle Substances 0.000 description 11
- 101710032590 57 Proteins 0.000 description 10
- CKHWEVXPLJBEOZ-UHFFFAOYSA-N Threoninyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)C(C)O CKHWEVXPLJBEOZ-UHFFFAOYSA-N 0.000 description 10
- 239000011449 brick Substances 0.000 description 10
- 201000009910 diseases by infectious agent Diseases 0.000 description 10
- 125000000267 glycino group Chemical group [H]N([*])C([H])([H])C(=O)O[H] 0.000 description 10
- LDEBVRIURYMKQS-UHFFFAOYSA-N Serinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CO LDEBVRIURYMKQS-UHFFFAOYSA-N 0.000 description 9
- 108010089804 glycyl-threonine Proteins 0.000 description 9
- 239000002773 nucleotide Substances 0.000 description 9
- 125000003729 nucleotide group Chemical group 0.000 description 9
- 108010061238 threonyl-glycine Proteins 0.000 description 9
- 241000894006 Bacteria Species 0.000 description 8
- 210000001503 Joints Anatomy 0.000 description 8
- 229920000272 Oligonucleotide Polymers 0.000 description 8
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 8
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 8
- 108010047857 aspartylglycine Proteins 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 7
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 7
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 7
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 7
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 7
- IQHUITKNHOKGFC-MIMYLULJSA-N Thr-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IQHUITKNHOKGFC-MIMYLULJSA-N 0.000 description 7
- XXDVDTMEVBYRPK-XPUUQOCRSA-N Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O XXDVDTMEVBYRPK-XPUUQOCRSA-N 0.000 description 7
- GVRKWABULJAONN-UHFFFAOYSA-N Valyl-Threonine Chemical compound CC(C)C(N)C(=O)NC(C(C)O)C(O)=O GVRKWABULJAONN-UHFFFAOYSA-N 0.000 description 7
- 238000000034 method Methods 0.000 description 7
- VBKIFHUVGLOJKT-UHFFFAOYSA-N Asparaginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(N)=O VBKIFHUVGLOJKT-UHFFFAOYSA-N 0.000 description 6
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 6
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 229920002892 amber Polymers 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000000295 complement Effects 0.000 description 6
- 230000029087 digestion Effects 0.000 description 6
- 108010037850 glycylvaline Proteins 0.000 description 6
- 230000000977 initiatory Effects 0.000 description 6
- 239000010410 layer Substances 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 108091007521 restriction endonucleases Proteins 0.000 description 6
- SONUFGRSSMFHFN-IMJSIDKUSA-N Asn-Ser Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O SONUFGRSSMFHFN-IMJSIDKUSA-N 0.000 description 5
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 5
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- OTXBNHIUIHNGAO-UWVGGRQHSA-N Leu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN OTXBNHIUIHNGAO-UWVGGRQHSA-N 0.000 description 5
- 108010001267 Protein Subunits Proteins 0.000 description 5
- 102000002067 Protein Subunits Human genes 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- 238000004166 bioassay Methods 0.000 description 5
- 230000004927 fusion Effects 0.000 description 5
- 230000002068 genetic Effects 0.000 description 5
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine zwitterion Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 5
- 239000000710 homodimer Substances 0.000 description 5
- 230000002458 infectious Effects 0.000 description 5
- 230000002401 inhibitory effect Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl β-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 5
- 238000005304 joining Methods 0.000 description 5
- 238000006384 oligomerization reaction Methods 0.000 description 5
- 239000011148 porous material Substances 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 238000001338 self-assembly Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000001131 transforming Effects 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 4
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 4
- 108050001186 Chaperonin Cpn60 Proteins 0.000 description 4
- 102000010991 Chaperonin Cpn60 Human genes 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- MRVYVEQPNDSWLH-UHFFFAOYSA-N Glutaminyl-Valine Chemical compound CC(C)C(C(O)=O)NC(=O)C(N)CCC(N)=O MRVYVEQPNDSWLH-UHFFFAOYSA-N 0.000 description 4
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 4
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 4
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 4
- WITCOKQIPFWQQD-FSPLSTOPSA-N Val-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O WITCOKQIPFWQQD-FSPLSTOPSA-N 0.000 description 4
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 4
- STTYIMSDIYISRG-WDSKDSINSA-N Val-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(O)=O STTYIMSDIYISRG-WDSKDSINSA-N 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 108010077245 asparaginyl-proline Proteins 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 238000005452 bending Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- STKYPAFSDFAEPH-LURJTMIESA-N gly-val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CN STKYPAFSDFAEPH-LURJTMIESA-N 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 101710030587 ligN Proteins 0.000 description 4
- 101700077585 ligd Proteins 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 239000000123 paper Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 239000011541 reaction mixture Substances 0.000 description 4
- 230000001105 regulatory Effects 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000002194 synthesizing Effects 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- VNYDHJARLHNEGA-RYUDHWBXSA-N (2S)-1-[(2S)-2-azaniumyl-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carboxylate Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 VNYDHJARLHNEGA-RYUDHWBXSA-N 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N 4-amino-5-[(1-carboxy-2-phenylethyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 3
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 3
- HZYFHQOWCFUSOV-IMJSIDKUSA-N Asn-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O HZYFHQOWCFUSOV-IMJSIDKUSA-N 0.000 description 3
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 3
- NPDLYUOYAGBHFB-UHFFFAOYSA-N Asparaginyl-Arginine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N NPDLYUOYAGBHFB-UHFFFAOYSA-N 0.000 description 3
- HXWUJJADFMXNKA-UHFFFAOYSA-N Asparaginyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(N)=O HXWUJJADFMXNKA-UHFFFAOYSA-N 0.000 description 3
- NTQDELBZOMWXRS-UHFFFAOYSA-N Aspartyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC(O)=O NTQDELBZOMWXRS-UHFFFAOYSA-N 0.000 description 3
- PNMUAGGSDZXTHX-BYPYZUCNSA-N Gly-Gln Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(N)=O PNMUAGGSDZXTHX-BYPYZUCNSA-N 0.000 description 3
- IEFJWDNGDZAYNZ-BYPYZUCNSA-N Gly-Glu Chemical compound NCC(=O)N[C@H](C(O)=O)CCC(O)=O IEFJWDNGDZAYNZ-BYPYZUCNSA-N 0.000 description 3
- WRPDZHJNLYNFFT-UHFFFAOYSA-N Histidinyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CC1=CN=CN1 WRPDZHJNLYNFFT-UHFFFAOYSA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 3
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 3
- XGDCYUQSFDQISZ-BQBZGAKWSA-N Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O XGDCYUQSFDQISZ-BQBZGAKWSA-N 0.000 description 3
- 210000003041 Ligaments Anatomy 0.000 description 3
- 229920001850 Nucleic acid sequence Polymers 0.000 description 3
- BXNGIHFNNNSEOS-UWVGGRQHSA-N Phe-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 BXNGIHFNNNSEOS-UWVGGRQHSA-N 0.000 description 3
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 3
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 102100017875 S100A8 Human genes 0.000 description 3
- 101710023380 S100A8 Proteins 0.000 description 3
- YZMPDHTZJJCGEI-BQBZGAKWSA-N Ser-His Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 YZMPDHTZJJCGEI-BQBZGAKWSA-N 0.000 description 3
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfizole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 3
- UQTNIFUCMBFWEJ-UHFFFAOYSA-N Threoninyl-Asparagine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-UHFFFAOYSA-N 0.000 description 3
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 238000009835 boiling Methods 0.000 description 3
- 108091006028 chimera Proteins 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 230000002779 inactivation Effects 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 239000000543 intermediate Substances 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 230000035800 maturation Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006011 modification reaction Methods 0.000 description 3
- 108091005569 modified proteins Proteins 0.000 description 3
- 102000035365 modified proteins Human genes 0.000 description 3
- 108010053725 prolylvaline Proteins 0.000 description 3
- 230000002441 reversible Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 108010048818 seryl-histidine Proteins 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M sodium hydroxide Inorganic materials [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 235000011121 sodium hydroxide Nutrition 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 239000003381 stabilizer Substances 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- IOUPEELXVYPCPG-UHFFFAOYSA-N val-gly Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 3
- LQJAALCCPOTJGB-YUMQZZPRSA-N (2S)-1-[(2S)-2-amino-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carboxylic acid Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N (3S)-3-[[(2S,3R)-2-amino-3-hydroxybutanoyl]amino]-4-(carboxymethylamino)-4-oxobutanoic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- TUTIHHSZKFBMHM-UHFFFAOYSA-N 4-amino-5-[(3-amino-1-carboxy-3-oxopropyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O TUTIHHSZKFBMHM-UHFFFAOYSA-N 0.000 description 2
- 101700076057 AAGAB Proteins 0.000 description 2
- 101700023948 AMP3 Proteins 0.000 description 2
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 2
- 108010047814 Antigen-Antibody Complex Proteins 0.000 description 2
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 2
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 description 2
- PQBHGSGQZSOLIR-RYUDHWBXSA-N Arg-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PQBHGSGQZSOLIR-RYUDHWBXSA-N 0.000 description 2
- XNSKSTRGQIPTSE-UHFFFAOYSA-N Arginyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCCNC(N)=N XNSKSTRGQIPTSE-UHFFFAOYSA-N 0.000 description 2
- FFMIYIMKQIMDPK-BQBZGAKWSA-N Asn-His Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 FFMIYIMKQIMDPK-BQBZGAKWSA-N 0.000 description 2
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 2
- YZQCXOFQZKCETR-UWVGGRQHSA-N Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YZQCXOFQZKCETR-UWVGGRQHSA-N 0.000 description 2
- DWBZEJHQQIURML-IMJSIDKUSA-N Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(O)=O DWBZEJHQQIURML-IMJSIDKUSA-N 0.000 description 2
- OMSMPWHEGLNQOD-UHFFFAOYSA-N Asparaginyl-Phenylalanine Chemical compound NC(=O)CC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UHFFFAOYSA-N 0.000 description 2
- VGRHZPNRCLAHQA-UHFFFAOYSA-N Aspartyl-Asparagine Chemical compound OC(=O)CC(N)C(=O)NC(CC(N)=O)C(O)=O VGRHZPNRCLAHQA-UHFFFAOYSA-N 0.000 description 2
- UKGGPJNBONZZCM-WDSKDSINSA-N Aspartyl-L-proline Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 2
- ZVDPYSVOZFINEE-UHFFFAOYSA-N Aspartyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CC(O)=O ZVDPYSVOZFINEE-UHFFFAOYSA-N 0.000 description 2
- 210000000170 Cell Membrane Anatomy 0.000 description 2
- 102000008186 Collagen Human genes 0.000 description 2
- 108010035532 Collagen Proteins 0.000 description 2
- 108010090461 DFG peptide Proteins 0.000 description 2
- 101700057505 DIT9 Proteins 0.000 description 2
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 2
- 108060001039 GCN4 Proteins 0.000 description 2
- YBAFDPFAUTYYRW-YUMQZZPRSA-N Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O YBAFDPFAUTYYRW-YUMQZZPRSA-N 0.000 description 2
- UQHGAYSULGRWRG-WHFBIAKZSA-N Glu-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(O)=O UQHGAYSULGRWRG-WHFBIAKZSA-N 0.000 description 2
- HHSJMSCOLJVTCX-UHFFFAOYSA-N Glutaminyl-Threonine Chemical compound CC(O)C(C(O)=O)NC(=O)C(N)CCC(N)=O HHSJMSCOLJVTCX-UHFFFAOYSA-N 0.000 description 2
- IKAIKUBBJHFNBZ-LURJTMIESA-N Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CN IKAIKUBBJHFNBZ-LURJTMIESA-N 0.000 description 2
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 2
- KRBMQYPTDYSENE-BQBZGAKWSA-N His-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CNC=N1 KRBMQYPTDYSENE-BQBZGAKWSA-N 0.000 description 2
- 229960000310 ISOLEUCINE Drugs 0.000 description 2
- 125000000510 L-tryptophano group Chemical group [H]C1=C([H])C([H])=C2N([H])C([H])=C(C([H])([H])[C@@]([H])(C(O[H])=O)N([H])[*])C2=C1[H] 0.000 description 2
- SENJXOPIZNYLHU-IUCAKERBSA-N Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-IUCAKERBSA-N 0.000 description 2
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 2
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 2
- JYOAXOMPIXKMKK-UHFFFAOYSA-N Leucyl-Glutamine Chemical compound CC(C)CC(N)C(=O)NC(C(O)=O)CCC(N)=O JYOAXOMPIXKMKK-UHFFFAOYSA-N 0.000 description 2
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 2
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 2
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 2
- ADHNYKZHPOEULM-BQBZGAKWSA-N Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O ADHNYKZHPOEULM-BQBZGAKWSA-N 0.000 description 2
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 2
- WEDDFMCSUNNZJR-WDSKDSINSA-N Met-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O WEDDFMCSUNNZJR-WDSKDSINSA-N 0.000 description 2
- 229960004452 Methionine Drugs 0.000 description 2
- 108010038807 Oligopeptides Proteins 0.000 description 2
- 102000015636 Oligopeptides Human genes 0.000 description 2
- HWMGTNOVUDIKRE-UWVGGRQHSA-N Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 HWMGTNOVUDIKRE-UWVGGRQHSA-N 0.000 description 2
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 2
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N Phenylalanyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- ZKQOUHVVXABNDG-IUCAKERBSA-N Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 ZKQOUHVVXABNDG-IUCAKERBSA-N 0.000 description 2
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 2
- 108010033725 Recombinant Proteins Proteins 0.000 description 2
- 102000007312 Recombinant Proteins Human genes 0.000 description 2
- 101710033747 S6 Proteins 0.000 description 2
- VBKBDLMWICBSCY-IMJSIDKUSA-N Ser-Asp Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O VBKBDLMWICBSCY-IMJSIDKUSA-N 0.000 description 2
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 2
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 2
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 2
- RZEQTVHJZCIUBT-UHFFFAOYSA-N Serinyl-Arginine Chemical compound OCC(N)C(=O)NC(C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-UHFFFAOYSA-N 0.000 description 2
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 2
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 2
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 2
- WXVIGTAUZBUDPZ-DTLFHODZSA-N Thr-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 WXVIGTAUZBUDPZ-DTLFHODZSA-N 0.000 description 2
- BQBCIBCLXBKYHW-CSMHCCOUSA-N Thr-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O BQBCIBCLXBKYHW-CSMHCCOUSA-N 0.000 description 2
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 2
- AOLHUMAVONBBEZ-STQMWFEESA-N Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AOLHUMAVONBBEZ-STQMWFEESA-N 0.000 description 2
- 230000036462 Unbound Effects 0.000 description 2
- OBTCMSPFOITUIJ-FSPLSTOPSA-N Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O OBTCMSPFOITUIJ-FSPLSTOPSA-N 0.000 description 2
- JKHXYJKMNSSFFL-IUCAKERBSA-N Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN JKHXYJKMNSSFFL-IUCAKERBSA-N 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000002378 acidificating Effects 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 229960000070 antineoplastic Monoclonal antibodies Drugs 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010060035 arginylproline Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010003152 bacteriophage T7 RNA polymerase Proteins 0.000 description 2
- 230000003115 biocidal Effects 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 229920001436 collagen Polymers 0.000 description 2
- 229960005188 collagen Drugs 0.000 description 2
- 230000001808 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 238000001493 electron microscopy Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- KGNSGRRALVIRGR-UHFFFAOYSA-N gln-tyr Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-UHFFFAOYSA-N 0.000 description 2
- KZNQNBZMBZJQJO-YFKPBYRVSA-N gly pro Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 2
- 108010020688 glycylhistidine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 230000002209 hydrophobic Effects 0.000 description 2
- 125000001165 hydrophobic group Chemical group 0.000 description 2
- 230000002163 immunogen Effects 0.000 description 2
- 230000001965 increased Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010044655 lysylproline Proteins 0.000 description 2
- 239000002609 media Substances 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000002808 molecular sieve Substances 0.000 description 2
- 108010045030 monoclonal antibodies Proteins 0.000 description 2
- 229960000060 monoclonal antibodies Drugs 0.000 description 2
- 102000005614 monoclonal antibodies Human genes 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N p-acetaminophenol Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 2
- 108010018625 phenylalanylarginine Proteins 0.000 description 2
- 108010012581 phenylalanylglutamate Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 235000004252 protein component Nutrition 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N (2S)-1-[(2S)-1-[(2S)-pyrrolidin-1-ium-2-carbonyl]pyrrolidine-2-carbonyl]pyrrolidine-2-carboxylate Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N (2S)-1-[(2S)-2-[[(2S)-2-azaniumylpropanoyl]amino]propanoyl]pyrrolidine-2-carboxylate Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- ZDSRFXVZVHSYMA-CMOCDZPBSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-4-carboxybutanoyl]amino]pentanedioic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=C(O)C=C1 ZDSRFXVZVHSYMA-CMOCDZPBSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N (2S)-2-[[(2S)-2-[[(2S)-2-aminopropanoyl]amino]propanoyl]amino]-3-hydroxypropanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N (2S)-2-[[(2S,3R)-2-[[(2S,3R)-2-amino-3-hydroxybutanoyl]amino]-3-hydroxybutanoyl]amino]butanedioic acid Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N (3S)-4-[[(1S)-1-carboxy-2-(4-hydroxyphenyl)ethyl]amino]-3-[[(2S)-2,6-diaminohexanoyl]amino]-4-oxobutanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N (4S)-4-amino-5-[[(2S)-1-[[(1S)-1-carboxy-2-methylpropyl]amino]-3-methyl-1-oxobutan-2-yl]amino]-5-oxopentanoic acid Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- BCOSEZGCLGPUSL-UHFFFAOYSA-N 2,3,3-trichloroprop-2-enoyl chloride Chemical compound ClC(Cl)=C(Cl)C(Cl)=O BCOSEZGCLGPUSL-UHFFFAOYSA-N 0.000 description 1
- GEYHHGQCORRWGS-UHFFFAOYSA-K 2-[2-[[2-[[1-amino-3-[[3-amino-2-(methylamino)-3-oxopropyl]disulfanyl]-1-oxopropan-2-yl]amino]-2-oxoethyl]-(carboxylatomethyl)amino]ethyl-[2-[2-oxidoprop-2-enyl(2-oxopropyl)amino]ethyl]amino]acetate;gadolinium(3+);hydrate Chemical compound O.[Gd+3].CNC(C(N)=O)CSSCC(C(N)=O)NC(=O)CN(CC([O-])=O)CCN(CC([O-])=O)CCN(CC(C)=O)CC([O-])=C GEYHHGQCORRWGS-UHFFFAOYSA-K 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N 2-[[(2S)-2-[[(2S)-2-azaniumylpropanoyl]amino]propanoyl]amino]acetate Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N 2-[[2-[[(2S)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]amino]acetic acid Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N 3-Amino-1,4-dimethyl-5H-pyrido[4,3-b]indole Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- 101710006321 34 Proteins 0.000 description 1
- MGHKSHCBDXNTHX-UHFFFAOYSA-N 4-amino-5-[(4-amino-1-carboxy-4-oxobutyl)amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(CCC(N)=O)C(O)=O MGHKSHCBDXNTHX-UHFFFAOYSA-N 0.000 description 1
- MPZWMIIOPAPAKE-UHFFFAOYSA-N 4-amino-5-[[1-carboxy-4-(diaminomethylideneamino)butyl]amino]-5-oxopentanoic acid Chemical compound OC(=O)CCC(N)C(=O)NC(C(O)=O)CCCN=C(N)N MPZWMIIOPAPAKE-UHFFFAOYSA-N 0.000 description 1
- WDSCBUNMANHPFH-UHFFFAOYSA-N 6-acetamidohexanoic acid Chemical compound CC(=O)NCCCCCC(O)=O WDSCBUNMANHPFH-UHFFFAOYSA-N 0.000 description 1
- 101710025916 ACTC1 Proteins 0.000 description 1
- 102100012494 ACTC1 Human genes 0.000 description 1
- 101710039696 AF_0250 Proteins 0.000 description 1
- YRKCREAYFQTBPV-UHFFFAOYSA-N Acetylacetone Chemical compound CC(=O)CC(C)=O YRKCREAYFQTBPV-UHFFFAOYSA-N 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 description 1
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 1
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N Ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229940064005 Antibiotic throat preparations Drugs 0.000 description 1
- 229940083879 Antibiotics FOR TREATMENT OF HEMORRHOIDS AND ANAL FISSURES FOR TOPICAL USE Drugs 0.000 description 1
- 229940042052 Antibiotics for systemic use Drugs 0.000 description 1
- 229940042786 Antitubercular Antibiotics Drugs 0.000 description 1
- WYBVBIHNJWOLCJ-IUCAKERBSA-N Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N WYBVBIHNJWOLCJ-IUCAKERBSA-N 0.000 description 1
- JSLGXODUIAFWCF-UHFFFAOYSA-N Arginyl-Asparagine Chemical compound NC(N)=NCCCC(N)C(=O)NC(CC(N)=O)C(O)=O JSLGXODUIAFWCF-UHFFFAOYSA-N 0.000 description 1
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 1
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 1
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 1
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 1
- KWBQPGIYEZKDEG-FSPLSTOPSA-N Asn-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O KWBQPGIYEZKDEG-FSPLSTOPSA-N 0.000 description 1
- PSZNHSNIGMJYOZ-WDSKDSINSA-N Asp-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PSZNHSNIGMJYOZ-WDSKDSINSA-N 0.000 description 1
- NALWOULWGHTVDA-UWVGGRQHSA-N Asp-Tyr Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NALWOULWGHTVDA-UWVGGRQHSA-N 0.000 description 1
- QJMCHPGWFZZRID-UHFFFAOYSA-N Asparaginyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CC(N)=O QJMCHPGWFZZRID-UHFFFAOYSA-N 0.000 description 1
- 101710044578 At3g10140 Proteins 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 102100015498 BRD3 Human genes 0.000 description 1
- 101700008396 BRD3 Proteins 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 210000004899 C-terminal region Anatomy 0.000 description 1
- 102100004276 CCT3 Human genes 0.000 description 1
- 101710024722 CCT3 Proteins 0.000 description 1
- 102100014408 CYBC1 Human genes 0.000 description 1
- 108060002022 CYBC1 Proteins 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- YJQPYGGHQPGBLI-KGSXXDOSSA-N Cathomycin Chemical compound O1C(C)(C)[C@H](OC)[C@@H](OC(N)=O)[C@@H](O)[C@@H]1OC1=CC=C(C(O)=C(NC(=O)C=2C=C(CC=C(C)C)C(O)=CC=2)C(=O)O2)C2=C1C YJQPYGGHQPGBLI-KGSXXDOSSA-N 0.000 description 1
- 210000000349 Chromosomes Anatomy 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 235000016795 Cola Nutrition 0.000 description 1
- 240000001644 Cola acuminata Species 0.000 description 1
- 235000011824 Cola pachycarpa Nutrition 0.000 description 1
- ZSRSLWKGWFFVCM-WDSKDSINSA-N Cys-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O ZSRSLWKGWFFVCM-WDSKDSINSA-N 0.000 description 1
- 210000000805 Cytoplasm Anatomy 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 102000033147 ERVK-25 Human genes 0.000 description 1
- 210000001513 Elbow Anatomy 0.000 description 1
- 241000701867 Enterobacteria phage T7 Species 0.000 description 1
- 241001505295 Eros Species 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 230000035693 Fab Effects 0.000 description 1
- 206010016256 Fatigue Diseases 0.000 description 1
- 102100012723 GATM Human genes 0.000 description 1
- 101700032567 GATM Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- OWOFCNWTMWOOJJ-WDSKDSINSA-N Gln-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OWOFCNWTMWOOJJ-WDSKDSINSA-N 0.000 description 1
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 1
- FYYSIASRLDJUNP-WHFBIAKZSA-N Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FYYSIASRLDJUNP-WHFBIAKZSA-N 0.000 description 1
- LSPKYLAFTPBWIL-BYPYZUCNSA-N Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(O)=O LSPKYLAFTPBWIL-BYPYZUCNSA-N 0.000 description 1
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 1
- JSIQVRIXMINMTA-ZDLURKLDSA-N Glu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O JSIQVRIXMINMTA-ZDLURKLDSA-N 0.000 description 1
- LLEUXCDZPQOJMY-AAEUAGOBSA-N Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 LLEUXCDZPQOJMY-AAEUAGOBSA-N 0.000 description 1
- YSWHPLCDIMUKFE-QWRGUYRKSA-N Glu-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YSWHPLCDIMUKFE-QWRGUYRKSA-N 0.000 description 1
- SSHIXEILTLPAQT-UHFFFAOYSA-N Glutaminyl-Aspartate Chemical compound NC(=O)CCC(N)C(=O)NC(CC(O)=O)C(O)=O SSHIXEILTLPAQT-UHFFFAOYSA-N 0.000 description 1
- ARPVSMCNIDAQBO-UHFFFAOYSA-N Glutaminyl-Leucine Chemical compound CC(C)CC(C(O)=O)NC(=O)C(N)CCC(N)=O ARPVSMCNIDAQBO-UHFFFAOYSA-N 0.000 description 1
- VHLZDSUANXBJHW-UHFFFAOYSA-N Glutaminyl-Phenylalanine Chemical compound NC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 VHLZDSUANXBJHW-UHFFFAOYSA-N 0.000 description 1
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 1
- YIWFXZNIBQBFHR-LURJTMIESA-N Gly-His Chemical compound [NH3+]CC(=O)N[C@H](C([O-])=O)CC1=CN=CN1 YIWFXZNIBQBFHR-LURJTMIESA-N 0.000 description 1
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 1
- PFMUCCYYAAFKTH-YFKPBYRVSA-N Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CN PFMUCCYYAAFKTH-YFKPBYRVSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- 229940093922 Gynecological Antibiotics Drugs 0.000 description 1
- 101710031376 HI_1506/HI_1507 Proteins 0.000 description 1
- 101710013836 HSPD1 Proteins 0.000 description 1
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 1
- MMFKFJORZBJVNF-UWVGGRQHSA-N His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MMFKFJORZBJVNF-UWVGGRQHSA-N 0.000 description 1
- HTOOKGDPMXSJSY-STQMWFEESA-N His-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 HTOOKGDPMXSJSY-STQMWFEESA-N 0.000 description 1
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 1
- 108090000745 Immune Sera Proteins 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N Kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- VYZAGTDAHUIRQA-WHFBIAKZSA-N L-alanyl-L-glutamic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O VYZAGTDAHUIRQA-WHFBIAKZSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- RNKSNIBMTUYWSH-YFKPBYRVSA-N L-prolylglycine Chemical compound [O-]C(=O)CNC(=O)[C@@H]1CCC[NH2+]1 RNKSNIBMTUYWSH-YFKPBYRVSA-N 0.000 description 1
- LCPYQJIKPJDLLB-UWVGGRQHSA-N Leu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C LCPYQJIKPJDLLB-UWVGGRQHSA-N 0.000 description 1
- BQVUABVGYYSDCJ-ZFWWWQNUSA-N Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-ZFWWWQNUSA-N 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 1
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 description 1
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 1
- ZOKVLMBYDSIDKG-CSMHCCOUSA-N Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ZOKVLMBYDSIDKG-CSMHCCOUSA-N 0.000 description 1
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 1
- JPNRPAJITHRXRH-UHFFFAOYSA-N Lysyl-Asparagine Chemical compound NCCCCC(N)C(=O)NC(C(O)=O)CC(N)=O JPNRPAJITHRXRH-UHFFFAOYSA-N 0.000 description 1
- HJYYPODYNSCCOU-ODRIEIDWSA-N MDL-62769 Chemical compound OC1=C(C(O)=C2C)C3=C(O)C=C1NC(=O)\C(C)=C/C=C/[C@H](C)[C@H](O)[C@@H](C)[C@@H](O)[C@@H](C)[C@H](OC(C)=O)[C@H](C)[C@@H](OC)\C=C\O[C@@]1(C)OC2=C3C1=O HJYYPODYNSCCOU-ODRIEIDWSA-N 0.000 description 1
- 101710019262 MJ1070 Proteins 0.000 description 1
- 101710028811 MTBMA_c00490 Proteins 0.000 description 1
- UASDAHIAHBRZQV-YUMQZZPRSA-N Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N UASDAHIAHBRZQV-YUMQZZPRSA-N 0.000 description 1
- DZMGFGQBRYWJOR-YUMQZZPRSA-N Met-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O DZMGFGQBRYWJOR-YUMQZZPRSA-N 0.000 description 1
- 210000004897 N-terminal region Anatomy 0.000 description 1
- 101700080605 NUC1 Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 229960002950 Novobiocin Drugs 0.000 description 1
- 101000084487 Outer membrane porin F Proteins 0.000 description 1
- 235000011829 Ow cola Nutrition 0.000 description 1
- 240000000645 Oxalis tuberosa Species 0.000 description 1
- 235000008469 Oxalis tuberosa Nutrition 0.000 description 1
- 101710016786 P/C Proteins 0.000 description 1
- 108091005771 Peptidases Proteins 0.000 description 1
- OZILORBBPKKGRI-RYUDHWBXSA-N Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 OZILORBBPKKGRI-RYUDHWBXSA-N 0.000 description 1
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 1
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 1
- JMCOUWKXLXDERB-WMZOPIPTSA-N Phe-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 JMCOUWKXLXDERB-WMZOPIPTSA-N 0.000 description 1
- FSXRLASFHBWESK-HOTGVXAUSA-N Phe-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 FSXRLASFHBWESK-HOTGVXAUSA-N 0.000 description 1
- KLAONOISLHWJEE-UHFFFAOYSA-N Phenylalanyl-Glutamine Chemical compound NC(=O)CCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 KLAONOISLHWJEE-UHFFFAOYSA-N 0.000 description 1
- 241000690470 Plantago princeps Species 0.000 description 1
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 1
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 1
- RWCOTTLHDJWHRS-YUMQZZPRSA-N Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 RWCOTTLHDJWHRS-YUMQZZPRSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 210000003660 Reticulum Anatomy 0.000 description 1
- 101700084441 SFR2 Proteins 0.000 description 1
- 101710028729 SLC25A20 Proteins 0.000 description 1
- 102100011103 SLC25A20 Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- UJTZHGHXJKIAOS-WHFBIAKZSA-N Ser-Gln Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O UJTZHGHXJKIAOS-WHFBIAKZSA-N 0.000 description 1
- LAFKUZYWNCHOHT-WHFBIAKZSA-N Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O LAFKUZYWNCHOHT-WHFBIAKZSA-N 0.000 description 1
- PBUXMVYWOSKHMF-WDSKDSINSA-N Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO PBUXMVYWOSKHMF-WDSKDSINSA-N 0.000 description 1
- SBMNPABNWKXNBJ-UHFFFAOYSA-N Serinyl-Lysine Chemical compound NCCCCC(C(O)=O)NC(=O)C(N)CO SBMNPABNWKXNBJ-UHFFFAOYSA-N 0.000 description 1
- 229940083575 Sodium Dodecyl Sulfate Drugs 0.000 description 1
- 108010088160 Staphylococcal Protein A Proteins 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 229940014598 TAC Drugs 0.000 description 1
- 102100005486 TCP1 Human genes 0.000 description 1
- 101700078799 TCP1 Proteins 0.000 description 1
- 101700077173 TGA7 Proteins 0.000 description 1
- 101710002875 TYRO3 Proteins 0.000 description 1
- VPZKQTYZIVOJDV-LMVFSUKVSA-N Thr-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(O)=O VPZKQTYZIVOJDV-LMVFSUKVSA-N 0.000 description 1
- BECPPKYKPSRKCP-ZDLURKLDSA-N Thr-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BECPPKYKPSRKCP-ZDLURKLDSA-N 0.000 description 1
- APIDTRXFGYOLLH-VQVTYTSYSA-N Thr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O APIDTRXFGYOLLH-VQVTYTSYSA-N 0.000 description 1
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 1
- YKRQRPFODDJQTC-UHFFFAOYSA-N Threoninyl-Lysine Chemical compound CC(O)C(N)C(=O)NC(C(O)=O)CCCCN YKRQRPFODDJQTC-UHFFFAOYSA-N 0.000 description 1
- 229940024982 Topical Antifungal Antibiotics Drugs 0.000 description 1
- YNJBWRMUSHSURL-UHFFFAOYSA-N Trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 1
- YRIZYWQGELRKNT-UHFFFAOYSA-N Trichloroisocyanuric acid Chemical compound ClN1C(=O)N(Cl)C(=O)N(Cl)C1=O YRIZYWQGELRKNT-UHFFFAOYSA-N 0.000 description 1
- IMMPMHKLUUZKAZ-WMZOPIPTSA-N Trp-Phe Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=CC=C1 IMMPMHKLUUZKAZ-WMZOPIPTSA-N 0.000 description 1
- NQIHMZLGCZNZBN-PXNSSMCTSA-N Trp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC=3C4=CC=CC=C4NC=3)N)C(O)=O)=CNC2=C1 NQIHMZLGCZNZBN-PXNSSMCTSA-N 0.000 description 1
- TYYLDKGBCJGJGW-WMZOPIPTSA-N Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 TYYLDKGBCJGJGW-WMZOPIPTSA-N 0.000 description 1
- LWFWZRANSFAJDR-JSGCOSHPSA-N Trp-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 LWFWZRANSFAJDR-JSGCOSHPSA-N 0.000 description 1
- 101710042194 Trpgamma Proteins 0.000 description 1
- GRQCSEWEPIHLBI-UHFFFAOYSA-N Tryptophyl-Asparagine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(CC(N)=O)C(O)=O)=CNC2=C1 GRQCSEWEPIHLBI-UHFFFAOYSA-N 0.000 description 1
- YBRHKUNWEYBZGT-UHFFFAOYSA-N Tryptophyl-Threonine Chemical compound C1=CC=C2C(CC(N)C(=O)NC(C(O)C)C(O)=O)=CNC2=C1 YBRHKUNWEYBZGT-UHFFFAOYSA-N 0.000 description 1
- UBAQSAUDKMIEQZ-QWRGUYRKSA-N Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UBAQSAUDKMIEQZ-QWRGUYRKSA-N 0.000 description 1
- CGWAPUBOXJWXMS-HOTGVXAUSA-N Tyr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 CGWAPUBOXJWXMS-HOTGVXAUSA-N 0.000 description 1
- QZOSVNLXLSNHQK-UHFFFAOYSA-N Tyrosyl-Aspartate Chemical compound OC(=O)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UHFFFAOYSA-N 0.000 description 1
- ZSXJENBJGRHKIG-UHFFFAOYSA-N Tyrosyl-Serine Chemical compound OCC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 ZSXJENBJGRHKIG-UHFFFAOYSA-N 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- IBIDRSSEHFLGSD-YUMQZZPRSA-N Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-YUMQZZPRSA-N 0.000 description 1
- GJNDXQBALKCYSZ-RYUDHWBXSA-N Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 GJNDXQBALKCYSZ-RYUDHWBXSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 101700035528 YASK Proteins 0.000 description 1
- 101700083362 YLCN Proteins 0.000 description 1
- 101700017682 YMF16 Proteins 0.000 description 1
- 101700012947 YNAX Proteins 0.000 description 1
- 101700017418 YPQQ Proteins 0.000 description 1
- 101700042348 YTUX Proteins 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 230000019552 anatomical structure morphogenesis Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007172 antigens Proteins 0.000 description 1
- 102000038129 antigens Human genes 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 230000003190 augmentative Effects 0.000 description 1
- 238000006065 biodegradation reaction Methods 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 239000004568 cement Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002860 competitive Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000447 dimerizing Effects 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 231100001004 fissure Toxicity 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 101710028401 gene 5 Proteins 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 102000034327 globular proteins Human genes 0.000 description 1
- 108091005889 globular proteins Proteins 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010008237 glutamyl-valyl-glycine Proteins 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010050848 glycylleucine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 101710031454 groL1 Proteins 0.000 description 1
- 101710031453 groL2 Proteins 0.000 description 1
- 101710031450 groL4 Proteins 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 101700067551 hemX Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 229940079866 intestinal antibiotics Drugs 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 230000002427 irreversible Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 125000000012 isoleucine group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 230000000670 limiting Effects 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 239000002365 multiple layer Substances 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 101700006494 nucA Proteins 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 239000006916 nutrient agar Substances 0.000 description 1
- 229940005935 ophthalmologic Antibiotics Drugs 0.000 description 1
- 239000011860 particles by size Substances 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 108091008117 polyclonal antibodies Proteins 0.000 description 1
- 230000001376 precipitating Effects 0.000 description 1
- QLROSWPKSBORFJ-BQBZGAKWSA-N pro glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 230000001915 proofreading Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000001718 repressive Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 229960003292 rifamycin Drugs 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000000087 stabilizing Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 230000001954 sterilising Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 102000003995 transcription factors Human genes 0.000 description 1
- 108090000464 transcription factors Proteins 0.000 description 1
- 238000005829 trimerization reaction Methods 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 108010044292 tryptophyltyrosine Proteins 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010068794 tyrosyl-tyrosyl-glutamyl-glutamic acid Proteins 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 101700009423 ycf24 Proteins 0.000 description 1
- 101700006214 ydhX Proteins 0.000 description 1
- 101700038436 yhaC Proteins 0.000 description 1
- 101700057840 yhxC Proteins 0.000 description 1
- 101700058793 yjgN Proteins 0.000 description 1
- 101700008973 yorX Proteins 0.000 description 1
- 101700043759 yppC Proteins 0.000 description 1
- DXJZITDUDUPINW-UHFFFAOYSA-N γ-glutamyl-Asparagine Chemical compound NC(=O)CCC(N)C(=O)NC(CC(N)=O)C(O)=O DXJZITDUDUPINW-UHFFFAOYSA-N 0.000 description 1
- SIGGQAHUPUBWNF-UHFFFAOYSA-N γ-glutamyl-Methionine Chemical compound CSCCC(C(O)=O)NC(=O)C(N)CCC(N)=O SIGGQAHUPUBWNF-UHFFFAOYSA-N 0.000 description 1
- UKKNTTCNGZLJEX-UHFFFAOYSA-N γ-glutamyl-Serine Chemical compound NC(=O)CCC(N)C(=O)NC(CO)C(O)=O UKKNTTCNGZLJEX-UHFFFAOYSA-N 0.000 description 1
Abstract
La presente invención se relaciona con nanoestructuras, es decir, estructuras de tamaño nanométricoútiles en la construcción de estructuras microscópicas y macroscópicas. En particular, la presente invención se relaciona con nanoestructuras basadas en las proteínas de fibra de cola del bacteriófago T4 y variantes de las mismas.
Description
"MATERIALES PARA LA PRODUCCIÓN DE ESTRUCTURAS NANOMETRICAS Y USO DE LAS MISMAS"
CAMPO DE LA INVENCIÓN
La presente invención se relaciona con nanoestruc turas, es decir, estructuras de tamaño nanométrico útiles en la construcción de estructuras microscópicas y macroscópicas. En particular, la presente invención se relaciona con nanoestructuras basadas en las proteínas de fibra de cola del bacteriófago T4 y variantes de las mismas.
ANTECEDENTES DE LA INVENCIÓN
Aún cuando la resistencia de la mayoría de los materiales metálicos y a base de cerámica se deriva de las resistencias de ligazón teóricas entre sus moléculas componentes y sus superficies de cristalita, está limitada significativamente mediante fallas en sus estructuras de cristal o semejantes a vidrio. Estas fallas usualmente son inherentes a las materias primas mismas o desarrolladas durante la fabricación y frecuentemente se expanden debido a la exposición a esfuerzos ambientales.
El campo emergente de la nanotecnología ha hecho más críticas las limitaciones de los materiales tradicionales. La capacidad de diseñar y producir estructuras muy pequeñas (es decir, de dimensiones nanométricas) que pueden servir para funciones complejas depende del uso de materiales apropiados que pueden manipularse de maneras previstas y reproducibles, y que tiene las propiedades requeridas para cada aplicación novedosa. Los sistemas biológicos sirven como un paradigma para nanoestructuras sofisticadas. Las células vivientes fabrican proteínas y combinan las mismas en estructuras que se forman perfectamente y pueden resistir el daño en su medio ambiente normal. En algunos casos, se crean estructuras intrincadas mediante un proceso de auto-ensamblado, las instrucciones para el cual se construyen en los polipéptidos componentes. Finalmente, las proteínas están sujetas a procesos de corrección de pruebas que aseguran un alto grado de control de calidad. Por lo tanto, hay una necesidad en la técnica para métodos y composiciones que explotan estas particularidades singulares de las proteínas para formar constituyentes de nanoestructuras sintéticas. La necesidad es para diseñar materiales cuyas propiedades se pueden modelar para adaptarse a requisitos específicos de la tecnología a la escala de nanó etro. Además, puesto que las subunidades de la mayoría de los materiales macroestructurales, cerámicas, metales, fibras, etc. se basan en la ligazón de las subunidades nanoestructurales, la fabricación de subunidades apropiadas sin fallas o defectos y dimensiones y uniformidad exactas deben mejorar la resistencia y consistencia de las macroestructuras debido a que las superficies son más regulares y pueden interaccionar más estrechamente a través de un área ampliada del material más grande y más heterogéneo.
COMPENDIO DE LA INVENCIÓN
En un aspecto, la presente invención proporciona bloques de construcción de proteína aislada para nanoestructuras, que comprenden proteínas de fibra de cola modificadas del bacteriógrafo T4. Las proteínas gp34, 36 y
37 se modifican de varias maneras para formar estructuras de bastón novedosas con propiedades diferentes. Las secuencias de péptido internas específicas se pueden suprimer sin afectar su capacidad para formar dímeros y asociarse con sus compañeras de fibra de cola naturales.
Alternativamente, pueden modificarse de manera que: interaccionen solamente con otras compañeras de fibra de cola modificadas y no nativos. exhiban interacciones termolábiles con sus compañeras; o que contiene grupos funcionales adicionales que permiten que las mismas interaccionen con los residuos de ligazón heterólogos. La presente invención también abarca proteínas de fusión que contienen secuencias de dos o más proteínas de fibra de cola diferentes. La proteína gp35, que forma una articulación de ángulo, se modifica a fin de formar ángulos promedio diferentes del ángulo promedio natural de 137°C
(+7°) o 156° (+12°), y para exhibir interacciones termolábiles con sus compañeras. En otro aspecto, la presente invención proporciona nanoestructuras que comprenden proteínas de fibra de cola nativas modificadas del bacteriófago T4. Las nanoestructuras pueden ser bastones unidireccionales, polígonos bidimensionales u hojas abierta o cerrada o jaulas abiertas tridimensionales o sólidos cerrados.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
Las Figuras ÍA y IB muestran una representación esquemática de la partícula del bacteriógago T4 (Figura ÍA) , y ur.a representación esquemática de la fibra de cola del bacteriófago T4 (Figura IB) . La Figura 2 muestra una representación esquemática de un bastón unitario.
Las Figuras 3A a 3D muestran representaciones esquemáticas de: un bastón de unidades múltiples unidimensionales unidas a lo largo del eje x (Figura 3A) : hojas simples cerradas (Figura 3B) : hojas de ladrillo cerradas (Figura 3C) : y hojas de ladrillo abiertas (Figura 3D) . La Figura 4 muestra una representación esquemática de dos unidades usadas paa construir hojas porosas y sólidas (superior e inferior) , que, cuando se colocan en capas alternativamente, producen un juego de capas múltiples de jaulas como se muestra. La Figura 5 muestra una representación esquemática de una estructura en ángulo que tiene un ángulo de 120°C. La Figura 6 muestra una secuencia de ADN (SEQ ID
NO:l) de genes 34, 35, 36 y 37 del bacteriófago T4. La Figura 7 muestra las secuencias de aminoácido
(que se muestran en códigos de una sola letra) de los productos de gen de los genes 34 (SEQ ID NO: 2, ORFX SEQ ID NO:3), 35 (SEQ ID NOM), 36 (SEQ ID NO:5), y 37 (SEQ ID
NO: 6 del bacteriófago T4. Las secuencias de aminoácido
(línea inferior de cada par) quedan alineadas con las secuencias de nucleótido (línea superior de cada par) . Se observará que la secuencia de proteína deducida del gen 35 (de la base de datos NCBI) se cree que es exacta.
Las Figuras 8A-8B muestran una representación esquemática de: la formación de un iniciador de dímero P37 de una mclécula que se auto-ensambla en un dímero (Figura
8A) ; y la formación de un iniciador del trímero P37 de una molécula que se auto-ensambla en un trímero (Figura 8B) . La Figura 9 muestra una representación esquemática de la formación del polímero (P37-P36)n con un iniciador que es un dímero de auto-ensamblado.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
Todas las patentes, solicitudes de patente y referencias en la literatura citadas en la especificación, se incorporan en la presente por referencia en su totalidad. En el caso de inconsistencias, prevalecerá la exposición presente, incluyendo las definiciones. Aún cuando la invención se describe en términos de las proteínas de fibra de cola de bacteriófago T4, se comprenderá que la invención es también aplicable a proteínas de fibras de cola de otros bacteriófagos semejante a una T, v.gr., de la familia T4 (v.gr., T4, Tula, Tulb) , y la familia T2 (T2, T6, K3, 0x2, MI, etc.).
DEFINICIONES "Nanoestructuras" se definen en la presente como estructuras de tamaños y formas diferentes que se ensamblan de componentes de proteína de tamaño nanométrico. "Químeros" se definen en la presente como proteínas quiméricas en donde por lo menos las regiones terminales de amino- y carboxi se derivan de pólipéptidos originales diferentes ya sea que los polipéptidos originales ocurran de manera natural o se hayan modificado mediante mutagénesis. "Homodímeros" se definen en la presente como conjuntos de dos subunidades de proteína esencialmente idénticas que forman una estructura tridimensional definida. La designación "gp" representa un polipéptido monomérico, mientras que la designación "P" representa homooligó eros . P34, P36 y P37 son supuestamente homodímeros u homotrímeros . Un polipéptido aislado que "consiste esencialmente de" una secuencia de aminoácido especificada se define en la presente como un polipéptido que tiene la secuencia especificada o un polipéptido que contiene substituciones conservadoras dentro de esa secuencia. Las substituciones conservadoras como lo comprenderán aquellas personas conocedoras de la técnica son aquellas en donde un residuo acídico se reemplaza por un residuo acídico, un residuo básico mediante un residuo básico o un residuo hidrofóbico mediante un residuo hidrofóbico. Está marcado asimismo ?;n polipéptido que carece de uno o más aminoácidos ya sea en el terminal de amino o el terminal de carboxi, hasta un total de cinco en cada terminal, cuando la ausencia de los residuos específicos no tiene efecto discernible en la estructura o la función del polipéptido para lleve.r a la práctica la presente invención. La presente invención se relaciona con una nueva clase de bloques de construcción de proteína cuyas dimensiones se miden en nanómetros, que son útiles en la construcción de estructuras microscópicas y macroscópicas. Sin desear quedar limitados mediante ninguna teoría, se ere que la unidad básica es un homodímero compuesto de dos subunidades de proteína idénticas que tienen una configuración de beta cruzada aún cuando una estructura trimérica también es posible. Por lo tanto como será evidente, las referencias a un "homodímero" o "dimerización" como se usan en la presente en muchos casos de interpretarán también como haciendo referencia a un homotrímero o trimerización. Estas unidades en forma de bastón, largas rígidas y estables pueden ensamblarse con otros bastones usando dispositivos de acoplamiento que pueden fijarse genéticamente o in vitro. Los extremos de un bastón pueden fijarse a extremos diferentes de otros bastones o bastones semejantes. Las variaciones en la longitud de los bastones en los ángulos de fijación y en sus características de flexibilidad permiten que las estructuras diferentemente configuradas se auto-ensamblen in situ. De esta manera las unidades pueden auto-ensamblarse en estructuras más grandes predeterminadas de una, dos o tres dimensiones. El auto-ensamblado puede proporcionarse para formar estructuras de dimensiones precisas y resistencia uniforme debido a la fabricación biológica exenta de defectos de los componentes. Los bastones también pueden modificarse mediante modificaciones genética y química para formar sitios de fijación específicos predeterminados para otras entidades químicas, permitiendo la formación de estructuras complejas. Un aspecto importante de la presente invención es que las unidades de proteína pueden diseñarse de manera que comprendan bastones de longitudes diferentes y pueden además modificarse para incluir particularidades que alteran sus propiedades superficiales de maneras predeterminadas y/o influencian su capacidad para unirse con otras unidades idénticas o diferentes. Además, las capacidades de auto-ensamblado pueden expandirse produciendo proteínas quiméricas que combinan las propiedades de dos miembros diferentes de esta clase. Esta particularidad de diseño se logra manipulando la estructura de los genes que codifican estas proteínas. Como se detallará a continuación, las composiciones y métodos de la presente invención aprovechan la ventaja de las propiedades de las proteínas naturales, es decir, las estructuras resultantes son rígidas, resistentes estables en medios acuosos, resistentes al calor, resistentes a la proteasa y pueden hacerse biodegradables. Una gran cantidad de unidades se puede fabricar fácilmente en los microorganismos. Además, para facilidad de automatización, las grandes cantidades de piezas y subconjuntos pueden almacenarse y usarse tal y como sea necesario. Las secuencias de las subunidades de proteína se basan en los componentes de la fibra de cola de bacteriófago T4 de E. coli. Se comprenderá que los principios y técnicas pueden aplicarse a las fibras de cola de otros bacteriófagos a un T, u otros bacteriófagos relacionados que tengan estructuras de cola y/o fibra semejantes. La estructura de la fibra de cola de bacteriófago T4 (que se ilustra en la Figura 1) se puede representar esquemáticamente de la siguiente manera (N= terminal de amino, C== terminal de carboxi) : N[P34]C - N[gp35]C N[P36]C - N)P237]C. P34, P36 y P37 son todos homodímeros de proteína rígidos, en forma de bastón en donde dos hojas beta idénticas orientadas en la misma dirección se funden cara a cara mediante interacciones hidrofóbicas entre las hojas colocadas en yuxtaposición con un eje de simetría de rotación de 180° a través del eje largo del bastón. (La estructura variará si P34, P36 y P37 son homotrímeros) . gp35, en contraste, es un polipéptido monomérico que se fija específicamente al terminal N de P36 y luego al terminal C de P34 y forma una articulación de ángulo entre dos bastones. Durante la infección de T4 de E coli, dos monómeros gp 37 se dimerizan para formar un homodímero P37; el proceso de dimerización se cree que se inicia cerca del terminal C de P37 y que requiere dos proteínas E. coli de compañía. (Una variante gp37 con una mutación sensible a la temperatura cerca del C-terminal usada en la invención presente requiere solamente una compañía gp57, para dimerización) . Una vez que se dimeriza, el terminal N de P37 inicia la dimerización de dos monómeros gp36 hacia un bastón P36. La unión o articulación entre el terminal C de P36 y el terminal N de p37 es apretado y rígido, pero no covalente, El terminal N de P36 luego se fija al monómero gp35; esta interacción estabiliza P36 y forma el codo de la fibra de cola. Finalmente, gp35 se fija al terminal C de P34 (que usa gp57 para dimerización) . Por lo tanto, el auto-ensamblado de la fibra de cola se regula mediante un orden de interacción predeterminado de las subunidades específicas mediante lo cual de maduración estructural ocasionada por la formación del primer subconjunto permite la intereicción con nuevas subunidades (anteriormente no capacitadas) . Esto da por resultado la producción de una estructura de especificaciones exactas de una mezcla al azar de los componentes. De conformidad con la presente invención, los genes que codifican estas proteínas pueden modificarse a fin de producir bastones de longitudes diferentes con combinaciones de exremo diferentes. Las propiedades de las proteínas nativas son particularmente ventajosas a este respecto. Primero, la hoja beta está compuesta de beta-fibras y beta-dobleces antiparalelos en las orillas izquierda (L) y derecha (R) . Segundo, las cadenas laterales de aminoácido alteran hacia arriba y hacia abajo fuera del plano de la hoja. La primera propiedad permite que los dobleces puedan extenderse para formar sitios de fijación simétricos y específicos entre las superficies L y R, así como formar sitios de fijación para otras estructuras. Además, las secciones de núcleo de la hoja beta pueden acortarse o alargarse mediante manipulaciones genéticas, v.gr., mediante empalme de las regiones de ADN que codifican los dobleces beta en la misma orilla de la hoja, para formar nuevos dobleces que excluyen los pépidos de intervención o insertando segmentos de péptido de una manera analógica empalmándose en los ángulos de doblez. La segunda propiedad permite que las cadenas laterales de aminoácido se extiendan por encima y debajo de las superficies de la hoja beta para modificarse durante substitución genética o acoplamiento químico. De manera importante, todas las modificaciones anteriormente citadas se logran sin comprometer la integridad estructural del bastón. Se comprenderá por una persona experta en la técnica que estas propiedades permiten una gran cantidad de flexibilidad al diseñar unidades que pueden ensamblarse en una amplia variedad de estructuras algunas veces las cuales se detallarán a continuación.
UNIDADES ESTRUCTURALES Los bastones de la presente invención funcionan de manera semejante a espárragos de madera o vigas de acero para construcción. En este caso, las superficies son exactamente reproducibles al nivel molecular y de esta manera se ajustan para fijaciones específicas a bastones de unidades similares o diferentes o sitios de unión fijos. Las superficies también se modifican para ser más o menos hidrofílicas incluyendo grupos cargados positiva y negativamente, y tienen protuberancias construidas para la ligazón específica a otras unidades o a una unión intermedia con dos sitios receptores. Las superficies del bastón y una esquemática del bastón unitario se ilustran en la Figura 2. Las tres dimensiones del bastón se definen como: x, para la dimensión posterior (B) hacia frontal (F) ; y, para la dimensión hacia abajo (D) hacia arriba (U) ; y z para la dimensión de izquierda (L) a derecha a derecha (R) . Los bastones multi-unitarios unidimensionales pueden ensamblarse fácilmente de bastones unitarios individuales unidos a lo largo del eje x (Figura 3A) pero la unión regular de subunidades en cualesquiera de las otras dos dimensiones también formará una estructura larga, pero con secciones transversales diferentes que en la dimensión x. Dos construcciones dimensionales son las hojas formadas mediante interacción de los bastones a lo largo de cualquiera de los dos ejes. 1) Hojas simples cerradas se forman de superficies que se traslapan exactamente a lo largo de cualesquiera de los dos ejes (Figura 3B) . 2) Hojas de ladrillo cerradas se forman de la interacción entre las unidades que tienen exactamente superficies traslapantes en una dimensión y un tipo especial de traslape en la otra (Figura 3C) . En este caso deben haber dos juegos diferentes de uniones o juntas complementarias separadas con exactamente una distancia de 1/2 unidad entre las mismas. Si se centran (es decir, cada juego de 1/4 desde el extremo) entonces cada unión o junta estará en el centro de las unidades por encima y por debajo. Si están descentradas, entonces la junta o unión se descentrará asimismo. En esta construcción, los sitios de interacción complementarios están esquematizados mediante y ' ' . Si los sitios de interacción cada uno son simétricos, las hileras alternativas pueden interaccionar con los bastones en cualquier dirección. Si no son simétricas, y pueden sólo interaccionar con hileras de intersección en la dirección misa u opuesto, la hoja se fabricará de bastones unidireccionales o capas de bastones en direcciones alternativas. 3) Hojas de ladrillo abiertas (o redes) que resultan de las unidades cuando se separan mediante más de media unidad (Figura 3D) . Las dimensiones de las aberturas (o poros) dependen de la distancia (dx) que separa los sitios de interacción y la distancia (dy) mediante lo cual estos sitios separan las superficies. Las construcciones tridimensionales requieren interacciones estéricamente comparatibles entre las tres superficies para formar sólidos. 1) Sólidos cerrados se pueden ensamblar de unidades que se traslapan exactamente en todas las tres direcciones (v.gr., el traslape exacto de las hojas simples cerradas) . De una manera análoga, las hojas de ladrillo cerradas pueden formar sólidos cerrados mediante hojas traslapantes exactamente o desplazadas para colocar IDS ladrillos en la tercera dimensión. Esto requiere un juego de uniones apropiado en todos los tres pares de caras paralelas de la unidad. 2) Sólidos porosos se fabrican uniendo las hojas de ladrillo abiertas de varias mar.eras. Por ejemplo, si las unidades se traslapan exactamente en la dimensión tercera, se forma un sólido con una formación de agujeros de dimensiones exactas que corren perpendiculares al plano del papel. Si en vez de estos, se necesita m material con espacios cerrados, con capas de ancho dz es decir, en la dimensión U—>D) , una hoja cerrada simple se coloca en capa sobre la hoja de ladrillo abierta para cerrar las aberturas. Si el traslape de la hoja de ladrillo abierta es v.gr., de la unidad 1/4, entonces el bastón de una longitud de 3/4 unidades se usa para producir la hoja. Las uniones o juntas luego se necesitan en la dimensión z. Las dos unidades usadas para polimerizar estas capas alternativas, y las capas mismas, se muestran esquemáticamente en la Figura 4. Todas las estructuras anteriormente citadas están compuesta:» de bastones lineales o simples. Una segunda unidad, la unidad de ángulo expande el tipo y dimension¡?lidad de las estructuras posibles. La unidad de ángulo conecta dos bastones a ángulos diferentes de 180°, semejantes a un hierro ángulo. El ángulo promedio y su grado de rigidez se construyen en esta estructura conectora. Por ejemplo, la estructura mostrada en la Figura 5 tiene un ángulo de 120° y sitios de unión específicos diferentes en a y en b. Los siguienes son ejemplos de estructuras que se forman utilizando juntas o uniones de ángulo: 1) Hojas de ladrillos abiertas se expanden y se refuerzan en la dirección perpendicular a la dirección del bastón, añadiendo ángulos perpendiculares a la hoja. En este caso, se forma una red tridimensional. La fijación de ángulos de 90° a los extremos de los bastones, produce un ángulo casi en el plano de la hoja, permitiendo que se añadan nuevos bastones a aquellos ángulos (que deben tener cierto juago del plano de la hoja original para fijarse en el primer sitio) para formar una nueva hoja, casi paralela, con una orientación perpendicular a su vecina superior e inferior. 2. Los hexágonos se producen de una mezcla de bastones juntas o uniones de ángulo que forman ángulos de 120°. En este caso, hay dos juegos de uniones o juntas exclusivos. Cada juego se produce hasta uno de los dos extremos del bastón y uno de los dos sitios complementarios en el ángulo. Esta es una estructura lineal en el sentido de que el hexágono tiene una direcicón (ya sea una dirección dextrógira o levógira) . Puede producirse en una red abierta bidimensional (es decir, una estructura alveolar bidimensional) uniendo los lados de los hexágonos. Puede formar tubos hexagonales teniendo la parte superior del hexágono por debajo hasta la cara inferior del hexágono por encima. Si los tubos se unen también mediante sus lados, formarán un tubo hexagonal múltiple tridimensional abierto. 3) Los tubos hexagonales helicoidales se producen de manera análoga a los hexágonos pero la sexta unidad no se une a la primera para cerrar el hexágono. En vez de esto, el extremo se desplaza del plano del hexágono y la séptima y unidades adicionales se añadan para formar un tubo hexagonal que puede ser un resorte si hay poca o ninguna fierza adhesiva entre las unidades de la hélice, o un bastón rígido si hay esta fuerza para mantener la proximidad estrecha de las unidades opuestas. Será evidente para una persona experta en la técnica que las composiciones y métodos de la presente invención también abarcan otras estructuras poligonales tales como octágonos, así como sólidos abiertos tales como tetrahedros e icosahedros formados de triángulos y cajas formadas de cuadros y rectángulos. La escala de estructura se limita únicamente mediante el tipo de unidades de ángulo y los substituyentes que se pueden proporcionar en los ejes diferentes de las unidades de bastón. Por ejemplo, sus ángulos que ocurren de manera natural se encuentran en las fibras del bacteriófago T7, que tiene un ángulo de 90° (Steven y otros, J. Mol. Biol. 200: 352-365, 1988) .
DISEÑO Y PRODUCCIÓN DE LAS PROTEÍNAS DE BASTÓN Las subunidades de proteína se usan para construir las nanoestructuras de la presente invención se basan en los cuatro polipéptidos que comprenden las fibras de cola del bacteriófago T4, es decir, gp34, gp35, gp36 y gp37. Los genes que codifican estas proteínas se han clonado, y su ADN y secuencias de proteína se han determinado (para el gen 36 y 37 véase de Oliver y otros, J. Mol. Biol. 153: 545-568, 1981). Las secuencias de ADN y aminoácido de los genes 34, 35, 36 y 37 se señalan en las Figuras 6 y 7 que se presentarán a continuación. Gp34, gp35, gp36 y gp37 se producen de manera natural después de la infección de las células de E. coli mediante partículas intactas del bacteriófago T4. Después de la síntesis en el citoplasma de la célula bacteriana, los monóireros gp34, 36 y 37 forman homodímeros que son competentes para ensamblarse con partículas bacteriófagas maduras. Por lo tanto, el E. coli sirve como una fábrica eficiente y conveniente para la síntesis y la dimerización de las subunidades de proteína que se describirán a continuación.
Al llevar a la práctica la presente invención, los genes que codifican las proteínas de interés (nativos, modificados o recombinados) se incorporan en los vectores de exprés:.ón de ADN que son bien conocidos en la técnica. Estos plásmidos circulares típicamente contienen genes marcadores seleccionables (que confieren usualmente resistencia antibiótica a las bacterias transformadas), secuencias que permiten la duplicación del plásmido a un número elevado de copias en E. coli y un sitio de clonación múltiple inmediatamente en aguas abajo de un sitio de ligazón de ribosoma y promotor inducible. Los ejemplos de vectores comercialmente disponibles apropiados para usarse en la presente invención incluyen el sistema de pET (Novagen, Inc., de Madison, Wl) y los vectores Superenla adores pSE280 y pSE380 (Invitrogen, San Diego, CA) . La estrategia es 1) construir el gen de interés y clonar el mismo en el sitio de clonación múltiple; 2) transformar las células de E. coli con el plásmido recombinante; 3) inducir la expresión del gen clonado; 4) probar para síntesis del producto de proteína; y, finalmente, 5) probar para la formación de homodímeros funcionales. En algunos casos, los genes adicionales también se clonan en el mismo plásmido, cuando se requiere su función para dimerización de la proteína de interés, por ejemplo cuando se expresan versiones de tipo silvestre o modificadas de gp37, el gen 57 de compañía bacteriano también se incluye; cuando se expresa el gp36 de tipo silvestre modificado, la versión de tipo silvestre o la versión del gp37 se incluye. El gp37 modificado debe tener la capacidad de dimerizar y contener un terminal N que puede ser compañero de la dimerización de gp36. Este método permite la formación de productos de gen monomérico y, en algunos casos la maduración de los monómeros en bastones homodimérícos en ausencia de otras proteínas inducidas por bacteriófago presentes normalmenmte en la célula infectada con T4. Los pasos 1 a 4 de la estrategia anteriormente definida se logran mediante métodos que son bien conocidos en la técnica de la tecnología de ADN recombinante y expresión de proteína en bacterias. Por ejemplo, en el paso 1, la disociación de la enzima de restricción en sitios múltiples, seguida por ligamento de fragmentos se usa para construir supresiones en el segmento del bastón interno de gp34, 36 y 37 (véase el Ejemplo 1 que se presenta a continuación) . Alternativamente, se usa una disociación de enzima de restricción individual o múltiples seguida por digestión de exonucieasa (EXO-SIZE, New England Biolabs, de Beverly, MA) , para suprimir las secuencias de ADN en una o ambas direcciones desde el sitio de disociación inicial;
cuando se combina con el paso de ligamento subsecuente, este procedimiento produce un juego de supresiones de tamaños aamentados. De manera semejante, se usan métodos normales para recombinar los segmentos de ADN de dos genes de fibra de cola diferentes, para producir genes quiméricos que codifican las proteínas de fusión (llamadas "químeros" en esta descripción) . Por lo general, este último método se usa para proporcionar los terminales alternativos N- o C- y por lo tanto crear combinaciones novedosas de los extremos que permiten nuevos patrones de unión de segmentos de bastón diferentes. Un representante de este tipo de químero, ]a fusión de gp37-36, se describe en el Ejemplo 2. Los huéspedes preferidos para la producción de estas proteínas (Paso 2) es la cepa E. coli BL21 (DE3) y BL21 (DE3/pLysS) (obtenible comercialmente de Novagen, de Madison, Wl), aún cuando pueden usarse otras cepas compatibles recA, tales como HMS174(DE3) y HMS174 (DE3/pLysS) . La transformación con el plásmido recombinante (Paso 2) está acompañado por métodos normales (Sambrook, J. Molecular Cloning, Cold Spring Harbor Laboratories, Cold Spring Harbor, NY; esta también es la procedencia para los métodos de ADN recombinante normales usados en esta invención) . Las bacterias transformadas se seleccionéin debido a su resistencia a los antibióticos, v.gr, amp;.cilina o canamicina. El método mediante el cual se induce la expresión de los genes de fibra de cola clonados (Paso 3) depende del promotor específico usado. Un promotor preferido es plac (con un laci^ en el vector para reducir la expresión de fondo), que puede regularse mediante la adición de isopropiltiogalactósido (IPTG) . Un segundo promotor preferido es pT7fl0 que es específico para la polimerasa de ARN T7 y no se reconoce por la polimerasa de ARN de E. coli. La polimerasa de ARN T7 que es resistente a la rifamicina, se codifica en el lisógeno de DE lambda defectuoso en el cromosoma BL21 de E. coli. La polimersa T7 en BL21(DE3) se super reprime mediante el gen laci"? en el plásmido y se induce y regula mediante IPTG. Típicamente, se incuba un cultivo de las bacterias transformadas con el inductor durante un período de horas durante las cuales las síntesis de la proteína de interés se supervisa. En el caso presente, los extractos de las células bacterianas se preparan y las proteínas de fibra de cola T4 se detectan por ejemplo mediante electroforésis de gel de SDS-poliacrilamida. Jna vez que se detecta la proteína modificada en los extractos bacterianos, es necesario asegurarse de si forma o no los homodímeros apropiados (Paso 4). Esto se logra inicialmente probando si la proteína se reconoce mediante un antisuero específico hacia la forma dimerizada madura de la proteína. Los antisueros específicos de la fibra de cola se preparan como se describe (Edgar, R.S. y Lielausis, I., Genetics 52: 1187, 1965; Ward y otros, J. Mol. Biol. 54:15, 1970) . Abreviando, se usan bacteriófagos T4 enteros como un inmunógeno; opcionalmente, el antisuero resultante luego es absorbido con partículas del bacteriófago menos la cola removiendo de esta manera todos los anticuerpos excepto aquellos dirigidos contra las proteínas de fibra de cola. En el paso subsecuente, las alícuotas diferentes del antisuero son absorbidas individualmente con los extractos, los cuales cada uno carece de una proteína de fibra de cola específica. Por ejemplo, si un extracto que contiene solamente componentes de fibra de cola P34, se usa gp35 y gp36 (derivados de una célula infectada con un mutante T4 que carece de un gen gp37 funcional) para la absorción, y el antisue*ro resultante reconocerá únicamente el P37 maduro y el P36-P37 dimerizado. Un enfoque semejante se puede usar para preparar los antisueros individuales que reconocen solamente el P34 y P36 maduros (es decir, homodimerizados) absorbiéncose con extractos que contienen fibras de cola de mitad distante o P34, gp35 y P37, respectivamente. Una alternativa es elevar el anticuerpo contra las mitades de la fibra ce cola purificadas v.gr., P34 y gp35-P36-P37. Los anti gp35-P36-P37 luego pueden ser absorbidos con P36-P37 para producir el anti-gp35 y el anti-P36 se puede producir mediante absorción con P37 y gp35. Los anti-P37, anti-gp35 y anti-P34 también se pueden producir directamente usando P37, gp35 y P34 purificados como inmunógenos. Otro enfoque es elevar los anticuerpos monoclonales específicos contra los componentes de fibra de cola diferentes o segmentos de los mismos. Los anticuerpos específicos a las subunidades o partes de cola que usan en cualesqiera de las maneras siguientes para detectar las proteínas de fibra de cola apropiadamente homodimerizada: 1) colonias bacterianas se seleccionéin para aquellas proteínas de fibra de cola maduras de expresión transfiriendo directamente las colonias o alternativamentes muestras de los cultivos lisados o no lisados a filtros de nitrocelulosa. Lisar las células bacterianas en el filtro si es necesario e incubarse con los anticuerpos específicos. La formación de complejos inmunes luego se detecta mediante métodos usados ampliamente en la técnica (v.gr., anticuerpo secundario conjugado hacia una enzima cromogénica o Proteína A de Estafilococo irradiada) . Este método es particularmente útil para seleccionar grandes números de colonias, v.gr., aquellas producidas por la supresión de exo-tamaño como se describe en lo que antecede. 2) Las células bacterianas que expresan la proteína de interés primero se irradian metabólicamente con -^^S-metionina, seguido por preparación de extractos e incubación con el antisuero. Los complejos inmunes luego se recuperan mediante incubación con la Proteína A inmovilizada seguido por centrifugación después de lo cual pueden resolverse mediante electroforésis de gel de SDS-po iacrilamida. Un ensayo competitivo alternativo para probar si las proteínas de fibra de cola internamente suprimidas que no permiten la infección del bacteriófago, sin embargo, retienen la capacidad para dimerizarse y asociarse con sus compañeras apropiadas utiliza un sistema de complemtentación in vitro. 1) Un extracto bacteriano que contiene ] a proteína modificada de interés como se describe en lo qus antecede, se mezcla con un segundo extracto preparado de células infectadas con el bacteriófago T4 que es un mutante en el gen de interés. 2) Después de varias horas de incubación, se añade un tercer extracto que contiene J a versión de tipo silvestre de la la proteína que se está probando, y la incubación se continua durante varias horas adicionales. 3) Finalmente, el extracto se valora pera las partículas del bacteriófago infeccioso infectando E. coli cuantificando las placas del bacteriófago que resultan. Una proteína de fibra de cola modificado que se dimeriza correctamente y que es capaz de unirse cen sus compañeras se incorpora en las fibras de cola de una manera no funcional en el Paso 1, evitando de esta manera la incorporación de la versión de tipo silvestre de la proteína en el Paso 2; el resultado es una reducción en la valoración de la muestra del bateriófago resultante. En constraste, si la proteína modificada es incapaz de dimerizarse y por lo tanto forma los terminales N y/o C apropiados, no se incorporará en las partículas del bacteriófago en el Paso 1, y de esta manera no competirá con el ensamblado en las partículas de bacteriófago intactas en el Paso 2; la valoración del bacteriófago debe por lo tanto ser equivalente a aquél obnservado cuando se añade la protéina modificada en el Paso 1 (un control negativo) . Otra manera en la cual se prueba si los químeros y las proteínas de fibra de cola internamente suprimidas retienen la capacidad para dimerizarse y asociarse con sus compañeras apropiadas, se lleva a cabo in vivo. El ensayo detecta la capacidad de estos químeros y proteínas suprimidas para competir con las partes normales del bacteriófago para ensamblado, reduciendo por lo tanto, el tamaño de reventamiento del bacteriófago de tipo silvestre que infecta la misma célula huésped en donde se expresaron recombinantemente los químeros o las proteínas suprimidas. Por lo tanto, la expresión de un vector de expresión que codifica el químero o la proteína suprimida se induce dentro de una célula y la célula luego se infecta mediante un bacteriófago de tipo silvestre. La inhibición de la producción del bacteriófago de tipo silvestre demuestra la capacidad del químero o proteína recombinante para asociarse con las proteínas de la fibra de cola apropiadas del bacteriófago. Se usan los métodos anteriormente descrito solos o en combinación en el diseño y producción de tipos diferentes de proteínas de fibra de cola modificadas. Por ejemplo, una selección preliminar de un gran número de colonias bacterianas para aquellas que expresan una proteína apropiadamente dimerizada, identificará las colonias positivas que luego pueden probarse individualmente mediante complementación in vitro. Los ejemplos no limitativos de las proteínas novedosas que se abarcan mediante la presente invención incluyen; 1) Los polipéptidos gp34, 36 y 37 internamente suprimidos (veáse el Ejemplo 1 que se presenta a continuación) ; 2) El gp36 truncado en el terminal C fundido en el terminal N de gp37 truncado en el terminal N; 3) Una fusión entre gp36 y gp37 en donde gp37 es el terminal N para gp36 (es decir, en reversa del orden natural) , denominado aquí "químero gp37-36" (Veáse el Ejemplo 2 que se presenta a continuación) ; 4) Una fusión entre gp34 y gp36 en donde gp36 es el terminal N para gp34 (es decir, en reversa del orden natural), denominado aquí "químero gp36-34"; 5) Una variante de gp36 en donde el terminal C se somete a mutación de tal manera que carece la capacidad para interaccionar con (y dimerizarse en respuesta a) el terminal N del P37 de tipo silvestre, denominado aquí "gp36*"; 6) Una variante de gp37 en donde el terminal N se somete a mutación de tal manera que forma un P37 que carece de la capacidad para interaccionar con el terminal C del gp36 de tipo silvestre denominado aquí "*P37"; 7) Variantes de gp36* y *P37 que pueden interaccionar uno con el otro, pero no con gp36 o P37. 8) Una variante del "químero P37-36" en donde el residuo de gp36 se deriva de la variante como en 5) , es decir, "P37-36*". (Para 5 a 8, Véase el Ejemplo 3 que se presenta a continuación) . 9) Una variante del "químero P37-36" en donde el residuo gp37 se deriva de la variante como en 6) anterior, es decir, "*P37-36" .
) Una variante del químero P37-36, *P37-P36*, en donde los residuos de gp36 y gp37 se derivan de las variantes en 7) . 11) Una fusión entre de gp36 y gp34 en donde las secuencias de gp36 se colocan en el terminal N al gp34, el dímero del cual se denomina aquí "químero P36-34"; 12) Variantes de gp35 que forman ángulos promedio diferentes de 137° o 158° (el ángulo nativo) v.gr., tienos de aproximadamente 125° o más de aproximadamente 145 bajo condiciones en donde la proteína gp35 de tipo silvestre forma un ángulo de 137° cuando se combina con los dímeros P34 y P36-P37, y/o exhibe mayor o menor flexibilidad que el polipéptido nativo; 13) Variantes de gp34, 35, 36 y 37 que exhiben interacciones termolábiles u otras interacciones específicas variantes con sus compañeras afines; y 14) Variantes de gp37 en donde el dominio del terminal C del polipéptido se modifica para incluir secuencias que confieren propiedades de ligazón específicas en toda la molécula, v.gr., secuencias derivadas de avidina que recorocen biotina, secuencias derivadas de la cadena pesada de inmunoglobulina que reconocen la proteína A de Estafilococo, secuencias derivadas de la porción de Fab en la cadena pesada de los anticuerpos monoclonales a los cuales sus duplicados de cadena ligera de Fab respectivos podrían f.jarse y formar un sitio de ligazón de antígeno, secuencias inmunoactivas que reconocen los anticuerpos específiccs o secuencias que se ligan a los iones de metal específices. Estos grupos coordinadores pueden inmovilizarse para facilitar la purificación y/o el ensamblado. En modalidades específicas, los químeros de la invención comprenden una porción que consiste de por lo menos los primeros 10 aminoácidos (terminal N) de una primera proteína de fibra de cola fundida a través de una ligazón de péptido con una porción que consiste de por lo menos loe últimos 10 aminoácidos (terminal C) de una segunda proteína de fibra de cola. La primera y segunda proteínas de fibra de cola pueden ser proteínas iguales o diferentes. En otra modalidad los químeros comprenden una porción de aminoácido dentro de la escala de los primeros 10 a 60 aminoácidos desde una proteína de fibra de cola fundida a una porción de aminoácido dentro de la escala de por lo menos 10 a 60 aminoácidos desde una segunda proteína de fibra de cola. En otra modalidad, cada porción del aminoácido por lo menos es de 20 aminoácidos de la proteína de fibra de cola. Los químeros comprenden porciones, es decir, no proteínas de fibra de cola de longitud completa fundidas una a la otra. En un aspecto preferido, la primera porción de la proteína de fibra de cola del químero es de gp37, y la segunda porción de proteína de fibra de cola es de; gp36. Este químero (químero gp37-36) , después de oligomerización para formar P37-36, puede polimerizarse a otros oligómeros idénticos. Un químero gp36-34 después de la oligomerización para formar P36-34, puede ligarse a gp35 y esta unidad luego puede polimerizarse. En otra modalidad, la primera porción es de gp37, y la segunda porción es de gp34. En un aspecto preferido los químeros de la invención se producen mediante inserciones o supresiones dentro de una vuelta beta de la estructura beta de las proteínas de fibra de cola. De manera especialmente preferida, las inserciones en una secuencia de fibra de cola o las fusión con otra secuencia de proteína de fibra de cola (de preferencia a través de la manipulación al nivel de ADN recombinante para producir la proteína codificada deseada, se lleva a cabo de manera que las secuencias en las vueltas beta en la misma orilla de la hoja beta se unen. Además de los químeros anteriormente descritos, las nancestructuras de la invención pueden también comprender construcciones de supresión de proteína de fibra de cola q e se truncan en un extremo, v.gr., que carecen de un extremo de amino o carboxi (de por lo menos 5 o 10 aminoácidos) de la molécula. Estas moléculas truncadas en el terminal de amino, v.gr., gp37, gp34, o gp36, truncados pueden usarse para "tapar" una nanoestructura, puesto, que una vez que se incorporan terminarán su polimerización. Estas moléculas de preferencia comprenden un fragmento de una proteína de fibra de cola que carece por lo menos los primeros 10, 20 o 60 aminoácidos del terminal de amino. A fin de cambiar la longitud de las proteínas de componente de bastón como se desea, las porciones de proteína de fibra cola iguales o diferentes pueden insertarse en el químero de fibra de cola para alargar el bastón o suprimirse del químero para cortar el bastón.
CONJUNTO DE COMPONENTES DE BASTÓN INDIVIDUALES EN NANQESTRUCTURAS La expresión de las proteínas de la presente invención en E. coli como se ha descrito en lo que antecede dan por resultado las síntesis de grandes cantidades de proteína y permite la expresión y ensamblado simultáneo de componentes diferentes en la mismas células. Los métodos para aumentar la producción de proteína recombinante son directos y se conocen ampliamente en la técnica, y pueden usarse muchos protocolos normales para recuperar las proteínas de fibra de cola nativas y mofidicadas de un cultivo bacteriano. En una modalidad preferida, el gp35 nativo (no recombinante) se aisla para usarse haciendo crecer un bacteriófago T4 que tiene una mutación de ámbar en el gen 36, en una cepa su° bacteriana (no un supresor de ámbar) y aislando el gp35 del cultivo resultante mediante métodos normales . P34, P36-P37, P37, y los químeros derivados de los mismos se purifican de cultivos de E. coli como dímeros maduros. Gp35 y variantes del mismo se purifican como monómeros. La purificación se logra mediante los siguientes procedimientos o combinaciones de los mismos, usando métodos normales: 1) cromatografía en tamiz molecular, intercambio de iones y/o matrices hidrofóbicas; 2) ultracent ifugación de preparación; y 3) cromatografía de afinidad usando como los anticuerpos específicos del grupo coordinador inmovilizado u otros residuos de ligazón específicos. Por ejemplo, el dominio del terminal C de P37 se liga a la lipopolisacáridos de E. coli B. Otros bacteriófagos semejantes a T4 tienen análogos de P37 que se ligan a otros componentes superficiales de célula tales como la proteína OmpF o TSX. Alternativamente, si las proteínas se han modificado para incluir dominios heterólogos que actúan como grupos coordinadores o sitios de ligazón, la compañera afin se inmoviliza en una matriz sólida y se usa en purificación de afinidad. Por ejemplo, este dominio heterólogo puede ser biotina, que se liga a una fase sólida revestida con estreptavidina.
Alternativamene, varios componentes se coexpresan en las mismas células bacterianas, y los subconjuntos de nanoestructuras más grandes se purifican subsecuentemente al conjunto in vivo limitado, usando los métodos anteriormente enumerados. Los componentes purificados luego se combinan in vitro bajo condiciones en donde el ensamblado de la nanoestructura deseada ocurre a temperaturas entre aproximadamente 4°C y aproximadamente 37°C, y valores de pH entre aproximadamente 5 y aproximadamente 9. Para una nanoestructura determinada, las condiciones óptimas para el ensamblado (es decir, tipo y concentración de sales y iones de metal) se determinan fácilmente mediante experimentos de rutina tales como cambiando cada variable individualmente y supervisando la formación de los productos apropiados. Alternativamente, uno o más de los extractos bacterianos crudos pueden prepararse, mezclarse y permitirss que las reacciones de ensamblado prosigan antes de la purificación. En algunos casos, uno o más componentes purificados se ensamblan espontáneamente en la estructura deseada sin necesidad de iniciadores. En otros casos, se requiere un iniciador para nuclear la polimerización de bastones u hojas. Esto ofrece la ventaja de localizar el proceso de ensamblar (es decir, si el iniciador se inmoviliza o localiza de otra manera) o de regular las dimensiones de la estructura final. Por ejemplo, los componentes del bastón que contienen un P36 funcional del terminal Z requieren una P37 funcional del terminal N para iniciar la formación estequiométrica del bastón; de esta manera alterando la cantidad relativa del iniciador y el componente del bastón influirá la longitud promedio del polímero del bastón. Si la relación es n, el bastón promedio será aproximadamente (P37-36) n--terminal N, P37-P37 terminal C. En todavía otros casos, la nanoestructura final se compone de dos o más componentes que no pueden auto-ensamblarse individualmente pero sólo en combinación uno con el otro. En esta situación, los ciclos alternativos de ensamblado pueden prepararse para producir productos finales da la estructura definida de manera precisa (véase el Ejemplo 6B que se da a continuación) . Cuando se usa un iniciador inmovilizado, puede ser deseable remover la unidad polimerizada de la matriz después del ensamblado por etapas. Para este objeto, los iniciadores especializados se modifican de manera que la interacción con el primer componente del bastón se haga reversiblemente termolábil (véase el Ejemplo 5 que se presenta a continuación) . De esta manera, el polímero puede separarse fácilmente del iniciador ligado a la matriz, permitiendo de esta manera: 1) la preparación fácil de la solución de material de partes o subconjuntos uniformes y, 2) la reutilización del iniciador ligado a la matriz pe.ra ciclos múltiples de iniciación de polímero, crecimiento y liberación. En una modalidad en la cual se ensambla una nanoesruc;ura que está fijada a una matriz sólida a través de gp34 (o P34, una manera en la cual puede separarse la nonoestructura para colocarla en solución es usar un mutante (termolábil) gp34 que puede prepararse para separarse durante la exposición en una temperatura más elevada (v.gr., de 40°C) . Este mutante gp34 denominado tsB45 de T4 que tiene una mutación en su extremo del terminal Z de tal manera que P34 se fija a la mitad de la fibra de cola distante a 30°C pero que puede separarse de la misma in vitro mediante incubación a 40°C en presencia de 1 por ciento de SDS (a diferencia del T4 de tipo silvestre que es estable bajo estas condicines), se ha ya dado a conocer (Seed, 1980, Studies of the Bacteriophage T4 Proximal Half Tail Fiber, Ph.D. Thesis, California Institute of Technology), y se puede usar. Las proteínas que catalizan la formación de una estructura secundaria estable correcta (de menor energía) (2°) son proteínas de compañía. (De manera frecuente, especilamente en proteínas globulares, esta estabilización es ayudada por una estructura terciaria, v.gr., la estabilización de las hojas beta mediante su interacción en los cuerpos tubulares beta o mediante interacción con hélices alfa) . Normalmente, las "chaperoninas" impiden la intracadena o interacciones de intracadena que producirían intermedios de doblez metaestables e impedirían o retardarían el doblez apropiado. Hay dos proteínas accesorias conocidas gp57 y gp38 y la morfogénesis de las fibras de cola del bacteriófago T4 que algunas veces son llamadas "chaperoninas" debido a que son esenciales para la maduración apropiada de los oligómeros de proteína, pero que no es:án presentes en las estructuras finales. El sistema de "chaperonina" usual (v.gr., groEL/ES) interacciona con ciertos residuos de olipéptido del producto del gen para impedir las interacciones indeseadas con residuos de oligopéptido en cuanlquier sitio en el mismo polipéptido o en otro péptido. Estos formarían intermedios de doblez metaestables que retardan o impiden el doblez apropiado del polipéptido hacia su estado nativo (energía menor) . El gp57 probablemente junto con algunas proteínas de membrana, tiene el papel de colocar en yuxtaposición (y alinear) y/o iniciarl el doblez de dos o tres moléculas idénticas gp37. Los péptidos alineados luego se cierran (mientras que estabilizan mutuamente sus estructuras beta nascientes) para formar una viga sin interacción adicional con gp57. El gp57 actúa en el conjunto de T4 no solamente para oligomerización de gp37, sino también para gp34 y gpl2.
COMPONENTES ESTRUCTURALES PARA EL AUTOENSAMBLADO DE VIGAS IN VITRO Alternativamente a la iniciación de la polimerización de los químeros con el uso de una unidad olimérica preformada quimérica o natural llamada un iniciador producido in vivo, las moléculas (de preferencia péptidos) que pueden auto-ensamblarse pueden producirse como proteínas de fusión, fundirse al terminal N- o C- de las variantes de la fibra de cola de la invención (químeros, construcciones de supresión/inserción) para alinear sus extremos y de esta manera facilitar su doblez subsecuente no ayudado en unidades oligoméricas estables semejantes a un bastón doblado en beta (de viga) in vitro en ausencia de las proteínas de "chaperonina" requeridas normalmente (v.gr., gp57) y proteínas de membrana de célula huésped. Como una ilustración, consideremos que la unidad P37 es un iniciador de gp37-36 de oligomerización y polimerización. Normalmente, el doblez apropiado de gp37 en un iniciador P37 requiere un bacteriófago infectado con una membrana de célula y dos proteínas de compañía gp38 y gp57. En ana modalidad preferida, la necesidad para gp38 se puede ev tar mediante el uso de una mutación ts3 (una duplicación de 7 residuos justamente en aguas abajo de la zona de transición de gp37) que suprimen el gen 38 (Wood, W.B., F.A. Eiserling y R.A. Crowther, 1994,. "Long Tail Fibers: Genes, Proteins, Structure, and Assembly", en Molecular Biology of Bacteriophage T4, (Jim. D. Karam, Editor) Atierican Society for Microbology, Washington, D.C. páginas 232-290). Si un residuo que se auto-ensambla en un dímero, trímero u otro oligómero ("residuo de auto-ensamblado") se funde en una supresión del terminal C de gp37 en .aguas abajo o en aguas arriba de la región de transición [la región de transición es una región de 17 residuos de aminoácido conservados en las proteínas de cola semejantes a T4, en donde la estructura de la proteína se hace más angosta hasta formar una fibra delgada; veáse de Henning y otros, 1994, "Receptor recognition by T-even-type cliphages" en Molecular Biology by Bacteriophage T4, Karam (editor) , American Society for Microbiology, Washington, D.C. páginas 291 a 298; Wood y otros, 1994, "Long tail fibers: Genes, proteins, structure, and assembly" en Molecular Biology of Bacteriophage T4, Karam (editor) American Society for Microbiology, Washington D.C. páginas 282 a 290], cuando se expresa, el residuo de auto-ensamblado se oligomerizará en paralelo y de esta manera alineará los péptidos gp37 fundidos permitiendo que los mismos se doblen in vitro en ausencia de otras proteínas de "chaperonina" . Si P37 es un dímero (Figura 8A) , el residuo de auto-ensamblado puede ser un péptido de autodimerización tal como el ziper de leucina que se produce de los residuos 250-281 del factor de transcripción de levadura, GCN4 (E.K. O'Shea, R. Rutkowski y P.S. Kim, Science 243:538, 1989) o el péptido de ziper de leucina del mutante de auto-dimerización, pIL en donde las posiciones se substituyen con la isoleucina y las posiciones d con leucina (Harbury P.B., T. Zhang, P.S. Kim y T. Alper. 1993. A Switch Between Two-, Three-, and Four-Stranded Coiled Coils in GCN4 Leucine Zipper Mutants. Science, 262:1401-1407) . Si P37 es un trímero (Figura 8B) el residuo de auto-ensamblado puede ser un péptido de ziper de leucina mutante de auto-t::imerización, pll en donde tanto las posiciones a como d se substituyen con isoleucina (Harbury P.B. y otros. ibid.). Alternativamente, un péptido de colágeno puede usarse como el residuo de auto-ensamblado de tal manera como se describe por Bella y otros (J. Bella. M. Eaton, B. Brodsky y H.M. Berman. 1994. Crystal and Molecular Structure of a Collagen-Like Peptide at 1.9Á Resolution. Science, 226:75-81), que se auto-alinea mediante el residuo de alanina de no repetición específica insertado cerca del centro. Los residuos de auto-ensamblado se pueden usar para producir inhibidores para polimerizaciones en ausencia de los inhibidores normales. Por ejemplo, para crear un iniciador para oligomerización y polimerización del monómero quimérico, pueden usarse gp37-36, gp37-36-C2 como se i Lustran en la Figura 9. (C2 significa un péptido formador de dímero que se funde al terminal C del residuo de gp36. Esto se usa si la viga es una estructura dimérica. De otra manera, C3 — un péptido formador de trímero fundido en el terminal C2 — se usaría) . Además, el uso del terminal N represor del E. coli lac v.gr. que se asocia como un tetrámero, con dos vueltas orientadas en cada dirección podría unir dos dímeros (o polímeros de dímeros) extremo con extremo ya sea a su terminal N o C, dependiendo en cuál extremo se colocaron los péptidos de auto-ensamblado. Podrían también unir los terminales N a C. En cualqu:.er caso solos podrían solo formar un dímero cada extremo del cual sería extensible añadiendo un monómero de químero apropiado (como se muestra para el caso más sencillo en la Figura 9) . En una modalidad alternativa, el residuo de auto-ensamblado puede fundirse al terminal N del químero. En una modalidad específica, el residuo de auto-ensamblado se funde a por lo menos la porción de 10 aminoácidos de una proteína de fibra de cola aún semejante a T. Un residuo de auto-ensamblado que se ensambla en un heteroligómero puede también usarse. Por ejemplo, si la polimerización entre las vigas se dirige mediante la superficie de una superficie de beta transversal dimérica, la adición de una unidad heterodimérica con una superficie que no activa la polimerización adicional sería muy útil para tapar la penúltima unidad y de esta manera dar por terminada la polimerización. Si los dos tipos de regiones enrolladas del residuo de auto-ensamblado son más atractivas una con respecto a la otra que para ellas mismas, entonces todos los dímeros serán heterodímeros . Tal es el caso para las regiones de ziper de leucina Jun y Fos del terminal N. Una ventaja adicional de estas unidades heterodiméricas es la capacidad para la polimerización y, por lo tanto, para construir una unidad (o una superifice en una formación de 2D) en una sola vez. Por ejemplo, supongamos que la superficie A se fija a B, pero ninguna se fija a si misma ( [A<->B] se usa para simbolizar este tipo de interacción) . La mezcla A/A y B/B0 (B0 se fija a una matriz para purificación fácil) . Esto formará B0/B-A/A. Ahora lavaremos A/A y añadiremos B/B. La construcción ahora es B0/B-A/A-B/B. Ahora se añade A/AQ . La construcción es ahora B0/B-A/A-B/B-A/A0 y no pueden añadirse más vigas. Hay desde luego muchas otras posibilidades.
APLICACIONES Los usos de nanoestructuras de la presente invención son múltiples e incluyen aplicaciones que requieren formaciones bien definidas altamente regulares de fibras, jaulas o sólidos que pueden incluir sitios de fijación específicos que permiten que las mismas se asocien con otros materiales. En una modalidad, se usa una formación hexagonal tridimensional de tubos como un tamiz molecular o filtro, proporcionando poros verticales regulares de diámetro preciso para la separación selectiva de partículas mediante el tamaño. Estos filtros se pueden usar para esterilización de soluciones (es decir, para remover microorganismos o virus) , o como una serie de filtros de interrupción de peso molecular. En este caso, los componentes de la proteína de los poros pueden modificarse para proporcionar propiedades de superficie específica (es decir, hidrofilicidad o hidrofobicidad, capacidad para ligarse a los grupos coordinadores específicos, etc.). Entre las ventajas de este tipo de dispositivo de filtraciói está la uniformidad y linealidad de los poros y la alta relación de poro a matriz.
En otra modalidad, se incorporan las fibras largas unidireccionales por ejemplo, en papel o cemento o plástico durante la fabricación para proporcionar resistencia a la tensión en húmedo y en seco. En todavía otra modalidad, las formaciones de nanoestructura diferentes se impregnan en papel y tela como marcadores de anti-contra falsificación. En este caso, una simple reacción de anticuerpo enlazada de color (tal como aquellas disponibles comercialmente en estuches, se usa para verificar el origen del material. Alternativamente, estas formaciones de nanoestructura podrían ligar colorantes u otras substancias ya sea antes o después de la incorporación para colorear el papel o las telas o para modificar su apariencia o propiedades de otras maneras.
ESTUCHES La invención proporciona también estuches para producir nonanoestructuras, que comprenden en uno o más envases los químeros y construcciones de supresión de la invención. Por ejemplo, uno de estos estuches comprende en uno o más envases gp35 purificado y el químero gp36-34 purificado. Otro de estos estuches comprende el químero gp37-36 parificado. Los siguientes ejemplos se destinan a ilustrar la presente invención sin limitar su alcance.
En los ejemplos que se presentan a continuación, todas las enzimas, nucleasas, ligasas, etc. de restricción pueden obtenerse comercialmente con numerosas procedencias comerciales, tales como New England Biolabs (NEB) , Beverly, MA; Life Technologies (GIBCO-BRL) , Gaithersburg, MD; y Boehringer Mannheim Corp. (BMC) , Indianapolis, IN.
EJEMPLO 1
DISEÑO, CONSTRUCCIÓN Y EXPRESIÓN DEL P37 INTERNAMENTE SUPRIMIDO El gp37 de codificación de gen contiene dos sitios paca la enzima Bgl II de restricción, ocurriendo la primera disociación después de que el nucleótido 293 y la segunda después de que el nucleótido 1486 (los nucleótidos se enumeran del codón de metionina iniciador ATG.) Por lo tanto, la digestión de un gp37 de codificación de fragmento de ADN con BglII, la excisión del fragmento de intervención (nucleótidos 294-1485) y el re-ligamento de los fragmentos 5' y 3' da por resultado la formación de un gp37 internamente suprimido designado ?P37, en donde la arginina-98 se une con la serina-497. La mezcla de reacción de digestión de restricción contiene:
El ADN de plásmido gp37 (1 µg/µl) 2µl El estabilizador de NEB #2 (10X) lµl H20 6µl Bgl II (10 Unidades/µl) lµl El plásmido gp37 significa un plásmido pT7-5 en el cual se ha insertado el gen 37 en el sitio de clonación múltiple en aguas abajo de un buen sitio de ligazón de ribosoma, y el gen 57 para supervisar la dimerización. La reacción se incuba durante 1 hora a 37°C. Luego, se añaden 89 microlitros del estabilizador de ligasa de ADN T4 y un microlitro de ligasa de ADN T4, y la reacción se continua a 16°C durante 4 horas. 2 microlitros de la enzima de restricción Stu I se añaden luego y la incubación se continua a 37°C durante 1 hora. (La enzima de restricción Stu I diciere los plásmidos residuales que no se cortaron mediante Bgl II en el primer paso, reduciendo su transformabilidad mediante aproximadamente 100 veces) . La mezcla de reacción luego se transforma en la cepa BL21 de E. coli, que se obtiene de Novagen, usando procedimientos normales. La mezcla de transformación se coloca en platinas en agar nutritivo que contiene 100 microgramos por mililitro de ampicilina, y las placas se incuban durante la noche a 37°C. Las colonias que aparecen después de la incubación durante la noche se recogen y el ADN de plásmido se extrae y se digiere con Bgl II como anteriormente. Las digestiones de restricción se resuelven en 1 por ciento de geles de agarosa. Una supresión satisfactoria se evidencia media la aparición después de la electroforésis de gel de un nuevo fragmento de ADN de 4.2 kbp, que representa la parte que no se ha suprimido del gen 37 que todavía se fija al plásmido y que se vuelve a formar un sitio BglII mediante ligamento. El fragmento de ADN de 1.2 kbp ligado mediante los sitios BglII en el gen original ya no está en el plásmido y por lo tanto falta del gel. Los plásmidos seleccionados para supresión prevista como anteriormente se transforman en la cepa BL21(DE3) de E. coli. Los transformantes de hacen crecer a 30°C. hasta que la densidad (Agoo) del cultivo llega a 0.6. Se añade luego IPTG a una concentración final de 0.4 mM y la incubación se continua a 30°C durante 2 horas, después de lo cuaL los cultivos se enfrian en hielo. 20 microlitros del cultivo se remueven luego y se añaden a 20 microlitros de un "estabilizador" concentrado por dos veces que contiene 1 por ciento de dodecilsulfato de sodio, glicerol y el colorante de seguimiento. 15 microlitros de esta solución se cargan en un gel de poliacrilamida al 10 por ciento; una segunda alícuota de 15 microlitros se incuba primero en un baño de agua en ebullición durante 3 minutos y luego se carga en el mismo gel. Después de la electroforésis, el gel se fija y se tiñe. La expresión de gp37 suprimidos se evidencia mediante la aparición de una especie de proteína que emigra en una masa molecular aparente de 65-70,000 daltons en la muestra hervida. El grado de dimerización se sugiere mediante la intensidad de la especie de masa molecular más elevada en la muestra no hervida y/o mediante la desaparición de la banda de proteína de 65-70,000 daltons. La capacidad del polipéptido suprimido para dimerizarse apropiadamente se evalúa directamente probando su capacidad para reconocerse mediante un antisuero anti-P37 que reacciona solamente con dímeros P37 maduros, usando un procedimiento normal de inmunosecado de proteína. Un ensayo alternativo para dimerización funcional del polipéptido P37 suprimido (al cual se hace también referencia como ?P37) es su capacidad para complementar in vivo un bacteriófago T4 37~, induciendo primero la expresión del ?P37 y luego infectándose con el mutante T4 y detectando el bacteriófago de descendencia. Se preparó un ?P37 como se describe en lo que antecede, y se encontró capaz de complementarse in vivo un bacteriófago T4 37".
EJEMPLO 2 DISEÑO, CONSTRUCCIÓN Y EXPRESIÓN DE UN QUIMERO gp37-36
El plásmido de partida de esta construcción es uno en donde el gen que codifica gp37 se clona inmediatamente en aguas arriba (es decir, 5') del gen que codifica gp36. El plásmido se digiere con Hae III, que suprime toda la región 3' del ADN de gp37 en aguas abajo del nucleótido 724 hacia el terminal 3', y también remueve el extremo 5' del ADN de gp36 del terminal 5' al nucleótido 349. La mezcla de reacción es idéntica a aquella descrita en el Ejemplo 1, con la excepción de que se usa un ADN de plásmido diferente, y la enzima es HaelII. La ligadura usando ligasa de ADN T4, la transformación bacteriana, y el análisis de restricción se llevan a cabo también como en el Ejemplo 1. En este caso, la excisión de la porción central de la inserción del gen 37-36 y re-ligadura revela una inserción novedosa de 346 en los codones en-cuadro, que se corta solamente una vez mediante HaelII (después del nucleótido 725) . La construcción resultante luego se expresa en BL21 (DE3) de E. coli como se describe en el Ejemplo 1. La expresión satisfactoria del químero gp37-36 se evidencia mediante la aparición de un producto de proteína de aproximadamente 35,000 daltons. Esta proteína tendrá los primeros 242 aminoácidos del terminal N de gp37 fundidos en los 104 aminoácidos del terminal C finales de gp36 (numerados 118-221). La utilidad de este químero depende de su capacidad para dimerizarse y fijarse extremo con extremo, es decir, los terminales de carboxi del péptido tendrán la capacidad interaccionar con el terminal de amino del dímero de proteína P37 del bacteriófago T4 y formar una dímero fijado, y el terminal de amino del dímero del polipéptido tendrá la capacidad de interaccionar con otros polipéptidos del químero. Esta propiedad se puede probar ensayando si la introducción de ?P37 inicia la dimerización y polimerización. Alternativamente, los anticuerpos policlonales específicos al dímero P36 pueden usarse para detectar P36 subscuente hasta la iniciación de la dimerización mediante ?P37. Se preparó un químero gp37-36 de manera semejante a los procedimientos anteriormente descritos, con la excepción de que la enzima de restricción Taql se usó en vez de HaelII. Abreviando, el fragmento 5' resultante de la digestión de Taql del gen 37 se ligó al fragmento 3' resultante de la digestión de Taql del gen 36. Esto produjo una construcción que codifica un químero gp37-36 en donde los aminoácidos 1-48 de gp37 se fundieron en los aminoácidos 100-221 de gp36. Esta construcción se expresó en BL21 pE3) de E. coli, y el químero se detectó como una proteína de 18 kD. Este químero gp37-36 se encontró que inhibía el crecimiento de T4 de tipo silvestre cuando la expresión del químero gp37-36 se indujo antes de la infección (en un ensayo de inhibición del bacteriófago in vitro.
EJEMPLO 3
MUTACIÓN DEL QUIMERO GP37-36 PARA PRODUCIR SUPRESORES COMPLEMENTARIOS
La mira de esta construcción es producir dos variantes de un químero P37-36 dimerizable: Uno en donde el terminal N del polipéptido se somete a mutación (A, designado *P37-36) y uno en donde el terminal C del polipéptido se somete a mutación (B, designado P37-36*) . El requisito es que el terminal N del *P37 sometido a mutación no pueda formar una unión o junta con el terminal C de P36 de tipo silvestre, sino solamente con el terminal N de *P36 sometido a mutación. La razón es que A y B cada uno no puede polimerizarse independientemente (como lo puede hacer la proteína P37-36 de origen) , sino que sólo se pueden asociar uno con el otro en secuencia (es decir, P37-36* + *P37--> P37-36*~*P37-36) . Una segunda construcción, *p37-P36*, se forma recombinando *P37-36 y P37-36* in vitro. Cuando los monómeros gp37-36* y gp37-36 se mezclan en presencia del iniciador P37, gp37-36 se dimerizaría y polimerizaría en (P37-36)n; de manera semejante, *P37 no podría catalizar la polimerización de *gp37-36 en (*P37-36*)n. En este caso, los dos químeros podrían ser de tamaño diferente y de secuencia primaria diferente con interacciones de grupo secundario potencial diferentes y podrían iniciar la fijación en superficies diferentes, dependiendo de la especificidad de fijación de P37. La cepa bacteriana de partida es una cepa su° de
E. coli íque carece de la capacidad para suprimirse bajo mutaciones ámbar) . Cuando esta cepa se infecta con un bacteriófago T4 mutante que contiene mutaciones ámbar en los genes 35, 36 y 37, la duplicación del bacteriófago es incompleta, puesto que las proteínas de fibra de cola no pueden sintetizarse. Cuando esta cepa se transforma primero con un plásmido que dirige la expresión de los genes pg35, gp36 y gp37 de tipo silvestre y se induce con IPTG, y se infecta subsecuentemente con un bacteriófago mutante, se producen las partículas del bacteriófago infeccioso; estos se evidencia mediante la aparición de colonias "puntiagudas". Las colonias puntiagudas no tienen apariencia redonda con orillas lisas, sino más bien tienen falta de sectores. Esto se ocasiona mediante el ataque de una microcolonia por un solo bacteriófago que duplica e impide eJ crecimiento de las bacterias en el sector que falta. Para los fines de esta construcción, la región de terminal 31 del gen 36 (que corresponde a la región del terminal C de gp36) se mutageniza con oligonucleótidos adulterados al azar. Los oligonucleótidos adulterados al azar se preparan mediante la síntesis química de los oligonucleótidos añadiendo una cantidad de traza (hasta un porcentaje bajo) de otros tres nucleótidos en una posición determinada, de manera que la mezcla de oligonucleótidos resultante tenga un pequeño porcentaje de nucleótidos incorrectos en esa posición. La incorporación de estos oligonucleótidos en el plásmido dará por resultado mutaciones al azar (Hutchison y otros, Methods .Enzymol . 202:356, 1991) . La población de plásmidos mutagenizada (que contiene, sin embargo, genes no modificados 36 y 37), luego se transforma en las bacterias su° seguido por infección con el bacteriófago T4 mutante como anteriormente. En este caso, la aparición de colonias "no puntiagudas" indica que los terminales C de gp36 sometidos a mutación ya no pueden interaccionar con P37 de tipo silvestre para formar fibras de cola funcionales. Los fenotipos gp36* putativos encontrados en estas colonias no puntiagudas se comprueban para determinar la falta de terminales N diméricos mediante inmunoespecificidad apropiada como se señala en lo que antecede, y se usan colonias positivas como la fuente de plásmido para el siguiente paso. Varios de estos plásmidos sometidos a mutación se recuperan y se someten a una segunda ronda de mutagénesis, usando esta vez oligonucleótidos adulterados que introducen mutaciones al azar en la región del terminal N de gp37 presente en el mismo plásmido. De nuevo, los plásmidos mutagenizados (ahora doblemente) se transforman en la cepa supo de E. coli y los transformantes se infectan con el bacteriófago T4 mutante. En esta etapa, las placas bacterianas se seleccionan para la re-aparición de colonias "puntiagudas". Una colonia puntiaguda en esta etapa indica que el bacteriófago se ha duplicado debido a la supresión de la mutación (es) gp36* no funcional mediante la mutación *P37. En otras palabras, estas colonias deben contener polipéptidos *37 novedosos que ahora han adquirido la capacidad de interaccionar con las proteínas P36* codificada en el mismo plásmido. Los químeros supresores en pares *P37-36 y
P37-36* (A y B como anteriormente) luego se construyen de la misma manera que se describe en el Ejemplo 2. En este caso, sin embargo, *P37 se usa en vez de P37 del tipo silvestre, y P36* se usa en vez de P36 de tipo silvestre. Un químero *P37-36* puede ahora prepararse mediante restricción de *P37-36 y P37-36* y religadura en el orden recombinado. El *P37-36* puede mezclarse con el químero P37-36, la polimerización de cada uno se puede lograr independientemente en presencia del otro. Esto es útil cuando la porción central semejante a un bastón de estos químeros .se ha modificado de maneras diferenes.
EJEMPLO 4
DISEÑO, CONSTRUCCIÓN Y EXPRESIÓN DEL QUIMERO gp36-34
El plásmido de partida para esta construcción es una en el cual el vector que contiene el gen 57 y el gen que codifica gp36 se clona inmediatamente en aguas arriba (es decir, 5') del gen que codifica gp34. El plásmido se digiere con Ndel, que se corta después de bp 219 del gen 36 y después de bp 2594 del gen 34, suprimiendo de esta manera los 148 codones del terminal C finales del residuo de pg36 y los primeros 865 codones del terminal N del residuo de gp34. La mezcla de reacicón es idéntica a aquella descrita en el Ejemplo 1, con la excepción de que se usa un ADN de plásmido diferente, y la enzima usada es Ndel (NEB) . La ligadura usando ligasa de ADN T4, transformación bacterial, y análisis de restricción también se llevan a cabo como en el Ejemlo 1. Esto da por resultado un gen híbrido nuevo que codifica una proteína de 497 aminoáciedos (73 aminoácidos del terminal N de gp36 y 424 aminoácidos del terminal de gp34, numerados 866-1289) . Como una alternativa, el plásmido de partida se corta con Sphl en bp 648 en el gen 34, y se usa el Estuche de Supresión de Exo-Tamaño (NEB) para crear supresiones como se describe en lo que antecede. La construcción resultante luego se expresa en BL21(DE3) de E. coli como se describe en el Ejemplo 1. La expresión satisfactoria del químero gp36-34 se evidencia mediante la aparición de un producto de proteína de aproximadamente 55,0000 daltons. De preferencia, los terminales de amino del homodímero de polipéptido tienen la capacidad de internaccionar la proteína gp35, y luego los terminales de carboxi tienen la capacidad de interaccionar con las otras moléculas gp35 fijadas. La formación satisfactoria del dímero puede detectarse mediante reacción con anticuerpos anti-P36 o mediante fijación de gp35 o mediante el ensayo de inhibición de bacteriófago in vitro descrito en el Ejemplo 2.
EJEMPLO 5
AISLAMIENTO DE LAS PROTEÍNAS TERMOLABILES PARA AUTOENSAMBLADO Las estructuras termolábiles pueden utilizarse en las nanoestructuras para: a) iniciación de polimerización de químero (v.gr., gp37-36) a baja temperatura e inactivación subsecuente de y separación del iniciador a alta temperatura; b) iniciación de formación de ángulo entre P36 y gp35 (v.gr., variantes de gp35 que tienen sitios de fijación termolábiles para P36 de terminales N o P34 de terminales C, una variante P36 que forma una fijación termolábil a gp35 y una variante P34 con un sitio de fijación del terminal C termolábil) . La termolabilidad puede ser reversible, permitiendo la re-fijación de los terminales apropiados cuando se restablece la temperatura más baja o puede ser irreversible. Para crear una variante gp37 que permite que la separación industrial por calor de la junta o unión de P36 -- P37, el extremo 5' de gp37 de ADN se mutageniza al azar usando oligonucleótidos adulterados como se describe anteriormente. El fragmento de ADN mutagenizado luego se recombina con el bacteriófago T4 mediante infección de la célula que contiene el ADN mutagenizado mediante un bacteriófago T4 que contiene dos mutaciones ámbar que flanquean la región mutagenizada. Después de una infección de baja multiplicidad, se seleccionan bacteriófagos no ámbar a baja temperatura en Su° de E. coli a 30°C. La descendencia de estas placas se resuspende, se estabiliza y se reta mediante calentamiento a 60°C. A esta temperatura, las fibras de cola de tipo silvestre permanecen intactas y funcionales mientras que las versiones termolábiles liberan las unidades terminales P37 y de esta manera hacen que aquellos oacteriófagos no sean infecciosos. En esta etapa, los bacteriófagos de tipo silvestre se remueven mediante: 1) adsorbiendo los bacteriófagos de tipo silvestre en bacterias sensibles y sedimenta do (o filtrando) las bacterias con el bacteriófago de tipo silvestre adsorbido; o 2) haciendo reaccionar el material lisado con el anticuerpo anti-P37 segido por Proteína A inmovilizado y remoción de los bacteriófagos de tipo silvestre adsorbidos. Cualquier tipo deja las oartículas del bacteriófago mutante no infecciosas en el fluido o filtrado sobrenadante del cual se pueden recuperar. Los bacteriófagos no infecciosos que carecen de los residaos del terminal P37 (y probablemente el resto de las fibras de cola asimismo) luego se tratan con urea con urea 6M, y se mezclan con los esferoplastos bacterianos para permitir infección a baja multiplicidad después de lo cual se duplican a baja temperatura y liberan la descendencia. Alternativamente, los bacteriófagos infecciosos se reconstituyen mediante incubación in vitro de los bacteriófagos mutantes con P37 de tipo silvestre a 30°C; esto es seguido mediante infección de las células bacterianas intactas usando el protocolo normal. El último método de infección se selecciona específicamente los bacteriófagos mutantes en donde es reversible la termolabilidad de la junta de P36-P37. Usando cualquier método, la poblaciones de bacterióf gos se someten a rondas múltiples de selección como anteriormente después de lo cual las partículas individuales del bacteriófago se aislan mdiante purificación de placa a 30°C. Finalmente, los mutantes putativos se evalúan individualmente para determinar las siguientes características: 1) pérdida de infectividad después de la incubación a altas temperauras (40-60°C), como se mide mediante una disminución en la valoración; 2) pérdida da P37 después de la incubación a alta temperatura como se mide mediante disminución en la ligazón del anticuerpo específico P37 a las partículas de bacteriófago; y 3) cambios morfológicos en las fibras de cola después de la incubación a altas temperaturas, como se determina mediante microscopía electrónica. Después de que los mutantes se aislan y que sus fenotipos se confirman, el gen P37 se somete a secuencia. Si las mutaciones se localizan en regiones o residuos específicos, aquellas secuencias se enfocan para utagénesis dirigida al sitio para llevar al óptimo las características deseadas.
Finalmente, el gen 37 mutante se clona en plásmidos de expresión y se expresa individualmente en
E. coli como en el Ejemplo 1. Los dímeros P37 mutantes luego se purifican de los extractos bacterianos y se usan en reacciones de ensamblado in vitro. De manera semejante, los polipéptidos gp35 mutantes pueden aislarse que exhiben una interacción termolábil con el terminal N de P36 o el terminal C de P34. Para interacción termolábil con P34, los bacteriófagos se incuban a alta temperatura dando por resultado la pérdida de toda i a mitad distante de la fibra de cola (es decir, gp35-P36-?37) . La única diferencia en el protocolo experimental es que, en este caso, 1) se lleva a cabo la mutagénes.ls al azar a través de todo el gen gp35; 2) los bacteriófagos de tipo silvestre (y las medias fibras distantes de los mutantes termolábiles) se separan de los bacteriófagos mutantes termolábiles que se han inactivado a alta temperatura (pero que todavía tienen fijadas medias fibras de cola próximas) precipitando tanto las medias fibras distantes como las partículas del bacteriófago que contienen fibras de cola intactas con cualesquiera de los anticuerpos de la mitad de fibra de cola antidistantes seguido por cuentas de proteína A de Estafilococo; 3) los bacterióf gos mutantes restantes en el líquido sobrenadante se reactivan mediante incubación a baja temperatura con extractos bacterianos que contienen medias fibras distantes intactas de tipo silvestre, y 4) los materiales mutantes 35 de gen termolábiles que se hacen crecer a 30°C pueden probarse para termolabilidad reversible mediante inactivación a 60°C y reincubación a 30°C. La inactivación se lleva a cabo en una suspensión concentrada del bacteriófago y la reincubación a 30°C se lleva a cabo ya sea antes o después de la dilución. Si los bacteriófagos se reactivan satisfactoriamente antes pero no después de la dilución, esto indica que su gp35 es reversiblemente termolábi L . Para crear una mutación de gen 36 con un enlace termolábi.L de gp35--P36, el terminal C del gen 36 se mutageniza como se describe en lo que antecede, y el mutante sa selecciona para reversibilidad. Una alternaiva es mutagenizar gp35 para crear un mutante del gen 35 en donde el enlace gp35-P36 se disociará a 60°C. En este caso, la incubación con los anticuerpos anti-gp35 puede usarse para precipitar los bacteriófagos sin P36-P37 y por lo tanto para separar los mismos de los bacteriófagos de tipo silvestre y las medias fibras de cola distantes (P36-P37), puesto que gp35 variante permanecerá fijado a P34. EJEMPLO 6 ENSAMBLADO DE BASTONES UNIDIMENSIONALES A. Ensamblado Simple: El químero P37-36 descrito en el Ejemplo 2 es capaz de auto-ensamblado pero requiere un iniciador P37 para ligar la primera unidad del bastón. Por lo ta to, un P37 o un dímero ?P37 ya sea se fija a una matriz sólida o queda libre en solución para servir como un iniciador, Si el iniciador está fijado a una matriz sólida, el dímero P37 termolábil se usa de preferencia. La adición ce un extracto que contiene gp37-36 o químero gp37-36 purificado da por resultado el ensamblado de multímeros lineales de longitud aumentada. En el caso ligado en la matriz, los bastones finales se liberan mediante una incubación breve a alta temperatura
(40°C-60°C), dependiendo de las características de la variante P31 termolábil específica) . La relación del iniciador a gp37-36 se puede variar, y la distribución de tamaño de los bastones se mide mediante cualesquiera de los siguientes métodos: 1) Cromatografía de exclusión de tamaño; 2) Aumento en la viscosidad de la solución; y 3) Medición directa mediante microscopía electrónica. B. Ensamblado en etapas: Las variantes de P37-36, *P37-36 y P37-36* que se describen en el Ejemplo 3 no pueden autopolimerizarse . Esto permite que el ensamblado en etapas de los bastones de longitud definida de conformidad con el siguiente protocolo: 1. Fije el iniciador P37 (de preferencia termolábil) a una matriz. 2. Añada un exceso de *gp37-36 para fijarse y oligomeri arse como los homooligómeros P37-36 en el terminal N de P37. 3. Lavar el *gp37-36 sin reaccionar e inundarse con gp37-36*. 4. Lavar el gp37-36* sin reaccionar e inundarse con un exceso de gp37-36. 5. Repetir los pasos 2 a 4, n-1 veces. 6. Liberar el ensamblado o conjunto de la matriz mediante incubación breve a alta temperatura como anteriormente . Los dimensiones lineales de los bastones de proteína en el lote dependerá de las longitudes de los heteroquímeros de la unidad y el número de ciclos (n) de adición. Este método tiene la ventaja de asegurar reproducibilidad absoluta de la longitud del bastón y una distribución de tamaño homogénea monodispersa de una preparación a otra. EJEMPLO 7 ENSAMBLADO EN ETAPAS MEDIANTE POLÍGONOS
La siguiente estrategia de ensamblado utiliza gp35 come una junta o unión de ángulo para permitir la formación de polígonos. Para los fines de este Ejemplo, el ángulo formado mediante gp35 se supone que es de 137°. La unidad de bastón comprende el químero P36-34 descrito en el Ejemplo 4 que es incapaz de auto-polimerización. El homodímero P36-34 se produce de una clona bacteriana en donde se expresan tanto gp36-34 como gp57. En el gp57 puede supervisar la homodimerización de gp36-34 a P36-34. 1. Iniciador: La media fibra distante incompleta de P36-37 se fija a una matriz sólida mediante el terminal C, P37. El gp35 termolábil como se describe en el Ejempio 5 se añade luego para formar el iniciador intacto. 2. El exceso del químero P36-34 se añade para fijarse a un solo P36-34. Después de la ligazón a la matriz a través del gp35 el químero no ligado se lava. 3. El gp35 de tipo silvestre (es decir, no termolábil) se añade luego en exceso. Después de la incubación, el material no ligado se lava. 4. Se repiten los pasos 2 y 3, de 7 a 8 veces. 5. El conjunto o ensamblado se liberó de la matriz mediante incubación breve a alta temperatura. El bastón polimérico liberado, de 8 unidades de largo formará un polígono de 8 lados regular cuyos lados comprenderi el dímero P36-34 y cuyas juntas o uniones comprenderi el monómero gp35 de tipo silvestre. Sin embargo, habrá algunos multímeros de estas 8 unidades ligadas como hélices Cuando la unidad no se cierra, sino en vez de esto añade otro de sus terminales, la unidad no puede cerrarse más y la hélice puede construirse en cualquier dirección La dirección del primer traslape también determina el sentido de la hélice. Diez (o siete) bastones unitarios pueden formar hélices más frecuentemente que los polígonos puesto que sus ángulos naturales son de 144° o (128.6°) . La posibilidad de cierre de un polígono regular depende r o solamente del ángulo promedio de gp35, sino también de su flexibilidad que puede además manipularse mediante qaodificación genética o ambiental. El tipo de polígono que se forma usando este protocolo depende de la longitud de las unidades de bastón y el ángulo formado mediante la junta o unión del ángulo. Por ejemp .o, las unidades de bastón alternativas de tamaños diferente ¡5 se pueden usar en el paso 2. Además, los polipéptiflos gp35 variantes que forman ángulos diferentes que el án julo natural de 137° se pueden usar permitiendo la formación de polígonos regulares diferentes. Además para un polígono (determinado con un número igual de lados y ángulos iguales, los lados en cualquier mitad pueden ser de cualquier tamaño, siempre y cuando las sos mitades sean simétricafe LISTADO DE SECUENCIAS
(1) INFORMACIÓN GENERAL: (i) SOLICITANTE: Goldberg, Edward B. (ii) TITULO DE LA INVENCIÓN: MATERIALES PARA LA PRODUCCIÓN DE ESTRUCTURAS NANOMETRICAS Y USO DE LAS MISMAS (iii) NUMERO DE SECUENCIAS: 6 (iv) DIRECCIÓN PARA CORRESPONDENCIA: (A) CONSIGNATARIO: Pennie and Edmonds (B) CALLE: 1155 Avenue of the Americas (C) CIUDAD: Nueva York (D) ESTADO: Nueva York (E) PAÍS: Estados Unidos (F) CÓDIGO POSTAL: 10036 (v) FORMA LEÍBLE EN COMPUTADORA: (A) TIPO MEDIANO: Disquete (B) COMPUTADORA: IBM PC compatible (C) SISTEMA DE FUNCIONAMIENTO PC- DOS/MS-DOS (D) SOFTWARE: Patente en Liberación #1.0, Versión #1.25 (vi) DATOS DE SOLICITUD ACTUALES: (A) NUMERO DE SOLICITUD: Va a asignarse (B) FECHA DE PRESENTACIÓN: 13 de Octubre de 1995 (C) CLASIFICACIÓN: (viii) INFORMACIÓN DEL ABOGADO/AGENTE: (A) NOMBRE: Misrock, S. Leslie (B) NUMERO DE REGISTRO: 18,872 (C) NUMERO DE REFERENCIA/TOCA DEL ABOGADO: 8471-0005-999 (ix) INFORMACIÓN DE TELECOMUNICACIÓN: (A) TELEFONO: (212) 790-9090 (B) TELEFAX: 212-869-8864 (C) TELEX: 66441 PENNIE (2) INFORMACIÓN PARA SEQ ID NO:l: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 8855 pares de base (B) TIPO: ácido nucleico (C) TIPO DE CADENA: simple (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómica) (iii) HIPOTÉTICA: NO (iv) ANTISENTIDO: NO (vi) FUENTE ORIGINAL: (A) ORGANISMO: Bacteriófago T4 (vii) FUENTE INMEDIATA: (B) CLONA: GENES DE FIBRA DE COLA (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO:l: TAGGAGCCCG GGAGAATGGC CGAGATTAAA AGAGAATTCA GAGCAGAAGA TGGTCTGGAC 60 -
GCAGGTGCTG Í.TAAAATAAT CAACGT?GCT TTAGCTGATC GTACCGTAGG AACTGACGGT 120
GT A?CGTi: ?.CTACTTAAT TCA?GAA?AC ACAGTTCAAC AGTATG? CC AACTCGTGGA 180
TATTTAAA G A7TTTGTAAT CATTTATGAT AACCGCTTTT GGGCTGCTAT A.AATGATATT 243
CC?AAACCAG CAGGAGCTTT TAATAGCGGA CGCTGGAGAG CATTACGTAC CGATGCTAAC 300
TGGA TACGC TTTCATCTGG TTCATATCAA TTA?AA CTG GTGAAGC?A? TTCGGTTAAC 360
ACCGC?GCTC GAAATGACAT CACGTTTACT TTACCATCTT CTCCAATTGA TGGTGATACT 420
ATCGTTC?CG AAGATATTGG AGGAAAACCT GGAGTTAACC AAG7TTT?AT G AGCTCCA 480
GTACAAAGT* TTGTAAACTT TAGAGGTGAA CAGGTACGTT CAGTACTAAT GACTCATCCA 540
AAGTCACAGC TAGTTT AAT TTTTAGTAAT CGTCTGTGGC AAATGTATGT TGCTGATTAT 600
AGTAG GAAC- CTATAGTTGT AACACCAGCG AATACTTATC AAGCGCAATC CAACGATTTT 660 TCGTACGTk OATTTACTTC TGCTGCACCA ATTAATGTCA AACTTCCAAG A TTGCTAAT 720
CATGGCGATA TTATTAATTT CGTCGATTTA GATAAACTAA ATCCGCTTTA TCATACAATT 780
CTTACTACA.' ACGATGAAAC GACTTCAGTA CAAGAAGTTG GAACTCATTC CATTGAAGGC 840
CGTACATCG TTGACGGTTT CTTGATGTTT GATGATAATG AGAAATTATG GAGAC GTTT 900
GACGGGGATA GTAAACCGCG TTTACGTATC ATAACGACTA ATTCAAACAT TCGTCCAAAT 960
GAAGAAGTT? TGGTATTTGG TGCGAATAAC GGAACAACTC AAACAATTGA GCTTAAGCTT 1020
CCAACTAAT? TTTCTGTTGG TGATACTGTT AAAATTTCCA TGAATTACAT GAGAAAAGGA 1080
C2.AACAGTT? AAATCAAAGC TGCTGATGAA GATAAAATTG CT CTTCAGT TCAATTGCTG 1140
CAATTCCCA? AACGCTCAGA ATATCCACCT GAAGCTG AT GGGTTACAGT TCAAGAA?TA .200
GTTTTT?ACG ATGAAACTAA TTATGTTCCA GTTTTGGAGC TTGCTTACAT AGAAGATTCT 12G0
GATGGAAAAG ATTGGGTTGT ACAGCAAAAC GTTCCAACTG TAGAAAGAGT AGATTCTTT 132C
ARTG?TTCT^ CTAGAGCAAG ATTAGGCGTA ATTGCTTTAG CT^C?C?J.GC 7C AGCTA?T 13SD
GTCG? TT 2 AA?ATTCTCC ?CAAAA GA? TT?GCA..TTA CTC C? G.' .C GT ?GC'?AT 144:
CGTACTGCT^. CAGA??CTCG C?GAGGTATP CAAG?A^A A." ""?" CGC TCAAG G?AT 15C0
CAGA?CACCFT CATTC CTTT TGCTGATCA^ .VTTATCATC? CTC ""T? ??A GCTGAATGAA 1560
?GAACTGCT? C&G ?.?C C\ , T?GAGGTG"'. CCAGAA?TTC CT? CC ACCA AGAAAC7AA? 1620
GCAGG&ACCG ATGAT?CT?C ATCATCACT CCTA?AAAGC TTCAAGCTCG TC AÜGTTCT 1580
GA?TCATTAT GTGGTATG.: .' ?ACCG G -'V TCTAJTCC?G ^ GCT?CTC GCTTCTAGC 1740
CGTGA TTG? TCGT?CCA TGTTTAT.V ;V.?\;.G?C7G AT; AT^AG- T:-GTGC?CCI ISCO
?kAcrrrrc.' ATCGGTATAA ?OCTACTC ? ...:?CA"CA?C - ;r CÍ.C??I? : T;.G. AGTT ISCO
G A\ '-'jG?^ < T?.?T7 'r \, ACAAAGTC. '."' iCG?TG'-C C^' ? C7CT '- T W rCC 1920
C?ACC G " ?TA?G?J.C C AVCAACTGAT 'G-,,.C?;-TG\ " • .- 'r, /V.A "?CG 198C
C AAG G .r G T A^?; ,.GG AACTGÍ.V . T crcrrrr-. c T "?CC.?;. .WCT^G??AT 2C C
CG CÍ?TAG7': A CT.J.'??G TTTAAGTGC ; ACCT .,,,.; ?-.• WCAO A TOCWGTC 2icc -
< i '-GGAGGC; TCGACGATAC TCGT?TCTCT ACACCATTA.\ AAATTAAAAC CAGA?TTAAT ??ß
AGTACTGATC GTACTTCTGT TGTTCCTCTA TCTGGATTAG TTGAATCAGG AACTCTCTGG 2220
GACCATTATA CACTTAATAT tCTTGAAGCA AATGAGACAC AACGTGGTAC ACTTCGTGTA 2280
GCTACGCAGG TCGAAGCTGC TGCGGGAACA TTAGATAATo TTTTAATAAC TCCTAAAAAG 2340
CTTTTAGGTi. OT?AATCTAC TGAAGCGCAA GAGGGTGTTA TTAAAGTTGC ?AC C?GTCT 2400
GAA?CTGTGA CTGGAACGTC ?GCAAATACT GCTGTATCTG CAAAA?ATTT AA?ATGGATT 24S0 < i
G2GCAGAGTL- AACCTACTTG G3CAGCTACT ACTGCAATAA GAGGTTTTGT TAAAACTTCA 25?0 !
TCTGGTTC?? TTACATTCGT TGGTAATGAT ACAGTCGGTT CTACCCAAGA TTTAGAACTG 2580
T?TGAGAAA.1 ATAGCTATGC GGTATCACCA TATGAATTAA ACCGTGTATT AGCAAATTAT 2640
TTGCCACTA\ AAGCAAAAGC TGCTGATACA AATTTATTGG ATGGTCTAGA TTCATCTCAG 2700
TTCATTCGT=k GCGATATTGC ACAGACGGTT AATGGTTCAC TAACCTTAAC CCAACAAACG 2760
AATCTGAG 3 CCCCTCTTGT ATCATCTAGT ACTGGTGAAT TTGGTGGTTC ATTGGCCGCT 2820
AÍITAGAACAG TTACCATCCG TAATACAGGA GCCCCGACTA GTATCGTTTT CGAAAAAGGT 2680
CCTGTATCC3 GGGCAAATCC TGCACAGTCA ATGAGTATTC G77TATGGCG T?ACCAATTT 2940
GGCCCCGGTA GTG TACGAC CCGTTCGACA GTGTTTGAAG TTCGCGATGA CACATCTCAT 3000
CACTTTTAT? CTCJ.ACGTAA TAAAGACGGT AATATAGCG "T?AACATTAA TGGT?CTGTA 3060
ATGCCAAT?A ACATTAATGC TTCCGGTTTG ATGAATGTGA ?TGGCACTGC AACATTCGGT 3120
CCTTCACTi^ CAGCCAATGG TGAATTCATC AGCAAGTCTG CAAATGCTTT ?AG?GCAATA 3330
ÍACGÜ?GJ-T ACG7ATTC T TATTCCTAAT GATGCCTCVA AT¿ CCTATTT TTTGCTCAC" 3240
Gt'ZrOCGGIC- A77AG?CTGG TGCTTTTAAT GGATT?CGCC A'I'TATTAAT TA?T Í.TCÍ.A 3300
TCC?GÍCA:A TTACA?TTGG TCAAGGCTTA ATCATTGCCA AAGGTGTTAC TATA? - TCH 3300
CGCCT/I I' ? CTG T?ACTC CAGAATTCGT TCTCAGGGTP CT P CA O TGA7'? AT?,'I 3 ^0
AC CGTGCC C.;^CATCTGA T?CTGTAGGA TTCTGGTCA-* TCG.TATT?? GGA TGAOCC ¿ -o
AC TATA? 7 AG7ICCCGCG TTATTTTA?A ATGGTTGA?A A ACTAJÍTGA JV.:TG C'"'CC7 3740
CTT^CATACT TA' V?CGT C '"GAAGAAGTT AAATCTCCT& GT\C.?CTGAC TCAGTTIGGT 3600
A a.C?C "'G ATTCGCTGTA CC^AGATTGG í TTACT'r'ATC* Cv\C3?CGrC AGAAGCGCG7 3660
ACCACTCGGT GGACACG AC ATGCCAG ?A ?CCA??A?CT CG'CGTCAAG GTTGTIC?G 37?0
C ÍV/GTTCA :G CACGT?ACCC CCTC?ACCH TCTGATATCG CT^C ^ACC ATCGGAT^V: 37&0
CCTG.CAÍT G GCAATCTT\C T?.TTCGGG?T TTCTTGCO-K. - I G'iA .r»t t".cc;.ttctt ?^o
C7TGACCC \^ V i-AT??/.. >C G GTT?AA??T G?ATGGG77 ?A Aí.GAGGT AGT GGA ? G r Q
Í "l "'G?AGGATAT GTCCA?ACG'. C. " >'T?"CC GAAACIAA?'" 3 CC
CAGi'AACA'? TÍ?A .TA?GV 'i?GCGGC-?T CTTCCCCCC ' T r , ¡V.C?OCA '" ?C /.TCAT ¿r)?C VGTVAA; ""i ' " G!.,;TA T CT-TGTAGCAA GTCAA?CÍ •:'"' r -rv.~ ?-,c-r, OOTTOATTTA OSO
AC"(","rr:r-' ^ :tc. TCC?G me AGGATTA GTT&AT . • S ->; MT:" G ^TT^CGAC 414C TCAA?TGñTA CTACATCAGC TGC?TTTG7T AGTTTTCATG AATTC'TTTGA CCAATAATCG 4200
AATTG TGCT ATATT ACTA G7GGAAAGGT ?AATTTTCCT CCTGAAGTAG TATCITGGTT 4260
AAG ACCGCC GGAACGTCTG CCTTTCCATC TGATTCTATA TTGTC?AGAT TTGACGTATC 4320
AT??GCTGC7 7TTTATACTT CTTCTAAAAG AGCTATCGCA TTAGAGCATG TTAAACTGAG 4380
TAATAGAAAA AGCACAGATG ATTATCAAAC TATTTTAG?T CTTGTATTTG ACAGTTTAGA 4440
AG??GTAGGA GCTACCGGG7 TTCCAAGAA'J AACGTATGAA AGTG7TGAGC AATTCATGTC 4500
GGCAGTTGOT GGP-ACTAATA ACGAAATTGC GAGATTGCCA ACTTCACCTG CTATAAG?AA 4560
ATTATCTGAT TATAATTTAA TTCCTGGAG TGTTCTTTAT CTTAAAGCTC AGTTATATGC 4620
TG TGCTGAT TTACTTGCTC TTGGAACTAC AAATATATCT ATCCGTTTTT ATAATGCATC 4680
TAACCGATAT ATTTCTTCAA CAC?AGCTCA ATTTACTGGG CAAGCTGGGT CATGGGAATT 4740
AAAGGAAGAT TATGTAGTTG 7TCCAGAAAA CGCAGTAGGA TTTACGATAT ACGCACAGAG 4800
AACTGCACAA GCTGGCCAAG GTGGCATGAG AAATTTAAGC TTTT'JTGAAG TATCAAGAAA 4860
TGGCGGCATT TCGAAACCTG CTGAATTTGG CGTCAATGGT ATTCGTGTTA ATTATATCTG 4920
CGAATCCGCT TCACCTCCGG AT?TAATGGT ?CTTCCTACG C AGCATCC-T CTAAAACTGG 4980
TAAAGTGTTT GGGCAAGAAT TTAGAGAAGT TTAAATTGAC GGACCCTTCG GGTTCCCTTT 5040
TTCTTTATAA ATACTATTCA AATAAAGGGG CATACAATGG CTG?TTTAAA AGTAGGTTCA 5.100
ACAACTGG?G GCTCTGTCAT TTGGCATCAA GGAAATTTTC CATTG?ATCC AGCCCGTGAC 5160
GATGTACTCT ATAAATCATT TAAAATATAT TCAGAATATA ACAAACC?CA AGCTGCTGÍ.T 5220
;IACGATTTG3 TTTCTAAAGC TAATGGTG3T ACTTATGCA? OPA GGTAAC A?TTAACCCT 5280
GGC TTCAJ.G TCCCAT?TC-C TCC?AACATC ATGAC-CCCAT GCGC'.-?TTTA TCGGGGTAAC 5340
G TGATGG7G 7?CTTTTGA TAAAGCAAAT ?7CG,V¡7-.TTG TTCYTGG";. TCGCC-TAGCA C3400
TTTAAATCGI CATTTGGTTC AACAGRCCGA ACIGTTG AA TTAAT?CACG CAA GGTG?T 5460
?VTTAACAC?? ?ACGTGTTGT G77GGCACCT CGTCAAGTA". A?.'TGGTGC GGG7GCTCCT 5520
AT?GCACCG.- ?TG?GCTTAC TACAA?CGAC T.V'GI TG?TC GVGC _ "AAA TAC GTTACV 55G0
GCAA TCCA? ACTCT?GGGT GCTACGGTCT GGTCACACCA TCAC.VGTAA 7TTAACAGCG 5540
CC?A?CT '1" TCT GCAGAA TCCTGCATCT CAACCC7CAC ?CGT TCCACG ?L^TGACC?A 5700
/.TCGT&?TIA ACGGTTCTGT TCAAGG.TTTG CGCTATTATT VAGAGGACTT ;TGGCT\CGT 5760
T ?AACAA.'I ACA?'I'?TAAA AGA?CCA?A? 1 CGC?CGAAG ?CCTGCTCCT GCTTCAC??T 5C20 ?GCCGAACC- TGA?TTGGCT ATAAACTT A AAG?TP.GAA'"' ,V?T" "T7ACT ?AAGATR A R 53G?'
CACG?AA-?. C?TCCATCTA GG^TT??^;. AAGCGGCGC? :1"" '. TG? - uv iwc :.. 59<* :
T?AACGC; _"' TGÍTG?G?TT? AAVCCCCAGT ?TGT?C?Í-V. r r - ?.ATG ?CTG?.V ' J? e c:
G C. ?TT. C V'1 .". \CTGAT G^GTC?C C- sAAAA.'*- , ,"7 ? G. > .' 7A7? CGC'rYC?/" 60 V) •]".' ; t GCA , J.G O CA AC G;. ' GTI <;;.-. ATGCCCAT ver.; TGA AP.T??C: ;ATG ¿ GJ
GCAC'l GAA' r; "T '7GTTATP l .'- TGC?CGCC T CAAJ'.rrc , • : i-.C? '.,: : 3bT CÍ ' ¡'.'.T-i !''." 610 ? TTAGGGTTAG ACAAGGAACA GGAAGCACTG CCAACAGTGA ATTCTATTTC CGCTCTATAA 62¿
ATGGAGGCG ATTTCAGGCT AACCGTATTT TAGCATCAGA TTCGTTAGTA ACAAAACGCA 630
TTGCGGTTGA TACCGTTATT CATGATGCCA AAGCATTTGG ACAATATGAT TCTCACTCTT 636
TGGT7AATTA TsTTTATCCT GGAACCGG7G AAACAAATGG TGTAAACTAT CTTCGTAAAG 642
TTCGCGCTPA GTCCGGTGGT ACAATTTATC ATGAAATTGT TACTGCACAA ACAGGCCTGG 640
CTG.VTG?ACT TTCTTGGTGG TCTGGTGATA CACCAGTATT TAAACTATAC GGTATTCGTG 654
ACG?TGGCAG AATGATTATC CGTAATAGCC TTGCATTAGG TACATTCACT ACAAATTTCC 660
CGTCTAGTGA TTATGGCAAC GTCGGTGTAA TGGGCGATAA GTATCTTGTT CTCGGCGACA 666
C GTAACTGG CTTGTCATAC AAAAAAACTG GTGTATTTGA TCTAGTTGGC GGTGGATATT 672
C GTTGC RC TATTACTCCT GACAGTTTCC CTAGTACTCG TAAAGGTATA TTTGGTCGTT 678
CTGAGGACCA AGGCGCAACT TGGATAATGC CTGGTACAAA TGCTGCTCTC TTGTCTGTTC 68
AAACACAAGC TGATAATAAC AATGCTGGAG ACGGACAAAC CCATATCGGG TACAATGCTG 69
GCGC-TAAAAT GAACCPICTAT TTCCGTGGTA CAGGTCAGAT GAATATCAAT ACCCAACAAG 69
GTATGGA?AT T??CCCGGGT ATTTTGAAAT TGGTAACTGG CTCTAATAAT GTACAATTTT 70
ACGCTGACGG AACTATTTCT TCCATTCAAC CTATTAAATT AGP.TAACGAG ATATTTTTAA 70
CTAAATCR,AA TAATACTGCG GGTCTTAAAT TTGGAGCTCC TAGCCAAGTT GATCGCACAA 71
GGACTATCCN ?TGGAACGGT GGTACTCGCG AAGGACAGAA TAAAAACTAT GTGATTATTA 72
AAGCATGCGC AACTCATTT ??TGCCACTG GTGATAGATC TCGCGAAACG GT7TTCCAAG 72
TATCAC-AGAG TV?AGGATAT TAGTTTTATG CTCATCGTAA AGCTCCAACC GGCGACGAA? 73
CTATTGCACC TATTGAAGCT CAATTTCCTG GGGATGTTTA TGCTAAAGGT ATTTTTGCCP 73
ACGGA?ATTT 7ACAGTTGTT GGCTCAAGCG CTTTAGCCGG CAATGTTAC? ATGTCTAACG 7
GTTTG*""JTGT CCAAGGI3GT TCTTCT?TTÑ CTCGACAP.GT 7AAAATTGGC GGAACACC\A "75
ACCCACT3AC A?T71GGA?C GCTGAATATG GTGCTAVTT CGTCGTTC GAAAGTAACT 7?
TTTATA"TAT TCC ACCAAT 7AAAATG AG GAC A?GTCG AGACPTTCAG AGCTCTT7GA 7
GACCT3TG?G AAIAGGATTA AACGATGGCA TGGTTGGGTT ?CGAACAGA' TC7TT7AT? 76
TAGATC\AA? TAATGCTTTA ACTACG?TAA ACAGTAACTC TCGCATTAAT GCCA C7TTA 77
G ATCI?? I "GGCCAGTCG GCATACATTG ATGCAGAATG TACTGATGC? GTTCGGCCGG 78
C1GGIG ?CG TTCA ^^CCI TCCC?C??TA ATG ACAC¡T CCGTCCCCCG tvr -? ? TG? "' C
P.TATTGAt:.C A TGA7GCT AGTGCATATG TTCCT?TTrT GAAACAACGT ^A^ TTC ?G "^
GCA-ATC GG"' ' 'TATJ J .TTA GGGACTTTAA TT?A rAAT GG TAATTTCC G? CT7CATTACC 79
ATGGCC GCC AG ^Y C CG7 TC7?C?GGTC CACAC TGC TGATTTTGG? "GCGAATTTA 80- TTAAAJ--V . O r ' '? ?I ^ T i' " G'. GC^CGCG A T^ \AT lGC AGCCA?AGTG AC P 'TTG?TA 31
GAACTC 'GT?.* "?Tr.iCVG T GGT*1 CTCGTA AT O riOCTAA CT7AAAC7 GT A ,A..T 3 AT 81
CACT ™ AA! M Al f .i.'I 1 'iV AsTTACC CV TT G^TGC CCGATTC7T TGOCCGA&7C ^ 2 ATTCAGTTCC TGCTGGATTT GCTTTGATGG AAGGTCAGAC CTTTGATAAG TCCGCATATC 8280
CAAAGTTAGC TGTTGCATAT CCTAGCGGTG TTATTCCAGA TATGCGCGGG CAAACTATCA 8340
AGGGTAAACC AAGTGGTCGT GCTGTTTTGA GCGCTGAGGC AGATGGTGTT AAGGCTCATA 8400
GCCATAGTGC ATCGGCTTCA AGTACTGACT TAGGTACTAA AACCACATCA AGCTTTGACT 8460
ATGGTACGAA GGGAACTAAC AGTACGC-GTG GACACACTCA CTCTGGTAGT GGTTCTACTA 8520
GCACAAATGG TGAGCACAGC CACTACATCG AGGCATGGAA TGGTACTGGT GTAGGTGGTA 8580
ATAAGATGTC ATCATATGCC ATATCATACA GGGCGGGTGG GAGTAACACT AATGCAGCAG 8640
GGAACCACAG TCACACTTTC TCTTTTGGGA CTAGCAGTGC TGGCGACCAT TCCCACTCTG 8700
TAGGTA TGG TGCTCATACC CACACGGTAG CAATTGGATC ACATGGTCAT ACTATCACTG 8760
TAAATAGTAC AGGTAATACA GAAAACACGG TTAAAAACAT TGCTTTTAAC TATATCGTTC 8820
GTTTAGCATS AGGAGAGGGG CTTCGGCCCT TCTAA 8855
( 2 ) INFORMACIÓN PARA SEQ ID NO : 2 : ( i ) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD : 1289 aminoácidos (B) TIPO : aminoácido (D) TOPOLOGÍA: lineal ( i i ) TIPO DE MOLÉCULA: proteina (vi ) FUENTE ORIGINAL : (A) ORGANISMO : Bacteriófago T4 (vii ) FUENTE INMEDIATA: (B ) CLONA: aminoácido p34 (xi ) DESCRIPCIÓN DE LA SECUENCIA : SEQ ID NO : 2 Met Ala Glu He Lys Arg Glu Phe Arg Ala Glu Asp Gly Leu Aep la
1 5 "0 15
Gly Gly Asp Lys He He Asn Val Ala Leu Ala Asp Arg Thr Val Gly 20 25 30 Thr Asp Gly Val Asn Val Asp Tyr Leu He Gln Glu As- hr Val Gln 25 40 5 Gln Tyr Asp Pro Thr Arg Gly Tyr Leu Lys Asp Phe V 1 He He Tyr 50 55 60 Asp Asn Arg Phe Trp Ala Ala He Asn Asp He Pro Lys Pro Ala Gly
65 70 75 80
Ala Phe Asn Ser Gly Arg Trp Arg Ala Leu Arg Thr Asp Ala isn Trp 85 90 95 lie Thr Val Ser Ser Gly Ser Tyr Gln Leu Lys Ser Gly Glu Ala He 100 105 110 Ser- Val Asn Thr Ala Ala Gly Asn Asp He Thr Phe Thr Leu Pro Ser 115 120 125 Ser Pro He Asp Gly Asp Thr lie Val Leu Gln Asp He Gly Gly Lys 130 135 140
Pro Gly Val Asn Gln Val Leu He Val Ala Pro Val Gln Ser He Val 145 .150 155 160
Aen Phe Arg Gly Glu Gln Val .Arg Ser Val Leu íiet Thr His Pro Lys 165 170 175
Ser Gln Leu Val Leu He Phe Ser Asn Arg Leu Tro Gln Met Tyr Val 180 185 * 190 Ala Asp Tyr Ser Arg Glu Ala He Val Val Thr Pro Ala Asn Thr Tyr 195 200 205 Gln Ala Gln Ser Asn Asp Phe He Val Arg Arg Phe Thr Ser Ala Ala 210 215 220 Pro He ?sn Val Lys Leu Pro Arg Phe Ala Asn His Gly Aep He Xle 225 230 235 240
Asn Phe i/al Asp Leu Asp Lys Leu Asn Pro Leu Tyr His Thr He Val 245 250 255
Thr Thr Tyr Asp Glu Thr Thr Ser Val Gln Glu Val Gly Thr His Ser 260 265 270 He Glu Gly Arg Thr Ser He Asp Gly Phe Leu Mat Phe Asp Asp Asn 275 280 285 Glu Lys Leu Trp Arg Leu Phe Asp Gly Asp Ser Lvs Ala Arg Leu Arg 290 295 300 He He Thr Thr Asn Ser Asn He Arg Pro Asn Glu Glu Val Met Val 305 310 315 320
Phe Giy Ala Asn Asn Gly Thr Thr Gln Thr He Glu Leu Lys Leu Pro 325 330 335
Thr Asn lie Ser Val Gly Aep Thr Val Lys He Ser Met Asn Tyr Met 340 * 345 350 Arg Lys Gly Gln Thr Val Lys He Lys Ala Ala Asp Glu Aep Lys He 355 " 360 365 Ala Ser Ser Val G n Leu Leu Gln Phe Pro Lys Arg Ser Glu Tyr Pro 37C 375 330 Pro Gli. Ala Glu Trp Val Thr Val Gln Glu Leu Val Phe Asn Asp Glu 385 31-0 395 400
Thr ¡¡.a:, Tyr Val Pro Val Leu Glu Leu Ala Tyr He Glu Asp Ser Aep 405 io 415
Gly Lv : Tyr Tro Val Val Gln Gln Asn Val Pro Thr Val Glu P.rg Val 420 425 430 Asp .7-:. - Leu Asn Aso Cer Trr Ar? Ala Ara Leu Gly Val He Ala Leu 3 * 44Ó ' 445 Ala 'Tl.r Gln Ale Glr, A; a Arn Val Asp Leu Glu Asn Ser Pro Gln Lye 41.') ^55 460 Glu L- : Ala He Thv Pro Glu Thr Leu Ala Asn Arg Thr Ala Thr Glu 4GB -''70 475 480
Thr i.r. -f Arg G]y He Ala A-;t He Ala 7hr Thr Ala Gln Val 3 Gln 485 490 495
Z'sr. ' r Th-: Phe Ser e Al Asp Asp lie He Ha Thr Pro Lys Lys 1220 1225 1230 Phe Val Gln Val Phe Asp Gly Gly Asn Pro Pro G n Pro Ser Asp He 1235 1240 1245 Gly Ala Leu Pro Ser Asp Aen Ala Thr Met Gly Asn Leu Thr He Arg 1250 1255 1260 Asp Phe Leu Arg He Gly Asn Val Arg He Val Pro Asp Pro Val Asn 126? 1270 1275 1280
Lys Thr Val Lys Phe Glu Trp Val Glu 1285
(2) INFORMACIÓN PARA SEQ ID NO : 3 : (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 65 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteina (vi) FUENTE ORIGINAL: (A) ORGANISMO: Bacteriófago T4 (vii) FUENTE INMEDIATA: (B) CLONA: aminoácido ORF X (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 3:
Met Glu Lys Phe Met Ala Glu He Trp Thr Arg He Cys Pro Asn Ala 1 5 10 15
He Leu Ser Glu Ser Aen Ser Val Arg Tyr Lys He Ser He Ala Glv 20 25 30 Ser Gys Pro Leu Ser Thr Ala Gly Pro Ser Tvr Val Lvs Phe Gln Aep
40 " 45 Asn Pro Val Gly Ser Gln Thr Phe Arg Arg ?rg Pro Sor Phe Lvs r 50 55 60 Phe 65 (2) INFORMACIÓN PARA SEQ ID NO: 4: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 295 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteina (vi) FUENTE ORIGINAL: (A) ORGANISMO: Bacteriófago T4 (vii) FUENTE INMEDIATA: (B) CLONA: aminoácido p35 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 4
Val
(2) INFORMACIÓN PARA SEQ ID NO: 5: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 221 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteina (vi) FUENTE ORIGINAL: (A) ORGANISMO: Bacteriófago T4 (vii) FUENTE INMEDIATA: (B) CLONA: aminoácido p36 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO : 5
Met Ala Asp Leu Lys Val Gly Ser Thr Thr Gly Gly Ser Val He Trp 1 5 10 15
HÍB Glr Gly Asn Phe Pro Leu Asn Pro Ala Gly Asp ?sp Val Leu Tyr 20 25 30 Lys Ser Phe Lys He Tyr Ser Glu Tyr Asn Lys Pro Gln Ala Ala Asp 35 40 45 Asn Asp Phe Val Ser Lyp Ala Asn Gly Gly Thr Tyr Ala Ser Lys Val 50 55 60 Thr Phe Asn Ala Gly He Gln Val Pro Tyr Ala Pro Asn lie Met Ser 65 70 75 80
Pro Cye Gly He Tyr Gly Gly Asn Gly Asp Gly Ala Thr Phe Asp Lys 85 90 95
Alf'i Asn He Asp He Val Ser Trp Tyr Gly Val Gly Phe Lys Ser Ser 100 105 110 Phe Gly Ser Thr Gly Arg Thr Val Val He Asn Tnr Arg Asn Gly A3P
115 120 125 He Asn Thr Lys Gly Val Val Ser Ala Ala Gly Gln Val Arg Ser Gly 130 135 140 -
Ala Ala Ala Pro He Ala Ala Asn Asp Leu Thr Arg Lys Asp Tyr Ve.1
145 155 160
Asp Gly Ala He Asn Thr Val Thr Ala Asn Ala Asn Ser Arg Val Leu 165 170 175 Aro Ser Gly ?sp Thr Met Thr Gly Asn Leu Thr Ala Pro Asn Phe Phe 180 185 190 Ser Glr. Asn Pro Ala Ser C-ln Pro S3r His Val Pro Arg Phe Asn Gln 195 200 205 Ha Val He Lys Asp Ser Val Gln Asp Phe Gly Tyr Tyi 21C 215 220
(2) INFORMACIÓN PARA SEQ ID NO : 6 : (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1026 aminoácidos (B) TIPO: aminoácido (d) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteina (vi) FUENTE ORIGINAL: (A) ORGANISMO: Bacteriófago T (vii) FUENTE INMEDIATA: (B) CLONA: aminoácido p37 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO : 6 :
Met Ala Tnr Leu Lys Gln He Gln Phe Lys Arg Ser Lys He Ala Gly 1 5 10 15 - - Thr Arg Fro Ala Ala Ser Val Leu Ala Glu Gly Glu Leu Ala He Asn 20 25 30 Leu Lya í>sp Arg Thr He Phe Thr Lye Asp Asp Ser Gly Asn He He 35 40 45 Aap Leu Gly Phe Ala Lys Gly Gly Gln Val Aso Gly Asn Val Thr He 50 55 " 60 Asn Gly leu Leu Arg Leu Asn Gly Asp Tyr Val Gln Thr Gly Gly Met 65 70 75 80
Thr Val ?sn Gly Pro He Gly Ser Thr Asp Gly Val Thr Gly Lys He 85 90 95
Phe Arg Ser Thr Gln Gly Ser Phe Tyr Ala Arg Ala Thr Asn Asp Thr 100 105 HO Ser Asn íla His Leu Trp Phe Glu Asn Ala Aso Gly Thr Glu Arg Gly 115 120 * 125 Val He Tyr Ala Arg Pro Gln Thr Thr Thr Asp Gly Glu He Arg Leu 130 135 140 Arg Val Arg Gln Gly Thr Gly Ser Thr Ala Asn Ser Glu Phe Tyr Phe 145 150 155 160
Arg Ser He Aen Gly Gly Glu Phe Gin Ala Asn Arg He Leu Ala Ser 165 170 175
Asp Ser Leu Val Thr Lys Arg He Ala Val Aso Thr Val He Kis Aep 180 185 " 190 Ala Lys Pía Phe Gly Gln Tyr Aep Ser Hie Ser Leu Val Asn Tyr Vel 195 200 205 Tyr Pro Gly Thr Gly Glu Thr Asn Gly Val Asr. Tvr Leu Arg Lys Val 2.10 215 220 Arg Ala l s Ser Gly Gly Thr He Tyr His Glu He Val Thr Ala Gln 225 230 235 240
Thr Gly Leu Ala Asp Glu Val Ser Trp Trp Ser Gly Asp Thr Pro Val 245 250 " 255
Phe Lys Leu Tvr Gly He Arg Asp Asp Glv Arg Met He He Arg ?sn 260 265 " " 270 Ser Leu Ma Leu Gly Thr Phe Thr Thr Asn Phs Pro Ser Ser Asp Tyr 275 280 285 Gly Asn Val Gly Val Met Gly Asp Lys Tyr LP '. ai Leu G.y App Thr 2?C * 295 300 Val h'" Cly Leu Ser Tyr Lys Lys Ti" r Gly Va. ?ne Asp leu Va! 1, 1 / 303 310 3_.á 320
G.ty Glv 'r Ser Val Ala Ser He T.r Tro A.-p ar Phe- ; -p í"er Thr 325 :J 335
Arg ..yu C y He Phe Gly Arg Fe- G?u s,y-, cin Giy ?.le> ~r.r Trp "!o 340 345 3 7 Met Pro "1:. Ala Asp Aon .r. u ¡ en Ala Gly Asp Gly Gln Thr Hie lie Gl\ Tyr AJ? Al I ly -
Gly Aon Phe Arg Val Hie Tyr His Gly Gly Gly Asp Asn Gly Ser Thr 740 745 750 Glv Pro Gln Thr Ala Asp Phe Gly Trs iu Phe He Lys Asn Gly Asp 755 760 * 765 Phe He Ser Pro Arg Asp Leu He Ala Gly Lys Val Arg Phe Asp Arg 770 775 780 Thr Gly Asn He Thr Gly Gly Ser Gly Asn Phe Ala Asn Leu Asn Ser 785 790 795 800
Thr He Glu Ser Leu Lys Thr Asp He Met Ser Ser Tyr Pro He Gly 805 * 810 815
Ala Pro He Pro Trp Pro Ser Asp Ser Val Pro Ala Gly Phe Ala Leu 820 825 830 Met Glu Gly Gln Thr Phe Asp Lys Ser Ala Tyr Pro Lys Leu Ala Val 335 840 845 Ala Tvr Pro Ser Gly Val He Pro Aso Met Arg Gly Gin Thr He Lys 850 855 ' 860 Gly Lye ?ro Ser Gly Arg Ala Val Leu Ser Ala Glu Ala Asp Gly Val 865 870 875 880
Lys Ala :~'is Ser His Ser Ala Ser Ala Ser Ser Thr Aep Leu Gly Thr 885 890 895
Lvs Thr Thr Ser Ser Phe Asp Tyr Glv Thr Lys Glv Thr Asr. Ser Thr 900 905 * 910 Glv Gly His Thr His Ser Gly Ser Glv Ser Thr Ser Thr Asn Glv Glu 15 920 * 925 His Ser His Tyr He Glu Ala Trp Asn Gly Thr Gly Val Gly Gly Aen 930 935 940 Lye Met ::.er Ser Tyr Ala He Ser Tyr Arg Ala Gly Gly Ser Asn Thr 945 950 " 955 960
Asn Ala 7.1a Giy Asn His Ser His Thr Phe Sor Pho Glv Thr Ser Soe 965 970 " 975
Ala Gly nep Hie Ser His Ser Val Glv He Gly Ala His Thr His Thr 980 985 990 Val Ala He Gly Ser His Gly His Thr He Thr Val Asn Ser Thr Gly 995 1000 1005 Asn Thr Glu Asn Thr Val Lys Aen He Ala Phe A.~". Tyr He Val ?rg 1010 1015 1020 Lou Air. 3025
Claims (53)
1. Un polipéptido aislado que consiste esencialmente de la proteina de fibra de cola gp37 del bacteriófago T4 que carece de los aminoácidos 99-496 (SEQ ID NO: 6) cuando se enumera el terminal de amino, en donde el polipéptido tiene la capacidad de formar dimeros e interaccionar con el oligómero de la proteina P36 del bacteriófago T4.
2. Un polipéptido aislado que consiste esencialmente de una proteina de fusión entre las proteínas gp36 y gp37 del bacteriófago T4, en donde los residuos de aminoácido 1-242 de gp37 (SEQ ID NO: 6) se funden en un cuadro de lectura apropiado a los residuos de aminoácido 118-221 de gp36 (SEQ ID NO: 5).
3. El polipéptido de conformidad con la reivindicación 2, en donde una pluralidad de terminales de carboxi del polipéptido tiene la capacidad de interaccionar en el terminal de amino del oligómero de proteina P37 del bacteriófago T4 y para formar un oligómero fijado y los terminales de amina del oligómero del polipéptido tienen la capacidad de interaccionar con los terminales de carboxi de los polipéptidos gp36 del bacteriófago T .
4. Un oligómero de polipéptido aislado que consiste esencialmente de dos polipéptidos gp37 del bacteriófago T4, en donde los terminales de amino del oligómero carecen de la capacidad para interaccionar con los terminales de carboxi de los polipéptidos gp36 del bacteriófago T4.
5. Un oligómero de polipéptido aislado que consiste esencialmente de la proteina P37 del bacteriófago T4, en donde los terminales de amino del oligómero carecen de la capacidad de interaccionar con los terminales de carboxi o los polipéptidos gp36 del bacteriófago T4.
6. Un polipéptido aislado que consiste esencialmente de una variante de la proteina gp36 del bacteriófago T4, en donde el polipéptido carece de la capacidad de interaccionar con los terminales de amino del oligómero de proteina P37 de bacteriófago T4.
7. Un polipéptido aislado que consiste esencialmente de una proteina de fusión entre las proteínas gp36 y gp34 del bacteriófago T4, en donde los residuos de aminoácido 1-73 de gp36 (SEQ ID NO: 5) se funden en un cuadro de lectura apropiado del terminal de amino a Los residuos de aminoácido 866-1289 de gp34 (SEQ ID NO: 2) .
8. Un oligómero del polipéptido de conformidad con la reivindicación 7, en donde los terminales de amino del dime.ro tienen la capacidad de interaccionar con la proteina gp35 del bacteriófago T4.
9. Un polipéptido aislado que consiste esencialmente de una variante de la proteina gp35 del bacteriófago T4, en donde el polipéptido forma un ángulo de menos de aproximadamente 125° cuando se combina con los oligómeros de proteina P34 y P36-P37 del bacteriófago T4, bajo condiciones en donde la proteina gp35 de tipo silvestre forma un ángulo de 137° cuando se combina con los oligómeros.
10. Un polipéptido aislado que consiste esencialmente de una variante de la proteina gp35 del bacteriófago T4, en donde el polipéptido forma un ángulo de más de aproximadamente 145° cuando se combina con los oligómetos de proteina P34 y P36-P37 del bacteriófago T4, bajo condiciones en donde la proteina gp35 de tipo silvestre forma un ángulo de 137° cuando se combina con los oligómeros.
11. Un polipéptido aislado que consiste esencialmente de una variante de la proteina gp35 del bacteriófago T4, en donde la interacción del polipéptido con el oligómero de la proteina P34 del bacteriófago T4 es inestable a temperaturas de entre aproximadamente 40°C y aproximadamente 60°C.
12. Un oligómero de polipéptido aislado que consiste esencialmente de una variante de la proteina P37 del bacteriófago T4, en donde la interacción del oligómero con el oligómero de proteina P36 del bacteriófago T4 es inestable a temperaturas de entre aproximadamente 40°C y aproximadamente 60°C.
13. Un oligómero de polipéptido aislado que consiste esencialmente de una variante de la proteina P37 del bacteriófago T4, en donde el dominio del terminal de carboxi del oligómero se modifica a fin de conferir la capacidad de todo el polipéptido para ligarse específicamente a un grupo coordinador inmovilizado.
14. El polipéptido de conformidad con la reivindicación 13, en donde el grupo coordinador se selecciona del grupo que consiste de biotina, inmunoglobulina o iones de metal divalentes.
15. Una nanoestructura que comprende una pluralidad de proteínas de fusión, las proteínas de fusión comprende:! una primera porción que consiste de por lo menos los primeros 10 aminoácidos del terminal N de una proteina de fibra de cola fundida a través de una ligazón de péptido a una segunda porción que consiste de por lo menos los últimos LO aminoácidos del terminal C de una segunda proteina de fibra de cola, en donde las proteínas de fibra de cola se seleccionan en el grupo que consiste de proteínas gp34, gp35, gp36 y gp37 de un bacteriófago aun semejante a T, en donde la primera y segunda proteina de fibra de cola son iguales o diferentes.
16. La nanoestructura de conformidad con la reivindicación 15, en donde la primera y segunda proteínas de fibra de cola son diferentes.
17. La nanoestructura de conformidad con la reivindicación 15, que además comprende una molécula que puede auto-ensamblarse en un dímero o trímero, fundida a por lo menos de una porción de 10 aminoácidos de una proteina de fibra de cola semejante aun a T.
18. La nanoestructura de conformidad con la reivindicación 17, en donde la molécula tiene la estructura de un ziper de leucina.
19. La nanoestructura de conformidad con la reivindicación 15, en donde la nanoestructura comprende un bastón lineal unidimensional.
20. La nanoestructura de conformidad con la reivindcación 15, en donde la nanoestructura comprende un polígono.
21. La nanoestructura de conformidad con la reivindicación 15, en donde la nanoestructura comprende una jaula o sólido tridimensional.
22. La nanoestructura de conformidad con la reivindicación 15, en donde la nanoestructura comprende una hoja bidiraensional abierta o cerrada.
23. Una proteína de fusión aislada que consiste esencialmente de una porción de una proteína gp37 o un bacteriófago semejante aun a T que consiste de por lo menos los primeros 10 a 60 aminoácidos del terminal N de la proteína gp37 fundidos a una segunda porción de la proteína gp36 de un bacteriófago aun semejante a T, que consiste de por lo menos los últimos 10 a 60 aminoácidos del terminal C de la proteína gp36.
24. Una proteína de fusión aislada que consiste esencialmente de una porción de una proteína gp37 de un bacteriófago aun semejante a T, que consiste de por lo menos los primeros 10 aminoácidos del terminal N de la proteína gp37 fundidos a una segunda porción de la proteina gp36 de un bacteriófago aun semejante a T, que consiste de por lo menos los últimos 10 aminoácidos del terminal C de la proteína gp 36.
25. Una proteína de fusión aislada que consiste esencialmente de una porción de una proteína gp37 de un bacteriófago aun semejante a T, que consiste de por lo menos los primeros 20 aminoácidos del terminal N de la proteína gp37 fundidos a una segunda porción de una proteína gp36 de un bacteriófago aun semejante a T, que consiste de por lo menos los últimos 20 aminoácidos del terminal Z de la proteína gp36.
26. Una proteína de fusión aislada que consiste esencialmente de una porción de una proteína gp36 de un bacteriógafo aun semejante a T, que consiste de por lo menos los primeros 10 a 60 aminoácidos del terminal N de la proteína gp36 fundidos a una segunda porción de una proteína gp34 de un bacteriófago aun semejante a T, que consiste de por lo menos los últimos 10 a 60 aminoácidos del terminal C de la proteína gp34.
27. Una proteína aislada que comprende por lo menos 20 aminoácidos contiguos de la proteína gp37, gp36 o gp34 de un bacteriófago aún semejante a T y que carece de por lo menos 5 aminoácidos del terminal de amino o carboxi de la proteína.
28. Un ADN aislado que codifica el polipéptido de la reivindicación 1.
29. Un ADN aislado que codifica el polipéptido de la reivindicación 2.
30. Un ADN aislado que codifica el polipéptido de la reivindicación 4.
31. Un ADN aislado que codifica el polipéptido de la reivindicación 5.
32. Un ADN aislado que codifica el polipéptido de la reivindicación 6.
33. Un ADN aislado que codifica el polipéptido de la reivindicación 7.
34. Un ADN aislado que codifica el polipéptido de la reivindicación 9.
35. Un ADN aislado que codifica el polipéptido de la reivindicación 10.
36. Un ADN aislado que codifica el polipéptido de la reivindicación 11.
37. Un ADN aislado que codifica el polipéptido de la rei indicación 12.
38. Un ADN aislado que codifica el polipéptido de la reivindicación 13.
39. Un ADN aislado que codifica la proteína de la reivindicación 23.
40. Un ADN aislado que codifica la proteína de la reivindicación 25.
41. Un ADN aislado que codifica la proteína de la reivindicación 26.
42. Un ADN aislado que codifica la proteína de la reivindicación 27.
43. Un método para producir una nanoestructura poligonal que comprende poner en contacto la proteína de la reivindicación 26 con las proteínas gp35 purificadas de un bacteriófago aun semejante a T.
44. Un método para producir una nanoestructura que comprende poner en contacto una pluralidad de las proteínas de reivindicación 23 una con la otra.
45. Un estuche que comprende en uno o más envases, la proteína de fusión de la reivindicación 23.
46. Un estuche que comprende en uno o más envases, la proteína de fusión de la reivindicación 25.
47. Un estuche que comprende en uno o más envases, la proteína de fusión de la reivindicación 26.
48. Un estuche que comprende en uno o más envases, la proteína de fusión de la reivindicación 26 y una proteína gp35 aislada de un bacteriófago aun semejante a T.
49. La proteína de conformidad con la reivindicación 23, en donde el bacteriófago semejante aun a T es T4.
50. La proteína de conformidad con la reivindicación 26, en donde el bacteriófago semejante aun a T es T4.
51. Un polipéptido aislado que consiste esencialmente de una variante de la proteína gp36 del bacteriófago T4, en donde la interacción del polipéptido con el oLigómero de proteína P37 del bacteriófago T4 es inestable a temperaturas de entre aproximadamente 40°C y aproximadamente 60°C.
52. Un polipéptido aislado que consiste esencialmente de una variante de la proteína gp36 del bacteriófago T4, en donde la interacción del polipéptido con la proteína gp35 del bacteriófago T4 es inestable a temperaturas de entre aproximadamente 40°C y aproximadamente 60°C.
53. Un polipéptido aislado que consiste esencialmente de una variante de la proteína gp34 del bacteriófago T4, en donde la interacción del polipéptido con la proteína gp35 del bacteriófago T4 es inestable a temperaturas de entre aproximadamente 40°C y aproximadamente 60°C.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08322760 | 1994-10-13 | ||
US08/322,760 US5877279A (en) | 1994-10-13 | 1994-10-13 | Materials for the production of nanometer structures and use thereof |
PCT/US1995/013023 WO1996011947A1 (en) | 1994-10-13 | 1995-10-13 | Materials for the production of nanometer structures and use thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
MXPA97002657A true MXPA97002657A (es) | 1997-06-01 |
MX9702657A MX9702657A (es) | 1997-06-28 |
Family
ID=23256290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MX9702657A MX9702657A (es) | 1994-10-13 | 1995-10-13 | Materiales para la produccion de estructuras nanometricas y uso de las mismas. |
Country Status (17)
Country | Link |
---|---|
US (4) | US5877279A (es) |
EP (1) | EP0785946B1 (es) |
JP (1) | JPH10508194A (es) |
KR (2) | KR100555998B1 (es) |
CN (1) | CN1113068C (es) |
AT (1) | ATE286068T1 (es) |
AU (1) | AU689662B2 (es) |
BR (1) | BR9509487A (es) |
CA (1) | CA2202474A1 (es) |
DE (1) | DE69533894T2 (es) |
ES (1) | ES2236715T3 (es) |
HU (1) | HUT77683A (es) |
IL (1) | IL115632A0 (es) |
MX (1) | MX9702657A (es) |
NZ (1) | NZ295046A (es) |
RU (1) | RU2162856C2 (es) |
WO (1) | WO1996011947A1 (es) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030198956A1 (en) * | 2002-02-21 | 2003-10-23 | Lee Makowski | Staged assembly of nanostructures |
US5877279A (en) * | 1994-10-13 | 1999-03-02 | Nanoframes, Llc | Materials for the production of nanometer structures and use thereof |
US20040018587A1 (en) * | 1994-10-13 | 2004-01-29 | Lee Makowski | Nanostructures containing antibody assembly units |
US20040039168A1 (en) * | 1994-10-13 | 2004-02-26 | Goldberg Edward B. | Method for manufacture of nanostructures using staged-assembly |
JP3673617B2 (ja) * | 1997-06-26 | 2005-07-20 | キヤノン株式会社 | インクジェット記録装置およびインクジェット記録方法 |
CN1075842C (zh) * | 1998-07-31 | 2001-12-05 | 中国科学院感光化学研究所 | 在单分子膜上形成小于10纳米金属原子簇或金属原子二维有序点阵的方法 |
US6756039B1 (en) * | 1999-05-10 | 2004-06-29 | The Regents Of The University Of California | Self assembling proteins |
WO2000077196A1 (en) * | 1999-06-11 | 2000-12-21 | The Trustees Of Tufts College | Gene and protein sequences of phage t4 gene 35 |
GB9922013D0 (en) * | 1999-09-17 | 1999-11-17 | Univ Sussex | Peptides |
AU2001227837A1 (en) * | 2000-01-12 | 2001-07-24 | Light Sciences Corporation | Novel treatment for eye disease |
DE50109723D1 (de) * | 2001-02-01 | 2006-06-08 | Profos Ag | Nachweis und identifikation von bakteriengruppen |
DK2055267T3 (da) * | 2001-05-01 | 2013-07-01 | Amedica Corp | Strålegennemtrængeligt knogletransplantat |
US20050164515A9 (en) * | 2001-06-05 | 2005-07-28 | Belcher Angela M. | Biological control of nanoparticle nucleation, shape and crystal phase |
US20030148380A1 (en) * | 2001-06-05 | 2003-08-07 | Belcher Angela M. | Molecular recognition of materials |
US20030113714A1 (en) * | 2001-09-28 | 2003-06-19 | Belcher Angela M. | Biological control of nanoparticles |
ATE356102T1 (de) * | 2001-07-02 | 2007-03-15 | Exxonmobil Chem Patents Inc | Inhibierung der katalysatorverkokung bei der herstellung eines olefins |
CN100386627C (zh) * | 2001-07-03 | 2008-05-07 | 包刚 | 过滤型蛋白芯片 |
CN100343671C (zh) * | 2002-06-24 | 2007-10-17 | 普罗福斯股份公司 | 检测和去除内毒素的方法 |
DE602004008582T2 (de) * | 2003-02-17 | 2008-05-21 | Peter Burkhard | Peptidische nanoteilchen als arzneimittelabgabe- und antigen-display-systeme |
KR20060109904A (ko) | 2003-10-15 | 2006-10-23 | 보드 오브 리전츠, 더 유니버시티 오브 텍사스 시스템 | 전자 공학적, 광학적, 자기적, 반도체 및 생물 공학적용도의 지지체로서의 다기능성 생체 재료 |
US20080093219A1 (en) * | 2005-03-15 | 2008-04-24 | Tufts University | Magnetic Protein Nanosensors and Methods of Use |
US8584841B1 (en) * | 2012-11-05 | 2013-11-19 | Gregory D. Tiegs | Container |
CO7090253A1 (es) * | 2014-10-10 | 2014-10-21 | Univ Del Valle | Bacteriofago artificial basado en nanoestructuras de carbono para el suministro de medicamentos |
EA038595B1 (ru) | 2014-12-16 | 2021-09-21 | Си3Джей ТЕРАПЬЮТИКС, ИНК. | Композиции и способы для конструирования вирусного генома in vitro |
RU2633508C1 (ru) * | 2016-12-27 | 2017-10-12 | Федеральное государственное учреждение "Федеральный исследовательский центр "Фундаментальные основы биотехнологии" Российской академии наук (ФИЦ Биотехнологии РАН) | Штамм E. coli - продуцент изолированного домена 1 протективного антигена Bacillus anthracis в форме вирусоподобных частиц |
RU2633504C1 (ru) * | 2016-12-27 | 2017-10-12 | Федеральное государственное учреждение "Федеральный исследовательский центр "Фундаментальные основы биотехнологии" Российской академии наук (ФИЦ Биотехнологии РАН) | Штамм E.coli - продуцент полноразмерного протективного антигена Bacillus anthracis в форме вирусоподобных частиц |
WO2024030432A1 (en) | 2022-08-01 | 2024-02-08 | Gensaic, Inc. | Therapeutic phage-derived particles |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3532593A (en) * | 1966-02-01 | 1970-10-06 | Swift & Co | Process of improving collagen by removing fat therefrom |
US5837242A (en) * | 1992-12-04 | 1998-11-17 | Medical Research Council | Multivalent and multispecific binding proteins, their manufacture and use |
US5561043A (en) * | 1994-01-31 | 1996-10-01 | Trustees Of Boston University | Self-assembling multimeric nucleic acid constructs |
US5877279A (en) | 1994-10-13 | 1999-03-02 | Nanoframes, Llc | Materials for the production of nanometer structures and use thereof |
-
1994
- 1994-10-13 US US08/322,760 patent/US5877279A/en not_active Expired - Fee Related
-
1995
- 1995-10-12 US US08/542,003 patent/US5864013A/en not_active Expired - Fee Related
- 1995-10-13 CA CA002202474A patent/CA2202474A1/en not_active Abandoned
- 1995-10-13 IL IL11563295A patent/IL115632A0/xx unknown
- 1995-10-13 HU HU9800746A patent/HUT77683A/hu unknown
- 1995-10-13 CN CN95196597A patent/CN1113068C/zh not_active Expired - Fee Related
- 1995-10-13 KR KR1020037014057A patent/KR100555998B1/ko not_active IP Right Cessation
- 1995-10-13 NZ NZ295046A patent/NZ295046A/en unknown
- 1995-10-13 ES ES95936297T patent/ES2236715T3/es not_active Expired - Lifetime
- 1995-10-13 JP JP8513358A patent/JPH10508194A/ja not_active Ceased
- 1995-10-13 AT AT95936297T patent/ATE286068T1/de not_active IP Right Cessation
- 1995-10-13 RU RU97107477/13A patent/RU2162856C2/ru active
- 1995-10-13 EP EP95936297A patent/EP0785946B1/en not_active Expired - Lifetime
- 1995-10-13 KR KR1019970702422A patent/KR100425966B1/ko not_active IP Right Cessation
- 1995-10-13 WO PCT/US1995/013023 patent/WO1996011947A1/en active IP Right Grant
- 1995-10-13 MX MX9702657A patent/MX9702657A/es unknown
- 1995-10-13 DE DE69533894T patent/DE69533894T2/de not_active Expired - Fee Related
- 1995-10-13 AU AU38296/95A patent/AU689662B2/en not_active Ceased
- 1995-10-13 BR BR9509487A patent/BR9509487A/pt not_active Application Discontinuation
-
1999
- 1999-01-25 US US09/236,949 patent/US6437112B1/en not_active Expired - Fee Related
-
2002
- 2002-04-29 US US10/136,225 patent/US20030236390A1/en not_active Abandoned
Similar Documents
Publication | Publication Date | Title |
---|---|---|
MXPA97002657A (es) | Materiales para la produccion de estructuras nanometricas y uso de las mismas | |
KR100555998B1 (ko) | 나노구조 및 이의 생산 방법 | |
WO1996011947A9 (en) | Materials for the production of nanometer structures and use thereof | |
Karlin et al. | Substitution of two residues in the measles virus nucleoprotein results in an impaired self-association | |
AU630643B2 (en) | Functional recombinantly prepared synthetic protein polymer | |
JP2009148252A (ja) | 標的結合性ポリペプチド | |
Miroshnikov et al. | Engineering trimeric fibrous proteins based on bacteriophage T4 adhesins. | |
EP2764018B1 (en) | Self-assembling polypeptide polyhedra | |
WO2006104700A1 (en) | Magnetic protein nanosensors and methods of use | |
CN114480441B (zh) | 一段核苷酸序列及其表达重组蛋白纳米颗粒在犬瘟热病毒疫苗的应用 | |
JPH11512288A (ja) | 結合されたリガンドと受容体ディスプレイ | |
CN107058363B (zh) | 基于淀粉样蛋白实现小分子肽类高效分泌表达的方法及其应用 | |
Wang et al. | Cloning of the J gene of bacteriophage lambda, expression and solubilization of the J protein: first in vitro studies on the interactions between J and LamB, its cell surface receptor | |
Mesyanzhinov | Bacteriophage T4: structure, assembly, and initiation infection studied in three dimensions | |
JPH10508479A (ja) | 天然疎水性ペプチドアナログとしての組換えペプチドの産生 | |
US20040039168A1 (en) | Method for manufacture of nanostructures using staged-assembly | |
EP2154251B1 (en) | Expression system of recombinant proteins with enhanced yield and immunogenicity | |
WO2000077196A1 (en) | Gene and protein sequences of phage t4 gene 35 | |
CN116789847B (zh) | 融合蛋白、病毒样颗粒以及疫苗 | |
Chuprov-Netochin et al. | The β-helical domain of bacteriophage T4 controls the folding of the fragment of long tail fibers in a chimeric protein | |
Carbonell et al. | Insertional mutagenesis in the tailspike protein of bacteriophage P22 | |
US20220282264A1 (en) | Endotoxin-free Production of Recombinant Subunit Vaccine Components | |
RU1816797C (ru) | Рекомбинантна плазмидна ДНК рР1, определ юща синтез гибридного белка, обладающего антигенными свойствами вируса иммунодефицита человека 1, способ ее конструировани и штамм бактерий ЕSснеRIснIа coLI - продуцент гибридного белка, обладающего антигенными свойствами вируса иммунодефицита человека 1 | |
JPS63196292A (ja) | L−フエニルアラニン・アンモニアリア−ゼ発現用組換え体プラスミド及び該プラスミドを有する形質転換株 | |
Harrah | Engineered bacteriophage T4 tail fiber proteins for nanotechnology |