PL232192B1 - Syntetyczna biblioteka białek opartych na sekwencji zmiennych receptorów limfocytów minoga morskiego oraz białko wiążące marker nowotworowy S100A7 - Google Patents
Syntetyczna biblioteka białek opartych na sekwencji zmiennych receptorów limfocytów minoga morskiego oraz białko wiążące marker nowotworowy S100A7Info
- Publication number
- PL232192B1 PL232192B1 PL408210A PL40821014A PL232192B1 PL 232192 B1 PL232192 B1 PL 232192B1 PL 408210 A PL408210 A PL 408210A PL 40821014 A PL40821014 A PL 40821014A PL 232192 B1 PL232192 B1 PL 232192B1
- Authority
- PL
- Poland
- Prior art keywords
- sequence
- protein
- vlr
- amino acid
- asn
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 96
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 95
- 102000005871 S100 Calcium Binding Protein A7 Human genes 0.000 title claims abstract description 29
- 108010005256 S100 Calcium Binding Protein A7 Proteins 0.000 title claims abstract description 29
- 210000004698 lymphocyte Anatomy 0.000 title claims abstract description 20
- 241000251745 Petromyzon marinus Species 0.000 title claims abstract description 14
- 230000027455 binding Effects 0.000 title claims abstract description 12
- 239000003550 marker Substances 0.000 title 1
- 230000001613 neoplastic effect Effects 0.000 title 1
- 239000000439 tumor marker Substances 0.000 claims abstract description 8
- 238000001042 affinity chromatography Methods 0.000 claims abstract description 4
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 27
- 238000002405 diagnostic procedure Methods 0.000 claims description 2
- 150000001413 amino acids Chemical group 0.000 abstract description 24
- 235000018102 proteins Nutrition 0.000 description 82
- 235000001014 amino acid Nutrition 0.000 description 33
- 239000000427 antigen Substances 0.000 description 24
- 102000036639 antigens Human genes 0.000 description 24
- 108091007433 antigens Proteins 0.000 description 24
- 102000005962 receptors Human genes 0.000 description 15
- 108020003175 receptors Proteins 0.000 description 15
- 210000004901 leucine-rich repeat Anatomy 0.000 description 12
- 238000000034 method Methods 0.000 description 11
- 108090000765 processed proteins & peptides Proteins 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 10
- 229920001184 polypeptide Polymers 0.000 description 9
- 102000004196 processed proteins & peptides Human genes 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 7
- 241001465754 Metazoa Species 0.000 description 7
- 229960005091 chloramphenicol Drugs 0.000 description 7
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 7
- 239000008103 glucose Substances 0.000 description 7
- 238000012261 overproduction Methods 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 239000003446 ligand Substances 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 108091035707 Consensus sequence Proteins 0.000 description 4
- 101001038321 Homo sapiens Leucine-rich repeat protein 1 Proteins 0.000 description 4
- 101710148893 Internalin B Proteins 0.000 description 4
- 102100040249 Leucine-rich repeat protein 1 Human genes 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 4
- 230000003053 immunization Effects 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 206010006187 Breast cancer Diseases 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 102000005720 Glutathione transferase Human genes 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- 241000235789 Hyperoartia Species 0.000 description 3
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 3
- 229920002873 Polyethylenimine Polymers 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 238000002649 immunization Methods 0.000 description 3
- 229930027917 kanamycin Natural products 0.000 description 3
- 229960000318 kanamycin Drugs 0.000 description 3
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 3
- 229930182823 kanamycin A Natural products 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 206010005003 Bladder cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 241001273590 Cyclostomata Species 0.000 description 2
- 108010024636 Glutathione Proteins 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 208000037396 Intraductal Noninfiltrating Carcinoma Diseases 0.000 description 2
- 206010073094 Intraductal proliferative breast lesion Diseases 0.000 description 2
- 201000004681 Psoriasis Diseases 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000006287 biotinylation Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 208000028715 ductal breast carcinoma in situ Diseases 0.000 description 2
- 201000007273 ductal carcinoma in situ Diseases 0.000 description 2
- 210000003743 erythrocyte Anatomy 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 201000006585 gastric adenocarcinoma Diseases 0.000 description 2
- 229960003180 glutathione Drugs 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 108010028295 histidylhistidine Proteins 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 235000005772 leucine Nutrition 0.000 description 2
- 238000002898 library design Methods 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 1
- 206010001197 Adenocarcinoma of the cervix Diseases 0.000 description 1
- 208000034246 Adenocarcinoma of the cervix uteri Diseases 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 101100455506 Arabidopsis thaliana LRR2 gene Proteins 0.000 description 1
- 101100519158 Arabidopsis thaliana PCR2 gene Proteins 0.000 description 1
- 206010004992 Bladder adenocarcinoma stage unspecified Diseases 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 102000004889 Interleukin-6 Human genes 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical group OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical group NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical group OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- DINOPBPYOCMGGD-VEDJBHDQSA-N Man(a1-2)Man(a1-2)Man(a1-3)[Man(a1-2)Man(a1-3)[Man(a1-2)Man(a1-6)]Man(a1-6)]Man(b1-4)GlcNAc(b1-4)GlcNAc Chemical compound O[C@@H]1[C@@H](NC(=O)C)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O[C@H]2[C@H]([C@@H](O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO[C@@H]3[C@H]([C@@H](O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)O3)O)O2)O)[C@@H](CO)O1 DINOPBPYOCMGGD-VEDJBHDQSA-N 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 101150102573 PCR1 gene Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100032446 Protein S100-A7 Human genes 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 101150007311 S100A7 gene Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 230000033115 angiogenesis Effects 0.000 description 1
- 230000009831 antigen interaction Effects 0.000 description 1
- 230000007503 antigenic stimulation Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 108091006004 biotinylated proteins Proteins 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 1
- 201000006587 bladder adenocarcinoma Diseases 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 201000008274 breast adenocarcinoma Diseases 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 201000006662 cervical adenocarcinoma Diseases 0.000 description 1
- 235000013351 cheese Nutrition 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000000978 circular dichroism spectroscopy Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 150000001945 cysteines Chemical class 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000007783 downstream signaling Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 235000014304 histidine Nutrition 0.000 description 1
- 150000002411 histidines Chemical class 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 229940100601 interleukin-6 Drugs 0.000 description 1
- 210000002510 keratinocyte Anatomy 0.000 description 1
- 150000002614 leucines Chemical class 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 201000005249 lung adenocarcinoma Diseases 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 238000002824 mRNA display Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 108700010839 phage proteins Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000002818 protein evolution Methods 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 229940030793 psoriasin Drugs 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 238000002702 ribosome display Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 201000010106 skin squamous cell carcinoma Diseases 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- IBKZNJXGCYVTBZ-IDBHZBAZSA-M sodium;1-[3-[2-[5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]ethyldisulfanyl]propanoyloxy]-2,5-dioxopyrrolidine-3-sulfonate Chemical compound [Na+].O=C1C(S(=O)(=O)[O-])CC(=O)N1OC(=O)CCSSCCNC(=O)CCCC[C@H]1[C@H]2NC(=O)N[C@H]2CS1 IBKZNJXGCYVTBZ-IDBHZBAZSA-M 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 150000004043 trisaccharides Chemical class 0.000 description 1
- 230000005748 tumor development Effects 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/461—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from fish
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Biochemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Toxicology (AREA)
- Peptides Or Proteins (AREA)
Description
Przedmiotem wynalazku jest syntetyczna biblioteka białek opartych na sekwencji zmiennych receptorów limfocytów minoga morskiego oraz białko wiążące marker nowotworowy S100A7 znajdujące zastosowanie jako składnik testów diagnostycznych, w szczególności przy diagnostyce nowotworów, oraz w immunochemii, w szczególności jako koniugat ze związkiem chemiluminescencyjnym.
Białka o wysokiej sile i specyficzności wiązania znajdują bardzo liczne zastosowania w biotechnologii i medycynie, zarówno jako środki terapeutyczne, jak i podstawowe składniki molekularnych narzędzi diagnostycznych. Wśród nich najczęściej wykorzystywane są przeciwciała lub ich fragmenty. Immunoglobuliny to duże białka (ok. 150 kDa) składające się z łańcuchów lekkich i ciężkich, które są ze sobą połączone mostkami disiarczkowymi. Poza oczywistymi zaletami przeciwciał, molekuły te nie są pozbawione wad, które ograniczają ich wykorzystanie. Ich stosunkowo duże rozmiary stanowią ograniczenie w penetracji tkanek, a skomplikowana struktura trzecio i czwartorzędowa oraz glikozylacja łańcuchów ciężkich wymagają zastosowania do ich produkcji kosztownych eukariotycznych systemów ekspresyjnych. W związku z tym trwają poszukiwania białek o podobnych do immunoglobulin właściwościach, jednak o mniej skomplikowanej budowie. Dotychczas ponad 50 cząsteczek zostało zaproponowanych jako białka alternatywne dla przeciwciał. Większość z tych białek opracowano na podstawie polipeptydów biorących naturalnie udział w różnego typu oddziaływaniach typu białko-ligand. Tego typu molekuły, specyficznie wiążące antygen, są generowane w wyniku selekcji z kombinatorycznych bibliotek przy zastosowaniu techniki phage display (prezentacja polipeptydów na powierzchni wirusów bakteryjnych) lub metod pokrewnych, jak mRNA display (prezentacja polipeptydów na mRNA) czy ribosome display (prezentacja polipeptydów na rybosomach). Cechy idealnego kandydata to niewielki rozmiar, umożliwiający wydajną penetrację tkanek, wysoka rozpuszczalność, stabilność termiczna, chemiczna i proteolityczna, jednołańcuchowy format, brak cystein oraz wydajna nadprodukcja w bakteryjnych systemach ekspresyjnych. Podstawą jest otrzymanie wysoce stabilnej cząsteczki, której sekwencja posłużyłaby do projektowania biblioteki. Kolejnym krokiem jest ustalanie miejsc, które tworzą potencjalną powierzchnię oddziaływania z antygenem oraz sposobu randomizacji reszt. Polipeptyd powinien tolerować mutacje w pozycjach zapewniających oddziaływanie z ligandem, zachowując jednocześnie swoją konformację. Wybór tych pozycji nie jest tak oczywisty jak w przypadku przeciwciał, których naturalna zmienność występuje w pętlach CDR. Dla białek stanowiących alternatywę dla przeciwciał miejsca te są zwykle wyznaczane w oparciu o reszty najsłabiej zachowane ewolucyjnie, które często odpowiadają za określone funkcje białka np. wiązanie liganda, a także na podstawie analiz strukturalnych. Ze względu na unikatową naturę każdego z alternatywnych zrębów białkowych niezbędne jest indywidualne podejście do projektowania biblioteki.
Wśród alternatywnych zrębów białkowych można wyróżnić białka zawierające motyw kanapki beta, baryłki beta, helisy alfa, a także białka zawierające wiele powtórzeń pojedynczego motywu. Jednym z nich są powtórzenia bogate w leucynę, oznaczane skrótem LRR (ang. leucine-rich repeats), które to występują w wielu białkach o różnorodnej funkcji, biorąc udział w oddziaływaniach typu białko-białko. Pojedyncze powtórzenie stanowi 20-29 aminokwasowa sekwencja zawierająca 11-aminokwasowy fragment konsensusowy, w skład którego wchodzą 4 leucyny. Jego konformacja to włókno β połączone pętlą z różnorodnymi strukturami helikalnymi, jak np. helisa a czy helisa 310, zależnie od długości powtórzenia. Szereg powtórzeń bogatych w leucynę tworzy zakrzywioną strukturę w kształcie podkowy, której powierzchnię wklęsłą stanowi równoległa kartka β, natomiast powierzchnię wypukłą struktury helikalne. Powierzchnia wklęsła tworzy zwykle miejsce oddziaływania z antygenem. Grupą białek zbudowanych z powtórzeń bogatych w leucynę są zmienne receptory limfocytów, oznaczane skrótem VLR (ang. variable lymphocyte receptor), występujące u kręgowców bezszczękowych, pełniące u tych zwierząt funkcję przeciwciał. U minoga morskiego, jednego z przedstawicieli tej nadgromady, występują trzy typy białek VLR: VLRA, VLRB, VLRC. Tylko VLRB po stymulacji antygenowej są wydzielane przez limfocyty. Powtórzenia bogate w leucynę wchodzące w skład tych białek podzielono na kilka rodzajów: na końcach N i C znajdują się czapeczki, zwane odpowiednio LRRNT oraz LRRCT, pomiędzy nimi znajduje się zmienna liczba modułów LRR. Pierwszy z nich to moduł LRR1, kolejno może wystąpić od 0 do 9 modułów LRRV (ang. variable), następnie jeden moduł LRRVe, a po nim peptyd łączący LRRCP. Co istotne, białka te jako jedyne z opisanych alternatywnych dla przeciwciał struktur, są składnikiem układu odpornościowego i posiadają naturalną zdolność do wiązania antygenów i wysoką tolerancję na mutacje. Zaletą tego typu białek jest fakt, że wielkość powierzchni wiążącej antygen może być dostosowana
PL 232 192 B1 do rozmiaru ligandu, wobec którego jest przeprowadzana selekcja, poprzez modulację liczby powtórzeń motywu LRRV.
Białka VLR mogą stanowić doskonałe rusztowanie do rozpoznawania molekularnego. Ich prawdopodobna immunogenność u ludzi może utrudnić ich wykorzystanie terapeutyczne, jednak mogą one znaleźć zastosowanie w diagnostyce (np. chipy białkowe, cytometria przepływowa, immunochistochemia, testy ELISA), chromatografii powinowactwa bądź do tworzenia nowych białek fuzyjnych.
Jednym z białek będących obiektem zainteresowania naukowców jest polipeptyd S100A7 inaczej nazywany psoriazyną (z ang. psoryasis - łuszczyca). Jego nadekspresję po raz pierwszy zaobserwowano w keratynocytach pacjentów cierpiących na łuszczycę. Psoriazyna może być zlokalizowana w cytoplazmie bądź w jądrze komórkowym, a także wydzielana do przestrzeni zewnątrzkomórkowej. Wzrost zainteresowania psoriazyną spowodowany jest odkryciem interesującego związku między zmianami ekspresji S100A7 a nowotworzeniem. Najbardziej widoczna korelacja ekspresji S100A7 a rozwojem nowotworu występuje w przypadku inwazyjnego hormononiezależnego raka sutka DCIS (ang. Ductal Carcinoma In Situ) oraz inwazyjnego ER-negatywnego raka piersi. W obu przypadkach nadekspresja S100A7 jest związana ze złym rokowaniem oraz zmniejszoną przeżywalnością pacjentów. Zwiększoną nadprodukcję psoriazyny zaobserwowano także w komórkach nabłonkowych raka kolczystokomórkowego skóry, raka pęcherza, głowy oraz szyi, jednak rola tego białka w rozwoju nowotworów nie została wyjaśniona. Jedna z hipotez łączy ekspresję S100A7 ze stymulacją procesu angiogenezy regulowanego przez VEGF. Poza tym S100A7 może regulować fosforylację receptora EGFR oraz cząsteczek sygnałowych niższego szczebla, co może promować rozwój nowotworu oraz jego przerzutowanie. Zastosowanie białek specyficznie rozpoznających S100A7 w diagnostyce nowotworów z pewnością przyczyniłoby się do wykrywania zmian u pacjentów na wcześniejszym etapie rozwoju choroby.
Z publikacji naukowej Antigen recognition by variable lymphocyte receptors, Byung Woo Han i współ., Science 321, 1834, 2008, znana jest struktura krystaliczna kompleksu białka VLR z minoga morskiego z antygenem H trisacharydu z erytrocytów ludzkiej krwi typu 0, przy czym antygen wiąże się od wklęsłej strony modułów LRR tworzących zakrzywioną strukturę w kształcie podkowy. VLR specyficzny wobec erytrocytów ludzkiej krwi typu 0 uzyskano w wyniku immunizacji minogów. Prezentowane podejście ogranicza liczbę możliwych do zastosowania antygenów, ponieważ zdolne do wywołania odpowiedzi immunologicznej są zwykle białka, generalnie stanowiące cząsteczki większe niż 5000 Da, o złożonej budowie, a ponadto wymagane jest uśmiercenie zwierząt.
Z kolei autorzy publikacji naukowej Sugar-Binding Proteins from Fish: Selection of High Affinity Lambodies That Recognize Biomedically Relevant Glycans, Zeev Pancer i współ., ACS Chem. Biol. 2013, 8, 152-160, wyselekcjonowali warianty białka VLR specyficznie wiążące antygeny cukrowe, przy zastosowaniu techniki prezentacji białek na powierzchni komórek drożdżowych. Bibliotekę białek VLR użytą do selekcji wyselekcjonowano poprzez izolację cDNA z limfocytów minoga, które wklonowano do odpowiedniego wektora drożdżowego i przeprowadzono selekcję. Po izolacji klonów wiążących określone antygeny, sekwencje je kodujące wklonowano do wektora pa-GCN4, który koduje sekwencję domeny dimeryzującej zamka leucytowego (leucine zipper dimerization domain), dzięki czemu białko występuje w formie homodimeru. W niniejszej publikacji skupiono się na celach molekularnych: Tn, TFa, LaA, LaX, kwas N-glikolyloneuramidowy, poly-Man 9, HIV gp120, aOSM, aGPA, wykorzystując technikę yeast display, przy czym do konstrukcji biblioteki wykorzystano wyizolowane cDNA minoga morskiego. Prezentowane podejście ogranicza liczbę możliwych do zastosowania antygenów, ponieważ zdolne do wywołania odpowiedzi immunologicznej są zwykle białka, generalnie stanowiące cząsteczki większe niż 5000 Da, o złożonej budowie, a ponadto wymagane jest uśmiercenie zwierząt.
W amerykańskim patencie US8039588 ujawniono polipeptyd VLR, który został wyizolowany i jest częścią odporności adaptacyjnej, a także jest generowany przez rearanżacje somatyczne. Wyszczególnione zostały moduły z jakich jest zbudowany oraz długość łańcucha polipeptydowego. Ponadto antygenem, wobec którego białko jest generowane może być patogen, jakim jest bakteria lub toksyna. Prezentowane rozwiązanie również opiera się na immunizacji zwierząt, co ogranicza wachlarz możliwych do zastosowania antygenów i wymaga uśmiercenia zwierząt.
Przedmiotem zgłoszenia patentowego WO2010065407 jest wektor drożdżowy do ekspresji VLR do zastosowania w technice prezentacji peptydów na powierzchni komórek drożdżowych YSD (ang.
yeast surface display), a także sposób selekcji białek VLR wobec antygenów, na który składa się etap immunizacji minogów antygenem, a następnie izolacja osocza zawierającego białka VLR powstałe w odpowiedzi na pojawianie się antygenu i konstrukcja wektora drożdżowego zawierającego sekwencję kodującą białko VLR. Ponadto do sekwencji kodującej białko VLR mogą być wprowadzane mutacje.
PL 232 192 B1
Podobnie do poprzednich rozwiązań, prezentowane podejście ogranicza liczbę możliwych do zastosowania antygenów, ponieważ zdolne od wywołania odpowiedzi immunologicznej są zwykle białka, stanowiące cząsteczki większe niż 5000 Da o złożonej budowie. Niniejszy sposób immunizacji wymaga uśmiercenia zwierząt.
Z kolei z publikacji naukowej Design of a binding scaffold based on variable lymphocyte receptors of jawless vertebrates by module engineering, Kim i współ., 2011, PNAS, 109, 3299-3304, znany jest zrąb białkowy oparty na strukturze zmiennych receptorów limfocytów (VLR). Zrąb przygotowano poprzez połączenie powtarzających się modułów konsensusowych LRR z czapeczkami na końcach N- i C-. Moduł N-końcowy zaprojektowano na podstawie modułu pochodzącego z internaliny B, analizując podobieństwa obu podjednostek przy zastosowaniu metod obliczeniowych. Przytoczony w publikacji zrąb składał się z LRRNT (na podstawie modułu internaliny B), LRR1 (również na podstawie sekwencji internaliny B), pięciu modułów LRRV (z których pierwszy posiadał sekwencję na podstawie sekwencji modułu LRR2 internaliny B, a kolejne sekwencję konsensusową LRR), LRRVe, CP oraz LRRCT. Nowy zrąb, który nazwano „Repebody”, wykazał wysoki poziom ekspresji w formie rozpuszczalnej w bakteriach, był stabilny zarówno termodynamicznie, jak i w różnych warunkach pH. Autorzy poprzez racjonalne podejście zaprojektowali Repobody specyficzne wobec lizozymu oraz białka 2 różnicowania białaczki (MD2) oraz określili ich strukturę krystaliczną. Ponadto przygotowano bibliotekę Repebody prezentowaną na powierzchni fagów w fuzji z pili. Do randomizacji typu NNK wybrane zostały po 3 pozycje w modułach LRRV1 oraz LRRV2. Po przeprowadzeniu 4 rund selekcji wyizolowano klony specyficzne wobec interleukiny 6. Jednak, autorzy publikacji randomizowali dane pozycji do wszystkich naturalnie występujących aminokwasów, wśród których jest także cysteina, która może tworzyć mostki disiarczkowe oraz prolina, występująca w szczególności w zagięciach helis, mogące (obie) zaburzać strukturę białka.
Z publikacji naukowej Design and characteristics of a stable protein scaffold for specific binding based on variable lymphocyte receptor sequences, Wezner-Ptasińska M. i współ., 2011, Biochimica at Biophysica Acta, 1814, 1140-1145 znany jest zrąb białkowy oparty na strukturze zmiennych receptorów limfocytów (VLR) minoga morskiego. Autorzy zaprojektowali modelowe białko o sekwencji konsensusowej (Sekwencja 1) w oparciu o dostępne sekwencje VLRB w bazie UNiPROT, które nazwano dVLR, następnie przygotowali jego konstrukt genetyczny oraz nadprodukowali i oczyścili białko. Kolejno zmierzono właściwości fizyko-chemiczne dVLR przy użyciu technik dichroizmu kołowego oraz spektroskopii fluorescencyjnej. Białko o zaprojektowanej sekwencji było nadprodukowane w formie rozpuszczalnej oraz posiadało szereg pożądanych cech. Było monomerem w całym zmierzonym zakresie stężeń (0,1-300 μΜ) oraz zachowywało strukturę drugorzędową w zakresie pH 3,0-11,0, ponadto było bardzo stabilne, zarówno termicznie (Tm = 73,9°C w pH = 6,0) jak i chemicznie (kooperatywne przejście według modelu dwóch stanów z punktem przejścia wynoszącym 3,3 M GdmCl oraz wysoką zmianą entalpii swobodnej denaturacji wynoszącą 14,1 kcal/mol).
Problemem technicznym stawianym przed niniejszym wynalazkiem jest zaproponowanie takiej biblioteki białek VLR, która zostałaby opracowana syntetycznie, bez konieczności zabijania zwierząt, dzięki której możliwe byłoby otrzymanie wariantów specyficznie rozpoznających dowolne antygeny, natomiast białka wchodzące w skład biblioteki będą posiadały jednakową strukturę i wielkość oraz większą stabilność termiczną i chemiczną, przy czym będą monomerami, a praca z tymi białkami będzie mniej skomplikowana. Ponadto celem niniejszego wynalazku jest zapewnienie sekwencji aminokwasowej białka VLR wyselekcjonowanej wobec markera nowotworowego S100A7. Nieoczekiwanie wspomniane problemy techniczne i cele rozwiązał prezentowany wynalazek.
Pierwszym przedmiotem wynalazku jest białko oparte na sekwencji zmiennych receptorów limfocytów minoga morskiego (VLR), charakteryzujące się tym, że sekwencja matrycowa białka stanowi Sekwencja 2, przy czym X oznacza pozycje randomizowane, przy czym aminokwas w pozycji 33 wybrano spośród grupy obejmującej: Val, Asn, ile, Arg, aminokwas na pozycji 37 wybrano spośród grupy obejmującej: Tyr, His, Asn, Ser, aminokwas na pozycji 38 wybrano spośród grupy obejmującej: Asn, Asp, Ser, Val, Thr, aminokwas na pozycji 57 wybrano spośród grupy obejmującej: Glu, Lys, Tyr, Arg, Gln, Thr, aminokwas na pozycji 59 wybrano spośród grupy obejmującej: Tyr, Asn, Trp, Asp, His, Gly, aminokwas na pozycji 61 wybrano spośród grupy obejmującej: Asn, Gly, Ser, Tyr, His, Ala, aminokwas na pozycji 62 wybrano spośród grupy obejmującej: Gly, Asn, Ser, Gln, Asp, Val, aminokwas na pozycji 81 wybrano spośród grupy obejmującej: His, Arg, Gln, Tyr, Lys, aminokwas na pozycji 83 wybrano spośród grupy obejmującej: Ser, Gly, Ala, Asp, Val, Glu, Asn, Tyr, Trp, aminokwas na pozycji 85 wybrano spośród grupy obejmującej: His, Asn, Tyr, Asp, Gln, Ser, aminokwas na pozycji 86 wybrano spośród grupy obejmującej: Asn, Thr, Gln, Asp.
PL 232 192 B1
Drugim przedmiotem wynalazku jest białko oparte na sekwencji zmiennych receptorów limfocytów minoga morskiego (VLR) wiążące marker nowotworowy S100A7, charakteryzujące się tym, że zawiera sekwencję aminokwasową przedstawioną w Sekwencja 3.
Trzecim przedmiotem wynalazku jest zastosowanie białka opartego na sekwencji zmiennych receptorów limfocytów minoga morskiego (VLR) jak zdefiniowano w drugim przedmiocie wynalazku w testach diagnostycznych, chromatografii powinowactwa oraz do tworzenia nowych białek fuzyjnych.
Prezentowana syntetyczna biblioteka białek opartych na sekwencji zmiennych receptorów limfocytów minoga morskiego (VLR) została zaprojektowana na podstawie sekwencji konsensusowej dVLR (Sekwencja 1) ujawnionej w publikacji naukowej Design and characteristics of a stable protein scaffold for specific binding based on variable lymphocyte receptor sequences, Wezner-Ptasińska M. i współ., 2011, Biochimica at Biophysica Acta, 1814, 1140-1145. Białko dVLR to stosunkowo mały, nieglikozylowany, jednołańcuchowy polipeptyd o masie ok. 20 kDa. Charakteryzuje się on wysoką stabilnością zarówno termiczną jak i chemiczną oraz jest monomerem, co bezpośrednio wpływa na czas etapów izolacji i oczyszczania oraz sposób jego przechowywania. Informacje o wysokiej stabilności zaprojektowanej sekwencji konsensusowej dVLR pozwoliły na podjęcie decyzji o zaprojektowaniu i skonstruowaniu białkowej biblioteki fagowej na podstawie struktury przeciwciał kręgowców bezszczękowych, w szczególności na podstawie zaprojektowanej sekwencji dVLR (Sekwencja 1). Białka wyizolowane z biblioteki stanowią nieograniczone źródło wariantów białka VLR mogące potencjalnie oddziaływać z dowolnym antygenem. W porównaniu do przeciwciał rekombinowanych, praca z białkami VLR jest znacznie mniej skomplikowana. Co więcej wybranie 11 pozycji randomizowanych wpływa na uzyskanie większej powierzchni oddziaływania z antygenem. Dodatkowo białko oparte na sekwencji zmiennych receptorów limfocytów minoga morskiego (VLR) wiążące marker nowotworowy S100A7 posiadający sekwencję aminokwasów według Sekwencji 3, specyficznie wiąże marker nowotworowy S100A7 i pozwala na diagnozę raka piersi, szyjki macicy, płuc, pęcherza moczowego czy gruczolakoraka żołądka.
Przykładowe realizacje wynalazku przedstawiono na rysunku, na którym fig. 1 przedstawia schemat wektora pDST23, do którego wklonowano sekwencje kodujące białka VLR, fig. 2 przedstawia wykres testu ELISA dla 96 indywidualnych klonów po 4 rundzie selekcji wobec S100A7, fig. 3 przedstawia analizę SDS-PAGE w warunkach denaturujących procesu oczyszczania białka VLR.S1B, F1-S1B-F3S1B - kolejne frakcje białka VLR.S1B, fig. 4 przedstawia wyniki analizy oddziaływania pomiędzy VLR.S1B a S100A7.
P r z y k ł a d 1
Projektowanie biblioteki VLR.Sm11S
Przeanalizowano 388 sekwencji białek VLRB dostępnych w bazie UNIPROT. Na podstawie analizy zdecydowano o zmianie fragmentu sekwencji białka (sekwencja 1), mającego stanowić matryce do konstrukcji biblioteki, odpowiadającego regionowi hiperzmiennemu LRRCT. Siedem aminokwasów regionu hiperzmiennego LRRCT (135-141) zamieniono na inną sekwencję liczącą 10 aminokwasów. Zmieniono również sekwencję kolejnych 7 aminokwasów znajdujących się bezpośrednio za regionem hiperzmiennym, które występowały z większą częstotliwością na tych pozycjach (sekwencja 2). Na podstawie analizy częstotliwości występowanie poszczególnych aminokwasów w każdej pozycji danego modułu LRR u 388 sekwencji białek VLR, danych literaturowych wskazujących potencjalne pozycje uznane za odpowiedzialne za rozpoznanie antygenu, a także analizę pozycji biorących udział w oddziaływaniu z ligandami u ustalonych struktur krystalicznych białek VLR z ligandami, zdecydowano o wyborze pozycji, które poddano randomizacji oraz o typie randomizacji, biorąc pod uwagę również charakter łańcuchów bocznych aminokwasów (Tabela 1) . Biblioteka VLR.Sm 11S została wklonowana do wektora pDST23 o sekwencji 4 (fig. 1), zawierającego sekwencję sygnalną kierującą białka na drogę translokacji SRP i umożliwiającego prezentacje białek w fuzji z końcem C fagowego białka pili, pomiędzy miejsca restrykcyjne 5' BamHI i 3' EcoRI. Konstrukcję biblioteki zlecono firmie Sloning Biotechnology GmbH, która dysponuje techniką syntezy nici DNA przy wykorzystaniu tripletów nukleotydów (kodonów, kodujących określone aminokwasy) dlatego też możliwym było zastosowanie ściśle zdefiniowanego schematu randomizacji (w przypadku standardowej randomizacji, czyli zastosowaniu w sekwencji oligonukleotydów, które wykorzystuje się do konstrukcji biblioteki, zdegenerowanych kodonów np. NNC, gdzie N - adenina/guanina/cytozyna/tymina, C - cytozyna, można otrzymać na danej pozycji 15 różnych aminokwasów (A/C/D/F/G/H/I/L/N/P/R/S/T/V/Y). Dzięki temu możliwe jest uniknięcie występowania na danej pozycji aminokwasów niepożądanych
PL232 192 Β1 z punktu widzenia stabilności białka, czy poziomu jego nadprodukcji jak np. cysteina. Wszystkie warianty białka VLR stanowiące bibliotekę VLR.Sm11S znajdujące się w wektorze pDST23 wprowadzono metodą elektro po racji do komórek E. coli 2738. Wielkość biblioteki VLR.Sm11S wynosiła 1,1*108 wariantów. Komórki E. coli 2738 hodowano w pożywce 2TY uzupełnionej 1% glukozą oraz 33 μg/ml chloramfenikolu i hodowano do osiągnięcia OD600 = 0,5, zakażano fagiem pomocniczym przez 40 minut w temperaturze 37°C i wirowano. Zakażone bakterie zawieszano w pożywce 2TY uzupełnionej 0,1% glukozą, 33 μg/ml chloramfenikolu, 50 μg/ml kanamycyny oraz 0,1 mM IPTG i hodowano przez noc w temperaturze 30°C, pozwalając na namnożenie fagów prezentujących wyselekcjonowane warianty VLR. Fagi oczyszczono zgodnie ze standardową procedurą operacyjną i stosowano do selekcji wobec wybranych antygenów.
Tabela 1
Pozycje w sekwencji matrycowej VLR, które poddano randomizacji oraz schemat randomizacji
| Pozycja w sekwencji, którą poddano randomizacji | Schemat randomizacji (aminokwasy, które mogą wystąpić w danej pozycji) |
| wt amino acid #33 - Val | Val, Asn, Ile, Arg |
| wt amino acid #37 - Tyr | Tyr, His, Asn, Ser |
| wt amino acid #38 - Asp | Asn, Asp, Ser, Val, Thr |
| wt amino acid #57 - Lys | Glu, Lys, Tyr, Arg, Gin, Thr |
| wt amino acid #59 - Tyr | Tyr, Asn, Trp, Asp, His, Gly |
| wt amino acid #61 - Asn | Asn, Gly, Ser, Tyr, His, Ala |
| wt amino acid #62 - Gly | Gly, Asn, Ser, Gin, Asp, Val |
| wt amino acid #81 - His | His, Arg, Gin, Tyr, Lys |
| wt amino acid #83 - Ser | Ser, Gly, Ala, Asp, Val, Glu, Asn, Tyr, Trp |
| wt amino acid #85 - His | His, Asn, Tyr, Asp, Gin, Ser |
| wt amino acid #86 - Asn | Asn, Thr, Gin, Asp |
Przykład 2
Nadprodukcja i oczyszczanie białka S100A7
Wektor pDEST15, o sekwencji nr 5, do którego wklonowany był gen S100A7 umożliwia nadprodukcję białka w systemie bakteryjnym w fuzji z białkiem glutationo-S-transferazą (GST). Nadprodukcję białka prowadzono w komórkach E. coli BL21 (DE3), po indukcji 1 mM IPTG przy Οϋθοο = 0,8 w temperaturze 27°C przez noc. Białko oczyszczano na kolumnie ze złożem glutationowym według standardowej procedury. Białko fuzyjne poddawano 48-godzinnemu trawieniu proteazą rTEV, przy jednoczesnej dializie do buforu 50 mM Tris pH 8,0, 50 mM NaCI, 2 mM DTT. GST oddzielano od S100A7 na kolumnie ze złożem glutationowym. Czystość frakcji S100A7 analizowano przez SDS-PAGE w warunkach redukujących.
PL 232 192 B1
P r z y k ł a d 3
Biotynylacja białek
Biotynylację białka S100A7 (S100A7 - marker nowotworowy, którego nadekspresję wykryto w wielu typach nowotworów, w tym raka piersi, szyjki macicy, płuc, pęcherza moczowego czy gruczolakoraka żołądka) przeprowadzono z użyciem odczynnika EZ-link Sulfo-NHS-SS-Biotin, zgodnie ze standardową procedurą operacyjną. Reakcję prowadzono stosując 1-krotny nadmiar molowy odczynnika biotynylującego w stosunku do stężenia białka. Modyfikację prowadzono przez 1 godzinę w temperaturze pokojowej lub przez noc w temperaturze 4°C. Po przeprowadzeniu reakcji nadmiar odczynnika biotynylującego usuwano przez całonocną dializę do PBS. Efektywność procesu przyłączania biotyny szacowano z użyciem spektrometrii mas.
P r z y k ł a d 4
Metoda selekcji
Selekcje prowadzono na podłożu stałym z wykorzystaniem płytek 96-dołkowych Streptawell powleczonych streptawidyną. Do eksperymentów stosowano biotynylowane białko S100A7. Biotynylowane S100A7 immobilizowano na 96-dołkowej płytce Streptawell (8 dołków po 100 gl na jedną rundę selekcji, CS100A7 = 1 gM). Po opłaszczeniu podłoże trzykrotnie przemywano PBS, a następnie blokowano roztworem 3% PBSB (PBS uzupełniony 3% albuminą surowicy bydlęcej) przez 2 godziny w temperaturze pokojowej. Fagi prezentujące na swojej powierzchni warianty białka VLR w ilości 1013 inkubowano z immobilizowanym na płytce S100A7 w temperaturze pokojowej 2 h. Niezwiązane fagi odmywano, natomiast fagi związane eluowano 100 mM roztworem trietyloaminy i neutralizowano 1 M Tris-HCl pH 7,5. Zwolnione cząstki fagowe używano do infekcji bakterii E. coli ER2738, znajdujących się w logarytmicznej fazie wzrostu (OD600 = 0,5). Bakterie infekowano 40 minut w temperaturze 37°C, następnie wysiewano na podłoże stałe 2TY uzupełnione 1% glukozą oraz 33 gg/ml chloramfenikolu i inkubowano przez noc w temperaturze 30°C. Założono hodowlę bakterii, które wyrosły przez noc w 200 ml pożywki 2TY uzupełnionej 1% glukozą oraz 33 gg/ml chloramfenikolu i hodowano do osiągnięcia OD600 = 0,5, zakażano fagiem pomocniczym przez 40 minut w temperaturze 37°C i wirowano. Zakażone bakterie zawieszano w pożywce 2TY uzupełnionej 0,1% glukozą, 33 gg/ml chloramfenikolu, 50 gg/ml kanamycyny oraz 0,1 mM IPTG i hodowano przez noc w temperaturze 30°C, pozwalając na namnożenie fagów prezentujących wyselekcjonowane warianty VLR. Fagi oczyszczono zgodnie ze standardową procedurą operacyjną i używano w kolejnej rundzie selekcji.
P r z y k ł a d 5
Test ELISA monoklonalna
Po czwartej rundzie selekcji testowano pojedyncze warianty białka VLR pod kątem oddziaływania z antygenem, wyniki testów zostały przedstawione na wykresie z fig. 2. Założono hodowlę pojedynczych kolonii bakteryjnych w 200 gl pożywki 2TY uzupełnionej 1% glukozą i 33 gg/ml chloramfenikolu na płytce 96-dołkowej. Hodowlę prowadzono z intensywnym napowietrzaniem przez 2 h w temperaturze 37°C, zakażano fagiem pomocniczym, a następnie zawirowywano i zawieszano bakterie w pożywce 2TY uzupełnionej 0,1% glukozą, 33 gg/ml chloramfenikolu, 50 gg/ml kanamycyny oraz 0,1 mM IPTG i hodowano przez noc w temperaturze 30°C. Jednocześnie immobilizowano biotynylowane białko S100A7 na 96-dołkowej płytce Streptawell, a następnie blokowano. Supernatanty bakteryjne zawierające fagi prezentujące na swojej powierzchni białko VLR nanoszono na płytkę Streptawell z immobilizowanym antygenem, inkubowano 1 h w temperaturze pokojowej, a następnie niezwiązane fagi odmywano PBST (PBS uzupełniony 0,1% Tween 20) i PBS. Do detekcji utworzonych kompleksów stosowano przeciwciało HRP-anty-M13 w rozcieńczeniu 1:5000, które inkubowano 1 h w temperaturze pokojowej z białkami znajdującymi się na płytce. Po odpł ukaniu nadmiaru przeciwciała, dodawano do każdej studzienki substratu dla peroksydazy chrzanowej (TMB), inkubowano 15 min. Reakcję zatrzymywano przez dodanie 1 M H 2SO4, a wyniki odczytywano w postaci pomiaru kalorymetrycznego przy długości fali 450 nm.
P r z y k ł a d 6
Klonowanie genu VLR.S1B
Klonowanie genu VLR.S1B, o sekwencji nr 5, przeprowadzono w dwóch krokach PCR, w których wprowadzono na końcu 5' genu VLR.S1B sekwencję sygnalną, dzięki której nadprodukowane białko mogło być translokowane do medium, natomiast na końcu 3' genu VLR.S1B sekwencję kodującą 6 histydyn, dzięki czemu możliwe było oczyszczanie białka przy zastosowaniu złoża NiNTA. W PCR1 stosowano primery HindIII-SP-VLR-F1:
PL 232 192 B1
5'CTCTTCTTCCTGTCAGTAACGACTGGTGTCCACTCCGCATGTCCGAGCCAGTGTAGCTG 3' oraz NotI-VLR-Histag-R: 5'CTCCGCGGCCGCTCAATGATGGTGATGATGATGCGGACATTTGCTCGGGCTGGTG 3', natomiast w PCR2 HindIII-SP-P-F2:
5'CTCCAAGCTTTGAACCACCATGGAATGGAGCTGGGTCTTTCTCTTCTTCCTGTCAGTAAC GACTGG 3' oraz primer NotI-VLR-Histag-R. Produkt reakcji PCR2 oraz wektor ekspresyjny pLEV113 trawiono enzymami restrykcyjnymi Hindlll i Notl. Produkty restrykcji ligowano i użyto do transformacji komórek kompetentnych DH10a.
P r z y k ł a d 7
Linia komórkowa
Linię komórkową jajnika chomika chińskiego CHO-S zastosowano do nadprodukcji białka VLR.S1 B. Hodowlę komórek prowadzono w postaci zawiesiny w medium POWERCHO-2CD uzupełnionej 8 mM L-glutaminą i antybiotykami, z wytrząsaniem 140 rpm. Hodowlę prowadzono w warunkach standardowych (37°C, 5% CO2).
P r z y k ł a d 8
Nadprodukcja białka VLR.S1B
Wektor pLEV113, do którego wklonowano gen VLR.S1B, o sk umożliwia nadprodukcję białek w systemie eukariotycznym. Wprowadzenie sekwencji sygnalnej na końcu 5' genu VLR skutkuje translokacją białka do medium. W dniu transfekcji komórki hodowano w pożywce ProCHO4 bez antybiotyków. Wektor pLEV113 zawierający gen VLR.S1B zmieszano z polietylenoaminą (PEI), inkubowano w temperaturze pokojowej. Kompleks DNA-PEI dodano do kultury komórek, komórki hodowano przez 4 h w warunkach standardowych. Dodano medium PowerCHO-2CD, obniżono temperaturę hodowli do 31°C. Komórki hodowano w tych warunkach przez 6 dni. Na fig. 3 przedstawiono analizę SDS-PAGE w warunkach denaturujących procesu oczyszczania białka VLR.S1B, F1 -S1B-F3-S1B - kolejne frakcje białka VLR.S1B.
P r z y k ł a d 9
Oczyszczanie białka VLR.S1B
Białko oczyszczano na kolumnie za złożem NiNTA-agaroza według standardowej procedury. Oczyszczone białko dializowano do PBS. Czystość eluowanych frakcji VLR.S1B analizowano przez SDS-PAGE w warunkach redukujących.
P r z y k ł a d 10
Pomiar stałej oddziaływania VLR.S1B z S100A7 za pomocą powierzchniowego rezonansu plazmonowego (SPR)
Przygotowano serię rozcieńczeń białka VLR.S1 B, które analizowano przy użyciu ProteOn XPR36 firmy BIO-RAD, na czujniku GLC z immobilizowanym S100A7. Wyniki analizowano z użyciem oprogramowania ProteOn Manager. Jeden z wyselekcjonowanych wariantów oddziaływał z S100A7 ze stałą Kd wynoszącą 9,19*10-6 M, jak przedstawia wykres znajdujący się na fig. 4.
PL232 192 Β1
| Wykaz sekwencji |
Sekwencja 1
ACPSQCSCSGTTVNCHSKSLASVPAGIPTTTQVLWLYDNQITKLEPGVFDSLVNLQKLYLNG
NQLTALPAGVFDKLTQLTHLSLHNNQLKSIPRGAFDNLKSLTHIWLFNNPWDCECSDILYLS
NWIVQHASTVNPSGHGGVDNAKCSGTNTPVRAVTEASTSPSKCP
| Opis sekwencji | 1: |
| Consensus | XLXXLXXLXLXXNQLXXLPXGVFD |
LRRNT ACPSQCSCSGTTVNCHSKSLASVPAGIPTTTQ
| LRR1 | VLWLYDNQITKLEPGVFD |
| LRRV | SLVNLQKLYLNGNQLTALPAGVFD |
| LRRVe | KLTQLTHLSLHNNQLKSIPRGAFD |
| LRRCP | NLKSLTHIWLFNN |
| LRRCT | PWDCECSDILYT,SNWIVQHAS TVN PSGHGGVDNAKCSGTNTPVRAVTE ASTSPSKCP |
Sekwencja 2
ACPSQCSCSGTTVNCHSKSLASVPAGIPTTTQXLWLXXNQITKLEPGVFDSLVNLQXLXLXX
ΝΩΕΤΑΣΡΑ6νΓΟΚΕΤ01ΤΧίΧΣΧΧΝΰ1,Κ3ΙΡΚ6ΑΡΟΝΒΚ81,ΤΗΙ«ΕΓΝΝΡΐ70ΟΕ05ΟΣΣΥΕ8
NWIVQHASIVMRWDGKAVNDPDSAKCAGTNTPVRAVTEASTSPSKCP
Opis sekwencji 2:
LRRNT ACPSQCSCSGTTVNCHSKSLASVPAGIPTTIQ
| LRR1 | XLWLXXNQITKLEPGVFD |
| LRRV | SLVNLQXLXLXXNQLTALPAGVFD |
| LRRVe | KLTQLTXLXLXXNQLKSIPRGAFD |
| LRRCP | NLKSLTHIWLFNN |
| LRRCT | PWDCECSDILYLSNWIVQHASIVM RWDGKAVNDPDSAKCAGTNTPVRA |
YTEASTSPSKCP
PL232 192 Β1
Sekwencja 3
ΑΟΡ50Ο503αΤΤνΝΟΗ5Κ3ΣΑ3νΡΑΟΙΡΤΤΤ(2ΝΒΝΕΞΤΝ2ΙΤΚΣΕΡθνΕΟ3ΣνΝΓ0ΙΈν7ΕΟΝ
NQLTALPAGVFDKLTQLTYLGLHDNQLKSIPRGAFDNLKSLTHIWLFNNPWDCECSDILYLS
NWIVQHASIVMRWDGKAVNDPDSAKCAGTNTPVRAVTEASTSPSKCP
Opis sekwencji 3:
| LRRNT | ACPSQCSCSGTTVNCHSKSLASVPAGIPTTTQ |
| LRR.1 | NLWLSTNQITKLEPGVFD |
| LRRV | SLVNLQTLWLGNNQLTALPAGVFD |
| LRRVe | KLTQLTYLGLHDNQLKSIPRGAFD |
| LRRCP | NLKSLTHIWLFNN |
| LRRCT | PWDCECSDILYLSNWIVQHASIVM RWDGKAVNDPDSAKCAGTNTPVRA YTEASTSPSKCP |
Sekwencja 4
| 1 | tctagagcatgcgtaggagaaaataaaatgaaaaagatttggctggcgct |
| 51 | ggctggtttagttttagcgtttagcgcatcggcggactacaaagatggat |
| 101 | ccgacctgggtaagaaactgctggaagctgctcgtgctggtcaggacgac |
| 151 | gaagttcgtatcctgatggctaacggtgctgacgttaacgctaatgactg |
| 201 | gtttggtattactccgctgcacctggttgttaataatggtcacctggaaa |
| 251 | tcattgaagttctgctgaagtacgctgctgacgttaacgcttctgacaag |
| 301 | tctggttggactccgctgcacctggctgcttatcgtggtcacctggaaat |
| 351 | cgttgaagttctgctgaagtacggtgctgacgttaacgctatggactatc |
| 401 | agggttatactccgctgcacctggctgctgaggatggtcacctggaaatc |
| 451 | gttgaagttctgctgaagtacggtgctgacgttaacgctcaggacaaatt |
| 501 | cggtaagaccgctttcgacatctccatcgacaacggtaacgaggacctgg |
| 551 | ctgaaatcctgcaatctgcagccgaattcgagcagaagctgatctctgag |
| 601 | gaggatctgtagggtggtggctctggttccggtgattttgattatgaaaa |
| 651 | gatggcaaacgctaataagggggctatgaccgaaaatgccgatgaaaacg |
PL232 192 Β1 cgctacagtctgacgctaaaggcaaacttgattctgtcgctactgattac ggtgcLgctatcgatggtttcattggtgacgtttccggccttgctaatgg taatggtgctactggtgattttgctggctctaattcccaaatggctcaag tcggtgacggtgataattcacctttaatgaataatttccgtcaatattta ccttccctccctcaatcggttgaatgtcgcccttttgtctttggcgctgg taaaccatatgaattttctattgattgtgacaaaataaacttattccgtg gtgtctttgcgtttcttttatatgttgccacctttatgtatgtattttct acgtttgctaacatactgcgtaataaggagtcttgataagcttgacctgt gaagtgaaaaatggcgcagattgtgcgacattttttttgtctgccgttta attaaaggggggggggggccggcctgggggggggtgtacatgaaattgta aacgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctc attttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaag aatagaccgagatagggttgagtgttgttccagtttggaacaagagtcca ctattaaagaacgtggactccaacgtcaaagggcgaaaaaccgtctatca gggcgatggcccactacgagaaccatcaccctaatcaagttttttggggt cgaggtgccgtaaagcactaaatcggaaccctaaagggagcccccgattt agagcttgacggggaaagccggcgaacgtggcgagaaaggaagggaagaa agcgaaaggagcgggcgctagggcgctggcaagtgtagcggtcacgctgc gcgtaaccaccacacccgccgcgcttaatgcgccgctacagggcgcgtgc tagactagtgtttaaaccggaccgggggggggcttaagtgggctgcaaaa caaaacggcctcctgtcaggaagccgcttttatcgggtagcctcactgcc cgctttccagtcgggaaacctgtcgtgccagctgcatcagtgaatcggcc aacgcgcggggagaggcggtttgcgtattgggagccagggtggtttttct tttcaccagtgagacgggcaacagctgattgcccttcaccgcctggccct gagagagttgcagcaagcggtccacgctggtttgccccagcaggcgaaaa tcctgtttgatggtggtcagcggcgggatataacatgagctgtcctcggt atcgtcgtatcccactaccgagatgtccgcaccaacgcgcagcccggact cggtaatggcacgcattgcgcccagcgccatctgatcgttggcaaccagc atcgcagtgggaacgatgccctcattcagcatttgcatggtttgttgaaa accggacatggcactccagtcgccttcccgttccgctatcggctgaattt gattgcgagtgagatatttatgccagccagccagacgcagacgcgccgag acagaacttaatgggccagctaacagcgcgatttgctggtggcccaatgc gaccagatgctccacgcccagtcgcgtaccgtcctcatgggagaaaataa tactgttgatgggtgtctggtcagagacatcaagaaataacgccggaaca
232 192
ttagtgcaggcagcttccacagcaatagcatcctggtcatccagcggata gttaataatcagcccactgacacgttgcgcgagaagattgtgcaccgccg ctttacaggcttcgacgccgcttcgttctaccatcgacacgaccacgctg gcacccagttgatcggcgcgagatttaatcgccgcgacaatttgcgacgg cgcgtgcagggccagactggaggtggcaacgccaatcagcaacgactgtt tgcccgccagttgttgtgccacgcggttaggaatgtaattcagctccgcc atcgccgcttccactttttcccgcgttttcgcagaaacgtggctggcctg gttcaccacgcgggaaacggtctgataagagacaccggcatactctgcga catcgtataacgttactggtttcacattcaccaccctgaattgactctct tccgggcgctatcatgccataccgcgaaaggttttgcgccattcgatgct agccatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccg cgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaa aatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagata ccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccc tgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcg ctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcg ctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcg ccttatccggtaactatcgtcttgagtccaacccggtaagacacgactta tcgccactggcagcagccactggtaacaggattagcagagcgaggtatgt aggcggtgctacagagttcttgaagtggtggcctaactacggctacacta gaagaacagtatttggtatctgcgctctgctgtagccagttaccttcgga aaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcgg tggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctc aagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaa aactcacgttaagggattttggtcagatctagcaccaggcgtttaagggc accaataactgccttaaaaaaattacgccccgccctgccactcatcgcag tactgttgtaattcattaagcattctgccgacatggaagccatcacaaac ggcatgatgaacctgaatcgccagcggcatcagcaccttgtcgccttgcg tataatatttgcccatagtgaaaacgggggcgaagaagttgtccatattg gctacgtttaaatcaaaactggtgaaactcacccagggattggctgagac gaaaaacatattctcaataaaccctttagggaaataggccaggttttcac cgtaacacgccacatcttgcgaatatatgtgtagaaactgccggaaatcg tcgtggtattcactccagagcgatgaaaacgtttcagtttgctcatggaa aacggt.gtaacaagggtgaacactatcccatatcaccagctcaccgtctt
PL232 192 Β1
| 4101 | tcattgccatacggaactccgggtgagcattcatcaggcgggcaagaatg |
| 4151 | tgaataaaggccggataaaacttgtgcttatttttctttacggtctttaa |
| 4201 | aaaggccgtaatatccagctgaacggtctggttataggtacattgagcaa |
| 4251 | ctgactgaaatgcctcaaaatgttctttacgatgccattgggatatatca |
| 4301 | acggtggtatatccagtgatttttttctccattttagcttccttagctcc |
| 4351 | tgaaaatctcgataactcaaaaaatacgcccggtagtgatcttatttcat |
| 4401 | tatggtgaaagttggaacctcacccgacgtctaatgtgagttagctcact |
| 4451 | cattaggcaccccaggctttacactttatgcttccggctcgtatgttgtg |
| 4501 | tggaattgtgagcggataacaatttcacacaggaaacagctatgaccatg |
| 4551 | attacgaatt |
| Sekwencja | 5 |
| 1 | ATCGAGATCTCGATCCCGCGAAATTAATACGACTCACTATAGGGAGACCA |
| 51 | CAACGGTTTCCCTCTAGAAATAATTTTGTTTAACTTTAAGAAGGAGATAT |
| 101 | ACATATGTCCCCTATACTAGGTTATTGGAAAATTAAGGGCCTTGTGCAAC |
| 151 | CCACTCGACTTCIITTGGAATATCTTGAAGAAAAATATGAAGAGCATTTG |
| 201 | TATGAGCGCGATGAAGGTGATAAATGGCGAAACAAAAAGTTTGAATTGGG |
| 251 | TITGGAGTTICCCAATCTTCCTIATTATATIGATGGTGATGTTAAATTAA |
| 301 | CACAGTCTATGGCCATCATACGTTATATAGCTGACAAGCACAACATGTTC- |
| 351 | GGTGGTTGTCCAAAAGAGCGTGCAGAGATTTCAATGCTTGAAGGAGCGGT |
| 401 | IITGGATATIAGATACGGTGTIICGAGAATIGCATATAGTAAAGACTTTG |
| 451 | AAACTCTCAAAGTTGATTTTCTTAGCAAGCTACCTGAAATGCTGAAAATG |
| 501 | TTCGAAGATCGTTTATGTCATAAAACATATTTAAATGGTGATCATGTAAC |
| 551 | CCATCCTGACTTCATGTTGTATGACGCTCTTGATGTTGTTTTATACATGG |
| 601 | ACCCAATGTGCCTGGATGCGTTCCCAAAATTAGTTTGTTTTAAAAAACGT |
| 651 | ATTGAAGCTATCCCACAAATTGATAAGTACTTGAAATCCAGCAAGTATAT |
| 701 | AGCATGGCCITTGCAGGGCTGGCAAGCCACGTTTGGTGGTGGCGACCATC |
| 751 | CTCCAAAATCGGATCTGGTTCCGCGTCCATGGTCGAATCAAACAAGTTTC- |
| 801 | TACAAAAAAGCTGAACGAGAAACGTAAAATGATATAAATATCAATATATT |
| 851 | AAATTAGATTTTGCATAAAAAACAGACTACATAATACTGTAAAACACAAC |
| 901 | ATATCCAGTCACTATGGCGGCCGCATTAGGCACCCCAGGCTTTACACTTT |
232 192
ATGCTTCCGGCTCGTATAATGTGTGGATITTGAGTTAGGATCCGTCGAGA T T Τ TCAGGAGCTAAGGAAGC ΤΑΑΑΑΤ GGAGAAAAAAATCACTGGATATAC CACCGTTGATATATCCCAATGGCATCGTAAAGAACATTTTCAGCCATTTC AGICAGTTGCTCAATGTACCTATAACCAGACCGTTCAGCTGGATAITACG GCCTTTTTAAAGACCGTAAAGAAAAATAAGCACAAGTTTTATCCGGCCTT lAITCACATICTIGCCCGCCTGATGAATGCICATCCGGAAITCCGIATGG CAATGAAAGACGGTGAGCTGGTGATATGGGATAGTGTTCACCCTTGTTAC ACCGTTTTCCATGAGCAAACTGAAACGTTTTCATCGCTCTGGAGTGAATA CCACGACGATTTCCGGCAGTTTCTACACATATATTCGCAAGATGTGGCGT GTTACGGTGAAAACCTGGCCTATTTCCCTAAAGGGTTTATTGAGAATATG TTTTTCGTCTCAGCCAATCCCTGGGTGAGTTTCACCAGTTTTGATTTAAA CGTGGCCAATATGGACAACTTCTICGCCCCCGITTTCACCATGGGCAAAT ATTATACGCAAGGCGACAAGGTGCTGATGCCGCTGGCGATTCAGGTTCAT CATGCCGTCTGTGATGGCTTCCATGTCGGCAGAATGCTTAATGAATTACA ACAGTACTGCGATGAGTGGCAGGGCGGGGCGTAATCTAGAGGATCCGGCT TACTAAAAGCCAGATAACAGTATGCGTATTTGCGCGCTGATTTTTGCGGT ATAAGAATATATACTGATATGTATACCCGAAGTATGTCAAAAAGAGGTGT GCTATGAAGCAGCGTATIACAGTGACAGTTGACAGCGACAGCTATCAGTT GCTCAAGGCATATATGATGTCAATATCTCCGGTCTGGTAAGCACAACCAT GCAGAATGAAGCCCGTCGTCTGCGTGCCGAACGCTGGAAAGCGGAAAATC AGGAAGGGAIGGCTGAGGTCGCCCGGTTTAITGAAATGAACGGCTCTIIT GCTGACGAGAACAGGGACTGGTGAAATGCAGTTTAAGGTTIACACCTATA AAAGAGAGAGCCGTTATCGTCTGTTTGTGGATGTACAGAGTGATAITATT GACACGCCCGGGCGACGGATGGTGATCCCCCTGGCCAGTGCACGTCTGCT GTCAGATAAAGTCTCCCGTGAACTTTACCCGGTGGTGCATATCGGGGATG AAAGCTGGCGCATGATGACCACCGATATGGCCAGTGTGCCGGTCTCCGTT ATCGGGGAAGAAGTGGCTGATCTCAGCCACCGCGAAAATGACATCAAAAA CGCCATTAACCTGATGTTCTGGGGAATATAAATGTCAGGCTCCCTTATAC ACAGCCAGTCTGCAGGTCGACCATAGTGACTGGATATGTTGTGTTTTACA GTATTATGTAGTCTGTTTTTTATGCAAAATCTAATTTAATATATTGATAT
PL232 192 Β1
TTATATCATTTTACGTTTCTCGTTCAGCTTTCTTGTACAAAGTGGTTTGA
TTCGACCCGGGATCCGGCrGCTAACAAAGCCCGAAAGGAAGCTGAGTTGG
CTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAA
CGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATATCC
ACAGGACGGGTGTGGTCGCCATGATCGCGTAGTCGATAGTGGCTCCAAGT
AGCGAAGCGAGCAGGACTGGGCGGCGGCCAAAGCGGTCGGACAGTGCTCC
GAGAACGGGTGCGCATAGAAATTGCATCAACGCATATAGCGCTAGCAGCA
CGCCATAGTGACTGGCGATGCTGTCGGAATGGACGATATCCCGCAAGAGG
CCCGGCAGTACCGGCATAACCAAGCCTATGCCTACAGCATCCAGGGTGAC
GGTGCCGAGGATGACGATGAGCGCATTGTTAGATTTCATACACGGTGCCT
GACTGCGTTAGCAATTTAACTGTGATAAACTACCGCATTAAAGCTIATCG
ATGAIAAGCIGICAAACArGAGAATTCTTGAAGACGAAAGGGCCTCGTGA
TACGCCTATTTITATAGGrTAATGTCATGATAATAATGGTTTCTTAGACG
TCAGGTGGCACITITCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATT
TTTCTAAATACATTCAAArATGTATCCGCTCATGAGACAATAACCCTGAT
AAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTC
CGTGTCGCCCTTATTCCCrTTTTTGCGGCATTTTGCCTTCCTGTTTTTGC
TCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTG
CACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAG
AGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCT
GCTATGTGGCGCGGTATTATCCCGTGTTGACGCCGGGCAAGAGCAACTCG
GTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTC
ACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGC
TGCCATAACCATGAGTGArAACACIGCGGCCAACTTACTTCTGACAACGA
TCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCAT
GTAACTCGCCTTGATCGTrGGGAACCGGAGCTGAATGAAGCCATACCAAA
CGACGAGCGTGACACCACGATGCCTGCAGCAATGGCAACAACGTTGCGCA
AACTATTAACTGGCGAACrACTTACTCTAGCTTCCCGGCAACAATTAATA
GACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCI
TCCGGCTGGCTGGTTTATrGCTGATAAATCTGGAGCCGGTGAGCGTGGGT
232 192
CTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATC
GTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAG
ACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAG
ACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTITTAA
TTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAAT
CCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGA
TCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTG
CAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGA
GCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATAC
CAAATACTGTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAAC
TCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGC
TGCTGCCAGTGGCGATAACTCGTCTCTTACCGGGTTCGACTCAAGACGAT
AGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACA
CAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCG
IGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGT
ATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCA
GGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTG
ACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGA
AAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCT
TTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCG
IATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCG
AGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCTGATGCGGTAT
ITTCTCCTTACGCATCTGTGCGGTATTTCACACCGCATATATGGTGCACT
CTCAGTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATACACTCCG
CTATCGCTACGTGACTGGGTCATGGCTGCGCCCCGACACCCGCCAACACC
CGCTGACGCGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGAC
AAGCTGTGACCGTCTCCGGGAGCTGCATGTGTCAGAGGTTTTCACCGTCA
TCACCGAAACGCGCGAGGCAGCTGCGGTAAAGCTCATCAGCGTGGTCGTG
AAGCGATTCACAGATGTCTGCCTGTTCATCCGCGTCCAGCTCGTTGAGTT
TCTCCAGAAGCGTTAATGTCTGGCTTCTGATAAAGCGGGCCATGTTAAGG
PL232 192 Β1
GCGGTTTTTTCCTGTTTGGTCACTGATGCCTCCGTGTAAGGGGGATTTCT
GTTCATGGGGGTAATGATACCGATGAAACGAGAGAGGATGCTCACGATAC
GGGTTACTGATGATGAACATGCCCGGTTACTGGAACGTTGTGAGGGTAAA
CAACTGGCGGTATGGAIGCGGCGGGACCAGAGAAAAATCACTCAGGGTCA
ATGCCAGCGCTICGTTAATACAGATGTAGGTGTTCCACAGGGTAGCCAGC
AGCATCCTGCGATGCAGATCCGGAACATAATGGTGCAGGGCGCTGACTTC
CGCGTTTCCAGACTTTACGAAACACGGAAACCGAAGACCATTCATGTTGT
IGCTCAGGTCGCAGACGTTTTGCAGCAGCAGTCGCTTCACGTTCGCTCGC
GTATCGGTGATTCATTCTGCTAACCAGTAAGGCAACCCCGCCAGCCTAGC
CGGGTCCTCAACGACAGGAGCACGATCATGCGCACCCGTGGCCAGGACCC
AACGCTGCCCGAGATGCGCCGCGTGCGGCTGCTGGAGATGGCGGACGCGA
TGGATATGTTCTGCCAAGGGTTGGTTTGCGCATTCACAGTTCTCCGCAAG
AATTGATTGGCTCCAATTCTTGGAGTGGTGAATCCGTTAGCGAGGTGCCG
CCGGCTTCCAITCAGGTCGAGGTGGCCCGGCTCCATGCACCGCGACGCAA
CGCGGGGAGGCAGACAAGGTATAGGGCGGCGCCTACAATCCATGCCAACC
CGTTCCATGTGCTCGCCGAGGCGGCATAAATCGCCGTGACGATCAGCGGT
CCAGTGATCGAAGTTAGGCTGGTAAGAGCCGCGAGCGATCCTTGAAGCTG
TCCCTGATGGTCGTCATCTACCTGCCTGGACAGCATGGCCTGCAACGCGG
GCATCCCGATGCCGCCGGAAGCGAGAAGAATCATAATGGGGAAGGCCATC
CAGCCTCGCGTCGCGAACGCCAGCAAGACGTAGCCCAGCGCGTCGGCCGC
CATGCCGGCGATAATGGCCTGCTTCTCGCCGAAACGTTTGGTGGCGGGAC
CAGTGACGAAGGCTTGAGCGAGGGCGTGCAAGATTCCGAATACCGCAAGC
GACAGGCCGAICATCGICGCGCTCCAGCGAAAGCGGTCCTCGCCGAAAAT
GACCCAGAGCGCTGCCGGCACCTGTCCTACGAGTTGCATGATAAAGAAGA
CAGTCATAAGTGCGGCGACGATAGTCATGCCCCGCGCCCACCGGAAGGAG
CTGACTGGGTTGAAGGCTCTCAAGGGCATCGGTCGATCGACGCTCTCCCT
TATGCGACTCCTGCATTAGGAAGCAGCCCAGTAGTAGGTTGAGGCCGTTG
AGCACCGCCGCCGCAAGGAATGGTGCATGCAAGGAGATGGCGCCCAACAG
TCCCCCGGCCACGGGGCCTGCCACCATACCCACGCCGAAACAAGCGCTCA
TGAGCCCGAAGIGGCGAGCCCGATCTTCCCCATCGGTGATGTCGGCGATA
PL232 192 Β1
| 6951 | TAGGCGCCAGCAACCGCACCTGTGGCGCCGGTGATGCCGGCCACGATGCG |
| 7001 | TCCGGCGTAGAGG |
Sekwencja 5
| 1 51 101 151 201 251 301 351 401 451 501 | GCATGTCCGAGCCAGTGTAGCTGTAGCGGCACCACCGTTAATTGTCATAG CAAAAGCCTGGCAAGCGTTCCGGCAGGCATTCCGACCACCACCCAGAACC TGTGGCTGTCGACCAATCAGATTACCAAACTGGAACCGGGTGTTTTTGAT AGCCTGGTGAATCTGCAGACCCTGTGGCTGGGTAACAACCAGCTGACCGC ACTGCCTGCAGGCGTTTTTGATAAACTGACCCAGCTGACGTATTTAGGTC TGCATGACAATCAGCTGAAAAGCATTCCGCGTGGTGCATTTGATAATCTG aaaagcctgacccatatttggctgtttaataatccgtgggattgtgaatg TAGCGAIATICIGTATCTGAGCAATTGGATTGIICAGCATGCCAGCATTG TTATGCGTTGGGATGGTAAAGCGGTGAACGATCCGGATAGCGCGAAATGC GCGGGCACCAATACACCGGTTCGTGCAGTTACCGAAGCAAGCACCAGCCC GAGCAAATGTCCG |
Sekwencja 6
| 1 | GTCGACCTCCAGGGCCCACTAGTCAGTGGGCAGAGCGCACATCGCCCACA |
| 51 | GTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAG |
| 101 | AAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCC |
| 151 | TTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTTGCCGTG |
| 201 | AACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGCTGAACCTTCG |
| 251 | AGGGGCTCGCATCTCTCCTTCACGCGCCCGCCGCCCTACCTGAGGCCGCC |
| 301 | ATCCACGCCGGTTGAGTCGCGTTCTGCCGCCTCCCGCCTGTGGTGCCTCC |
| 351 | TGAACTGCGTCCGCCGTCTAGGTAAGTTTAAAGCTCAGGTCGAGACCGGG |
| 401 | CCTTTGICCGGCGCTCCCTTGGAGCCTACCTAGACTCAGCCGGCTCTCCA |
| 451 | CGCTTTGCCTGACCCTGCTTGCTCAACTCTACGTCTTTGTTTCGTTTTCT |
| 501 | GTTCTGCGCCGTTACAGATCCAAGCTGTGACCGGCGCCTACCTGAGATCA |
| 551 | CCGGTAAAGCTTTGAGCTAGCGATATCGGTACCAGGCCTGCGGCCGCTCG |
| 601 | AGCATGCATCTAGCCTAGTGCCATTTGTTCAGTGGTTCGTAGGGCTTTCC |
| 651 | CCCACTGTTIGGCTTTCAGTTAIATGGATGATGTGGTATTGGGGGCCAAG |
| 701 | TCTGTACAGCAICITGAGTCCCITTTTACCGCIGTTACCAATTTTCTITI |
| 751 | GTCTTTGGGTATACATTTAAACCCTAACAAAACAAAGAGATGGGGTTACT |
PL232 192 Β1
CTCTAAATTTTATGGGTTATGTCATTGGATGTTATGGGTCCTTGCCACAA GAACACATCATACΑΑΑΑΑΑΤ CAAAGAAT GT T T TAGAAAAC T T CC T AT TAA CAGGCCTATTGATTGGAAAGTATGTCAACGAATTGTGGGTCTTTTGGGTT TTGCTGCCCCTTTTACACAATGTGGTTATCCTGCGTTGATGCCTTTGTAT GCATGTATTCAATCTAAGCAGGCTTTCACTTTCTCGCCAACTTACAAGGC CTTTCTGTGTAAACAATACCTGAACCTTTACCCCGTTGCCCGGCAACGGC CACCTCTGTGCCAAGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCTTG GTCATGGGCCATCAGCGCATGCGTGGAACCTTTTCGGCTCCTCTGCCGAT CCATACTGCGGAACTCCTAGCCGCTTGTTTTGCTCGCAGCAGGTCTGGAG CAAACATTATCGGGACTGATAACTCTGTTGTCCTATCCCGCAAATATACA TCGTTTCCATGGCTGCTAGGCTGTGCTGCCAACTGGATCCTGCGCGGGAC GTCCTTTGTTTACGTCCCGTCGGCGCTGAATCCTGCGGACGACCCTTCTC GGGGTCGCTTGGGACTCTCTCGTCCCCTTCTCCGTCTGCCGTTCCGACCG ACCACGGGGCGCACCTCTCTTTACGCGGACTCCCCGTCTGTGCCTTCTCA TCTGCCGGACCGTGTGCACTTCGCTTCACCTCTGCACGTCGCATGGAGAC CACCGTGAACGCCCACCAAATATTGCCCAAGGTCTTACATAAGAGGACTC TTGGACTCTCAGCAATGTCAACGACCGACCTTGAGGCATACTTCAAAGAC TGTTTGTTTAAAGACTGGGAGGAGTTGGGGGAGGAGATTAGGTTAAAGGT CTTTGTACTAGGAGGCTGTAGGCATAAATTGGTCTGCGCACCAGCACCAT GTATCACTAGAGCGGGGGGGGATCCACTAGTTCTAGAGGGCCCTATTCTA TAGTGTCACCTAAATGCTAGAGCTCGCTGATCAGCCTCGACTGTGCCTTC TAGTTGCCAGCCATCTGTTGTTTGCCCCICCCCCGTGCCTTCCTTGACCC TGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCA TCGCATTGTCTGAGTAGGTGTCATTCTAITCTGGGGGGTGGGGTGGGGCA GGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATG CGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGCATTAGATCT CTAGCTAGAGGATCGATCCCCGCCCCGGACGAACTAAACCTGACTACGAC ATCTCTGCCCCTTCTTCGCGGGGCAGTGCATGTAATCCCTTCAGTTGGTT GGTACAACTTGCCAACTGAACCCTAAACGGGTAGCATATGCTTCCCGGGT
AGTAGTATATACTATCCAGACTAACCCTAATTCAATAGCATATGTTACCC
232 192
AACGGGAAGCATATGCTATCGAATTAGGGTTAGTAAAAGGGTCCTAAGGA
ACAGCGATGTAGGTGGGCGGGCCAAGATAGGGGCGCGATTGCTGCGATCT
GGAGGACAAATTACACACACTTGCGCCTGAGCGCCAAGCACAGGGTTGTT
GGTCCTCATATTCACGAGGTCGCTGAGAGCACGGTGGGCTAATGTTGCCA
TGGGTAGCATATACTACCCAAATATCTGGATAGCATATGCTATCCTAATC
TATATCTGGGTAGCATAGGCTATCCTAATCTATATCTGGGTAGCATATGC
TATCCTAATCTATATCTGGGTAGTATATGCTATCCTAATTTATATCTGGG
TAGCATAGGCTATCCTAATCTATATCTGGGTAGCATATGCTATCCTAATC
TATATCTGGGTAGTATATGCTATCCTAATCTGTATCCGGGTAGCAIATGC
TATCCTAATAGAGATIAGGGTAGTATATGCTATCCTAATTTATATCTGGG
TAGCATATACTACCCAAATATCTGGATAGCATATGCTATCCTAATCTATA
TCTGGGTAGCATATGCTATCCTAATCTATATCIGGGTAGCATAGGCIATC
CTAATCTATATCTGGGTAGCATATGCTATCCTAATCTATATCTGGGTAGT
ATATGCTATCCTAATITATATCTGGGTAGCATAGGCTATCCTAATCTATA
TCTGGGTAGCATATGCTATCCIAATCTATATCTGGGTAGTATATGCTATC
CTAATCTGTATCCGGGTAGCATATGCTATCCTCATGATAAGCTGTCAAAC
ATGAGAAIIAATICTIGAAGACGAAAGGGCCTCGTGATACGCCTAITTTI
ATAGGTTAATGTCATGATAATAATGGTTTCTTAGACGTCAGGTGGCACTT
ITCGGGGAAATGTGCGCGGAACCCCTATTTGTITATTTTTCTAAATACAT
TCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATA
ATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTA
TTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACG
CTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTA
CATCGAACIGGAICTCAACAGCGGIAAGAICCITGAGAGTITICGCCCCG
AAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCG
GTATTATCCCGTGTTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACA
CTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATC
TTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATG
AGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAA
GGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTG
PL232 192 Β1
ATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGAC ACCACGATGCCTGCAGCAATGGCAACAACGTTGCGCAAACTATTAACTGG CGAACTACTTACTCTAGCTTCCCGGCAACAATIAATAGACTGGATGGAGG CGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGG TTTATTGCTGATAAATCTGGAGCCGGTGAGCGIGGGICTCGCGGTATCAT TGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACA CGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAG ATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTC ATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCT AGGTGAAGATCCTTTTTGATAATCTCATGACCAAAAICCCTTAACGTGAG TTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTC T T GAGAT CCTTTTTTTCTGC GCGT AAT CTGCTGCTT GGAAAGAAAAAAAC CACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTT TTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCT TCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGC CTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGC GATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAA GGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGG AGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAA AGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGG CAGGGTCGGAACAGGAGAGCGCACGAGGGAGCITCCAGGGGGAAACGCCT GGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGA TTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAA CGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGI TCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTT GAGTGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTC
AGTGAGCGAGGAAGC
Claims (3)
1. Białko oparte na sekwencji zmiennych receptorów limfocytów minoga morskiego (VLR), zna- mienne tym, że sekwencja matrycowa białka stanowi Sekwencja 2, przy czym X oznacza pozycje randomizowane, przy czym aminokwas w pozycji 33 wybrano spośród grupy obejmującej: Val, Asn, Ile, Arg, aminokwas na pozycji 37 wybrano spośród grupy obejmującej: Tyr, His, Asn, Ser, aminokwas na pozycji 38 wybrano spośród grupy obejmującej: Asn, Asp, Ser, Val, Thr, aminokwas na pozycji 57 wybrano spośród grupy obejmującej: Glu, Lys, Tyr, Arg,
Gin, Thr, aminokwas na pozycji 59 wybrano spośród grupy obejmującej: Tyr, Asn, Trp, Asp,
His, Gly, aminokwas na pozycji 61 wybrano spośród grupy obejmującej: Asn, Gly, Ser, Tyr,
His, Ala, aminokwas na pozycji 62 wybrano spośród grupy obejmującej: Gly, Asn, Ser, Gin,
Asp, Val, aminokwas na pozycji 81 wybrano spośród grupy obejmującej: His, Arg, Gin, Tyr, Lys, aminokwas na pozycji 83 wybrano spośród grupy obejmującej: Ser, Gly, Ala, Asp, Val, Glu, Asn, Tyr, Trp, aminokwas na pozycji 85 wybrano spośród grupy obejmującej: His, Asn, Tyr, Asp, Gin, Ser, aminokwas na pozycji 86 wybrano spośród grupy obejmującej: Asn, Thr, Gin, Asp.
2. Białko oparte na sekwencji zmiennych receptorów limfocytów minoga morskiego (VLR) wiążące marker nowotworowy S100A7, znamienne tym, że zawiera sekwencję aminokwasową przedstawioną na Sekwencja 3.
3. Zastosowanie białka opartego na sekwencji zmiennych receptorów limfocytów minoga morskiego (VLR) jak zdefiniowano w zastrz. 2 w testach diagnostycznych, chromatografii powinowactwa oraz immunochemii.
Rysunki
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PL408210A PL232192B1 (pl) | 2014-05-15 | 2014-05-15 | Syntetyczna biblioteka białek opartych na sekwencji zmiennych receptorów limfocytów minoga morskiego oraz białko wiążące marker nowotworowy S100A7 |
| PCT/PL2015/050016 WO2015174869A1 (en) | 2014-05-15 | 2015-05-15 | Synthetic library of proteins based on sea lamprey's sequence of variable lymphocyte receptors, andcancer marker s100a7 binding protein |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PL408210A PL232192B1 (pl) | 2014-05-15 | 2014-05-15 | Syntetyczna biblioteka białek opartych na sekwencji zmiennych receptorów limfocytów minoga morskiego oraz białko wiążące marker nowotworowy S100A7 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| PL408210A1 PL408210A1 (pl) | 2015-11-23 |
| PL232192B1 true PL232192B1 (pl) | 2019-05-31 |
Family
ID=53476952
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PL408210A PL232192B1 (pl) | 2014-05-15 | 2014-05-15 | Syntetyczna biblioteka białek opartych na sekwencji zmiennych receptorów limfocytów minoga morskiego oraz białko wiążące marker nowotworowy S100A7 |
Country Status (2)
| Country | Link |
|---|---|
| PL (1) | PL232192B1 (pl) |
| WO (1) | WO2015174869A1 (pl) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12077609B2 (en) | 2018-12-21 | 2024-09-03 | Wisconsin Alumni Research Foundation | Variable lymphocyte receptors that target the brain extracellular matrix and methods of use |
| US12371468B2 (en) | 2019-02-11 | 2025-07-29 | Wisconsin Alumni Research Foundation | Variable lymphocyte receptors that target the blood brain barrier and methods of use |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008500064A (ja) | 2004-05-21 | 2008-01-10 | ザ ユーエービー リサーチ ファウンデーション | 可変性リンパ球受容体、その関連ポリペプチドおよび核酸、ならびにその使用 |
| AU2007281284A1 (en) * | 2006-08-02 | 2008-02-07 | The Uab Research Foundation | Methods and compositions related to soluble monoclonal variable lymphocyte receptors of defined antigen specificity |
| WO2010065407A2 (en) | 2008-12-01 | 2010-06-10 | University Of Maryland Biotechnology Institute | High affinity recombinant sea lamprey antibodies selected by a yeast surface display platform |
-
2014
- 2014-05-15 PL PL408210A patent/PL232192B1/pl unknown
-
2015
- 2015-05-15 WO PCT/PL2015/050016 patent/WO2015174869A1/en not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| WO2015174869A1 (en) | 2015-11-19 |
| PL408210A1 (pl) | 2015-11-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN103459415B (zh) | 设计的与血清白蛋白结合的重复蛋白 | |
| JP6853250B2 (ja) | 抗体の挿入可能な可変フラグメント及びnkg2dリガンドの改変されたa1−a2ドメイン、及び非天然のnkg2d受容体に結合する非天然のnkg2dリガンド | |
| RU2664464C2 (ru) | Связывающие белки, содержащие по меньшей мере две повторяющиеся области-антагонисты HER2 | |
| CN105722855B (zh) | 恒定链经修饰的双特异性五价和六价Ig-M抗体 | |
| CN112074532B (zh) | 结合非天然NKG2D受体的非天然NKG2D配体的修饰的α1-α2结构域 | |
| KR20150023957A (ko) | 혈소판-유래 성장인자에 결합하는 설계된 안키린 반복 단백질 | |
| EP2719706A1 (en) | Bispecific HER2 ligands for cancer therapy | |
| KR20240122764A (ko) | 이중 결합 특이성을 갖는 설계된 반복 도메인과 이의 용도 | |
| JP6032735B2 (ja) | Vegf結合性融合ペプチド | |
| CN113614103A (zh) | 不直接向其附着的细胞传导信号的非天然nkg2d受体 | |
| PL232192B1 (pl) | Syntetyczna biblioteka białek opartych na sekwencji zmiennych receptorów limfocytów minoga morskiego oraz białko wiążące marker nowotworowy S100A7 | |
| CN108699551B (zh) | 多肽文库 | |
| JP2024511155A (ja) | 多価タンパク質およびスクリーニング法 | |
| TW201118205A (en) | Phage displaying system expressing single chain antibody | |
| JP2017043625A (ja) | Vegf結合性ペプチド | |
| HK40059771A (en) | Designed repeat proteins binding to serum albumin | |
| JP2016123342A (ja) | Vegf結合性ペプチド | |
| CN121263440A (zh) | 重组cd2结合蛋白及其用途 | |
| HK40061399A (en) | Non-natural nkg2d receptors that do not directly signal the cells to which they are attached | |
| KR20130103299A (ko) | Rtk에 특이적으로 결합하는 rtk―bpb | |
| HK40019596B (zh) | 具有可供选择的结合表面的基於iii型纤连蛋白重复的蛋白质支架 | |
| HK1262243A1 (en) | Polypeptide library | |
| HK1189386B (zh) | 设计的与血清白蛋白结合的重复蛋白 |