KR20090003327A - 폴리펩티드 생성 세포 - Google Patents
폴리펩티드 생성 세포 Download PDFInfo
- Publication number
- KR20090003327A KR20090003327A KR1020087027867A KR20087027867A KR20090003327A KR 20090003327 A KR20090003327 A KR 20090003327A KR 1020087027867 A KR1020087027867 A KR 1020087027867A KR 20087027867 A KR20087027867 A KR 20087027867A KR 20090003327 A KR20090003327 A KR 20090003327A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleic acid
- leu
- ser
- pro
- val
- Prior art date
Links
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 176
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 173
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 165
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 486
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 462
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 462
- 239000012634 fragment Substances 0.000 claims abstract description 67
- 108020004705 Codon Proteins 0.000 claims abstract description 58
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 53
- 230000008488 polyadenylation Effects 0.000 claims abstract description 48
- 108020005067 RNA Splice Sites Proteins 0.000 claims abstract description 43
- 210000004027 cell Anatomy 0.000 claims description 275
- 241000282414 Homo sapiens Species 0.000 claims description 181
- 108090000623 proteins and genes Proteins 0.000 claims description 137
- 108020004999 messenger RNA Proteins 0.000 claims description 90
- 238000000034 method Methods 0.000 claims description 84
- 102000004169 proteins and genes Human genes 0.000 claims description 79
- 108060003951 Immunoglobulin Proteins 0.000 claims description 75
- 102000018358 immunoglobulin Human genes 0.000 claims description 75
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 claims description 72
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 claims description 68
- 230000014509 gene expression Effects 0.000 claims description 51
- 238000013519 translation Methods 0.000 claims description 45
- 210000000170 cell membrane Anatomy 0.000 claims description 38
- 230000027455 binding Effects 0.000 claims description 35
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 35
- 229940072221 immunoglobulins Drugs 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 18
- 238000010367 cloning Methods 0.000 claims description 12
- 241000287828 Gallus gallus Species 0.000 claims description 10
- 238000012258 culturing Methods 0.000 claims description 10
- 102000005962 receptors Human genes 0.000 claims description 9
- 108020003175 receptors Proteins 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 6
- 102000004190 Enzymes Human genes 0.000 claims description 5
- 108090000790 Enzymes Proteins 0.000 claims description 5
- 210000004978 chinese hamster ovary cell Anatomy 0.000 claims description 5
- 229930004094 glycosylphosphatidylinositol Natural products 0.000 claims description 5
- 239000003446 ligand Substances 0.000 claims description 4
- 102100030886 Complement receptor type 1 Human genes 0.000 claims description 3
- 102000004127 Cytokines Human genes 0.000 claims description 3
- 108090000695 Cytokines Proteins 0.000 claims description 3
- 108091008794 FGF receptors Proteins 0.000 claims description 3
- 101100118547 Gallus gallus EGFR gene Proteins 0.000 claims description 3
- 101000727061 Homo sapiens Complement receptor type 1 Proteins 0.000 claims description 3
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 claims description 3
- 239000000556 agonist Substances 0.000 claims description 3
- 230000003281 allosteric effect Effects 0.000 claims description 3
- 239000005557 antagonist Substances 0.000 claims description 3
- 239000003443 antiviral agent Substances 0.000 claims description 3
- 239000002872 contrast media Substances 0.000 claims description 3
- 231100000599 cytotoxic agent Toxicity 0.000 claims description 3
- 229940127089 cytotoxic agent Drugs 0.000 claims description 3
- 239000002254 cytotoxic agent Substances 0.000 claims description 3
- 239000003248 enzyme activator Substances 0.000 claims description 3
- 239000002532 enzyme inhibitor Substances 0.000 claims description 3
- 102000052178 fibroblast growth factor receptor activity proteins Human genes 0.000 claims description 3
- 239000003102 growth factor Substances 0.000 claims description 3
- 239000001963 growth medium Substances 0.000 claims description 3
- 239000005556 hormone Substances 0.000 claims description 3
- 229940088597 hormone Drugs 0.000 claims description 3
- 108700016418 rat Egfr Proteins 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 102000015696 Interleukins Human genes 0.000 claims description 2
- 108010063738 Interleukins Proteins 0.000 claims description 2
- 210000000805 cytoplasm Anatomy 0.000 claims description 2
- 101000942958 Mus musculus Leukemia inhibitory factor receptor Proteins 0.000 claims 1
- 108020004414 DNA Proteins 0.000 description 94
- 235000018102 proteins Nutrition 0.000 description 76
- 241001529936 Murinae Species 0.000 description 67
- 239000013612 plasmid Substances 0.000 description 47
- 125000003275 alpha amino acid group Chemical group 0.000 description 38
- 241000699660 Mus musculus Species 0.000 description 37
- 239000002773 nucleotide Substances 0.000 description 37
- 108010029485 Protein Isoforms Proteins 0.000 description 33
- 102000001708 Protein Isoforms Human genes 0.000 description 33
- 239000012528 membrane Substances 0.000 description 29
- 108091092195 Intron Proteins 0.000 description 27
- 108010052285 Membrane Proteins Proteins 0.000 description 26
- 125000003729 nucleotide group Chemical group 0.000 description 26
- 239000013604 expression vector Substances 0.000 description 25
- 239000002609 medium Substances 0.000 description 25
- 102000018697 Membrane Proteins Human genes 0.000 description 24
- 239000003550 marker Substances 0.000 description 24
- 108700024394 Exon Proteins 0.000 description 23
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 21
- 239000003623 enhancer Substances 0.000 description 21
- 239000002953 phosphate buffered saline Substances 0.000 description 21
- 108091026890 Coding region Proteins 0.000 description 19
- 108091028043 Nucleic acid sequence Proteins 0.000 description 19
- 241000223104 Trypanosoma Species 0.000 description 19
- 108091036066 Three prime untranslated region Proteins 0.000 description 18
- 230000035897 transcription Effects 0.000 description 18
- 238000013518 transcription Methods 0.000 description 18
- 241000223105 Trypanosoma brucei Species 0.000 description 16
- 239000000427 antigen Substances 0.000 description 16
- 108091007433 antigens Proteins 0.000 description 16
- 102000036639 antigens Human genes 0.000 description 16
- 108010047857 aspartylglycine Proteins 0.000 description 16
- 230000002103 transcriptional effect Effects 0.000 description 16
- 241000880493 Leptailurus serval Species 0.000 description 15
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 15
- 108010087924 alanylproline Proteins 0.000 description 15
- 108010077112 prolyl-proline Proteins 0.000 description 15
- 108010031719 prolyl-serine Proteins 0.000 description 15
- 238000001890 transfection Methods 0.000 description 15
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 14
- 241000700157 Rattus norvegicus Species 0.000 description 14
- HNDMFDBQXYZSRM-IHRRRGAJSA-N Ser-Val-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HNDMFDBQXYZSRM-IHRRRGAJSA-N 0.000 description 14
- 210000004899 c-terminal region Anatomy 0.000 description 14
- 238000004113 cell culture Methods 0.000 description 14
- 239000000523 sample Substances 0.000 description 14
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 13
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 13
- 108010050848 glycylleucine Proteins 0.000 description 13
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 12
- 238000002965 ELISA Methods 0.000 description 12
- 241000699666 Mus <mouse, genus> Species 0.000 description 12
- 239000012228 culture supernatant Substances 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 12
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 11
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 11
- 229940098773 bovine serum albumin Drugs 0.000 description 11
- 238000000684 flow cytometry Methods 0.000 description 11
- 108091033319 polynucleotide Proteins 0.000 description 11
- 102000040430 polynucleotide Human genes 0.000 description 11
- 239000002157 polynucleotide Substances 0.000 description 11
- 230000000717 retained effect Effects 0.000 description 11
- 108010073969 valyllysine Proteins 0.000 description 11
- 238000000636 Northern blotting Methods 0.000 description 10
- 241000700159 Rattus Species 0.000 description 10
- 235000001014 amino acid Nutrition 0.000 description 10
- 238000010276 construction Methods 0.000 description 10
- 108010057821 leucylproline Proteins 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 108091035707 Consensus sequence Proteins 0.000 description 9
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 9
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 9
- 108091027974 Mature messenger RNA Proteins 0.000 description 9
- 229940024606 amino acid Drugs 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 210000004962 mammalian cell Anatomy 0.000 description 9
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- 230000010076 replication Effects 0.000 description 9
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 8
- 102100024321 Alkaline phosphatase, placental type Human genes 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 8
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 8
- 102100039726 Immunoglobulin epsilon heavy chain Human genes 0.000 description 8
- 101710202749 Immunoglobulin epsilon heavy chain Proteins 0.000 description 8
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 8
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 150000001413 amino acids Chemical class 0.000 description 8
- 108010092854 aspartyllysine Proteins 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Natural products O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 8
- 108010010147 glycylglutamine Proteins 0.000 description 8
- 108010031345 placental alkaline phosphatase Proteins 0.000 description 8
- 239000013615 primer Substances 0.000 description 8
- 238000005406 washing Methods 0.000 description 8
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 7
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 7
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 7
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 7
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 7
- WQLJRNRLHWJIRW-KKUMJFAQSA-N Asn-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N)O WQLJRNRLHWJIRW-KKUMJFAQSA-N 0.000 description 7
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 7
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 7
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 7
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 7
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 7
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 7
- 102000019260 B-Cell Antigen Receptors Human genes 0.000 description 7
- 108010012919 B-Cell Antigen Receptors Proteins 0.000 description 7
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 7
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 7
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 7
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 7
- XUMFMAVDHQDATI-DCAQKATOSA-N Gln-Pro-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUMFMAVDHQDATI-DCAQKATOSA-N 0.000 description 7
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 7
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 7
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 7
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 7
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 7
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 7
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 7
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 7
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 7
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 7
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 7
- FULZDMOZUZKGQU-ONGXEEELSA-N Gly-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN FULZDMOZUZKGQU-ONGXEEELSA-N 0.000 description 7
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 7
- 101000961146 Homo sapiens Immunoglobulin heavy constant gamma 2 Proteins 0.000 description 7
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 7
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 7
- 102100026215 Immunoglobulin gamma-1 heavy chain Human genes 0.000 description 7
- 101710111858 Immunoglobulin gamma-1 heavy chain Proteins 0.000 description 7
- 102100039346 Immunoglobulin heavy constant gamma 2 Human genes 0.000 description 7
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 7
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 7
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 7
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 7
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 7
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 7
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 7
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 7
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 7
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 7
- RKIIYGUHIQJCBW-SRVKXCTJSA-N Met-His-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RKIIYGUHIQJCBW-SRVKXCTJSA-N 0.000 description 7
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 7
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 7
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 7
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 7
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 7
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 7
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 7
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 7
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 7
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 7
- QEDMOZUJTGEIBF-FXQIFTODSA-N Ser-Arg-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O QEDMOZUJTGEIBF-FXQIFTODSA-N 0.000 description 7
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 7
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 7
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 7
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 7
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 7
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 7
- JMBRNXUOLJFURW-BEAPCOKYSA-N Thr-Phe-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N)O JMBRNXUOLJFURW-BEAPCOKYSA-N 0.000 description 7
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 7
- XGFGVFMXDXALEV-XIRDDKMYSA-N Trp-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N XGFGVFMXDXALEV-XIRDDKMYSA-N 0.000 description 7
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 7
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 7
- GZUIDWDVMWZSMI-KKUMJFAQSA-N Tyr-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GZUIDWDVMWZSMI-KKUMJFAQSA-N 0.000 description 7
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 7
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 7
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 7
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 7
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 7
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 7
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 7
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 7
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 7
- 108010038633 aspartylglutamate Proteins 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 7
- 108010049041 glutamylalanine Proteins 0.000 description 7
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 7
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 7
- 230000012010 growth Effects 0.000 description 7
- 230000003834 intracellular effect Effects 0.000 description 7
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 7
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 7
- 108010091871 leucylmethionine Proteins 0.000 description 7
- 108010064235 lysylglycine Proteins 0.000 description 7
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 7
- 108010073101 phenylalanylleucine Proteins 0.000 description 7
- 108010070643 prolylglutamic acid Proteins 0.000 description 7
- 230000003248 secreting effect Effects 0.000 description 7
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 7
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 7
- 108010052774 valyl-lysyl-glycyl-phenylalanyl-tyrosine Proteins 0.000 description 7
- SRUUBQBAVNQZGJ-LAEOZQHASA-N Asn-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N SRUUBQBAVNQZGJ-LAEOZQHASA-N 0.000 description 6
- YMBAVNPKBWHDAW-CIUDSAMLSA-N Cys-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N YMBAVNPKBWHDAW-CIUDSAMLSA-N 0.000 description 6
- KSMSFCBQBQPFAD-GUBZILKMSA-N Cys-Pro-Pro Chemical compound SC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 KSMSFCBQBQPFAD-GUBZILKMSA-N 0.000 description 6
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 6
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 6
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 6
- FYVHHKMHFPMBBG-GUBZILKMSA-N His-Gln-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FYVHHKMHFPMBBG-GUBZILKMSA-N 0.000 description 6
- 101000840257 Homo sapiens Immunoglobulin kappa constant Proteins 0.000 description 6
- 102100039727 Immunoglobulin delta heavy chain Human genes 0.000 description 6
- 101710205091 Immunoglobulin delta heavy chain Proteins 0.000 description 6
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 6
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 6
- LUTDBHBIHHREDC-IHRRRGAJSA-N Lys-Pro-Lys Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O LUTDBHBIHHREDC-IHRRRGAJSA-N 0.000 description 6
- UGCIQUYEJIEHKX-GVXVVHGQSA-N Lys-Val-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O UGCIQUYEJIEHKX-GVXVVHGQSA-N 0.000 description 6
- JOXIIFVCSATTDH-IHPCNDPISA-N Phe-Asn-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JOXIIFVCSATTDH-IHPCNDPISA-N 0.000 description 6
- MHHQQZIFLWFZGR-DCAQKATOSA-N Pro-Lys-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O MHHQQZIFLWFZGR-DCAQKATOSA-N 0.000 description 6
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 6
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 6
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 6
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 6
- 239000002253 acid Substances 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 108010003700 lysyl aspartic acid Proteins 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- -1 nucleic acids Chemical class 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 241000283690 Bos taurus Species 0.000 description 5
- 241000283707 Capra Species 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 5
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 5
- 102000013463 Immunoglobulin Light Chains Human genes 0.000 description 5
- 108010065825 Immunoglobulin Light Chains Proteins 0.000 description 5
- 102100039352 Immunoglobulin heavy constant mu Human genes 0.000 description 5
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 108010022394 Threonine synthase Proteins 0.000 description 5
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 5
- 238000002835 absorbance Methods 0.000 description 5
- 229960000723 ampicillin Drugs 0.000 description 5
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 102000004419 dihydrofolate reductase Human genes 0.000 description 5
- 108020005243 folate receptor Proteins 0.000 description 5
- 102000006815 folate receptor Human genes 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 239000006228 supernatant Substances 0.000 description 5
- 230000005030 transcription termination Effects 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 239000011534 wash buffer Substances 0.000 description 5
- 241000699800 Cricetinae Species 0.000 description 4
- 241000287830 Gallus sp. Species 0.000 description 4
- 101000800116 Homo sapiens Thy-1 membrane glycoprotein Proteins 0.000 description 4
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 4
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 4
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 4
- 102100020985 Immunoglobulin mu heavy chain Human genes 0.000 description 4
- 101710099741 Immunoglobulin mu heavy chain Proteins 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- 239000004677 Nylon Substances 0.000 description 4
- 108700020796 Oncogene Proteins 0.000 description 4
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 4
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 4
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 4
- 239000004098 Tetracycline Substances 0.000 description 4
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 4
- 102100033523 Thy-1 membrane glycoprotein Human genes 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 238000000376 autoradiography Methods 0.000 description 4
- 239000011324 bead Substances 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 102000006834 complement receptors Human genes 0.000 description 4
- 108010047295 complement receptors Proteins 0.000 description 4
- 230000001086 cytosolic effect Effects 0.000 description 4
- 239000013024 dilution buffer Substances 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 238000001114 immunoprecipitation Methods 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 210000004698 lymphocyte Anatomy 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 229920001778 nylon Polymers 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 4
- 229960002180 tetracycline Drugs 0.000 description 4
- 229930101283 tetracycline Natural products 0.000 description 4
- 235000019364 tetracycline Nutrition 0.000 description 4
- 150000003522 tetracyclines Chemical class 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 3
- 108020005345 3' Untranslated Regions Proteins 0.000 description 3
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 3
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 3
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 3
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 3
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 3
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 3
- 101710137189 Amyloid-beta A4 protein Proteins 0.000 description 3
- 102100022704 Amyloid-beta precursor protein Human genes 0.000 description 3
- 101710151993 Amyloid-beta precursor protein Proteins 0.000 description 3
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 3
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 239000003155 DNA primer Substances 0.000 description 3
- 230000033616 DNA repair Effects 0.000 description 3
- 108090000204 Dipeptidase 1 Proteins 0.000 description 3
- 108010016626 Dipeptides Proteins 0.000 description 3
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 3
- 101710111383 Gene 64 protein Proteins 0.000 description 3
- WQWMZOIPXWSZNE-WDSKDSINSA-N Gln-Asp-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O WQWMZOIPXWSZNE-WDSKDSINSA-N 0.000 description 3
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 3
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 3
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 3
- 102000010956 Glypican Human genes 0.000 description 3
- 108050001154 Glypican Proteins 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 3
- 101000897400 Homo sapiens CD59 glycoprotein Proteins 0.000 description 3
- 101001022847 Homo sapiens E3 ubiquitin-protein ligase MYCBP2 Proteins 0.000 description 3
- 101001065559 Homo sapiens Lymphocyte antigen 6D Proteins 0.000 description 3
- 101001126102 Homo sapiens Pleckstrin homology domain-containing family B member 1 Proteins 0.000 description 3
- 101150107391 IGKC gene Proteins 0.000 description 3
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 3
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 3
- 102100029572 Immunoglobulin kappa constant Human genes 0.000 description 3
- 108010025815 Kanamycin Kinase Proteins 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 3
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 3
- 102100032131 Lymphocyte antigen 6E Human genes 0.000 description 3
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 3
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 3
- 102000003992 Peroxidases Human genes 0.000 description 3
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 3
- 108091000054 Prion Proteins 0.000 description 3
- 102000029797 Prion Human genes 0.000 description 3
- 101100463675 Rattus norvegicus Bcan gene Proteins 0.000 description 3
- 101000589616 Rattus norvegicus T-cell ecto-ADP-ribosyltransferase 2 Proteins 0.000 description 3
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 3
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 3
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 3
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 3
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 3
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 3
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 3
- 241000251735 Torpedo marmorata Species 0.000 description 3
- 108700009124 Transcription Initiation Site Proteins 0.000 description 3
- BYSKNUASOAGJSS-NQCBNZPSSA-N Trp-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N BYSKNUASOAGJSS-NQCBNZPSSA-N 0.000 description 3
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 3
- 241000223107 Trypanosoma congolense Species 0.000 description 3
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 3
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 3
- 108010000134 Vascular Cell Adhesion Molecule-1 Proteins 0.000 description 3
- 102100023543 Vascular cell adhesion protein 1 Human genes 0.000 description 3
- 238000001042 affinity chromatography Methods 0.000 description 3
- 238000000246 agarose gel electrophoresis Methods 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- DZHSAHHDTRWUTF-SIQRNXPUSA-N amyloid-beta polypeptide 42 Chemical compound C([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O)[C@@H](C)CC)C(C)C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O)C(C)C)C(C)C)C1=CC=CC=C1 DZHSAHHDTRWUTF-SIQRNXPUSA-N 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000004440 column chromatography Methods 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 230000001900 immune effect Effects 0.000 description 3
- 238000003119 immunoblot Methods 0.000 description 3
- 238000010820 immunofluorescence microscopy Methods 0.000 description 3
- 239000000411 inducer Substances 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 210000004185 liver Anatomy 0.000 description 3
- 108010038320 lysylphenylalanine Proteins 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000000386 microscopy Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 108040007629 peroxidase activity proteins Proteins 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 108010037277 thymic shared antigen-1 Proteins 0.000 description 3
- 230000005026 transcription initiation Effects 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- 108010022752 Acetylcholinesterase Proteins 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 2
- KQFRUSHJPKXBMB-BHDSKKPTSA-N Ala-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 KQFRUSHJPKXBMB-BHDSKKPTSA-N 0.000 description 2
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 2
- HUUOZYZWNCXTFK-INTQDDNPSA-N Ala-His-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N HUUOZYZWNCXTFK-INTQDDNPSA-N 0.000 description 2
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 2
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 2
- 108020004217 Aminoglycoside phosphotransferase Proteins 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 2
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 2
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 2
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 2
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000222122 Candida albicans Species 0.000 description 2
- 108091062157 Cis-regulatory element Proteins 0.000 description 2
- 241001505967 Cricetinae gen. sp. Species 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 102000001301 EGF receptor Human genes 0.000 description 2
- 108090000371 Esterases Proteins 0.000 description 2
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 2
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 2
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 2
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 2
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 2
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 2
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 2
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 2
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 101710181600 Glycoprotein gp2 Proteins 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 101000801359 Homo sapiens Acetylcholinesterase Proteins 0.000 description 2
- 101000980814 Homo sapiens CAMPATH-1 antigen Proteins 0.000 description 2
- 101100386242 Homo sapiens CD55 gene Proteins 0.000 description 2
- 101000909520 Homo sapiens Contactin-1 Proteins 0.000 description 2
- 101000827746 Homo sapiens Fibroblast growth factor receptor 1 Proteins 0.000 description 2
- 101000961156 Homo sapiens Immunoglobulin heavy constant gamma 1 Proteins 0.000 description 2
- 101000961145 Homo sapiens Immunoglobulin heavy constant gamma 3 Proteins 0.000 description 2
- 101000961149 Homo sapiens Immunoglobulin heavy constant gamma 4 Proteins 0.000 description 2
- 101001033312 Homo sapiens Interleukin-4 receptor subunit alpha Proteins 0.000 description 2
- 101000688216 Homo sapiens Intestinal-type alkaline phosphatase Proteins 0.000 description 2
- 101000638886 Homo sapiens Urokinase-type plasminogen activator Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 102100026120 IgG receptor FcRn large subunit p51 Human genes 0.000 description 2
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 2
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 2
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 2
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 2
- 108700005091 Immunoglobulin Genes Proteins 0.000 description 2
- 108700029228 Immunoglobulin Heavy Chain Genes Proteins 0.000 description 2
- 102100039345 Immunoglobulin heavy constant gamma 1 Human genes 0.000 description 2
- 102100039348 Immunoglobulin heavy constant gamma 3 Human genes 0.000 description 2
- 102100039347 Immunoglobulin heavy constant gamma 4 Human genes 0.000 description 2
- SIKJAQJRHWYJAI-UHFFFAOYSA-N Indole Chemical compound C1=CC=C2NC=CC2=C1 SIKJAQJRHWYJAI-UHFFFAOYSA-N 0.000 description 2
- 101000668058 Infectious salmon anemia virus (isolate Atlantic salmon/Norway/810/9/99) RNA-directed RNA polymerase catalytic subunit Proteins 0.000 description 2
- 102000010787 Interleukin-4 Receptors Human genes 0.000 description 2
- 108010038486 Interleukin-4 Receptors Proteins 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- 102000007547 Laminin Human genes 0.000 description 2
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 2
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 2
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 2
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- SUHOOTKUPISOBE-UHFFFAOYSA-N O-phosphoethanolamine Chemical group NCCOP(O)(O)=O SUHOOTKUPISOBE-UHFFFAOYSA-N 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 2
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 2
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- UNBFGVQVQGXXCK-KKUMJFAQSA-N Phe-Ser-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O UNBFGVQVQGXXCK-KKUMJFAQSA-N 0.000 description 2
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 2
- 101100005707 Rattus norvegicus Cd48 gene Proteins 0.000 description 2
- 101100029566 Rattus norvegicus Rabggta gene Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108020005091 Replication Origin Proteins 0.000 description 2
- 108091027981 Response element Proteins 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- LOKXAXAESFYFAX-CIUDSAMLSA-N Ser-His-Cys Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CS)C(O)=O)CC1=CN=CN1 LOKXAXAESFYFAX-CIUDSAMLSA-N 0.000 description 2
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 2
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- BYCVMHKULKRVPV-GUBZILKMSA-N Ser-Lys-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O BYCVMHKULKRVPV-GUBZILKMSA-N 0.000 description 2
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 2
- 101800001707 Spacer peptide Proteins 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- KRPKYGOFYUNIGM-XVSYOHENSA-N Thr-Asp-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O KRPKYGOFYUNIGM-XVSYOHENSA-N 0.000 description 2
- ZLNWJMRLHLGKFX-SVSWQMSJSA-N Thr-Cys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZLNWJMRLHLGKFX-SVSWQMSJSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- 108010031650 Thy-1 Antigens Proteins 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- WMBFONUKQXGLMU-WDSOQIARSA-N Trp-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WMBFONUKQXGLMU-WDSOQIARSA-N 0.000 description 2
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 2
- CJDZKZFMAXGUOJ-IHRRRGAJSA-N Val-Cys-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N CJDZKZFMAXGUOJ-IHRRRGAJSA-N 0.000 description 2
- APEBUJBRGCMMHP-HJWJTTGWSA-N Val-Ile-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 APEBUJBRGCMMHP-HJWJTTGWSA-N 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- ZXYPHBKIZLAQTL-QXEWZRGKSA-N Val-Pro-Asp Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N ZXYPHBKIZLAQTL-QXEWZRGKSA-N 0.000 description 2
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 2
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- OIPILFWXSMYKGL-UHFFFAOYSA-N acetylcholine Chemical compound CC(=O)OCC[N+](C)(C)C OIPILFWXSMYKGL-UHFFFAOYSA-N 0.000 description 2
- 229960004373 acetylcholine Drugs 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 229960002648 alanylglutamine Drugs 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 102000006646 aminoglycoside phosphotransferase Human genes 0.000 description 2
- 230000003698 anagen phase Effects 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 210000000628 antibody-producing cell Anatomy 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 210000004900 c-terminal fragment Anatomy 0.000 description 2
- 229940095731 candida albicans Drugs 0.000 description 2
- 125000000837 carbohydrate group Chemical group 0.000 description 2
- 230000015861 cell surface binding Effects 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 239000013599 cloning vector Substances 0.000 description 2
- 108010004073 cysteinylcysteine Proteins 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 102000005396 glutamine synthetase Human genes 0.000 description 2
- 108020002326 glutamine synthetase Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 102000053119 human ALPI Human genes 0.000 description 2
- 102000043738 human CD52 Human genes 0.000 description 2
- 102000051442 human CD59 Human genes 0.000 description 2
- 102000053184 human CNTN1 Human genes 0.000 description 2
- 102000054663 human IL4R Human genes 0.000 description 2
- 102000056088 human LY6D Human genes 0.000 description 2
- 102000056831 human PLAU Human genes 0.000 description 2
- 229940096329 human immunoglobulin a Drugs 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000000968 intestinal effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 238000007431 microscopic evaluation Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- WLGOTMXHWBRTJA-GACYYNSASA-N murodermin Chemical compound C([C@H]1C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@H](C(=O)N[C@H](C(NCC(=O)N1)=O)[C@@H](C)CC)C(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H]1NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC=2C=CC(O)=CC=2)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CC=2NC=NC=2)NC(=O)[C@H](CCSC)NC(=O)[C@@H]2CSSC[C@@H](C(=O)N3CCC[C@H]3C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC=3C=CC(O)=CC=3)C(=O)N[C@H](C(N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)NCC(=O)N[C@H](C(=O)N2)C(C)C)=O)CSSC1)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=C(O)C=C1 WLGOTMXHWBRTJA-GACYYNSASA-N 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- HEGSGKPQLMEBJL-UHFFFAOYSA-N n-octyl beta-D-glucopyranoside Natural products CCCCCCCCOC1OC(CO)C(O)C(O)C1O HEGSGKPQLMEBJL-UHFFFAOYSA-N 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 230000009871 nonspecific binding Effects 0.000 description 2
- HEGSGKPQLMEBJL-RKQHYHRCSA-N octyl beta-D-glucopyranoside Chemical compound CCCCCCCCO[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O HEGSGKPQLMEBJL-RKQHYHRCSA-N 0.000 description 2
- 108010084572 phenylalanyl-valine Proteins 0.000 description 2
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000008844 regulatory mechanism Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000004062 sedimentation Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- ZTOJFFHGPLIVKC-YAFCTCPESA-N (2e)-3-ethyl-2-[(z)-(3-ethyl-6-sulfo-1,3-benzothiazol-2-ylidene)hydrazinylidene]-1,3-benzothiazole-6-sulfonic acid Chemical compound S\1C2=CC(S(O)(=O)=O)=CC=C2N(CC)C/1=N/N=C1/SC2=CC(S(O)(=O)=O)=CC=C2N1CC ZTOJFFHGPLIVKC-YAFCTCPESA-N 0.000 description 1
- LCTORNIWLGOBPB-GASJEMHNSA-N (3r,4s,5s,6r)-2-amino-6-(hydroxymethyl)oxane-2,3,4,5-tetrol Chemical group NC1(O)O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O LCTORNIWLGOBPB-GASJEMHNSA-N 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- SCPRYBYMKVYVND-UHFFFAOYSA-N 2-[[2-[[1-(2-amino-4-methylpentanoyl)pyrrolidine-2-carbonyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(O)=O SCPRYBYMKVYVND-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- ZTOJFFHGPLIVKC-UHFFFAOYSA-N 3-ethyl-2-[(3-ethyl-6-sulfo-1,3-benzothiazol-2-ylidene)hydrazinylidene]-1,3-benzothiazole-6-sulfonic acid Chemical compound S1C2=CC(S(O)(=O)=O)=CC=C2N(CC)C1=NN=C1SC2=CC(S(O)(=O)=O)=CC=C2N1CC ZTOJFFHGPLIVKC-UHFFFAOYSA-N 0.000 description 1
- IMIZPWSVYADSCN-UHFFFAOYSA-N 4-methyl-2-[[4-methyl-2-[[4-methyl-2-(pyrrolidine-2-carbonylamino)pentanoyl]amino]pentanoyl]amino]pentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C1CCCN1 IMIZPWSVYADSCN-UHFFFAOYSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical group NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- VIGKUFXFTPWYER-BIIVOSGPSA-N Ala-Cys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N VIGKUFXFTPWYER-BIIVOSGPSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- MAEQBGQTDWDSJQ-LSJOCFKGSA-N Ala-Met-His Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MAEQBGQTDWDSJQ-LSJOCFKGSA-N 0.000 description 1
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 1
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- 239000012103 Alexa Fluor 488 Substances 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- YQGZIRIYGHNSQO-ZPFDUUQYSA-N Arg-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YQGZIRIYGHNSQO-ZPFDUUQYSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- QHBMKQWOIYJYMI-BYULHYEWSA-N Asn-Asn-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O QHBMKQWOIYJYMI-BYULHYEWSA-N 0.000 description 1
- ZPMNECSEJXXNBE-CIUDSAMLSA-N Asn-Cys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ZPMNECSEJXXNBE-CIUDSAMLSA-N 0.000 description 1
- PPMTUXJSQDNUDE-CIUDSAMLSA-N Asn-Glu-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PPMTUXJSQDNUDE-CIUDSAMLSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- AITKTFCQOBRJTG-CIUDSAMLSA-N Asp-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N AITKTFCQOBRJTG-CIUDSAMLSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 102100023927 Asparagine synthetase [glutamine-hydrolyzing] Human genes 0.000 description 1
- 108010070255 Aspartate-ammonia ligase Proteins 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 102100027205 B-cell antigen receptor complex-associated protein alpha chain Human genes 0.000 description 1
- 101710095183 B-cell antigen receptor complex-associated protein alpha chain Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 108010038940 CD48 Antigen Proteins 0.000 description 1
- 102000015713 CD48 Antigen Human genes 0.000 description 1
- 108010065524 CD52 Antigen Proteins 0.000 description 1
- 102000013135 CD52 Antigen Human genes 0.000 description 1
- 102100022002 CD59 glycoprotein Human genes 0.000 description 1
- 102000016289 Cell Adhesion Molecules Human genes 0.000 description 1
- 108010067225 Cell Adhesion Molecules Proteins 0.000 description 1
- 241000238366 Cephalopoda Species 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 102100025680 Complement decay-accelerating factor Human genes 0.000 description 1
- 108010087195 Contactin 1 Proteins 0.000 description 1
- 102100024326 Contactin-1 Human genes 0.000 description 1
- 208000034656 Contusions Diseases 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 1
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 1
- IVOMOUWHDPKRLL-KQYNXXCUSA-N Cyclic adenosine monophosphate Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-KQYNXXCUSA-N 0.000 description 1
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 1
- HIPHJNWPLMUBQQ-ACZMJKKPSA-N Cys-Cys-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(N)=O HIPHJNWPLMUBQQ-ACZMJKKPSA-N 0.000 description 1
- UXUSHQYYQCZWET-WDSKDSINSA-N Cys-Glu-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O UXUSHQYYQCZWET-WDSKDSINSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 1
- VRJZMZGGAKVSIQ-SRVKXCTJSA-N Cys-Tyr-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VRJZMZGGAKVSIQ-SRVKXCTJSA-N 0.000 description 1
- ALTQTAKGRFLRLR-GUBZILKMSA-N Cys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N ALTQTAKGRFLRLR-GUBZILKMSA-N 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 241001269524 Dura Species 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 108010087819 Fc receptors Proteins 0.000 description 1
- 102000009109 Fc receptors Human genes 0.000 description 1
- 108700030156 Gallus gallus EOS47 Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- MFLMFRZBAJSGHK-ACZMJKKPSA-N Gln-Cys-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N MFLMFRZBAJSGHK-ACZMJKKPSA-N 0.000 description 1
- GPISLLFQNHELLK-DCAQKATOSA-N Gln-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GPISLLFQNHELLK-DCAQKATOSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- GTBXHETZPUURJE-KKUMJFAQSA-N Gln-Tyr-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GTBXHETZPUURJE-KKUMJFAQSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- DXVOKNVIKORTHQ-GUBZILKMSA-N Glu-Pro-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O DXVOKNVIKORTHQ-GUBZILKMSA-N 0.000 description 1
- PAZQYODKOZHXGA-SRVKXCTJSA-N Glu-Pro-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O PAZQYODKOZHXGA-SRVKXCTJSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- GTFYQOVVVJASOA-ACZMJKKPSA-N Glu-Ser-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N GTFYQOVVVJASOA-ACZMJKKPSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- FQKKPCWTZZEDIC-XPUUQOCRSA-N Gly-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 FQKKPCWTZZEDIC-XPUUQOCRSA-N 0.000 description 1
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- ISSDODCYBOWWIP-GJZGRUSLSA-N Gly-Pro-Trp Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ISSDODCYBOWWIP-GJZGRUSLSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 1
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 102100020948 Growth hormone receptor Human genes 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 102100031547 HLA class II histocompatibility antigen, DO alpha chain Human genes 0.000 description 1
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 1
- IDNNYVGVSZMQTK-IHRRRGAJSA-N His-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N IDNNYVGVSZMQTK-IHRRRGAJSA-N 0.000 description 1
- MWWOPNQSBXEUHO-ULQDDVLXSA-N His-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 MWWOPNQSBXEUHO-ULQDDVLXSA-N 0.000 description 1
- VHHYJBSXXMPQGZ-AVGNSLFASA-N His-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N VHHYJBSXXMPQGZ-AVGNSLFASA-N 0.000 description 1
- SDTPKSOWFXBACN-GUBZILKMSA-N His-Glu-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O SDTPKSOWFXBACN-GUBZILKMSA-N 0.000 description 1
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 1
- BDFCIKANUNMFGB-PMVVWTBXSA-N His-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 BDFCIKANUNMFGB-PMVVWTBXSA-N 0.000 description 1
- MJUUWJJEUOBDGW-IHRRRGAJSA-N His-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MJUUWJJEUOBDGW-IHRRRGAJSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 1
- PGRPSOUCWRBWKZ-DLOVCJGASA-N His-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 PGRPSOUCWRBWKZ-DLOVCJGASA-N 0.000 description 1
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 1
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 1
- FHKZHRMERJUXRJ-DCAQKATOSA-N His-Ser-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 FHKZHRMERJUXRJ-DCAQKATOSA-N 0.000 description 1
- HZWWOGWOBQBETJ-CUJWVEQBSA-N His-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O HZWWOGWOBQBETJ-CUJWVEQBSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000856022 Homo sapiens Complement decay-accelerating factor Proteins 0.000 description 1
- 101000866278 Homo sapiens HLA class II histocompatibility antigen, DO alpha chain Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 101150002194 IGHG3 gene Proteins 0.000 description 1
- 101150066679 IGHG4 gene Proteins 0.000 description 1
- 101710177940 IgG receptor FcRn large subunit p51 Proteins 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- NULSANWBUWLTKN-NAKRPEOUSA-N Ile-Arg-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N NULSANWBUWLTKN-NAKRPEOUSA-N 0.000 description 1
- VCYVLFAWCJRXFT-HJPIBITLSA-N Ile-Cys-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N VCYVLFAWCJRXFT-HJPIBITLSA-N 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 1
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 1
- OWSWUWDMSNXTNE-GMOBBJLQSA-N Ile-Pro-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N OWSWUWDMSNXTNE-GMOBBJLQSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- ZQISRDCJNBUVMM-UHFFFAOYSA-N L-Histidinol Natural products OCC(N)CC1=CN=CN1 ZQISRDCJNBUVMM-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- ZQISRDCJNBUVMM-YFKPBYRVSA-N L-histidinol Chemical compound OC[C@@H](N)CC1=CNC=N1 ZQISRDCJNBUVMM-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- JRJLGNFWYFSJHB-HOCLYGCPSA-N Leu-Gly-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JRJLGNFWYFSJHB-HOCLYGCPSA-N 0.000 description 1
- BTNXKBVLWJBTNR-SRVKXCTJSA-N Leu-His-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O BTNXKBVLWJBTNR-SRVKXCTJSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- OMHLATXVNQSALM-FQUUOJAGSA-N Leu-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(C)C)N OMHLATXVNQSALM-FQUUOJAGSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 1
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 1
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 1
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- CNWDWAMPKVYJJB-NUTKFTJISA-N Leu-Trp-Ala Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CNWDWAMPKVYJJB-NUTKFTJISA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- SUYRAPCRSCCPAK-VFAJRCTISA-N Leu-Trp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUYRAPCRSCCPAK-VFAJRCTISA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102100032127 Lymphocyte antigen 6D Human genes 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 1
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 1
- VHTOGMKQXXJOHG-RHYQMDGZSA-N Lys-Thr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VHTOGMKQXXJOHG-RHYQMDGZSA-N 0.000 description 1
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 1
- TZLYIHDABYBOCJ-FXQIFTODSA-N Met-Asp-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O TZLYIHDABYBOCJ-FXQIFTODSA-N 0.000 description 1
- AEQVPPGEJJBFEE-CYDGBPFRSA-N Met-Ile-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEQVPPGEJJBFEE-CYDGBPFRSA-N 0.000 description 1
- WPTDJKDGICUFCP-XUXIUFHCSA-N Met-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCSC)N WPTDJKDGICUFCP-XUXIUFHCSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- FDGAMQVRGORBDV-GUBZILKMSA-N Met-Ser-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCSC FDGAMQVRGORBDV-GUBZILKMSA-N 0.000 description 1
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 1
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102000001621 Mucoproteins Human genes 0.000 description 1
- 108010093825 Mucoproteins Proteins 0.000 description 1
- 101000969137 Mus musculus Metallothionein-1 Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 102100021852 Neuronal cell adhesion molecule Human genes 0.000 description 1
- 101710130688 Neuronal cell adhesion molecule Proteins 0.000 description 1
- 102000011931 Nucleoproteins Human genes 0.000 description 1
- 108010061100 Nucleoproteins Proteins 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- LBSARGIQACMGDF-WBAXXEDZSA-N Phe-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 LBSARGIQACMGDF-WBAXXEDZSA-N 0.000 description 1
- HPECNYCQLSVCHH-BZSNNMDCSA-N Phe-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N HPECNYCQLSVCHH-BZSNNMDCSA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 1
- KPEIBEPEUAZWNS-ULQDDVLXSA-N Phe-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KPEIBEPEUAZWNS-ULQDDVLXSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- BPIFSOUEUYDJRM-DCPHZVHLSA-N Phe-Trp-Ala Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C)C(O)=O)C1=CC=CC=C1 BPIFSOUEUYDJRM-DCPHZVHLSA-N 0.000 description 1
- FRMKIPSIZSFTTE-HJOGWXRNSA-N Phe-Tyr-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FRMKIPSIZSFTTE-HJOGWXRNSA-N 0.000 description 1
- ZOGICTVLQDWPER-UFYCRDLUSA-N Phe-Tyr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O ZOGICTVLQDWPER-UFYCRDLUSA-N 0.000 description 1
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 108010001014 Plasminogen Activators Proteins 0.000 description 1
- 102000001938 Plasminogen Activators Human genes 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- NUZHSNLQJDYSRW-BZSNNMDCSA-N Pro-Arg-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NUZHSNLQJDYSRW-BZSNNMDCSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- FEPSEIDIPBMIOS-QXEWZRGKSA-N Pro-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 FEPSEIDIPBMIOS-QXEWZRGKSA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- SRBFGSGDNNQABI-FHWLQOOXSA-N Pro-Leu-Trp Chemical compound N([C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C(=O)[C@@H]1CCCN1 SRBFGSGDNNQABI-FHWLQOOXSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- MHBSUKYVBZVQRW-HJWJTTGWSA-N Pro-Phe-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MHBSUKYVBZVQRW-HJWJTTGWSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- JDJMFMVVJHLWDP-UNQGMJICSA-N Pro-Thr-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JDJMFMVVJHLWDP-UNQGMJICSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010071563 Proto-Oncogene Proteins c-fos Proteins 0.000 description 1
- 102000007568 Proto-Oncogene Proteins c-fos Human genes 0.000 description 1
- 101150002602 Psap gene Proteins 0.000 description 1
- 239000012979 RPMI medium Substances 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 108091058545 Secretory proteins Proteins 0.000 description 1
- 102000040739 Secretory proteins Human genes 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 1
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- DINQYZRMXGWWTG-GUBZILKMSA-N Ser-Pro-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DINQYZRMXGWWTG-GUBZILKMSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108700025832 Serum Response Element Proteins 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 108010068542 Somatotropin Receptors Proteins 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- IGGFFPOIFHZYKC-PBCZWWQYSA-N Thr-His-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O IGGFFPOIFHZYKC-PBCZWWQYSA-N 0.000 description 1
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- XYFISNXATOERFZ-OSUNSFLBSA-N Thr-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XYFISNXATOERFZ-OSUNSFLBSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- VUXIQSUQQYNLJP-XAVMHZPKSA-N Thr-Ser-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N)O VUXIQSUQQYNLJP-XAVMHZPKSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- ZEJBJDHSQPOVJV-UAXMHLISSA-N Thr-Trp-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZEJBJDHSQPOVJV-UAXMHLISSA-N 0.000 description 1
- AKHDFZHUPGVFEJ-YEPSODPASA-N Thr-Val-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AKHDFZHUPGVFEJ-YEPSODPASA-N 0.000 description 1
- ILUOMMDDGREELW-OSUNSFLBSA-N Thr-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O ILUOMMDDGREELW-OSUNSFLBSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102100029677 Trehalase Human genes 0.000 description 1
- 108010087472 Trehalase Proteins 0.000 description 1
- NKUIXQOJUAEIET-AQZXSJQPSA-N Trp-Asp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 NKUIXQOJUAEIET-AQZXSJQPSA-N 0.000 description 1
- WLQRIHCMPFHGKP-PMVMPFDFSA-N Trp-Leu-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CC(C)C)C(O)=O)C1=CC=CC=C1 WLQRIHCMPFHGKP-PMVMPFDFSA-N 0.000 description 1
- SSSDKJMQMZTMJP-BVSLBCMMSA-N Trp-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 SSSDKJMQMZTMJP-BVSLBCMMSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108010075344 Tryptophan synthase Proteins 0.000 description 1
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- IVOMOUWHDPKRLL-UHFFFAOYSA-N UNPD107823 Natural products O1C2COP(O)(=O)OC2C(O)C1N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-UHFFFAOYSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- DBMMKEHYWIZTPN-JYJNAYRXSA-N Val-Cys-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N DBMMKEHYWIZTPN-JYJNAYRXSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- MJXNDRCLGDSBBE-FHWLQOOXSA-N Val-His-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N MJXNDRCLGDSBBE-FHWLQOOXSA-N 0.000 description 1
- KNYHAWKHFQRYOX-PYJNHQTQSA-N Val-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N KNYHAWKHFQRYOX-PYJNHQTQSA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- USXYVSTVPHELAF-RCWTZXSCSA-N Val-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N)O USXYVSTVPHELAF-RCWTZXSCSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical class N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 235000008206 alpha-amino acids Nutrition 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 230000003141 anti-fusion Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 238000003705 background correction Methods 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 208000034526 bruise Diseases 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 150000001733 carboxylic acid esters Chemical class 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000004154 complement system Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 1
- 238000007821 culture assay Methods 0.000 description 1
- 229940095074 cyclic amp Drugs 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 210000001951 dura mater Anatomy 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 108010038082 heparin proteoglycan Proteins 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 108010002685 hygromycin-B kinase Proteins 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- PZOUSPYUWWUPPK-UHFFFAOYSA-N indole Natural products CC1=CC=CC2=C1C=CN2 PZOUSPYUWWUPPK-UHFFFAOYSA-N 0.000 description 1
- RKJUIXBNRJVNHR-UHFFFAOYSA-N indolenine Natural products C1=CC=C2CC=NC2=C1 RKJUIXBNRJVNHR-UHFFFAOYSA-N 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- 238000010212 intracellular staining Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- HPNSFSBZBAHARI-UHFFFAOYSA-N micophenolic acid Natural products OC1=C(CC=C(C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-UHFFFAOYSA-N 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- HPNSFSBZBAHARI-RUDMXATFSA-N mycophenolic acid Chemical compound OC1=C(C\C=C(/C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-RUDMXATFSA-N 0.000 description 1
- 229960000951 mycophenolic acid Drugs 0.000 description 1
- 108010068617 neonatal Fc receptor Proteins 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000023362 neuron cell-cell adhesion Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010085336 phosphoribosyl-AMP cyclohydrolase Proteins 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 229940127126 plasminogen activator Drugs 0.000 description 1
- 125000003367 polycyclic group Chemical group 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010067988 prolactin-binding protein Proteins 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 238000003118 sandwich ELISA Methods 0.000 description 1
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 229940043517 specific immunoglobulins Drugs 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 108091012236 urea binding proteins Proteins 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/06—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies from serum
- C07K16/065—Purification, fragmentation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/03—Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Cell Biology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 a) 인 프레임 번역 정지 코돈(in frame translational stop codon) 없이 이종 폴리펩티들 코딩하는 제1 핵산, b) 5' 스플라이스 공여 부위로 시작되고 인 프레임 정지 코돈 및 폴리아데닐화 신호를 포함하는 3' 스플라이스 수용 부위로 종결되는 제2 핵산, c) i) 경막 도메인의 적어도 단편 또는 ii) GPI-고착자(anchor)에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산에 관한 것이다.
Description
본 발명은 폴리펩티드 제조 분야에 관한 것이다. 본원은 택일적으로 스플라이싱될 수 있는(alternatively spliceable) 핵산을 포함하는 핵산; 이 핵산을 포함하는 세포; 이종 폴리펩티드를 코딩하는 제1 핵산, 택일적으로 스플라이싱될 수 있는 핵산을 포함하는 제2 핵산, 및 경막 도메인의 적어도 단편 또는 글리코실포스파티딜이노시톨(GPI)-고착자(anchor)에 대한 신호 펩티드를 코딩하는 제3 핵산을 포함하는 핵산을 사용하여 이종 폴리펩티드를 발현하는 세포를 단리하는 방법; 및 이종 폴리펩티드의 제조 방법을 개시한다.
재조합 폴리펩티드의 제조를 위한 발현 시스템은 당업계에 잘 공지되어 있고 예컨대, 문헌(Marino, M.H., Biopharm. 2 (1989) 18-33; Goeddel, D.V., et al, Methods Enzymol. 185 (1990) 3-7; Wurm, F., and Bernard, A., Curr. Opin. Biotechnol. 10 (1999) 156-160)에 기재되어 있다. 약학 분야에서 사용되는 폴리펩티드 및 단백질의 제조를 위해, 바람직하게는 포유동물 숙주 세포, 예컨대, CHO 세포, BHK 세포, NS0 세포, Sp2/0 세포, COS 세포, HEK 세포, PER.C6® 세포 등이 사용된다. 폴리펩티드를 코딩하는 핵산은 바람직하게는 핵산, 예컨대, 발현 벡터 내에 포함되어 숙주 세포 내로 도입된다. 발현 벡터의 필수 요소들은 예를 들어, 대장균(Escherichia coli)의 경우 복제 기점 및 선별 마커, 진핵 선별 마커, 및 프로모터, 구조 유전자 및 전사 종결서열(폴리아데닐화 신호를 포함함)를 각각 포함하는, 원하는 구조 유전자(들)의 발현을 위한 하나 이상의 발현 카세트를 포함하는 원핵 플라스미드 증폭 단위체이다. 포유동물 세포에서의 일시적인 발현의 경우, 포유동물 세포의 복제 기점, 예컨대, SV40 Ori 또는 EBV의 OriP가 포함될 수 있다. 기본(constitutive) 프로모터 또는 유도성 프로모터를 프로모터로서 선택할 수 있다. 최적화된 전사를 위해서는, 코작(Kozak) 서열이 5' 비번역 영역(5' UTR) 내에 포함될 수 있다. mRNA 프로세싱, 특히 전사 종결 및 전구-메신저 RNA(전구-mRNA) 스플라이싱의 경우, 구조 유전자의 구성(엑손-인트론-구성)에 따라 mRNA 스플라이싱 신호 및 폴리아데닐화 신호가 포함될 수 있다.
유전자의 발현은 일시적 또는 영구적 발현으로서 수행된다. 원하는 폴리펩티드는 폴리펩티드가 세포로부터 세포외 배지로 수송/분비되는 데 필수적인 N-말단 연장부(extension)(신호 서열로도 공지되어 있음)를 포함하는 분비 폴리펩티드 또는 세포질 폴리펩티드일 수 있다.
폴리펩티드의 대규모 제조를 위해서는, 고 생산성 세포주가 확립되어야 한다. 숙주 세포주, 예컨대, CHO 세포, BHK 세포, NS0 세포, Sp2/0 세포, COS 세포, PER.C6® 세포, HEK 세포의 형질감염 후, 일반적으로 상이한 특성을 가진 다수의 클론이 수득되는데, 이는 예를 들어, 일시적으로 형질감염되거나 안정하게 삽입된 플라스미드로부터 발현된 폴리펩티드의 다양성 때문이다. 선별을 위해서는, 세포 내로 도입된 핵산이 선별 마커, 예컨대, 독성 물질에 대한 내성을 부여하는 유전자를 추가로 보유한다.
형질감염 후, 적절한 선별 배지에서의 생장에 의해 고 생산성 클론이 단리되어야 한다. 이것은 시간이 소요되고 결과적으로 비용이 소요된다. 이 문제점을 해결하기 위해 여러 방법이 개발되어 왔다.
이 방법들 중 하나는 유전자 증폭이다. 유전자 증폭에서, 디하이드로폴레이트 리덕테이즈(dihydrofolate reductase; DHFR)가 결핍된 세포를, DHFR 단백질의 발현을 위한 제1 발현 카세트 및 원하는 이종 폴리펩티드의 발현을 위한 제2 발현 카세트를 포함하는 벡터/플라스미드로 형질감염시킨다. 글라이신, 하이포잔틴 및 티미딘이 고갈된 배양 배지를 사용함으로써 선별 생장 조건을 확립한다. 증폭을 위해서는, DHFR 억제제인 메토트렉세이트(MTX)를 첨가한다(Kaufman, R.J., et al., J. Mol. Biol. 159 (1982) 601-621; 미국 특허 제4,656,134호).
별법으로, 레포터 분자, 예컨대, 클로람페니콜-아세틸-트랜스퍼레이즈, 루시퍼레이즈, 녹색 형광 단백질 또는 베타-갈락토시데이즈를, 고 생산성 세포주로 발현시키고자 하는 이종 폴리펩티드에 융합하여 간접적인 선별 마커로서 사용할 수 있다. 선별은 첨가된 외래 기질 또는 보조인자의 존재 하에 일어난다.
고 생산성 클론을 확인하는 추가 방법은 선별 마커 유전자, 및 내부 리보좀 도입 부위(IRES)를 통해 이종 폴리펩티드를 코딩하는 구조 유전자의 연결된 전사이다. 이러한 방법을 이용하여 이종 폴리펩티드의 발현을 선별 마커의 발현과 상호관련지을 수 있다.
인간 면역글로불린은 전문화된 림프구, 즉 B 세포에 의해 생산된다. 이 세포는 면역글로불린(sIg)을 분비할 뿐만 아니라 그의 외부 세포막 상에 원형질-막-결합 면역글로불린(mIg)로서 면역글로불린을 제시한다. 이 mIg는 면역반응의 개시에 있어서 중요한 역할을 수행한다. 제시된 mIg는 그의 상응하는 항원의 세포 수용체 기능을 가진다.
1980년부터 sIg 및 mIg의 유래를 다루는 논문들이 공개되었다. 문헌(Early, P., et al., Cell 20 (1980) 313-319)에는 마우스에서 면역글로불린의 중쇄를 코딩하는 mRNA의 2가지 유형이 단일 면역글로불린 μ-유전자의 동일한 일차 전사체로부터 유래한다고 기재되어 있다. sIg 및 mIg 형태의 형성은 중쇄 전구-mRNA의 택일적 스플라이싱으로부터 기인한다. sIg 이소폼(isoform)의 경우, 면역글로불린의 도메인을 코딩하는 모든 엑손, 및 C-말단 도메인을 코딩하는 엑손 다음에 위치한 인트론이 mRNA에 존재하고, 인트론 내 정지 코돈의 다운스트림에 위치한 폴리아데닐화 신호가 일차 전사체의 절단 및 폴리아데닐화를 위해 사용된다. mIg 이소폼의 경우, 분비된 형태의 C-말단 도메인(즉, CH3 또는 CH4)을 코딩하는 엑손 다음에 위치한 택일적 5' 스플라이스 공여 부위가 경막 도메인을 코딩하는 엑손 M1 및 M2의 다운스트림과 불변 영역을 연결한다. 이 경우, sIg 형태의 인접한 인트론 내 폴리아데닐화 신호뿐만 아니라 말단 아미노산, 분비된 형태의 정지 코돈을 코딩하는 서열이 인트론과 함께 스플라이싱에 의해 제거된다.
예를 들어, sIg 중쇄 형태를 코딩하는 mRNA와 mIg 중쇄 형태를 코딩하는 mRNA의 비는 10:1 내지 100:1이다. 이 비는 주로 전구-mRNA 스플라이싱 과정 동안 확립된다. 번역 및 번역-후 조절 기작은 적은 정도로만 기여한다(예컨대, 문헌(S. D., et al., Immun. Cell Biol. 79 (2001) 472-481) 참조).
세포의 원형질-막에 결합된 면역글로불린은 그의 분비된 유사체와 동일한 아미노산 서열 및 2차 구조를 가진다. 차이는 경막 도메인을 포함하는 sIg의 중쇄의 C-말단 연장부이다. 이 경막 도메인은 일반적으로 약 40 내지 약 75개 아미노산 잔기 길이를 가진다. 뮤린 및 인간 면역글로불린의 경우, 경막 도메인은 하기 3개의 상이한 구조 영역으로 더 분류될 수 있다: 13 내지 67개 아미노산 잔기로 이루어진 N-말단 세포외 영역, 25개 아미노산 잔기로 이루어진 중심 보존 경막 스트레치, 및 3 내지 28개 아미노산 잔기로 이루어진 C-말단 세포질 영역(Major, J.G., et al., Mol. Immunol. 33 (1996) 179-187).
증폭가능한 선별 유전자, 형광 단백질 유전자, 및 전사와 번역 연결을 최적화하는 방식으로 원하는 생성물을 코딩하는 유전자를 포함하는 발현 벡터가 국제특허출원 공개 제WO 01/04306호에 기재되어 있다. 국제특허출원 공개 제WO 01/38557호에는 2가지 이상의 원하는 펩티드 또는 단백질을 발현하는 세포를 확인하기 위한 다중 형질전환/형질감염 세포의 검색 방법이 기재되어 있다. 이 2가지 펩티드/단 백질은 IRES를 통해 형광 마커 유전자에 연결된다.
영상화 마커 형질전환유전자(transgene)를 포함하는 형질전환 동물 및 세포는 미국 특허출원 공개 제2003/0033616호에 기재되어 있다. 미국 특허출원 공개 제2005/0032127호에는 온화한 조건 하에 형광-현미경 검출 방법을 이용하여 세포 또는 세포 배양물의 혼합물로부터 단일 생존 세포를 특이적 생산 능력에 대해 비-침윤적으로 선별하는 방법이 기재되어 있다. 분비 단백질을 생성하는 세포를 확인하고 단리하는 방법은 미국 특허출원 공개 제2002/0168702호에 기재되어 있다.
햄스터 프로모터에 기능적으로 연결되어 있는, 원하는 단백질을 코딩하는 유전자, 형광 단백질을 코딩하는 유전자, 및 바람직하게는 증폭될 수 있는 선별 마커 유전자로 이루어진 발현 벡터가 미국 특허출원 공개 제2004/0148647호에 기재되어 있다.
도 1: sIgG/mIgG 발현 벡터 pmIgG-A(A), sIgG/mIgG 발현 벡터 pmIgGΔ-A(B) 및 sIgG 발현 벡터 pIgG-A(C)의 플라스미드 카드. 도시된 벡터 요소들은 상세히 후술되어 있다.
도 2: 감마 (γ) 쇄 발현 카세트의 엑손 인트론 구조의 개략적 도시.
A: 발현 벡터 pmIgG-A 내의 감마 1 쇄 불변 영역의 구조. 약 7.2 kb DNA 단편이 흑색 선으로 표시되어 있다. 엑손은 전술한 명칭이 기재되어 있는 투명한 상 자로 표시되어 있다. IgG의 분비 형태[p(A)s] 및 막 결합 형태[p(A)M]의 폴리아데닐화 신호의 위치는 흑색 막대로 표시되어 있다. 인트론과 3' 비번역 영역(3' UTR)의 번호는 도표 아래에 표시되어 있다. 인트론 6 내 SphI 제한 부위 및 3' UTR(가로 내) 내 돌연변이된 SphI의 상대적인 위치가 표시되어 있다.
B: A에서 도시된 발현 벡터 pmIgGΔ-A 내 약 4.8 kb 하이브리드 γ1 - γ3 - γ4 쇄 불변 영역의 구조. 도표는 3개의 면역글로불린 중쇄 γ 유전자 좌위(IGHGl, IGHG3 및 IGHG4)로부터 유래된 영역도 보여준다.
도 3: mIgG를 발현하는 클론 내에서 IgG 분비와 세포 표면 신호의 상관관계. 플라스미드 pmIgG-A(좌측), pmIgGΔ-A(중앙) 또는 대조군인 pIgG-A(우측)로 형질감염된 Sp2/0-Agl4 세포의 6개 독립 클론을 소정의 조건 하에 48시간 동안 배양한다. 원형질막에 결합된 IgG의 양의 척도인, 유세포분류(flow cytometry)에서의 평균 형광 강도는 회색 막대로 표시되어 있다. 상응하는 세포 배양물 상청액 중의 분비 IgG의 농도는 흑색 다이아몬드로 표시되어 있다.
도 4: FACS밴티지(FACSVantage) 유세포분류기 상에서의 세포 분류에 사용되는 전형적인 FL1/FSC 도트 플롯(BD). 게이트 R1은 상기 FSC/SSC 도트 플롯에 의해 게이팅된 도시된 생존 세포 집단의 5.7%를 포함한다. R1에 속하는 세포는 분류 과정 동안 수거된다.
도 5: 비생성속도의 측정. 클론 5B11, 9B3 및 J5-H3을 스피너 플라스크 내에서 92시간 동안 배양하였다.
A: 세포 생장. 스피너 배양 개시 후 표시된 시점에서 각 클론의 세포수를 CASY 세포 계수기로 측정하였다.
B: (A에서와 같이) 표시된 시점에서, 세포 배양물 상청액 중의 IgG 농도를 단백질 A 친화 크로마토그래피로 측정하였다. C: 비생성속도. 막대 차트는 첫 69시간 내에서의 세포수 및 IgG 측정치로부터 계산된 각 클론에 대한 평균 비생성속도를 보여준다(표 2를 참조하고 보다 상세한 사항은 본문을 참조함). 표준 편차는 오차 막대로 표시되어 있다.
도 6: 면역형광 현미경. 분비 sIgG 및 막 결합 mIgG를 분비하는 클론 5B11(사진 1 및 4), 분비 sIgG만을 발현하는 클론 J5-H3(사진 2 및 5), 또는 형질감염되지 않은 Sp2/0-Agl4 세포(사진 3 및 6)를 세포 표면 상의 IgG(사진 1 내지 3) 또는 세포내 IgG(사진 4 내지 6)에 대해 표지하고, 액시오포토(Axiophot) 형광 현미경에서 사진을 기록하였다.
도 7: 노던 블롯에 의한 mRNA의 분석.
A: 프로브 A(레인 1 내지 3) 또는 프로브 B(레인 4 내지 6)로 표지된 [(α-32P]와 혼성화된 노던 블롯의 오토래디오그래피(autoradiography). 각 레인에서, 클론 5B11(레인 1 및 4), 클론 J5-H3(클론 2 및 5) 또는 형질감염되지 않은 Sp2/0-Agl4 세포(레인 3 및 6)로부터 단리된 10 ㎍의 전체 RNA를 변성 아가로스 겔 전기영동으로 분리하고 나일론 막으로 옮겼다.
B: 막 결합 mIgG 또는 분비 sIgG의 중쇄를 코딩하는 2가지 mRNA 이소폼의 개 략적 도시. 엑손은 박스로 표시되어 있다. 프로브 A 및 B에 상보적인 영역은 흑색 막대로 표시되어 있다.
도 8: IgG 중쇄 이소폼의 면역블롯 분석. 클론 5B11(레인 1 및 4), 클론 J5-H3(클론 2 및 5) 또는 형질감염되지 않은 Sp2/0-Agl4 세포(레인 3 및 6)를 알칼리성 카보네이트 추출법(실시예 참조)에 따라 추출하였다. 내재(integral) 막 단백질을 함유하는 막 분획의 면역글로불린(레인 1 내지 3), 또는 세포의 가용성 내용물을 주로 함유하는 SN 분획의 면역글로불린(레인 4 내지 6)을 단백질 A 침강 분석으로 정제하고 변성 SDS 폴리아크릴아미드 겔 전기영동으로 분리하였다. 호스라디쉬 퍼록시데이즈에 커플링된 이차 항체를 사용한 블롯팅 및 표지 후, 중쇄를 화학발광 반응으로 가시화하였다. 분비된 sIgG 중쇄(sIgG HC) 및 막 결합 mIgG 중쇄(mIgG HC)가 표시되어 있다. 하부 패널은 상부 패널에서의 블롯 절편의 단시간 노출을 표시한다.
도 9: 노던 블롯에 의한 mRNA의 분석. 도 7B에 나타낸 바와 같은, [α-32P]로 표지된 프로브 A(좌측 패널) 또는 프로브 B(우측 패널)와 혼성화된 노던 블롯의 오토래디오그래피. 각 레인에서, 클론 1A1, 1B6, 1C5 또는 1D1로부터 단리된 10 ㎍의 전체 RNA(레인 1 내지 4), 및 클론 1D6, 2D6, KO2 또는 KO6으로부터 단리된 10 ㎍의 전체 RNA(레인 6 내지 9)를 변성 아가로스 겔 전기영동으로 분리하고 나일론 막으로 옮겼다. 클론 "27"은 sIgG만을 발현하고 대조군용으로 추가되었다(레인 5 및 10). mIgG 및 sIgG 이소폼의 중쇄 mRNA가 표시되어 있다.
도 10: sIgG/IgG-GPI 발현 벡터 pIgG-GPI-B의 플라스미드 카드.
본 발명은
a) 인 프레임 번역 정지 코돈(in frame translation stop codon) 없이 이종 단백질 폴리펩티드를 코딩하는 제1 핵산,
b) 5' 스플라이스 공여 부위로 시작되고 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 3' 스플라이스 수용 부위에 의해 종결되는 제2 핵산, 및
c) i) 경막 도메인의 적어도 단편 또는 ii) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산
을 5'에서 3' 방향으로 포함하는 핵산을 포함한다.
본 발명의 추가 측면은 본 발명의 핵산을 포함하는 진핵세포에 적합한 벡터 및 본 발명에 따른 하나 이상의 핵산을 포함하는 진핵세포이다.
또한, 본 발명은 이종 폴리펩티드를 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은
a) i) 인 프레임 번역 정지 코돈 없이 이종 폴리펩티드를 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되고 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;
b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 폴리펩티드로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 이종 폴리펩티드 및 원형질막-결합 이종 폴리펩티드를 생성하는, 단계; 및
c) 원형질막-결합 이종 폴리펩티드를 가진 세포를 이종 폴리펩티드를 발현하는 세포로서 선별하는 단계
를 포함하는 방법을 포함한다.
한 실시양태에서, 본 발명의 방법은 면역글로불린을 발현하는 진핵세포를 선별하는 방법으로서,
a) i) 인 프레임 번역 정지 코돈 없이 적어도 면역글로불린 중쇄의 단편을 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;
b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 면역글로불린 중쇄로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 면역글로불린 중쇄 및 원형질막-결합 면역글로불린 중쇄를 생성하는, 단계; 및
c) 원형질막-결합 면역글로불린 중쇄를 가진 세포를 면역글로불린을 발현하는 세포로서 선별하는 단계
를 포함하는 방법이다.
또한, 본 발명은
a) 진핵세포를 제공하고,
b) 본 발명에 따른 핵산으로 상기 진핵세포를 형질감염시키고,
c) 상기 핵산의 발현에 적합한 조건 하에 형질감염 세포를 배양하고,
d) 상기 형질감염 세포의 배양 배지 또는 세포질로부터 폴리펩티드를 회수함으로써 본 발명에 따른 핵산에 의해 코딩된 폴리펩티드를 제조하는 방법을 포함한다.
또한, 본 발명은
a) 제1 다중 클로닝 부위,
b) 5' 스플라이스 공여 부위로 시작되고 3' 스플라이스 수용 부위로 종결되는 핵산으로서, i) 번역 정지 코돈 및 폴리아데닐화 신호를 포함하고, ii) 전구-mRNA 프로세싱 동안 기본적으로 제거되지 않는 핵산,
c) 제2 다중 클로닝 부위
를 5'에서 3' 방향으로 포함하는 핵산을 포함한다.
또한, 본 발명은 본 발명에 따른, 기본적으로 제거되지 않은 핵산을 포함하는 벡터를 포함한다.
본 발명은 이종 폴리펩티드 또는 단백질을 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은
a) i) 인 프레임 번역 정지 코돈 없이 이종 폴리펩티드 또는 단백질을 코딩하는 제1 핵산, ii) 5' 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 3' 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;
b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 폴리펩티드 또는 단백질로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 이종 폴리펩티드 또는 단백질 및 원형질막-결합 이종 폴리펩티드 또는 단백질을 생성하는, 단계; 및
c) 원형질막-결합 이종 폴리펩티드 또는 단백질을 가진 세포를 이종 폴리펩티드 또는 단백질을 발현하는 세포로서 선별하는 단계
를 포함한다.
본 발명을 실시하기에 유용한 방법 및 기법은 예컨대, 문헌(Ausubel, F.M. (ed.), Current Protocols in Molecular Biology, Volumes I to III (1997); Glover, N.D., and Hames, B.D., ed., DNA Cloning: A Practical Approach, Volumes I and II (1985), Oxford University Press; Freshney, R.I. (ed.), Animal Cell Culture - a practical approach, IRL Press Limited (1986); Watson, J.D., et al., Recombinant DNA, Second Edition, CHSL Press (1992); Winnacker, EX., From Genes to Clones; N.Y., VCH Publishers (1987); Celis, J., ed., Cell Biology, Second Edition, Academic Press (1998); Freshney, R.I., Culture of Animal Cells: A Manual of Basic Technique, second edition, Alan R. Liss, Inc., N.Y. (1987))에 기재되어 있다.
재조합 DNA 기법을 이용하여 한 폴리펩티드의 무수한 유도체를 생성할 수 있다. 이러한 유도체는 예를 들어, 치환, 변경, 교환, 결실 또는 삽입에 의해 개개의 또는 여러 아미노산 위치 내에서 변형될 수 있다. 변형 또는 유도체화는 예를 들어, 부위 지정 돌연변이유발을 이용하여 수행할 수 있다. 이러한 변형은 당업자에 의해 용이하게 수행될 수 있다(예를 들어, 문헌(Sambrook, J., et al., Molecular Cloning: A laboratory manual (1999) Cold Spring Harbor Laboratory Press, New York, USA; Hames, B.D., and Higgins, S.G., Nucleic acid hybridization - a practical approach (1985) IRL Press, Oxford, England).
본 발명의 범위 내에서, 사용된 용어들 중 일부는 하기와 같이 정의된다.
본 명세서에서 사용된 "핵산"은 폴리뉴클레오티드 분자, 예를 들어, DNA 및/또는 RNA 유형을 지칭한다. 이 폴리뉴클레오티드 분자는 천연 발생 폴리뉴클레오티드 분자 또는 합성 폴리뉴클레오티드 분자, 또는 하나 이상의 천연 발생 폴리뉴클레오티드 분자 또는 이의 단편과 하나 이상의 합성 폴리뉴클레오티드 분자의 조합물일 수 있다. 이 정의는 하나 이상의 뉴클레오티드가 예를 들어, 돌연변이유발에 의해 변경되거나, 결실되거나 또는 추가된 천연 발생 폴리뉴클레오티드 분자도 포함한다. 핵산은 단리된 상태일 수 있거나, 또 다른 핵산, 예를 들어, 발현 벡터 또는 진핵 숙주세포의 염색체 내에 삽입되어 있을 수 있다. 마찬가지로, 핵산은 개별 뉴클레오티드로 이루어진 그의 핵산 서열을 특징으로 한다. 상응하는 코딩 핵산으로부터 아미노산 서열을 유추하는 것 및 코딩된 아미노산 서열로부터 상응하는 핵산을 유도하는 것도 당업계에 공지되어 있다. 따러서, 아미노산 서열도 그의 핵산을 특징으로 한다. 핵산도 상응하는 아미노산 서열에 의해 주어진다.
본원에서 상호교환적으로 사용되는 표현 "플라스미드" 또는 "벡터"는 예를 들어, 형질감염 플라스미드뿐만 아니라 셔틀 및 발현 플라스미드를 포함한다. 전형적으로, 플라스미드는 박테리아 내에서의 플라스미드의 복제를 위한 복제 기점(예를 들어, ColE1 및 oriP 복제 기점) 및 선별 마커(예를 들어, 앰피실린 또는 테트라사이클린 내성 유전자)도 포함할 것이다.
"발현 카세트"는 적어도 세포 내에 포함된 구조 유전자를 발현시키는 데 필요한 조절 요소들을 보유하는 구축물을 지칭한다. 경우에 따라, 발현된 폴리펩티드 또는 단백질의 분비를 가능하게 하는 추가 요소가 포함된다.
"유전자"는 폴리펩티드 또는 단백질의 발현에 필요한, 예컨대, 염색체 또는 플라스미드 상의 절편을 지칭한다. 코딩 영역 외에, 유전자는 프로모터, 하나 이상의 인트론 및/또는 엑손, 및 하나 이상의 종결서열을 비롯한 다른 기능적 요소들을 포함한다.
본원에서 사용된 용어 "구조 유전자"는 신호 서열은 가지고 있지 않지만 개재(intervening) 인트론을 가진 유전자의 코딩 영역, 즉 엑손을 지칭한다.
"선별 마커"는 상응하는 선별제의 존재 또는 부재 하에 그 유전자를 보유하는 세포가 특이적으로 선별될 수 있게 하는 유전자를 지칭한다. 유용한 양성 선별 마커는 항생제 내성 유전자이다. 이 선별 마커는 상응하는 항생제의 존재 하에 그 유전자로 형질전환된 숙주 세포가 양성적으로 선별될 수 있게 하고, 비-형질전환된 숙주 세포는 선별 배양 조건 하에, 즉 선별 배지 중의 선별제의 존재 하에 생장하거나 생존할 수 없을 것이다. 선별 마커는 양성, 음성 또는 이기능성 선별 마커일 수 있다. 양성 선별 마커는 그 마커를 보유하는 세포에 대한 선별을 허용하는 반면, 음성 선별 마커는 그 마커를 보유하는 세포가 선별적으로 제거될 수 있게 한다. 전형적으로, 선별 마커는 숙주 세포에서 동화 또는 이화 결함에 대한 약물 또는 보충제에 대한 내성을 부여할 것이다. 진핵세포에서 유용한 선별 마커는 예를 들어, 아미노글리코사이드 포스포트랜스퍼레이즈(APH), 예컨대, 히그로마이신 포스포트랜스퍼레이즈(hyg), 네오마이신 및 G418 APH, DHFR, 싸이미딘 카이네이즈(tk), 글루타민 신쎄테이즈(GS), 아스파라진 신쎄테이즈, 트립토판 신쎄테이즈(선별제 인돌), 히스티디놀 데히드로게네이즈(선별제 히스티디놀 D)에 대한 유전자, 및 퓨로마이신, 블레오마이신, 플레오마이신, 클로람페니콜, 제오신 및 마이코페놀산에 대한 내성을 코딩하는 유전자를 포함한다. 추가 마커 유전자는 국제특허출원 공개 제WO 92/08796호 및 제WO 94/28143호에 기재되어 있다.
본원에서 사용된 "조절 요소"는 원하는 구조 유전자를 포함하는, 유전자의 전사 및/또는 번역에 필요한 시스 및/또는 트랜스로 존재하는 뉴클레오티드 서열을 지칭한다. 전사 조절 요소는 통상적으로 발현될 유전자 서열의 프로모터 업스트림, 전사 개시 및 종결 부위, 및 폴리아데닐화 신호 서열을 포함한다. 용어 "전사 개시 부위"는 일차 전사체, 즉 전구-mRNA로 전사될, 제1 핵산에 상응하는 유전자 내 뉴클레오티드를 지칭하고, 전사 개시 부위는 프로모터 서열과 중첩될 수 있다. 용어 "전사 종결 부위"는 RNA 폴리머레이즈로 하여금 전사를 종결시키게 하는, 통상적으로 전사될 원하는 유전자의 3' 말단에 존재하는 뉴클레오티드 서열을 지칭한다. 폴리아데닐화 신호 서열 또는 폴리-A 추가 신호는 진핵세포 mRNA의 3' 말단에 있는 특정 부위에서 절단하는 것, 및 핵 내에서 약 100 내지 200개의 아데닌 뉴클레오티드로 이루어진 서열(폴리A 꼬리)을 절단된 3' 말단에 전사 후 추가하는 것에 대한 신호를 제공한다. 폴리아데닐화 신호 서열은 절단 부위로부터 약 10 내지 30개의 뉴클레오티드 업스트림에 위치한 컨센서스 서열 AATAAA를 포함할 수 있다.
번역 조절 요소는 번역 개시 코돈(AUG) 및 정지 코돈(TAA, TAG 또는 TGA)을 포함한다. IRES는 일부 구축물에 포함될 수 있다.
"프로모터"는 작동가능하게 연결되어 있는 유전자 또는 핵산 서열의 전사를 조절하는 폴리뉴클레오티드 서열을 지칭한다. 프로모터는 RNA 폴리머라제 결합 및 전사 개시를 위한 신호를 포함한다. 사용된 프로모터는 선별된/작동가능하게 연결된 서열의 발현이 고려되는 숙주 세포의 세포 유형에서 기능성을 가질 것이다. 다양한 공급원으로부터 유래된 기본 프로모터, 유도성 프로모터 및 억제가능성 프로모터를 비롯한 매우 많은 프로모터가 당업계에 잘 공지되어 있고 (진뱅크(GenBank)와 같은 데이타베이스에서 확인될 수 있으며, (예를 들어, ATCC와 같은 기탁기관 및 다른 상업적 또는 개별적 공급원으로부터의) 클로닝된 폴리뉴클레오티드로서 또는 클로닝된 폴리뉴클레오티드 내의 프로모터로서 입수될 수 있다. "프로모터"는 구조 유전자의 전사를 지시하는 뉴클레오티드 서열을 포함한다. 전형적으로, 프로모터는 구조 유전자의 전사 개시 부위에 근접해 있는, 유전자의 5' 비-코딩 또는 UTR에 위치되어 있다. 전사 개시에서 작용하는 프로모터 내의 서열 요소들은 종종 컨센서스 뉴클레오티드 서열을 특징으로 한다. 이 프로모터 요소들은 RNA 폴리머레이즈 결합 부위, TATA 서열, CAAT 서열, 분화-특이적 요소(DSE; McGehee, R.E. Jr., et al., Mol. Endocrinol. 7 (1993) 551-60), 사이클릭 AMP 반응 요소(CRE), 혈청 반응 요소(SRE; Treisman, R., Seminars in Cancer Biol. 1 (1990) 47-58), 글루코코르티코이드 반응 요소(GRE), 및 다른 전사 인자들에 대한 결합 부위, 예컨대, CRE/ATF(O'Reilly, M.A., et al., J. Biol. Chem. 267 (1992) 19938-43), AP2(Ye, J., et al., J. Biol. Chem. 269 (1994) 25728-34), SP1, cAMP 반응 요소 결합 단백질(CREB; Loeken, M.R., Gene Expr. 3 (1993) 253-64) 및 옥타머 인자(예컨대, 일반적으로, 문헌(Watson et al., eds., Molecular Biology of the Gene, 4th ed., The Benjamin/Cummings Publishing Company, Inc. (1987), and Lemaigre, F.P. and Rousseau, G.G., Biochem. J. 303 (1994) 1-14) 참조)를 포함한다. 프로모터가 유도성 프로모터인 경우, 전사 속도는 유도제에 반응하여 증가한다. 대조적으로, 전사 속도는 프로모터가 기본 프로모터인 경우 유도제에 의해 조절되지 않는다. 억제가능한 프로모터도 공지되어 있다. 예를 들어, c-fos 프로모터는 성장 호르몬과 세포 표면 상의 성장 호르몬 수용체의 결합 시 특이적으로 활성화된다. 테트라사이클린(Tet)에 의해 조절되는 발현은 예를 들어, CMV 프로모터 및 이것 다음에 위치한 2개의 Tet-오퍼레이터 부위로 이루어진 인공 하이브리드 프로모터에 의해 달성될 수 있다. Tet-억제자(repressor)는 상기 2개의 Tet-오퍼레이터 부위에 결합하여 전사를 차단한다. 유도제인 테트라사이클린의 첨가 시, Tet-억제자는 Tet-오퍼레이터 부위로부터 방출되고 전사가 진행된다(Gossen, M. and Bujard, H. PNAS 89 (1992) 5547-5551). 메탈로싸이오네인 및 열 충격 프로모터를 비롯한 다른 유도성 프로모터의 경우, 예를 들어, 상기 문헌(Sambrook et al.) 및 문헌(Gossen et al., Curr. Opin. Biotech. 5 (1994) 516-520)을 참조한다. 고수준 발현을 위한 강력한 프로모터로서 확인된 진핵세포 프로모터 중에는 SV40 초기 프로모터, 아데노바이러스 주요 후기 프로모터, 마우스 메탈로싸이오네인-I 프로모터, 라우스 육종 바이러스 장 말단 반복부, 차이니스 햄스터 연장 인자 1 알파(CHEF-I, 예를 들어, 미국 특허 제5,888,809호 참조), 인간 EF-1 알파, 유비퀴틴 및 인간 사이토메갈로바이러스 즉각 초기 프로모터(CMV IE)가 있다.
"프로모터"는 기본 프로모터 또는 유도성 프로모터일 수 있다. 인핸서(enhancer)(즉, 프로모터에 작용하여 전사를 증가시키는 시스-작용 DNA 요소)가 프로모터와 함께 작용하여 프로모터만을 사용하여 얻는 발현 수준을 증가시키는 데 필요할 수 있고 전사 조절 요소로서 포함될 수 있다. 종종, 프로모터를 포함하는 폴리뉴클레오티드 절편도 인핸서 서열을 포함할 것이다(예를 들어, CMV 또는 SV40).
"작동가능하게 연결된"은 둘 이상의 요소들의 병렬배치를 지칭하는데, 이때 상기 요소들이 그들의 의도된 방식으로 작용할 수 있는 관계로 배치되어 있다. 예를 들어, 프로모터 및/또는 인핸서는 이것이 연결된 코딩 서열의 전사를 제어하거나 조절하도록 시스로 작용하는 경우 코딩 서열에 작동가능하게 연결되어 있다. 반드시는 아니지만 일반적으로, "작동가능하게 연결된" DNA 서열은 인접하여 위치하고, 필요한 경우 2개의 단백질 코딩 영역, 예컨대, 분비 리더와 폴리펩티드, 폴리펩티드와 경막 도메인, 폴리펩티드와 GPI-고착자에 대한 신호 펩티드, 또는 폴리펩티드와 번역 정지 코돈을 인접된 리딩 프레임으로 연결한다. 그러나, 작동가능하게 연결된 프로모터가 일반적으로 코딩 서열의 업스트림에 위치되어 있다 하더라도, 상기 프로모터가 반드시 상기 코딩 서열에 인접하여 위치할 필요는 없다. 인핸서는 인접하여 위치될 필요가 없다. 인핸서는 이것이 코딩 서열의 전사를 증가시키는 경우 코딩 서열에 작동가능하게 연결되어 있다. 작동가능하게 연결된 인핸서는 코딩 서열의 업스트림에, 코딩 서열의 내에 또는 코딩 서열의 다운스트림에 위치되어 있고 프로모터로부터 상당히 멀리 떨어져 위치되어 있다. 폴리아데닐화 신호는 전사가 코딩 서열을 통과하여 폴리아데닐화 서열로 진행되도록 상기 폴리아데닐화 신호가 코딩 서열의 다운스트림 말단에 위치된 경우 상기 코딩 서열에 작동가능하게 연결되어 있다. 연결은 당업계에 공지되어 있는 재조합 방법, 예를 들어, PCR 방법의 이용 및/또는 편리한 제한 부위에서의 결찰(ligation)에 의해 달성된다. 편리한 제한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오티드 어댑터 또는 링커를 통상적인 관행에 따라 사용한다.
본원에서 사용된 용어 "전구-mRNA의 생성"은 DNA가 그의 상보적 전구-mRNA로 전사되는 과정을 지칭한다. 진핵생물 DNA는 엑손(코딩)으로 지칭되는 코딩 영역 및 인트론(비-코딩)으로 지칭되는 비-코딩 영역으로 이루어져 있다. DNA가 그의 상보적 전구-mRNA로 전사되는 과정에서, 엑손 및 인트론의 게놈 구성이 유지된다.
본원에서 사용된 용어 "전구-mRNA의 프로세싱"은 전사-후 변형 과정을 지칭한다. 이 단계에서, 전구-mRNA의 인트론은 스플라이싱되고, 즉 전구-mRNA로부터 제거되고, 프로세싱된 mRNA의 5' 말단은 캡핑되며, 3' 폴리아데닐화가 일어난다. 최종 핵, 즉 성숙 mRNA가 이 단계에서 수득된다.
본원에서 사용된 용어 "경막 도메인"은 DNA 수준에서 하나 이상의 엑손에 의해 코딩되며 세포외 영역, 경막 영역 및 세포내 영역을 포함하는 폴리펩티드 또는 단백질을 지칭한다. 경막 도메인은 일반적으로 3개의 상이한 구조적 영역, 즉 N-말단 세포외 영역, 중심 보존 경막 스트레치 및 C-말단 세포질 영역을 포함한다. 한 실시양태에서, 경막 도메인은 세포외 영역 및 경막 영역을 N-말단에서 C-말단 방향으로 포함한다. 경막 도메인은 세포내 또는 세포질 영역을 추가로 포함할 수 있다.
본원에서 사용된 용어 "경막 도메인의 단편"은 세포막에 걸쳐 있는, 즉 세포막 내에 위치된 경막 도메인의 일부, 즉 경막 스트레치를 지칭한다.
용어 "택일적으로 스플라이싱될 수 있는 핵산"은 5' 스플라이스 공여 부위로 시작되고 3' 스플라이스 수용 부위로 종결되는 핵산을 지칭한다. 이 핵산은 번역 정지 코돈 및 폴리아데닐화 신호를 함유한다. 이 택일적으로 스플라이싱될 수 있는 핵산은 상응하는 전구-mRNA로부터 기본적으로 스플라이싱되어 제거되지 않는 비-코딩 영역, 예컨대, 면역글로불린 중쇄 CH3 또는 CH4 도메인을 코딩하는 엑손 다음에 오는 인트론을 포함한다. 택일적으로 스플라이싱될 수 있는 핵산의 5' 스플라이스 공여 부위에서 일어나는 "택일적 스플라이싱 이벤트"는 택일적으로 스플라이싱될 수 있는 핵산이 전구-mRNA로부터 스플라이싱되어 제거되는지 아니면 적어도 부분적으로 유지되어 성숙(프로세싱된) mRNA에 포함되는지를 결정하는 이벤트이다.
본원에서 사용된 용어 "택일적 스플라이싱" 및 이의 문법적 등가 용어는 하나 이상의 인트론의 상이한 프로세싱으로 인해 단일 전구-mRNA로부터 상이한 성숙 mRNA가 얻어질 수 있으므로 폴리펩티드의 상이한 이소폼이 발현될 수 있다. 본 발명의 한 실시양태에서, 생성된 전구-mRNA의 단일, 즉 하나의 인트론만이 택일적으로 스플라이싱될 수 있다. 또 다른 실시양태에서, 제2 핵산이 택일적으로 스플라이싱될 수 있다. 추가 실시양태서, 제2 핵산은 택일적으로 스플라이싱될 수 있는 인트론을 포함한다. 상이한 프로세싱은 "예/아니요" 결정이고, 즉 택일적 스플라이싱 과정에서 프로세싱될 인트론, 즉 "택일적으로 스플라이싱될 수 있는 핵산"이 적어도 부분적으로 보유되거나 스플라이싱될 수 있다. 이것은 상이한 엑손이 뒤따르게 하는 분지점 기작(branching point mechanism)으로서 이해되서는 안된다. 사실상, 택일적으로 스플라이싱될 수 있는 핵산이 스플라이싱되거나 성숙 mRNA에서 적어도 부분적으로 유지되는 기작이다. 이 기작을 이용함으로써, 택일적으로 스플라이싱될 수 있는 핵산이 보유되거나 제거되고, 이에 따라 핵산 내에 포함된 인 프레임 번역 정지 코돈이 보유되거나 제거된다.
택일적 스플라이싱은 진핵세포에서 중요한 조절 기작이다. 택일적 스플라이싱을 이용함으로써, 동일한 DNA에 의해 코딩된 복수의 상이한 단백질을 생성시키는 동일한 전구-mRNA로부터 성숙 mRNA 내의 엑손의 상이한 조합물이 수득될 수 있다.
본원에서 사용된 용어 "발현"은 세포 내에서 일어나는 전사 및/또는 번역 과정을 지칭한다. 세포 내에서의 원하는 생성물의 전사 수준은 세포 내에 존재하는 상응하는 mRNA의 양을 기초로 하여 측정할 수 있다. 예를 들어, 선택된 서열로부터 전사된 mRNA는 PCR 또는 노던 혼성화에 의해 정량될 수 있다(문헌(Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press (1989)) 참조). 폴리펩티드는 다양한 방법, 예컨대, ELISA, 폴리펩티드의 생물학적 활성 분석, 또는 상기 활성과 무관한 분석법의 이용, 예컨대, 웨스턴 블롯팅, SDS 폴리아크릴아미드 겔 전기영동, NMR 또는 방사성면역분석, 예컨대, 폴리펩티드를 인식하여 이것에 결합하는 항체의 사용에 의해 정량될 수 있다(상기 문헌(Sambrook et al., 1989) 참조).
"숙주 세포"는 폴리펩티드 또는 단백질을 코딩하는 이종 핵산이 도입될 세포를 지칭한다. 숙주 세포는 플라스미드의 증식을 위해 사용되는 원핵세포, 및 이종 핵산의 발현을 위해 사용되는 진핵세포 둘다를 포함한다. 바람직하게는, 진핵세포는 포유동물 세포이다. 바람직하게는, 포유동물 세포는 CHO 세포, BHK 세포, NSO 세포, Sp2/0 세포, COS 세포, HEK 세포, PER.C6® 세포이다.
"폴리펩티드"는 천연적으로 생성되든 합성되든 관계없이 펩티드 결합에 의해 연결된 아미노산들로 이루어진 중합체이다. 약 20개 미만의 아미노산 잔기들로 이루어진 폴리펩티드는 "펩티드"로 지칭될 수 있는 반면, 100개 초과의 아미노산 잔기들로 이루어지거나 2개 이상의 폴리펩티드 쇄로 이루어진 폴리펩티드는 "단백질"로 지칭될 수 있다.
"단백질"은 100개 이상의 아미노산으로 이루어진 하나 이상의 폴리펩티드 쇄를 포함하거나 2개 이상의 폴리펩티드 쇄를 포함하는 거대분자이다.
폴리펩티드 및 단백질은 비-펩티드성 성분들, 예컨대, 탄수화물 기, 금속 이온, 지질, 카복실산 에스터 또는 이들의 조합물도 포함할 수 있다. 비-펩티드성 치환체가 폴리펩티드 또는 단백질을 생성하는 세포에 의해 추가될 수 있고 세포의 유형에 따라 달라질 수 있다. 폴리펩티드 및 단백질은 이들의 아미노산 골격 구조 면에서 본원에서 정의되고, 탄수화물 기와 같은 추가는 일반적으로 요구되지 않지만 그럼에도 불구하고 존재할 수 있다.
"이종 DNA" 또는 "이종 핵산"은 소정의 숙주 세포 내에 천연적으로 존재하지 않는 DNA 분자 또는 핵산, 또는 DNA 분자의 집단 또는 핵산의 집단을 지칭한다. 특정 숙주 세포에 대해 이종성을 나타내는 DNA 분자는 숙주 DNA가 비-숙주 DNA(즉, 외래 DNA)와 조합되는 한 숙주 세포 종으로부터 유래된 DNA(즉, 내재 DNA)를 함유할 수 있다. 예를 들어, 프로모터를 포함하는 숙주 DNA 절편과 작동가능하게 연결된 폴리펩티드를 코딩하는 비-숙주 DNA 절편을 함유하는 DNA 분자는 이종 DNA 분자인 것으로 간주된다. 반대로, 이종 DNA는 외래 프로모터와 작동가능하게 연결된 내재 구조 유전자를 포함할 수 있다.
비-숙주, 즉 이종 핵산에 의해 코딩된 펩티드 또는 폴리펩티드는 "이종" 펩티드 또는 폴리펩티드이다.
본원에서 사용된 용어 "생물학적 활성 폴리펩티드"는 인공 생물학적 시스템에 투여된 경우, 예컨대, 세포주 및 바이러스를 사용한 생체분석에서 사용된 경우, 또는 조류 및 인간을 비롯한 포유동물을 포함하나 이들로 한정되지 않는 동물에 생체내 투여된 경우 생물학적 효과를 초래하는 유기 분자, 예를 들어, 생물학적 거대분자, 예컨대, 펩티드, 단백질, 당단백질, 뉴클레오단백질, 뮤코단백질, 지단백질, 합성 폴리펩티드 또는 단백질을 지칭한다. 이 생물학적 효과는 효소 억제 또는 활성화, 결합 부위 또는 주변에서의 수용체 또는 리간드와의 결합, 또는 신호 유발 또는 신호 조절일 수 있으나 이들로 한정되지 않는다. 한 실시양태에서, 상기 생물학적 활성 폴리펩티드는 면역글로불린, 면역글로불린 단편, 면역글로불린 접합체 및 항융합원성(antifusogenic) 펩티드로 이루어진 군으로부터 선택된다. 생물학적 활성 분자는 예를 들어, 호르몬; 사이토카인; 인터류킨; 면역글로불린; 항융합원성 펩티드; 성장 인자; 수용체 리간드, 작용제 또는 길항제; 세포독성제; 항바이러스제; 조영제; 효소 억제제; 효소 활성화제 또는 효소 활성 조절제, 예컨대, 알로스테릭 물질; 및 이들의 접합체이나, 이들로 한정되지 않는다.
본원에서 사용된 용어 "아미노산"은 핵산에 의해 직접 코딩되거나 전구체로서 코딩될 수 있는 알라닌(3문자 코드: Ala, 일문자 코드: A), 아르기닌(Arg, R), 아스파라긴(Asn, N), 아스파르트산(Asp, D), 시스테인(Cys, C), 글루타민(Gln, Q), 글루탐산(Glu, E), 글리신(Gly, G), 히스티딘(His, H), 이소류신(Ile, I), 류신(Leu, L), 라이신(Lys, K), 메티오닌(Met, M), 페닐알라닌(Phe, F), 프롤린(Pro, P), 세린(Ser, S), 쓰레오닌(Thr, T), 트립토판(Trp, W), 티로신(Tyr, Y) 및 발린(Val, V)을 포함하는 일군의 카복시 α-아미노산을 지칭한다.
"클로닝 벡터"는 숙주 세포 내에서 자가 복제할 수 있는 능력을 가진 핵산, 예컨대, 플라스미드, 코스미드, 파지미드 또는 박테리아 인공 염색체(BAC)이다. 클로닝 벡터는 전형적으로 벡터의 필수적인 생물학적 기능을 상실하지 않으면서 결정가능한 방식으로 핵산의 삽입을 가능하게 하는 하나 또는 소수의 제한 엔도뉴클레이즈 인식 부위뿐만 아니라 클로닝 벡터로 형질전환된 세포의 확인 및 선별에 사용하기에 적합한 선별 마커를 코딩하는 뉴클레이티드 서열을 포함한다. 선별 마커는 전형적으로 테트라사이클린, 네오마이신, G418 또는 앰피실린 내성을 부여하는 유전자를 포함한다.
"발현 벡터"는 숙주 세포 내에서 발현시킬 이종 폴리펩티드 또는 단백질을 코딩하는 핵산이다. 전형적으로, 발현 벡터는 예를 들어, 대장균의 경우 원핵 복제 기점 및 선별 마커, 진핵 선별 마커, 및 프로모터, 구조 유전자 및 전사 종결인자(폴리아데닐화 신호를 포함함)를 각각 포함하는, 원하는 구조 유전자(들)의 발현을 위한 하나 이상의 발현 카세트를 포함하는 원핵 플라스미드 증폭 단위체이다. 유전자 발현은 통상적으로 프로모터의 조절 하에 놓여지고, 이러한 구조 유전자는 프로모터와 "작동가능하게 연결된" 상태에 있다고 기술된다. 유사하게, 조절 요소와 코어 프로모터는 조절 요소가 코어 프로모터의 활성을 조절하는 경우 작동가능하게 연결되어 있다.
"폴리시스트론(polycistronic) 전사 단위체"는 하나 초과의 구조 유전자가 동일한 프로모터의 조절 하에 놓여 있는 전사 단위체이다.
"단리된 폴리펩티드" 또는 "단리된 단백질"은 오염 세포 성분들을 본질적으로 보유하지 않는, 예컨대, 탄수화물, 지질 또는 다른 단백질성 불순물에 공유 결합되어 있지 않을뿐만 아니라 천연 상태의 폴리펩티드 또는 단백질과 결합된 비-단백질성 불순물을 실질적으로 보유하지 않는 폴리펩티드 또는 단백질이다. 전형적으로, 단리된 폴리펩티드/단백질 제제는 고도로 정제된 형태의, 즉 약 80% 이상, 약 90% 이상, 약 95% 이상, 95% 초과 또는 99% 초과의 순도를 가진 폴리펩티드/단백질을 함유한다. 특정 제제가 단리된 폴리펩티드 또는 단백질을 함유한다는 것을 보여주는 한 방법은 상기 제제의 소듐 도데실 설페이트(SDS)-폴리아크릴아미드 겔 전기영동 및 겔의 코마시에 브릴리언트 블루(Coomassie Brilliant Blue) 염색 후에 단일 밴드가 나타나는지를 확인하는 방법이다. 그러나, 용어 "단리된"은 택일적인 물리학적 형태, 예컨대, 이량체 또는 택일적으로 글리코실화된 또는 유도체화된 형태의 동일한 폴리펩티드 또는 단백질의 존재를 배제하지 않는다.
본원에서 사용된 용어 "면역글로불린"은 면역글로불린 유전자에 의해 실질적으로 코딩된 하나 이상의 폴리펩티드로 이루어진 단백질을 지칭한다. 이 정의는 변이체, 예컨대, 돌연변이 형태, 즉 하나 이상의 아미노산의 치환, 결실 및 삽입을 가진 형태, 말단이 절단된 형태 및 융합된 형태를 포함한다. 인식된 면역글로불린 유전자는 여러 불변 영역 유전자 및 다수의 면역글로불린 가변 영역 유전자를 포함한다. 면역글로불린은 예를 들어, Fv, Fab 및 F(ab)2뿐만 아니라 단일쇄(scFv)를 비롯한 다양한 형태로 존재할 수 있다(예를 들어, (Huston, J.S., et al., PNAS USA 85 (1988) 5879-5883; Bird, R.E., et al., Science 242 (1988) 423-426; and, in general, Hood et al., Immunology, Benjamin N.Y., 2nd edition (1984) and Hunkapiller, T., and Hood, L., Nature 323 (1986) 15-16) 참조).
면역글로불린의 중쇄 폴리펩티드 및 경쇄 폴리펩티드가 모두 존재하는 경우 이들은 불변 영역(일반적으로, 카복시 말단 부분)을 각각 포함할 수 있다. 중쇄의 불변 영역은 i) Fc 수용체를 보유하는 세포, 예컨대, 대식세포, 또는 ii) 브람벨(Brambell) 수용체로도 공지되어 있는 신생아 Fc 수용체(FcRn)를 보유하는 세포와 항체의 결합을 매개한다. 또한, 중쇄의 불변 영역은 보편적인 보체 시스템의 인자들, 예컨대, 요소 C1q를 비롯한 일부 인자들과의 결합을 매개한다. 나아가, 경막 도메인은 면역글로불린 중쇄의 C-말단 불변 도메인, 즉 CH3 또는 CH4 도메인 다음에 위치할 수 있다. 이 경막 도메인은 원형질막-결합 면역글로불린, 면역글로불린 단편 또는 면역글로불린-융합 폴리펩티드의 형성을 가능하게 한다.
면역글로불린의 중쇄 폴리펩티드 및 경쇄 폴리펩티드가 모두 존재하는 경우 이들은 가변 도메인(일반적으로 아미노 말단 부분)을 포함할 수 있다. 면역글로불린 경쇄 또는 중쇄의 가변 도메인은 여러 절편, 즉 4개의 골격 영역(FR) 및 3개의 초가변 영역(CDR)을 포함한다.
용어 "의 적어도 단편"은 전장 핵산 또는 전장 폴리펩티드의 부분, 즉 전장 핵산, 폴리펩티드 또는 도메인의 20% 이상, 40% 이상, 60% 이상 또는 80% 이상을 지칭한다. 예를 들어, "면역글로불린 CH3 또는 CH4 도메인의 적어도 단편을 코딩하는 핵산"은 전장 면역글로불린 CH3 또는 CH4 도메인을 코딩하는 핵산의 부분, 즉 전장 면역글로불린 CH3 또는 CH4 도메인을 코딩하는 핵산의 20% 이상, 40% 이상, 60% 이상 또는 80% 이상을 지칭한다. 한 실시양태에서, 면역글로불린 중쇄의 단편은 면역글로불린 중쇄의 C-말단 단편이다.
용어 "인 프레임 번역 정지 코돈"은 핵산의 선행 코딩 영역에 대해 리딩 프레임의 프레임이동(frameshift) 없이 핵산의 후속 코딩 영역, 즉 번역 과정 동안에 코딩 영역을 종결시키는 번역 정지 코돈(TAA, TAG 또는 TGA)을 지칭한다. 인 프레임 번역 정지 코돈은 핵산의 선행 코딩 영역과 작동가능하게 연결되어 있다.
용어 "인 프레임 번역 정지 코돈 없이"는 지정된 핵산 내 번역 정지 코돈(TAA, TAG 또는 TGA)의 부재, 및/또는 핵산의 코딩 영역 내에서 또는 말단에서 발견될 수 있으나 1 또는 2개의 염기쌍 이동으로 인해 프로세싱된 mRNA의 번역 과정 동안에 인식되지 않아(즉, 아웃-오브-프레임, 작동가능하게 연결되지 않음) 번역 과정에서 코딩 영역을 종결시키지 않는 번역 정지 코돈의 존재를 지칭한다.
본원에서 사용된 "전사 종결서열"은 mRNA 합성의 종결을 위한 신호를 RNA 폴리머레이즈에게 제공하는 길이 50 내지 750 bp의 DNA 서열이다. 특히 강력한 프로모터를 사용하는 경우 RNA 폴리머레이즈가 전사 종결서열을 통과하여 판독하는 것을 방지하기 위해서는 발현 카세트의 3' 말단에 매우 효율적인 (강력한) 종결서열을 위치시키는 것이 바람직하다. 비효율적인 전사 종결서열은 원치않는, 예를 들어, 플라스미드에 의해 코딩된 유전자 발현의 원일일 수 있는 오페론-유사 mRNA의 형성을 초래할 수 있다.
본원에서 사용된 용어 "전구-mRNA 프로세싱 과정 동안에 기본적으로 제거되지 않은" 및 "(상응하는) 전구-mRNA로부터 기본적으로 스플라이싱되어 제거되지 않은"은 전구-mRNA 프로세싱 과정 동안에 예기치 않게 일어나지 않는 스플라이싱 과정(즉, 특정 인트론의 핵산은 종종 전구-mRNA 프로세싱 과정 동안에 제거됨)을 지칭한다. 그 결과, 2개의 상이한 성숙 mRNA가 수득되는데, 하나는 인트론의 적어도 일부를 갖고 나머지 하나는 인트론을 갖지 않는다.
본원에서 사용된 용어 "GPI-고착자"는 폴리펩티드 또는 단백질의 C-말단에 부착된 번역-후 변형을 지칭한다. "GPI-고착자"는 하나 이상의 에탄올아민 포스페이트 잔기, 트리만노사이드, 글루코스아민 잔기 및 이노시톨 인지질을 포함하는 모핵 구조를 가진다. 이러한 모핵 구조에도 불구하고, GPI-고착자는 통상적으로 일부 미세불균질성(microheterogeniety)을 보유하므로 GPI-고착자를 가진 단백질은 통상적으로 상이한 측쇄 변형을 가진 동일한 모핵 구조의 균질한 GPI-고착자를 가진 단백질들의 혼합물이다.
용어 "GPI-고착자에 대한 신호 펩티드"는 GPI-고착자가 부착될 1개의 아미노산, 임의적 성분인 스페이서 펩티드 및 소수성 펩티드로 이루어진 폴리펩티드 또는 단백질의 C-말단 아미노산 서열을 지칭한다. 이 신호 펩티드 중 거의 모두, 즉 임의적 성분인 스페이서 펩티드 및 소수성 펩티드는 효소 GPI-트랜스아미네이즈에 의해 번역 후에 제거되고, GPI-고착자의 모핵 에탄올아민 포스페이트의 아미노 기와 GPI-고착자가 부착된 아민산 사이의 결합이 형성된다.
이종 핵산으로 형질감염시킨 후, 이종 핵산에 의해 코딩된 이종 폴리펩티드를 발현하는 세포가 선별되어야 한다. 선별을 위해 마커를 사용한다. 상기 마커는 성공적으로 형질전환되어 있고 세포의 선별 및 단리를 용이하게 하는 세포 집단 내의 세포를 지칭한다. 상이한 마커, 예컨대, 선별 마커 또는 녹색 형광 단백질(GFP)과 같은 검출 표지가 사용될 수 있다.
세포의 선별은 일단계 또는 다단계로 수행될 수 있다. 일/다단계 과정에서, 제1 선별은 예를 들어, 선별 마커, 예컨대, 검출 마커의 역치 수준을 기초로 하여 수행할 수 있다. 예를 들어, 유세포분류에 의한 (예컨대, FACS - 형광 활성화 세포 분류에 의한) 선별의 경우, 형광 역치 수준은 설정되고 이 역치 수준을 초과하는 형광도를 가진 세포가 선별된다. 샘플 집단의 형광 강도의 상위 1 내지 15%(즉, 가장 강한 검출 표지를 가진 세포의 15%), 상위 1 내지 10%, 상위 1 내지 5%, 상위 5 내지 10% 또는 상위 5 내지 6%가 모아질 수 있다. 세포의 선별을 위한 별법은 예를 들어, 단백질 A 또는 특이적 면역글로불린으로 코팅된 자기 비드와의 면역학적 결합이다. 세포의 선별된 패널은 예를 들어, 단일 세포 접종(seeding), 배양 및 ELISA 분석(효소-결합 면역흡착 분석); 제한 희석 클로닝, 수일 동안 선별 배지 중에서 선별 배양 조건 하의 배양에 의한 증폭 및 추가 FACS 선별; 예를 들어, 선행 FACS 선별에서 검출된 형광 강도에 기초할 수 있는 보다 높은 역치 수준을 가진 추가 FACS 선별; 또는 면역침전 방법(예컨대, 국제특허출원 공개 제WO 2005/020924호 참조)에 의한 추가 선별 단계를 위한 기초 집단으로서 얻어질 수 있다. 본 발명에 따라 세포를 선별하는 것은 유세포분류, ELISA, 면역침전, 면역친화 컬럼 크로마토그래피, 자기 비드 면역친화 분류, 현미경-기초 단리 방법 또는 면역학적 결합을 이루어진 군으로부터 선택된 방법을 수행한 후, 단일 세포 접종 및 배양, 제한 희석 및 배양에 의한 증폭으로 이루어진 군으로부터 선택된 방법을 수행함으로써 실시될 수 있다. 한 실시양태에서, 본 발명에 따른 세포의 선별은 본 발명에 따라 세포를 선별하는 것은 유세포분류, ELISA, 면역침전, 면역친화 컬럼 크로마토그래피, 자기 비드 면역친화 분류, 현미경-기초 단리 방법 또는 면역학적 결합을 이루어진 군으로부터 선택된 방법을 수행한 다음, FACS, 면역침강, 면역친화 컬럼 크로마토그래피, 자기 비드 면역친화 분류, 현미경-기초 단리 방법 및 ELISA로 이루어진 군으로부터 선택된 방법을 수행함으로써 실시될 수 있다.
당업계에 공지되어 있는 형질감염 방법 및 벡터의 효율이 매우 높아 다수의 형질감염 세포가 수득되기 때문에, 형질감염 세포의 발현 수율과 마커의 검출된 "강도"의 상관관계를 허용할 수도 있는 마커가 바람직하다. 따라서, 원하는 이종 폴리펩티드의 발현을 마커의 발현과 상호관련시키는 것이 편리하다.
본 발명은 스플라이싱 방법, 즉 택일적 스플라이싱을 이용하여 동일한 핵산, 즉 동일한 발현 카세트로부터 이종 폴리펩티드 및 마커를 발현시킴으로써, 예를 들어, IRES를 전혀 사용하지 않는다. 본 발명에서 마커는 발현된 이종 폴리펩티드의 원형질막-결합 형태이다. 본 발명에서, 선별 마커는 N-말단 부분으로서 이종 폴리펩티드를 포함하고 C-말단 부분으로서 경막 도메인 또는 GPI-고착자의 적어도 단편을 포함한다. 따라서, 생성된 이종 폴리펩티드와 선별 마커의 세포외 부분, 즉 검출되는 선별 마커의 부분이 동일하다.
본 발명은 이종 폴리펩티드를 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은
a) i) 인 프레임 번역 정지 코돈 없이 이종 폴리펩티드를 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;
b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 폴리펩티드로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 이종 폴리펩티드 및 원형질막-결합 이종 폴리펩티드를 생성하는, 단계; 및
c) 원형질막-결합 이종 폴리펩티드를 가진 세포를 이종 폴리펩티드를 발현하는 세포로서 선별하는 단계
를 포함하는 방법을 포함한다.
DNA의 전사 과정 동안에 소위 전구-mRNA인 한 카피의 DNA가 수득된다. 이 전구-mRNA는 기질 DNA와 동일한 구성을 가진다. 상기 전구-mRNA는 게놈 인트론-엑손-구성을 가진다. 엑손만이 코딩된 폴리펩티드의 아미노산 서열의 정보를 함유한다. 따라서, 인트론은 번역 전에 전구-mRNA로부터 제거되어야 한다. 이 과정은 RNA-스플라이싱으로 지칭된다.
"스플라이싱될 수 있는 핵산"은 적어도 5' 스플라이스 공여 부위, 3' 스플라이스 수용 부위, 및 통상적으로 상기 수용 부위의 20 내지 50개 염기 업스트림에 위치한 소위 분지점을 특징으로 한다. 이 구조는 RNA 스플라이싱 과정 동안에 5' 스플라이스 공여 부위에서 3' 스플라이스 수용 부위로 핵산이 인식되어 전구-mRNA로부터 제거되는 것에 영향을 미친다. 스플라이싱 단계 동안에 폴리펩티드 또는 단백질이 번역되는 성숙 mRNA가 생성된다. 본 발명의 한 실시양태에서, 하나 이상의 핵산, 바람직하게는 제2 핵산은 추가 조절 요소, 예컨대, 인 프레임 정지 코돈 및 폴리아데닐화 신호를 함유하는 스플라이싱될 수 있는 핵산이다.
그러나, 스플라이싱 과정이 유일한 방법은 아니다. 예를 들어, 인트론은 전구-mRNA 프로세싱 과정 동안에 전구-mRNA로부터 제거되지 않고 성숙 mRNA 내로 적어도 부분적으로 포함되어 있다. 인 프레임 정지 코돈이 "포함되거나 포함되지 않는" 인트론에 존재하는 경우, 번역은 이 정지 코돈에서 정지하고 코딩된 폴리펩티드의 변이체가 생성된다.
인트론의 인식 및 제거는 종종 전구-mRNA 내의 추가 시스-작용 요소들에 의해 조절된다. 이 요소들은 이들의 기능 및 위치로 인해 엑손 스플라이스 인핸서(ESE), 엑손 스플라이스 침묵자(silencer)(ESS), 인트론 스플라이스 인핸서(ISE) 또는 인트론 스플라이스 침묵자(ISS)로 지칭된다(Black, D. L., Annu Rev Biochem 72 (2003) 291-336).
대부분의 진핵 유전자의 게놈 DNA는 인트론-엑손-구성을 가진다. 예를 들어, 면역글로불린 중쇄의 분비된 형태의 C-말단 도메인(즉, CH3 또는 CH4 도메인)을 코딩하는 엑손 내에 5' 스플라이스 공여 부위가 존재한다.
이 스플라이스 공여 부위가 중쇄 전구-mRNA의 프로세싱에 효과적이지 않은 경우, 이 엑손 후에 위치하는, 정지 코돈 및 폴리아데닐화 신호를 포함하는 인트론은 성숙 mRNA 내에 적어도 부분적으로 보유된다. 그 후, mRNA는 CH3 또는 CH4 도메인으로 종결되는 면역글로불린 중쇄로 번역되고 가용성 면역글로불린을 대표한다. 이것은 면역글로불린 분비 세포 내에서의 면역글로불린 중쇄 유전자에 대한 주요 프로세싱 경로이다.
이 스플라이스 공여 부위가 면역글로불린 중쇄 전구-mRNA의 프로세싱에 효과적인 경우, 연속적인 인트론이 제거됨으로써 정지 코돈이 제거된다. 따라서, 번역이 면역글로불린 중쇄의 C-말단 도메인 다음에서 정지되지 않는다. 게다가, 계속해서 스플라이싱되면서 번역이 경막 도메인을 코딩하는 엑손까지 연속된다. 면역글로불린 중쇄의 이 주요 프로세싱 경로는 면역글로불린 생성 세포의 세포 표면 상에 제시된 원형질막-결합 면역글로불린 형태를 생성시킨다.
이 과정은 "택일적 스플라이싱"으로 지칭되고 이 과정에서 제거되거나 제거되지 않는 핵산(즉, 인트론)은 "택일적으로 스플라이싱될 수 있는 핵산"으로 지칭된다.
이종 폴리펩티드 또는 단백질을 코딩하는 핵산이 경막 도메인의 적어도 단편을 코딩하는 핵산, 또는 택일적으로 스플라이싱될 수 있는 핵산을 통해 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산에 연결되어 있는 경우, 즉 택일적으로 스플라이싱될 수 있는 핵산이 상기 두 핵산 사이에 위치되어 이들 3개의 핵산이 작동가능하게 연결되어 있는 경우, 이종 폴리펩티드 또는 단백질의 2개 변이체인 가용성 변이체(즉, 폴리펩티드 또는 단백질만을 포함하는 변이체) 및 원형질막-결합 변이체(즉, 폴리펩티드 또는 단백질, 또는 이들 둘다 및 경막 도메인 또는 GPI-고착자를 포함하는 변이체)가 발현된다.
한 실시양태에서, 형질감염된 핵산은 발현 카세트에 포함되어 있다. 한 실시양태에서, 제1 핵산은 그의 3' 말단에서 인 프레임 번역 정지 코돈을 갖지 않는다. 또 다른 실시양태에서, 제1 핵산, 제2 핵산 및 제3 핵산은 작동가능하게 연결되어 있다. 한 실시양태에서, 제3 핵산은 경막 도메인의 적어도 단편을 코딩한다. 또 다른 실시양태에서, 경막 도메인의 단편은 경막 영역이다. 한 실시양태에서, 제3 핵산은 GPI-고착자에 대한 신호 펩티드를 코딩한다. 본 발명의 한 실시양태에서, 제1 핵산에 의해 코딩된 폴리펩티드는 면역글로불린 중쇄, 면역글로불린 경쇄, 생물학적 활성 폴리펩티드, 이들의 단편, 및 이들의 융합 폴리펩티드를 포함하는 군으로부터 선택된다. 본 발명의 한 실시양태에서, 제1 핵산에 의해 코딩된 폴리펩티드는 면역글로불린 중쇄, 면역글로불린 경쇄, 이들의 단편 및 이들의 융합체를 포함하는 군으로부터 선택된다. 한 실시양태에서, 제3 핵산은 면역글로불린 경막 도메인의 적어도 단편을 코딩한다.
보다 상세하게, 본 발명은 면역글로불린 중쇄를 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은
a) i) 인 프레임 번역 정지 코돈 없이 면역글로불린 중쇄를 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;
b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 면역글로불린 중쇄로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 면역글로불린 중쇄 및 원형질막-결합 면역글로불린 중쇄를 생성하는, 단계; 및
c) 원형질막-결합 면역글로불린 중쇄를 가진 세포를 면역글로불린 중쇄를 발현하는 세포로서 선별하는 단계
를 포함하는 방법이다.
한 실시양태에서, 본 방법은 면역글로불린을 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은
a) 면역글로불린 경쇄에 대한 제1 발현 카세트, 및
i) 인 프레임 번역 정지 코돈 없이 면역글로불린 중쇄를 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 제2 발현 카세트
를 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;
b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 면역글로불린 중쇄로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 면역글로불린 및 원형질막-결합 면역글로불린을 생성하는, 단계; 및
c) 원형질막-결합 면역글로불린을 가진 세포를 면역글로불린을 발현하는 세포로서 선별하는 단계
를 포함하는 방법이다.
한 실시양태에서, 본 발명은 면역글로불린을 발현하는 진핵세포를 선별하는 방법을 포함하는데, 이때 상기 방법은
a) 2개의 핵산으로 진핵세포를 동시에 또는 순차적으로 형질감염시키는 단계로서, 이때 하나의 핵산이 면역글로불린 경쇄에 대한 발현 카세트를 포함하고 나머지 하나의 핵산이 i) 인 프레임 번역 정지 코돈 없이 면역글로불린 중쇄를 코딩하는 제1 핵산, ii) 스플라이스 공여 부위로 시작되며 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및 iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 발현 카세트를 포함하는, 단계;
b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 면역글로불린 중쇄로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 상기 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱에 의해 가용성 면역글로불린 및 원형질막-결합 면역글로불린을 생성하는, 단계; 및
c) 원형질막-결합 면역글로불린을 가진 세포를 면역글로불린을 발현하는 세포로서 선별하는 단계
를 포함하는 방법이다.
한 실시양태에서, 제3 핵산에 의해 코딩된 경막 도메인은 면역글로불린 경막 도메인이다. 본 발명의 한 실시양태에서, 제2 핵산은 1개의 5' 스플라이스 공여 부위 및 1개의 3' 스플라이스 수용 부위만을 포함한다. 본 발명의 또 다른 실시양태에서, 제2 핵산은 면역글로불린 중쇄 CH3 또는 CH4 도메인을 코딩하는 엑손 다음에 위치한 천연 발생 면역글로불린 중쇄 인트론으로서, 이때 50개 이상의 연속 뉴클레오티드가 상기 인트론에서 결실되어 있다.
예를 들어, 진핵세포 내에서 면역글로불린 중쇄를 재조합 발현시키고자 하는 경우, 게놈 인트론-엑손-구성을 가지거나 코딩 영역만을 포함하는 핵산, 즉 cDNA가 사용된다. 두 경우에서, 핵산은 면역글로불린 중쇄의 C-말단 도메인을 코딩하는 엑손 다음의 정지 코돈으로 종결된다. 그 후, 게놈 구성에서 택일적으로 스플라이싱될 수 있는 핵산 및 경막 도메인을 포함하는 후속 인트론 및 엑손이 제거된다. 따라서, 이러한 핵산을 사용하는 경우 가용성 면역글로불린 중쇄만이 수득된다.
면역글로불린 또는 이의 단편의 재조합 발현의 경우, 면역글로불린 중쇄 유전자의 게놈 구성이 적어도 부분적으로 보유되고, 즉 C-말단 도메인을 코딩하는 엑손(즉, 택일적으로 스플라이싱될 수 있는 핵산) 및 경막 도메인을 코딩하는 후속 엑손 다음에 인트론이 보유되는 경우, 택일적 스플라이싱이 가능하다. 택일적 스플라이싱 이벤트에 있어서, CH3 또는 CH4 도메인 코딩 엑손의 3' 말단 코돈 및 정지 코돈이 인트론 서열로서 또는 인트론 서열과 함께 제거되고, 추가로 유지된 엑손에 의해 코딩 영역, 즉 리딩 프레임이 그의 3' 말단에서 연장되어 있는 상이한 성숙 mRNA가 생성된다. 이 mRNA는 추가 3' 엑손에 의해 코딩된 추가 경막 도메인 또는 이의 단편을 포함하는 C-말단 연장 면역글로불린 중쇄로 번역된다. 이 연장된 면역글로불린 중쇄는 원형질막-결합 면역글로불린을 발생시키는 면역글로불린의 조립 과정 동안에 도입된다. 놀랍게도 본 발자들은 본 발명에 따른 핵산을 사용하여 이종 폴리펩티드를 생성하는 형질감염 세포를 선별할 수 있음을 발견하였다. 이 방법은 일반적으로 적용될 수 있고 면역글로불린으로 한정되지 않는다. 이 방법을 실시하기 위해, 인 프레임 정지 코돈 없이 이종 폴리펩티드를 재조합 발현하기 위한 핵산은 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 면역글로불린으로부터 유래된 택일적으로 스플라이싱될 수 있는 핵산에 인 프레임으로 작동가능하게 연결되어야 한다. 후속 제3 핵산도 변경시킬 수 있고 경막 도메인 또는 이의 단편을 코딩하는 임의의 핵산뿐만 아니라 GPI-고착자에 대한 신호 펩티드를 코딩하는 임의의 핵산으로부터 선택될 수 있다. 이 요소들, 즉 폴리펩티드를 코딩하는 핵산, 택일적으로 스플라이싱될 수 있는 핵산, 및 경막 도메인 또는 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산이 상이한 유전자 및 상이한 유기체로부터 선택되어 조합될 수 있다. 유일한 필요조건은 상기 3개의 핵산이 택일적으로 스플라이싱될 수 있는 핵산 내 번역 정지 코돈이 폴리펩티드를 코딩하는 핵산의 리딩 프레임과 인 프레임으로 위치하게 하는 방식, 즉 상기 번역 정지 코돈이 리보좀에 의해 인식되어 번역이 종결되게 하는 방식으로 조합된다는 것이다.
일반적으로, 가용성 형태의 이종 폴리펩티드의 C-말단의 부분은 택일적 스플라이싱을 이용하여 전구-mRNA로부터 인트론의 일부로서 제거하거나 제거하지 않을 수 있다. 상기 부분은 3' 말단 코돈, 3' UTR, 정지 코돈 및 분비된 형태의 폴리아데닐화 신호를 포함하거나 포함하지 않는다. 그러므로, 5' 스플라이스 공여 부위로 시작되고 제거되거나 제거되지 않는 3' 스플라이스 수용 부위로 종결되는 핵산은 택일적으로 프로세싱되지 않은 변이체의 C-말단과 중첩되거나 중첩될 수 있다.
그러므로, 면역글로불린 중쇄 유전자의 적어도 부분적으로 보유된 게놈 구성을 가진 본 발명에 따른 핵산을 사용하여 이종 폴리펩티드의 2개의 변이체, 즉 짧은 가용성 변이체 및 긴 원형질막-결합 변이체를 수득할 수 있다.
제1 핵산이 면역글로불린 중쇄를 코딩하는 한 실시양태에서, 제1 핵산은 게놈 수준으로 구성된 면역글로불린 중쇄 유전자의 모든 엑손 및 모두는 아니지만 1개의 인트론을 포함한다. 한 실시양태에서, 제3 핵산은 경막 도메인의 단편 또는 GPI-고착자에 대한 신호 펩티드를 코딩함으로써 경막 도메인의 단편이 단일 엑손에 의해 코딩된다. 또 다른 실시양태에서, 경막 도메인은 M1-M2-엑손-융합체, 즉 게놈 수준의 개재 인트론을 갖지 않는 단일 엑손에 의해 코딩된 면역글로불린 경막 도메인이다. 한 실시양태에서, 면역글로불린 경막 도메인은 cDNA에 의해 코딩된다.
면역글로불린 중쇄 유전자의 적어도 부분적으로 보유된 전체 게놈 구성을 가진 핵산을 숙주 세포 내로 도입함으로써, 한편으로 가용성 이종 폴리펩티드를 발현하고 다른 한편으로 원형질막-결합 이종 폴리펩티드를 발현하는 세포를 수득한다. 예를 들어, 2개의 면역글로불린 변이체를 수득하기 위해, 즉 택일적 스플라이싱을 가능하게 하기 위해, 면역글로불린 중쇄 유전자의 전체 게놈 구성, 즉 모든 인트론 및 엑손을 유지할 필요는 없다. 단지 택일적 스플라이스 부위를 기능성 형태로 유지하는 것만이 요구된다. "기능성 스플라이스 부위"는 5' 스플라이스 공여 부위 및 3' 스플라이스 수용 부위를 포함하는 핵산 서열이므로 전구-mRNA로부터 개재 핵산 서열이 제거될 수 있게 한다. 인트론의 인식 및 제거는 종종 전구-mRNA 상의 추가 시스-작용 요소에 의해 조절된다. 이 요소들은 이들의 기능 및 위치 때문에 엑손 스플라이스 인핸서(ESE), 엑손 스플라이스 침묵자(ESS), 인트론 스플라이스 인핸서(ISE) 또는 인트론 스플라이스 침묵자(ISS)로 지칭된다(본원에 참고로 도입되는 문헌(Black, D. L., Annu Rev Biochem 72 (2003) 291-336)).
이종 폴리펩티드를 발현하는 형질감염 세포를 선별하기 위해 다양한 방법, 예컨대, 분광학적 방법, 예를 들어, 형광, ELISA 및 이의 변법, 생물학적 활성 분석법, 이러한 활성과 무관한 분석법, 예컨대, 이종 폴리펩티드를 인식하여 이 폴리펩티드에 결합하는 항체를 사용하는 웨스턴 블롯팅, SDS 폴리아크릴아미드 겔 전기영동 또는 방사성면역분석법을 이용할 수 있으나 이들로 한정되지 않는다. 원형질막-결합 이종 폴리펩티드는 그의 C-말단을 제외하고 가용성 이종 폴리펩티드와 동일한 아미노산 서열 및 이차 구조를 가지기 때문에, 상기 원형질막-결합 이종 폴리펩티드는 예를 들어, 가용성 변이체와 동일한 항체를 사용하여 확인할 수 있다.
폴리펩티드의 원형질막-결합 변이체는 이것을 발현하는 세포에 단단히 연결된다. 따라서, 원형질막-결합 변이체는 이종 폴리펩티드 또는 단백질, 예를 들어, 면역글로불린의 발현을 위한 핵산으로 성공적으로 형질감염된 세포를 단리하기 위한 마커로서 사용될 수 있다. 한 실시양태에서, 폴리펩티드는 면역글로불린이다. 한 실시양태에서, 면역글로불린은 IgG, IgE 및 IgA로 이루어진 군으로부터 선택된다.
이종 폴리펩티드의 원형질막-결합 변이체에 대한 이종 폴리펩티드의 가용성 변이체의 분자 비는 50:50 초과 내지 100:0 미만, 바람직하게는 75:25 초과 내지 100:0 미만이다. 예를 들어, 진핵세포가 면역글로불린을 코딩하는 본 발명에 따른 핵산으로 형질감염된 경우, 성공적으로 형질감염된 세포는 원형질막-결합 면역글로불린의 등장에 의해 선별될 수 있다.
본 발명에 따른 핵산은 이종 폴리펩티드에 대한 코딩 영역, 택일적으로 스플라이싱될 수 있는 핵산 및 경막 도메인에 대한 코딩 영역 또는 이의 단편 또는 GPI-고착자에 대한 신호 펩티드에 대한 코딩 영역을 5'에서 3' 방향으로 포함하는 핵산이다. 보다 상세하게는, 본 발명은
a) 인 프레임 번역 정지 코돈 없이 이종 폴리펩티드를 코딩하는 제1 핵산,
b) 5' 스플라이스 공여 부위로 시작되고 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 3' 스플라이스 수용 부위로 종결되는 제2 핵산, 및
c) i) 경막 도메인의 적어도 단편 또는 ii) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산
을 포함하는 핵산을 포함한다.
다른 실시양태에서, i) 택일적으로 스플라이싱되는 인트론의 5' 스플라이스 부위는 이종 폴리펩티드를 코딩하는 핵산의 정상적인 정지-코돈의 5'에 위치하고, ii) 제2 핵산은 택일적으로 스플라이싱될 수 있는 핵산이며, iii) 5' 스플라이스 부위는 종종 사용될 뿐 기본적으로 사용되지 않고 택일적으로 프로세싱된 이종 폴리펩티드, 즉 원형질막-결합 폴리펩티드에 대한 정상적으로 프로세싱된 이종 폴리펩티드, 즉 가용성 폴리펩티드의 분자 비가 50:50 초과 내지 100:0 미만이 되게 한다. 한 실시양태에서, 제1 핵산과 제2 핵산은 작동가능하게 연결된다. 즉, 제2 핵산의 번역 정지 코돈이 폴리펩티드 또는 이의 단편을 코딩하는 제1 핵산의 리딩 프레임에 인 프레임으로 위치되어 있다.
택일적 스플라이싱에 의해 제거될 수 있는 핵산은 폴리펩티의 적어도 단편을 코딩하는 핵산 다음에 위치하고 경막 도메인의 적어도 단편을 코딩하거나 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산 앞에 위치한다. 한 실시양태에서, 이종 폴리펩티드는 원하는 N-말단 폴리펩티드 및 면역글로불린 중쇄 CH3 또는 CH4 도메인 또는 이의 변이체의 적어도 C-말단 단편을 포함하는 융합 폴리펩티드이다. 한 실시양태에서, 핵산은 제1 핵산과 제2 핵산 및/또는 제2 핵산과 제3 핵산 사이에 제4 핵산을 포함한다. 즉, 제4 핵산은 예를 들어, 제2 핵산 다음 (즉, 3' 스플라이스 수용 부위 다음) 제3 핵산의 5' 말단 앞에 위치한다.
이종 폴리펩티드를 코딩하는 핵산과 경막 도메인을 코딩하거나 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산 사이에 위치한 택일적으로 스플라이싱될 수 있는 핵산을 사용하여, 이종 폴리펩티드의 2개 변이체, 즉 경막 도메인 또는 GPI-고착자를 갖지 않은 이종 폴리펩티드 및 경막 도메인 또는 GPI-고착자를 갖는 이종 폴리펩티드를 발현시킬 수 있다. 이종 폴리펩티드는 예를 들어, 호르몬; 사이토카인; 성장 인자; 수용체 리간드, 작용제 또는 길항제; 세포독성제; 항바이러스제; 조영제; 효소 억제제; 효소 활성화제 또는 효소 활성 조절제, 예컨대, 알로스테릭 물질; 면역글로불린; 및 이들의 융합체 및 단편으로부터 선택되나, 이들로 한정되지 않는다. 한 실시양태에서, 폴리펩티드는 면역글로불린, 면역글로불린 중쇄 폴리펩티드 또는 면역글로불린 융합체이다.
본 발명은 택일적으로 스플라이싱될 수 있는 핵산이 포함되어 있는 한 임의의 폴리펩티드, 임의의 경막 도메인 및 GPI-고착자에 대한 임의의 신호 펩티드를 사용하여 실시할 수 있다. 보다 상세하게는, 5' 스플라이스 공여 부위로 시작되고 3' 스플라이스 수용 부위로 종결되는 핵산 단편이 적절하게 선택되어야 한다. 선행 폴리펩티드 및 후속 경막 도메인 또는 GPI-고착자가 자유롭게 선택될 수 있다.
본 발명은 a) 제1 다중 클로닝 부위, b) 5' 스플라이스 공여 부위로 시작되고 3' 스플라이스 수용 부위로 종결되는 스플라이싱될 수 있는 핵산으로서, 이때 i) 상기 스플라이싱될 수 있는 핵산이 정지 코돈 및 폴리아데닐화 신호를 포함하고, ii) 상기 스플라이싱될 수 있는 핵산이 전구-mRNA 프로세싱 과정 동안에 기본적으로 제거되지 않는, 핵산, c) 제2 다중 클로닝 부위를 포함하는 핵산을 추가로 포함한다.
본 발명은 예를 들어, C3b/C4b 수용체(보체 수용체 타입 1)(Hourcade, D., et al, J. Exp. Med. 168 (1988) 1255-1270), 인간, 닭 및 래트 EGFR(Callaghan, T., et al., Oncogene 8 (1993) 2939-2948; Reiter, J.L., and Maihle, N.J., Nuc. Acids Res. 24 (1996) 4050-4056; Petch, L., et al., Mol. Cell Biol. 10 (1990) 2973-2982), 면역글로불린(Ig) α, ε, γ 및 μ 중쇄(Zhang, K., et al., J. Exp. Med. 176 (1992) 233-243; Rogers, J.E., et al., Cell 20 (1980) 303-312; Milcarek, C, and Hall, B., Mol. Cell Biol. 5 (1985) 2514-2520; Kobrin, B.J., et al., Mol. Cell Biol. 6 (1986) 1687-1697; Cushley, W., et al., Nature 298 (1982) 77; Alt, F.W., et al., Cell 20 (1980) 293-301; Peterson, MX., Gene Exp. 2 (1992) 319-327), 인간 PLA2 수용체(Ancian, P., et al., J. Biol. Chem. 270 (1995) 8963-8970), 닭 Cek5(Connor, RJ., and Pasquale, E.B., Oncogene 11 (1995) 2429-2438), 및 인간 FGFR(Johnson, D.E., et al, Mol. Cell Biol. 11 (1991) 4627-4634)을 코딩하는 핵산들로 이루어진 군으로부터 유래된 제2 핵산, 즉 택일적으로 스플라이싱될 수 있는 핵산(그러나, 이들로 한정되지 않음)을 사용하여 실시할 수 있다.
한 실시양태에서, 제2 핵산은 CH3/CH4 도메인을 코딩하는 엑손과 경막 도메인의 적어도 단편을 코딩하는 엑손 사이에 위치한 면역글로불린의 인트론이다. 한 실시양태에서, 제2 핵산은 인간(hu) 면역글로불린(Ig) α(알파) 중쇄, hu Ig δ(델타) 중쇄, hu Ig ε(엡실론) 중쇄, hu Ig γ1, γ2, γ3 및 γ4(감마) 중쇄, hu Ig μ(뮤) 중쇄, 뮤린 Ig 중쇄 타입 α(알파), 뮤린 Ig 중쇄 타입 δ(델타), 뮤린 Ig 중쇄 타입 ε(엡실론), 뮤린 Ig 중쇄 타입 γ1, 뮤린 Ig 중쇄 타입 γ2A, 뮤린 Ig 중쇄 타입 γ2B, 뮤린 Ig 중쇄 타입 γ3 및 뮤린 Ig 중쇄 타입 μ(뮤)를 코딩하는 핵산으로 이루어진 군으로부터 유래된다.
한 실시양태에서, 제2 핵산은 인간 면역글로불린 γ1 중쇄, 인간 면역글로불린 γ2 중쇄, 인간 면역글로불린 γ3 중쇄, 인간 면역글로불린 γ4 중쇄, 인간 면역글로불린 ε 중쇄(1) 및 인간 면역글로불린 ε 중쇄(2)를 코딩하는 핵산들로 이루어진 군으로부터 선택된다. 한 실시양태에서, 제2 핵산은 인간 면역글로불린 δ 중쇄, 인간 면역글로불린 γ1 중쇄, 인간 면역글로불린 γ2 중쇄, 인간 면역글로불린 μ 중쇄, 뮤린 중쇄 타입 α, 뮤린 중쇄 타입 γ1, 뮤린 중쇄 타입 γ2B, 뮤린 중쇄 타입 γ3 및 뮤린 중쇄 타입 μ를 코딩하는 핵산들로 이루어진 군으로부터 유도되거나 선택된다.
본 발명은 예를 들어, 경막 도메인의 적어도 단편을 코딩하는 핵산의 경우 C3b/C4b 수용체(보체 수용체 타입 1)(Hourcade, D., et al., J. Exp. Med. 168 (1988) 1255-1270), 인간, 닭 및 래트 EGFR(Callaghan, T., et al., Oncogene 8 (1993) 2939-2948; Reiter, J.L., and Maihle, N.J., Nuc. Acids Res. 24 (1996) 4050-4056; Petch, L., et al., Mol. Cell Biol. 10 (1990) 2973-2982), Ig α, ε, γ 및 μ 중쇄(Zhang, K., et al., J. Exp. Med. 176 (1992) 233-243; Rogers, J.E., et al., Cell 20 (1980) 303-312; Milcarek, C, and Hall, B., Mol. Cell Biol. 5 (1985) 2514-2520; Kobrin, BJ., et al., Mol. Cell Biol. 6 (1986) 1687-1697; Cushley, W., et al., Nature 298 (1982) 77; Alt, F.W., et al., Cell 20 (1980) 293-301; Peterson, M.L., Gene Exp. 2 (1992) 319-327), 인간 PLA2 수용체(Ancian, P., et al., J. Biol. Chem. 270 (1995) 8963-8970), 닭 Cek5(Connor, RJ., and Pasquale, E.B., Oncogene 11 (1995) 2429-2438), 및 인간 FGFR(Johnson, D.E., et al, Mol. Cell Biol. 11 (1991) 4627-4634)을 코딩하는 핵산들로 이루어진 군으로부터 선택된 제3 핵산(그러나, 이들로 한정되지 않음)을 사용하여 실시할 수 있다. 한 실시양태에서, 제3 핵산은 인간(hu) 면역글로불린(Ig) α 중쇄, hu Ig δ 중쇄, hu Ig ε 중쇄, hu Ig γ1, γ2, γ3 및 γ4 중쇄, hu Ig μ 중쇄, 뮤린 Ig 중쇄 타입 α, 뮤린 Ig 중쇄 타입 δ, 뮤린 Ig 중쇄 타입 ε, 뮤린 Ig 중쇄 타입 γ1, 뮤린 Ig 중쇄 타입 γ2A, 뮤린 Ig 중쇄 타입 γ2B, 뮤린 Ig 중쇄 타입 γ3 및 뮤린 Ig 중쇄 타입 μ를 코딩하는 핵산으로 이루어진 군으로부터 유래된다. 한 실시양태에서, 제3 핵산은 인간 면역글로불린 γ1 중쇄, 인간 면역글로불린 γ2 중쇄, 인간 면역글로불린 γ3 중쇄, 인간 면역글로불린 γ4 중쇄, 인간 면역글로불린 ε 중쇄(1) 및 인간 면역글로불린 ε 중쇄(2)를 코딩하는 핵산들로 이루어진 군으로부터 선택된다. 한 실시양태에서, 제3 핵산은 인간 면역글로불린 δ 중쇄, 인간 면역글로불린 γ1 중쇄, 인간 면역글로불린 γ2 중쇄, 인간 면역글로불린 μ 중쇄, 뮤린 중쇄 타입 α, 뮤린 중쇄 타입 γ1, 뮤린 중쇄 타입 γ2B, 뮤린 중쇄 타입 γ3 및 뮤린 중쇄 타입 μ를 코딩하는 핵산들로 이루어진 군으로부터 선택된다.
경막 도메인의 적어도 단편을 코딩하는 핵산으로 이루어진 군 이외에, 제3 핵산은 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산들로 이루어진 군으로부터 선택될 수 있다. GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산들로 이루어진 군은 인간 알칼리성 디에스터레이즈, 아세틸콜린 에스터레이즈, 알칼리성 포스파테이즈(장, 간 및 태반), CAMPATH-1 항원, 암배아 항원, CD55, CD59, CD90, 콘택틴-1, E48 항원, 폴레이트 수용체 A 및 B, GPI-고착 단백질 p137, 림프구 기능-관련 항원-3, mDIA 상호작용 단백질, 5'-뉴클레오티데이즈, 유로키네이즈 플라스미노겐 활성화자 인자로부터 유래된 GPI-고착자; 뮤린, LY-6C 항원, LY-6 항원, 5'-뉴클레오티데이즈, OX45 항원, 줄기세포 항원-2, 혈관 세포 부착 분자-1, Qa 림프구 항원 2(Qa2)로부터 유래된 GPI-고착자; 토끼 트레할레이즈로부터 유래된 GPI-고착자; 래트 브레비칸 단백질, CD90, 글리피칸 단백질, 헤파린 설페이트 프로테오글리칸, MRC OX-45 항원, 5'-뉴클레오데이즈, 췌장 분비 과립 막 주 당단백질, T-세포 표면 단백질 RT6.2로부터 유래된 GPI-고착자; 효모 DNA 복구 단백질 PHR1, 당인지질-고착 표면 단백질 1로부터 유래된 GPI-고착자; 돼지 아밀로이드 전구체 단백질, 디펩티데이즈로부터 유래된 GPI-고착자; 트립파노소마 브루세이 다양성 변이체 표면 단백질, 폴리시클릭 산성 반복 단백질로부터 유래된 GPI-고착자; 트립파노소마 콘골렌즈(congolense) 변이체 표면 단백질 YNat 1.1로부터 유래된 GPI-고착자; 닭 멜라노트랜스페린, 신경 세포 부착 분자로부터 유래된 GPI-고착자; 토페도 마모라타(Torpedo marmorata) 아세틸콜린 에스터레이즈로부터 유래된 GPI-고착자; 햄스터 프리온 단백질로부터 유래된 GPI-고착자; 소 5'-뉴클레오티데이즈로부터 유래된 GPI-고착자; 점균류 막 단백질 Gp64, 전구-포자 특이적 항원으로부터 유래된 GPI-고착자; 및 스퀴드(squid) Sgp1, Sgp2로부터 유래된 GPI-고착자에 대한 신호 펩티드를 코딩하는 핵산들로 이루어진 군으로부터 선택될 수 있다.
본 발명에 따른 제2 핵산의 핵산 서열들의 예가 하기 표 1에 기재되어 있다. 표 2에서, 본 발명에 따른 제3 핵산의 핵산 서열 및 본 발명에 따른 제3 핵산 서열에 상응하는 아미노산 서열의 예가 하기 표 2에 기재되어 있다. 임의적 핵산인 제4 핵산의 핵산 서열 및 본 발명에 따른 상기 임의적 핵산인 제4 핵산에 상응하는 아미노산 서열의 예가 하기 표 3에 기재되어 있다.
하기 표 1에는 5' 스플라이스 공여 부위, 제2 (택일적으로 스플라이싱될 수 있는) 핵산 및 3' 스플라이스 수용 부위가 기재되어 있다. 제2 핵산의 서열이 일반으로 1 kb를 초과하기 때문에 표 1에 기재된 서열은 단축되고 전장 제2 핵산의 전체 크기를 표시하는 숫자에 의해 분리된 제2 핵산의 처음 약 100개 뉴클레오티드 및 마지막 100개 뉴클레오티드를 보여준다. 제2 핵산의 전장 서열은 서열목록의 주어진 서열번호에 포함되어 있다. 정지 코돈은 밑줄로 표시되어 있다.
스플라이스 공여 부위는 스플라이스 공여 부위의 선행 컨센서스 서열, 및 수직선에 의해 분리된 제2 핵산의 처음 6개 뉴클레오티드를 포함하는 형태로 주어진다(예를 들어, 문헌(Zhang, M.Q., Human Mol. Gen. 7 (1998) 919-932) 참조). 마찬가지로, 스플라이스 수용체 부위는 수직선에 의해 분리되어 있는 제2 핵산 및 후속 스플라이스 수용 부위 컨센서스 서열의 마지막 6개 뉴클레오티드를 기재함에 의해 주어진다. 수직선 바로 다음에 위치한 뉴클레오티드(5' 스플라이스 공여 부위) 및 수직선 바로 앞에 위치한 뉴클레오티드(3' 스플라이스 수용 부위)는 제2 (스플라이싱될 수 있는) 핵산의 첫번째 뉴클레오티드 및 마지막 뉴클레오티드이다. 제2 핵산 내의 정지 코돈은 표 1에서 밑줄로 표시되어 있다.
제2 핵산은 이종 폴리펩티드를 코딩하는 핵산, 즉 제1 핵산 또는 임의적 핵산 서열인 작은 (9 내지 21개 염기) 개재 핵산 서열에 직접 연결될 수 있다. 한 실시양태에서, 임의적 핵산인 개재 (제5) 핵산은 제2 핵산이 수득되는 게놈 내의 제2 핵산 앞에 위치한 핵산으로부터 유래된다.
표 2에서, 경막 도메인의 단편을 코딩하는 제3 핵산 서열 및 GPI-고착자에 대한 신호 펩티드의 아미노산 서열의 예가 기재되어 있다. 이 서열은 단독으로 또는 임의적 서열인 개재 서열, 즉 제4 핵산과 함께 3' 스플라이스 수용 부위 다음에 위치할 수 있다. 표 3에서, 제4 핵산 서열 및 이 제4 핵산 서열에 상응하는 아미노산 서열의 예가 표 3에 기재되어 있다.
한 실시양태에서, 본 발명에 따른 핵산은 제2 핵산과 제3 핵산 사이에 제4 핵산을 포함한다. 한 실시양태에서, 본 발명에 따른 핵산은 제1 핵산과 제2 핵산 사이에 제5 핵산을 포함한다. 본 발명의 한 실시양태는 제3 핵산이 i) 동일한 또는 ii) 상이한 유전자 또는 유기체로부터 제2 핵산으로서 수득되고, 즉 상기 제3 핵산이 게놈 내에서 상기 제2 핵산과 함께 존재할 필요가 없다는 것이다.
서열은 공개적으로 입수가능한 게놈 또는 데이타베이스(예를 들어, 인간 게놈 프로젝트, http://www.gdb.org/; mouse genome database, http://www.informatics.jax.org/; SwissProt (http://www.expasy.org/sprot/)로부터 유래된다. 정보를 이용할 수 없는 경우, 서열은 소프트웨어 ALOM(예컨대, 문헌(Klein, P., et al., Biochim. Biophys. Acta 787 (1984) 221-226) 참조)에 의해 예측되거나 완성된다. 전장 막 도메인의 경우, 괄호안의 서열은 주어진 스위스프로트(SwissProt) 소프트웨어 이외에 ALOM에 의해 예측된다.
한 실시양태에서, 제2 핵산은 서열번호 001, 002, 003, 004, 005, 006, 007, 008, 009, 151, 152, 153, 154, 155, 156, 157, 158, 159, 169, 170, 171, 172 및 173을 포함하는 핵산들로 이루어진 군으로부터 선택된다. 한 실시양태에서, 본 발명에 따른 핵산 중 제2 핵산은 서열번호 001 내지 009의 핵산 서열들로 이루어진 군으로부터 선택된다. 한 실시양태에서, 제2 핵산은 서열번호 002, 003, 156, 157, 170 및 171을 포함하는 핵산들로 이루어진 군으로부터 선택된다. 한 실시양태에서, 본 발명에 따른 핵산 중 제3 핵산은 서열번호 010 내지 018의 핵산 서열들 및 서열번호 019 내지 069의 아미노산 서열들을 코딩하는 핵산 서열들로 이루어진 군으로부터 선택되거나 상기 군으로부터 선택된 핵산의 단편이다. 한 실시양태에서, 본 발명에 따른 핵산 중 제3 핵산은 서열번호 010, 011, 012, 013, 014, 015, 016, 017, 018, 160, 161, 163, 164, 165, 166, 167, 168, 174, 175 및 176의 핵산 서열들 및 서열번호 019 내지 069 및 162의 아미노산 서열들을 코딩하는 핵산 서열들로 이루어진 군으로부터 선택되거나 상기 군으로부터 선택된 핵산의 단편이다. 한 실시양태에서, 본 발명에 따른 핵산 중 제3 핵산은 서열번호 011, 012, 165, 166 및 175의 핵산 서열들 및 서열번호 019 내지 036의 아미노산 서열들을 코딩하는 핵산 서열들로 이루어진 군으로부터 선택되거나 상기 군으로부터 선택된 핵산의 단편이다. 또 다른 실시양태에서, 본 발명에 따른 핵산 중 제3 핵산은 서열번호 011, 012, 165, 166 및 175의 핵산 서열들로 이루어진 군으로부터 선택되거나 상기 군으로부터 선택된 핵산의 단편이다. 한 실시양태에서, 본 발명에 따른 핵산 중 제4 핵산은 서열번호 070 내지 078의 핵산 서열들 및 서열번호 079 내지 129의 아미노산 서열들을 코딩하는 핵산 서열들로 이루어진 군으로부터 선택되거나 상기 군으로부터 선택된 핵산을 포함한다.
한 실시양태에서, 면역글로불린 중쇄 및 경막 도메인의 폴리펩티드는 면역글로불린 중쇄의 폴리펩티드이다. 면역글로불린을 발현시키고자 하는 경우, 본 발명의 핵산은 면역글로불린 경쇄를 코딩하는 핵산과 함께 진핵 숙주세포 내로 도입된다. 이 핵산은 동일한 핵산 또는 상이한 핵산 상에 위치할 수 있다.
본 발명은 본 발명의 벡터를 포함하는 진핵세포뿐만 아니라 본 발명의 핵산을 포함하는 벡터를 포함한다.
본 발명에 따른 핵산에 의해 코딩된 이종 폴리펩티드의 가용성 변이체는 본 발명의 핵산으로 진핵세포를 형질감염시키고, 상기 핵산에 의해 코딩된 폴리펩티드의 발현에 적합한 조건 하에 상기 세포를 배양하고, 세포의 세포질 또는 세포 배양물로부터 폴리펩티드를 회수함으로써 제조할 수 있다.
본 발명에 따른 진핵세포를 발생시키고자 하는 경우, 키트가 제공된다. 상기 키트는 2개 이상의 다중 클로닝 부위, 및 5' 스플라이스 공여 부위로 시작되며 3' 스플라이스 수용 부위로 종결되는 스플라이싱될 수 있는 핵산을 함유하는 벡터를 포함하는데, 이때 i) 상기 핵산은 번역 정지 코돈 및 폴리아데닐화 신호를 포함하고, ii) 상기 핵산은 전구-mRNA 프로세싱 과정 동안에 기본적으로 제거되지 않는다.
한 실시양태에서, 본 발명의 진핵세포는 포유동물 세포이다. 한 실시양태에서, 포유동물 세포는 CHO 세포, NS0 세포, Sp2/0 세포, COS 세포, K652 세포, BHK 세포, PER.C6® 세포 및 HEK 세포를 포함하는 군으로부터 선택된 세포이다.
하기 실시예, 서열목록 및 도면은 본 발명의 이해를 돕기 위해 제공된 것이고, 본 발명의 진정한 범위는 첨부된 청구범위에 기재되어 있다. 본 발명의 사상을 벗어나지 않으면서 기재된 절차에 변형을 가할 수 있다.
표 설명
표 1: 제2 핵산의 예
표 2: 제3 핵산 및 제3 핵산에 상응하는 아미노산의 예
표 3: 제4 핵산 및 제4 핵산에 상응하는 아미노산의 예
표 4: sIgG/mIgG 발현 벡터 "pmIgG-A"의 제작에 있어서 클로닝 및 돌연변이유발용 올리고뉴클레오티드 프라이머
표 5: 대수기 동안 여러 시점에서 계산된 4개의 상이한 SPR에 기초한, 모든 선택된 클론에 대해 측정된 평균 SPR
표 6: 단일 세포를 96웰 플레이트 내에 배분한 지 3주 후 상이한 IgG 농도 수준에 대한 클론의 분포, 및 ELISA에 의한 515개의 mIgG-분류 클론 및 550개의 대조군 클론의 세포 배양물 상청액의 분석
표 7: 제2 선별에서 상이한 IgG 농도 수준에 대한 클론의 분포.
표 8: CASY® TT 세포 계수기(Scharfe Systems)로 측정한 모든 클론의 0, 1, 2, 3, 4 및 7일 진탕기 배양물의 세포수
표 9: ELISA에 의한 10일 진탕기 배양물의 생산성 측정
서열 설명
서열번호 001: 인간 면역글로불린 δ 중쇄로부터 유래된 제2 핵산
서열번호 002: 인간 면역글로불린 γ1 중쇄로부터 유래된 제2 핵산
서열번호 003: 인간 면역글로불린 γ2 중쇄로부터 유래된 제2 핵산
서열번호 004: 인간 면역글로불린 μ 중쇄로부터 유래된 제2 핵산
서열번호 005: 뮤린 면역글로불린 중쇄 타입 α로부터 유래된 제2 핵산
서열번호 006: 뮤린 면역글로불린 중쇄 타입 γ1로부터 유래된 제2 핵산
서열번호 007: 뮤린 면역글로불린 중쇄 타입 γ2B로부터 유래된 제2 핵산
서열번호 008: 뮤린 면역글로불린 중쇄 타입 γ3으로부터 유래된 제2 핵산
서열번호 009: 뮤린 면역글로불린 중쇄 타입 μ로부터 유래된 제2 핵산
서열번호 010: 인간 면역글로불린 δ 중쇄로부터 유래된 제3 핵산
서열번호 011: 인간 면역글로불린 γ1 중쇄로부터 유래된 제3 핵산
서열번호 012: 인간 면역글로불린 γ2 중쇄로부터 유래된 제3 핵산
서열번호 013: 인간 면역글로불린 μ2 중쇄로부터 유래된 제3 핵산
서열번호 014: 뮤린 면역글로불린 중쇄 타입 α로부터 유래된 제3 핵산
서열번호 015: 뮤린 면역글로불린 중쇄 타입 γ1로부터 유래된 제3 핵산
서열번호 016: 뮤린 면역글로불린 중쇄 타입 γ2B로부터 유래된 제3 핵산
서열번호 017: 뮤린 면역글로불린 중쇄 타입 γ3으로부터 유래된 제3 핵산
서열번호 018: 뮤린 면역글로불린 중쇄 타입 μ로부터 유래된 제3 핵산
서열번호 019: 인간 AChE로부터 유래된 제3 핵산
서열번호 020: 인간 장 알칼리성 포스파테이즈로부터 유래된 제3 핵산
서열번호 021: 인간 간 알칼리성 포스파테이즈로부터 유래된 제3 핵산
서열번호 022: 인간 태반 알칼리성 포스파테이즈로부터 유래된 제3 핵산
서열번호 023: 인간 CAMPATH-1 항원으로부터 유래된 제3 핵산
서열번호 024: 인간 암배아 항원으로부터 유래된 제3 핵산
서열번호 025: 인간 CD55로부터 유래된 제3 핵산
서열번호 026: 인간 CD59로부터 유래된 제3 핵산
서열번호 027: 인간 CD90으로부터 유래된 제3 핵산
서열번호 028: 인간 콘택틴-1로부터 유래된 제3 핵산
서열번호 029: 인간 E48 항원으로부터 유래된 제3 핵산
서열번호 030: 인간 폴레이트 수용체 A로부터 유래된 제3 핵산
서열번호 031: 인간 폴레이트 수용체 B로부터 유래된 제3 핵산
서열번호 032: 인간 GPI-고착 단백질 p137로부터 유래된 제3 핵산
서열번호 033: 인간 림프구 기능-관련 항원-3으로부터 유래된 제3 핵산
서열번호 034: 인간 mDIA 상호작용 단백질로부터 유래된 제3 핵산
서열번호 035: 인간 5'-뉴클레오티데이즈로부터 유래된 제3 핵산
서열번호 036: 인간 유로키네이즈 플라스미노겐 활성화자 인자로부터 유래된 제3 핵산
서열번호 037: 뮤린 세포 표면 단백질 LY-6C 항원으로부터 유래된 제3 핵산
서열번호 038: Ly-6 항원 ThB로부터 유래된 제3 핵산
서열번호 039: 뮤린 5'-뉴클레오티데이즈로부터 유래된 제3 핵산
서열번호 040: 뮤린 OX45 항원으로부터 유래된 제3 핵산
서열번호 041: 뮤린 줄기 세포 항원 2로부터 유래된 제3 핵산
서열번호 042: 뮤린 혈관 세포 부착 분자 1로부터 유래된 제3 핵산
서열번호 043: 래트 브레비칸으로부터 유래된 제3 핵산
서열번호 044: 래트 CD90 항원으로부터 유래된 제3 핵산
서열번호 045: 래트 글리피칸으로부터 유래된 제3 핵산
서열번호 046: 래트 MRC OX45 항원으로부터 유래된 제3 핵산
서열번호 047: 래트 5'-뉴클레오티데이즈로부터 유래된 제3 핵산
서열번호 048: 래트 췌장 분비 과립 막 주 당단백질 GP2로부터 유래된 제3 핵산
서열번호 049: 래트 T-세포 표면 단백질 RT6.2로부터 유래된 제3 핵산
서열번호 050: 효모 DNA 복구 단백질 PHR1로부터 유래된 제3 핵산
서열번호 051: 효모 당인지질-고착 표면 단백질-1로부터 유래된 제3 핵산
서열번호 052: 돼지 아밀로이드 전구 단백질로부터 유래된 제3 핵산
서열번호 053: 돼지 디펩티데이즈로부터 유래된 제3 핵산
서열번호 054: 트립파노소마 브루세이 변이체 표면 단백질 IL Tat 1.1로부터 유래된 제3 핵산
서열번호 055: 트립파노소마 브루세이 변이체 표면 단백질 MIT 117a로부터 유래된 제3 핵산
서열번호 056: 트립파노소마 브루세이 변이체 표면 단백질 MIT 118a로부터 유래된 제3 핵산
서열번호 057: 트립파노소마 브루세이 변이체 표면 단백질 MIT 221로부터 유래된 제3 핵산
서열번호 058: 트립파노소마 브루세이 변이체 표면 단백질 MITat 1.1000 BC로부터 유래된 제3 핵산
서열번호 059: 트립파노소마 브루세이 변이체 표면 단백질 MITat 1.5b로부터 유래된 제3 핵산
서열번호 060: 트립파노소마 브루세이 프로사이클릭 산성 반복 단백질로부터 유래된 제3 핵산
서열번호 061: 트립파노소마 브루세이 변이체 표면 단백질 TxTat 1로부터 유래된 제3 핵산
서열번호 062: 트립파노소마 콘골렌즈 변이체 표면 단백질 YNat 1.1로부터 유래된 제3 핵산
서열번호 063: 닭 멜라노트랜스페린으로부터 유래된 제3 핵산
서열번호 064: 닭 신경 세포 부착 분자로부터 유래된 제3 핵산
서열번호 065: 토페도 마모라타 AChE로부터 유래된 제3 핵산
서열번호 066: 햄스터 프리온 단백질로부터 유래된 제3 핵산
서열번호 067: 소 5'-뉴클레오티데이즈로부터 유래된 제3 핵산
서열번호 068: 점균류 막 단백질 Gp64로부터 유래된 제3 핵산
서열번호 069: 점균류 전구-포자 특이적 항원으로부터 유래된 제3 핵산
서열번호 070: 인간 면역글로불린 δ 중쇄로부터 유래된 제4 핵산
서열번호 071: 인간 면역글로불린 γ1 중쇄로부터 유래된 제4 핵산
서열번호 072: 인간 면역글로불린 γ2 중쇄로부터 유래된 제4 핵산
서열번호 073: 인간 면역글로불린 μ 중쇄로부터 유래된 제4 핵산
서열번호 074: 뮤린 면역글로불린 중쇄 타입 α로부터 유래된 제4 핵산
서열번호 075: 뮤린 면역글로불린 중쇄 타입 γ1로부터 유래된 제4 핵산
서열번호 076: 뮤린 면역글로불린 중쇄 타입 γ2B로부터 유래된 제4 핵산
서열번호 077: 뮤린 면역글로불린 중쇄 타입 γ3으로부터 유래된 제4 핵산
서열번호 078: 뮤린 면역글로불린 중쇄 타입 μ로부터 유래된 제4 핵산
서열번호 079: 인간 AChE로부터 유래된 제4 핵산
서열번호 080: 인간 장 알칼리성 포스파테이즈로부터 유래된 제4 핵산
서열번호 081: 인간 간 알칼리성 포스파테이즈로부터 유래된 제4 핵산
서열번호 082: 인간 태반 알칼리성 포스파테이즈로부터 유래된 제4 핵산
서열번호 083: 인간 CAMPATH-1 항원으로부터 유래된 제4 핵산
서열번호 084: 인간 암배아 항원으로부터 유래된 제4 핵산
서열번호 085: 인간 CD55로부터 유래된 제4 핵산
서열번호 086: 인간 CD59로부터 유래된 제4 핵산
서열번호 087: 인간 CD90으로부터 유래된 제4 핵산
서열번호 088: 인간 콘택틴-1로부터 유래된 제4 핵산
서열번호 089: 인간 E48 항원으로부터 유래된 제4 핵산
서열번호 090: 인간 폴레이트 수용체 A로부터 유래된 제4 핵산
서열번호 091: 인간 폴레이트 수용체 B로부터 유래된 제4 핵산
서열번호 092: 인간 GPI-고착 단백질 p137로부터 유래된 제4 핵산
서열번호 093: 인간 림프구 기능-관련 항원-3으로부터 유래된 제4 핵산
서열번호 094: 인간 mDIA 상호작용 단백질로부터 유래된 제4 핵산
서열번호 095: 인간 5'-뉴클레오티데이즈로부터 유래된 제4 핵산
서열번호 096: 인간 유로키네이즈 플라스미노겐 활성화자 인자로부터 유래된 제4 핵산
서열번호 097: 뮤린 세포 표면 단백질 LY-6C 항원으로부터 유래된 제4 핵산
서열번호 098: Ly-6 항원 ThB로부터 유래된 제4 핵산
서열번호 099: 뮤린 5'-뉴클레오티데이즈로부터 유래된 제4 핵산
서열번호 100: 뮤린 OX45 항원으로부터 유래된 제4 핵산
서열번호 101: 뮤린 줄기 세포 항원 2로부터 유래된 제4 핵산
서열번호 102: 뮤린 혈관 세포 부착 분자 1로부터 유래된 제4 핵산
서열번호 103: 래트 브레비칸으로부터 유래된 제4 핵산
서열번호 104: 래트 CD90 항원으로부터 유래된 제4 핵산
서열번호 105: 래트 글리피칸으로부터 유래된 제4 핵산
서열번호 106: 래트 MRC OX45 항원으로부터 유래된 제4 핵산
서열번호 107: 래트 5'-뉴클레오티데이즈로부터 유래된 제4 핵산
서열번호 108: 래트 췌장 분비 과립 막 주 당단백질 GP2로부터 유래된 제4 핵산
서열번호 109: 래트 T-세포 표면 단백질 RT6.2로부터 유래된 제4 핵산
서열번호 110: 효모 DNA 복구 단백질 PHR1로부터 유래된 제4 핵산
서열번호 111: 효모 당인지질-고착 표면 단백질-1로부터 유래된 제4 핵산
서열번호 112: 돼지 아밀로이드 전구 단백질로부터 유래된 제4 핵산
서열번호 113: 돼지 디펩티데이즈로부터 유래된 제4 핵산
서열번호 114: 트립파노소마 브루세이 변이체 표면 단백질 IL Tat 1.1로부터 유래된 제4 핵산
서열번호 115: 트립파노소마 브루세이 변이체 표면 단백질 MIT 117a로부터 유래된 제4 핵산
서열번호 116: 트립파노소마 브루세이 변이체 표면 단백질 MIT 118a로부터 유래된 제4 핵산
서열번호 117: 트립파노소마 브루세이 변이체 표면 단백질 MIT 221로부터 유래된 제4 핵산
서열번호 118: 트립파노소마 브루세이 변이체 표면 단백질 MITat 1.1000 BC로부터 유래된 제4 핵산
서열번호 119: 트립파노소마 브루세이 변이체 표면 단백질 MITat 1.5b로부터 유래된 제4 핵산
서열번호 120: 트립파노소마 브루세이 프로사이클릭 산성 반복 단백질로부터 유래된 제4 핵산
서열번호 121: 트립파노소마 브루세이 변이체 표면 단백질 TxTat 1로부터 유래된 제4 핵산
서열번호 122: 트립파노소마 콘골렌즈 변이체 표면 단백질 YNat 1.1로부터 유래된 제4 핵산
서열번호 123: 닭 멜라노트랜스페린으로부터 유래된 제4 핵산
서열번호 124: 닭 신경 세포 부착 분자로부터 유래된 제4 핵산
서열번호 125: 토페도 마모라타 AChE로부터 유래된 제4 핵산
서열번호 126: 햄스터 프리온 단백질로부터 유래된 제4 핵산
서열번호 127: 소 5'-뉴클레오티데이즈로부터 유래된 제4 핵산
서열번호 128: 점균류 막 단백질 Gp64로부터 유래된 제4 핵산
서열번호 129: 점균류 전구-포자 특이적 항원으로부터 유래된 제4 핵산
서열번호 130: 모든 개재 인트론과 함께 CH1 내지 CH3까지의 엑손 및 인접 3' UTR을 포함하는 인간 면역글로불린 중쇄 불변 γ1(IGHG1) 유전자
서열번호 131: 플라스미드 pIgG-A에 의해 코딩된 γ 쇄 불변 영역의 아미노산 서열
서열번호 132: 올리고뉴클레오티드 프라이머 TM-fw1
서열번호 133: 올리고뉴클레오티드 프라이머 TM-rv1
서열번호 134: 올리고뉴클레오티드 프라이머 M1-rv
서열번호 135: 올리고뉴클레오티드 프라이머 M2-fw
서열번호 136: 올리고뉴클레오티드 프라이머 TM-fw2
서열번호 137: 올리고뉴클레오티드 프라이머 TM-rv2
서열번호 138: 올리고뉴클레오티드 프라이머 mutSphI-1
서열번호 139: 올리고뉴클레오티드 프라이머 mutSphI-2
서열번호 140: 모든 개재 인트론과 함께 CH1 내지 M2까지의 엑손, 인트론 6 내의 IgG1의 분비 형태에 대한 폴리아데닐화 신호, 및 IgG1의 막 결합 형태에 대한 폴리아데닐화 신호를 포함하는 3' UTR을 포함하는 인간 면역글로불린 중쇄 불변 γ1(IGHG1) 유전자
서열번호 141: 플라스미드 pmIgG-A에 의해 코딩된 짧은 (sIgG) 이소폼의 아미노산 서열
서열번호 142: 플라스미드 pmIgG-A에 의해 코딩된 γ-쇄 불변 영역의 긴 (mIgG) 이소폼의 아미노산 서열
서열번호 143:모든 개재 인트론과 함께 CH1 내지 CH3의 엑손, 및 면역글로불린의 분비 형태에 대한 폴링아데닐화 부위를 포함하는 인트론 6의 인접 5' 부분을 포함하는 인간 IGHG1 유전자
서열번호 144: 플라스미드 pmIgGΔ-A에 의해 코딩된 γ-쇄 불변 영역의 짧은 (sIgG) 이소폼의 아미노산 서열
서열번호 145: 플라스미드 pmIgGΔ-A에 의해 코딩된 γ-쇄 불변 영역의 긴 (sIgG) 이소폼의 아미노산 서열
서열번호 146: pmIgGΔ-B로부터 제거된 코딩되는 서열
서열번호 147: 플라스미드 pIgG-GPI-B의 발생을 위해 삽입된 코딩되는 서열(인간 태반 알칼리성 포스파테이즈의 카복시-말단 신호 펩티드의 아미노산 서열(NCBI 검색번호: M 13077; 뉴클레오티드: 1542부터 1643까지))
서열번호 148: 발현 플라스미드 pIgG-GPI-B의 CH1부터 3' UTR까지 이르는 γ 쇄 발현 카세트 불변 영역의 DNA 서열
서열번호 149: 플라스미드 pIgG-GPI-B에 의해 코딩된 γ 쇄 불변 영역의 sIgG 이소폼의 아미노산 서열
서열번호 150: 플라스미드 pIgG-GPI-B에 의해 코딩된 인간 태반 알칼리성 포스파테이즈의 카복시-말단 신호 펩티드를 포함하는 γ 쇄 불변 영역의 긴 이소폼의 아미노산 서열
서열번호 151: 인간 섬유모세포 성장인자 수용체 1로부터 유래된 제2 핵산
서열번호 152: 뮤린 상피 성장인자 수용체로부터 유래된 제2 핵산
서열번호 153: 인간 보체 수용체 1(C3b/C4b)로부터 유래된 제2 핵산
서열번호 154: 뮤린 인터류킨 4 수용체로부터 유래된 제2 핵산
서열번호 155: 인간 면역글로불린 α 중쇄로부터 유래된 제2 핵산
서열번호 156: 인간 면역글로불린 ε 중쇄(1)로부터 유래된 제2 핵산
서열번호 157: 인간 면역글로불린 γ3 중쇄로부터 유래된 제2 핵산
서열번호 158: 뮤린 Ig 중쇄 타입 ε으로부터 유래된 제2 핵산
서열번호 159: 뮤린 Ig 중쇄 타입 γ2A로부터 유래된 제2 핵산
서열번호 160: 인간 섬유모세포 성장인자 수용체 1로부터 유래된 제3 핵산
서열번호 161: 뮤린 상피 성장인자 수용체로부터 유래된 제3 핵산
서열번호 162: 인간 보체 수용체 1(C3b/C4b)로부터 유래된 제3 핵산
서열번호 163: 뮤린 인터류킨 4 수용체로부터 유래된 제3 핵산
서열번호 164: 인간 면역글로불린 α 중쇄로부터 유래된 제3 핵산
서열번호 165: 인간 면역글로불린 ε 중쇄로부터 유래된 제3 핵산
서열번호 166: 인간 면역글로불린 γ3 중쇄로부터 유래된 제3 핵산
서열번호 167: 뮤린 Ig 중쇄 타입 ε으로부터 유래된 제3 핵산
서열번호 168: 뮤린 Ig 중쇄 타입 γ2A로부터 유래된 제3 핵산
서열번호 169: 인간 인터류킨 4 수용체로부터 유래된 제2 핵산
서열번호 170: 인간 면역글로불린 ε 중쇄(2)로부터 유래된 제2 핵산
서열번호 171: 인간 면역글로불린 γ4 중쇄로부터 유래된 제2 핵산
서열번호 172: 뮤린 면역글로불린 δ 중쇄로부터 유래된 제2 핵산
서열번호 173: 인간 면역글로불린 ε 중쇄(2)로부터 유래된 제2 핵산
서열번호 174: 인간 인터류킨 4 수용체로부터 유래된 제3 핵산
서열번호 175: 인간 면역글로불린 γ4 중쇄로부터 유래된 제3 핵산
서열번호 176: 뮤린 Ig 중쇄 타입 δ로부터 유래된 제3 핵산
실시예 1
게놈 단편의 클로닝 및 진핵 sIgG/mIgG 발현 벡터의 구축
a) sIgG 발현 벡터 "pIgG-A"의 구축
단백질 "A"에 대한 특이성을 가진 면역글로불린을 발현시키기 위해 벡터 "pIgG-A"를 구축하였다. 상기 벡터는 상기 면역글로불린의 분비 sIgG 형태를 코딩하고 하기 요소들을 포함한다(도 1C 참조):
1. - 인간 사이토메갈로바이러스(hCMV)로부터의 즉시 초기 인핸서 및 프로모터,
- 코작 컨센서스 서열(Kozak, M., Nucleic Acids Res. 15 (1987) 8125-48)을 포함하는 합성 5' UTR,
- 신호 서열 인트론을 포함하는 뮤린 면역글로불린 중쇄 신호 서열,
- 단백질 "A"에 대한 특이성을 가진 항체의 가변 중쇄 cDNA, 및
- 모든 개재 인트론과 함께 CH1부터 CH3까지의 엑손, 및 IgG1의 분비 형태의 중쇄에 대한 폴리아데닐화 신호를 포함하는 인접 3' UTR을 포함하는 인간 면역글로불린 중쇄 불변 γ1(IGHGl) 유전자와 연결된 마우스 Ig μ 인핸서(JH3-JH4 스위치 영역)를 포함하는 마우스/인간 중쇄 하이브리드 인트론 2
로 이루어진, 인간 γ1 중쇄에 대한 전사 단위체.
중쇄 불변 영역의 뉴클레오티드 서열은 서열번호 130에 기재되어 있다. 플라스미드 pIgG-A에 의해 코딩된 γ-쇄 불변 영역의 아미노산 서열은 서열번호 131에 기재되어 있다.
2. - hCMV로부터의 즉시 초기 인핸서 및 프로모터,
- 코작 컨센서스 서열을 포함하는 합성 5' UTR,
- 신호 서열 인트론을 포함하는 뮤린 면역글로불린 중쇄 신호 서열,
- 단백질 "A"에 대한 특이성을 가진 항체의 가변 κ 쇄 cDNA,
- 인간 면역글로불린 κ 불변(IGKC) 유전자에 연결된 마우스 인트론 2 Ig κ 인핸서, 및
- 폴리아데닐화 신호를 포함하는 인간 IGKC 유전자 3' UTR
으로 이루어진, 인간 κ 경쇄에 대한 전사 단위체.
3. 포유동물 세포에 대한 선별 마커로서 네오마이신 포스포트랜스퍼레이즈 전사 단위체.
4. 대장균에서 플라스미드 복제를 위한 벡터 pUC18로부터의 복제 기점.
5. 대장균에서 앰피실린 내성을 부여하는 베타-락타메이즈 유전자.
b) sIgG/mIgG 발현 벡터 "pmIgG-A"의 구축
엑손 CH3의 인트론 다운스트림의 주요 부분(인트론 6), 엑손 M1, 엑손 M1의 인트론-다운스트림(인트론 7), 엑손 M2, 및 γ1 쇄의 막 결합 형태에 대한 폴리아데닐화 신호를 포함하는 인접 3' UTR을 포함하는 인간 IGHGl 좌위의 5.2 kb 게놈 단편을, 익스팬드 롱 템플레이트 PCR 시스템(Expand Long Template PCR System; 독일 소재의 Roche Diagnostics GmbH) 및 하기 표 4에 기재된 올리고뉴클레오티드 프라이머를 사용한 PCR로 인간 게놈 DNA(독일 만하임 소재의 Roche Diagnostics GmbH)로부터 증폭하였다.
증폭된 단편은 "호모 사피엔스 염색체 14번 게놈 콘티그"(NCBI 검색번호: NT_026437, 역 상보체)의 뉴클레오티드 87203513 내지 87208691에 상응한다. 서브클로닝된 PCR 생성물의 시퀀싱은 상응하는 염색체 14번 서열과 비교할 때 98% 동일성을 보였고, 모든 차이는 인트론 또는 3' UTR에서 발견되었다. 엑손 M2 정지 코돈으로부터 219 bp 다운스트림에 위치한 SphI 제한 부위를, 표 2에 기재된 올리고뉴클레오티드 프라이머를 사용한 PCR-기초 부위 지정 돌연변이유발로 파괴하였다. 그 다음, SphI 제한 부위를 통해 면역글로불린 γ1 쇄 발현 벡터 pIgG-A 내로 클로닝하여 단편을 인트론 6의 5' 플랭킹 부분과 연결함으로써, 게놈 수준으로 구성된 완전한 γ1 쇄 전사 단위체를 생성하였다. 서브클로닝함으로써 단백질 "A"에 대한 특이성을 가진 항체의 분비 형태(sIgG) 및 막 결합 형태(mIgG)를 코딩하는 진핵 발현 벡터 "pmIgG-A"를 구축하였다. 플라스미드는 하기 요소들을 포함한다(도 1A 참조):
1. - hCMV로부터의 즉시 초기 인핸서 및 프로모터,
- 코작 컨센서스 서열을 포함하는 합성 5' UTR,
- 신호 서열 인트론을 포함하는 뮤린 면역글로불린 중쇄 신호 서열,
- 단백질 "A"에 대한 특이성을 가진 항체의 가변 중쇄 cDNA, 및
- 모든 개재 인트론과 함께 CH1부터 M2까지의 엑손, 및 인트론 6 내의 IgG1의 분비 형태에 대한 폴리아데닐화 신호 및 IgG1의 막 결합 형태에 대한 폴리아데닐화 신호를 포함하는 인접 3' UTR을 포함하는 인간 IGHGl 유전자에 연결된, JH3-JH4 스위치 영역(Banerji, J., et al., Cell 33 (1983) 729-740; Gillies, S.D., et al., Cell, 33 (1983) 717-728)으로부터 마우스 Ig μ 인핸서를 포함하는 마우스/인간 중쇄 하이브리드 인트론 2
로 이루어진, 인간 γ1 중쇄에 대한 전술한 전사 단위체.
중쇄 불변 영역의 게놈 구성은 도 2A에 나타나 있고, 뉴클레오티드 서열은 서열번호 140에 기재되어 있다. 플라스미드 pmIgG-A에 의해 코딩된 γ-쇄 불변 영역의 짧은 (sIgG) 이소폼 또는 긴 (mIgG) 이소폼의 아미노산 서열은 서열번호 141 또는 142에 기재되어 있다.
2. - hCMV로부터의 즉시 초기 인핸서 및 프로모터,
- 코작 컨센서스 서열을 포함하는 합성 5' UTR,
- 신호 서열 인트론을 포함하는 뮤린 면역글로불린 중쇄 신호 서열,
- 단백질 "A"에 대한 특이성을 가진 항체의 가변 κ 쇄 cDNA,
- 인간 면역글로불린 κ 불변(IGKC) 유전자와 연결된 마우스 인트론 2 Ig κ 인핸서(Emorine, L., et al., Nature 304 (1983) 447-449; Picard, D., and Schaffner, W., Nature (1984) 307, 80-82), 및
- 폴리아데닐화 신호를 포함하는 인간 IGKC 유전자 3' UTR
으로 이루어진, 인간 κ 경쇄에 대한 전사 단위체.
3. 포유동물 세포에 대한 선별 마커로서의 네오마이신 포스포트랜스퍼레이즈 전사 단위체.
4. 대장균에서의 플라스미드 복제를 위한 벡터 pUC18로부터의 복제 기점.
5. 대장균에서 앰피실린 내성을 부여하는 β-락타메이즈 유전자.
c) sIgG/mIgG 발현 벡터 "pmIgGΔ-A" 및 "pmIgGΔ-B"의 구축
실시예 1b)에 기재된 것과 유사한 방식으로, 엑손 CH3의 인트론 다운스트림의 주요 부분(인트론 6) 및 엑손 M1을 포함하는 인간 면역글로불린 중쇄 γ3(IGHG3) 좌위의 1.1 kb 게놈 단편을 PCR로 증폭하였다(올리고뉴클레오티드에 대해서는 표 2 참조). 단편은 98%의 서열 동일성으로 "호모 사피엔스 염색체 14번 게놈 콘티그"(NCBI 검색번호: NT_026437, 역 상보체)의 뉴클레오티드 87235195 내지 87236300에 상응한다. 엑손 M1 내의 하나의 뉴클레오티드 교환만이 침묵 돌연변이라는 점을 제외하고 모든 차이는 인트론에서 발견되므로, 코딩된 아미노산 서열은 변경되지 않는다. 유사하게, 엑손 2, 및 γ4 쇄의 막 결합 형태에 대한 폴리아데닐화 신호를 포함하는 인접 3' UTR을 포함하는 인간 면역글로불린 중쇄 불변 γ4(IGHG4) 좌위의 1.6 kb 단편을 PCR로 증폭하였다(올리고뉴클레오티드에 대해서는 표 2 참조). 단편은 98%의 서열 동일성으로 "호모 사피엔스 염색체 14번 게놈 콘티그"(NCBI 검색번호: NT_026437, 역 상보체)의 뉴클레오티드 87087786 내지 87089377에 상응하고, 모든 차이는 3' UTR에서 발견된다. 엑손 M2로부터 212 bp 다운스트림에 위치한 SphI 부위를 PCR-기초 부위 지정 돌연변이유발로 파괴하였다. 두 단편을 PCR(올리고뉴클레오티드에 대해서는 표 2 참조)로 M1과 M2 사이에 연결한 후, 인트론 6 내 SphI 부위를 통해 γ1 쇄 발현 벡터 내로 클로닝함으로써, M1과 M2 사이의 인트론(인트론 7)을 갖지 않은 게놈 구성을 가진 하이브리드 γ1 - γ3 - γ4 쇄 발현 카세트를 생성하였다. 서브클로닝함으로써, 단백질 "A"에 대한 특이성을 가진 항체의 분비 sIgG 및 막 결합 mIgG 형태를 코딩하는 진핵 발현 벡터 "pmIgGΔ-A"를 구축하였다. 플라스미드는 하기 요소들을 포함한다(도 1B도 참조):
1. - hCMV로부터의 즉시 초기 인핸서 및 프로모터,
- 코작 컨센서스 서열을 포함하는 합성 5' UTR,
- 신호 서열 인트론을 포함하는 뮤린 면역글로불린 중쇄 신호 서열,
- 단백질 "A"에 대한 특이성을 가진 항체의 가변 중쇄 cDNA,
- 모든 개재 인트론과 함께 CH1부터 CH3까지의 엑손, 및 IgG1의 분비 형태의 중쇄에 대한 폴리아데닐화 신호를 포함하는 인접 3' UTR을 포함하는 인간 면역글로불린 중쇄 불변 γ1(IGHGl) 유전자와 연결된 마우스 Ig μ 인핸서(JH3-JH4 스위치 영역)를 포함하는 마우스/인간 중쇄 하이브리드 인트론 2,
- 인간 IGHG3 유전자로부터의 인트론 6 및 엑손 M1의 3' 부분, 및
- 엑손 M2, 및 인간 IGHG4 유전자로부터의 면역글로불린의 막 결합 형태에 대한 폴리아데닐화 신호를 포함하는 3' UTR
으로 이루어진, 하이브리드 γ1 - γ3 - γ4 중쇄에 대한 전술한 전사 단위체.
중쇄 불변 영역의 게놈 구성은 도 2B에 나타나 있고, 뉴클레오티드 서열은 서열번호 143에 기재되어 있다. 플라스미드 pmIgGΔ-A에 의해 코딩된 γ 쇄 불변 영역의 짧은 (sIgG) 이소폼 또는 긴 (mIgG) 이소폼의 아미노산 서열은 서열번호 144 또는 145에 기재되어 있다.
2. - hCMV로부터의 즉시 초기 인핸서 및 프로모터,
- 코작 컨센서스 서열을 포함하는 합성 5' UTR,
- 신호 서열 인트론을 포함하는 뮤린 면역글로불린 중쇄 신호 서열,
- 단백질 "A"에 대한 특이성을 가진 항체의 가변 κ 쇄 cDNA,
- 인간 면역글로불린 κ 불변(IGKC) 유전자와 연결된 마우스 인트론 2 Ig κ 인핸서, 및
- 폴리아데닐화 신호를 포함하는 인간 IGKC 유전자 3' UTR
으로 이루어진, 인간 κ 경쇄에 대한 전사 단위체.
3. 포유동물 세포에 대한 선별 마커로서의 네오마이신 포스포트랜스퍼레이즈 전사 단위체.
4. 대장균에서의 플라스미드 복제를 위한 벡터 pUC18로부터의 복제 기점.
5. 대장균에서 앰피실린 내성을 부여하는 β-락타메이즈 유전자.
γ 및 κ 쇄의 가변 영역을 코딩하는 cDNA 서열을 교환함으로써 sIgG/mIgG 발현 벡터 "pmIgGΔ-B"를 구축하였다. 상기 벡터는 pmIgGΔ-A에 대해 기재된 것과 동일한 구성을 갖지만 단백질 "B"에 대한 특이성을 가진 면역글로불린을 코딩한다.
실시예 2
Sp2/0-Agl4 세포의 형질감염 및 분석
a) Sp2/0-Agl4 세포의 배양 및 전기영동
Sp2/0-Agl4 하이브리도마 세포(ATCC 수탁번호 CRL-1581, Shulman, M., et al., Nature 276 (1978) 269-270)를 37℃, 5% CO2 및 95% 습도의 조건 하에 10% 한외-저(ultra-low) IgG 태아 소 혈청(FCS)(미국 소재의 Invitrogen Corp.) 및 2 mM 글루타민(미국 소재의 Invitrogen Corp.)로 보충된 RPMI 배지(미국 소재의 Invitrogen Corp.) 중에서 배양하였다. 형질감염 후, 4℃에서 137 mM NaCl, 5 mM KCl, 0.7 mM Na2HPO4 및 6 mM 글루코스를 함유하는 pH 7.0의 20 mM HEPES-완충제(N-(2-하이드록시에틸)-피페라진-N'-2-에탄설폰산) 중에서 106개 세포 당 10 ㎍의 플라스미드 DNA로 세포를 전기천공하였다. 전기천공은 220V 및 960 μF에서 진펄서(Genepulser) 전기천공 장치(미국 소재의 Bio-Rad Laboratories Inc.)를 이용하여 수행하였다. 형질감염 후, 세포를 웰 당 100 ㎕ 배지 중 5000 세포의 밀도로 96웰 플레이트에 분배하였다. 형질감염 세포의 선별을 위해, 500 ㎍/㎖ G418(독일 소재의 Roche Diagnostics GmbH)을 전기천공 후 1일째 날에 배지에 첨가하였다. 배지를 2 내지 3일마다 바꾸어 선별 압력을 유지하였다. 형질감염시킨 지 약 2주 후, 형질감염종 클론을 96웰 플레이트로부터 단리하여 적절한 배양 용기 내에서 더 증식시켰다. 저장을 위해, 클론의 약 106개 세포를 저 IgG FCS(미국 소재의 Invitrogen Corp.) 중의 10% 디메틸설폭사이드(독일 소재의 Sigma-Aldrich Co.) 중에서 동결시키고 액체 질소 중에 저장하였다.
플라스미드 pmIgG-A, pmIgGΔ-A 및 pIgG-A로 각각 106개 세포를 형질감염시켜 각각 15, 19 및 12개의 독립 클론을 형성하였다. 추가 분석을 위해 각 형질감염으로부터 6개의 클론을 무작위로 선별하였다.
b) 유세포분류에 의한 IgG 정량 및 분석
실시예 2a)의 각 클론의 105개 세포를 6웰 플레이트에서 G418(전술한 바와 같음)을 함유하는 2 ㎖ 배지 중에 접종하고 48시간 동안 배양하였다. 그 다음, 상청액을 모아 분비된 IgG의 양을 제조자의 프로토콜에 따라 "인간 Fc 검출 키트"(CIS biointernational)를 사용한 균질 시간-해상 형광(HTRF) 면역분석으로 정량하였다. 유세포분류로 원형질막-결합 항체를 분석하기 위해, 각 클론의 105개 세포를 4℃에서 PBS(인산염 완충 식염수)로 2회 세척한 후, 50 ㎕ FITC-접합 F(ab')2 단편 마우스 항-인간 IgG(독일 소재의 Dianova) 중에 재현탁시키고, 1% BSA(독일 소재의 Roche Diagnostics GmbH)를 함유하는 PBS 중에 1:50으로 희석하고, 4℃의 암실에서 1시간 동안 항온처리하였다. PBS로 2회 세척한 후, 세포를 PBS 중에 재현탁시키고 BD FACSCalibur 유세포분류기(미국 소재의 BD Biosciences)로 분석하였다. 세포 표면에 결합된 IgG의 양의 척도로서 평균 형광 강도를 각 클론에 대해 측정하였다.
도 3에서, 유세포분류에서의 평균 형광 강도는 각 클론에 대해 세포 배양물 상청액 중의 IgG 농도와 함께 표시된다. pmIgG-A 또는 pmIgGΔ-A(즉, sIgG 및 mIgG 형태 둘다에 대한 플라스미드)로 형질감염된 클론의 경우 분비된 IgG의 증가된 양이 상승된 세포 표면 신호와 일치함이 관찰되었다. 이러한 상관관계는 pIgG-A(즉, 항체의 분비 형태인 sIgG만을 코딩하는 플라스미드)로 형질감염된 클론의 경우에는 관찰되지 않았다.
실시예 3
유세포분류에 의한 안정하게 형질감염 세포의 분류
IgG를 안정하게 발현하는 클론을 생성하기 위해, 3xlO6개 Sp2/0-Agl4 세포를 전술한 바와 같은 전기천공으로 플라스미드 pmIgGΔ-B로 형질감염시켰다. 형질감염시킨 지 1일 후, 세포를 500 ㎍/㎖의 G418 선별 배지로 옮기고 약 2주 동안 풀(pool)로서 배양하였다. 선별 후, 형질감염 세포의 표면에 결합된 IgG를 표지하고 가장 강한 신호를 가진 세포를 유세포분류로 분류하였다. 이로써, 상기 풀로부터의 4x106개 세포를 4℃에서 배지로 2회 세척한 후, 배지 중에 1:50으로 희석된 플루오레세인(FITC)-접합 F(ab')2 단편 마우스 항-인간 IgG(독일 소재의 Dianova)와 함께 얼음 위에서 20분 동안 항온처리하였다. 배지를 사용한 2 단계 세척 후, 세포를 배지 중에 재현탁시키고 BD FACS밴티지 유세포분류기(미국 소재의 BD Biosciences)로 옮겼다. 게이트는 동일한 집단의 형광 강도의 상위 5 내지 6%를 갖는 세포를 포괄하도록 설정하였고, 이 게이트로 분류된 세포를 모았다. 모은 세포를 선별 배지 중에서 수일 동안 배양함으로써 증폭하였다. 이 세포를 이용하여 제2 및 연속적으로 제3 분류 주기를 전술한 바와 같이 수행하였다. 분류된 세포를 풀로서 회수하는 대신에, 제4 및 최종 분류 단계를 96웰 플레이트 내로의 단일 세포 배분에 이용하였다. 이 배분은 141개의 독립 클론을 생성하였고, 이 클론들 중 21개의 클론이 실시예 2b)에 기재된 HTRF 면역분석에 의한 IgG 발현 분석을 위해 선택되었다. 이 클론들 중에서 가장 높은 분비 속도 및 그에 따라 가장 강한 세포 표면 신호를 보이는 2개의 클론, 즉 5B11 및 9B3을 이들의 생산성에 대한 추가 평가를 위해 스피너 배양기 중에서의 혈청 부재 생장에 적응시켰다.
실시예 4
클론의 비생산성의 측정
클론 5B11 및 9B3의 비생산성을 측정하기 위해, 상기 클론들을 100 ㎖ 스피너 플라스크(미국 소재의 Belco) 내에서 1x 콜레스테롤/지질 농축물(미국 소재의 Invitrogen Corp.), 4 mM 글루타민(미국 소재의 Invitrogen Corp.) 및 250 ㎍/㎖ G418(독일 소재의 Roche Diagnostics GmbH)로 보충된 ProCHO 6k 배지(미국 소재의 Cambrex Corp.) 중에서 소정의 조건 하에 배양하였다. 세포가 정지 성장기에 도달할 때까지 37℃, 5% CO2 및 95% 습도에서 세포를 생장시켰다. 대수 성장기 동안 여러 시점에서 모든 클론의 세포수를 CASY 세포 계수기(독일 소재의 Scharfe Systems)를 사용하여 측정하고 상청액 중의 IgG 농도를 단백질 A 친화 크로마토그래피(하기 참조)로 측정하였다. 기준물로서 클론 J5-H3을 배양하고 동등한 조건 하에 분석하였다. 이 클론도 Sp2/0-Agl4 세포의 형질감염으로부터 유래되었고 클론 5B11 및 9B3과 동일한 항체, 즉 알베이트(albeit) 분비 형태만을 안정하게 발현한다. 클론 J5-H3은 여러 제한 희석 및 서브클로닝 단계에 의해 보편적으로 발생되었고 산업적 제조 과정을 위한 생산성 요건을 만족시키도록 1000개 초과의 클론 중에서 선별된다.
세포 배양물 상청액 중의 IgG 농도는 Akta™ 익스플로러 크로마토그래피 장치(스웨던 소재의 GE Healthcare(이전 명칭: Amersham Biosciences))를 사용한 분석 친화 크로마토그래피로 측정하였다. 소정의 부피의 세포 배양물 상청액을 단백질 세파로스 컬럼에 가하여 IgG와 친화 매트릭스의 결합을 촉진하였다. 상기 컬럼을 pH 5.0의 100 mM 시트르산으로 세척한 후, 결합된 항체를 pH 3.0의 100 mM 시트르산으로 용출하였다. 용출은 280 nm에서 용출물의 UV 흡광도를 연속적으로 기록함으로써 모니터링하였다. 샘플 항체 농도는 소정의 항체 농도를 함유하는 표준 샘플로 시스템을 보정한 후 통합된 UV 흡광도로부터 계산하였다.
모든 클론에 대해 비생성속도(SPR)를 세포수 및 세포 배양물 상청액 중의 IgG 농도로부터 하기 방정식으로 계산하였다:
상기 식에서,
평균 SPR은 대수 성장기 동안 여러 시점에서 계산한 4개의 상이한 SPR을 기초로 하여 모든 클론에 대해 산정되었다(도 5 및 하기 표 5).
막 결합 mIgG에 의해 분류된 두 클론, 즉 5B11 및 9B3은 산업적 규모로 클론을 제조하기에 적합한 범위에 속하는 15 내지 20 g·세포-1·d-1의 평균 SPR을 나타내었다. 이 클론들의 SPR은 동일한 세포주에서 번거로운 전통적인 기법에 의해 수득된, 동일한 항체를 발현하는 클론(클론 J5-H3)을 사용하여 달성할 수 있는 SPR에 필적할만 하였다.
실시예 5
면역형광 현미경에 의한 sIgG 및 mIgG의 검출
세포내 및 세포 표면 결합 항체를 면역형광 현미경으로 검출하였다. 세포내 염색을 위해, 폴리-L-라이신-코팅 현미경 슬라이드에 부착된 세포를 PBS 중의 2%(v/v) 포름알데히드로 고정하고, PBS 중의 0.2%(v/v) 트립톤 X-100으로 10분 동안 투과성 세포로 만들고 PBS로 2회 세척하였다. 비특이적 결합 부위를 PBS 중의 3%(v/v) BSA(소 혈청 알부민)로 30분 동안 블로킹하였다. 세포를 세척 완충제(WB: PBS 중의 0.2%(w/v) BSA, 0.1%(v/v) Tween 20)로 2회 세척한 후, WB 중에 1:50으로 희석된 R-파이코에리쓰린-접합 F(ab')2 단편 염소 항-인간 IgG(독일 Dianova 소재)와 함께 1시간 동안 항온처리하였다. WB로 4회 세척하고 이중 탈이온화된 H2O로 2회 세척한 후, 세포를 커버슬립 하에 올려놓고 4℃의 암실에서 현미경 분석 시까지 저장하였다. 세포 표면 결합 항체를 염색하기 위해, 105개 세포를 냉각된 PBS 중의 1%(w/v) BSA로 세척한 후, 비특이적 결합 부위를 얼음 상에서 PBS 중의 1% BSA로 30분 동안 블록킹하였다. IgG 표지를 위해, 세포를 PBS 중의 1%(w/v) BSA 중에 1:50으로 희석된 R-파이코에리쓰린-접합 F(ab')2 단편 염소 항-인간 IgG(독일 Dianova 소재)와 함께 얼음 상에서 1시간 동안 항온처리하였다. 냉각된 PBS로 3회 세척한 후, 세포를 폴리-L-라이신-코팅 현미경 슬라이드에 부착시키고 실온에서 PBS 중의 2%(v/v) 포름알데히드로 10분 동안 고정시켰다. PBS로 2회 세척한 후, 세포를 커버슬립 하에 올려놓고 4℃의 암실에서 현미경 분석 시까지 저장하였다. 세포내 및 표면 표지 세포를 Plan-APOCHROMAT 4Ox/1.0 대물렌즈(독일 소재의 Carl Zeiss)를 사용한 액시오포트 형광 현미경 상에서 분석하였다.
클론 5B11에서, 항체는 세포 표면 상에서 주로 mIgG 형태로 검출될 수 있었고(도 6, 사진 1), 발현/분비 경로 및 세포내에서 sIgG 형태 및 mIgG 형태 둘다로 검출될 수 있었다(사진 4). 반대로, 클론 J5-H3에서 세포내 항체만이 검출될 수 있었는데(도 6, 사진 2 및 5), 이는 이 클론이 mIgG를 발현하지 않았기 때문이다. 두 방법을 이용한 염색 모두 비형질감염 세포주 Sp2/0-Agl4에서 관찰되지 않았는데(도 6, 사진 3 및 6), 이는 이 세포가 IgG를 전혀 발현하지 않았기 때문이다.
실시예 6
노던 블롯팅에 의한 γ-쇄 mRNA 이소폼의 검출
일차 전사체의 택일적 스플라이싱/폴리아데닐화에 의해 나타나는 2개의 중쇄 이소폼 사이의 비를 측정하기 위해, 안정하게 형질감염된 클론의 RNA를 노던 블롯으로 분석하였다. 따라서, 총 RNA는 RNeasy 기법(독일 소재의 Qiagen)을 이용하여 세포로부터 단리하였다. 그 다음, 각각의 경우, 변성 아가로스 겔 전기영동으로 10 ㎍의 총 RNA를 분획하고 노던맥스 시스템(미국 소재의 Ambion Inc.)을 사용하여 나일론 막으로 옮겼다. 블롯 막의 혼성화를 위해, 2개의 상이한 DNA 프로브를 DECA프라임(DECAprime) II 키트(미국 소재의 Ambion Inc.)를 사용한 무작위 프라이밍 방법으로 [α-32P]로 표지하였다. 도 7B에 나타낸 바와 같이, 프로브 "A"는 엑손 CH1과 CH3 사이에서 중쇄 mRNA에 상보적이므로 상기 두 이소폼 모두에 혼성화한다. 대조적으로, 프로브 "B"는 긴 mIgG 중쇄 mRNA의 3' UTR에만 결합한다. 막의 혼성화 및 엄격한 세척 후, 블롯을 오토래디오그래피로 분석하였다.
도 7A는 클론 5B11, 클론 J5-H3 및 세포주 Sp2/O-Agl4로부터의 총 RNA와 노던 블롯의 오토래디오그래피를 나타낸다. 프로브 "A"를 사용한 혼성화는 상기 항체 둘다를 발현하는 클론에서 sIgG의 중쇄를 코딩하는 짧은 mRNA 이소폼의 예측된 크기에 상응하는 1.8 kb 신호를 주로 보여주었다(레인 1 및 2). 도시된 긴 노출에서, 2 kb와 4 kb 사이의 일부 약한 신호도 검출되었다. 클론 5B11에서만 보여지는 3.3 kb 밴드(레인 1)는 mIgG의 중쇄를 코딩하는 긴 mRNA 이소폼을 나타내는데, 이는 블롯이 프로브 "B"(레인 4)와 혼성화할 때 동일한 이동 패턴을 가진 밴드가 단일 신호로서 검출되기 때문이다. 레인 1에서 1.8 kb 밴드와 3.3 kb 밴드의 상대적인 신호 강도의 비교는 항체 중쇄 형질전환유전자의 일차 전사체가 주로 작은 mRNA 이소폼으로 프로세싱되어 항체의 분비된 sIgG 형태를 발생시킴을 암시한다. 단지 소량(5% 미만)이 긴 mRNA 이소폼으로 완전히 스플라이싱되어 원형질막-결합 mIgG를 생성한다.
실시예 7
알칼리성 카보네이트 추출법 및 면역블롯팅에 의한 IgG 중쇄 이소폼의 정제 및 검출
mIgG 중쇄를 검출하기 위해, 퓨지키(Fujiki)(Fujiki, Y., et al., J. Cell Biol. 93 (1982) 97-102)에 의해 개발된 알칼리성 카보네이트 추출법을 이용하여 막 단백질을 안정하게 형질감염 세포로부터 추출하였다. 각각의 경우, 107개 세포를 PBS로 2회 세척한 후, 얼음 상의 0.1M NaCl로 1회 세척하였다. pH 11.5의 냉각된 1 ㎖ 0.1 M Na2CO3 중에 재현탁시킨 후, 세포를 초음파처리로 20초 동안 파괴하고, 30분 동안 얼음 상에서 항온처리한 다음, 4℃에서 200,000 x g로 60분 동안 원심분리하였다. 이 단계를 이용하여, 내재 막 단백질을 여전히 함유하는 세포막을 가용성 내용물로부터 분리하였다. 상청액을 모으고, 이 상청액에 최종 농도가 1%(w/v)가 되도록 트리톤 X-100을 첨가하고 최종 농도가 60 mM이 되도록 N-옥틸-베타-D-글루코피라노사이드를 첨가하고 최종 농도가 50 mM이 되도록 pH 7.4의 TRIS-HCl을 첨가하고 최종 농도가 300 mM이 되도록 NaCl을 첨가하였다("SN 분획"). 따라서, 막 펠릿을 1.1 ㎖의 0.1 M Na2CO3(pH 11.5), 1%(w/v) 트리톤 X-100, 60 mM N-옥틸-베타-D-글루코피라노사이드, 50 mM TRIS-HCl(pH 7.4) 및 300 mM NaCl 중에서 해상하였다. 이 단계 후 불용성 성분들을 15,00O x g에서 10분 동안 원심분리하여 제거하고, 상청액을 "막 분획"으로서 모았다. 단백질 A 침강 분석을 수행하여 막 또는 SN 분획으로부터 항체 이소폼을 정제하였다. 따라서, 각 분획을 4℃에서 30 ㎕ 층 부피 단백질 A 세파로스(스웨던 소재의 GE Healthcare)와 함께 60분 동안 항온처리한 후, 0.02%(v/v) Igepal CA360을 함유하는 PBS로 4회 세척하였다. 단백질 A 매트릭스에 결합된 단백질을 70℃에서 환원 단백질 겔 샘플 완충제로 용출하고 SDS 폴리아크릴아미드 겔 전기영동(NuPAGE®-system, 미국 소재의 Invitrogen Corp.)으로 분리하였다. 분리 후, 단백질을 반건조 면역블롯팅법에 따라 PVDF(폴리비닐리덴플루오라이드) 막으로 옮겼다(Ausubel, F.A., et al. (eds.) Current Protocols in Molecular Biology, Vol. 2, John Wiley and Sons, Inc., New York (1995)). 막에 고정된 IgG 중쇄를 호스라디쉬 퍼록시데이즈(덴마크 소재의 DakoCytomation, DAKO A/S)에 커플링된 다중클론 토끼 항-인간 IgG 항체로 표지하고 LUMI-영상화기 F1(독일 소재의 Roche Diagnostics GmbH) 상의 화학발광 반응(LUMI-라이트 플러스 웨스턴 블롯팅 키트(LUMI-Light PLUS Western Blotting Kit)(독일 소재의 Roche Diagnostics GmbH)으로 검출하였다.
sIgG의 중쇄에 따른 강한 신호는 항체를 발현하는 두 클론(클론 5B11 및 J5-H3, 도 8의 레인 1, 2, 4 및 5 참조)의 막 및 SN 분획에서 검출할 수 있었다. 클론 5B11의 경우, sIgG 중쇄 위에서 이동하는 추가 단백질도 검출되었다(도 8, 레인 1). 이 밴드는 내재 막 단백질이 풍부한 이 클론의 막 분획에서 주로 발견된다. 상기 밴드는 sIgG 중쇄보다 8 kDa 더 많은 이론상 분자량을 가진 보다 큰 mIgG 중쇄 이소폼을 나타낸다. 일관적으로, 클론 J5-H3에는 상응하는 신호가 없는데(도 8의 레인 2), 이는 이 클론이 항체의 분비 형태만을 발현하기 때문이다.
실시예 8
CHO-K1 세포의 배양 및 형질감염
현탁 배양물 중에서의 혈청 부재 생장에 미리 적응된 CHO-K1 세포(ATCC 수탁번호 CCL-61; Puck, T.T., et al., J. Exp. Med. 108 (1958), 945-956)를, 37℃, 5% CO2 및 95% 습도 하에 현탁 플라스크 내에서 8 mM L-알라닐-L-글루타민(미국 소재의 Invitrogen Corp.) 및 1x HT 보충제(미국 소재의 Invitrogen Corp.)로 보충된 ProCHO4-CDM 배지(미국 소재의 Cambrex Corp.) 중에서 배양하였다. 3일 또는 4일마다 세포를 새로운 배지 내로 2x1O5 세포/㎖의 농도로 분할하였다. 형질감염 동안, 세포를 실온에서 총 부피 200 ㎕ PBS 중의 7.5x106개 세포 당 20 ㎍의 플라스미드 DNA로 전기천공하였다. 전기천공은 15 ms 동안 단회 160 V 펄스를 사용하는 사각형 파동 프로토콜을 이용하여 2 mm 갭 큐빗 내의 진 펄서 XCell 전기천공 장치(미국 소재의 Bio-Rad Laboratories)로 수행하였다. IgG를 안정하게 발현하는 클론을 발생시키기 위해, 6x107개 세포를 전술한 바와 같이 플라스미드 pmIgGΔ-B로 전기천공하였다. 그 후, 안정하게 형질감염된 세포의 선별을 위해 형질감염시킨 지 1일 후 배양물에 첨가된 700 ㎍/㎖ G418과 함께 세포를 상기 특정된 배지 중의 풀로서 약 2주 동안 배양하였다.
실시예 9
유세포분류에 의한 안정하게 형질감염된 CHO-K1 세포의 분류
선별 후, 형질감염 세포의 표면에 결합된 IgG를 표지하고, 가장 강한 신호를 가진 세포를 유세포분류기로 분류하였다. 따라서, 풀로부터의 4x107개 세포를 먼저 40 μM 나일론 메쉬에 통과시켜 큰 세포 응집물을 제거한 후, 37℃에서 아큐맥스(Accumax)(PAA)와 함께 15분 동안 항온처리하여 남은 보다 작은 응집물을 분리하였다. 세포를 얼음 상에서 배지 중의 1%(w/v) BSA와 함께 20분 동안 항온처리한 후, 암실 내의 얼음 상에서 1%(w/v) BSA를 함유하는 총 부피 8 ㎖ 배지 중의 10 ng/㎖ 단백질 A 알렉사 플루오르(Alexa Fluor) 488(미국 소재의 Molecular Probes Inc., Invitrogen Corp.)로 30분 동안 염색하였다. 배지 중의 1%(w/v) BSA를 사용한 2회 세척 단계 후, 세포를 배지 중에 재현탁시키고 BD FACS아드리아(FACSAria) 세포 분류기(미국 소재의 BD Bioscience)로 옮겼다. 살아있는 단일 세포의 집단을 전방향-산란기/측면-산란기(FSC/SSC) 도트 플롯으로 게이팅하였다. 게이팅된 생존 세포의 형광 강도의 상위 5%를 가진 세포를 포괄하는 하위집단을 한정하고 이 집단으로부터 약 45,000개 세포를 모았다(mIgG-분류 세포 풀). 대조군으로서 약 40,000개 세포를 이들의 형광도와 관계없이 FSC/SSC-게이팅된 생존 세포 집단으로부터 무작위로 모았다(대조군 세포 풀). 모은 세포 풀을 선별 배지(실시예 8 참조) 중에서 2주 동안 배양함으로써 증폭시켰다. 그 다음, 제2 분류 사이클을 수행하였다. mIgG-분류 세포 풀로부터의 세포를 전술한 바와 같이 세포 표면 IgG에 대해 염색하였다. BD FACS아드리아 세포 분류기(미국 소재의 BD Biosciences)를 이용하여 형광 강도의 상위 4%를 가진 세포를 생존 단일 세포의 집단으로부터 분류하였다(FSC/SSC 도트 플롯에 의해 게이팅됨). 분류된 세포를 96웰 플레이트 내로 단일 세포로서 모았다. 대조군 세포 풀로부터 단일 세포를 FSC/SSC-게이팅된 비염색 생존 세포 집단으로부터 무작위로 모았다. 단일 세포 클론을 선별 배지(실시예 8 참조) 중에서 2주 동안 배양함으로써 증폭시켰다.
실시예 10
ELISA에 의한 IgG 농도의 측정
세포 배양물 상청액 중의 면역글로불린 농도는 포획 시약으로서 바이오티닐화 항-인간 IgG F(ab')2 단편을 사용하고 검출 시약으로서 퍼록시데이즈-접합 항-인간 IgG F(ab')2 항체 단편을 사용하는 샌드위치 ELISA로 측정하였다. 스트렙타비딘 코팅 96웰 플레이트(Pierce Reacti-Bind™ 스트렙타비딘 코팅 폴리스티렌 스트립 플레이트, 코드 번호 15121)를 진탕 하에 실온에서 1시간 동안 항온처리함으로써 희석 완충제(희석 완충제: 0.5 중량/부피(w/v)%의 소 혈청 알부민을 함유하는 PBS 완충제) 중의 포획 항체로서의 0.5 ㎍/㎖ 바이오티닐화 염소 다중클론 항-인간 IgG F(ab')2 항체 단편으로 코팅하였다. 그 후, 플레이트를 0.3 ㎖ 초과의 세척 완충제(세척 완충제: 1%(w/v) 트윈 20을 함유하는 PBS)로 3회 세척하였다. 세포 배양물 상청액(샘플)을 함유하는 IgG를 희석 완충제 중에 0.5 내지 20 ng/㎖의 농도로 연속(2배) 희석하고, 웰에 첨가하고, 실온에서 진탕 하에 1시간 동안 항온처리하였다. 희석 완충제 중의 정제된 표준 항체(0.5 내지 20 ng/㎖)를 IgG 단백질 표준 곡선의 작도를 위해 사용하였다. 플레이트를 0.3 ㎖/웰 세척 완충제로 3회 세척한 후, 항-인간 Fcγ에 결합된 결합체를 염소 다중클론 항-인간 F(ab')2-특이적 IgG(F(ab')2<h-Fcγ>POD; 독일 소재의 Dianova, 코드 번호 109-036-098)의 퍼록시다제-접합 F(ab')2 단편으로 검출하였다. 플레이트를 0.3 ㎖/웰 세척 완충제로 3회 세척한 후, 플레이트를 ABTS(2,2'-아지노-비스(3-에틸벤즈티아졸린-6-설폰산) 퍼록시데이즈 기질 용액(독일 소재의 Roche Diagnostics GmbH, 코드 번호 1684302)으로 현상하였다. 10 내지 30분 후, 테칸 스펙트라플루오르플러스(Tecan Spectrafluorplus) 플레이트 판독기(독일 소재의 Tecan Deutschland GmbH) 상에서 흡광도를 405 nm 및 490 nm에서 블랭크 시약에 대해 측정하였다. 배경 보정을 위해, 490 nm에서의 흡광도를 하기 식에 따라 405 nm에서의 흡광도로부터 차감하였다:
샘플의 IgG 함량은 표준 곡선으로부터 산출하였다.
실시예 11
mIgG 발현 CHO 클론의 검색 및 선별
단일 세포를 96웰 플레이트 내로 배분한 지 3주 후, 515개의 mIgG-분류 클론 및 550개의 대조군 클론의 세포 배양물 상청액을 ELISA로 분석하였다(실시예 10 참조). 하기 표 6은 상이한 IgG 농도 수준에 대한 클론의 분포를 보여준다.
대조 방법에서 모든 클론의 90%가 1 ㎍/㎖ 이하의 IgG 농도를 보임이 관찰되었다. 대조적으로, 어떤 mIgG-분류 클론도 이 군에 속하지 않았다. 게다가, 이 방법에서 22 ㎍/㎖를 초과하는 IgG 농도는 6개의 클론에 의해 달성된 반면, 대조 방법에서 측정된 가장 높은 IgG-농도는 12.3 ㎍/㎖이었다. 그 후, 10 ㎍/㎖를 초과하는 모든 mIgG-분류 클론 및 3 ㎍/㎖를 초과하는 모든 대조군 클론을 제2 검색을 위해 24웰 플레이트로 옮겼다. 클론은 선별 배지(실시예 8 참조) 중에서 20일 동안 배양함으로써 증폭시킨 후, 세포 배양물 상청액 중의 IgG 농도를 ELISA로 측정하였다. 하기 표 7은 상이한 IgG 농도 수준에 대한 클론의 분포를 보여준다.
대조군 클론은 6.1 ㎍/㎖의 평균 IgG 농도와 함께 16.8 ㎍/㎖ 이하의 발현 수준을 보였다. 대조적으로, mIgG-분류 클론의 평균 발현 수준은 31.4 ㎍/㎖이었고, 이 군에 속하는 한 클론의 최대 관측 IgG 농도는 58.9 ㎍/㎖이었다. 그 다음, 45 ㎍/㎖를 초과하는 발현 수준을 보이는 6개의 mIgG-분류 클론 및 10 ㎍/㎖를 초과하는 발현 수준을 보이는 2개의 대조군 클론을 추가 평가를 위해 125 ㎖의 진탕기 플라스크로 옮겼다.
실시예 12
선별된 CHO 클론의 생산성 평가
진탕에 적응시키기 위해, 실시예 11의 선별된 클론을 125 ㎖의 진탕기 플라스크로 옮기고 표준 조건(실시예 8 참조) 하에 150 rpm의 회전 진탕기 상의 25 ㎖ 선별 배지(실시예 8 참조) 중에서 1주 동안 배양하였다. 그 후, 각 클론에 대해 1x106개 세포/㎖를 8 mM L-알라닐-L-글루타민(미국 소재의 Invitrogen Corp.), 1x HT 보충제(미국 소재의 Invitrogen Corp.) 및 400 ㎍/㎖ G418(독일 소재의 Roche Diagnostics GmbH)로 보충된 25 ㎖ ProCHO5-CDM 배지(미국 소재의 Cambrex Corp.)에 접종하고 전술한 바와 같이 125 ㎖ 진탕기 플라스크 중에서 배양하였다. 0, 1, 2, 3, 4 및 7일째 날, 모든 클론의 세포수를 CASY® TT 세포 계수기(독일 소재의 Scharfe Systems)로 측정한 결과, 모든 시험된 클론의 생장이 유사하였음을 알 수 있었다(하기 표 8 참조).
10일째 날, 세포 배양물 상청액을 모아 IgG 농도를 ELISA로 측정하였다(하기 표 9 참조).
6개의 mIgG-분류 클론들 중 3개 클론(즉, 클론 1A1, 1B6 및 1D6)이 2개의 대조군 클론과 유사한 범위 내의 발현 수준을 보임이 관찰되었다. 나머지 3개 mIgG-분류 클론(즉, 클론 1C5, 1D1 및 2D6)은 대조군 클론에서 관찰된 것보다 3.3배 이상 더 많은 현저히 증가된 IgG 발현을 보였다.
실시예 13
선별된 CHO 클론의 노던 블롯 분석
진탕기 플라스크 내에서의 생장에 적응된(실시예 12 참조) 6개의 mIgG-분류 클론 및 2개의 대조군 클론을 노던 블롯으로 분석하여 일차 전사체의 택일적 스플라이싱에 의해 나타나는 2개의 중쇄 이소폼 사이의 비를 측정하였다. 비교를 위해, 클론 "27"을 동시에 분석하였다. 이 클론은 동일한 항체의 분비 형태만에 대한 게놈 수준으로 구성된 발현 벡터로 CHO-K1 세포를 안정하게 형질감염시켜 수득하였다. 노던 블롯은 실시예 6에 상세히 기재된 바와 같이 수행하였고 도 9에 나타내었다.
실시예 14
sIgG/IgG-GPI 발현 벡터 "pIgG-GPI-B"의 구축
면역글로불린의 원형질막 고착을 위해, 엑손 M1의 3' 부분에 의해 코딩된 천연 경막 도메인 및 엑손 M2에 의해 코딩된 세포내 영역을 GPI 고착을 매개하는 인간 태반 알칼리성 포스파테이즈의 카복시-말단 신호 펩티드로 치환시켰다. 이로써, 하기 53개 아미노산(즉, LWTTITIFITLFLLSVCYSATVTFFKVKWIFSSVYDLKQTIVPDYRNMIRQGA(서열번호 146))을 코딩하는 플라스미드 pmIgGΔ-B(실시예 Ic 참조)의 DNA 서열은 인간 태반 알칼리성 포스파테이즈(NCBI 검색번호: M 13077; 뉴클레오티드: 1542 내지 1643)의 카복시-말단 신호 펩티드의 하기 아미노산 서열(즉, AGTTDAAHPGRSWPALLPLLAGTLLLLETATAP(서열번호 147))을 코딩하는 DNA 서열에 의해 치환되었다.
발현 플라스미드 pIgG-GPI-B의 CH1부터 3' UTR까지 걸쳐 있는 γ 쇄 발현 카세트 불변 영역의 핵산 서열은 서열번호 148에 기재되어 있다.
플라스미드 pIgG-GPI-B에 의해 코딩된 γ 쇄 불변 영역의 sIgG 이소폼의 상응하는 아미노산 서열은 서열번호 149에 기재되어 있다.
플라스미드 pIgG-GPI-B에 의해 코딩된 인간 태반 알칼리성 포스파테이즈의 카복시-말단 신호 펩티드를 포함하는 γ 쇄 불변 영역의 긴 이소폼의 상응하는 아미노산 서열은 서열번호 150에 기재되어 있다.
이 플라스미드는 중쇄 전구-mRNA의 택일적 스플라이싱에 의해 항체의 분비 형태(sIgG) 및 GPI-고착 형태가 발현될 수 있게 한다(도 10 참조).
SEQUENCE LISTING
<110> F. Hoffmann-La Roche AG
<120> POLYPEPTIDE PRODUCING CELLS
<130> 23748 WO
<150> EP 06010146.6
<151> 2006-05-17
<160> 176
<170> PatentIn version 3.2
<210> 1
<211> 2767
<212> DNA
<213> Homo sapiens
<400> 1
gtgagtcacc cccaggccca gggttgggac ggggactctg aggggggcca taaggagctg 60
gaatccatac taggcagggg tgggcactgg gcaggggcgg ggctaggctg tcctgggcac 120
acaggcccct tctcggtgtc cggcaggagc acagacttcc cagtactcct gggccatgga 180
tgtcccagcg tccatccttg ctgtccacac cacgtgctgg cccaggctgg ctggcacagt 240
gtaagaggtg gatacaaccc ctcgccgtgc cctgaggagt ggcggtttcc tcccaagaca 300
ttccccacgg ctgggtgctg ggcacaggcc ttccctggtg tgaccgtgaa tgtggtcacc 360
ctgaacagct gccctctctg gggacatctg actgtccaag accacagtca gcacctctgg 420
gagccagagg ggtctccaga gacccccaga tgtcaggctt gggctcagtg cccagcgaaa 480
ggtcagcccc acacatgccc ataatgggcg cccacccaga gtgacagccc ccagcctcct 540
gccaggccca cccttttccg cccccttgag gcatggcaca cagaccagtg cgcccactgc 600
ccgagcatgg ccccagtggg atgtggtggc cacgaggggc tgtacacaca gcaggaggct 660
gtccgccctg ctcagggcct gctgcctatg ccccagctgt ccaaccaagg gaggcatgga 720
agggcccctg gtgtaagctg gagccaggca cccaggcccc cggccaccct gcagagccaa 780
ggaaaggaag acacccaagt caacaagggg cagggctgag ggctgtccca ggctcttttg 840
gcccgagggg ctgccagcag ccctgacccg gcatgggcct tccccaaaag cgaccctgtg 900
aggtggcctc acagagaacc ccctctgagg acagtgtctg accctgcctg cctcacacag 960
atgggcccca cagcagtggg caacctgggg ggcagcagcc caacctgacc ctgcagggac 1020
tgccccctgc agcagcagct gcttctcagt cccccaacct ccctgtcccc gccagagggt 1080
cttccccgaa gctgcagccc caacccatgg ctgcccacct ggaaccggga ctccctgtcc 1140
actgccccct ccccttcggg gccccatctg tgctggggcc caggttcggc ctacagattc 1200
ccatcattgc catggcctcc tgaccttgcc tatccacccc caaccaccgg ctccatgctg 1260
accctccccc aggctcccac gcccagctgg ccggccatcc ccaggcacag acagtctggg 1320
atctcacagg ttagcctgga ccatccacct ggccagacct gggagaggct ggaagctgcc 1380
ctgccaccat gctccagggc cccaggttgc agtactatgg ggtgagggtg tgtgtgcaca 1440
cctgtgtgta cctaggatat ccgagtgtac ccttgtgccc ccaagcacaa gtctccctcc 1500
caggcagtga ggcccagatg gtgcagtggt tagagctgag gcttatccca cagagaaccc 1560
tggcgccttg gtcaaggaag cccctatgcc tttcttgcct cgatttcccc tcttgtctgc 1620
tgagccagca ggggccacgt cctgggctgc tgtgaggagg aagcaagttg gtgctaggag 1680
gggctcctgt gtgtgcatgg gcgggagggg tgcaggtatc tgagcacccc ggtctccact 1740
tgagagagca gggcaggagc tccctgaccc acccagacta cacacgctgt gtccacgtgt 1800
ctcccattat ctgtggcaga ggatccggct tctttctcaa tttccagttc ttcacaaagc 1860
aatgcctttg taaaatgcaa taagaaatac tagaaaaatg atatgaacag aaagacacgc 1920
cgattttttg ttattagatg taacagacca tggccccatg aaatgatccc ggaccagatc 1980
cgtccacacc cgccactcag cagctctggc cgagctcaca gtacaaccac aataaactct 2040
tgttgaatga actctaggaa gtctgtgacg tggctggttc ttgtcaatgc ttcctgcctg 2100
cccacaggct cttcctcgtg gatggggctg tgcttgccac ggaagcgcgt ttttcccggc 2160
ctaggcttgc cttgggcccc actgccgtct ccagctggag atgaccttct atacacacat 2220
ttgctcatga cagacccttg cttagccccc ttccatggct ccctcctgct gctgggataa 2280
aatcaccttg cctggatatc ccctcctggg cccctttcca ccctccttag tcagcacccc 2340
cagttcaggg cacctgcttt ccccgctgcg gagaagccac tctctccttg ctgcccggct 2400
gtgtcttgcc ttccacacct tgtcacagtg gccacttcct aaggaaggcc tccctgtgtg 2460
caggtgtgca gaagtgcccc agcctcccgt cacctttgtc acgggagccc aatccatgag 2520
agtctatggt tctgtctgtc tgccccactc agggcagcga caagtccagg cggggaggac 2580
acagtaggca gagatttgtc gaggggacat atgagcaaga gggtgaggct gggagctccc 2640
tggagataac cacgcctcct gggaagactc gccgtcattt cagctccacg ctgtgcgggg 2700
gtgggtggag gggtagcctg gccctcatga ccagggagct tctcactcag cccctgttcc 2760
tccccag 2767
<210> 2
<211> 1287
<212> DNA
<213> Homo sapiens
<400> 2
gtaaatgagt gccacggccg gcaagccccc gctccccagg ctctcggggt cgcgcgagga 60
tgcttggcac gtaccccgtg tacatacttc ccaggcaccc agcatggaaa taaagcaccc 120
agcgcttccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct 180
gaggcctgag tggcatgagg gaggcagagt gggtcccact gtccccacac tggcccaggc 240
tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg 300
tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacgag 360
aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg 420
ttctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt 480
gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct 540
gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc 600
tgtggagaga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc 660
ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg 720
gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga 780
acactcctcg gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc 840
tcggcagctt ctccacatgc tgacctgctc agacaaaccc agccctcctc tcacaaggtg 900
cccctgcagc cgccacacac acacagggga tcacacacca cgtcacgtcc ctggccctgg 960
cccacttccc agtgccgccc ttccctgcag ctggggtcac atgaggtgtg ggcttcacca 1020
tcctcctgcc ctctgggcct cagggaggga cacgggagac ggggagcggg tcctgctgag 1080
ggccaggtcg ctatctaggg ccgggtgtct ggctgagccc cggggccaaa gctggtgccc 1140
agggcgggca gctgtgggga gctgacctca ggacattgtt ggcccatccc ggccgggccc 1200
tacatcctgg gtcctgccac agagggaatc acccccagag gcccaagccc agggggacac 1260
agcactgacc acccccttcc tgtccag 1287
<210> 3
<211> 1301
<212> DNA
<213> Homo sapiens
<400> 3
gtaaatgagt gccacggccg gcaagccccc gctccccagg ctctcggggt cgcgcgagga 60
tgcttggcac gtaccccgtc tacatacttc ccgggcaccc agcatggaaa taaagcaccc 120
agcgctgccc tgggcccctg cgagactgtg atggttcttt ccgtgggtca ggccgagtct 180
gaggcctgag tggcatgagg gaggcagagc gggttccact gtccccacac tggcccaggc 240
tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg 300
tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacggg 360
aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg 420
tcctgtgagc gccctgtcct ccgacctcca tgcccactcg ggggcatgcc tagtccatgt 480
gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggctgccct 540
gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc 600
tgtggaggga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc 660
ccgcgctgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg 720
gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga 780
acactcctca gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc 840
tcggcagctt ctccacatgc tgacctgctc agacaaaccc agccctcctc tcacaaggtg 900
cccctgcagc cgccacacac acacaggccc ccacacacag gggaacacac gccacgtcgc 960
gtccctggca ctggcccact tcccaatgcc gcccttccct gcagctgagg tcacatgagg 1020
tgtgggcttc accatcctcc tgccctctgg gcctcaggga gggacacagg agatggggag 1080
cgggtcctgc tgagggccag gtcgctatct agggctgggt gtctggctga gtcccggggc 1140
caaagctggt gcccagggca ggcagctgtg gggagctgac ctcaggacac tgttggccca 1200
tcccggccgg gccctacatc ctgggtcctg ccacagaggg aatcaccccc agaggcccga 1260
gcccagcagg acacagtatt gaccacccac ttcctgtcca g 1301
<210> 4
<211> 1914
<212> DNA
<213> Homo sapiens
<400> 4
gtaaacccac cctgtacaac gtgtccctgg tcatgtccga cacagctggc acctgctact 60
gaccctgctg gcctgcccac aggctcgggg cggctggccg ctctgtgtgt gcatgcaaac 120
taaccgtgtc aacggggtga gatgttgcat cttataaaat tagaaataaa aagatccatt 180
caaaagatac tggtcctgag tgcacgatgc tctggcctac tggggtggcg gctgtgctgc 240
acccaccctg cgcctcccct gcagaacacc ttcctccaca gcccccaccc ctgcctcacc 300
cacctgcgtg cctcagtggc ttctagaaac ccctgaattc cctgcagctg ctcacagcag 360
gctgacctca gacttgccat tcctcctact gcttccagaa agaaagctga aagcaaggcc 420
acacgtatac aggcagcaca caggcatgtg tggatacaca tggacagaca cggacacaca 480
caaacacatg gacacacaga gacgtgctaa cccatgggca cacacataca cagacatgga 540
cccacacaca aacatatgtg gacacacatg tacaaacatg cacaggcaca caaagagaac 600
actgactaca ggcacacaca cacacgggca cactacccac aggcacacaa cagatggaca 660
cgcgtacaca gacatgcaca cacccacagg cacaacacgt gcgcatgccg gccggccccc 720
gcccacattc tcccagggcc ctgccggata ctctgtccct gcagcagttt gctccctgcg 780
ctgtgctggc cccggggctt tgggcccagg ctctgcttgt ccttctgtct ctgcttggag 840
gtgctgccat ggcacccagc ttgggctctg cctggggagc ggaggcccca gggatagcat 900
gtgacccctg ctgaggccag gctcctgatg aaggcagcag atagccccca cacccaccgg 960
tgagcagaac cagagcctgt gccatgtgct gagagcaggc agtgactaag catatgggcc 1020
cagagggcag agtggctgcc ctgggcagct gctcctctta gcaggaggcc tcaggagatg 1080
agctagagca agtctgcccc tgcaaatacc acctgctccc caacccacag cagggagcag 1140
gcgaggtcag acagcagcag cccgggaagg accgagcccc agcagggaag gcagggcccg 1200
agtgaggtct ccacacccaa cgcacagtgc tgtctctaac tggggccacc tccgagtccc 1260
cgccacactc ttggcccttt ggagtcctgg gctccaggtg tctcccaagg gcccatctgt 1320
gcaggggatg caaccccccg aatgtcctca tcccactgtg gagctcaggt ctctgtctgc 1380
tccctgggtc ctggcagggt aggacaagtc cgccaggatg tccccatgca gactctgctc 1440
caagagggag ctggagagtc agggccttgg tgagggagtc aggatcgggt tccccccagc 1500
tcagtcctcc cacctgccag cccccacagc acagggcagg gccacacccc ctgcttcccc 1560
ctccaggaga gtcaggacat gctggccgct gctccgctgg ggccccgccc tccagccccc 1620
accttggtct gtgtgctgca tcccccacgc tctctctgcc accccaggac tctgaggaaa 1680
agacctcaga gtcccagccc tgcccagcct cggcctgtgc ccccgctgca tcaggctttc 1740
aggggcccag cccatgccct gggcagtgcc cgagcccccc tgcacttgct ctccccaccc 1800
ctgggtgcag cacagcctag gggccaaggg tgggcctaga ggatgggccc cgggggggct 1860
ttgctgggtg ccaccccagc ctgaccctat tcccccgtgc tgtgtctcct gcag 1914
<210> 5
<211> 2432
<212> DNA
<213> Mus musculus
<400> 5
gtaaacccac caatgtcagc gtgtctgtga tcatgtcaga gggagatggc atctgctact 60
gagccaccct gcctgtccct actcctgaaa taaactctgt gctcatccaa agtatccctg 120
cacttccatc cagtgcctgt ccatcatcct tagggtctac agaacacagg gaggggtcag 180
ggcccaggga gggagaaaca ccaccaccta agcttgtaag gcctcggaga ctttgaagac 240
ccttcatgcc tagagtatat gtgtatgcat gtctatgtat tggtgagtgc ttatggatgg 300
gtccatgtgc cttcatgtgt gtacctgtgt gcagcaagag aggagtgagt ttgtgtgcac 360
ctatggttta taggtatgta tatgggtata agtacatatg tggacacact atatctatgt 420
ccctgtgagc aagtgtgtgc ctgtgcatac ctatgagcat gcatatatct atgtgtgttc 480
atgttggtgg aaacatgaga gtgtgtgcac ctgccctgtg aatgtgcaat gagtgaatgg 540
gaagtaagaa taaactgggg atgaaatcca aggcgagcag actcagccaa gaaggcaaag 600
ctcatgggag agtccccagg gcagtgggtt gctgcacaag tactctgagt ggtgggtggt 660
gtggctgttt attagaccgc agcttctaac ccaaacaaga cagggataga tggagcaaaa 720
gggtagcacc atcaaggctg gtgccgtgtg ggggtcacaa tagagatgat ggtatgagaa 780
tgaagggatg aacacagggg cactgggaag aagatgccac gcaccctcag taggccatcc 840
ctgaatggaa acatgcattc agggtgacca ctgactcatg agaaagacat atagcatggc 900
acagacaacc ctcagcagca ccctgctctt cacacatgca catgggcata caccctgttc 960
tgcatacatg cacatgggca tacatgcaca gacactcaca tttgcacact cacacagacc 1020
tgaaccctgg aggaagatga agttcacagc ccacacccag cttctggaaa gcaaggggag 1080
tcccctccaa gcccccggga gaatttccag gcccgacact gacaactaca cacaatggac 1140
aagggcatag gcccctccag gtgccccctt tctaacctaa gtctcccttc ccatcctgag 1200
cccaagtatc acaaaccaga agcaggataa gaggcaaatc tgggaagaag caggagcagg 1260
ccatggagac cactcccaca caggcctcgg cctcctccat gggcacccct agaacacaaa 1320
gttctacaac caggtatact tggagcccag gtgtccacaa gagggcagtg ggggccctgc 1380
tcctgtctca caggccttca gaacttcggg gggggggggg aggagttgct ggtttctagc 1440
aacttccctc tgctctcaga gcaagagtgg agtaaaggcc catgcatgcc ctggatactc 1500
tccagcttga aagtccagtt ccctgagaat agcaagagca acagaccagc ttgggaaacc 1560
tgactcagaa aagtaccata gccacccatg gaatccaagg cctggcccat gacagagaat 1620
cctagtaagg aggagtcaat aggtgaaaga ctgaatcccc acagggagag ggggcagaga 1680
agctggagaa tcacgatagt cgggaaagat gatgagtgag cggctggagg gtaatggatg 1740
gctggctaca aggatgaacg atggggatga tggatggatt gatggatggc tgcagtgaca 1800
gaaatacgag tggttgacta tcagtacaca tttcctactg ccacttaaaa tgaaactctg 1860
tgcgcagaga acctgaggac agcagggttg gctctactgg gggtctttac tgttgcttaa 1920
cccccagtca cagctcttaa gaatgcaaca gagtcctctg accacatgtc caggccttgg 1980
tagtctaact ttggcccaga aatcacattg gcctgtatct gtttgaaggt gtctgatctt 2040
acacaaccct agtacccaag ccaagattag cctaagaact ggggtttagg gaggtattgc 2100
taaatatcta gaaaggactg agacctaagg agccttgggt tcaaactctt ctcagagttt 2160
gacagaaaca actctcttac catgacaggt ctctaattaa ggtttcccta agagagagag 2220
atgggtcttg gggccatctc aagaactgct gggattccag tcccttacct gggaccctgc 2280
ctcctcatta tccctgaaca agtcccttcc cgggaataag ggacccctac caccactgtc 2340
cccaaagccc aaggaggcat agaagcagaa accttaagtc tgagccccca tccccatggg 2400
tttggatcta gaaggtcatc tatgtcttac ag 2432
<210> 6
<211> 1411
<212> DNA
<213> Mus musculus
<400> 6
gtaaatgatc ccagtgtcct tggagccctc tggtcctaca ggactctgac acctacctcc 60
acccctccct gtgtaaataa agcacccagc actgccttgg gaccctgcaa taatgtcctg 120
gtgatttctg agatgtagag tctagctagg tcatggaatg aggggtctcc atggtttgag 180
gcctgagttg tgactaagga aaaacccata ggcctacact gccacaccca gcacttttga 240
atttgcctga catgaaaaga atttacctct ccctggaaag tggagcctta tccctaggca 300
gttcccttac cagaccttcc tctagcttgc actttgttct gggcacagaa tgtgtctaac 360
cccccaaagc aaggaagaca caacctctac ctccctcact ctgtccttac cccttttcct 420
ggctaagcat ctcactgagt gcgctgaata gatgcatgtg gccacagtct tgcagacaga 480
cccttgccat ctctccactc agctttccag aggctaagtc tagcccgtat ggtgataatg 540
cagggagctc tatgctatct cagtgctatc agactcccaa gtggaggatg aacatggacc 600
cattaaaacc aacctgcgca gcaacaccct gccaataagg cccgtatgtg aaaatgtgca 660
cacatctaca catgcacagg cacacacaca cacacatgca tgggcacaca cacatacaga 720
gagagagaat cacagaaact cccatgagca tcctatacag tactcaaaga taaaaaggta 780
ccaggtctac ccacatgatc atcctcggca tttacaagtg ggccaactga tacagataaa 840
acttttctat gccaaggacg ccaacatata cacaagtccg ctcatgacaa atctgtccct 900
gaacctcaga ctggcgcccg tgactcatac agtggacact cctccaaagc tgtatagctt 960
cctttacttc cctgtgtgta ctttctctga agtacactca tcacacagaa gaggccctgt 1020
gattactctg gccctctgtt cttggtcatc agagaataga cagaagatca ggcaaactac 1080
acagacactt cccacaatca tcacaggccc tgactctgct ctccagtctc aaaactgaag 1140
gctggagcac acagaataag ctcctgcaca ggccaggcca gtatcgggtc cagtgtgtct 1200
gactgagccc agggacaaaa tggcagcact ttggggaact gaggtttctg gtccaagaag 1260
gagagatgga ggcccaggga gggtctgctg acccagccca gcccagccca gctgcagctt 1320
tctcctgggc ctccatacag cctcctgcca cacagggaat ggccctagcc ccaccttatt 1380
gggacaaaca ctgaccgccc tctctgtcca g 1411
<210> 7
<211> 1357
<212> DNA
<213> Mus musculus
<400> 7
gtaaatgagc tcagcaccca caaagctctc aggtcctaag agacactggc acccatatcc 60
atgcatccct tgtataaata aagcatccag caaagcctgg taccatgtaa aactgtcctg 120
gttctttcca aggtatagag catagctcac gggctgatag gtctggccag ggttggagga 180
cagccttgtc tataggaaga gaatgaggtt tctgcactgc atgactcaga ggtcatgagt 240
cattctgcct tggactgttg gggcttggct ttaggcagtg ccttttcctt gccttcccat 300
gaaccagcag ctgccagaca tagagataat cctaggaagc ctcaaatgga taagcacaca 360
aacccacctc ccttaggctg ttcctgtccc cctgccccat ttctctactt aggggttttt 420
ctgagtctat tgtggagtga cacatggcca ggggcattcc atagaccttt gtcatctata 480
ctctcaactc aggcagcttt tcacagacga ggtctgcaca cccatacaaa tggctcactc 540
ctgcctgtgc cacctggggc tgaggcacat ggctcttgat gccccaaggg agggactatt 600
agatagccac actcatgcta aatcctgacc ctgctgaaca ccatccagtc catatagcac 660
atgtatcctc atgctcgtga gcacaaaacg catttaacac actgggacaa ctcctctgtg 720
cccagcacag cacctacatc cagcaatgta tcaccataca cacggccaaa aattcaatgc 780
ccacgtttct gccatcacaa tcagacacac ctttcctctt ctgaggacac tccattctcc 840
gctcaaaaca agacctctga agccagattc atctctggta cctcggggtc atgcttcaac 900
cccacatgaa taattcaaac catagccata atggtctgaa tcacttcaca ctgggatgtt 960
cccaagttca ggcaagaaaa gccacaggct ctgctgatga ctgaagaata gcaaagggtc 1020
agtccagctg tatagccact gttgacctgg gtcacaggcc ctgctgaccc tccaccttct 1080
cctgtactga aggaatgaaa gatgagacaa gcatagaggg cacttgaata atccaggtca 1140
ctctgaggtc catccaaggc attattggac tcaggtggag gaagctgaga ctgatgtccc 1200
agagggaaag gaaggaaagc aggccccggg gagggtctgc tgtcccagtc aggctggaga 1260
tctctcctct gacttcatgc agacatgtct gcctcacagg gaatctctcc cagcatcaac 1320
catgttggga caaacactga ctgtcctctc tgttcag 1357
<210> 8
<211> 1472
<212> DNA
<213> Mus musculus
<400> 8
gtaaatgaga acagcaccta gccattcctc gggtcttaca agacactgat accagcccta 60
accggtgaac cctataaata aagcacccag agatgggacc ttgtgagatt atcttggttc 120
tttacatggc acatagttca tgatacacct cagccacagg ctgtggggtc tggccagggt 180
tcaaggtgta agttaacatc caagaaagaa caaggtctta tactgccaga cccagggcat 240
gcaagtggac ctgcccttgc cagagatcat ccctctctgc atagcaagtt tgacccaagg 300
ggccctcttc atactcttcc ccacaaccag caactgttct gtgatgagtc tggagataga 360
aatatcgccc tagaaaatat ccaaagaaag gaacacagaa agtgtatccc acctcaacac 420
gaaccccacc ttcatttgtc tgtccttccc tctaccgtga ctcccctacc ttgacctagg 480
aggtctctgt atgtattaca tagacaggca ggaagactca tacatgaagc ccgttcatct 540
ccaccacacc cctagcgata gggataggga tgagtactcc taagagacta cctcccatat 600
gacattcact cacacctaag ttccaagaca ctgagagact tatgacccta gctgccccca 660
aggaagtaac taatcaaata cctacataga tgctgagacc agaactatta gaaccagcct 720
gctaagcatc actcaaccca catggtacct ccaagcctac atacatccac tgatacctca 780
cctaggcagc atgaatagca accaaaccca tcttagtgtc gggatatccc tagacactac 840
ctaaatgtac acatttggac cagtgaagat gaaatagctc tcatgggtac ctaactgttt 900
tcccctaaca cacacaagta ccttcagacc cattctgtcc ctctatgcct aagcccctat 960
tttcatccct tacagttaac actctcccat agctgtataa cctgactcac ttcccaatgt 1020
ggaccttcta ggaagcccag gtatcatcaa acgcaggccc tactctcact ctgtccctct 1080
gtactcagtc accagggaac aagcagtagg tcaggcaagc tgcagagcta ttacctacag 1140
ggcttccaag ccttgaatca gccaagccag ccccagtact gagggatagg gtagacaaaa 1200
agggttcctg catagcccag gccagcatca ggtccagtgt atctggctct acccagggac 1260
aaaacggcag cacattgggg agctgaggtt tctggttcac agagaacata aaggagagat 1320
ggccccaggg agggtcagat ggccccaggg agggtctgct gacccagtca ggctgcagct 1380
ttctcctggg cctccatgca gcctcctgcc acacagggaa tggccctagc tctaccttgt 1440
tgggacaaac actgactttc ctctctgttc ag 1472
<210> 9
<211> 1860
<212> DNA
<213> Mus musculus
<400> 9
gtaaacccac actgtacaat gtctccctga tcatgtctga cacaggcggc acctgctatt 60
gaccatgcta gcgctcaacc aggcaggccc tgggtgtcca gttgctctgt gtatgcaaac 120
taaccatgtc agagtgagat gttgcatttt ataaaaatta gaaataaaaa aaatccattc 180
aaacgtcact ggttttgatt atacaatgct catgcctgct gagacagttg tgttttgctt 240
gctctgcaca caccctgcat acttgcctcc accctggccc ttcctctacc ttgccagttt 300
cctccttgtg tgtgaactca gtcaggctta caacagacag agtatgaaca tgcgattcct 360
ccagctactt ctagatatat ggctgaaagc ttgcctaacc tggtgcaggc agcattcagg 420
cacatatata gacacacatg catttataca tagatatata ggtacacatg tgtagacaca 480
tacatgaatg tgtattcatg gacacacaga caaaggtaca catatataca catgagttca 540
tgcgcacaca catgcatgga cacttacaaa cgccttcaga gacaaatagg catagacaca 600
caaccactca cagaaacaga taccaatatg catggtcctg tgtacacaga aacagactat 660
aggcaaatat acacaaataa actatataga tacaaagata tgcatataca cacatgtaca 720
gaaacatctt cacatgtgta cactaacatg tgaacaggta tagcacacag atacacctgg 780
actctgacca gggctgtaat ctccaaggct cacggctcag agagcctaca ctaggctggg 840
tcactgatac tcctcaggag cccactctat gattgggaga gataacccca ggtacaaagt 900
atgcctatct gtctcaacac catggggcag aagatactcc actaaccacc catgacagaa 960
agttagcctt ggctgtgtct ccattaatag aacacctcag aagaccaatg tgaaattgcc 1020
taacccactc acacccaccc tgatctccag ttcaaaatgc agaaaacata atgcagttgt 1080
ccaaaagatg ccccaaccac acacacacac acacacacac acacacacac acacacacac 1140
acacacacac acacacacca tcaaggagcc tctgtaagga gtcaccaccc aataacactg 1200
cctctttggg ctcatatcct ggacattctt catattcata tccatttggg gcctaggctt 1260
tagatatccc caagggctca tctttacagg gatcagagat cccaataaat gccctggtcc 1320
cacagcctcc ctcaggtatc tgtctgttta tctcttggta ccaagaccca acattgctgg 1380
caggggtagg acaagcaacg cacgggaact ctgatcaaag aaagtcatga gatgcctgag 1440
tccttcagga agtaaggagg gacaacctct ggtatccctg ttcttattgc taaagcccaa 1500
gagacaggga gacctgctct aaattctcag tctaaacagc accgatggca ccacctgctc 1560
agggaaagtc cagagcacac caatatcatt ttgccacagt tcctgagtct gcctttaccc 1620
aggtccatac attgcatctg tcttgcttgc tctgctgccc cagggctcct ggaacaaagg 1680
ctccaaatta gtgtgtccta cagcttggcc tgttctgtgc ctccgtctag cttgagctat 1740
taggggacca gtcaatactc gctaagattc tccagaacca tcagggcacc ccaaccctta 1800
tgcaaatgct cagtcacccc aagacttggc ttgaccctcc ctctctgtgt cccttcatag 1860
<210> 10
<211> 87
<212> DNA
<213> Homo sapiens
<400> 10
agcctgtgga ccaccctgtc cacgtttgtg gccctcttca tcctcaccct cctctacagc 60
ggcattgtca ctttcatcaa ggtgaag 87
<210> 11
<211> 78
<212> DNA
<213> Homo sapiens
<400> 11
gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 60
gccaccgtca ccttcttc 78
<210> 12
<211> 78
<212> DNA
<213> Homo sapiens
<400> 12
gggctgtgga ccaccatcac catcttcatc acactcttcc tgctaagcgt gtgctacagt 60
gccaccatca ccttcttc 78
<210> 13
<211> 81
<212> DNA
<213> Homo sapiens
<400> 13
aacctgtggg ccaccgcctc caccttcatc gtcctcttcc tcctgagcct cttctacagt 60
accaccgtca ccttgttcaa g 81
<210> 14
<211> 63
<212> DNA
<213> Mus musculus
<400> 14
actgtgacct tcctcaccct cttcctactg agcttgttct acagcacagc actcactgtt 60
aca 63
<210> 15
<211> 84
<212> DNA
<213> Mus musculus
<400> 15
gggctctgga cgaccatcac catcttcatc agcctcttcc tgctcagtgt gtgctacagc 60
gctgctgtca cactcttcaa ggta 84
<210> 16
<211> 78
<212> DNA
<213> Mus musculus
<400> 16
gggctctgga cgaccatcac catcttcatc agcctcttcc tgctcagcgt gtgctacagc 60
gcctctgtca cactcttc 78
<210> 17
<211> 78
<212> DNA
<213> Mus musculus
<400> 17
gggctctgga cgaccatcac catcttcatc agcctcttcc tgctcagcgt gtgctacagc 60
gcctctgtca ccctcttc 78
<210> 18
<211> 84
<212> DNA
<213> Mus musculus
<400> 18
aacctgtgga ccactgcctc caccttcatc gtcctcttcc tcctgagcct cttctacagc 60
accaccgtca ccctgttcaa ggtg 84
<210> 19
<211> 30
<212> PRT
<213> Homo sapiens
<400> 19
Gly Glu Ala Ala Arg Arg Pro Gly Leu Pro Leu Pro Leu Leu Leu Leu
1 5 10 15
His Gln Leu Leu Leu Leu Phe Leu Ser His Leu Arg Arg Leu
20 25 30
<210> 20
<211> 26
<212> PRT
<213> Homo sapiens
<400> 20
Asp Ala Ala His Pro Val Ala Ala Ser Leu Pro Leu Leu Ala Gly Thr
1 5 10 15
Leu Leu Leu Leu Gly Ala Ser Ala Ala Pro
20 25
<210> 21
<211> 24
<212> PRT
<213> Homo sapiens
<400> 21
Ser Ser Ala Gly Ser Leu Ala Ala Gly Pro Leu Leu Val Ala Leu Ala
1 5 10 15
Leu Tyr Pro Leu Ser Val Leu Phe
20
<210> 22
<211> 30
<212> PRT
<213> Homo sapiens
<400> 22
Asp Ala Ala His Pro Gly Arg Ser Val Val Pro Ala Leu Leu Pro Leu
1 5 10 15
Leu Ala Gly Thr Leu Leu Leu Leu Glu Thr Ala Thr Ala Pro
20 25 30
<210> 23
<211> 26
<212> PRT
<213> Homo sapiens
<400> 23
Ser Ala Ser Ser Asn Ile Ser Gly Gly Ile Phe Leu Phe Phe Val Ala
1 5 10 15
Asn Ala Ile Ile His Leu Phe Cys Phe Ser
20 25
<210> 24
<211> 27
<212> PRT
<213> Homo sapiens
<400> 24
Ala Ser Gly Thr Ser Pro Gly Leu Ser Ala Gly Ala Thr Val Gly Ile
1 5 10 15
Met Ile Gly Val Leu Val Gly Val Ala Leu Ile
20 25
<210> 25
<211> 29
<212> PRT
<213> Homo sapiens
<400> 25
Ser Gly Thr Thr Arg Leu Leu Ser Gly His Thr Cys Phe Thr Leu Thr
1 5 10 15
Gly Leu Leu Gly Thr Leu Val Thr Met Gly Leu Leu Thr
20 25
<210> 26
<211> 27
<212> PRT
<213> Homo sapiens
<400> 26
Asn Gly Gly Thr Ser Leu Ser Glu Lys Thr Val Leu Leu Leu Val Thr
1 5 10 15
Pro Phe Leu Ala Ala Ala Trp Ser Leu His Pro
20 25
<210> 27
<211> 32
<212> PRT
<213> Homo sapiens
<400> 27
Cys Glu Gly Ile Ser Leu Leu Ala Gln Asn Thr Ser Trp Leu Leu Leu
1 5 10 15
Leu Leu Leu Ser Leu Ser Leu Leu Gln Ala Thr Asp Phe Met Ser Leu
20 25 30
<210> 28
<211> 22
<212> PRT
<213> Homo sapiens
<400> 28
Ser Gly Ala Pro Thr Leu Ser Pro Ser Leu Leu Gly Leu Leu Leu Pro
1 5 10 15
Ala Phe Gly Ile Leu Val
20
<210> 29
<211> 39
<212> PRT
<213> Homo sapiens
<400> 29
Asp Leu Cys Asn Glu Lys Leu His Asn Ala Ala Pro Thr Arg Thr Ala
1 5 10 15
Leu Ala His Ser Ala Leu Ser Leu Gly Leu Ala Leu Ser Leu Leu Ala
20 25 30
Val Ile Leu Ala Pro Ser Leu
35
<210> 30
<211> 24
<212> PRT
<213> Homo sapiens
<400> 30
Ser Gly Ala Gly Pro Trp Ala Ala Trp Pro Phe Leu Leu Ser Leu Ala
1 5 10 15
Leu Met Leu Leu Trp Leu Leu Ser
20
<210> 31
<211> 26
<212> PRT
<213> Homo sapiens
<400> 31
Asn Ala Gly Glu Met Leu His Gly Thr Gly Gly Leu Leu Leu Ser Leu
1 5 10 15
Ala Leu Met Leu Gln Leu Trp Leu Leu Gly
20 25
<210> 32
<211> 49
<212> PRT
<213> Homo sapiens
<400> 32
Ala Arg Gly Leu Met Asn Gly Tyr Arg Gly Pro Ala Met Asp Ser Glu
1 5 10 15
Glu Asp Met Met Val Thr Ala Leu His Ser Leu Thr Leu Gln Thr Val
20 25 30
Val Ile His Ser Leu Ser Ser Val Leu Pro Gly Ile Thr Leu Ala Ile
35 40 45
Asn
<210> 33
<211> 30
<212> PRT
<213> Homo sapiens
<400> 33
Ser Ser Gly His Ser Arg His Arg Tyr Ala Leu Ile Pro Ile Pro Leu
1 5 10 15
Ala Val Ile Thr Thr Cys Ile Val Leu Tyr Met Asn Val Leu
20 25 30
<210> 34
<211> 27
<212> PRT
<213> Homo sapiens
<400> 34
Ser Gly Ala Ser Ser Leu His Arg His Phe Gly Leu Leu Leu Ala Ser
1 5 10 15
Leu Ala Pro Leu Val Leu Cys Leu Ser Leu Leu
20 25
<210> 35
<211> 26
<212> PRT
<213> Homo sapiens
<400> 35
Ser Thr Gly Ser His Cys His Gly Ser Phe Ser Leu Ile Phe Leu Ser
1 5 10 15
Leu Trp Ala Val Ile Phe Val Leu Tyr Gln
20 25
<210> 36
<211> 31
<212> PRT
<213> Homo sapiens
<400> 36
Gly Ala Ala Pro Gln Pro Gly Pro Ala His Leu Ser Leu Thr Ile Thr
1 5 10 15
Leu Leu Met Thr Ala Arg Leu Trp Gly Gly Thr Leu Leu Trp Thr
20 25 30
<210> 37
<211> 30
<212> PRT
<213> Mus musculus
<400> 37
Asn Ala Ala Val Pro Thr Gly Ala Ser Thr Trp Thr Met Ala Gly Val
1 5 10 15
Leu Leu Phe Ser Leu Ser Ser Val Ile Leu Gln Thr Leu Leu
20 25 30
<210> 38
<211> 35
<212> PRT
<213> Mus musculus
<400> 38
Asn Glu Arg Leu Val Ser Ala Ala Pro Gly His Ala Leu Leu Ser Ser
1 5 10 15
Val Thr Leu Gly Leu Ala Thr Ser Leu Ser Leu Leu Thr Val Met Ala
20 25 30
Leu Cys Leu
35
<210> 39
<211> 26
<212> PRT
<213> Mus musculus
<400> 39
Ser Ala Ala Ser His Tyr Gln Gly Ser Phe Pro Leu Val Ile Leu Ser
1 5 10 15
Leu Ser Ala Val Ile Phe Val Leu Tyr Gln
20 25
<210> 40
<211> 24
<212> PRT
<213> Mus musculus
<400> 40
Ser Ser Gly Val Cys Trp Thr Ala Thr Trp Leu Val Val Thr Thr Leu
1 5 10 15
Ile Ile His Arg Ile Leu Leu Thr
20
<210> 41
<211> 32
<212> PRT
<213> Mus musculus
<400> 41
Asn Phe Ser Ala Ala Gly Leu Gly Leu Arg Ala Ser Ile Pro Leu Leu
1 5 10 15
Gly Leu Gly Leu Leu Leu Ser Leu Leu Ala Leu Leu Gln Leu Ser Pro
20 25 30
<210> 42
<211> 16
<212> PRT
<213> Mus musculus
<400> 42
Ala Lys Ser Phe Tyr Phe Ile Cys Tyr Leu Cys Leu Tyr Leu Ala Leu
1 5 10 15
<210> 43
<211> 22
<212> PRT
<213> Rattus norvegicus
<400> 43
Gly Asn Ser Ala Glu Gly Ser Met Pro Ala Phe Leu Leu Phe Leu Leu
1 5 10 15
Leu Gln Leu Trp Asp Thr
20
<210> 44
<211> 32
<212> PRT
<213> Rattus norvegicus
<400> 44
Cys Gly Gly Ile Ser Leu Leu Val Gln Asn Thr Ser Trp Leu Leu Leu
1 5 10 15
Leu Leu Leu Ser Leu Ser Phe Leu Gln Ala Thr Asp Phe Ile Ser Leu
20 25 30
<210> 45
<211> 29
<212> PRT
<213> Rattus norvegicus
<400> 45
Ser Ala Ala Thr Arg Pro Glu Pro His Tyr Phe Phe Leu Leu Phe Leu
1 5 10 15
Phe Thr Leu Val Leu Ala Ala Ala Arg Pro Arg Trp Arg
20 25
<210> 46
<211> 24
<212> PRT
<213> Rattus norvegicus
<400> 46
Ser Ser Gly Val His Trp Ile Ala Ala Trp Leu Val Val Thr Leu Ser
1 5 10 15
Ile Ile Pro Ser Ile Leu Leu Ala
20
<210> 47
<211> 26
<212> PRT
<213> Rattus norvegicus
<400> 47
Ser Ala Ala Ser His Tyr Gln Gly Ser Phe Pro Leu Ile Ile Leu Ser
1 5 10 15
Phe Trp Ala Val Ile Leu Val Leu Tyr Gln
20 25
<210> 48
<211> 22
<212> PRT
<213> Rattus norvegicus
<400> 48
Arg Asn Thr Gly Phe Leu Leu Ala Trp Pro Thr Phe Phe Leu Pro Val
1 5 10 15
Phe Leu Ala Trp Leu Phe
20
<210> 49
<211> 30
<212> PRT
<213> Rattus norvegicus
<400> 49
Ser Ser Ala Gly Ala Arg Glu Ser Cys Val Ser Leu Phe Leu Val Val
1 5 10 15
Leu Pro Ser Leu Leu Val Gln Leu Leu Cys Leu Ala Glu Pro
20 25 30
<210> 50
<211> 33
<212> PRT
<213> Candida albicans
<400> 50
Ser Ser Gly Val Lys Ala Thr Gln Gln Met Ser Met Val Lys Leu Val
1 5 10 15
Ser Ile Ile Thr Ile Val Thr Ala Phe Val Gly Gly Met Ser Val Val
20 25 30
Phe
<210> 51
<211> 32
<212> PRT
<213> Yeast sp.
<400> 51
Asn Ala Ala Thr Asn Val Lys Ala Asn Leu Ala Gln Val Val Phe Thr
1 5 10 15
Ser Ile Ile Ser Leu Ser Ile Ala Ala Gly Val Gly Phe Ala Leu Val
20 25 30
<210> 52
<211> 25
<212> PRT
<213> porcine
<400> 52
Ala Arg Ala Ala Pro Thr Thr Ser Leu Gly Ser Leu Met Thr Val Ser
1 5 10 15
Ala Leu Ala Ile Leu Gly Trp Ser Val
20 25
<210> 53
<211> 26
<212> PRT
<213> porcine
<400> 53
Ser Ala Ala Pro Ser Leu His Leu Pro Pro Gly Ser Leu Leu Ala Ser
1 5 10 15
Leu Val Pro Leu Leu Leu Leu Ser Leu Pro
20 25
<210> 54
<211> 18
<212> PRT
<213> Trypanosoma brucei
<400> 54
Ser Asn Ser Phe Val Ile His Lys Ala Pro Leu Phe Leu Ala Phe Leu
1 5 10 15
Leu Phe
<210> 55
<211> 24
<212> PRT
<213> Trypanosoma brucei
<400> 55
Asp Ser Ser Ile Leu Val Thr Lys Lys Phe Ala Leu Thr Val Val Ser
1 5 10 15
Ala Ala Phe Val Ala Leu Leu Phe
20
<210> 56
<211> 24
<212> PRT
<213> Trypanosoma brucei
<400> 56
Asn Gly Ser Phe Leu Thr Ser Lys Gln Phe Ala Phe Ser Val Val Ser
1 5 10 15
Ala Ala Phe Val Ala Leu Leu Phe
20
<210> 57
<211> 18
<212> PRT
<213> Trypanosoma brucei
<400> 57
Ser Asn Ser Phe Val Ile Ser Lys Thr Pro Leu Trp Leu Ala Val Leu
1 5 10 15
Leu Phe
<210> 58
<211> 23
<212> PRT
<213> Trypanosoma brucei
<400> 58
Asp Gly Ser Phe Leu Val Asn Lys Lys Phe Ala Leu Met Val Tyr Asp
1 5 10 15
Phe Val Ser Leu Leu Ala Phe
20
<210> 59
<211> 23
<212> PRT
<213> Trypanosoma brucei
<400> 59
Asn Gly Ser Phe Leu Thr Ser Lys Gln Phe Ala Leu Met Val Ser Ala
1 5 10 15
Ala Phe Val Thr Leu Leu Phe
20
<210> 60
<211> 23
<212> PRT
<213> Trypanosoma brucei
<400> 60
Gly Ala Ala Thr Leu Lys Ser Val Ala Leu Pro Phe Ala Ile Ala Ala
1 5 10 15
Ala Ala Leu Val Ala Ala Phe
20
<210> 61
<211> 18
<212> PRT
<213> Trypanosoma brucei
<400> 61
Ser Asn Ser Phe Val Ile Asn Lys Ala Pro Leu Leu Leu Gly Phe Leu
1 5 10 15
Leu Phe
<210> 62
<211> 20
<212> PRT
<213> Trypanosoma congolense
<400> 62
Ser Gly Ser Ser His Gly Thr Lys Ala Ile Arg Ser Ile Leu His Val
1 5 10 15
Ala Leu Leu Met
20
<210> 63
<211> 28
<212> PRT
<213> Gallus sp.
<400> 63
Ala Gly Asn Lys Leu Ile Gln Gln His Leu Leu Val Ile Thr Phe Val
1 5 10 15
Pro Phe Ile Ile Leu Gly Gln Leu Gln Gly Leu Gly
20 25
<210> 64
<211> 26
<212> PRT
<213> Gallus sp.
<400> 64
Ala Thr Leu Gly Ser Pro Ser Thr Ser Ser Ser Phe Val Ser Leu Leu
1 5 10 15
Leu Ser Ala Val Thr Leu Leu Leu Leu Cys
20 25
<210> 65
<211> 25
<212> PRT
<213> Torpedo marmorata
<400> 65
Ser Ser Ser Gly Thr Ser Ser Ser Lys Gly Ile Ile Phe Tyr Val Leu
1 5 10 15
Phe Ser Ile Leu Tyr Leu Ile Phe Tyr
20 25
<210> 66
<211> 24
<212> PRT
<213> Hamster sp.
<400> 66
Ser Ser Ala Val Leu Phe Ser Ser Pro Pro Val Ile Leu Leu Ile Ser
1 5 10 15
Phe Leu Ile Phe Leu Met Val Gly
20
<210> 67
<211> 26
<212> PRT
<213> Bos taurus
<400> 67
Ser Ala Gly Ser His Cys Cys Gly Ser Phe Ser Leu Ile Phe Leu Ser
1 5 10 15
Val Leu Ala Val Ile Ile Ile Leu Tyr Gln
20 25
<210> 68
<211> 23
<212> PRT
<213> slime mold
<400> 68
Ser Ser Ala Thr Thr Ile Ala Phe Asn Ala Phe Val Val Phe Ala Ile
1 5 10 15
Val Leu Ser Val Leu Leu Phe
20
<210> 69
<211> 22
<212> PRT
<213> slime mold
<400> 69
Gly Ser Ala Ser Thr Val Val Ala Ser Leu Ser Leu Ile Ile Phe Ser
1 5 10 15
Met Ile Leu Ser Leu Cys
20
<210> 70
<211> 25
<212> DNA
<213> Homo sapiens
<400> 70
acctggccat gacccccctg atccc 25
<210> 71
<211> 29
<212> DNA
<213> Homo sapiens
<400> 71
agctgcaact ggaggagagc tgtgcggag 29
<210> 72
<211> 33
<212> DNA
<213> Homo sapiens
<400> 72
agctgcaact ggaggagagc tgtgcggagg cgc 33
<210> 73
<211> 25
<212> DNA
<213> Homo sapiens
<400> 73
agggggaggt gagcgccgac gagga 25
<210> 74
<211> 31
<212> DNA
<213> Mus musculus
<400> 74
aacgtcaaga gccactttcc tatgtgctac t 31
<210> 75
<211> 48
<212> DNA
<213> Mus musculus
<400> 75
ggctgcaact ggacgagacc tgtgctgagg cccaggacgg ggagctgg 48
<210> 76
<211> 27
<212> DNA
<213> Mus musculus
<400> 76
ggctagacct ggatgatatc tgtgctg 27
<210> 77
<211> 23
<212> DNA
<213> Mus musculus
<400> 77
agctggaact gaatgagacc tgt 23
<210> 78
<211> 33
<212> DNA
<213> Mus musculus
<400> 78
agggggaggt gaatgctgag gaggaaggct ttg 33
<210> 79
<211> 4
<212> PRT
<213> Homo sapiens
<400> 79
Gly Phe Thr His
1
<210> 80
<211> 4
<212> PRT
<213> Homo sapiens
<400> 80
Ala Cys Thr Thr
1
<210> 81
<211> 4
<212> PRT
<213> Homo sapiens
<400> 81
Cys Ala Pro Ala
1
<210> 82
<211> 4
<212> PRT
<213> Homo sapiens
<400> 82
Ala Gly Thr Thr
1
<210> 83
<211> 4
<212> PRT
<213> Homo sapiens
<400> 83
Thr Ser Ser Pro
1
<210> 84
<211> 4
<212> PRT
<213> Homo sapiens
<400> 84
Ile Thr Val Ser
1
<210> 85
<211> 4
<212> PRT
<213> Homo sapiens
<400> 85
Ser Gly Thr Thr
1
<210> 86
<211> 4
<212> PRT
<213> Homo sapiens
<400> 86
Glu Gln Leu Glu
1
<210> 87
<211> 4
<212> PRT
<213> Homo sapiens
<400> 87
Lys Leu Val Lys
1
<210> 88
<211> 4
<212> PRT
<213> Homo sapiens
<400> 88
Gln Val Lys Ile
1
<210> 89
<211> 4
<212> PRT
<213> Homo sapiens
<400> 89
Cys Cys Gln Glu
1
<210> 90
<211> 4
<212> PRT
<213> Homo sapiens
<400> 90
Ala Ala Ala Met
1
<210> 91
<211> 4
<212> PRT
<213> Homo sapiens
<400> 91
Ala Met His Val
1
<210> 92
<211> 4
<212> PRT
<213> Homo sapiens
<400> 92
Gly Ser Arg Gly
1
<210> 93
<211> 4
<212> PRT
<213> Homo sapiens
<400> 93
Thr Cys Ile Pro
1
<210> 94
<211> 4
<212> PRT
<213> Homo sapiens
<400> 94
Tyr Gly Tyr Ser
1
<210> 95
<211> 4
<212> PRT
<213> Homo sapiens
<400> 95
Arg Ile Lys Phe
1
<210> 96
<211> 4
<212> PRT
<213> Homo sapiens
<400> 96
Gln Tyr Arg Ser
1
<210> 97
<211> 4
<212> PRT
<213> Mus musculus
<400> 97
Glu Asp Leu Cys
1
<210> 98
<211> 4
<212> PRT
<213> Mus musculus
<400> 98
Thr Asp Leu Cys
1
<210> 99
<211> 4
<212> PRT
<213> Mus musculus
<400> 99
Arg Ile Lys Phe
1
<210> 100
<211> 4
<212> PRT
<213> Mus musculus
<400> 100
Asp Leu Ala Arg
1
<210> 101
<211> 4
<212> PRT
<213> Mus musculus
<400> 101
Ser Ser Phe Cys
1
<210> 102
<211> 4
<212> PRT
<213> Mus musculus
<400> 102
His Leu Met Phe
1
<210> 103
<211> 4
<212> PRT
<213> Rattus norvegicus
<400> 103
Ala Pro Ser Ser
1
<210> 104
<211> 4
<212> PRT
<213> Rattus norvegicus
<400> 104
Lys Leu Val Lys
1
<210> 105
<211> 4
<212> PRT
<213> Rattus norvegicus
<400> 105
Gly Gln Lys Thr
1
<210> 106
<211> 4
<212> PRT
<213> Rattus norvegicus
<400> 106
Thr Leu Ala Arg
1
<210> 107
<211> 4
<212> PRT
<213> Rattus norvegicus
<400> 107
Arg Ile Lys Phe
1
<210> 108
<211> 4
<212> PRT
<213> Rattus norvegicus
<400> 108
Asn Gly Thr Pro
1
<210> 109
<211> 4
<212> PRT
<213> Rattus norvegicus
<400> 109
Asn Cys Leu Tyr
1
<210> 110
<211> 4
<212> PRT
<213> Candida albicans
<400> 110
Gly Ser Ser Ser
1
<210> 111
<211> 4
<212> PRT
<213> Yeast sp.
<400> 111
Ser Ser Lys Lys
1
<210> 112
<211> 4
<212> PRT
<213> porcine
<400> 112
Glu Pro Leu Ser
1
<210> 113
<211> 4
<212> PRT
<213> porcine
<400> 113
Asn Tyr Gly Tyr
1
<210> 114
<211> 4
<212> PRT
<213> Trypanosoma brucei
<400> 114
Asn Thr Thr Gly
1
<210> 115
<211> 4
<212> PRT
<213> Trypanosoma brucei
<400> 115
Asn Ala Cys Lys
1
<210> 116
<211> 4
<212> PRT
<213> Trypanosoma brucei
<400> 116
Glu Lys Cys Arg
1
<210> 117
<211> 4
<212> PRT
<213> Trypanosoma brucei
<400> 117
Thr Thr Gly Ser
1
<210> 118
<211> 4
<212> PRT
<213> Trypanosoma brucei
<400> 118
Glu Lys Cys Cys
1
<210> 119
<211> 4
<212> PRT
<213> Trypanosoma brucei
<400> 119
Glu Asp Cys Arg
1
<210> 120
<211> 4
<212> PRT
<213> Trypanosoma brucei
<400> 120
Glu Pro Glu Pro
1
<210> 121
<211> 4
<212> PRT
<213> Trypanosoma brucei
<400> 121
Asn Thr Thr Ala
1
<210> 122
<211> 4
<212> PRT
<213> Trypanosoma congolense
<400> 122
Ser His Leu Pro
1
<210> 123
<211> 4
<212> PRT
<213> Gallus sp.
<400> 123
Gln Cys Ser Gly
1
<210> 124
<211> 4
<212> PRT
<213> Gallus sp.
<400> 124
Thr Val Ile Pro
1
<210> 125
<211> 4
<212> PRT
<213> Torpedo marmorata
<400> 125
Asp Gly Glu Leu
1
<210> 126
<211> 4
<212> PRT
<213> Hamster sp.
<400> 126
Asp Gly Arg Arg
1
<210> 127
<211> 4
<212> PRT
<213> Bos taurus
<400> 127
Arg Ile Gln Phe
1
<210> 128
<211> 4
<212> PRT
<213> slime mold
<400> 128
Asn Asn Val Cys
1
<210> 129
<211> 4
<212> PRT
<213> slime mold
<400> 129
Ser Thr Thr Thr
1
<210> 130
<211> 2074
<212> DNA
<213> Homo sapiens
<400> 130
cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg 60
gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt 120
ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag 180
gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct 240
acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga 300
ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg 360
catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc 420
cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg 480
ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg 540
ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac 600
cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag 660
taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac 720
cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta 780
gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct 840
tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag 900
gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 960
gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 1020
acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 1080
ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140
ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200
ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260
ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320
tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380
catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440
cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500
gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560
cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620
ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680
cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740
tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800
ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860
ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920
gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980
agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040
gcccactcgg gggcatgcga cagattgagg atcc 2074
<210> 131
<211> 330
<212> PRT
<213> Artificial
<220>
<223> Amino acid sequence of the gamma-chain constant region encoded by
plasmid pIgG-A
<400> 131
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr
65 70 75 80
Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
130 135 140
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
145 150 155 160
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
180 185 190
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
210 215 220
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
245 250 255
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
290 295 300
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330
<210> 132
<211> 40
<212> DNA
<213> Artificial
<220>
<223> TM-fw1
<400> 132
ggccgagtct gaggcctgag tggcatgagg gaggcagagt 40
<210> 133
<211> 48
<212> DNA
<213> Artificial
<220>
<223> TM-rv1
<400> 133
aactggatcc atgtagaaaa gaggagaagc cccgggggtc catgtagt 48
<210> 134
<211> 47
<212> DNA
<213> Artificial
<220>
<223> M1-rv
<400> 134
gatccacttc accttgaaga aggtgacggt ggcactgtag cacacgc 47
<210> 135
<211> 49
<212> DNA
<213> Artificial
<220>
<223> M2-fw
<400> 135
caccttcttc aaggtgaagt ggatcttctc ctcggtggtg gacctgaag 49
<210> 136
<211> 33
<212> DNA
<213> Artificial
<220>
<223> TM-fw2
<400> 136
ctccagcagc agctgccctg ggctgggcca cga 33
<210> 137
<211> 50
<212> DNA
<213> Artificial
<220>
<223> TM-rv2
<400> 137
cagggatccc ccgaggtgca gctggaccag cctcctcctg accgtgtttt 50
<210> 138
<211> 68
<212> DNA
<213> Artificial
<220>
<223> mutSphI-1
<400> 138
ctaccccaga cctccgctgc ttggtgcctg cagggcactg ggggccaggt gtcccctcag 60
caggacgt 68
<210> 139
<211> 62
<212> DNA
<213> Artificial
<220>
<223> mutSphI-2
<400> 139
cctgctgagg ggacacctgg cccccagtgc cctgcaggca ccaagcagcg gaggtctggg 60
gt 62
<210> 140
<211> 6949
<212> DNA
<213> Homo sapiens
<400> 140
cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg 60
gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt 120
ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag 180
gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct 240
acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga 300
ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg 360
catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc 420
cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg 480
ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg 540
ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac 600
cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag 660
taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac 720
cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta 780
gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct 840
tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag 900
gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 960
gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 1020
acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 1080
ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140
ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200
ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260
ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320
tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380
catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440
cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500
gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560
cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620
ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680
cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740
tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800
ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860
ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920
gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980
agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040
gcccactcgg gggcatgcct agtccatgcg cgtagggaca ggccctccct cacccatcta 2100
cccccacggc actaacccct ggcagccctg cccagcctcg cacccgcatg gggacacaac 2160
cgactccggg gacatgcact ctcgggccct gtggagggac tggtgcagat gcccacacac 2220
acactcagcc cagacccgtt caacaaaccc cgcactgagg ttggccggcc acacggccac 2280
cacacacaca cgtgcacgcc tcacacacgg agcctcaccc gggcgaaccg cacagcaccc 2340
agaccagagc aaggtcctcg cacacgtgaa cactcctcgg acacaggccc ccacgagccc 2400
cacgcggcac ctcaaggccc acgagccgct cggcagcttc tccacatgct gacctgctca 2460
gacaaaccca gccctcctct cacaaggtgc ccctgcagcc gccacacaca cacaggcccc 2520
cacacgcagg ggaacacacg ccacgtcgcg tccctggcac tggcccactt cccaatacag 2580
cccttccctg cagctggggt cacatgaggt gtgggcttca ccatcctcct gccctctggg 2640
cctcagggag ggacacggga gacggggagc gggtcctgct gagggccagg tcgctatcta 2700
gggccgggtg tctggctgag tcccggggcc aaagctggtg cccagggcgg gcagctgtgg 2760
ggagctgacc tcaggacatt gttggcccat cccggccggg ccctacatcc tgggccccgc 2820
cacagaggga atcaccccca gaggcccaag cccaggggga cacagcactg accaccccct 2880
tcctgtccag agctgcaact ggaggagagc tgtgcggagg cgcaggacgg ggagctggac 2940
gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 3000
gccaccgtca ccttcttcaa ggtcggccgc acgttgtccc cagctgtcct tgacattgtc 3060
ccccatgctg tcacaaactg tctctgacac tgtcccacag gctgtcccca cctgtccctg 3120
acgctgtccc ccatgctctc acaaactgtc cctgacattg tccccaatgc tgcccccacc 3180
tgtccaacag tgtcccccag gctctcccca catgtccccg acactgtccc ccatgctgtc 3240
cccatctgtc cccaacactg tcccccaccc tgtccccctt tgtccccaac actgtccccc 3300
acagtttcca cctgtccctg acactgtccc ccatgctttc cccacctgtc cctgacacca 3360
tcccccactc tgtcccctat agttcctggc cctgtccccc acgctgtccc ctacagtacc 3420
tggcactgtc ccccatgctg tcccctcctg tatgaaaccc tgtcccacat gctgtcccca 3480
cctgtccgtg acaatatccc ccacactgtc cccacctgtc cccgacactc tcctccacgt 3540
tgttcttacc taaacccgac actttcctcc atgctgtccc cacccatctc cgacactgta 3600
ccccacgttg tccccacctg tcctcaacac tgtcccccat gctgtcccca cctgtcccca 3660
acactctcct ccatgctgtc cccacctgtc cctgatattg tcccccatgc agtctccacc 3720
tgtccccaat gctgtccccc aggctgtacc taccagtaca acactgtccc ccatgctgtc 3780
cccacctgtc cctgacactg tcccccacgc tgtcccctcc tgtccccgac actgtccccc 3840
acactgtccc cacctgtccc caacactatc ctccatgctg tcccctcctg tccccacctg 3900
tcccctacac tgtcccccat gctgtcccca ccagtcccca aaactttcct ccacactgtc 3960
cccacctgtc cccaacactg tcccccacgc tatcccccct gtccccgaca atgtccccac 4020
tgtttcctcc tgttccctcc tatccctgac actgtccgcc atgctgtccc cacctgtccc 4080
tgacactgtc tcccactctg tcccctataa tccctgacac tgtcccccac gccgtcccct 4140
cccgtatgca ccactgtccc ccaagctgtc cccacctgtc ctcaacacag tcccccatgc 4200
tgtccccacc tgtccccaac actctcctcc atgtccccac ctgtccctga tattgtcccc 4260
catgcagtcc ccacctgtcc ccgatgctgt cccccgggct gtacctacca gtccaacact 4320
gtcccccaca ctctccccac ctgtccctga tactgtcccc catgctgtcc ccacctgtcc 4380
cggacactgt tctccacgat ctcccctcct gtccctgaca ctgtccccca cactgtcccc 4440
acctgtcccc aacactatcc tccatcctgt cccaacctgt ctcctacact gtcccccatg 4500
ctgtccccac cagtccccaa cactgtcctc catgctgtcc cccatgtccc caacactgtc 4560
ccccatgcta cctcccctgc ccctgacaat gtccccactg tttcctgtcc cctcctatcc 4620
ctgacactgt cccccatgct gtccccacct gtcccccaca tggtctccac cggtccctga 4680
cactgtctcc cactctgtcc cctataatcc ctgacactgt cccccacacc gtcccctcct 4740
gtatgcacca cggtccccca tgctgtcccc acctgtccct gatgctgtcc tccacacagt 4800
ccccacctct ccctgacact gtccccatct ctccccaaca ctctcctcca tgctgtcctc 4860
aactgtcccc aacactcttc cacactctgt ctccacctgt ccctgacact gtcccccaca 4920
ctgtcctcac ctgtgtctga cactgtcccc cacgctgtcc ccacctgtcc ctgacgctgt 4980
cttctgtgct gtccacatgc tgttggtgcc ctggctctgc tctctatcac caagcctcag 5040
agcaggcagt ggtgaggcca tggcacctgg gtggcatgag gggccggatg ggcctcaggg 5100
gcagggctgt ggcctgcgtg gactgacagg tgggtgggcc ttgggggcag agaggtggcc 5160
tcagtgccct gaggggtggg tggggctcgg gggcagggct gtggcctcgc tcacccctgt 5220
gctgtgcctt gcctacaggt gaagtggatc ttctcctcgg tggtggacct gaagcagacc 5280
atcatccccg actacaggaa catgatcgga cagggggcct agggccaccc tctgcggggt 5340
gtccagggcc gcccagaccc cacacaccag ccatgggcca tgctcagcca ccacccaggc 5400
cacacctgcc cccgacctca ccgccctcaa ccccatggct ctctggcctc gcagttgccc 5460
tctgaccctg acacacctga cacgcccccc ttccagaccc tgtgcatagc aggtctaccc 5520
cagacctccg ctgcttggtg cctgcagggc actgggggcc aggtgtcccc tcagcaggac 5580
gtccttgccc tccggaccac aaggtgctca cacaaaagga ggcagtgacc ggtatcccag 5640
gcccccaccc aggcaggagc tggccctgga gccaaccccg tccacgccag cctcctgaac 5700
acaggcgtgg tttccagatg gtgagtggga gcatcagccg ccaaggtagg gaagccacag 5760
caccatcagg ccctgttggg gaggcttccg agagctgcga aggctcactc agacggcctt 5820
cctcccagcc cgcagccagc cagcctccat tccgggcact cccgtgaact cctgacatga 5880
ggaatgacgt tgttctgatt tcaagcaaag aacgctgctc tctggctcct gggaacagtc 5940
tcggtgccag caccacccct tggctgcctg cccacactgc tggattctcg ggtggaactc 6000
gacccgcagg gacagccagc cccagagtcc gcactgggga gagaaggggc caggcccagg 6060
acactgccac ctcccaccca ctccagtcca ccgagatcac tcggagaaga gtctgggcca 6120
tgtggccgct gcaggagccc cacagtgcaa gggtgaggat agcccaagga agggctgggc 6180
atctgcccag acaggcctcc cacagaaggc tggtgaccag gtcccaggcg ggcaagactc 6240
agccttggtg gggcctgagg acagaggagg cccaggagca tcggggagag aggtggaggg 6300
acaccgggag agccaggggc gtggacacag ccagaactca tcacagaggc tggcgtccag 6360
tcccgggtca tgtgcagcag gaacaagcag ccactctggg ggcaccaggt ggagaggcaa 6420
gacgacaaag agggtgcccg tgttcttgcg aaagcggggc tgctggccac gagtgctgga 6480
cagaggcccc cacgctctgc tgcccccatc acgccgttcc gtgactgtca cgcagaatct 6540
gcagacagga agggagactc gagcgggagt gcggccagag cctgcctcgg ccgtcaggga 6600
ggactcccgg gctcactcga aggaggtgcc accatttcag ctttggtagc ttttcttctt 6660
cttttaaatt ttctaaagct cattaattgt ctttgatgtt tcttttgtga tgacaataaa 6720
atatcctttt taagtcttgt acttcgtgat gggagccgcc ttcctgtgtc cacgcgcctc 6780
ctgcccccgg tgggaagcac ggtcaggagg aggctggtcc agctgcacct cgggggctcc 6840
ctgcactcgc cccccgcctc ctgcagccac acgcattgcc cgagcgaccc tccctggccc 6900
ctgtcactac atggaccccc ggggcttctc ctcttttcta catggatcc 6949
<210> 141
<211> 330
<212> PRT
<213> Homo sapiens
<400> 141
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr
65 70 75 80
Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
130 135 140
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
145 150 155 160
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
180 185 190
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
210 215 220
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
245 250 255
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
290 295 300
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330
<210> 142
<211> 399
<212> PRT
<213> Homo sapiens
<400> 142
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr
65 70 75 80
Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
130 135 140
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
145 150 155 160
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
180 185 190
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
210 215 220
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
245 250 255
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
290 295 300
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gln Lys Ser Leu Ser Leu Ser Pro Glu Leu Gln Leu Glu Glu Ser Cys
325 330 335
Ala Glu Ala Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr
340 345 350
Ile Phe Ile Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val
355 360 365
Thr Phe Phe Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys
370 375 380
Gln Thr Ile Ile Pro Asp Tyr Arg Asn Met Ile Gly Gln Gly Ala
385 390 395
<210> 143
<211> 4608
<212> DNA
<213> Homo sapiens
<400> 143
cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg 60
gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt 120
ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag 180
gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct 240
acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga 300
ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg 360
catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc 420
cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg 480
ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg 540
ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac 600
cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag 660
taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac 720
cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta 780
gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct 840
tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag 900
gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 960
gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 1020
acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 1080
ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140
ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200
ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260
ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320
tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380
catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440
cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500
gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560
cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620
ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680
cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740
tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800
ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860
ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920
gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980
agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040
gcccactcgg gggcatgcct agtccatgcg cgtagggaca ggccctccct cacccatcta 2100
cccccacggc actaacccct ggcagccctg cccagcctcg cacccacatg gggacacaac 2160
cgactcctgg ggacatgcac tctcgggccc tgtggaggga ctggtccaga tgcccacaca 2220
cacactcagc ccagacccgt tcaacaaacc ccgcactgag gttggccggc cacacggcca 2280
ccacacacac acgtgcacgc ctcacacacg gagcttcacc cgggcgaacc gcacagcacc 2340
cagaccagag caaggtcctc gcacacgtga acactcctcg gacacaggcc cccacgagcc 2400
ccacgcggca cctcaaggcc cacgagccgc tcggcagctt ctccacttgc tgaccagctc 2460
agacaaaccc agccctcctc tcacaaagtg cccctgcagc cgccacacac acacaggccc 2520
ccacacacag gggaacacac gccacgtcac gtccctggca ctggcccact tcccaataca 2580
gcccttccct gcagctgagg tcacatgagg tgtgggcttc accatcctcc tgccctctgg 2640
gcctcaggga gggacacggg agacggggag tgggtcctgc tgagggccag gcctctatct 2700
agggccgggt gtctggctga gtcccggggc caaagctggt gcccagggcg ggcagctgtg 2760
gggagctgac ctcaggacac tgttggccca tcccggccgg gccctacatc ctgggccccg 2820
ccacagaggg aatcaccccc agaggcccaa gcccaggggg acacagcact gaccaccccc 2880
ttcctgtcca gagctgcaac tggaggagag ctgtgcggag gcgcaggacg gggagctgga 2940
cgggctgtgg acgaccatca ccatcttcat cacactcttc ctgctaagcg tgtgctacag 3000
tgccaccgtc accttcttca aggtgaagtg gatcttctcc tcggtggtgg acctgaagca 3060
gaccatcgtc cccgactaca ggaacatgat aaggcagggg gcctagggcc accctctgcg 3120
gggtgtccag ggccgcccag accccacaca cgagccgtgg gccatgctca gccaccaccc 3180
aggccacacc tgccccctga cctcaccgcc ctcaacccca tggctctctg gcttcgcagt 3240
cgccctctga gccctgaaac gccccccttc cagaccctgt gcatagcagg tctaccccag 3300
acctccgctg cttggtgcca gggcactggg ggccaggtgt cccctcagca ggacgtccct 3360
gccctctgga ccaccaggtg ctcacacaaa aggaggtaac cggcatccca ggcccccact 3420
caggcaggac ctcgccctgg agccaacccc gtccacgcca gcctcctgaa cacaggcatg 3480
gtttccagat ggtgagtggg agcatcagtc gccaaggtag ggaagccaca gcaccatcag 3540
gccctgttgg ggaggcttcc gagagctgcg aaggctcact cagacggcct tcctcccagc 3600
ccgcagccag ccagcctcca ttccgggcac tcccgtgaac tcctgacatg aggaatgagg 3660
ttgttctgat ttcaagcaaa gaacgctgct ctctggctcc tgagaacagt ctcggtgcca 3720
gcaccacccc ttggctgcct gcccacactg ctggattctc gggtggaact cgacccgcag 3780
ggacagccag ccccagagtc cgcactgggg agagaagggg ccaggcccag gacactgcca 3840
cctcccaccc actccagtcc accgagatca ctcagagaag agcctgggcc atgtggccgc 3900
tgcaggagcc ccacagtgca agggtgagga tagcccaagg aagggctggg catctgccca 3960
gacaggcctc ccacagaagg ctggtgacca ggtcccaggc gggcaagact cagccttggt 4020
ggggcctgag gacagaggag gcccaggagc atcggggaga gaggtggagg gacaccggga 4080
gagccaggag cgtggacaca gccagaactc accacagagg ctggcgtcca gtcccgggtc 4140
acgtgcagca ggaacaagca gccactctgg gggcaccagg tggagaggca agacgacaaa 4200
gagggtgccc gtgttcttgc gaaagcgggg ctgctggcca cgagtgctgg acagaggccc 4260
ccacgctctg ctgcccccat cacgccgttc cgtgactgtc acgcagaatc cacagacagg 4320
aagggaggct cgagcgggac tgcggccagc gcctgcctcg gccgtcaggg aggactcctg 4380
ggctcactcg aaggaggtgt caccatttca gctttggctt ttcttcttct tttaaatttt 4440
ctaaagctca ttaattgtct ttgatgtttc ttttttgatg acaataaaat atccttttta 4500
agtcttgtac ttcgtgatgg gagccacctt cctgtgtcca cgcgcctcct gcccccggtg 4560
gaaaacacgg tcaggaggag gctggtccag ctgcacctcg ggggatcc 4608
<210> 144
<211> 330
<212> PRT
<213> Artificial
<220>
<223> Amino acid sequence of the short (sIgG) isoform of the
gamma-chain constant region encoded by plasmid pmIgGdelta-A
<400> 144
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr
65 70 75 80
Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
130 135 140
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
145 150 155 160
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
180 185 190
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
210 215 220
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
245 250 255
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
290 295 300
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330
<210> 145
<211> 399
<212> PRT
<213> Artificial
<220>
<223> Amino acid sequence of the long (mIgG) isoform of the gamma-chain
constant region encoded by plasmid pmIgGdelta-A
<400> 145
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr
65 70 75 80
Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
130 135 140
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
145 150 155 160
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
180 185 190
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
210 215 220
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
245 250 255
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
290 295 300
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gln Lys Ser Leu Ser Leu Ser Pro Glu Leu Gln Leu Glu Glu Ser Cys
325 330 335
Ala Glu Ala Gln Asp Gly Glu Leu Asp Gly Leu Trp Thr Thr Ile Thr
340 345 350
Ile Phe Ile Thr Leu Phe Leu Leu Ser Val Cys Tyr Ser Ala Thr Val
355 360 365
Thr Phe Phe Lys Val Lys Trp Ile Phe Ser Ser Val Val Asp Leu Lys
370 375 380
Gln Thr Ile Val Pro Asp Tyr Arg Asn Met Ile Arg Gln Gly Ala
385 390 395
<210> 146
<211> 53
<212> PRT
<213> Homo sapiens
<400> 146
Leu Trp Thr Thr Ile Thr Ile Phe Ile Thr Leu Phe Leu Leu Ser Val
1 5 10 15
Cys Tyr Ser Ala Thr Val Thr Phe Phe Lys Val Lys Trp Ile Phe Ser
20 25 30
Ser Val Val Asp Leu Lys Gln Thr Ile Val Pro Asp Tyr Arg Asn Met
35 40 45
Ile Arg Gln Gly Ala
50
<210> 147
<211> 34
<212> PRT
<213> Homo sapiens
<400> 147
Ala Gly Thr Thr Asp Ala Ala His Pro Gly Arg Ser Val Val Pro Ala
1 5 10 15
Leu Leu Pro Leu Leu Ala Gly Thr Leu Leu Leu Leu Glu Thr Ala Thr
20 25 30
Ala Pro
<210> 148
<211> 4551
<212> DNA
<213> Artificial
<220>
<223> DNA sequence of the gamma-chain expression cassette constant
region, from CH1 to 3'UTR of expression plasmid pIgG-GPI-B
<400> 148
cctccaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc acctctgggg 60
gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg acggtgtcgt 120
ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta cagtcctcag 180
gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc acccagacct 240
acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa gttggtgaga 300
ggccagcaca gggagggagg gtgtctgctg gaagccaggc tcagcgctcc tgcctggacg 360
catcccggct atgcagcccc agtccagggc agcaaggcag gccccgtctg cctcttcacc 420
cggaggcctc tgcccgcccc actcatgctc agggagaggg tcttctggct ttttccccgg 480
ctctgggcag gcacaggcta ggtgccccta acccaggccc tgcacacaaa ggggcaggtg 540
ctgggctcag acctgccaag agccatatcc gggaggaccc tgcccctgac ctaagcccac 600
cccaaaggcc aaactctcca ctccctcagc tcggacacct tctctcctcc cagattccag 660
taactcccaa tcttctctct gcagagccca aatcttgtga caaaactcac acatgcccac 720
cgtgcccagg taagccagcc caggcctcgc cctccagctc aaggcgggac aggtgcccta 780
gagtagcctg catccaggga caggccccag ccgggtgctg acacgtccac ctccatctct 840
tcctcagcac ctgaactcct ggggggaccg tcagtcttcc tcttcccccc aaaacccaag 900
gacaccctca tgatctcccg gacccctgag gtcacatgcg tggtggtgga cgtgagccac 960
gaagaccctg aggtcaagtt caactggtac gtggacggcg tggaggtgca taatgccaag 1020
acaaagccgc gggaggagca gtacaacagc acgtaccgtg tggtcagcgt cctcaccgtc 1080
ctgcaccagg actggctgaa tggcaaggag tacaagtgca aggtctccaa caaagccctc 1140
ccagccccca tcgagaaaac catctccaaa gccaaaggtg ggacccgtgg ggtgcgaggg 1200
ccacatggac agaggccggc tcggcccacc ctctgccctg agagtgaccg ctgtaccaac 1260
ctctgtccct acagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga 1320
tgagctgacc aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga 1380
catcgccgtg gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc 1440
cgtgctggac tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag 1500
gtggcagcag gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta 1560
cacgcagaag agcctctccc tgtctccggg taaatgagtg cgacggccgg caagcccccg 1620
ctccccgggc tctcgcggtc gcacgaggat gcttggcacg taccccctgt acatacttcc 1680
cgggcgccca gcatggaaat aaagcaccca gcgctgccct gggcccctgc gagactgtga 1740
tggttctttc cacgggtcag gccgagtctg aggcctgagt ggcatgaggg aggcagagcg 1800
ggtcccactg tccccacact ggcccaggct gtgcaggtgt gcctgggccg cctagggtgg 1860
ggctcagcca ggggctgccc tcggcagggt gggggatttg ccagcgtggc cctccctcca 1920
gcagcacctg ccctgggctg ggccacggga agccctagga gcccctgggg acagacacac 1980
agcccctgcc tctgtaggag actgtcctgt tctgtgagcg ccctgtcctc cgacctccat 2040
gcccactcgg gggcatgcct agtccatgcg cgtagggaca ggccctccct cacccatcta 2100
cccccacggc actaacccct ggcagccctg cccagcctcg cacccacatg gggacacaac 2160
cgactcctgg ggacatgcac tctcgggccc tgtggaggga ctggtccaga tgcccacaca 2220
cacactcagc ccagacccgt tcaacaaacc ccgcactgag gttggccggc cacacggcca 2280
ccacacacac acgtgcacgc ctcacacacg gagcttcacc cgggcgaacc gcacagcacc 2340
cagaccagag caaggtcctc gcacacgtga acactcctcg gacacaggcc cccacgagcc 2400
ccacgcggca cctcaaggcc cacgagccgc tcggcagctt ctccacttgc tgaccagctc 2460
agacaaaccc agccctcctc tcacaaagtg cccctgcagc cgccacacac acacaggccc 2520
ccacacacag gggaacacac gccacgtcac gtccctggca ctggcccact tcccaataca 2580
gcccttccct gcagctgagg tcacatgagg tgtgggcttc accatcctcc tgccctctgg 2640
gcctcaggga gggacacggg agacggggag tgggtcctgc tgagggccag gcctctatct 2700
agggccgggt gtctggctga gtcccggggc caaagctggt gcccagggcg ggcagctgtg 2760
gggagctgac ctcaggacac tgttggccca tcccggccgg gccctacatc ctgggccccg 2820
ccacagaggg aatcaccccc agaggcccaa gcccaggggg acacagcact gaccaccccc 2880
ttcctgtcca gagctgcaac tggaggagag ctgtgcggag gcgcaggacg gggagctgga 2940
cggggccggc accaccgacg ccgcgcaccc ggggcggtcc gtggtccccg cgttgcttcc 3000
tctgctggcc gggaccctgc tgctgctgga gacggccact gctccctagg gccaccctct 3060
gcggggtgtc cagggccgcc cagaccccac acacgagccg tgggccatgc tcagccacca 3120
cccaggccac acctgccccc tgacctcacc gccctcaacc ccatggctct ctggcttcgc 3180
agtcgccctc tgagccctga aacgcccccc ttccagaccc tgtgcatagc aggtctaccc 3240
cagacctccg ctgcttggtg ccagggcact gggggccagg tgtcccctca gcaggacgtc 3300
cctgccctct ggaccaccag gtgctcacac aaaaggaggt aaccggcatc ccaggccccc 3360
actcaggcag gacctcgccc tggagccaac cccgtccacg ccagcctcct gaacacaggc 3420
atggtttcca gatggtgagt gggagcatca gtcgccaagg tagggaagcc acagcaccat 3480
caggccctgt tggggaggct tccgagagct gcgaaggctc actcagacgg ccttcctccc 3540
agcccgcagc cagccagcct ccattccggg cactcccgtg aactcctgac atgaggaatg 3600
aggttgttct gatttcaagc aaagaacgct gctctctggc tcctgagaac agtctcggtg 3660
ccagcaccac cccttggctg cctgcccaca ctgctggatt ctcgggtgga actcgacccg 3720
cagggacagc cagccccaga gtccgcactg gggagagaag gggccaggcc caggacactg 3780
ccacctccca cccactccag tccaccgaga tcactcagag aagagcctgg gccatgtggc 3840
cgctgcagga gccccacagt gcaagggtga ggatagccca aggaagggct gggcatctgc 3900
ccagacaggc ctcccacaga aggctggtga ccaggtccca ggcgggcaag actcagcctt 3960
ggtggggcct gaggacagag gaggcccagg agcatcgggg agagaggtgg agggacaccg 4020
ggagagccag gagcgtggac acagccagaa ctcaccacag aggctggcgt ccagtcccgg 4080
gtcacgtgca gcaggaacaa gcagccactc tgggggcacc aggtggagag gcaagacgac 4140
aaagagggtg cccgtgttct tgcgaaagcg gggctgctgg ccacgagtgc tggacagagg 4200
cccccacgct ctgctgcccc catcacgccg ttccgtgact gtcacgcaga atccacagac 4260
aggaagggag gctcgagcgg gactgcggcc agcgcctgcc tcggccgtca gggaggactc 4320
ctgggctcac tcgaaggagg tgtcaccatt tcagctttgg cttttcttct tcttttaaat 4380
tttctaaagc tcattaattg tctttgatgt ttcttttttg atgacaataa aatatccttt 4440
ttaagtcttg tacttcgtga tgggagccac cttcctgtgt ccacgcgcct cctgcccccg 4500
gtggaaaaca cggtcaggag gaggctggtc cagctgcacc tcgggggatc c 4551
<210> 149
<211> 330
<212> PRT
<213> Artificial
<220>
<223> amino acid sequence of the sIgG isoform of the gamma-chain
constant region encoded by plasmid pIgG-GPI-B
<400> 149
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr
65 70 75 80
Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Pro
100 105 110
Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys
115 120 125
Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val
130 135 140
Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp
145 150 155 160
Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr
165 170 175
Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp
180 185 190
Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu
195 200 205
Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Ala Cys Pro Gly
210 215 220
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
245 250 255
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
290 295 300
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
325 330
<210> 150
<211> 380
<212> PRT
<213> Artificial
<220>
<223> amino acid sequence of the long isoform of the gamma-chain
constant region including the carboxy-terminal signal peptide of
the human placental alkaline phosphatase encoded by plasmid
pIgG-GPI-B
<400> 150
Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys
1 5 10 15
Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr
20 25 30
Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser
35 40 45
Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser
50 55 60
Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr
65 70 75 80
Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys
85 90 95
Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys
100 105 110
Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro
115 120 125
Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys
130 135 140
Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp
145 150 155 160
Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu
165 170 175
Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu
180 185 190
His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn
195 200 205
Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly
210 215 220
Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu
225 230 235 240
Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr
245 250 255
Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn
260 265 270
Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe
275 280 285
Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn
290 295 300
Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr
305 310 315 320
Gln Lys Ser Leu Ser Leu Ser Pro Glu Leu Gln Leu Glu Glu Ser Cys
325 330 335
Ala Glu Ala Gln Asp Gly Glu Leu Asp Gly Ala Gly Thr Thr Asp Ala
340 345 350
Ala His Pro Gly Arg Ser Val Val Pro Ala Leu Leu Pro Leu Leu Ala
355 360 365
Gly Thr Leu Leu Leu Leu Glu Thr Ala Thr Ala Pro
370 375 380
<210> 151
<211> 2061
<212> DNA
<213> Homo sapiens
<400> 151
gtacacactg taacttctcc tctcgatgtc ctgccctcgc cacgggcacg gggggagcat 60
gcatttccag gcttggggag acacagaggc aggagagctg gaagaatggg ctcctgcctg 120
cctggtgcca catcctgccc cagctttgag ggctgaatcc tctcagctca gagaagagct 180
tccctagttt tgcaggcgca cggaggcctc ccacccgtac acctgcctct gctctccccc 240
tggccattgc aatgcatgcc cgggatctgg gtttaccctg cagcccgact cctccagggc 300
aggctccttc cgtccttggg tccagcagcc tcccccctcc gctgggtact gagcatctga 360
aaagtctcag atagggccct acacctcttc tcccttctca agtgctcagc ccaggggtgg 420
ggcttgctgc ttgcaaagag cagcccaccc tcctgtactg ccatcctatt gcctttgaag 480
aaggaggtca gcctggacag gtgaactgag ttgccttcag aaaggcctgt ctcaggcagc 540
cgcagcaggc ttcacgatgt ccatgtatcc tgtttgcctg ctgccgtctc tcctctccca 600
agaggggagg tctgcgtgtt gagccaggga ggaaggagcc tgcagcctgc tcagggtggt 660
ggctggtgac tgcggggcca gggcttgctg ctgtctctcg gaatgtcctg catgtgggtc 720
tggctgttcc tgctggcact gccctcttct ctctcccctc ctttcccact ctgccctgct 780
tgcccgtcag ggtctccgga tgcccctgct ggaggcagag aagcgttctg tttttatcat 840
cgtccctgtc ttggtcctgt ccgtgctccc catgtgctcc caatcagttg tcttcgttcc 900
tcaacatcag ggaaagaaaa aacagcaaca cttctccctg tcatcagctc tgctgtctcc 960
ttgtcaggcc ttgggacgtt ctctgggctc agtctagggt cgtgcctcat gcctcatgcc 1020
tctctgggaa ggttcccagg ggcgccgcct ccatggttgg ctggtgggtt ttaaagggga 1080
aggttgggag gaggcctgtg gaaggaggag ggccgtccac acccgtgggg caaagcgtgt 1140
tccatgaaac cagtgctgtg cgtgctggga tgaaagcctc ccagcctctc gtgctgaagg 1200
gaaaggtgga ccgaactggc ttagctgctg tggcaatggg gtggggggtg agtcctaatc 1260
agaaggtggg agaagagaat aacaaaatgg aactccgccc cctgccgcca catttcctta 1320
agttttagga gttggggcct atgagtagaa tttgaaagaa ctaccaaaaa agcttatttt 1380
tggaaattaa gtcagctttg cctgtggttt ggctaggaat aaatatttac ctgtgtgccc 1440
ctacagagat gacacagacc caaagtggga cattgagcaa ggcacaggct ggttcccctc 1500
ctgtcctctg tcctcattct gtgagtgcca ccatcaccag gtactgtggc ctgcagaaat 1560
aaacgaggca ccaaccctgc cctcagggac cccgtgtctt cttagggaca gaggactcag 1620
aaacatctgt gtccccgcat gttaagtgca tgcacacagt gctgaggctt tgcagagaag 1680
ggccatggct ccctgaggag accaagaaag gcacatagaa gtgacttctc agctggccct 1740
tgcaggatcc ctgggtgcct gtacctctcc agtccagctg agcaaggagg ctcaggaatt 1800
aatgaagatg gggcttgtgt agcacgatgg ttctaggcca tcccttttcc atggctcaag 1860
tccattgaag gcagcctcca aaatcagggg gttgcctgat cctcctagtg ccacaatccc 1920
agtcctagct agaacttgcc atggttcttc tccctaaaag ttcccagggg acaggagaca 1980
ggtgttgctt ttctaatgga gcgggacctc gcatggacgg ggccctccaa gcctgctaac 2040
accctgttcg cactgactca g 2061
<210> 152
<211> 2726
<212> DNA
<213> Mus musculus
<400> 152
tacgttcaat ggcagtggat cttaaagacc ttttggatct aagaccagaa gccatctctg 60
actcccctct caccttccag tttcttccaa atcctctggg ccagccagag gtctcagatt 120
ctgccctctt gccctgtgcc caccttgttg accactggac agcatatgtg atggctactg 180
ctagtgccag cttcacaaga ggttaacact acggactagc cattcttcct atgtatctgt 240
ttctgcaaat acagccgctt tacttaagtc tcagcacttc ttagtctcct cttttcctct 300
cagtagccca aggggtcatg tcacaaacat ggtgtgaagg gctactttgt caaatgaaaa 360
ggtctatctt ggggggcatt tttttctttt ctttttttct tgaaacacat tgcccagcaa 420
agccaataaa tttctctcat cattttgttt ctgataaatt cttactattg attgaaatgc 480
ttccctgagg aacattaaat tatgtatgaa tttccattca aagtcatcat gcagcagtgg 540
tatcaagcag gcagcatcta gtgcagaact gagattgtct acagaatgcc tgcttgatgc 600
tcagccttat atcccagtta cggacatgtc tacaaatagc ccttctctta ccatctctcc 660
cttaacttca tgatgtggta gctgattcct tctgccatca actgaaatgg caaaataaag 720
gaaagcctga atcctgtctc ccctcttagt ttccaaggac acttgcccag aaaaatgcgc 780
cccccccccc ccgtatcccc aggcagcatc caggactttc ttaaatggtt ctctgtacaa 840
tcccaccttt aaaacagtca gtgaccattc tttgtaatca ttactttatt aatggttttc 900
ttttctaaac cacctgcctt tgctgttgta gcttctcaat acatgctctg agacaaatca 960
ttccttatat attccaatat tgctgaaaac tcattaattt ttactaatag ggggttgttt 1020
tctaaagctc aggaaatgac ttgtactccc taagtaggaa atgttgcaaa ccaccatttc 1080
atgatgtaca gttgattcaa ttaagtcagg tctgtgagga ctttggttcc ttatctatat 1140
gtaaataatg ctgataccaa atctttgcta ttcattaaca tgtaatcttg caaataataa 1200
taaatttaac agaaactcaa attgaggtag attcttaagg ataatagctt tcagcctagc 1260
cataaaagaa atgaaaaaat agtctttaaa gatcccaaat tcagaattag taatattaat 1320
tcagatagtc cttcgtaaga ttgaaaaaca tgacttctga tttctcatct ttccaaagtt 1380
agacttgacc ttggtgagat ggcaaagtta aaaaattcct ggggtttaag gatatattgg 1440
ggcaacagtc acagcaacgg tgatgctttt tatatctaaa tcctgtcagg ttttgtttcc 1500
actgagctca ttcattcacc tagggatctc attaaaagta ggggaccggg ctggtgagat 1560
ggctcagcag gtaagagcac ccgactgctc ttccgaaggg cctgagttca aatcccagaa 1620
accacatggt ggctcacaac catccgtaac aagatctgac tccctcttct ggtgtgtctg 1680
aagacagcta cagtgtactt acatataata aataaataaa tcttaaaaaa aaaaaaaaag 1740
taggggaccc tatcagaggt ctcaatgtgc ctggaaggtc tcccaacatg gctgtgggaa 1800
aatgcctgac aatttttttt caattgcatg tgtgttctcc gagaaaggat aagatgcaag 1860
tttatataag aagcaggatt tacttatact aaaatgcctt acacgtaagg ttcaggtagc 1920
atcgtggcag agagggtaga aagactgtaa gagccagagg accaggatgt ccgctcttag 1980
tgtcttctat atatgaaaga aagctgtacc cgtgaattct caaacagttg tctacatatc 2040
acctgcacaa tggccgttct ggaaatctaa aaaaaacaaa aaacaaacaa acaaataaat 2100
aaataaataa atatcaaaaa atcaaaaacc acccctagat gaaaagctac aagtaattaa 2160
aagctgctaa aagggggaga atcaattttc tccagagaca agtccctgat aggtcatcca 2220
atttcgggtg atcagcccta agcacataca catataagca atactaaacg gacacagctg 2280
gtctatatac ttacaacttg gggcttgaag gaagttggtg gggaaggggg gagagtagta 2340
atgatgtatg taaatacagt actcatgtac gaaactcccc aaaaataaag aattcttaaa 2400
attattaaaa actggtattc ttgtcttgga ctattttctg aattttatat taatattttc 2460
atcatcaaaa gactataaaa tgattataat aatgagagaa gttcagatga aacatcaact 2520
gtcttaaatg tagaaaagga aactgacttc aggcagagaa gctaaaaatg ttggcaacct 2580
tgccttggga cttagccacc agtcatttcc tctatataag tcacccatat cccaatttct 2640
gagataattt taaatgttat cactgtgtca aaggtgcagg acatgtatgg aatgcccata 2700
ttaccttctc ttgtctctca ttccag 2726
<210> 153
<211> 5686
<212> DNA
<213> Homo sapiens
<400> 153
gggtgagttg gcagcaacat ctcttggttt aagagttcca gcacagcgat agtactttct 60
agccacatct cagcaaggaa actaggctat tgccacctgc tcttaagagg cttgaacaca 120
ggtgttaact cctgattgaa atgaacaaag ataggagaag attaggggga aaatctgtat 180
ccttgctgga aaccagggca gtgcacatat aaagagtatg ctgttcactg gatgggaagg 240
aaaaaaactt agaagtgtag tagtcaaagc acacaaacaa ccctaaccca gagtagacat 300
tgctggaaga aagggaagac catgtagcag ctgtgtgaga gaatgaatct taatgataac 360
agcatgatcc cttgctaggg ctgccatcaa aaagtacagg ccttcctcgt tttattgtac 420
ttcgcagatg ttatgctttt tacaaattga acgcttgtgg gaacgctgtg taagcatgtt 480
cgtcggcatc atttatccaa cagcgtgtgt tgacttcgtg tctctgtgta gcattttgat 540
tattctcaca gtatcccaga tgttttcatt attatcatgt ctgtgatagt gatctgtcat 600
cagtgatctt tgatgttact attgtcattg tttggggtcc ctacgaactg cacccatata 660
agacagaaaa cttaatcaat aaatgtgcgt gctttgactg ctccatggac tagacattcc 720
ccttctgtct ccctctcttc aggactccct aatccctgag acacaataat actaaaatga 780
ctccaattaa taaccctaca atagccttta agtgttgaca tgaagggaag agtcatgcat 840
ctcttacttt aaatcaaaag ctagagatga ttaagcttac tgaggaagat acgttgaaaa 900
ccaagatagg ccaaaagcca ttcctcatgt gccaaacagc tagaaagttg taaaggcaaa 960
gtaaaaatac ttgaaggaaa tttaaaatgc tcttccagtg aacacatgta tgataagaag 1020
gtaaaacagc cttattgctg atatggaaga agttttagtg gtctagacat aagatcaaac 1080
tagaaacatt tcctgaagcc aaagcgtaat cctgagcaag gccgtaactc tcttcaattc 1140
tgtgaaggct gacagaagct ggaagctagc agaatttggt tcctgaggtt taaggaaaga 1200
agccctctcc ataacataaa ggtccaaggt gaagcagcca gtgctcatat agaagttgca 1260
gcaagttatc tagaaaatct agctaagatc actgacgaag gtgttacact aaataacaga 1320
ttttccatgt agacaaaaca gccatctatt ggactttcat agctagagag gagaagccaa 1380
tacctgggtt caaagcttca aagaacaggc tgacttttta ggagctaatg ccgctggtga 1440
ctttgagttg aagccaatgt tcaccgacca ttctaaaaat cctagggccc ttaagcatta 1500
agttaaatat accttgcctg tgtctataaa tggaagaaca aagcctgatg acagaggtat 1560
gtttgcggca tagtttactg aatattttaa gcccactgtt gagatctagt gctcagaaaa 1620
acagattcct ttcaaaatat tactgctcat tgacattgca cctaagcagc caagagctct 1680
aatggagaag gacatggaga tgaatggagt tttcctgcct gctaacaaca gcagccattc 1740
tgcagcccat ggctgaagga gtaattttga ctttcaagtt tcactattta agaaatacat 1800
tttgtaaggt gagtccccac agacagtaat tcctctgatg gatctgaaca aaataagttg 1860
aaaactgctg gaaagaattc atcattctac ataccattaa gaacattcgt gattcatggg 1920
aagagcttaa aatatcaaca ttaataggag tttggtagaa gttaattcca accctcatgg 1980
ctgactttga gaggttcaag acttcagcgg aggaaataac tgaagatgtg gtgaaaatcg 2040
caagagaact acaattagaa gtggagcctg aagacgtgac tgaattgcga caaattcatg 2100
atcaaacttg aacagatgag gagttgcttc tcatgaatca gcagagaaag tggttttttt 2160
gaggtggagt gtcttcctgg tgatgatgac atgagcattg tgaaaatgac cacaaaggat 2220
acagaatatt acaaaaactt aggtgataaa gcagcagcag tatcgggagg attaactcca 2280
attttgaaag cagttcagag ggtaaaatgt tatcaaacag cattgcatgc tagaaaaatc 2340
ttttgtgaaa ggaagagtcc atcaatacag caattttatt gctgtctcag cttaagaaat 2400
tgccacagcc accccagcct tcagcaacca ccaccctgat cagtcagcag ccatcaacct 2460
tgaggcaaga ccctccacca acaaaaagat tacaaattat tgaaggtcag ataatcttta 2520
gtattttctt atcaataaac ctttttttaa agtatgactt tgtttagaca taatgctatt 2580
tcacacttaa tagactaccg tatagtataa acacaacttt tagactcact gagaaatcaa 2640
aaaattcatc tgactcattt gttgtgatat gtgttttatt gtggtggtct ggaactgaac 2700
ctgcaatata tttgaggaat gtctgtaaca cgaagtgggc ggcttaatac aacagaagtt 2760
tttggagttc cattctagag actggaaatc caaaatcaag gttttgggag ggccacgctc 2820
cctctgaatc ctgtagggaa ggatccttca ttgcatcttc cagcttctgg agccacaggc 2880
cttccttggc atgtggcagc agaactccaa tttctgtctc tgtcctcata tggccatctt 2940
ccctctgggt ctgtgtcctc atatgctgtt ctctctgtgc atgtctgttt ccaaagtttt 3000
cccttttaat aaggacacca gtcacactgg attagggcct accttcatga cctcacctta 3060
acttgattgc gtctgcaaag atcgtatttc caaataaggt cacatccaca gggactggag 3120
gttaagactt cagcatactc aggggagaca caattcaacc tataacagag cccctttgaa 3180
aatgtcaggc atcaggtgct cacagcacac ggtccagctg ttggtgctca cccttgctca 3240
gcacacggtg gaggctctgc ctcaatctca ttcttcatgg gaacagctaa gccaggtagc 3300
gaatacgagt tacgtttgtg tcaccacagc agacactgaa aggaagtttg tggtgtccag 3360
cacatttgcc agcataggcc tcacagacca caacacctag aatctgacaa aaattagaat 3420
aaatccgatg tctccttttc tctctttttt taagcatttt taaatacaat tggtaaattt 3480
cctgactgta ccctactcat cttgcattgc tgaataagtg aggaacctct ctatggcatg 3540
aagcagaaaa ccattgagct tatgagaaga aacaggaaat acatgtaaaa gagaccagtc 3600
tgaaaaatca ggagaaattt tacaaaagag atttactgcc aagaaaccag ggaaactttc 3660
agaacactct ccttttcata tttgtaacaa gattcaattg tacaaatact tctgtgaaac 3720
tagccatgaa gtgtgtacat gaatgaatat atgtattcag tgtgtttata tatttcattt 3780
catacatgtg atctatatca tatatatata tatatatata tatatatatc acaatgaata 3840
ttgcagaaaa ttaaagcaaa gagtaagaag agttaaccaa atgttccctg aatgcagtgg 3900
gaaaagatga aaaggagaag acaggcaagc acagtggctc acacatgtaa tcccaacata 3960
ttgagaggcc ggggcaagag gatcacttga gcccaggagc tcaagaccag cctggacaac 4020
atggcaaaaa cccatctcta caaaaaagta taaaaattag ctgggcatgg cagcatgtga 4080
ctgtagtcac agctaggcag gagaatgaag tgggaggatc acctgagccc aggaggctga 4140
ggcttcagtg agccttgatg gcaaccctgc actccagcct ggatgacaga atgagaccct 4200
gtctcaaaaa aggaaaaaga gaagacatat gtaacacagt gtcaggattc aaaatacatg 4260
tagcaaaaat tccagaaggg taagcaaata agcccatacc tagccatcac tagggaaact 4320
tctgtgtttc agggatagag aaaaaaactc tgattccaga aataaaatgt gaaaatataa 4380
tacccgcaaa agaaataaat ttattgacac cacattgatt ctatattgta taagatatat 4440
tgtataacac taaattgtag aagatagcac ttctcttgag ccaagctaat atgcacacct 4500
agaggctcca ggtacacatt aaaggataag caaagacaca aaaattgtac catttaagta 4560
tgtttcccag gcaattcata agcaaatttt taaaaaggag aatgatgaat tccaaaggaa 4620
atctcaatga gataggatgt aggtaaaaag aaaaaacaac aataaaaaaa acatacacac 4680
aaaatcttgg caatgtaata ataatttatt aataatctct ctaaactcat agaatatatc 4740
aataaaacta gaaaatgtga gacagcaaga aaagataggc tagacttaca ttacagaaaa 4800
gatgagtaga ctgactatat agagtttgac tctaaaattg agaaaagagg tttaaatatg 4860
tgtcacgtgt atatgtataa tatacatgca cacatataaa atgaaattcc tcactggaaa 4920
aaatattaag tttaatttcc aaattattag aatgactaaa acagttgaat ctatctgttc 4980
catatagtaa ttgaggggga aggaaaagga atagcaagga atccattttt ctcttccacc 5040
agaaataagc tccctcatgt ttgggtcagg tcactttatt cattgctttc tccacatcct 5100
catcattagg catcatgaaa tcaatgaaaa ggcagtgaaa gaatgatgat gaaagctaat 5160
caaatgtatc atttacctca atacgtttgg tttaatcttc ttgttgaaag acaaattctc 5220
ctagacagga tcaaaagcaa catatcttgt atttataaaa aacatgtctc aagtaaaatg 5280
acatagtatt atacacacac acacacatac acacacacac acacattaag ggaaaatgca 5340
gacaaaaaat ggcagaaata atatttagag aaagatagaa tttaagaaaa aaaattgtca 5400
aacaggtctg caaaataatt gttttatttt ggtgccagtt acagtccgca atgaagcgaa 5460
gatattaaga agcaaagtgg gccaggagaa attagagcag aaatatctct ttcaatagtg 5520
agagaatagg aaaaagaagt agaaaagctg ggaacaatag gtaaagttta ggctaggcct 5580
tagacttctc ctgcattgta atccctctgg tttgccacat atgcatgctg tcaggaagtt 5640
gatgaggtat gtacagcaca atttattttc cattttttgc ctttag 5686
<210> 154
<211> 1260
<212> DNA
<213> Mus musculus
<400> 154
gtgagtatca gggtcgtagg ctgtgaggat ctctacagcc gtgtatattc tctgttcaga 60
aattccctct ggctgaccgt ggcgttttcc gttctaggat gcctctaact atacatccct 120
gtggctgtgg tgtggtgatc cgagggctgc actaacacac agatttctgt ggttgtcact 180
gttcagggcc acagaatgac tgagtcttct ttctatacag tatgcagtag ctggatagtc 240
aggactgggg aaggttgtgt gaggttgact cggtggtacc gctgaggagg aaaagggctt 300
gtccagagca ggcgtgatgt acagcgcaca ttgttttttt cagcaagtaa tgaaaatctg 360
tgactgagtg accttggggg ctgcggtggt gaggagagct cacgggaatc ctggagcagt 420
gtagctggcg tgtcaaaagc agaaacgcag gagatgggtc agtgcgccga ggcccggagt 480
ttaaatcccc agagcccacg taaaagcctt gcgcagtagc acgcatgcgt aatcctgatg 540
gagcaattag gagaagccgg tggccggcta gcctgtgcag actgtgaaaa cagagcatct 600
gaagctgtgt gaaaggctag ctcgcctgtg ctcctcagat cctgacatac gccatctcga 660
gcaaaagatt aacaatcgat taaaacccac acatgaaaac aaagaaacca gttagctcca 720
gataaaagca aatgccagga aggaaaggag gcagagggca ggggtggagg agcaggtggg 780
agaggatgac gtcagagaaa tctcagtggc cgtgaacaag gaagatattc cagggcttgt 840
tctgaatgtg tgatctttta aaccatgtgg ccctcttagc ctgtgagaaa agtccatttc 900
tagccctgct gaacagagaa gcccagggga gcaaccaact ggccttcggt cactcagcaa 960
ggacctagta gaggctggct ttgaacttga gccctccagg gcacttgacc tctgagcttt 1020
gggaaaacaa gcgaggcagc ttcacgctgt tgtgatctgg acttggatca gggccagtga 1080
ggacagggac agggatgggt gtgataagga cttggtgtgt aagagggaga gttggggaga 1140
caggtgggag ggctatctgt agccaggtaa ccaagggtcc caggggaacc cccagtgtgg 1200
acgcggactg cacatgacac agggcggcct ccccattcat gactgttttt ctccttgcag 1260
<210> 155
<211> 2627
<212> DNA
<213> Homo sapiens
<400> 155
gtaaacccac ccatgtcaat gtgtctgttg tcatggcgga ggtggacggc acctgctact 60
gagccgcccg cctgtcccca cccctgaata aactccatgc tcccccaagc agccccacgc 120
ttccatccgg cgcctgtctg tccatcctca gggtctcagc acttgggaaa gggccagggc 180
atggacaggg aagaataccc cctgccctca gcctcggggg gcccctggca cccccctgag 240
cctttccacc ctggtgtgag tgtgagttgt gagtgtgaga gtgtgtggtg caggaggcct 300
cgctggtgtg agatcttagg tctgccaagg caggcacagc ccaggatggg ttctgagaga 360
tgcacatgcc ccggacagtt ctgagtgagc agtggcatgg ccgtttgtcc ctgagagagc 420
cgcctctggc tgtagctggg agggaatagg gagggtaaaa ggagcaggct agccaagaaa 480
ggcgcaggta gtggcaggag cggcgaggga gtgaggggct ggactccagg gccccactgg 540
gaggacaagc tccaggaggg ccccaccacc ctagtgggtg ggcctcagga cgtcccactg 600
acgcatgcag gaaggggcac ctccccttaa ccacactgct ctgtacgggg cacgtgggca 660
caggtgcaca ctcacactca catatacgcc tgagccctgc aggagcggaa cgttcacagc 720
ccagacccag ttccagaaaa gccaggggag tcccctccca agcccccaag ctcagcctgc 780
tcccctaggc ccctctggct tccctgtgtt tccactgtgc acagatcagg caccaactcc 840
acagacccct cccaggcagc ccctgctccc tgcctggcca agtctcccat cccttcctaa 900
gcccaactag gacccaaagc atagacaggg aggggccacg tggggtggca tcagaagcag 960
gccagtgaga cagggcctgc ccagggccct ctgcatgcct ctggcttctg cctggggctc 1020
ccaggagtgt aagaacagtc ccacaaccac tgtggggaca cctggcaccc agactcccac 1080
aagggggcag tggggcccct gctcgtgcct tagacatctt ccgggcctcc ccagggcccc 1140
ccgccttctg gctgcctccc tctgctctca gggccaaggt gaggtggagg ccactgtcac 1200
ccctgagggt ccagtcacca gagggtaatt gagagcaaca ggtcactcgg ggaagccctg 1260
ccacagagaa gccctccagc ccatgggacc caggacctgg cccaggggag gggcttttaa 1320
agagaggggg aaagagggag aatcaacaga tgaggggctg aaccagcaga cagagatcag 1380
gcagacacat gggtagatcc taggacatat aatgaatgga tgggtggatg gaggattggt 1440
agacggagga tggatgggtg ggtaaatggc tggatggagg atggacagat ggatatatga 1500
tggatggatg aaggacgggt ggatggagga tggatgagtg gatgaatgaa ggatggaaga 1560
tggatggatg gatgggtgga tggactgatg gatgatggat ggatggatgg atggatgatg 1620
gatggatggg taggcggatg gaggatggaa gggtggatgg aggatggaag atagatggag 1680
gggtgaatgg aggatgggtg gactgacgga ggattgagga tactggggtg ggtgggtggg 1740
tagatctatg gaggataggt gtatggaaga taattggatg gagaattgct ttatgaatgg 1800
atgaatgaag agatggaaaa tagctttata gatggatggg tgaatggatg gatggataga 1860
tggaagaagg atgaatggat ggaaaatagc tttatagata tatgggtgga tatttaagtg 1920
atagccttac attaatagat gaatggagga tgaatggttg ggtgagtggg taggagtgtt 1980
actgatggag gggtggatat acggataata gctttataga tggatggatg gatagatgga 2040
tggaaggata gaaagacagg tgaatgactg gatgtatcag catatgacaa gcaggtacag 2100
ctgtacatgg gaggtctatg ccctgagacc ctgaggaaaa tgaggatgcc cgtgctggtg 2160
gccctcacct ggccctcgct tgtaacccct cagccacatt ccctgggaag gcaacagagg 2220
cctctggtct tgcccattca acctttggca cactgagtgt cagacccagg tctctgtctt 2280
ggacccagat ctccttgagg gtgggtgtgt ctggtcctct ctggccccgg gacccagtca 2340
ctgaatacgt ggctgggact gagacggggt ggggtgggag gggcgggagg gtacctcggg 2400
ctcaagcttc ccttggagaa gcagatggtg tccactttct gccctgccaa gtctctccct 2460
gaagtgccct aagaatgtca aagacagaag gtcccagccc ctcacctggg actctgcctc 2520
ctcatcctcc ctgggggagt ctcaggcctt agatggggac ccagacccca ctgtccccag 2580
accccaagga agcatagccg ctgttcacac gagtctgggc ctggcag 2627
<210> 156
<211> 1937
<212> DNA
<213> Homo sapiens
<400> 156
gtaaatgacg tactcctgcc tccctccctc ccagggctcc atccagctgt gcagtgggga 60
ggactggcca gaccttctgt ccactgttgc aatgacccca ggaagctacc cccaataaac 120
tgtgcctgct cagagcccca ggtacaccca ttcttgggag cgggcagggc tgtgggcagg 180
tgcatcttgg cacagaggaa tgggcccccc aggaggggca gtgggaggag gtgggcaggg 240
ctgagtcccc ccaggagagg cggtgggagg aggtgggcag ggctgaggtg ccactcatcc 300
atctgccttc gtgtcagggt tatttgtcaa acagcatatc tgcagggact catcacagct 360
accccgggcc ctctctgccc ccactctggg tctaccccct ccaaggagtc caaagaccca 420
ggggaggtcc tcagggaagg ggcaagggag cccccacagc cctctctctt gggggcttgg 480
cttctacccc cctggacagg agcccctgca cccccaggta tagatgggca cacaggcccc 540
tccaggtgga aaaacagccc taagtgaaac ccccacacag acacacacga cccgacagcc 600
ctcgcccaag tctgtgccac tggcgttcgc ctctctgccc tgtcccgcct tgccgagtcc 660
tggccccagc accggggccg gtggagccga gcccactcac accccgcagc ctccgccacc 720
ctgccctgtg ggcacaccag gcccaggtca gcagccaggc cccctctcct actgcccccc 780
accgcccctt ggtccatcct gaatcggccc ccaggggatc gccagcctca cacacccagt 840
ctcgcccact cacgcctcac tcaaggcaca gctgtgcaca cactaggccc catagcaact 900
ccacagcacc ctgtaccacc accagggcgc catagacacc ccacacgtgg tcacacgtgg 960
cccacactcc gcctctcacg ctgcctccag cgaggctact gccaagccct tcctctgagc 1020
catacctggg ccgctggatc ccagagagaa atggagaggc cctcacgtgg tgtcctccag 1080
tccaaccctc cctgtcaccc tgtcagcagc agcaccccac agccaaacac aggatggatg 1140
cgtgggctcc atcccccact cacccacacc ggaaccccag agcaggctac gtgcccctca 1200
cagacctcaa acccacatgt gcatctgaca ccccagatcc aaacgctccc cccggtcatg 1260
cacaccaagg gcacagcacc caccaaatcc acacggaaac acgggcaccg ggcaccccat 1320
gagcacaaag cccctccatg tctgaagaca gtccctgcac accgtcacag ccatacattc 1380
agcttcactc tcacgtccca gcccacctgc acccagctct gggcctggag cagcagaaag 1440
aggtgtgagg gcccgaggcg ggacctgcac ctgctgatga cccgggacca gcaggcagct 1500
cacggtgttg gggaagggag tggagggcac ccagggcagg agccagaggg accaggctgg 1560
tgggcggggc cgggccgggg tagggccagg aggcagctct ggacacccac aggcctgggc 1620
tcatagtcca caccaggaca gcccctcaga gcacccatgc agtgagtccc aggtcttggg 1680
agccaggccg cagagctcac gcatccttcc gagggccctg agtgaggcgg ccactgctgt 1740
gccgaggggt tgggtccttc tctggggagg gcgtggggtc tagagaggcg gagtggaggt 1800
aaccagaggt caggagagaa gccgtaagga acagagggaa aatggggcca gagtcggggc 1860
gcagggacga gaggtcagga gtggtcggcc tggctctggg ccgttgactg actcgggacc 1920
tgggtgccca ccctcag 1937
<210> 157
<211> 1301
<212> DNA
<213> Homo sapiens
<400> 157
gtaaatgagt gcgacggccg gcaagccccc gctccccggg ctctcggggt cgcgcgagga 60
tgcttggcac gtaccccgtg tacatacttc ccgggcaccc agcatggaaa taaagcaccc 120
agcgctgccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct 180
gaggcctgag tggcatgagg gaggcagagc gggtcccact gtccccacac tggcccaggc 240
tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg 300
tgggggattt gccagcgtgg ccctccctcc agcagcagct gccctgggct gggccacggg 360
aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg 420
tcctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt 480
gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct 540
gcccagcctc gcacccgcat ggggacacaa ccgactccgg ggacatgcac tctcgggccc 600
tgtggagaga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc 660
ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg 720
gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga 780
acactcctcg gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc 840
tcggcagctt ctccacatgc tgaccagctc agacaaaccc agccctcctc tcacaaggtg 900
cccctgcagc cgccacacac acacaggccc ccacacacag gggaacacac gccacgtcgc 960
gtccctggca ctggcccact tcccaataca gcccttccct gcagctgggg tcacatgagg 1020
tgtgggcttc accatcctcc tgccctctgg gcctcaggga gggacacggg agacggggag 1080
tgggtcctgc tgagggccag gtcgctatct agggccgggt gtgtggctga gtcccggggc 1140
caaagctggt gcccagggcg ggcagctgtg gggagctgac ctcaggacac tgttggccca 1200
tcccggccgg gccctacatc ctgggtcctg ccacagaggg aatcaccccc agaggcccga 1260
gcccagcagg acacagcact gaccaccctc ttcctgtcca g 1301
<210> 158
<211> 1553
<212> DNA
<213> Mus musculus
<400> 158
gtaacacctc cctccatccc tcctaggcct ccatgtagct gtggtgggga aggtggatga 60
cagacatccg ctcactgttg taacaccagg aagctacccc aataaacact cagtgcctga 120
ttagagccct gggtgcctgt tcttggggaa ggcaggttat gggcagaaat atcttggcct 180
gaaagaaggg acaccccaag agaaggacag gagtgaagca tggctcaccc atctgtctat 240
gtgttggata tttgacaaat aggacatcac aggacttcag cataggtacc cctggtcctt 300
cctgctcttc actggatatc atgcacctga tctctagaga tgcagctaaa atgagccagt 360
ctgggaaacc tcagcaccca cctctcagtc ttgcaagctc ctgctcccag acattcctgg 420
atactaaacc ccttcaggta gagaaacagc caaagtcaac atctaggacg caggactcaa 480
catggtcctg ctccttccct ctctactcaa cagccattga ggctgagccc accgccccaa 540
ccgcctgcct tgccaaatga tcacaccagg cctggtgctc ctcgtcttac tacctaaact 600
cactccaacc caaattcatc ccaaggacca gaatgggctg acagcctcat acagtcaggt 660
tcccccatct atgacatgtt ttcacatgca tgcacacaca cacacacaca cacacacaca 720
cacacacaca cacacacaca cacacaggct tcattgagct ctctggttta gcaatagccc 780
aaagcaagcc atacatccat cccagttcca gaaggataag aaaaccagaa ccaagacaca 840
cccacaccta ttccataccc aaccaacagc acatatggct tacacacctg agattagtgg 900
ctcccatcat gtacacacac atgcacacaa aggagcccat acatacccat catttccaga 960
ggtaagtatc taacctttgg atctgagata tctctgagga acaccaatgg cagagtcaac 1020
cagcacctca gcctccagac taaatcctta cattttggcc caccccaagc catgagagat 1080
ggaggagggt ggaggcctga gctgcgggaa agcagagaca ggaagatgga ctgtttggtg 1140
agagtagtaa accagacaat ggggagacta aggcaggagt agagccccta caaggcccag 1200
agtctgcttt agagtccatg tgtcctgacc tgcccctcag atgccacaac caagatttct 1260
ggttccagag catgcatgca ggccctagaa atggacctat gagctcagag ccttcctaga 1320
gagccctggg tactctctga acaaaaggca attctgtgta gaggcatcct gtggccaaag 1380
accctaagac agtcatacac acacacacac acacacacac acacacacac aacacacaca 1440
acacacacaa cacaggtagg ttttatcatg ctctttggtt tagcaatagc cctgttgatg 1500
gtgggggata ctgggtcact gtgggcactg gagtagaaag agggaatgaa cag 1553
<210> 159
<211> 1354
<212> DNA
<213> Mus musculus
<400> 159
gtaaatgagc tcagcacaca caatgctcct gggtcctaat ggacactggc acccatatcc 60
atgcatccct tgtataaata aagcacccag caaagcctgg gaccatgtaa aactgtcctg 120
gttctttcca aggtatagag catagctcac gggctgatag ttctagccag ggttggagga 180
cagccttgtc tttaggtttc tgcactgcag gactcagagc tcatgagtca tcttggcctg 240
aagagtggaa cttagcttta ggcagtatct ttcctttact tcccacaaac cagcagctgc 300
cagacataga gataatccta ggaagcctca aatggagaag cacacaaacc cacctccctc 360
aggctgttcc tctccccagg ccccacttct ttacctaagg gtttctctga gtctattgta 420
gaggcacaca tggccaggga tattccggag acccttagca tccatacact caactcaggc 480
agcttttcac aggtgaggtc tgcacatcca tacagacggc tcactcctgc ctgtgccacg 540
tggggctgag gcacatggct cttgctgccc caagggaggg actattagat agccacagtc 600
atgctgaatc ctgacccatt caaattagcc tgctgaacac catccagtcc atatagcaca 660
tgtatccaca tgcacgtgtg cacacacaca tttaacacac tgggacaact cctctgtgcc 720
ctgcacagca cctacatcca gcaatgtatc accatacaca cggccaaaaa ttcaatgccc 780
acgtttctgc catcacaaac agacacacct ttcctctctg tggccactgc attatatgct 840
caacacaaga cctctgaagc cagatccatc tctggtacct cagggtcatg cttcaacccc 900
acatgaatta tgcaaaccat agccataatg gtctgaatca cttcacattg gaatggtccc 960
aagatcaggc aagaaaagcc acaggctctg ttgatgactg aaggacagca aagggtcagt 1020
ccagctgtat aaccactgtt gacctgggtc acagaccctg ctgaccctcc atattctctt 1080
gtactgaatg aatgaaaaat gagacaagca tagagggccc ttgcacaatc taggtcagta 1140
tgaggtctac ccgaggcatc attggagtca gctggaggaa gctgagactg atgtcccaga 1200
gggaaaggaa aagaaagaag gctccaggaa gggtctgctg taccagtcag gctggagctc 1260
tctcctctac ttcatgcaaa catgtctgca tcacagggaa tctctcccag caccaaccat 1320
gttgggacaa acactgactg tcctctctgt tcag 1354
<210> 160
<211> 81
<212> DNA
<213> Homo sapiens
<400> 160
tcgcccctgt acctggagat catcatctat tgcacagggg ccttcctcat ctcctgcatg 60
gtggggtcgg tcatcgtcta c 81
<210> 161
<211> 90
<212> DNA
<213> Mus musculus
<400> 161
aagataccat ctattgccac tgggattgtg ggtggcctcc tcttcatagt ggtggtggcc 60
cttgggattg gcctattcat gcgaagacgt 90
<210> 162
<211> 29
<212> PRT
<213> Homo sapiens
<400> 162
Thr His Asp Ala Leu Ile Val Gly Thr Leu Ser Gly Thr Ile Phe Phe
1 5 10 15
Ile Leu Leu Ile Ile Phe Leu Ser Trp Ile Ile Leu Lys
20 25
<210> 163
<211> 81
<212> DNA
<213> Mus musculus
<400> 163
cgccttccac tgggggtcac catctcctgc ctctgcatcc cgttgttttg cctgttctgt 60
tacttcagca ttaccaagat t 81
<210> 164
<211> 63
<212> DNA
<213> Homo sapiens
<400> 164
accatcacct tcctcaccct cttcctgctg agcctgttct atagcacagc actgaccgtg 60
acc 63
<210> 165
<211> 87
<212> DNA
<213> Homo sapiens
<400> 165
tggacgtgga ccggcctctg catcttcgcc gcactcttcc tgctcagcgt gagctacagc 60
gccgccatca cgctcctcat ggtgcag 87
<210> 166
<211> 78
<212> DNA
<213> Homo sapiens
<400> 166
gggctgtgga cgaccatcac catcttcatc acactcttcc tgttaagcgt gtgctacagt 60
gccaccgtca ccttcttc 78
<210> 167
<211> 78
<212> DNA
<213> Mus musculus
<400> 167
gagctgtgga ccagtatttg tgtcttcatc accctgttcc tgctcagtgt gagctatggg 60
gccactgtca ccgtcctc 78
<210> 168
<211> 78
<212> DNA
<213> Mus musculus
<400> 168
gggctctgga caaccatcac catcttcatc agcctcttcc tgctcagcgt gtgttacagc 60
gcctctgtca cactcttc 78
<210> 169
<211> 3111
<212> DNA
<213> Homo sapiens
<400> 169
gtgagtatca agaggcctaa gcaatggtaa tctccactct ccattcttcc cctgtggcca 60
gacacttccc ctggctgagt ctctgggctt ttatatcata ggatgcctct aatggcaatc 120
ctgccattag atacacctgc cgtggtgtat ctgccaggta ggcaggctag gctgcagtaa 180
caaacaagcc cacaatttcc atggcttaac actatgggaa tatatttctt gctcacgtaa 240
caagctaacg tgaatgttgc tggtttgtag gtggtttccc tccctgtaga aatctgggga 300
gtgaggttct ttccatcttg tggtgccgtc attctccagg acaaagattc ttacctactt 360
ttgtgtcctg gtttcctttg gcagcctggt gaagcctatg gacctcattt cagaatattt 420
ttaaatacat aaaatcccag cctgggcaat atagtgaaac ccccatctgt acaaaaatta 480
gccaggcatg gtggcatgca cctgtagtcc caggtactgg gaaggctgag gtgggaggat 540
cacttgagcc caggagtttg aggctgcagt gagccgtgat cgtaccactt tactcccacc 600
tgggtgacag agcaagagcc catctctaaa aataaataaa tacaatgaaa taaaataaaa 660
taaatagaac tacagaggaa actaattgta ttgaaatgca gttataaaac atttaaacac 720
atttttaatc tagagatata tgtgcttctt tattaagatc tataaataat aagttctagg 780
ggtagctcgc ataaatactg taatttcaaa gtagataagc ataaataata ctttatgata 840
ctgaaattgt gatgtgatat gagaatagct gtgagttttg ttttgctggg gacaggatca 900
gtgatgctgt cattactggg gtctcttccc tccattcttt ttttaaaatt gtattttatt 960
ttatttttaa aattttaaaa taaatagaga cagggtatca ctatgttgcc caggctgctt 1020
ttgacctcct gggctccagt gatcttccca tcttggcttc ccaaagtgct gggattacaa 1080
gtgggagcca gtgttcctgg ccccttcctc cattcttaat ggaaggagat gctaggtgtg 1140
agaggttagg gaaagtaaag atgtaatttc tttcccatcc aagttctcag acccctgaat 1200
tctacctgca gccatgttgg tccatcaacc ccaagtgaag aatccctgct ctagggcccc 1260
accattgtct gtatccagcc agcagaagag gcgtgattat ggagatcaca tctgcttctt 1320
gaaagcagac agcccggaag tgggccgcat cacttcctct caaattctat tggtgaaaat 1380
ggtcacatga ctacacatag ccacaaagga ggctgggaac tttctcactt ggaacctaca 1440
tcccagaaac aactcttttc agtgaggtat cccacaggtc tttcgcagta gaaatattga 1500
ttatctcaca taaaatgaag tcttacaaat ggacctactg ggttttgtac agcagccaag 1560
tgatatctct tcccttctgc tgtcttccct tctgccatcc ttcacatggt ggcattgtat 1620
ccttagactt gccacccatg ccctcaggtt ggccgttgca cactgtctta cataaagcag 1680
gaaggaaagg aaaggctgct acgagagagt gtaccttgtg catctctttt ttaatcagga 1740
agcaaacatc tttctagaag cttccctagc aaaattcccc ttacatctca ttggccaaga 1800
ctgttacatg ttacatggtt actgttatta cttgctcatt gcaaggaaga ctgggaactc 1860
aaatgcctgg aaaaaggaac aggataatcg tgattggctc aagccttagg gtgggcatgg 1920
ctccctgaca agggagagag gaaaaagctg ttgagtgaag aagactgctt cagtttcccc 1980
atctgtataa tgggaggagt aagggctgtc gtaaaaactc aatgaaagaa gattcttcaa 2040
cgtggtaggt gcagtggcag ctggcagtac cctgaccctg ccaccgcaca gccctctcag 2100
cattgctcat cctgcactgt ggatatcagt tgagccacgt gtctcctgcc ctgggctgtg 2160
agctccatag gcagggtctc catggctgta tctccagaac ccagcacaga accaggtgct 2220
tgggaaagtt ttgaattgat tctcatctgc cattggcatg gggaagggaa ctagcttgta 2280
tgaaacagat aacaatgtat gggaccctca ttcattattt cagcaaatat ttgctgagtt 2340
cctcctacat ggctagccct gtgctagaca ctggggaatc ggcgatgaac aaagcagata 2400
gaaatcccca ctcttgtgga gctgacattc tggagggaga gacaaaaagc aaacatataa 2460
agaaagaaag aaatcacatg gatctggatg acagtgagtg ctgggaagaa aataaaagca 2520
gaggaagggg atggagcgat gggcaggggg caacggtagg gagggtgtcg gggaaaactt 2580
tttggagaat gtgacgatga aagtgaacaa ggagaagtca accgtgttga gatgatggca 2640
gctaatgatg tggacaggcc actctgttct gagtgcatta tctattgatt catcatgtca 2700
tcctcgcaac agccctgcac gatcaattct gtcattaacc ccatagtaca gatgaggatg 2760
cggaggcaca gagaagataa gggacttgtc ctgtgtcaca cagcaaggag ccatccggct 2820
cctaagttgg tgcatttgac ttctgtgctt ccggaaagaa agagcagcaa gtttaagatc 2880
tggaggtggc actgagcttt ggaggagcag ggggcaatga ggtggccggt gtgacgagga 2940
ctcaatgtgc aagagggaga gtggtgggga gatgaggtgg aggggtggtc ggcggtcaga 3000
tcgtggaggg tctcggacga gggtcctgac cctgggtctc cagtcctggg aagtggagcc 3060
caggctgtac catggctgac ctcagctcat ggcttcccct cccacttcca g 3111
<210> 170
<211> 2093
<212> DNA
<213> Homo sapiens
<400> 170
gtaaatgacg tactcctgcc tccctccctc ccagggctcc atccagctgt gcagtgggga 60
ggactggcca gaccttctgt ccactgttgc aatgacccca ggaagctacc cccaataaac 120
tgtgcctgct cagagcccca ggtacaccca ttcttgggag cgggcagggc tgtgggcagg 180
tgcatcttgg cacagaggaa tgggcccccc aggaggggca gtgggaggag gtgggcaggg 240
ctgagtcccc ccaggagagg cggtgggagg aggtgggcag ggctgaggtg ccactcatcc 300
atctgccttc gtgtcagggt tatttgtcaa acagcatatc tgcagggact catcacagct 360
accccgggcc ctctctgccc ccactctggg tctaccccct ccaaggagtc caaagaccca 420
ggggaggtcc tcagggaagg ggcaagggag cccccacagc cctctctctt gggggcttgg 480
cttctacccc cctggacagg agcccctgca cccccaggta tagatgggca cacaggcccc 540
tccaggtgga aaaacagccc taagtgaaac ccccacacag acacacacga cccgacagcc 600
ctcgcccaag tctgtgccac tggcgttcgc ctctctgccc tgtcccgcct tgccgagtcc 660
tggccccagc accggggccg gtggagccga gcccactcac accccgcagc ctccgccacc 720
ctgccctgtg ggcacaccag gcccaggtca gcagccaggc cccctctcct actgcccccc 780
accgcccctt ggtccatcct gaatcggccc ccaggggatc gccagcctca cacacccagt 840
ctcgcccact cacgcctcac tcaaggcaca gctgtgcaca cactaggccc catagcaact 900
ccacagcacc ctgtaccacc accagggcgc catagacacc ccacacgtgg tcacacgtgg 960
cccacactcc gcctctcacg ctgcctccag cgaggctact gccaagccct tcctctgagc 1020
catacctggg ccgctggatc ccagagagaa atggagaggc cctcacgtgg tgtcctccag 1080
tccaaccctc cctgtcaccc tgtcagcagc agcaccccac agccaaacac aggatggatg 1140
cgtgggctcc atcccccact cacccacacc ggaaccccag agcaggctac gtgcccctca 1200
cagacctcaa acccacatgt gcatctgaca ccccagatcc aaacgctccc cccggtcatg 1260
cacaccaagg gcacagcacc caccaaatcc acacggaaac acgggcaccg ggcaccccat 1320
gagcacaaag cccctccatg tctgaagaca gtccctgcac accgtcacag ccatacattc 1380
agcttcactc tcacgtccca gcccacctgc acccagctct gggcctggag cagcagaaag 1440
aggtgtgagg gcccgaggcg ggacctgcac ctgctgatga cccgggacca gcaggcagct 1500
cacggtgttg gggaagggag tggagggcac ccagggcagg agccagaggg accaggctgg 1560
tgggcggggc cgggccgggg tagggccagg aggcagctct ggacacccac aggcctgggc 1620
tcatagtcca caccaggaca gcccctcaga gcacccatgc agtgagtccc aggtcttggg 1680
agccaggccg cagagctcac gcatccttcc gagggccctg agtgaggcgg ccactgctgt 1740
gccgaggggt tgggtccttc tctggggagg gcgtggggtc tagagaggcg gagtggaggt 1800
aaccagaggt caggagagaa gccgtaagga acagagggaa aatggggcca gagtcggggc 1860
gcagggacga gaggtcagga gtggtcggcc tggctctggg ccgttgactg actcgggacc 1920
tgggtgccca ccctcagggc tggctggcgg ctccgcgcag tcccagaggg ccccggatag 1980
ggtgctctgc cactccggac agcagcaggg actgccgaga gcagcaggag gctctgtccc 2040
ccacccccgc tgccactgtg gagccgggag ggctgactgg ccaggtcccc cag 2093
<210> 171
<211> 1285
<212> DNA
<213> Homo sapiens
<400> 171
gtaaatgagt gccagggccg gcaagccccc gctccccggg ctctcggggt cgcgcgagga 60
tgcttggcac gtaccccgtg tacatacttc ccgggcgccc agcatggaaa taaagcaccc 120
agcgctgccc tgggcccctg cgagactgtg atggttcttt ccacgggtca ggccgagtct 180
gaggcctgag tggcatgagg gaggcagagc gggtcccact gtccccacac tggcccaggc 240
tgtgcaggtg tgcctgggcc gcctagggtg gggctcagcc aggggctgcc ctcggcaggg 300
tgggggattt gccagcgtgg ccctccctcc agcagcacct gccctgggct gggccacgag 360
aagccctagg agcccctggg gacagacaca cagcccctgc ctctgtagga gactgtcctg 420
ttctgtgagc gccctgtcct ccgacccgca tgcccactcg ggggcatgcc tagtccatgt 480
gcgtagggac aggccctccc tcacccatct acccccacgg cactaacccc tggcagccct 540
gcccagcctc gaacccacat ggggacacaa ccgactccgg ggacatgcac tctcgggccc 600
tgtggaggga ctggtccaga tgcccacaca cacactcagc ccagacccgt tcaacaaacc 660
ccgcactgag gttggccggc cacacggcca ccacacacac acgtgcacgc ctcacacacg 720
gagcctcacc cgggcgaacc gcacagcacc cagaccagag caaggtcctc gcacacgtga 780
acactcctca gacacaggcc cccacgagcc ccacgcggca cctcaaggcc cacgagccgc 840
tcggcagctt ctccacatgc tgaccagctc agacaaaccc agccctcctc tcacaaggtg 900
cccctgcagc cgccacacac acaggggaac acacgccacg tcgcgtccct ggcactggcc 960
cacgtcccaa tacagccctt ccctgcagct ggggtcacat gaggggtggg tttcaccatc 1020
ctcctgccct ctggggctca gggagggaca cgggagacgg ggagtgggtc ctgctgaggg 1080
ccaggtcgct atctagggcc gggtgtctgg ctgagcccca gggccaaagc tggtgcccag 1140
ggtggacagc ttccgggagc tgacctcagg acattgttgg cccatcccgg ccgggcccta 1200
catcctgggc cccgccacag agggaatcac ccccagaggc ccaagcccag ggggacacag 1260
cactgaccac ccccttcctg tccag 1285
<210> 172
<211> 6350
<212> DNA
<213> Mus musculus
<400> 172
gtaagtcaca actgggtaag agtgtcaagc aaggacagca cttggtacct atgatagaca 60
aatactcctg tttgggaaga ggaggtctgc attgtctaga taagaggaac actgtgctta 120
tctgtttcag tttaaaagac agaactacat aacacttcac cctttctaca acacttagat 180
ttttcagccc tctcctctat ggtgtttcct gaaccctgaa gaaagtgata tagatgttta 240
tttattttct agggccactg ttccaaagaa acaatcacgt attattagca gcttgaccag 300
gtgtgaattt cccccagtat ccacttctgc tccctgtggg atgaagtccc tccataagta 360
aagttgaagg ctgtgggcat aaatgcaaat gcctgtaatc caattttaca agtccatgac 420
atacatttaa caaacaatag cagttacttc tctactggag cctatgaact ccccagctat 480
aggtttttcc cttctgcaga gcagagctta aatccaatag ggaagaagtt ggttgtaccc 540
ataactgcca taccactatt acaccaataa gcacatctta catagcaaga caattagtgt 600
agcactcaaa gtccatgttc aagagagaat gttggcaaca gcctatataa catctcccag 660
cacagaaaag aaaaggaaag gaaaggaaag gaaaggaaag gaaaggaaag gaaaggaaag 720
gaaaggaaag gaaaggaaag gaaaggaaag gaaagaaaag aaaagaaaag aaaagaaaag 780
aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaaag aaaagaaagg 840
aaaagaaagg aaaagaaagg aagacagcca gaaggcagct tccacttcag tcctagccca 900
tgttttctat gtcttacagc caaggttagt gaagtctcta gcagtaggaa tttatcatct 960
acttctggca tgcaagtaaa atcaatggtg ataacttttg tggtttgtgg ctccttggga 1020
gcctccctga acaataattt atgcagaggt agcccagctt tgccactggg gcttccatta 1080
aacaaacttt ggattgaggg agtgtctttt tctacctgca cacagtgatt cctatgtttt 1140
aactcttaat gagtcactgt tgtttgttgt tgttgttatt gttgttgtta ttgttgttgt 1200
tgttgttgtt tctatcaacc cagacactat agggctataa ggcaggtgga agcatcactg 1260
gctccagctg ttctcagtca tgctcttcct atcaatgttt gtgtaatgac tgcccctttt 1320
actgtcggtt ttctatgggt gcctatggat aacgctgggt tgggcgaaac ccttgatggc 1380
agcttttccc actgcttgct tatccatgta ggtgagagca cattcactct cacttgagag 1440
gcttaggcct ttatgaagtc tgcctgacat atgggatagg taggcttata tgcttaccca 1500
tcatgcaccc atgtgctggt accataagca agatcagacc tcacctgttc atgtagcatg 1560
cagaggatca gaatatttca caagaatgcc agaagctctc attactctct ggccttctct 1620
taaagatcac atcctctaac aaagcttacc aaagccacta acatctgagt tagtcctact 1680
caggtacaca tttcttaatg ctccagcaaa agcatctcta cccacttcat tgggcactaa 1740
acaccacttc tcacatgttt agagtttttt gttaagactt taaattatct ttcagtcatg 1800
tctgatgttc atgggcacct cagccagtaa taactgagtg tttctggtgt gtgcaggttt 1860
ttgtctgttt tgtgttgttt atatgccagg aaaaagctgt ttagtacaga tctaattggc 1920
attccccttc cttcatggtg tggatatttc ttttgagtta aaacatcccc tcttgtggca 1980
gggggagggc tagaggtcaa tggaatgatt tcccgagttt ccttggataa atgaaacctt 2040
tgtctcaggg aaggaagaat ggttctactt ctgtttctcc acttcatgat gctgactcta 2100
gcctcttcca tgccccgtgt ctccaggcta tgaaggaatc cagcatgctt ttctctcttc 2160
cttccttatc ttcttcatgg gttccaagtg ggttcctgtg gtttccacag gaaaggcttt 2220
ttagcacaaa tctgatctgt actgtctttc ctttatcccc tgccagctct gagacagaaa 2280
gccagcatct ctatcagaat ctctcttttg ccttcagaat cagagaccac tgtgaaaggc 2340
agcatccgtg catctttttt tccattgtac tccttcatta cgtgagcaag atttttctaa 2400
gcagatagct tagccttcat cgcacatctt agcacacact gcaaatgtca cacagacagc 2460
ttgctatgcc atcccatgta tactattttc aaggattgca ataccttctc tgatctgaaa 2520
tccattcaag taaaacaaca tgttgcaggt ccaattcaag aggcatgcca cctcatacca 2580
tataaaagaa gatggtcagc aaaaattcct gctctctcag acaactcaga cttgggagca 2640
gaaattccta tcacctctag cagggagtaa acaactacta ctacagctgg aagcatacta 2700
tctcctacca taaaagatgc tagcttctct gacaccttag acctgaggca aggaatcctc 2760
tgcctcattt ctttcgtctg ctggaaagcc tacaggacta agggctgctg taagcttgac 2820
acaagcttga ggttgaaagg tgtcagacag gcttcacctg aggggcccta tatatgagtg 2880
tagtgaggat ggaacaggct acgtggggca tcctccggca tcttgtcctc agagtggcct 2940
tcagagccca ggctcaagtc agccatactt ccccacttag actctggaaa tgccacagta 3000
tgtccacaac ctccacaccc agctacacaa aattgagaga gggacctagt gggactgcag 3060
caatcacatg aggccatacc tggaccagcc aagctgccag tataacagtc gtggctctga 3120
gattttgaaa gcttggtctg ttgtctatgc ctcgggatct ttgggatgcc ttaggatcca 3180
tcgagaaagt tctagagatc atgcctgttt ctggctgcac tgtactgact gagaacaggg 3240
gctacagcac cactgtttct catggcctac ttcctgccag gtggtgcctc attagtactg 3300
aaaggagcct gacctacact tgccccaaat tggccttttc ttttcccctg tggcattggt 3360
tcctcaaagg acactaaggt tttctcttac ttgactccct caggatctct ctacagattt 3420
tcacaggtca ctcctcagag ctagagtcat accagcatga ctatcctctg cccacattca 3480
cacagcatgc ttaggaagtc tgggcatgct ctgtagtcat cttcattagg ttgttcccac 3540
ctgcctctct atctgcccct gccccacttc cccttgttct gcctgttggt ctctccctac 3600
tctgtgcttc acatgtcttg aggtagatac atctgcctga gtcccacata acacttcttc 3660
atcacaccaa cccctgagaa caataatgtt cttagttctg tcgactagca cctcctgact 3720
tgtctctatg atgccattct tcccctccta cccatccatc accctgttgc caaggcactc 3780
tctgagacat cttgtttcta catagataca gaagaacatt tgattaggca tgtaggccat 3840
ggtgaaagaa aaacaccaag taaactttta acatcacaat tttatttaaa actactagag 3900
aggactcagc aatgctcaaa gagactaaat tcccaggtga aaggagatgg gatgttgtat 3960
tctaggcaca gacagacaga gcagtgggac atatgtaatc accaagaaat cagccaaatt 4020
tttaataaac accttagctg ccgagaggga tgagaacaca gaagaatccc aaattctgag 4080
ccaatcacca ctcacttaac ctcccaccca ggacactgct aagcaagaaa caccttcgag 4140
cacagtgtgg gcagaatatc catcttgtac cagctccaag gcctgctgaa tataagggtt 4200
atcccaaagc acctagagcc agaagtcaac tatgataccc cagctccagc acagctcagt 4260
tcccagttcc aaaaaacagg tcttccatgc ctggtggata agatgatatg cacttgtatc 4320
tcacccccag actctacaat ccatgtatat acaatgccta gcatgcaatc agtaattaca 4380
agatacaaat gattgataac caagacagag acagtacatg ggattagacc tgaggtacgg 4440
gaaaggttgg gaaagcattc atagtgtccc ttgctacaag aagtcccaga gctttgcagg 4500
gtgtgagcag attctaacct cccccattgg caagtcttct caaagctgct tctgctacta 4560
gagaaccctc tttcccagcc acctgccact atttatcact tatctgagtt ttccccatga 4620
ttctaggatg ctaccacctc ctgcctgagt cagacggtcc ttccaggaga cctgatggtc 4680
ctgcccttgc ctgagacctt tctaggctga atggtcatca tgtccactgt ctggttagct 4740
tggttgcctc tgtgttaagt tgcttcatac tacatgtagc aaggaaagtt acctttccac 4800
ttctcaggac actgtaaaga agcacttctg taaattatag tgagaaacga tcaataataa 4860
atgaaatgaa caaacataaa cctctcttat ctctatggga cctgccctaa ggcctcttgt 4920
ggatgcctga aaccttgagt gttcttaagc catgtgtcac ttcagtcatt aacctgtggc 4980
tgaggtggat cctgactgac aaacagacag gcatgtagac agcttgaagc ctggacaaag 5040
agaaggttga cgttccaggc aaagcaagag cctatcacat tgttccaaag tgtgtgattt 5100
agaatcagaa gatttcttgt ttaaaatata ctcaaaaagt tataaaatat cagccaggac 5160
tagtcataaa gcttaaatct gagagagaga gagagagaga gagagagaga gagaggtgtt 5220
catgtatata catatgtgtg tgtgtgtata tatatgtatg tatatgtatg tatatgtgta 5280
tattggtgtt tgggtgtcag attccctgga attaaagtta taaacagtta tgagctgcaa 5340
agtaggcttt ccaatgtctt gttctccaac cataggtaat tgaaactgga aactacaggt 5400
aaaggaggct gccaagtgtt tcttattatg ctaagattca gtgttctaca atattcacat 5460
gatttcactt tgatatggtg aaatgccttt aggccaacgc atccacagac ttcacagtga 5520
ccccagctga gcttacatat aatgtcaaac agcacttgtt gaatagatac ccaggcagcc 5580
ctgtgaccca tggtgttttc cttaattctt cccatctgcc ttggactttc acaccttgag 5640
ttgagatgtg ctttctgtag aaatgtattt ccctaggtct gtacatcagc caccaccctt 5700
tctgatcttg gaccatactt cagtctccag ctgggatatt catatgcatg cttagatatg 5760
gcataaccat cgttaacgtc ttctgttacc tttaggatta agttaccgta gctaggatgc 5820
tttccaatct ctccctccat ttgcaaaggc tcagggttcc ttctgactct ggagtagtac 5880
tctttcccaa tgagtgcacc atgaccacta ttcttcctta gaatgttact cccctttctc 5940
tgcctttttc atggcacatc tttctgagaa aacctacctg gtctagctgc tctttctggg 6000
tcttcttaag tagtaaccta actcctgcac catccgtgtg gcagtgacat agatccacat 6060
caggtttgga ttcagatatt ccaatcccat gcagaccaat ctatgtgtga gattccagga 6120
tccagcaggc tggggcatgg gttgaggggt aggattcttt ggggcaaagt ggttagtagg 6180
cacttgggac tggaagtgat aagtattagc gggaggaggg catatgatca aaacattgct 6240
gctggatgtg aaagctgtac cttcaggttc agtgttcagg agaccaggtt aataagaaat 6300
gatctttctg tagggtggag accttctcat gagcactagt tcttccctag 6350
<210> 173
<211> 1739
<212> DNA
<213> Mus musculus
<400> 173
gtaacacctc cctccatccc tcctaggcct ccatgtagct gtggtgggga aggtggatga 60
cagacatccg ctcactgttg taacaccagg aagctacccc aataaacact cagtgcctga 120
ttagagccct gggtgcctgt tcttggggaa ggcaggttat gggcagaaat atcttggcct 180
gaaagaaggg acaccccaag agaaggacag gagtgaagca tggctcaccc atctgtctat 240
gtgttggata tttgacaaat aggacatcac aggacttcag cataggtacc cctggtcctt 300
cctgctcttc actggatatc atgcacctga tctctagaga tgcagctaaa atgagccagt 360
ctgggaaacc tcagcaccca cctctcagtc ttgcaagctc ctgctcccag acattcctgg 420
atactaaacc ccttcaggta gagaaacagc caaagtcaac atctaggacg caggactcaa 480
catggtcctg ctccttccct ctctactcaa cagccattga ggctgagccc accgccccaa 540
ccgcctgcct tgccaaatga tcacaccagg cctggtgctc ctcgtcttac tacctaaact 600
cactccaacc caaattcatc ccaaggacca gaatgggctg acagcctcat acagtcaggt 660
tcccccatct atgacatgtt ttcacatgca tgcacacaca cacacacaca cacacacaca 720
cacacacaca cacacacaca cacacaggct tcattgagct ctctggttta gcaatagccc 780
aaagcaagcc atacatccat cccagttcca gaaggataag aaaaccagaa ccaagacaca 840
cccacaccta ttccataccc aaccaacagc acatatggct tacacacctg agattagtgg 900
ctcccatcat gtacacacac atgcacacaa aggagcccat acatacccat catttccaga 960
ggtaagtatc taacctttgg atctgagata tctctgagga acaccaatgg cagagtcaac 1020
cagcacctca gcctccagac taaatcctta cattttggcc caccccaagc catgagagat 1080
ggaggagggt ggaggcctga gctgcgggaa agcagagaca ggaagatgga ctgtttggtg 1140
agagtagtaa accagacaat ggggagacta aggcaggagt agagccccta caaggcccag 1200
agtctgcttt agagtccatg tgtcctgacc tgcccctcag atgccacaac caagatttct 1260
ggttccagag catgcatgca ggccctagaa atggacctat gagctcagag ccttcctaga 1320
gagccctggg tactctctga acaaaaggca attctgtgta gaggcatcct gtggccaaag 1380
accctaagac agtcatacac acacacacac acacacacac acacacacac aacacacaca 1440
acacacacaa cacaggtagg ttttatcatg ctctttggtt tagcaatagc cctgttgatg 1500
gtgggggata ctgggtcact gtgggcactg gagtagaaag agggaatgaa cagtcagtgg 1560
ggaaaggaca tctgcctcta gggctgaaca gagactggag cagtctcaga gcaggtggga 1620
tggggacctc tgccactcta gcttcatcag aactgcatga gacaagtatg gggtctaccc 1680
cctccccact gtcacctgga gtctggggaa gctaactggc tggtcccacc ccatcccag 1739
<210> 174
<211> 93
<212> DNA
<213> Homo sapiens
<400> 174
ttcgagcagc acctcctgct gggcgtcagc gtttcctgca ttgtcatcct ggccgtctgc 60
ctgttgtgct atgtcagcat caccaagatt aag 93
<210> 175
<211> 78
<212> DNA
<213> Homo sapiens
<400> 175
gggctgtgga cgaccatcac catcttcatc acactcttcc tgctaagcgt gtgctacagt 60
gccaccgtca ccttcttc 78
<210> 176
<211> 84
<212> DNA
<213> Mus musculus
<400> 176
ggcctgtggc ccacaatgtg caccttcgtg gccctcttcc tgctcacact gctctacagt 60
ggcttcgtca ccttcatcaa ggta 84
Claims (10)
- a) 인 프레임 번역 정지 코돈(in frame translational stop codon) 없이 이종 폴리펩티드를 코딩하는 제1 핵산,b) 5' 스플라이스 공여 부위(5' splice donor site)로 시작되고 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 3' 스플라이스 수용 부위(3' splice acceptor site)로 종결되는 제2 핵산,c) i) 경막 도메인(transmembrane domain)의 적어도 단편 또는 ii) 글리코실포스파티딜이노시톨(GPI)-고착자(anchor)에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산.
- 제1항에 따른 핵산을 포함하는 진핵세포.
- 제2항에 있어서,진핵세포가 CHO 세포, NS0 세포, Sp2/0 세포, COS 세포, K562 세포, BHK 세포, PER.C6® 세포 및 HEK 세포로 이루어진 군으로부터 선택됨을 특징으로 하는 진핵세포.
- a) 제1 다중 클로닝 부위,b) 5' 스플라이스 공여 부위로 시작되고 3' 스플라이스 수용 부위로 종결되는 핵산으로서, i) 정지 코돈 및 폴리아데닐화 신호를 포함하고, ii) 전구-메신저 RNA(전구-mRNA) 프로세싱(processing) 과정 동안에 기본적으로(constitutively) 제거되지 않는 핵산, 및c) 제2 다중 클로닝 부위를 5'에서 3' 방향으로 포함하는 벡터.
- a) i) 인 프레임 번역 정지 코돈 없이 이종 폴리펩티드를 코딩하는 제1 핵산,ii) 스플라이스 공여 부위로 시작되고 인 프레임 번역 정지 코돈 및 폴리아데닐화 신호를 포함하는 스플라이스 수용 부위로 종결되는 제2 핵산, 및iii) iiia) 경막 도메인의 적어도 단편 또는 iiib) GPI-고착자에 대한 신호 펩티드를 코딩하는 제3 핵산을 5'에서 3' 방향으로 포함하는 핵산으로 진핵세포를 형질감염시키는 단계;b) 상기 핵산으로부터 전구-mRNA를 생성하고 상기 전구-mRNA를 프로세싱하고 프로세싱된 mRNA를 폴리펩티드로 번역하기에 적합한 조건 하에 형질감염 세포를 배양하는 단계로서, 이때 형질감염 세포가 상기 전구-mRNA의 택일적 스플라이싱(alternative splicing)에 의해 가용성 이종 폴리펩티드 및 원형질막-결합 이종 폴리펩티드를 생성하는, 단계; 및c) 원형질막-결합 이종 폴리펩티드를 가진 세포를 이종 폴리펩티드를 발현하는 세포로서 선별하는 단계를 포함하는, 이종 폴리펩티드를 발현하는 진핵세포의 선별 방법.
- 제5항에 있어서,이종 폴리펩티드가 호르몬; 사이토카인; 인터류킨; 면역글로불린; 항융합원성(antifusogenic) 펩티드; 성장 인자; 수용체 리간드, 작용제 또는 길항제; 세포독성제; 항바이러스제; 조영제; 효소 억제제; 알로스테릭 물질과 같은 효소 활성화제 또는 효소 활성 조절제; 및 이들의 단편 및 융합체를 포함하는 폴리펩티드로 이루어진 군으로부터 선택됨을 특징으로 하는 방법.
- 제5항 또는 제6항에 있어서,i) 제1 핵산이 면역글로불린 중쇄 CH3 또는 CH4 도메인의 적어도 단편을 코딩하고,ii) 제2 핵산이 면역글로불린 중쇄 CH3 또는 CH4 도메인 엑손의 5' 스플라이스 공여 부위로 시작되고 후속 면역글로불린 중쇄 경막 도메인 엑손 M1의 3' 스플라이스 수용 부위로 종결되고,iii) 제3 핵산이 면역글로불린 경막 도메인의 적어도 단편임을 특징으로 하는 방법.
- 제5항 또는 제6항에 있어서,제2 핵산이 C3b/C4b 수용체; 인간, 닭 및 래트 EGFR; FGFR; 인간 및 마우스 면역글 로불린 α, ε, γ 및 μ 중쇄; 인간 PLA2 수용체; 닭 Cek5; 및 마우스 백혈병 억제 인자 수용체 α-쇄를 포함하는 군으로부터 선택된 폴리펩티드 또는 단백질을 코딩하는 핵산으로부터 수득됨을 특징으로 하는 방법.
- a) 진핵세포를 제공하는 단계;b) 제1항에 따른 핵산으로 상기 진핵세포를 형질감염시키는 단계;c) 상기 핵산의 발현에 적합한 조건 하에 형질감염 세포를 배양하는 단계; 및d) 배양 배지 또는 세포의 세포질로부터 폴리펩티드 또는 단백질을 회수하는 단계를 포함하는, 제1항에 따른 핵산에 의해 코딩된 이종 폴리펩티드 또는 단백질의 제조 방법.
- 제4항에 따른 벡터를 포함하는 제2항에 따른 세포를 제조하기 위한 키트.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP06010146.6 | 2006-05-17 | ||
EP06010146 | 2006-05-17 | ||
PCT/EP2007/004313 WO2007131774A1 (en) | 2006-05-17 | 2007-05-15 | Polypeptide producing cells |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090003327A true KR20090003327A (ko) | 2009-01-09 |
KR101202498B1 KR101202498B1 (ko) | 2012-11-16 |
Family
ID=37076089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087027867A KR101202498B1 (ko) | 2006-05-17 | 2007-05-15 | 폴리펩티드 생성 세포 |
Country Status (12)
Country | Link |
---|---|
US (2) | US8354516B2 (ko) |
EP (2) | EP2027273B1 (ko) |
JP (1) | JP4870208B2 (ko) |
KR (1) | KR101202498B1 (ko) |
CN (1) | CN101410525B (ko) |
AU (1) | AU2007251766B2 (ko) |
BR (1) | BRPI0712073B8 (ko) |
CA (1) | CA2651478C (ko) |
ES (2) | ES2543629T3 (ko) |
IL (1) | IL193721A (ko) |
MX (1) | MX2008013514A (ko) |
WO (1) | WO2007131774A1 (ko) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2651478C (en) * | 2006-05-17 | 2015-02-03 | Josef Endl | Polypeptide producing cells |
WO2008070367A2 (en) | 2006-11-01 | 2008-06-12 | Facet Biotech Corporation | Mammalian cell-based immunoglobulin display libraries |
WO2009059235A2 (en) | 2007-11-01 | 2009-05-07 | Facet Biotech Corporation | Immunoglobulin display vectors |
JP5788796B2 (ja) * | 2008-08-28 | 2015-10-07 | ノバルティス アーゲー | 終止コドンのリードスルーによるポリペプチドアイソフォームの細胞表面提示 |
DK2401377T3 (en) | 2009-02-27 | 2016-08-29 | Novartis Ag | Expression vector system comprising two selection markers |
FR2944017B1 (fr) * | 2009-04-02 | 2012-03-09 | Isp Investments Inc | Nouveaux peptides eclaircissants activateurs du proteasome et compositions les contenant |
FR2944016B1 (fr) | 2009-04-02 | 2012-03-09 | Isp Investments Inc | Nouveaux peptides anti-age activateurs du proteasome et compositions les contenant |
FR2944018B1 (fr) * | 2009-04-02 | 2012-03-09 | Isp Investments Inc | Nouveaux peptides anti-age activateurs du proteasome et compositions les contenant |
FR2944797B1 (fr) | 2009-04-23 | 2013-05-10 | Isp Investments Inc | Hydrolysats peptidiques activateurs du proteasome et compositions les contenant |
FR2944798B1 (fr) | 2009-04-23 | 2013-05-10 | Isp Investments Inc | Hydrolysats peptidiques eclaircissants activateurs du proteasome et compositions les contenant |
CN101875916B (zh) * | 2009-11-27 | 2013-04-17 | 西安交通大学 | 一种fgfr1高表达的重组hek293细胞及其应用 |
EP2922962B1 (en) | 2012-11-20 | 2016-12-21 | Novartis AG | Optimized expression cassette for expressing a polypeptide with high yield |
WO2014126254A1 (ja) * | 2013-02-18 | 2014-08-21 | 協和発酵キリン株式会社 | 膜結合型タンパク質発現ベクター |
US20160017319A1 (en) | 2013-03-11 | 2016-01-21 | Audrey Nommay | Method of screening cell clones |
WO2014171826A1 (en) | 2013-04-17 | 2014-10-23 | Stichting Vu-Vumc | Treatment of cognitive impairment in depressive disorders |
DK3027646T3 (en) | 2013-07-31 | 2018-09-24 | Novartis Ag | New selection vectors and methods for selecting eukaryotic host cells |
DK3083677T3 (da) | 2013-12-20 | 2019-11-25 | Novartis Ag | Hidtil ukendte eukaryote celler og fremgangsmåder til rekombinant ekspression af et produkt af interesse |
KR102288857B1 (ko) | 2013-12-20 | 2021-08-11 | 노파르티스 아게 | 신규한 진핵 세포 및 관심 생성물의 재조합 발현 방법 |
MA39502A (fr) * | 2014-02-28 | 2015-09-03 | Glenmark Pharmaceuticals Sa | Constructions d'expression et méthodes de sélection des cellules hôtes exprimant des polypeptides |
DK3320099T5 (da) | 2015-07-09 | 2024-10-07 | Institut National De La Sante Et De La Rech Medicale Inserm | Membranforankret eller udskilt antistof til ekspression af lentivirale vektorer |
EP3328399B1 (en) | 2015-07-31 | 2023-12-27 | Regents of the University of Minnesota | Modified cells and methods of therapy |
JP6818134B2 (ja) | 2016-09-29 | 2021-01-20 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | ポリペプチド産生細胞を選択するための改善された方法 |
GB2604416B (en) | 2016-10-18 | 2023-03-15 | Univ Minnesota | Tumor infiltating lymphocytes and methods of therapy |
EP3645021A4 (en) | 2017-06-30 | 2021-04-21 | Intima Bioscience, Inc. | ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY |
WO2019015677A1 (en) * | 2017-07-21 | 2019-01-24 | Beijing Biocytogen Co., Ltd | GENETICALLY MODIFIED IMMUNOGLOBULIN HEAVY CHAIN ANIMALS |
CN107557367B (zh) * | 2017-09-08 | 2020-11-03 | 北京大学人民医院 | Ighg1基因突变体及其应用 |
AU2021392972A1 (en) * | 2020-12-01 | 2023-06-08 | ETH Zürich | Dna constructs comprising alternative promoters |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4656134A (en) | 1982-01-11 | 1987-04-07 | Board Of Trustees Of Leland Stanford Jr. University | Gene amplification in eukaryotic cells |
EP0557459B1 (en) | 1990-11-13 | 1997-10-22 | Immunex Corporation | Bifunctional selectable fusion genes |
IL104570A0 (en) * | 1992-03-18 | 1993-05-13 | Yeda Res & Dev | Chimeric genes and cells transformed therewith |
EP0804590A1 (en) | 1993-05-21 | 1997-11-05 | Targeted Genetics Corporation | Bifunctional selectable fusion genes based on the cytosine deaminase (cd) gene |
US5888809A (en) | 1997-05-01 | 1999-03-30 | Icos Corporation | Hamster EF-1α transcriptional regulatory DNA |
EP1196566B1 (en) | 1999-07-12 | 2006-02-01 | Genentech, Inc. | Expression vectors and methods |
AUPQ422399A0 (en) | 1999-11-24 | 1999-12-16 | University Of New South Wales, The | Method of screening transformed or transfected cells |
IL136459A0 (en) * | 2000-05-30 | 2001-06-14 | Galim Galil Immunology Ltd | Antibody library |
ATE325865T1 (de) | 2001-01-16 | 2006-06-15 | Regeneron Pharma | Isolierung von sezernierte proteine exprimierenden zellen |
US20030033616A1 (en) | 2001-07-30 | 2003-02-13 | Star-Lack Joshua Morris | Imaging marker transgenes |
US7384744B2 (en) | 2002-11-29 | 2008-06-10 | Boehringer Ingelheim Pharma Gmbh & Co., Kg | Expression vector, methods for the production of heterologous gene products and for the selection of recombinant cells producing high levels of such products |
EP1477805A1 (de) | 2003-05-12 | 2004-11-17 | ProBioGen AG | Verfahren zur Zellselektion |
CA2536675A1 (en) | 2003-08-29 | 2005-03-10 | Centocor, Inc. | A rapid way to obtain high expression clones of mammalian cells using a methylcellulose and immunoprecipitation screening method |
WO2005040213A1 (en) * | 2003-10-16 | 2005-05-06 | Zlb Behring Gmbh | MODIFIED cDNA FOR HIGH EXPRESSION LEVELS OF FACTOR VIII AND ITS DERIVATIVES |
EP1733034A4 (en) * | 2004-03-15 | 2010-01-20 | Biogen Idec Inc | METHOD AND CONSTRUCTS FOR THE EXPRESSION OF POLYPEPTIDE MULTIMERS IN EUKARYONTIC CELLS USING ALTERNATIVE SPLEISSEN |
CA2651478C (en) * | 2006-05-17 | 2015-02-03 | Josef Endl | Polypeptide producing cells |
-
2007
- 2007-05-15 CA CA2651478A patent/CA2651478C/en not_active Expired - Fee Related
- 2007-05-15 US US12/299,918 patent/US8354516B2/en active Active
- 2007-05-15 AU AU2007251766A patent/AU2007251766B2/en not_active Ceased
- 2007-05-15 BR BRPI0712073A patent/BRPI0712073B8/pt not_active IP Right Cessation
- 2007-05-15 MX MX2008013514A patent/MX2008013514A/es active IP Right Grant
- 2007-05-15 ES ES10154684.4T patent/ES2543629T3/es active Active
- 2007-05-15 JP JP2009510343A patent/JP4870208B2/ja not_active Expired - Fee Related
- 2007-05-15 WO PCT/EP2007/004313 patent/WO2007131774A1/en active Application Filing
- 2007-05-15 CN CN2007800108283A patent/CN101410525B/zh not_active Expired - Fee Related
- 2007-05-15 ES ES07725230.2T patent/ES2573027T3/es active Active
- 2007-05-15 EP EP07725230.2A patent/EP2027273B1/en not_active Not-in-force
- 2007-05-15 EP EP20100154684 patent/EP2208792B1/en active Active
- 2007-05-15 KR KR1020087027867A patent/KR101202498B1/ko active IP Right Grant
-
2008
- 2008-08-27 IL IL193721A patent/IL193721A/en active IP Right Grant
-
2012
- 2012-12-05 US US13/705,339 patent/US8541204B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
ES2543629T3 (es) | 2015-08-20 |
BRPI0712073A2 (pt) | 2012-03-06 |
US20130109058A1 (en) | 2013-05-02 |
AU2007251766B2 (en) | 2013-06-20 |
JP2009537124A (ja) | 2009-10-29 |
ES2573027T3 (es) | 2016-06-03 |
EP2208792A2 (en) | 2010-07-21 |
EP2027273A1 (en) | 2009-02-25 |
EP2208792B1 (en) | 2015-05-06 |
EP2208792A3 (en) | 2010-10-27 |
CN101410525B (zh) | 2012-09-05 |
EP2027273B1 (en) | 2016-04-13 |
MX2008013514A (es) | 2008-10-28 |
JP4870208B2 (ja) | 2012-02-08 |
US20090311725A1 (en) | 2009-12-17 |
BRPI0712073B1 (pt) | 2019-11-12 |
WO2007131774A1 (en) | 2007-11-22 |
IL193721A (en) | 2014-09-30 |
CN101410525A (zh) | 2009-04-15 |
BRPI0712073B8 (pt) | 2021-05-25 |
IL193721A0 (en) | 2011-08-01 |
CA2651478C (en) | 2015-02-03 |
KR101202498B1 (ko) | 2012-11-16 |
CA2651478A1 (en) | 2007-11-22 |
US8354516B2 (en) | 2013-01-15 |
AU2007251766A1 (en) | 2007-11-22 |
US8541204B2 (en) | 2013-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101202498B1 (ko) | 폴리펩티드 생성 세포 | |
CN101688222B (zh) | 启动子 | |
AU765000C (en) | Methods and compositions for screening for modulators of IgE synthesis, secretion and switch rearrangement | |
US5166059A (en) | Gene therapy using gene fusions for genetic or acquired disorders | |
KR102288232B1 (ko) | 신규한 진핵 세포 및 관심 생성물의 재조합 발현 방법 | |
AU2018204332A1 (en) | Expression cassette | |
CN109666699B (zh) | 一种基于lag-3/mhc ii阻断功能及其生物效应的药物快速筛选方法 | |
JPH10507369A (ja) | ウィルス、特にレトロウィルスの複製を阻害するためへの“免疫不全ウィルス抑制リンフォカイン(isl)”の使用 | |
IL90514A (en) | A fusion gene that contains a gene for multidrug resistance that is fused to a gene for adenine diamines | |
US11591383B2 (en) | Method for selecting polypeptide producing cells | |
JP2003513670A (ja) | ジフテリア毒素構築体を用いるスクリーニングのための方法および組成物 | |
US20100178672A1 (en) | Cho cell | |
CN116323922A (zh) | 筛选靶向CD47-SIRPα免疫检查点的候选药物的方法和试剂盒 | |
CN118813540A (zh) | 一种Nur77/NF-κB/NFAT Jurkat三基因报告细胞系及其构建方法和用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150930 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20161028 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170929 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180928 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190924 Year of fee payment: 8 |