KR100950104B1 - 코어 글리코실화된 hcv 엔빌로프 단백질 - Google Patents
코어 글리코실화된 hcv 엔빌로프 단백질 Download PDFInfo
- Publication number
- KR100950104B1 KR100950104B1 KR1020037013778A KR20037013778A KR100950104B1 KR 100950104 B1 KR100950104 B1 KR 100950104B1 KR 1020037013778 A KR1020037013778 A KR 1020037013778A KR 20037013778 A KR20037013778 A KR 20037013778A KR 100950104 B1 KR100950104 B1 KR 100950104B1
- Authority
- KR
- South Korea
- Prior art keywords
- hcv
- protein
- seq
- man
- isolated
- Prior art date
Links
- 101710091045 Envelope protein Proteins 0.000 title abstract description 155
- 101710188315 Protein X Proteins 0.000 title abstract description 155
- 102100021696 Syncytin-1 Human genes 0.000 title abstract 6
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 claims abstract description 130
- 210000004027 cell Anatomy 0.000 claims abstract description 70
- 230000004988 N-glycosylation Effects 0.000 claims abstract description 62
- 230000014509 gene expression Effects 0.000 claims abstract description 59
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 claims abstract description 26
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 claims abstract description 26
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 claims abstract description 26
- 230000001225 therapeutic effect Effects 0.000 claims abstract description 9
- 230000000069 prophylactic effect Effects 0.000 claims abstract description 8
- 230000005664 protein glycosylation in endoplasmic reticulum Effects 0.000 claims abstract description 7
- 241000711549 Hepacivirus C Species 0.000 claims description 306
- 108090000623 proteins and genes Proteins 0.000 claims description 222
- 102000004169 proteins and genes Human genes 0.000 claims description 213
- 235000018102 proteins Nutrition 0.000 claims description 197
- 108700008783 Hepatitis C virus E1 Proteins 0.000 claims description 87
- 239000000203 mixture Substances 0.000 claims description 78
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 74
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 57
- 241000282414 Homo sapiens Species 0.000 claims description 52
- 210000004962 mammalian cell Anatomy 0.000 claims description 52
- 239000002245 particle Substances 0.000 claims description 44
- 101710125507 Integrase/recombinase Proteins 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 40
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 38
- 238000006243 chemical reaction Methods 0.000 claims description 32
- 229960005486 vaccine Drugs 0.000 claims description 25
- 241000124008 Mammalia Species 0.000 claims description 22
- 108010014251 Muramidase Proteins 0.000 claims description 19
- 102000016943 Muramidase Human genes 0.000 claims description 19
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 claims description 19
- 229960000274 lysozyme Drugs 0.000 claims description 19
- 239000004325 lysozyme Substances 0.000 claims description 19
- 235000010335 lysozyme Nutrition 0.000 claims description 19
- 238000011282 treatment Methods 0.000 claims description 19
- 101710185720 Putative ethidium bromide resistance protein Proteins 0.000 claims description 18
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 18
- 239000007787 solid Substances 0.000 claims description 18
- 239000002671 adjuvant Substances 0.000 claims description 17
- 150000001875 compounds Chemical class 0.000 claims description 17
- 239000003814 drug Substances 0.000 claims description 15
- 241000195493 Cryptophyta Species 0.000 claims description 14
- 239000008194 pharmaceutical composition Substances 0.000 claims description 13
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 10
- 208000015181 infectious disease Diseases 0.000 claims description 10
- 238000004519 manufacturing process Methods 0.000 claims description 10
- DJQYYYCQOZMCRC-UHFFFAOYSA-N 2-aminopropane-1,3-dithiol Chemical group SCC(N)CS DJQYYYCQOZMCRC-UHFFFAOYSA-N 0.000 claims description 9
- 230000000890 antigenic effect Effects 0.000 claims description 9
- 210000005253 yeast cell Anatomy 0.000 claims description 9
- 239000000178 monomer Substances 0.000 claims description 8
- 108010068380 arginylarginine Proteins 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 6
- 239000003937 drug carrier Substances 0.000 claims description 6
- 238000009007 Diagnostic Kit Methods 0.000 claims description 5
- 230000002163 immunogen Effects 0.000 claims description 5
- 230000001939 inductive effect Effects 0.000 claims description 5
- 108010062796 arginyllysine Proteins 0.000 claims description 4
- 230000036039 immunity Effects 0.000 claims description 4
- 235000013305 food Nutrition 0.000 claims description 3
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 claims description 2
- JQFZHHSQMKZLRU-IUCAKERBSA-N Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N JQFZHHSQMKZLRU-IUCAKERBSA-N 0.000 claims description 2
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 claims description 2
- NVGBPTNZLWRQSY-UWVGGRQHSA-N Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCCN NVGBPTNZLWRQSY-UWVGGRQHSA-N 0.000 claims description 2
- 108010054155 lysyllysine Proteins 0.000 claims description 2
- 208000005176 Hepatitis C Diseases 0.000 claims 2
- 238000010668 complexation reaction Methods 0.000 claims 1
- 241000235648 Pichia Species 0.000 abstract description 37
- 210000003527 eukaryotic cell Anatomy 0.000 abstract description 12
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 150
- 108020004414 DNA Proteins 0.000 description 105
- 102000053602 DNA Human genes 0.000 description 105
- 239000013598 vector Substances 0.000 description 99
- 229920001542 oligosaccharide Polymers 0.000 description 85
- 239000012634 fragment Substances 0.000 description 84
- 239000000047 product Substances 0.000 description 73
- 150000002482 oligosaccharides Chemical class 0.000 description 71
- 229940024606 amino acid Drugs 0.000 description 65
- 239000000523 sample Substances 0.000 description 63
- 235000001014 amino acid Nutrition 0.000 description 62
- 150000001413 amino acids Chemical class 0.000 description 58
- 241000320412 Ogataea angusta Species 0.000 description 51
- 238000006206 glycosylation reaction Methods 0.000 description 49
- 239000013612 plasmid Substances 0.000 description 48
- 230000013595 glycosylation Effects 0.000 description 47
- 125000000311 mannosyl group Chemical group C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 46
- 238000010828 elution Methods 0.000 description 43
- PXBFMLJZNCDSMP-UHFFFAOYSA-N 2-Aminobenzamide Chemical compound NC(=O)C1=CC=CC=C1N PXBFMLJZNCDSMP-UHFFFAOYSA-N 0.000 description 42
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 38
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 37
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 36
- 210000002966 serum Anatomy 0.000 description 36
- 238000011534 incubation Methods 0.000 description 35
- 239000000427 antigen Substances 0.000 description 33
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 32
- 108091007433 antigens Proteins 0.000 description 32
- 102000036639 antigens Human genes 0.000 description 32
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 30
- 108020004705 Codon Proteins 0.000 description 28
- 206010046865 Vaccinia virus infection Diseases 0.000 description 27
- 239000002904 solvent Substances 0.000 description 27
- 230000015556 catabolic process Effects 0.000 description 26
- 238000006731 degradation reaction Methods 0.000 description 26
- 208000007089 vaccinia Diseases 0.000 description 26
- 241000588724 Escherichia coli Species 0.000 description 25
- 239000002773 nucleotide Substances 0.000 description 25
- 125000003729 nucleotide group Chemical group 0.000 description 25
- 230000002441 reversible effect Effects 0.000 description 25
- 238000002965 ELISA Methods 0.000 description 24
- 108010012864 alpha-Mannosidase Proteins 0.000 description 24
- 102000019199 alpha-Mannosidase Human genes 0.000 description 24
- 238000000746 purification Methods 0.000 description 24
- 238000001262 western blot Methods 0.000 description 23
- 102000001696 Mannosidases Human genes 0.000 description 22
- 108010054377 Mannosidases Proteins 0.000 description 22
- 150000002772 monosaccharides Chemical class 0.000 description 22
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 21
- 241000235070 Saccharomyces Species 0.000 description 21
- 239000000872 buffer Substances 0.000 description 21
- 230000009257 reactivity Effects 0.000 description 21
- 239000013605 shuttle vector Substances 0.000 description 21
- 238000001542 size-exclusion chromatography Methods 0.000 description 21
- 239000000126 substance Substances 0.000 description 21
- 108010054576 Deoxyribonuclease EcoRI Proteins 0.000 description 20
- DINOPBPYOCMGGD-VEDJBHDQSA-N Man(a1-2)Man(a1-2)Man(a1-3)[Man(a1-2)Man(a1-3)[Man(a1-2)Man(a1-6)]Man(a1-6)]Man(b1-4)GlcNAc(b1-4)GlcNAc Chemical compound O[C@@H]1[C@@H](NC(=O)C)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O[C@H]2[C@H]([C@@H](O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO[C@@H]3[C@H]([C@@H](O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)O3)O)O2)O)[C@@H](CO)O1 DINOPBPYOCMGGD-VEDJBHDQSA-N 0.000 description 20
- 150000007523 nucleic acids Chemical class 0.000 description 20
- 241000235058 Komagataella pastoris Species 0.000 description 19
- 108010055059 beta-Mannosidase Proteins 0.000 description 19
- 239000000499 gel Substances 0.000 description 19
- 102100032487 Beta-mannosidase Human genes 0.000 description 18
- 102000004190 Enzymes Human genes 0.000 description 18
- 108090000790 Enzymes Proteins 0.000 description 18
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 18
- 150000001720 carbohydrates Chemical class 0.000 description 18
- 238000003776 cleavage reaction Methods 0.000 description 18
- 229940088598 enzyme Drugs 0.000 description 18
- ITFSNTMIZQUALH-BYBYOKTNSA-N n-[(2r,3r,4s,5r)-6-[(2s,3s,4s,5s,6r)-4,5-dihydroxy-6-(hydroxymethyl)-3-[(2r,3s,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-3,4-bis[[(2r,3s,4s,5r,6r)-5-hydroxy-6-(hydroxymethyl)-3,4-bis[[(2r,3s,4s,5s,6r)-3,4,5-trihydroxy-6-(hydro Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@H]1O[C@@H]1[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@H]([C@H](C=O)NC(=O)C)[C@H](O[C@@H]1[C@H]([C@@H](O[C@@H]2[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O1)O[C@@H]1[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@@H](CO[C@@H]1[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O[C@@H]1[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)O[C@@H]1[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O1)O)[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@@H]1O ITFSNTMIZQUALH-BYBYOKTNSA-N 0.000 description 18
- 230000007017 scission Effects 0.000 description 18
- 238000000926 separation method Methods 0.000 description 18
- KWIUHFFTVRNATP-UHFFFAOYSA-N Betaine Natural products C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 17
- KWIUHFFTVRNATP-UHFFFAOYSA-O N,N,N-trimethylglycinium Chemical compound C[N+](C)(C)CC(O)=O KWIUHFFTVRNATP-UHFFFAOYSA-O 0.000 description 17
- 229960003237 betaine Drugs 0.000 description 17
- 235000014633 carbohydrates Nutrition 0.000 description 17
- 238000004925 denaturation Methods 0.000 description 17
- 230000036425 denaturation Effects 0.000 description 17
- 239000002609 medium Substances 0.000 description 17
- 102000039446 nucleic acids Human genes 0.000 description 17
- 108020004707 nucleic acids Proteins 0.000 description 17
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 17
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 16
- 230000015572 biosynthetic process Effects 0.000 description 16
- 229920001184 polypeptide Polymers 0.000 description 16
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 15
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 15
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 15
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 15
- 238000002835 absorbance Methods 0.000 description 15
- 238000002474 experimental method Methods 0.000 description 15
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 15
- 150000003573 thiols Chemical class 0.000 description 15
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 14
- 229960000723 ampicillin Drugs 0.000 description 14
- 238000000855 fermentation Methods 0.000 description 14
- 230000004151 fermentation Effects 0.000 description 14
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 14
- 239000000463 material Substances 0.000 description 14
- 239000011541 reaction mixture Substances 0.000 description 14
- UCDWNBFOZCZSNV-AVGNSLFASA-N His-Arg-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O UCDWNBFOZCZSNV-AVGNSLFASA-N 0.000 description 13
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 13
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 13
- 238000003556 assay Methods 0.000 description 13
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 13
- 230000035772 mutation Effects 0.000 description 13
- 230000002829 reductive effect Effects 0.000 description 13
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 12
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 12
- 210000004369 blood Anatomy 0.000 description 12
- 239000008280 blood Substances 0.000 description 12
- 230000006698 induction Effects 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 238000012986 modification Methods 0.000 description 12
- DVEKCXOJTLDBFE-UHFFFAOYSA-N n-dodecyl-n,n-dimethylglycinate Chemical compound CCCCCCCCCCCC[N+](C)(C)CC([O-])=O DVEKCXOJTLDBFE-UHFFFAOYSA-N 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 12
- 108010036387 trimethionine Proteins 0.000 description 12
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 11
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 11
- 235000018417 cysteine Nutrition 0.000 description 11
- 238000000338 in vitro Methods 0.000 description 11
- 239000012528 membrane Substances 0.000 description 11
- 102000040430 polynucleotide Human genes 0.000 description 11
- 108091033319 polynucleotide Proteins 0.000 description 11
- 235000000346 sugar Nutrition 0.000 description 11
- 238000006277 sulfonation reaction Methods 0.000 description 11
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 10
- 108091026890 Coding region Proteins 0.000 description 10
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 10
- 102000003960 Ligases Human genes 0.000 description 10
- 108090000364 Ligases Proteins 0.000 description 10
- BCRQJDMZQUHQSV-STQMWFEESA-N Met-Gly-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BCRQJDMZQUHQSV-STQMWFEESA-N 0.000 description 10
- OSKIPPQETUTOMW-YHLOVPAPSA-N N-[(2R,3R,4R,5S,6R)-5-[(2S,3R,4R,5S,6R)-3-Acetamido-5-[(2R,3S,4S,5R,6R)-4-[(2R,3S,4S,5S,6R)-3-[(2S,3S,4S,5S,6R)-4,5-dihydroxy-6-(hydroxymethyl)-3-[(2R,3S,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-4,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-6-[[(2S,3S,4S,5R,6R)-6-[[(2S,3S,4S,5S,6R)-4,5-dihydroxy-6-(hydroxymethyl)-3-[(2R,3S,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxymethyl]-3,5-dihydroxy-4-[(2R,3S,4S,5S,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxymethyl]-3,5-dihydroxyoxan-2-yl]oxy-4-hydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-2,4-dihydroxy-6-(hydroxymethyl)oxan-3-yl]acetamide Chemical compound O[C@@H]1[C@@H](NC(=O)C)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O[C@@H]2[C@H]([C@@H](O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO[C@@H]3[C@H]([C@@H](O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)O3)O)O2)O)[C@@H](CO)O1 OSKIPPQETUTOMW-YHLOVPAPSA-N 0.000 description 10
- 102000035195 Peptidases Human genes 0.000 description 10
- 108091005804 Peptidases Proteins 0.000 description 10
- 241000700618 Vaccinia virus Species 0.000 description 10
- 230000029936 alkylation Effects 0.000 description 10
- 238000005804 alkylation reaction Methods 0.000 description 10
- 230000001684 chronic effect Effects 0.000 description 10
- 238000010367 cloning Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 238000001976 enzyme digestion Methods 0.000 description 10
- 239000008103 glucose Substances 0.000 description 10
- 229960002897 heparin Drugs 0.000 description 10
- 229920000669 heparin Polymers 0.000 description 10
- 239000008188 pellet Substances 0.000 description 10
- 230000009467 reduction Effects 0.000 description 10
- 108091008146 restriction endonucleases Proteins 0.000 description 10
- 239000000243 solution Substances 0.000 description 10
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 9
- FSXDWQGEWZQBPJ-HERUPUMHSA-N Ala-Trp-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N FSXDWQGEWZQBPJ-HERUPUMHSA-N 0.000 description 9
- 108010041986 DNA Vaccines Proteins 0.000 description 9
- 229940021995 DNA vaccine Drugs 0.000 description 9
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 9
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 9
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 9
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 9
- 241000699670 Mus sp. Species 0.000 description 9
- 108010079364 N-glycylalanine Proteins 0.000 description 9
- 229910019142 PO4 Inorganic materials 0.000 description 9
- 241000282579 Pan Species 0.000 description 9
- WSRWHZRUOCACLJ-UWVGGRQHSA-N Pro-Gly-His Chemical compound C([C@@H](C(=O)O)NC(=O)CNC(=O)[C@H]1NCCC1)C1=CN=CN1 WSRWHZRUOCACLJ-UWVGGRQHSA-N 0.000 description 9
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 9
- NQJDICVXXIMMMB-XDTLVQLUSA-N Tyr-Glu-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O NQJDICVXXIMMMB-XDTLVQLUSA-N 0.000 description 9
- 239000011543 agarose gel Substances 0.000 description 9
- 238000004113 cell culture Methods 0.000 description 9
- 239000007795 chemical reaction product Substances 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 9
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 9
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 9
- 238000003018 immunoassay Methods 0.000 description 9
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 9
- 108010051242 phenylalanylserine Proteins 0.000 description 9
- 239000010452 phosphate Substances 0.000 description 9
- 239000002157 polynucleotide Substances 0.000 description 9
- 238000002360 preparation method Methods 0.000 description 9
- 238000011218 seed culture Methods 0.000 description 9
- 230000009466 transformation Effects 0.000 description 9
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 8
- SRZZZTMJARUVPI-JBDRJPRFSA-N Cys-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N SRZZZTMJARUVPI-JBDRJPRFSA-N 0.000 description 8
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 8
- 102000012410 DNA Ligases Human genes 0.000 description 8
- 108010061982 DNA Ligases Proteins 0.000 description 8
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 8
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 8
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 8
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 8
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 8
- VWWGEKCAPBMIFE-SRVKXCTJSA-N Met-Met-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(O)=O VWWGEKCAPBMIFE-SRVKXCTJSA-N 0.000 description 8
- 101710144111 Non-structural protein 3 Proteins 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- JJKSSJVYOVRJMZ-FXQIFTODSA-N Ser-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)CN=C(N)N JJKSSJVYOVRJMZ-FXQIFTODSA-N 0.000 description 8
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 8
- 239000012505 Superdex™ Substances 0.000 description 8
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 8
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 8
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 8
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 8
- 230000029087 digestion Effects 0.000 description 8
- 230000002255 enzymatic effect Effects 0.000 description 8
- 238000009472 formulation Methods 0.000 description 8
- 230000028993 immune response Effects 0.000 description 8
- 230000003053 immunization Effects 0.000 description 8
- 230000005847 immunogenicity Effects 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- 238000002347 injection Methods 0.000 description 8
- 239000007924 injection Substances 0.000 description 8
- 230000002427 irreversible effect Effects 0.000 description 8
- -1 nucleotide sugars Chemical class 0.000 description 8
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 230000004936 stimulating effect Effects 0.000 description 8
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 7
- JPPLRQVZMZFOSX-UWJYBYFXSA-N Asn-Tyr-Ala Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 JPPLRQVZMZFOSX-UWJYBYFXSA-N 0.000 description 7
- XTHUKRLJRUVVBF-WHFBIAKZSA-N Cys-Gly-Ser Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O XTHUKRLJRUVVBF-WHFBIAKZSA-N 0.000 description 7
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 7
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 7
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- HDFGOPSGAURCEO-UHFFFAOYSA-N N-ethylmaleimide Chemical compound CCN1C(=O)C=CC1=O HDFGOPSGAURCEO-UHFFFAOYSA-N 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 7
- RIFVTNDKUMSSMN-ULQDDVLXSA-N Tyr-His-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O RIFVTNDKUMSSMN-ULQDDVLXSA-N 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 230000000903 blocking effect Effects 0.000 description 7
- 239000000969 carrier Substances 0.000 description 7
- 239000005018 casein Substances 0.000 description 7
- BECPQYXYKAMYBN-UHFFFAOYSA-N casein, tech. Chemical compound NCCCCC(C(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(CC(C)C)N=C(O)C(CCC(O)=O)N=C(O)C(CC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(C(C)O)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=N)N=C(O)C(CCC(O)=O)N=C(O)C(CCC(O)=O)N=C(O)C(COP(O)(O)=O)N=C(O)C(CCC(O)=N)N=C(O)C(N)CC1=CC=CC=C1 BECPQYXYKAMYBN-UHFFFAOYSA-N 0.000 description 7
- 235000021240 caseins Nutrition 0.000 description 7
- 230000002860 competitive effect Effects 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 7
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 7
- SHFKGANKURXVMY-LCWPZEQJSA-N hcv e2 protein Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)CNC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)O)[C@@H](C)O)C(C)C)[C@@H](C)O)[C@@H](C)O)[C@@H](C)O)CC1=CC=CC=C1 SHFKGANKURXVMY-LCWPZEQJSA-N 0.000 description 7
- 238000002649 immunization Methods 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 229910052760 oxygen Inorganic materials 0.000 description 7
- 239000001301 oxygen Substances 0.000 description 7
- 229920002477 rna polymer Polymers 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 6
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 6
- 244000062995 Cassia occidentalis Species 0.000 description 6
- QQAYIVHVRFJICE-AEJSXWLSSA-N Cys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N QQAYIVHVRFJICE-AEJSXWLSSA-N 0.000 description 6
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 6
- 108010074860 Factor Xa Proteins 0.000 description 6
- GWCJMBNBFYBQCV-XPUUQOCRSA-N Gly-Val-Ala Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O GWCJMBNBFYBQCV-XPUUQOCRSA-N 0.000 description 6
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 6
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 6
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 6
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 6
- GHAZCVNUKKZTLG-UHFFFAOYSA-N N-ethyl-succinimide Natural products CCN1C(=O)CCC1=O GHAZCVNUKKZTLG-UHFFFAOYSA-N 0.000 description 6
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 6
- 108091093037 Peptide nucleic acid Proteins 0.000 description 6
- 108010055817 Peptide-N4-(N-acetyl-beta-glucosaminyl) Asparagine Amidase Proteins 0.000 description 6
- 102000000447 Peptide-N4-(N-acetyl-beta-glucosaminyl) Asparagine Amidase Human genes 0.000 description 6
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 6
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 6
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 6
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 6
- KKHRWGYHBZORMQ-NHCYSSNCSA-N Val-Arg-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKHRWGYHBZORMQ-NHCYSSNCSA-N 0.000 description 6
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 6
- 108090000637 alpha-Amylases Proteins 0.000 description 6
- 102000004139 alpha-Amylases Human genes 0.000 description 6
- 229940024171 alpha-amylase Drugs 0.000 description 6
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 6
- 125000000837 carbohydrate group Chemical group 0.000 description 6
- 238000010790 dilution Methods 0.000 description 6
- 239000012895 dilution Substances 0.000 description 6
- 238000004128 high performance liquid chromatography Methods 0.000 description 6
- 125000005647 linker group Chemical group 0.000 description 6
- 239000002502 liposome Substances 0.000 description 6
- VIKNJXKGJWUCNN-XGXHKTLJSA-N norethisterone Chemical compound O=C1CC[C@@H]2[C@H]3CC[C@](C)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 VIKNJXKGJWUCNN-XGXHKTLJSA-N 0.000 description 6
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 6
- 230000006641 stabilisation Effects 0.000 description 6
- 238000011105 stabilization Methods 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- 238000002255 vaccination Methods 0.000 description 6
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 5
- 208000002109 Argyria Diseases 0.000 description 5
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 5
- 108090001008 Avidin Proteins 0.000 description 5
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 5
- CMYVIUWVYHOLRD-ZLUOBGJFSA-N Cys-Ser-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CMYVIUWVYHOLRD-ZLUOBGJFSA-N 0.000 description 5
- 108010058643 Fungal Proteins Proteins 0.000 description 5
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 5
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 5
- 108700039791 Hepatitis C virus nucleocapsid Proteins 0.000 description 5
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 5
- NNVXABCGXOLIEB-PYJNHQTQSA-N Ile-Met-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NNVXABCGXOLIEB-PYJNHQTQSA-N 0.000 description 5
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 5
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 5
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 5
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 5
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 5
- 108010076039 Polyproteins Proteins 0.000 description 5
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 5
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 5
- 239000004365 Protease Substances 0.000 description 5
- 229920002684 Sepharose Polymers 0.000 description 5
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 5
- 229930006000 Sucrose Natural products 0.000 description 5
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 5
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 238000001042 affinity chromatography Methods 0.000 description 5
- 239000002168 alkylating agent Substances 0.000 description 5
- 229940100198 alkylating agent Drugs 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 125000002619 bicyclic group Chemical group 0.000 description 5
- 238000005119 centrifugation Methods 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 230000002950 deficient Effects 0.000 description 5
- 239000007857 degradation product Substances 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 238000002296 dynamic light scattering Methods 0.000 description 5
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 5
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 210000004379 membrane Anatomy 0.000 description 5
- 239000003607 modifier Substances 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 230000000717 retained effect Effects 0.000 description 5
- 238000012807 shake-flask culturing Methods 0.000 description 5
- 238000010186 staining Methods 0.000 description 5
- 239000005720 sucrose Substances 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- SBKVPJHMSUXZTA-MEJXFZFPSA-N (2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-5-amino-2-[[2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-(1H-indol-3-yl)propanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-methylpentanoyl]amino]-5-oxopentanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]-5-oxopentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylsulfanylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 SBKVPJHMSUXZTA-MEJXFZFPSA-N 0.000 description 4
- SVTBMSDMJJWYQN-UHFFFAOYSA-N 2-methylpentane-2,4-diol Chemical compound CC(O)CC(C)(C)O SVTBMSDMJJWYQN-UHFFFAOYSA-N 0.000 description 4
- FOWHQTWRLFTELJ-FXQIFTODSA-N Ala-Asp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N FOWHQTWRLFTELJ-FXQIFTODSA-N 0.000 description 4
- FCXAUASCMJOFEY-NDKCEZKHSA-N Ala-Leu-Thr-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O FCXAUASCMJOFEY-NDKCEZKHSA-N 0.000 description 4
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 4
- 101710095342 Apolipoprotein B Proteins 0.000 description 4
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 4
- 102000007592 Apolipoproteins Human genes 0.000 description 4
- 108010071619 Apolipoproteins Proteins 0.000 description 4
- JTZUZBADHGISJD-SRVKXCTJSA-N Arg-His-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JTZUZBADHGISJD-SRVKXCTJSA-N 0.000 description 4
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 4
- ZRAOLTNMSCSCLN-ZLUOBGJFSA-N Asp-Cys-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)O ZRAOLTNMSCSCLN-ZLUOBGJFSA-N 0.000 description 4
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 4
- 101800002780 Crustacean hyperglycemic hormone Proteins 0.000 description 4
- JIVJXVJMOBVCJF-ZLUOBGJFSA-N Cys-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)C(=O)N JIVJXVJMOBVCJF-ZLUOBGJFSA-N 0.000 description 4
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 4
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 4
- 241000206602 Eukaryota Species 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- 102000007330 LDL Lipoproteins Human genes 0.000 description 4
- 108010007622 LDL Lipoproteins Proteins 0.000 description 4
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 4
- 108010038049 Mating Factor Proteins 0.000 description 4
- VAGCEUUEMMXFEX-GUBZILKMSA-N Met-Met-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(O)=O VAGCEUUEMMXFEX-GUBZILKMSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- 239000000020 Nitrocellulose Substances 0.000 description 4
- 101800001020 Non-structural protein 4A Proteins 0.000 description 4
- 101800001019 Non-structural protein 4B Proteins 0.000 description 4
- 101800001014 Non-structural protein 5A Proteins 0.000 description 4
- 102000003992 Peroxidases Human genes 0.000 description 4
- 108091000080 Phosphotransferase Proteins 0.000 description 4
- QNZLIVROMORQFH-BQBZGAKWSA-N Pro-Gly-Cys Chemical compound C1C[C@H](NC1)C(=O)NCC(=O)N[C@@H](CS)C(=O)O QNZLIVROMORQFH-BQBZGAKWSA-N 0.000 description 4
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 4
- 101800001554 RNA-directed RNA polymerase Proteins 0.000 description 4
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 4
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 4
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 4
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 4
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 4
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 4
- PMIJXCLOQFMOKZ-BPUTZDHNSA-N Trp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PMIJXCLOQFMOKZ-BPUTZDHNSA-N 0.000 description 4
- BEGDZYNDCNEGJZ-XVKPBYJWSA-N Val-Gly-Gln Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O BEGDZYNDCNEGJZ-XVKPBYJWSA-N 0.000 description 4
- HPOSMQWRPMRMFO-GUBZILKMSA-N Val-Pro-Cys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HPOSMQWRPMRMFO-GUBZILKMSA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 230000000692 anti-sense effect Effects 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 239000003638 chemical reducing agent Substances 0.000 description 4
- 238000011210 chromatographic step Methods 0.000 description 4
- 108010016616 cysteinylglycine Proteins 0.000 description 4
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000003599 detergent Substances 0.000 description 4
- 239000012990 dithiocarbamate Substances 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 238000001502 gel electrophoresis Methods 0.000 description 4
- 108091005608 glycosylated proteins Proteins 0.000 description 4
- 102000035122 glycosylated proteins Human genes 0.000 description 4
- 229910052736 halogen Inorganic materials 0.000 description 4
- 150000002367 halogens Chemical class 0.000 description 4
- 150000002632 lipids Chemical class 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 229950006780 n-acetylglucosamine Drugs 0.000 description 4
- 229920001220 nitrocellulos Polymers 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 108040007629 peroxidase activity proteins Proteins 0.000 description 4
- 102000020233 phosphotransferase Human genes 0.000 description 4
- 239000002244 precipitate Substances 0.000 description 4
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 4
- 235000019419 proteases Nutrition 0.000 description 4
- 230000001681 protective effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- GEHJYWRUCIMESM-UHFFFAOYSA-L sodium sulfite Chemical compound [Na+].[Na+].[O-]S([O-])=O GEHJYWRUCIMESM-UHFFFAOYSA-L 0.000 description 4
- 229910052717 sulfur Inorganic materials 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 239000007222 ypd medium Substances 0.000 description 4
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 3
- NGYHUCPPLJOZIX-XLPZGREQSA-N 5-methyl-dCTP Chemical compound O=C1N=C(N)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NGYHUCPPLJOZIX-XLPZGREQSA-N 0.000 description 3
- 108700016155 Acyl transferases Proteins 0.000 description 3
- 102000057234 Acyl transferases Human genes 0.000 description 3
- 229920001817 Agar Polymers 0.000 description 3
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 3
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 3
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 3
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 3
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 3
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 101150096839 Fcmr gene Proteins 0.000 description 3
- 244000182067 Fraxinus ornus Species 0.000 description 3
- 235000002917 Fraxinus ornus Nutrition 0.000 description 3
- KLJMRPIBBLTDGE-ACZMJKKPSA-N Glu-Cys-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O KLJMRPIBBLTDGE-ACZMJKKPSA-N 0.000 description 3
- 108090000288 Glycoproteins Proteins 0.000 description 3
- 102000003886 Glycoproteins Human genes 0.000 description 3
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 3
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 3
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 3
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 3
- 101001018085 Lysobacter enzymogenes Lysyl endopeptidase Proteins 0.000 description 3
- MUDYEFAKNSTFAI-JYJNAYRXSA-N Met-Tyr-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O MUDYEFAKNSTFAI-JYJNAYRXSA-N 0.000 description 3
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 3
- 101710144128 Non-structural protein 2 Proteins 0.000 description 3
- 101710199667 Nuclear export protein Proteins 0.000 description 3
- 241001580565 Peachia Species 0.000 description 3
- 239000001888 Peptone Substances 0.000 description 3
- 108010080698 Peptones Proteins 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 3
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 3
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 3
- 108010090804 Streptavidin Proteins 0.000 description 3
- 101000895926 Streptomyces plicatus Endo-beta-N-acetylglucosaminidase H Proteins 0.000 description 3
- 101710172711 Structural protein Proteins 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 3
- 102000002933 Thioredoxin Human genes 0.000 description 3
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 3
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 3
- 108090000631 Trypsin Proteins 0.000 description 3
- 102000004142 Trypsin Human genes 0.000 description 3
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 3
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 3
- MIKHIIQMRFYVOR-RCWTZXSCSA-N Val-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C(C)C)N)O MIKHIIQMRFYVOR-RCWTZXSCSA-N 0.000 description 3
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 3
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 3
- 230000001154 acute effect Effects 0.000 description 3
- 239000008272 agar Substances 0.000 description 3
- 206010003246 arthritis Diseases 0.000 description 3
- 238000002820 assay format Methods 0.000 description 3
- 229910052789 astatine Inorganic materials 0.000 description 3
- 239000012472 biological sample Substances 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 239000006285 cell suspension Substances 0.000 description 3
- 230000003196 chaotropic effect Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 239000011248 coating agent Substances 0.000 description 3
- 238000000576 coating method Methods 0.000 description 3
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 3
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 3
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 3
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 3
- 150000002019 disulfides Chemical class 0.000 description 3
- VHJLVAABSRFDPM-ZXZARUISSA-N dithioerythritol Chemical compound SC[C@H](O)[C@H](O)CS VHJLVAABSRFDPM-ZXZARUISSA-N 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000001962 electrophoresis Methods 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 125000000524 functional group Chemical group 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 235000004554 glutamine Nutrition 0.000 description 3
- 150000004676 glycans Chemical class 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 108010077515 glycylproline Proteins 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 210000002288 golgi apparatus Anatomy 0.000 description 3
- 208000006454 hepatitis Diseases 0.000 description 3
- 208000002672 hepatitis B Diseases 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 238000011081 inoculation Methods 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 238000010255 intramuscular injection Methods 0.000 description 3
- 239000007927 intramuscular injection Substances 0.000 description 3
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000002934 lysing effect Effects 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 235000006109 methionine Nutrition 0.000 description 3
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 3
- 235000019319 peptone Nutrition 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 108010029020 prolylglycine Proteins 0.000 description 3
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 3
- 239000013014 purified material Substances 0.000 description 3
- 239000012264 purified product Substances 0.000 description 3
- 239000011535 reaction buffer Substances 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000004043 responsiveness Effects 0.000 description 3
- 239000012279 sodium borohydride Substances 0.000 description 3
- 229910000033 sodium borohydride Inorganic materials 0.000 description 3
- HAEPBEMBOAIUPN-UHFFFAOYSA-L sodium tetrathionate Chemical compound O.O.[Na+].[Na+].[O-]S(=O)(=O)SSS([O-])(=O)=O HAEPBEMBOAIUPN-UHFFFAOYSA-L 0.000 description 3
- 239000012798 spherical particle Substances 0.000 description 3
- 238000003756 stirring Methods 0.000 description 3
- 238000010254 subcutaneous injection Methods 0.000 description 3
- 239000007929 subcutaneous injection Substances 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 239000011593 sulfur Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 150000007970 thio esters Chemical class 0.000 description 3
- 108060008226 thioredoxin Proteins 0.000 description 3
- 229940094937 thioredoxin Drugs 0.000 description 3
- 238000004448 titration Methods 0.000 description 3
- 239000012588 trypsin Substances 0.000 description 3
- 108010029384 tryptophyl-histidine Proteins 0.000 description 3
- 238000000108 ultra-filtration Methods 0.000 description 3
- 210000003501 vero cell Anatomy 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 3
- DRHZYJAUECRAJM-DWSYSWFDSA-N (2s,3s,4s,5r,6r)-6-[[(3s,4s,4ar,6ar,6bs,8r,8ar,12as,14ar,14br)-8a-[(2s,3r,4s,5r,6r)-3-[(2s,3r,4s,5r,6s)-5-[(2s,3r,4s,5r)-4-[(2s,3r,4r)-3,4-dihydroxy-4-(hydroxymethyl)oxolan-2-yl]oxy-3,5-dihydroxyoxan-2-yl]oxy-3,4-dihydroxy-6-methyloxan-2-yl]oxy-5-[(3s,5s, Chemical compound O([C@H]1[C@H](O)[C@H](O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@H]5CC(C)(C)CC[C@@]5([C@@H](C[C@@]4(C)[C@]3(C)CC[C@H]2[C@@]1(C=O)C)O)C(=O)O[C@@H]1O[C@H](C)[C@@H]([C@@H]([C@H]1O[C@H]1[C@@H]([C@H](O)[C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@](O)(CO)CO3)O)[C@H](O)CO2)O)[C@H](C)O1)O)O)OC(=O)C[C@@H](O)C[C@H](OC(=O)C[C@@H](O)C[C@@H]([C@@H](C)CC)O[C@H]1[C@@H]([C@@H](O)[C@H](CO)O1)O)[C@@H](C)CC)C(O)=O)[C@@H]1OC[C@@H](O)[C@H](O)[C@H]1O DRHZYJAUECRAJM-DWSYSWFDSA-N 0.000 description 2
- QFRHEHPVTSCSIH-UHFFFAOYSA-N 2,2,2-trifluoro-n-(2-iodoethyl)acetamide Chemical compound FC(F)(F)C(=O)NCCI QFRHEHPVTSCSIH-UHFFFAOYSA-N 0.000 description 2
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- HKJKONMZMPUGHJ-UHFFFAOYSA-N 4-amino-5-hydroxy-3-[(4-nitrophenyl)diazenyl]-6-phenyldiazenylnaphthalene-2,7-disulfonic acid Chemical compound OS(=O)(=O)C1=CC2=CC(S(O)(=O)=O)=C(N=NC=3C=CC=CC=3)C(O)=C2C(N)=C1N=NC1=CC=C([N+]([O-])=O)C=C1 HKJKONMZMPUGHJ-UHFFFAOYSA-N 0.000 description 2
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 2
- GFBLJMHGHAXGNY-ZLUOBGJFSA-N Ala-Asn-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GFBLJMHGHAXGNY-ZLUOBGJFSA-N 0.000 description 2
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 2
- HFBFSOAKPUZCCO-ZLUOBGJFSA-N Ala-Cys-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HFBFSOAKPUZCCO-ZLUOBGJFSA-N 0.000 description 2
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 2
- BDQNLQSWRAPHGU-DLOVCJGASA-N Ala-Phe-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N BDQNLQSWRAPHGU-DLOVCJGASA-N 0.000 description 2
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 2
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 2
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 2
- CREYEAPXISDKSB-FQPOAREZSA-N Ala-Thr-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CREYEAPXISDKSB-FQPOAREZSA-N 0.000 description 2
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 2
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 241000024188 Andala Species 0.000 description 2
- PCQXGEUALSFGIA-WDSOQIARSA-N Arg-His-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PCQXGEUALSFGIA-WDSOQIARSA-N 0.000 description 2
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 2
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 2
- YLVGUOGAFAJMKP-JYJNAYRXSA-N Arg-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YLVGUOGAFAJMKP-JYJNAYRXSA-N 0.000 description 2
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 2
- FOQFHANLUJDQEE-GUBZILKMSA-N Arg-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CS)C(=O)O FOQFHANLUJDQEE-GUBZILKMSA-N 0.000 description 2
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 2
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 2
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 2
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- HLTLEIXYIJDFOY-ZLUOBGJFSA-N Asn-Cys-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O HLTLEIXYIJDFOY-ZLUOBGJFSA-N 0.000 description 2
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 2
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 2
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 2
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 2
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 2
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- NOWKCMXCCJGMRR-UHFFFAOYSA-N Aziridine Chemical compound C1CN1 NOWKCMXCCJGMRR-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 230000005653 Brownian motion process Effects 0.000 description 2
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 2
- 241000238154 Carcinus maenas Species 0.000 description 2
- QRYRORQUOLYVBU-VBKZILBWSA-N Carnosic acid Natural products CC([C@@H]1CC2)(C)CCC[C@]1(C(O)=O)C1=C2C=C(C(C)C)C(O)=C1O QRYRORQUOLYVBU-VBKZILBWSA-N 0.000 description 2
- 108010087806 Carnosine Proteins 0.000 description 2
- 102000003902 Cathepsin C Human genes 0.000 description 2
- 108090000267 Cathepsin C Proteins 0.000 description 2
- DCXGXDGGXVZVMY-GHCJXIJMSA-N Cys-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CS DCXGXDGGXVZVMY-GHCJXIJMSA-N 0.000 description 2
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 2
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 2
- HBHMVBGGHDMPBF-GARJFASQSA-N Cys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N HBHMVBGGHDMPBF-GARJFASQSA-N 0.000 description 2
- UDDITVWSXPEAIQ-IHRRRGAJSA-N Cys-Phe-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UDDITVWSXPEAIQ-IHRRRGAJSA-N 0.000 description 2
- QQOWCDCBFFBRQH-IXOXFDKPSA-N Cys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N)O QQOWCDCBFFBRQH-IXOXFDKPSA-N 0.000 description 2
- KFYPRIGJTICABD-XGEHTFHBSA-N Cys-Thr-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N)O KFYPRIGJTICABD-XGEHTFHBSA-N 0.000 description 2
- PNEAWXSKCKCHDK-XIRDDKMYSA-N Cys-Trp-His Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CS)N)C(O)=O)C1=CN=CN1 PNEAWXSKCKCHDK-XIRDDKMYSA-N 0.000 description 2
- 101100223032 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) dapB gene Proteins 0.000 description 2
- QUSNBJAOOMFDIB-UHFFFAOYSA-N Ethylamine Chemical compound CCN QUSNBJAOOMFDIB-UHFFFAOYSA-N 0.000 description 2
- NXPXQIZKDOXIHH-JSGCOSHPSA-N Gln-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N NXPXQIZKDOXIHH-JSGCOSHPSA-N 0.000 description 2
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 2
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 2
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 2
- XUMFMAVDHQDATI-DCAQKATOSA-N Gln-Pro-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUMFMAVDHQDATI-DCAQKATOSA-N 0.000 description 2
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 2
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 2
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- GNBMOZPQUXTCRW-STQMWFEESA-N Gly-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)CN)C(O)=O)=CNC2=C1 GNBMOZPQUXTCRW-STQMWFEESA-N 0.000 description 2
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 2
- UEGIPZAXNBYCCP-NKWVEPMBSA-N Gly-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)CN)C(=O)O UEGIPZAXNBYCCP-NKWVEPMBSA-N 0.000 description 2
- DHDOADIPGZTAHT-YUMQZZPRSA-N Gly-Glu-Arg Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DHDOADIPGZTAHT-YUMQZZPRSA-N 0.000 description 2
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 2
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 2
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- 229940121672 Glycosylation inhibitor Drugs 0.000 description 2
- XWUIHCZETFNRPA-IHPCNDPISA-N His-His-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 XWUIHCZETFNRPA-IHPCNDPISA-N 0.000 description 2
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 2
- JVEKQAYXFGIISZ-HOCLYGCPSA-N His-Trp-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JVEKQAYXFGIISZ-HOCLYGCPSA-N 0.000 description 2
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 2
- 108091006054 His-tagged proteins Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- QIGBRXMKCJKVMJ-UHFFFAOYSA-N Hydroquinone Chemical compound OC1=CC=C(O)C=C1 QIGBRXMKCJKVMJ-UHFFFAOYSA-N 0.000 description 2
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 2
- 241000257303 Hymenoptera Species 0.000 description 2
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 2
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 2
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 101150045458 KEX2 gene Proteins 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 2
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 2
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 2
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 2
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 2
- ALEVUGKHINJNIF-QEJZJMRPSA-N Lys-Phe-Ala Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ALEVUGKHINJNIF-QEJZJMRPSA-N 0.000 description 2
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 2
- VEKRTVRZDMUOQN-AVGNSLFASA-N Met-Val-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 VEKRTVRZDMUOQN-AVGNSLFASA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- CQOVPNPJLQNMDC-UHFFFAOYSA-N N-beta-alanyl-L-histidine Natural products NCCC(=O)NC(C(O)=O)CC1=CN=CN1 CQOVPNPJLQNMDC-UHFFFAOYSA-N 0.000 description 2
- 239000002033 PVDF binder Substances 0.000 description 2
- 108010030544 Peptidyl-Lys metalloendopeptidase Proteins 0.000 description 2
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 2
- MMYUOSCXBJFUNV-QWRGUYRKSA-N Phe-Gly-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N MMYUOSCXBJFUNV-QWRGUYRKSA-N 0.000 description 2
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 2
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 2
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 2
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 2
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 2
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 2
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 2
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 2
- 108091028664 Ribonucleotide Chemical class 0.000 description 2
- 101150028158 STE13 gene Proteins 0.000 description 2
- 241001123650 Schwanniomyces occidentalis Species 0.000 description 2
- IYCBDVBJWDXQRR-FXQIFTODSA-N Ser-Ala-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IYCBDVBJWDXQRR-FXQIFTODSA-N 0.000 description 2
- VAIZFHMTBFYJIA-ACZMJKKPSA-N Ser-Asp-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O VAIZFHMTBFYJIA-ACZMJKKPSA-N 0.000 description 2
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 2
- GJFYFGOEWLDQGW-GUBZILKMSA-N Ser-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N GJFYFGOEWLDQGW-GUBZILKMSA-N 0.000 description 2
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 2
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 2
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 230000005867 T cell response Effects 0.000 description 2
- 102000005488 Thioesterase Human genes 0.000 description 2
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 2
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 2
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 2
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 2
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 2
- FRQRWAMUESPWMT-HSHDSVGOSA-N Thr-Trp-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N)O FRQRWAMUESPWMT-HSHDSVGOSA-N 0.000 description 2
- LVRFMARKDGGZMX-IZPVPAKOSA-N Thr-Tyr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=C(O)C=C1 LVRFMARKDGGZMX-IZPVPAKOSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 2
- MDDYTWOFHZFABW-SZMVWBNQSA-N Trp-Gln-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 MDDYTWOFHZFABW-SZMVWBNQSA-N 0.000 description 2
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 2
- QHWMVGCEQAPQDK-UMPQAUOISA-N Trp-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O QHWMVGCEQAPQDK-UMPQAUOISA-N 0.000 description 2
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 2
- YJQCOFNZVFGCAF-UHFFFAOYSA-N Tunicamycin II Natural products O1C(CC(O)C2C(C(O)C(O2)N2C(NC(=O)C=C2)=O)O)C(O)C(O)C(NC(=O)C=CCCCCCCCCC(C)C)C1OC1OC(CO)C(O)C(O)C1NC(C)=O YJQCOFNZVFGCAF-UHFFFAOYSA-N 0.000 description 2
- OOEUVMFKKZYSRX-LEWSCRJBSA-N Tyr-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OOEUVMFKKZYSRX-LEWSCRJBSA-N 0.000 description 2
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 2
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 2
- MXFPBNFKVBHIRW-BZSNNMDCSA-N Tyr-Lys-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O MXFPBNFKVBHIRW-BZSNNMDCSA-N 0.000 description 2
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 2
- VPEFOFYNHBWFNQ-UFYCRDLUSA-N Tyr-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 VPEFOFYNHBWFNQ-UFYCRDLUSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 2
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 2
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 2
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 2
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 2
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 2
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 2
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 2
- AEFJNECXZCODJM-UWVGGRQHSA-N Val-Val-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)NCC([O-])=O AEFJNECXZCODJM-UWVGGRQHSA-N 0.000 description 2
- 108010084455 Zeocin Proteins 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- HAXFWIACAGNFHA-UHFFFAOYSA-N aldrithiol Chemical compound C=1C=CC=NC=1SSC1=CC=CC=N1 HAXFWIACAGNFHA-UHFFFAOYSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 229940037003 alum Drugs 0.000 description 2
- 230000001745 anti-biotin effect Effects 0.000 description 2
- 239000002518 antifoaming agent Substances 0.000 description 2
- 239000003963 antioxidant agent Substances 0.000 description 2
- 235000006708 antioxidants Nutrition 0.000 description 2
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 238000005537 brownian motion Methods 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- DKVNPHBNOWQYFE-UHFFFAOYSA-N carbamodithioic acid Chemical compound NC(S)=S DKVNPHBNOWQYFE-UHFFFAOYSA-N 0.000 description 2
- 229940044199 carnosine Drugs 0.000 description 2
- CQOVPNPJLQNMDC-ZETCQYMHSA-N carnosine Chemical compound [NH3+]CCC(=O)N[C@H](C([O-])=O)CC1=CNC=N1 CQOVPNPJLQNMDC-ZETCQYMHSA-N 0.000 description 2
- 239000003054 catalyst Substances 0.000 description 2
- 238000013354 cell banking Methods 0.000 description 2
- 230000007969 cellular immunity Effects 0.000 description 2
- 230000036755 cellular response Effects 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000009918 complex formation Effects 0.000 description 2
- 239000012141 concentrate Substances 0.000 description 2
- 239000002577 cryoprotective agent Substances 0.000 description 2
- 108010060199 cysteinylproline Proteins 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000022811 deglycosylation Effects 0.000 description 2
- 239000008367 deionised water Substances 0.000 description 2
- 229910021641 deionized water Inorganic materials 0.000 description 2
- 239000005547 deoxyribonucleotide Chemical class 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical class 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- VLYUGYAKYZETRF-UHFFFAOYSA-N dihydrolipoamide Chemical compound NC(=O)CCCCC(S)CCS VLYUGYAKYZETRF-UHFFFAOYSA-N 0.000 description 2
- 238000007865 diluting Methods 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 150000004659 dithiocarbamates Chemical class 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000005886 esterification reaction Methods 0.000 description 2
- 238000010195 expression analysis Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005194 fractionation Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 2
- 210000002443 helper t lymphocyte Anatomy 0.000 description 2
- 231100000283 hepatitis Toxicity 0.000 description 2
- 229940051250 hexylene glycol Drugs 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 125000001183 hydrocarbyl group Chemical group 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 229940072221 immunoglobulins Drugs 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- JDNTWHVOXJZDSN-UHFFFAOYSA-N iodoacetic acid Chemical compound OC(=O)CI JDNTWHVOXJZDSN-UHFFFAOYSA-N 0.000 description 2
- INQOMBQAUSQDDS-UHFFFAOYSA-N iodomethane Chemical compound IC INQOMBQAUSQDDS-UHFFFAOYSA-N 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 239000004816 latex Substances 0.000 description 2
- 229920000126 latex Polymers 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010091871 leucylmethionine Proteins 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 230000001589 lymphoproliferative effect Effects 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 235000018977 lysine Nutrition 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 238000013411 master cell bank Methods 0.000 description 2
- 238000001906 matrix-assisted laser desorption--ionisation mass spectrometry Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000002483 medication Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 235000013336 milk Nutrition 0.000 description 2
- 239000008267 milk Substances 0.000 description 2
- 210000004080 milk Anatomy 0.000 description 2
- 239000003068 molecular probe Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 229940126619 mouse monoclonal antibody Drugs 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 229940021993 prophylactic vaccine Drugs 0.000 description 2
- 238000011321 prophylaxis Methods 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 230000002797 proteolythic effect Effects 0.000 description 2
- 239000008213 purified water Substances 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 239000002336 ribonucleotide Chemical class 0.000 description 2
- 125000002652 ribonucleotide group Chemical class 0.000 description 2
- 210000003935 rough endoplasmic reticulum Anatomy 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 229910052709 silver Inorganic materials 0.000 description 2
- 239000004332 silver Substances 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 235000010265 sodium sulphite Nutrition 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 229940021747 therapeutic vaccine Drugs 0.000 description 2
- 108020002982 thioesterase Proteins 0.000 description 2
- 125000003396 thiol group Chemical group [H]S* 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical group CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 239000013638 trimer Substances 0.000 description 2
- ZHSGGJXRNHWHRS-VIDYELAYSA-N tunicamycin Chemical compound O([C@H]1[C@@H]([C@H]([C@@H](O)[C@@H](CC(O)[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C(NC(=O)C=C2)=O)O)O1)O)NC(=O)/C=C/CC(C)C)[C@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1NC(C)=O ZHSGGJXRNHWHRS-VIDYELAYSA-N 0.000 description 2
- MEYZYGMYMLNUHJ-UHFFFAOYSA-N tunicamycin Natural products CC(C)CCCCCCCCCC=CC(=O)NC1C(O)C(O)C(CC(O)C2OC(C(O)C2O)N3C=CC(=O)NC3=O)OC1OC4OC(CO)C(O)C(O)C4NC(=O)C MEYZYGMYMLNUHJ-UHFFFAOYSA-N 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 239000003643 water by type Substances 0.000 description 2
- IGXNPQWXIRIGBF-KEOOTSPTSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoyl]amino]-3-(1h-imidazol-5-yl)propanoic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IGXNPQWXIRIGBF-KEOOTSPTSA-N 0.000 description 1
- NPWMTBZSRRLQNJ-VKHMYHEASA-N (3s)-3-aminopiperidine-2,6-dione Chemical compound N[C@H]1CCC(=O)NC1=O NPWMTBZSRRLQNJ-VKHMYHEASA-N 0.000 description 1
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- GZCWLCBFPRFLKL-UHFFFAOYSA-N 1-prop-2-ynoxypropan-2-ol Chemical compound CC(O)COCC#C GZCWLCBFPRFLKL-UHFFFAOYSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- YWXCBLUCVBSYNJ-UHFFFAOYSA-N 2-(2-sulfanylethylsulfonyl)ethanethiol Chemical compound SCCS(=O)(=O)CCS YWXCBLUCVBSYNJ-UHFFFAOYSA-N 0.000 description 1
- WFIYPADYPQQLNN-UHFFFAOYSA-N 2-[2-(4-bromopyrazol-1-yl)ethyl]isoindole-1,3-dione Chemical compound C1=C(Br)C=NN1CCN1C(=O)C2=CC=CC=C2C1=O WFIYPADYPQQLNN-UHFFFAOYSA-N 0.000 description 1
- IZQAUUVBKYXMET-UHFFFAOYSA-N 2-bromoethanamine Chemical compound NCCBr IZQAUUVBKYXMET-UHFFFAOYSA-N 0.000 description 1
- SJMLATCMQNTURW-UHFFFAOYSA-N 2-sulfanyl-n'-(2-sulfanylacetyl)acetohydrazide Chemical compound SCC(=O)NNC(=O)CS SJMLATCMQNTURW-UHFFFAOYSA-N 0.000 description 1
- KIUMMUBSPKGMOY-UHFFFAOYSA-N 3,3'-Dithiobis(6-nitrobenzoic acid) Chemical compound C1=C([N+]([O-])=O)C(C(=O)O)=CC(SSC=2C=C(C(=CC=2)[N+]([O-])=O)C(O)=O)=C1 KIUMMUBSPKGMOY-UHFFFAOYSA-N 0.000 description 1
- CYWHLOXWVAWMFO-UHFFFAOYSA-N 3-sulfanyl-1h-pyridine-2-thione Chemical compound SC1=CC=CN=C1S CYWHLOXWVAWMFO-UHFFFAOYSA-N 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- 108010051457 Acid Phosphatase Proteins 0.000 description 1
- 102000013563 Acid Phosphatase Human genes 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 1
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 1
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 1
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- BGGAIXWIZCIFSG-XDTLVQLUSA-N Ala-Tyr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O BGGAIXWIZCIFSG-XDTLVQLUSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108700023418 Amidases Proteins 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 101100448366 Arabidopsis thaliana GH3.12 gene Proteins 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- YHSNASXGBPAHRL-BPUTZDHNSA-N Arg-Cys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N YHSNASXGBPAHRL-BPUTZDHNSA-N 0.000 description 1
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- OCDJOVKIUJVUMO-SRVKXCTJSA-N Arg-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N OCDJOVKIUJVUMO-SRVKXCTJSA-N 0.000 description 1
- MMGCRPZQZWTZTA-IHRRRGAJSA-N Arg-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N MMGCRPZQZWTZTA-IHRRRGAJSA-N 0.000 description 1
- ITHMWNNUDPJJER-ULQDDVLXSA-N Arg-His-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ITHMWNNUDPJJER-ULQDDVLXSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- DIIGDGJKTMLQQW-IHRRRGAJSA-N Arg-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N DIIGDGJKTMLQQW-IHRRRGAJSA-N 0.000 description 1
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 1
- IGFJVXOATGZTHD-UHFFFAOYSA-N Arg-Phe-His Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccccc1)C(=O)NC(Cc2c[nH]cn2)C(=O)O IGFJVXOATGZTHD-UHFFFAOYSA-N 0.000 description 1
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- CDGHMJJJHYKMPA-DLOVCJGASA-N Asn-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC(=O)N)N CDGHMJJJHYKMPA-DLOVCJGASA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- CXBOKJPLEYUPGB-FXQIFTODSA-N Asp-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)O)N CXBOKJPLEYUPGB-FXQIFTODSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- WVDDGKGOMKODPV-UHFFFAOYSA-N Benzyl alcohol Chemical compound OCC1=CC=CC=C1 WVDDGKGOMKODPV-UHFFFAOYSA-N 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- BIBOEMPSFOZZEM-UFLZEWODSA-N C(C)N1C(C=CC1=O)=O.OC(=O)CCCC[C@@H]1SC[C@@H]2NC(=O)N[C@H]12 Chemical compound C(C)N1C(C=CC1=O)=O.OC(=O)CCCC[C@@H]1SC[C@@H]2NC(=O)N[C@H]12 BIBOEMPSFOZZEM-UFLZEWODSA-N 0.000 description 1
- 101100083253 Caenorhabditis elegans pho-1 gene Proteins 0.000 description 1
- 101001007681 Candida albicans (strain WO-1) Kexin Proteins 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 206010008909 Chronic Hepatitis Diseases 0.000 description 1
- 102000029816 Collagenase Human genes 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- 241001137251 Corvidae Species 0.000 description 1
- DEVDFMRWZASYOF-ZLUOBGJFSA-N Cys-Asn-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DEVDFMRWZASYOF-ZLUOBGJFSA-N 0.000 description 1
- ODDOYXKAHLKKQY-MMWGEVLESA-N Cys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N ODDOYXKAHLKKQY-MMWGEVLESA-N 0.000 description 1
- GGRDJANMZPGMNS-CIUDSAMLSA-N Cys-Ser-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O GGRDJANMZPGMNS-CIUDSAMLSA-N 0.000 description 1
- CLEFUAZULXANBU-MELADBBJSA-N Cys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CS)N)C(=O)O CLEFUAZULXANBU-MELADBBJSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 101710118188 DNA-binding protein HU-alpha Proteins 0.000 description 1
- 241000725619 Dengue virus Species 0.000 description 1
- 101710121417 Envelope glycoprotein Proteins 0.000 description 1
- 101710204837 Envelope small membrane protein Proteins 0.000 description 1
- 241001131785 Escherichia coli HB101 Species 0.000 description 1
- 108010091443 Exopeptidases Proteins 0.000 description 1
- 102000018389 Exopeptidases Human genes 0.000 description 1
- XZWYTXMRWQJBGX-VXBMVYAYSA-N FLAG peptide Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 XZWYTXMRWQJBGX-VXBMVYAYSA-N 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 101000893906 Fowl adenovirus A serotype 1 (strain CELO / Phelps) Protein GAM-1 Proteins 0.000 description 1
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 1
- 210000000712 G cell Anatomy 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 101000930822 Giardia intestinalis Dipeptidyl-peptidase 4 Proteins 0.000 description 1
- LKUWAWGNJYJODH-KBIXCLLPSA-N Gln-Ala-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LKUWAWGNJYJODH-KBIXCLLPSA-N 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- BVELAHPZLYLZDJ-HGNGGELXSA-N Gln-His-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O BVELAHPZLYLZDJ-HGNGGELXSA-N 0.000 description 1
- RDDSZZJOKDVPAE-ACZMJKKPSA-N Glu-Asn-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDDSZZJOKDVPAE-ACZMJKKPSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 102100022624 Glucoamylase Human genes 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- LXXANCRPFBSSKS-IUCAKERBSA-N Gly-Gln-Leu Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LXXANCRPFBSSKS-IUCAKERBSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- 229910004373 HOAc Inorganic materials 0.000 description 1
- 241000237369 Helix pomatia Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- HXKZJLWGSWQKEA-LSJOCFKGSA-N His-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CN=CN1 HXKZJLWGSWQKEA-LSJOCFKGSA-N 0.000 description 1
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 1
- STOOMQFEJUVAKR-KKUMJFAQSA-N His-His-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 STOOMQFEJUVAKR-KKUMJFAQSA-N 0.000 description 1
- 101000957351 Homo sapiens Myc-associated zinc finger protein Proteins 0.000 description 1
- LCWXJXMHJVIJFK-UHFFFAOYSA-N Hydroxylysine Natural products NCC(O)CC(N)CC(O)=O LCWXJXMHJVIJFK-UHFFFAOYSA-N 0.000 description 1
- 108050008546 Hyperglycemic hormone Proteins 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- TVSPLSZTKTUYLV-ZPFDUUQYSA-N Ile-Glu-Met Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O TVSPLSZTKTUYLV-ZPFDUUQYSA-N 0.000 description 1
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 1
- AYLAAGNJNVZDPY-CYDGBPFRSA-N Ile-Met-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N AYLAAGNJNVZDPY-CYDGBPFRSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- ANTFEOSJMAUGIB-KNZXXDILSA-N Ile-Thr-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N ANTFEOSJMAUGIB-KNZXXDILSA-N 0.000 description 1
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 1
- DTPGSUQHUMELQB-GVARAGBVSA-N Ile-Tyr-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 DTPGSUQHUMELQB-GVARAGBVSA-N 0.000 description 1
- ZSESFIFAYQEKRD-CYDGBPFRSA-N Ile-Val-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N ZSESFIFAYQEKRD-CYDGBPFRSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 229920001202 Inulin Polymers 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- PWKSKIMOESPYIA-BYPYZUCNSA-N L-N-acetyl-Cysteine Chemical compound CC(=O)N[C@@H](CS)C(O)=O PWKSKIMOESPYIA-BYPYZUCNSA-N 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- SSISHJJTAXXQAX-ZETCQYMHSA-N L-ergothioneine Chemical compound C[N+](C)(C)[C@H](C([O-])=O)CC1=CNC(=S)N1 SSISHJJTAXXQAX-ZETCQYMHSA-N 0.000 description 1
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- AUNMOHYWTAPQLA-XUXIUFHCSA-N Leu-Met-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AUNMOHYWTAPQLA-XUXIUFHCSA-N 0.000 description 1
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- 206010067125 Liver injury Diseases 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101710145006 Lysis protein Proteins 0.000 description 1
- 102100033468 Lysozyme C Human genes 0.000 description 1
- 108050000633 Lysozyme C Proteins 0.000 description 1
- 229920000057 Mannan Polymers 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- QGQGAIBGTUJRBR-NAKRPEOUSA-N Met-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCSC QGQGAIBGTUJRBR-NAKRPEOUSA-N 0.000 description 1
- FBQMBZLJHOQAIH-GUBZILKMSA-N Met-Asp-Met Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O FBQMBZLJHOQAIH-GUBZILKMSA-N 0.000 description 1
- RMHHNLKYPOOKQN-FXQIFTODSA-N Met-Cys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O RMHHNLKYPOOKQN-FXQIFTODSA-N 0.000 description 1
- JQHYVIKEFYETEW-IHRRRGAJSA-N Met-Phe-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=CC=C1 JQHYVIKEFYETEW-IHRRRGAJSA-N 0.000 description 1
- LQTGGXSOMDSWTQ-UNQGMJICSA-N Met-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCSC)N)O LQTGGXSOMDSWTQ-UNQGMJICSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- 101100068256 Mus musculus Serpine2 gene Proteins 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 102100038750 Myc-associated zinc finger protein Human genes 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- 102100038551 Peptide-N(4)-(N-acetyl-beta-glucosaminyl)asparagine amidase Human genes 0.000 description 1
- 208000037581 Persistent Infection Diseases 0.000 description 1
- HQCSLJFGZYOXHW-KKUMJFAQSA-N Phe-His-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N HQCSLJFGZYOXHW-KKUMJFAQSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 1
- JXQVYPWVGUOIDV-MXAVVETBSA-N Phe-Ser-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JXQVYPWVGUOIDV-MXAVVETBSA-N 0.000 description 1
- GKRCCTYAGQPMMP-IHRRRGAJSA-N Phe-Ser-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GKRCCTYAGQPMMP-IHRRRGAJSA-N 0.000 description 1
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 229920000954 Polyglycolide Polymers 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 1
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 1
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 241000582914 Saccharomyces uvarum Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000311088 Schwanniomyces Species 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- XTWXRUWACCXBMU-XIRDDKMYSA-N Ser-Trp-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)NC(=O)[C@H](CO)N XTWXRUWACCXBMU-XIRDDKMYSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000287219 Serinus canaria Species 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 1
- GNVMUORYQLCPJZ-UHFFFAOYSA-M Thiocarbamate Chemical compound NC([S-])=O GNVMUORYQLCPJZ-UHFFFAOYSA-M 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- UTSWGQNAQRIHAI-UNQGMJICSA-N Thr-Arg-Phe Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 UTSWGQNAQRIHAI-UNQGMJICSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- ODSAPYVQSLDRSR-LKXGYXEUSA-N Thr-Cys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O ODSAPYVQSLDRSR-LKXGYXEUSA-N 0.000 description 1
- VLIUBAATANYCOY-GBALPHGKSA-N Thr-Cys-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VLIUBAATANYCOY-GBALPHGKSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- YZUWGFXVVZQJEI-PMVVWTBXSA-N Thr-Gly-His Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O YZUWGFXVVZQJEI-PMVVWTBXSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 229920004898 Triton X-705 Polymers 0.000 description 1
- MQVGIFJSFFVGFW-XEGUGMAKSA-N Trp-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MQVGIFJSFFVGFW-XEGUGMAKSA-N 0.000 description 1
- HYVLNORXQGKONN-NUTKFTJISA-N Trp-Ala-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 HYVLNORXQGKONN-NUTKFTJISA-N 0.000 description 1
- PNKDNKGMEHJTJQ-BPUTZDHNSA-N Trp-Arg-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N PNKDNKGMEHJTJQ-BPUTZDHNSA-N 0.000 description 1
- NZCPCJCJZHKFGZ-AAEUAGOBSA-N Trp-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 NZCPCJCJZHKFGZ-AAEUAGOBSA-N 0.000 description 1
- JLTQXEOXIJMCLZ-ZVZYQTTQSA-N Trp-Gln-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 JLTQXEOXIJMCLZ-ZVZYQTTQSA-N 0.000 description 1
- FHVCMIMUGUFIOJ-IHPCNDPISA-N Trp-His-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CN=CN3)C(=O)N[C@@H](CC4=CN=CN4)C(=O)O)N FHVCMIMUGUFIOJ-IHPCNDPISA-N 0.000 description 1
- HNIWONZFMIPCCT-SIXJUCDHSA-N Trp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N HNIWONZFMIPCCT-SIXJUCDHSA-N 0.000 description 1
- RRXPAFGTFQIEMD-IVJVFBROSA-N Trp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N RRXPAFGTFQIEMD-IVJVFBROSA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- ZZDFLJFVSNQINX-HWHUXHBOSA-N Trp-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)O ZZDFLJFVSNQINX-HWHUXHBOSA-N 0.000 description 1
- UUZYQOUJTORBQO-ZVZYQTTQSA-N Trp-Val-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 UUZYQOUJTORBQO-ZVZYQTTQSA-N 0.000 description 1
- PALLCTDPFINNMM-JQHSSLGASA-N Trp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N PALLCTDPFINNMM-JQHSSLGASA-N 0.000 description 1
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- WPXKRJVHBXYLDT-JUKXBJQTSA-N Tyr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPXKRJVHBXYLDT-JUKXBJQTSA-N 0.000 description 1
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 1
- XYBNMHRFAUKPAW-IHRRRGAJSA-N Tyr-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XYBNMHRFAUKPAW-IHRRRGAJSA-N 0.000 description 1
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- HZWPGKAKGYJWCI-ULQDDVLXSA-N Tyr-Val-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(C)C)C(O)=O HZWPGKAKGYJWCI-ULQDDVLXSA-N 0.000 description 1
- LUEWUZLMQUOBSB-UHFFFAOYSA-N UNPD55895 Natural products OC1C(O)C(O)C(CO)OC1OC1C(CO)OC(OC2C(OC(OC3C(OC(O)C(O)C3O)CO)C(O)C2O)CO)C(O)C1O LUEWUZLMQUOBSB-UHFFFAOYSA-N 0.000 description 1
- 108010064997 VPY tripeptide Proteins 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- ZSZFTYVFQLUWBF-QXEWZRGKSA-N Val-Asp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N ZSZFTYVFQLUWBF-QXEWZRGKSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- MGVYZTPLGXPVQB-CYDGBPFRSA-N Val-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MGVYZTPLGXPVQB-CYDGBPFRSA-N 0.000 description 1
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 1
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 1
- ODUHAIXFXFACDY-SRVKXCTJSA-N Val-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C ODUHAIXFXFACDY-SRVKXCTJSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- UZQJVUCHXGYFLQ-AYDHOLPZSA-N [(2s,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-4-[(2r,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-3,5-dihydroxy-6-(hydroxymethyl)-4-[(2s,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-3,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-3,5-dihydroxy-6-(hy Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@]([C@@]3(CC[C@H]2[C@@]1(C=O)C)C)(C)CC(O)[C@]1(CCC(CC14)(C)C)C(=O)O[C@H]1[C@@H]([C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O[C@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UZQJVUCHXGYFLQ-AYDHOLPZSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 229960004308 acetylcysteine Drugs 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 108091005764 adaptor proteins Proteins 0.000 description 1
- 102000035181 adaptor proteins Human genes 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 230000000240 adjuvant effect Effects 0.000 description 1
- 238000012387 aerosolization Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 239000013566 allergen Substances 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 102000005840 alpha-Galactosidase Human genes 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- 102000005922 amidase Human genes 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 229940045713 antineoplastic alkylating drug ethylene imines Drugs 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- 229940072107 ascorbate Drugs 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229960004217 benzyl alcohol Drugs 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 1
- 230000009875 biological transport Effects 0.000 description 1
- 229920001400 block copolymer Polymers 0.000 description 1
- 239000010836 blood and blood product Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 229940125691 blood product Drugs 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 125000006297 carbonyl amino group Chemical group [H]N([*:2])C([*:1])=O 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 238000011097 chromatography purification Methods 0.000 description 1
- 239000012539 chromatography resin Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000007012 clinical effect Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- UFULAYFCSOUIOV-UHFFFAOYSA-N cysteamine Chemical compound NCCS UFULAYFCSOUIOV-UHFFFAOYSA-N 0.000 description 1
- 150000001944 cysteine derivatives Chemical class 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- YSMODUONRAFBET-UHFFFAOYSA-N delta-DL-hydroxylysine Natural products NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000030609 dephosphorylation Effects 0.000 description 1
- 238000006209 dephosphorylation reaction Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- XIMIGUBYDJDCKI-UHFFFAOYSA-N diselenium Chemical compound [Se]=[Se] XIMIGUBYDJDCKI-UHFFFAOYSA-N 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 125000002228 disulfide group Chemical group 0.000 description 1
- GRWZHXKQBITJKP-UHFFFAOYSA-L dithionite(2-) Chemical compound [O-]S(=O)S([O-])=O GRWZHXKQBITJKP-UHFFFAOYSA-L 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 108010003914 endoproteinase Asp-N Proteins 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000009585 enzyme analysis Methods 0.000 description 1
- 229940093497 ergothioneine Drugs 0.000 description 1
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical compound NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000006481 glucose medium Substances 0.000 description 1
- 102000003642 glutaminyl-peptide cyclotransferase Human genes 0.000 description 1
- 108010081484 glutaminyl-peptide cyclotransferase Proteins 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 1
- 230000001279 glycosylating effect Effects 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- LHGVFZTZFXWLCP-UHFFFAOYSA-N guaiacol Chemical compound COC1=CC=CC=C1O LHGVFZTZFXWLCP-UHFFFAOYSA-N 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 231100000234 hepatic damage Toxicity 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 229940006607 hirudin Drugs 0.000 description 1
- 229960002885 histidine Drugs 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- CUPFNGOKRMWUOO-UHFFFAOYSA-N hydron;difluoride Chemical compound F.F CUPFNGOKRMWUOO-UHFFFAOYSA-N 0.000 description 1
- QJHBJHUKURJDLG-UHFFFAOYSA-N hydroxy-L-lysine Natural products NCCCCC(NO)C(O)=O QJHBJHUKURJDLG-UHFFFAOYSA-N 0.000 description 1
- 201000001421 hyperglycemia Diseases 0.000 description 1
- 230000009610 hypersensitivity Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 239000002955 immunomodulating agent Substances 0.000 description 1
- 229940121354 immunomodulator Drugs 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 229940029339 inulin Drugs 0.000 description 1
- JYJIGFIDKWBXDU-MNNPPOADSA-N inulin Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)OC[C@]1(OC[C@]2(OC[C@]3(OC[C@]4(OC[C@]5(OC[C@]6(OC[C@]7(OC[C@]8(OC[C@]9(OC[C@]%10(OC[C@]%11(OC[C@]%12(OC[C@]%13(OC[C@]%14(OC[C@]%15(OC[C@]%16(OC[C@]%17(OC[C@]%18(OC[C@]%19(OC[C@]%20(OC[C@]%21(OC[C@]%22(OC[C@]%23(OC[C@]%24(OC[C@]%25(OC[C@]%26(OC[C@]%27(OC[C@]%28(OC[C@]%29(OC[C@]%30(OC[C@]%31(OC[C@]%32(OC[C@]%33(OC[C@]%34(OC[C@]%35(OC[C@]%36(O[C@@H]%37[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O%37)O)[C@H]([C@H](O)[C@@H](CO)O%36)O)[C@H]([C@H](O)[C@@H](CO)O%35)O)[C@H]([C@H](O)[C@@H](CO)O%34)O)[C@H]([C@H](O)[C@@H](CO)O%33)O)[C@H]([C@H](O)[C@@H](CO)O%32)O)[C@H]([C@H](O)[C@@H](CO)O%31)O)[C@H]([C@H](O)[C@@H](CO)O%30)O)[C@H]([C@H](O)[C@@H](CO)O%29)O)[C@H]([C@H](O)[C@@H](CO)O%28)O)[C@H]([C@H](O)[C@@H](CO)O%27)O)[C@H]([C@H](O)[C@@H](CO)O%26)O)[C@H]([C@H](O)[C@@H](CO)O%25)O)[C@H]([C@H](O)[C@@H](CO)O%24)O)[C@H]([C@H](O)[C@@H](CO)O%23)O)[C@H]([C@H](O)[C@@H](CO)O%22)O)[C@H]([C@H](O)[C@@H](CO)O%21)O)[C@H]([C@H](O)[C@@H](CO)O%20)O)[C@H]([C@H](O)[C@@H](CO)O%19)O)[C@H]([C@H](O)[C@@H](CO)O%18)O)[C@H]([C@H](O)[C@@H](CO)O%17)O)[C@H]([C@H](O)[C@@H](CO)O%16)O)[C@H]([C@H](O)[C@@H](CO)O%15)O)[C@H]([C@H](O)[C@@H](CO)O%14)O)[C@H]([C@H](O)[C@@H](CO)O%13)O)[C@H]([C@H](O)[C@@H](CO)O%12)O)[C@H]([C@H](O)[C@@H](CO)O%11)O)[C@H]([C@H](O)[C@@H](CO)O%10)O)[C@H]([C@H](O)[C@@H](CO)O9)O)[C@H]([C@H](O)[C@@H](CO)O8)O)[C@H]([C@H](O)[C@@H](CO)O7)O)[C@H]([C@H](O)[C@@H](CO)O6)O)[C@H]([C@H](O)[C@@H](CO)O5)O)[C@H]([C@H](O)[C@@H](CO)O4)O)[C@H]([C@H](O)[C@@H](CO)O3)O)[C@H]([C@H](O)[C@@H](CO)O2)O)[C@@H](O)[C@H](O)[C@@H](CO)O1 JYJIGFIDKWBXDU-MNNPPOADSA-N 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- BWHLPLXXIDYSNW-UHFFFAOYSA-N ketorolac tromethamine Chemical compound OCC(N)(CO)CO.OC(=O)C1CCN2C1=CC=C2C(=O)C1=CC=CC=C1 BWHLPLXXIDYSNW-UHFFFAOYSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 239000006193 liquid solution Substances 0.000 description 1
- 239000006194 liquid suspension Substances 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 238000012317 liver biopsy Methods 0.000 description 1
- 230000008818 liver damage Effects 0.000 description 1
- 125000001921 locked nucleotide group Chemical group 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 150000002669 lysines Chemical class 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- UYQJCPNSAVWAFU-UHFFFAOYSA-N malto-tetraose Natural products OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1OC1C(O)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(CO)O1 UYQJCPNSAVWAFU-UHFFFAOYSA-N 0.000 description 1
- LUEWUZLMQUOBSB-OUBHKODOSA-N maltotetraose Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@H](CO)O[C@@H](O[C@@H]2[C@@H](O[C@@H](O[C@@H]3[C@@H](O[C@@H](O)[C@H](O)[C@H]3O)CO)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O LUEWUZLMQUOBSB-OUBHKODOSA-N 0.000 description 1
- 210000004216 mammary stem cell Anatomy 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 229960004452 methionine Drugs 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- GKTNLYAAZKKMTQ-UHFFFAOYSA-N n-[bis(dimethylamino)phosphinimyl]-n-methylmethanamine Chemical compound CN(C)P(=N)(N(C)C)N(C)C GKTNLYAAZKKMTQ-UHFFFAOYSA-N 0.000 description 1
- 239000007922 nasal spray Substances 0.000 description 1
- 229940097496 nasal spray Drugs 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000036542 oxidative stress Effects 0.000 description 1
- 239000006174 pH buffer Substances 0.000 description 1
- 125000001312 palmitoyl group Chemical group O=C([*])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 229940085127 phytase Drugs 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 229920000747 poly(lactic acid) Polymers 0.000 description 1
- 239000004633 polyglycolic acid Substances 0.000 description 1
- 239000004626 polylactic acid Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 239000004800 polyvinyl chloride Substances 0.000 description 1
- 229920000915 polyvinyl chloride Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000020978 protein processing Effects 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 235000021251 pulses Nutrition 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000006697 redox regulation Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- CQRYARSYNCAZFO-UHFFFAOYSA-N salicyl alcohol Chemical compound OCC1=CC=CC=C1O CQRYARSYNCAZFO-UHFFFAOYSA-N 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- JVBXVOWTABLYPX-UHFFFAOYSA-L sodium dithionite Chemical compound [Na+].[Na+].[O-]S(=O)S([O-])=O JVBXVOWTABLYPX-UHFFFAOYSA-L 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 229940031439 squalene Drugs 0.000 description 1
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- HPGGPRDJHPYFRM-UHFFFAOYSA-J tin(iv) chloride Chemical compound Cl[Sn](Cl)(Cl)Cl HPGGPRDJHPYFRM-UHFFFAOYSA-J 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- LSGOVYNHVSXFFJ-UHFFFAOYSA-N vanadate(3-) Chemical compound [O-][V]([O-])([O-])=O LSGOVYNHVSXFFJ-UHFFFAOYSA-N 0.000 description 1
- 238000013022 venting Methods 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 230000009278 visceral effect Effects 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
- C07K14/08—RNA viruses
- C07K14/18—Togaviridae; Flaviviridae
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5258—Virus-like particles
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/24011—Flaviviridae
- C12N2770/24211—Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
- C12N2770/24222—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/24011—Flaviviridae
- C12N2770/24211—Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
- C12N2770/24223—Virus like particles [VLP]
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Virology (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Oncology (AREA)
- Animal Behavior & Ethology (AREA)
- General Chemical & Material Sciences (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Communicable Diseases (AREA)
- Veterinary Medicine (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 진핵생물 세포에서의 발현산물인 HCV 엔빌로프 단백질 또는 그의 일부에 관한 것이다. 보다 자세하게는, 상기 HCV 엔빌로프 단백질은 N-글리코실화 부위의 평균 80% 까지가 코어-글리코실화되는 것을 특징으로 한다. 이들 N-글리코실화된 부위중 70% 이상은 8 내지 10개 만노오스를 함유하는 올리고만노오스에 의해 글리코실화된다. 또한, Man(8)GlcNAc(2) 구조를 갖는 올리고만노오스에 대한 Man(7)GlcNAc(2) 구조를 갖는 올리고만노오스의 비율이 0.45 이하이다. 10% 미만의 올리고만노오스는 α1,3 결합된 만노오스에 의해 종료된다. 본 발명의 HCV 엔빌로프 단백질은 진단, 예방 및 치료 목적에 특히 적합하다. 본 발명의 HCV 엔빌로프 단백질을 생산하기 위해 적합한 진핵생물 세포는 한세눌라(Hansenula) 세포이다.
코어-글리코실화, HCV 엔빌로프 단백질, 올리고만노오스, 한세눌라 세포
Description
본 발명은 일반적 재조합 단백질 발현, HCV 감염의 진단, HCV 감염의 치료 또는 예방, 및 만성간염에 걸린 개인을 치료할 때 임상적 효과를 진단/조절하는 것과 천연 질병의 진단/조절에도 관한 것이다.
보다 자세하게는, 본 발명은 코어-글리코실화된 바이러스성 엔빌로프 (envelope) 단백질의 발현에 적합한 효모, 효모 균주에서 C형 간염 바이러스 엔빌로프 단백질의 발현, 및 본 발명에 따른 HCV 엔빌로프 단백질의 진단, 예방 또는 치료에서의 용도에도 관한 것이다.
C형 간염 바이러스(HCV) 감염은 개발국과 개도국 모두에서 주요 건강 문제이다. 세계 인구의 약 1 내지 5%가 이 바이러스에 감염된 것으로 추산된다. HCV 감염은 수혈과 관련된 간염의 가장 중요한 원인으로 보이며 흔히 만성적인 간 손상으로까지 진행한다. 또한, HCV가 간세포암의 유도에 관여함을 보여주는 증거가 존재한다. 따라서, 안정적인 진단법과 효과적인 치료제에 대한 요구가 높다. HCV-오염된 혈액 산물을 예민하고 특이하게 스크리닝하는 방법과 HCV를 배양하는 향상된 방법도 또한 요구된다.
HCV는 약 3000개 아미노산의 단일 폴리단백질을 암호화하는 약 9,600개 염기의 양성 표준 RNA 바이러스이다. 번역과 동시에 생기는 수식 및 번역후 수식에 결부된 전구체의 단백질 분해는 적어도 3개의 구조 단백질 및 6개의 비-구조적 단백질을 생성하는 것으로 나타나있다. 서열 상동성을 기초로 하여, 구조적 단백질은 1개의 단일 코어 단백질 및 2개의 엔빌로프 당단백질 E1 및 E2로 기능적으로 특정된다. 상기 E1 단백질은 192개의 아미노산으로 구성되며 또 HCV 유전형에 따라서 4 내지 5개의 N-글리코실화 부위를 함유한다. E2 단백질은 363 내지 370개 아미노산으로 구성되고 또 HCV 유전형에 따라서 9 내지 11개의 N-글리코실화 부위를 함유한다 (Major and Feinstone, 1997; Maertens and Stuyver, 1997 참조). E1 단백질은 다양한 가변 도메인을 함유한다(Maertens and Stuyver, 1997 참조). E2 단백질은 3개의 초가변적인 도메인을 함유하며, 이들의 주요 도메인은 단백질의 N-말단에 위치한다(Maertens and Stuyver, 1997 참조). HCV 당단백질은 ER에 주로 존재하며, 그곳에서 HCV 당단백질은 수식되어 올리고머성 복합체로 조립된다.
진핵생물에서, 당 잔기는 일반적으로 4개의 상이한 아미노산 잔기에 결합된다. 이들 아미노산 잔기는 O-결합된 잔기(세린, 트레오닌 및 히드록시리신) 및 N-결합된 잔기(아스파라긴)로 분류된다. O-결합된 당은 뉴클레오티드 당으로부터 골지체 또는 조면 소포체(ER)에서 합성된다. N-결합된 당은 통상의 전구체로부터 합성된 다음 가공된다. HCV 엔빌로프 단백질은 N-글리코실화되는 것으로 믿어진다. N-결합된 탄수화물 사슬의 부가는 접힘현상(folding) 중간체의 안정화 및 효과적인 접힘현상, 잘못된 접힘현상의 예방 및 소포체에서 분해, 올리고머화, 생물학적 활 성 및 당단백질의 수송에 중요한 역할을 하는 것으로 당분야에 공지되어 있다 (Rose 등, 1988; Doms 등, 1993; Helenius, 1994 에 의한 문헌 참조). 폴리펩티드상에서 세 개펩티드 서열 Asn-X-Ser 및 Asn-X-Thr (식중, X는 임의의 아미노산임)은 N-결합된 올리고당이 결합하기 위한 콘센서스(consensus) 부위이다. N-결합된 올리고당을 폴리펩티드에 부가한 후, 올리고당을 복합체 유형(N-아세틸글루코사민, 만노오스, 푸코오스, 갈락토오스 및 시알산을 함유) 또는 고-만노오스 유형(N-아세틸글루코사민 및 만노오스 함유)으로 더욱 가공한다. HCV 엔빌로프 단백질은 고-만노오스 유형일 것으로 보인다. N-결합된 올리고당의 효모에서의 가공은 포유동물 골지체 가공과는 아주 상이하다. 효모에서는, 올리고당 사슬은 만노오스의 점진적인 부가를 통하여 골지체에서 연장되어 "초글리코실화"로 불리는 정교한 고 만노오스 구조를 형성한다. 이와 대조적으로, 원핵생물에서 발현된 단백질은 글리코실화되지 않는다.
단백질 또는 펩티드의 고-만노오스 글리코실화의 패턴은 다양한 진핵생물 세포에 따라 결정된다. 포유동물 세포에서는, 평균 5 내지 9개의 만노오스 단위체가 코어-글리코실화 유형 올리고당중의 2개의 N-아세틸글루코사민 잔기에 결합된다(이 구조를 간단히 Man(5-9)GlcNAc(2)라 칭함). 코어 글리코실화는 Herscovics 및 Orleans(1993)의 도 3에서 박스(boxed) 구조와 유사한 구조를 지칭한다.
메틸로트로픽(methylotrophic) 효모 피치아 파스토리스(Pichia pastoris)는 글리코실화 부위당 평균 8 내지 14개 만노오스 단위, 즉 Man(8-14)GlcNAc(2)를 부착하고 있고(EP0256421호에서 Tschopp에 의해) 또 약 85%의 N-결합된 올리고당이 Man(8-14)GlcNAc(2) (Grinna 및 Tschopp 1989) 크기 범위에 있다고 보고되어 있다. 다른 연구자들은 피. 파스토리스(P. pastoris)에서 발현된 이종 단백질에 부착된 약간 상이한 올리고당 구조를 공개하였다: Man(8-9)GlcNAc(2) (Montesino 등, 1998), Man(9-14)GlcNAc(2) 또는 Man(9-15)GlcNAc(2) (Kalidas 등 2001), 및 Man(8-18)GlcNAc(2), 이때 Man(9-12)GlcNAc(2)가 우세하고 대부분의 올리고당은 Man(10)GlcNAc(2) (Miele 등, 1998)이다. Trimble 등(1991)은 약 75%의 N-결합된 올리고당에서 Man(8)GlcNAc(2) 및 Man(9)GlcNAc(2)의 분포가 동일하며 부가적으로 17%의 N-글리코실화 부위는 Man(10)GlcNAc(2)에 의해 점유되고 나머지 8%의 부위는 Man(11)GlcNAc(2)에 의해 점유된다고 보고하였다. 피. 파스토리스(P. pastoris)-발현된 단백질의 초글리코실화는 경우에 따라 보고되었다(Scorer 등 1993).
아스페르길루스 니거(Aspergillus niger)는 Man(5-10)GlcNAc(2)를 N-글리코실화 부위에 부가한다 (Panchal 및 Wodzinski 1998).
사카로마이세스 세레비시아애(Saccharomyces cerevisiae) 글리코실화 결핍 돌연변이체 mnn9는, mnn9 세포가 초글리코실화된 단백질 대신, Man(9-13)GlcNAc(2)으로 구성된 수식된 올리고당을 갖는 글리코실화 단백질을 생산하는 점에서 야생형 사카로마이세스 세레비시아애 (Saccharomyces cerevisiae)와 상이하다 (US 5,135,854호에서 Mackay 등 및 WO 94/01132호에서 Knisken 등 참조). 다른 에스. 세레비시아애(S. cerevisiae) 돌연변이체, ochlmnn9는 단백질중의 N-글리코실화 부위에 Man(8)GlcNAc(2)를 부가하는 것으로 보고되었다 (JP06277086호에서 Yoshifumi 등 참조).
에스. 세레비시아애(S. cerevisiae)(야생형 및 mnn9 돌연변이체) 코어 올리고당의 특징은 말단 α1,3-결합된 만노오스 잔기가 존재하는 점이다(Montesino 등 1998). 피. 파스토리스(P. pastoris) 또는 에스. 세레비시아애(S. cerevisiae) och1mnn1에서 발현된 단백질의 N-글리코실화 부위에 부착된 올리고당은 이러한 말단 α1,3-결합된 만노오스를 갖고 있지 않다(Gellissen 등 2000). 말단 α1,3-결합된 만노오스는 알레르기 유발물질로 간주된다(Jenkins 등 1996). 따라서, 자신에 당에 말단 α1,3-결합된 만노오스 잔기를 갖는 단백질은 진단 또는 치료 목적용으로는 적합하지 않다.
메틸로트로픽 효모 한세눌라 폴리모르파(Hansenula polymorpha)에서 발현된 단백질에서 글리코실화 패턴은 다수의 이종 단백질의 생산을 위해 상기 효모에서 사용됨에도 불구하고 (Gellissen 등, 2000에서 표 3 참조), 그다지 자세하게 연구되지 않았다. Janowicz 등 (1991) 및 Diminsky 등(1997)의 실험으로부터, 에이치. 폴리모르파(H. polymorpha)는 대형 또는 소형의 B형 간염 바이러스성 표면 항원(HBsAg)을 글리코실화시키지 않거나 극히 적게 글리코실화시키는 것으로 보인다. 이것은 HBsAg가 시그널 펩티드없이 발현됨으로 인하여, 생산된 HBsAg가 소포체의 세포간극으로 들어가지 못하게 하여 글리코실화를 방해하기 때문으로 보여진다. 에이치. 폴리모르파(H. polymorpha)에서 생산된 G-CSF (과립구 군체 자극인자)에 대한 모노- 또는 디헥소오스의 제한된 부가는 보고되어 있다 (Fischer 등 WO 00/40727호에 보고). 한편, 에이치. 폴리모르파(H. polymorpha) 세포에서 발현된 이종 α-갈락토시다제의 초글리코실화가 보고되어 있다(Fellinger 등 1991).
지금까지, 질병에 대한 백신처리는 질병을 제어하는 가장 비용 효과적이고 효율적인 방법으로 알려져 왔다. 그러나, 유망한 결과에도 불구하고 효과적인 HCV 백신을 개발하려는 노력은 여러 문제에 직면하였다. 백신에 대한 필수조건은 환자에서 면역반응을 유발하는 것이다. 따라서, HCV 항원결정부위를 확인해야하고, 적합한 조건에서 환자에게 투여되어야한다. 항원결정부위는 적어도 2개 형태, 즉 선형 및 입체적 항원결정부위로 분류될 수 있다. 입체적 항원결정부위는 글리코실화와 같은 번역과 동시에 생기는 수식 및 번역후 수식을 비롯한 3차원 공간에서 분자의 접힘현상에 기인한다. 일반적으로, 입체적 항원결정부위는 대부분의 효과적인 백신을 실현할 수 있을 것으로 보는데, 그 이유는 입체적 항원결정부위는 천연과 유사한 HCV 항원결정부위와 유사하고 또 실제의 선형 아미노산 서열보다 더 잘 보존될 수 있는 항원결정부위를 나타내기 때문이다. 따라서, HCV 엔빌로프 단백질의 글리코실화의 실제 정도는 천연 HCV 항원 결정기를 생성하는데 가장 중요하다. 그러나, HCV를 배양하는 것은 무수한 문제를 갖고 있어, 극히 소량의 비리온을 초래할 뿐이다. 또한, 재조합 단백질의 발현과 정제에도 다수의 문제가 존재하므로, 소량의 단백질, 초글리코실화된 단백질 또는 글리코실화되지 않은 단백질을 초래하게된다.
HCV 엔빌로프 단백질은 대장균(Escherichia coli), 곤충 세포, 효모 세포 및 포유동물 세포에서 재조합 수법에 의해 생산되었다. 그러나, 더 고등한 진핵생물에서의 발현은 실제의 백신 제조를 위한 다량의 항원을 얻는데 어려움이 존재한다. 대장균(E.coli)과 같은 원핵생물에서 발현은 글리코실화되지 않은 HCV 엔빌로프 단 백질을 초래한다. 효모에서의 HCV 엔빌로프 단백질의 발현은 초글리코실화를 초래한다. WO 96/04385에서 Maertens 등에 의해 이미 나타낸 바와 같이, 사카로마이세스 세레비시아애(Saccharomyces cerevisiae)에서 HCV 엔빌로프 단백질 E2의 발현은 상당히 글리코실화된 단백질을 초래한다. 이러한 초글리코실화는 단백질 항원결정부위를 숨기게된다. Mustilli 등(1999)는 에스. 세레비시아애(S. cerevisiae)에서 HCV E2의 발현이 코어-글리코실화를 초래하지만, 세포내적으로 발현된 물질의 결과는 그 일부가 초글리코실화되는 반면에 나머지 물질의 정확한 가공이 나타나지 않는다고 주장하였다. 더구나, Mustilli 등 (1999)에 의해 관찰된 초글리코실화는 튜니카마이신(글리코실화 억제제의 일종)의 존재하에서만 방지될 수 있고, 또 이것은 정상적인 천연 생장 조건하에서 생기는 글리코실화를 나타내지 않는다. 세포내 공급원으로부터 유도된 HCV 엔빌로프 단백질에 대한 필요는 잘 받아들여지고 있다 (WO 96/04385에서 Maertens 등, Heile 등, 2000). 이러한 필요성은 Mustilli 등(1999)의 도 5에서 분명한 바와 같이 포유동물 세포 배양액 유래 E2 단백질에 의해 면역화된 침팬지의 혈청과 분비된 효모 유래 E2의 불량한 반응성으로 부터도 더욱 예시된다. 이러한 것은 효모 유래 HCV 엔빌로프 단백질을 사용한 면역화가 그러한 도전으로 보호하는데 실패하였음을 보여주는 로사 등(1996)에 의한 문헌에 수록되어 있다.
따라서, 말단 α1,3-결합된 만노오스를 갖지 않는 천연과 유사한 글리코실화 패턴을 동시에 갖는 단백질을 다량으로 또 비용 효과적으로 얻을 수 있는 효과적인 발현계가 요망되고 있다. 특히, 이러한 계는 HCV 엔빌로프 단백질의 제조에 필요 하다.
발명의 요지
본 발명의 제1 요지는 진핵생물 세포에서의 발현산물이고 또 N-글리코실화 부위의 평균 80% 까지가 코어-글리코실화되어 있는 것을 특징으로 하는 한개 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 특히, 상기 코어-글리코실화 부위의 70% 이상이 글리코실화되고 올리고만노오스는 Man(8-10)-GlcNAc(2)에 의해 정의된 구조를 갖는다. 또한, Man(8)GlcNAc(2) 구조를 갖는 올리고만노오스에 대한 Man(7)GlcNAc(2) 구조를 갖는 올리고만노오스의 비율은 0.45 미만 또는 0.45 이다. 보다 자세하게는, 상기 올리고만노오스는 10% 미만의 말단 α1,3 만노오스를 함유한다. 상기 분리된 HCV 엔빌로프 단백질 또는 그의 일부를 발현하는 진핵생물 세포는 한세눌라(Hansenulla) 세포와 같은 효모 세포일 수 있다.
본 발명의 다른 요지는 HCV 엔빌로프 단백질 또는 그의 단편에 결합된 조류의 리소짐(lysozyme) 리더 펩티드 또는 그의 기능적 변이체를 포함하는 단백질로부터 유래한 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부에 관한 것이다. 보다 자세하게는, 상기 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 하기 구조식을 특징으로 하는 단백질로부터 유래된다:
CL-[(Al)a-(PS1)b-(A2)c]-HCVENV-[(A3)d-(PS2)e-(A4)
f]
식중에서,
CL은 조류의 리소짐 리더 펩티드 또는 그의 기능적 등가물이고,
A1, A2, A3 및 A4는 상이하거나 동일할 수 있는 어댑터(adptor) 펩티드이며,
PS1 및 PS2는 상이하거나 동일할 수 있는 가공 부위이고,
HCVENV는 HCV 엔빌로프 단백질 또는 그의 일부이며,
a, b, c, d, e 및 f는 0 또는 1이고, 또
경우에 따라, A1 및/또는 A2는 PS1의 일부이고 및/또는 A3 및/또는 A4는 PS2의 일부이다.
본 발명의 다른 요지는 단량체, 동종이합체, 이종이합체, 동종-올리고머 및 이종-올리고머로 구성되 군으로부터 선택된 구조에 포함되는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편을 포함한다. 다르게는, 본 발명에 따른 상기 분리된 HCV 엔빌로프 단백질 또는 그의 단편은 바이러스-유사 입자를 포함한다. 보다 자세하게는, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편은 시스테인 티올기가 화학적으로 수식된 시스테인을 포함할 수 있다.
본 발명의 특정 요지는 항원성 또는 면역원성이고 및/또는 T-세포 자극 항원결정부위를 포함하는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.
본 발명의 또 다른 요지는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편을 포함하는 조성물에 관한 것이다. 이러한 조성물은 약제학적으로 허용되는 담체를 더 포함할 수 있으며 또 의약 또는 백신일 수 있다.
본 발명은 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편을 생산하는 방법에 관한 것이다.
본 발명의 다른 방법은,
(i) 제1항 내지 제15항중 어느 한 항에 따른 HCV 엔빌로프 단백질 또는 그의 일부를, HCV 엔빌로프 단백질 또는 그의 일부와 항-HCV 항체의 복합체 형성을 허용하는 조건하에서 항-HCV 항체를 포함할 것으로 추정되는 샘플과 접촉시키는 단계,
(ii) (i)에서 형성된 복합체를 검출하는 단계, 및
(iii) (ii)으로부터 상기 샘플에서 항-HCV 항체의 존재를 유추하는 단계를 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플에서 항-HCV 항체의 존재를 검출하는 방법이다.
보다 자세하게는, 상기 방법은 상기 접촉이 경쟁 조건하에서 생기는 단계(i)를 포함할 수 있다. 특히 상기 방법은 상기 HCV 엔빌로프 단백질 또는 그의 일부가 부착되어 있는 고형 지지체를 이용할 수 있다.
본 발명은 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플에서 항-HCV 항체의 존재를 검출하기 위한 진단 키트에도 관한 것이다. 보다 자세하게는, 상기 키트는 고형 지지체에 부착된 상기 HCV 엔빌로프 단백질 또는 그의 일부를 포함할 수 있다.
본 발명은 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는 의약 또는 백신에도 관한 것이다.
본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부 및 경우에 따 라 약제학적으로 허용되는 보조제를 포함하는 포유동물에서 HCV-특이적 면역반응을 유발하는 약제학적 조성물도 본 발명에 포함된다. 이러한 약제학적 조성물은 예방적 조성물 또는 치료적 조성물일 수 있다. 특히, 상기 포유동물은 인간이다.
발명의 상세한 설명
본 발명에 따른 실시에서, 사카로마이세스 세레비시아애(Saccharomyces cerevisiae), 피치아 파스토리스(Pichia pastoris) 및 한세눌라 폴리모르파(Hansenula polymorpha)에서 글리코실화된 HCV 엔빌로프 단백질의 발현은 상기 HCV 엔빌로프 단백질을 상기 HCV 엔빌로프 단백질에 결합된 시그널 펩티드 서열을 포함하는 단백질로서 발현하는 것에 의해 가능함이 밝혀졌다. 그러나 이들 세 개 효모 종에서 발현된 HCV 엔빌로프 단백질의 글리코실화 패턴은 아주 상이하다 (실시예 6, 10, 13 및 25 참조). 보다 자세하게는, 에스.세레비시아애(S. cerevisiae) (글리코실화 결핍 돌연변이체)- 및 에이치. 폴리모르파(H. polymorpha)-발현된 HCV 엔빌로프 단백질은 코어-글리코실화 유사한 방식으로 글리코실화되었다. 피치아 파스토리스(Pichia pastoris)에서 발현된 HCV 엔빌로프 단백질은 상기 효모에서 발현된 단백질은 보통 초글리코실화되지 않는다(Gellissen 등 2000, Sugrue 등 1997)는 이전의 보고에도 불구하고 초글리코실화되었다.
에스.세레비시아애(S. cerevisiae) (글리코실화 결핍 균주), 에이치. 폴리모르파(H. polymorpha) 및 HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에서 생산된 HCV 단백질의 글리코실화 패턴을 더욱 분석하면, 놀랍게도 한세눌라(Hansenula) 생산된 HCV 엔빌로프 단백질은 HCV 엔빌로프 단백질의 진단, 예방 및 치료용으로 아주 유리한 글리코실화 패턴을 나타낸다는 것이 밝혀졌다 (실시예 21-24 및 26-29 참조). 이러한 예상치 못한 발견은 이하에 기재한 본 발명의 상이한 요지 및 실시예에 반영되어 있다.
본 발명의 제1 요지는 진핵생물 세포에서의 발현산물이고 또 N-글리코실화 부위의 평균 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79% 또는 80% 까지가 코어-글리코실화되어 있는 것을 특징으로 하는, 하나 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 보다 자세하게는, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% 또는 95% 이상의 N-글리코실화 부위는 Man(8-10)-GlcNAc(2)로 정의된 구조를 갖는 올리고만노오스에 의해 글리코실화된다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위의 비율은 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.
"Man(8-10)-GlcNAc(2)에 의해 정의된 구조를 갖는 올리고만노오스에 의해 글리코실화된 N-글리코실화 부위"는 상기 N-글리코실화 부위가 1개의 Man(8)-GlcNAc(2), Man(9)-GlcNAc(2) 또는 Man(10)-GlcNAc(2)에 의해 글리코실화됨을 의미한다.
2개의 단백질에서 동일한 N-글리코실화 부위는 상이한 올리고만노오스에 의해 점유될 수 있다는 것은 분명하다.
용어 "단백질"은 아미노산의 중합체를 지칭하며 특정 길이의 생성물을 의미하지 않는다; 따라서 펩티드, 올리고펩티드 및 폴리펩티드는 단백질의 정의내에 포함된다. 이 용어는 글리코실화, 아세틸화, 포스포릴화 등과 같은 단백질의 발현후 수식을 지칭하거나 또는 배제하지 않는다. 예컨대 아미노산(예컨대 비천연 아미노산, PNA 등 포함)의 1개 이상의 유사체를 함유하는 폴리펩티드, 치환된 결합 뿐만 아니라 천연산출 또는 비-천연산출의 당업계에서 공지된 다른 수식을 갖는 폴리펩티드도 상기 정의에 포함된다.
본 명세서에서 "프리-프로-단백질" 또는 "프리-단백질"은 목적하는 단백질에 결합된 프리-프로-서열을 포함하는 단백질 또는 목적하는 단백질에 결합된 프로-서열을 포함하는 단백질을 의미한다. "프리-서열"에 대한 다른 예로서, 용어 "시그널 서열", "시그널 펩티드", "리더 펩티드" 또는 "리더 서열"이 사용된다; 이들은 모두 (N)-글리코실화에 대한 전제조건인 조면 소포체(ER)에 대한 프리-단백질을 목표로하는 아미노산 서열을 지칭한다. "시그널 서열", "시그널 펩티드", "리더 펩티드" 또는 "리더 서열"은 시그널 펩티다제로 불리는 숙주 특이적 프로테아제에 의해 상기 ER의 간극 측상에서 목적하는 단백질에 결합된 시그널 서열을 포함하는 단 백질로부터 제거된다. 마찬가지로, 프리-프로-단백질은 ER의 루멘으로 전위시킬 때 프로-단백질로 전환된다. "프로"아미노산 서열의 성질에 따라서, 프리-프로-단백질을 발현하는 숙주 세포에 의해 제거될 수 있거나 제거될 수 없다. 공지된 프리-프로-아미노산 서열은 에스. 세레비시아애(S. cerevisiae) α 메이팅 인자의 α 메이팅 인자 프리-프로-서열이다.
"HCV 엔빌로프 단백질"은 HCV E1 및 HCV E2 엔빌로프 단백질 또는 그의 일부를 의미하며, 상기 단백질은 임의의 유전형의 HCV 균주로부터 유도될 수 있다. 보다 자세하게는, HCVENV는 아미노산 서열이 90% 이상 서로 동일한 서열번호 85 내지 98 및 그의 단편으로 구성된 아미노산 서열군으로부터 선택된다. "동일한" 아미노산은 상술한 바와 같이 보존되는 아미노산 군, 즉 Met, Ile, Leu 및 Val로 구성된 군; Arg, Lys 및 His로 구성된 군; Phe, Trp 및 Tyr로 구성된 군; Asp 및 Glu로 구성된 군; Asn 및 Gln로 구성된 군; Cys, Ser 및 Thr로 구성된 군; 및 Ala 및 Gly로 구성된 군으로 간주된다.
보다 자세하게는, 용어 "HCV 엔빌로프 단백질"은 글리코실화 부위 이외에 E1 또는 E2 영역의 한 개 이상의 HCV 항원결정부위를 정의하는 아미노산 서열(및/또는 아미노산 유사체)를 포함하는 폴리펩티드 또는 그의 유사체(예컨대 미모토프)에 관한 것이다. 이들 엔빌로프 단백질은 재조합적으로 발현되는 엔빌로프 단백질의 단량체, 헤테로-올리고머 또는 동종-올리고머 형태일 수 있다. 전형적으로, 항원결정부위를 규정하는 서열은 HCV의 E1 또는 E2 영역의 아미노산 서열에 상응한다(동일하거나 또는 항원결정부위를 파괴하지 않는 천연 아미노산 잔기의 유사체의 치환 을 통하여).
HCV 항원결정부위는 글리코실화 부위와 동일한 위치에 있을 수 있음이 알려져 있다.
일반적으로, 항원결정부위를 규정하는 서열은 3 또는 4개 아미노산 서열 길이, 보다 전형적으로 5, 6 또는 7개 아미노산 길이, 보다 전형적으로 8 또는 9개 아미노산 길이, 더욱 전형적으로 10개 이상의 아미노산 길이이다. 입체적 항원결정부위의 경우, 항원결정부위를 규정하는 서열의 길이는 다양할 수 있는데, 이는 이들 항원결정부위가 항원의 3차원 형상에 의해(예컨대 접힘현상) 형성되기 때문이라고 사료된다. 따라서, 항원결정부위를 규정하는 아미노산은 비교적 개수가 적을 수 있지만, 분자의 길이를 통하여 다양하게 분포되어 접힘현상을 통하여 정확한 항원결정부위 입체로 될 수 있다. 항원결정부위를 규정하는 잔기 사이의 항원 부분은 항원결정부위의 입체 구조에 중요하지 않을 수 있다. 예컨대, 이들 개제 서열의 결실 또는 항원결정부위 입체에 중요한 서열(예컨대 디술피드 결합, 글리코실화 부위에 관여되는 시스테인)이 유지되는 한 항원결정부위 입체에 영향을 주지 않을 수 있다. 입체적 항원결정부위는 동종-올리고머 또는 이종-올리고머의 서브유닛의 2개 이상의 필수 영역에 의해 형성될 수 있다.
본 명세서에서는, 지정된 폴리펩티드의 항원결정부위는 지정된 폴리펩티드에 있는 항원결정부위와 동일한 아미노산 서열을 갖는 항원결정부위 및 그의 면역학적 등가물을 의미한다. 이러한 등가물은 균주, 서브타입(=유전형), 또는 타입(그룹) 특이적 변이체를 포함하며, 예컨대 현재 공지된 서열 또는 균주는 유전형 1a, 1b, 1c, 1d, 1e, 1f, 2a, 2b, 2c, 2d, 2e, 2f, 2g, 2h, 2i, 3a, 3b, 3c, 3d, 3e, 3f, 3g, 4a, 4b, 4c, 4d, 4e, 4f, 4g, 4h, 4i, 4j, 4k, 4l, 5a, 5b, 6a, 6b, 6c, 7a, 7b, 7c, 8a, 8b, 9a, 9b, 10a, 11 (및 그의 서브타입), 12 (및 그의 서브타입) 또는 13(및 그의 서브타입) 또는 다른 새롭게 정의된 HCV (서브)타입에 속한다. 항원결정부위를 구성하는 아미노산은 선형 서열의 일부가 아닐 수 있지만, 임의 개수의 아미노산에 의해 산재될 수 있으므로, 입체적 항원결정부위를 형성할 수 있음을 주목해야한다.
본 발명의 HCV 항원은 HCV의 E1 및/또는 E2 (엔빌로프) 도메인으로부터의 입체적 항원결정부위를 포함한다. 바이러스성 엔빌로프 단백질에 상응하는 E1 도메인은 현재 HCV 폴리단백질의 아미노산 192-382에 걸쳐 존재하는 것으로 추정된다 (Hijikata 등, 1991). 포유동물 계에서 발현되면(글리코실화되면), SDS-PAGE에 의해 결정된 바와 같이 약 35 kDa의 분자량을 가질 것이다. 전에는 NS1로 불린 E2 단백질은 HCV 폴리단백질의 아미노산 384-809 및 384-746에 걸쳐 존재(Grakoui 등, 1993)하고 엔빌로프 단백질인 것으로 예상된다. 백시니아 계에서 발현되면(글리코실화되면), 약 72 kDa의 겔 분자량을 가질 것으로 생각된다. 이들 단백질 종점은 근사치임을 이해해야한다(예컨대 아미노산 730, 735, 740, 742, 744, 745, 바람직하게는 746, 747, 748, 750, 760, 770, 780, 790, 800, 809, 810, 820에서 끝남). E2 단백질은 E1, 및/또는 코어(aa 1-191), 및/또는 P7 (aa 747-809), 및/또는 NS2 (aa 810-1026), 및/또는 NS3 (aa 1027-1657), 및/또는 NS4A (aa 1658-1711) 및/또는 NS4B (aa 1712-1972) 및/또는 NS5A (aa 1973-2420), 및/또는 NS5B (aa 2421- 3011), 및/또는 E2와는 상이한 HCV 단백질의 임의 부분과 함께 발현될 수 있다. 마찬가지로, E1 단백질은 또한 E2, 및/또는 코어(aa 1-191), 및/또는 P7 (aa 747-809), 및/또는 NS2 (aa 810-1026), 및/또는 NS3 (aa 1027-1657), 및/또는 NS4A (aa 1658-1711) 및/또는 NS4B (aa 1712-1972), 및/또는 NS5A (aa 1973-2420), 및/또는 NS5B (aa 2421-3011), 및/또는 E1과는 상이한 HCV 단백질의 일부와 함께 발현될 수 있다. 이들 HCV 단백질과의 발현은 정확한 단백질 접힘현상을 얻는데 중요할 수 있다.
본 명세서에 사용한 용어 "E1"는 천연 E1과 면역학적으로 교차반응하는 유사체 및 절단된 형태를 포함하며 또 유전형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13의 E1 단백질 또는 다른 새롭게 동정된 HCV 유형 또는 서브유형을 포함한다. 본 명세서에서 사용된 용어 "E2"는 천연 E2와 면역학적으로 교차반응하는 유사체 및 절단된 형태를 포함하며 또 유전형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13의 E2 단백질 또는 다른 새롭게 동정된 HCV 유형 또는 서브유형을 포함한다. 예컨대 코돈 383과 384 사이에 복수의 코돈을 삽입하는 것 뿐만 아니라 아미노산 384-387의 결실이 카토 등(1992)에 의해 보고되어 있다. 따라서, 본 발명의 실시예 부분에서 사용된 분리물은 본 발명의 범위를 제한하기 위한 것이 아니며 또 유형 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13으로부터의 HCV 분리물 또는 새로운 유전형의 HCV는 본 발명을 실시하기 위한 E1 및/또는 E2 서열의 적합한 공급원이라는 것을 알 수 있다. 유사하게, 상기 기재한 바와 같이, 본 발명의 HCV 엔빌로프 단백질과 함께 발현되는 HCV 단백질은 임의의 HCV 유형으로부터 유도될 수 있고, 또한 본 발명의 HCV 엔빌로프 단백질과 동일한 유형으로부터 유도될 수 있다.
본 명세서에서 사용된 "E1/E2"는 하나 이상의 E1 성분 및 하나 이상의 E2 성분을 함유하는 엔빌로프 단백질의 올리고머 형태를 지칭한다.
용어 "특정 올리고머" E1 및/또는 E2 및/또는 E1/E2 엔빌로프 단백질은 응집되지 않는 재조합적으로 발현된 E1 및/또는 E2 엔빌로프 단백질의 모든 가능한 올리고머 형태를 지칭한다. E1 및/또는 E2 특정 올리고머 엔빌로프 단백질은 또한 동종-올리고머 E1 또는 E2 엔빌로프 단백질(이하 참조)로도 불린다. 용어 "단일 또는 특정 올리고머성" E1 및/또는 E2 및/또는 E1/E2 엔빌로프 단백질은 단일 단량체성 E1 또는 E2 단백질(엄밀한 단어 의미대로의 단일함) 뿐만 아니라 특정 올리고머성 E1 및/또는 E2 및/또는 E1/E2 재조합적으로 발현된 단백질을 지칭한다. 본 발명에 따른 이들 단일 또는 특정 올리고머성 엔빌로프 단백질은 화학식 (E1)x(E2)y 에 의해 더욱 정의될 수 있으며, 이때 x는 0 내지 100의 수일 수 있고, 또 y는 0 내지 100의 수일 수 있으며, 단 x 및 y는 동시에 0이 아니다. x =1 및 y = 0일 때 상기 엔빌로프 단백질은 단량체성 E1을 포함한다.
본 명세서에 사용된 용어 "동종-올리고머"는 1개 이상의 E1 또는 E2 단량체를 함유하는 E1 또는 E2의 복합체를 지칭하며, 예컨대 E1/E1 이합체, E1/E1/E1 삼합체 또는 E1/E1/E1/E1 사합체 및 E2/E2 이합체, E2/E2/E2 삼합체 또는 E2/E2/E2/E2 사합체, E1 펜타머 및 헥사머, E2 펜타머 및 헥사머 또는 더 높은 E1 또는 E2의 동종-올리고머가 본 발명의 범위내의 "동종-올리고머"이다. 이들 올리고머는 본 출원인에 의해 출원된 WO 94/25601호 및 WO96/13590호에서 Maertens 등에 의해 기재된 바와 같은 것을 비롯한 C형 간염 바이러스의 상이한 유형 또는 서브타입으로부터 얻은 1개, 2개 또는 몇 개의 상이한 E1 또는 E2 단량체를 함유할 수 있다. 이러한 혼합된 올리고머는 본 발명의 범위내에 속하는 동종-올리고머이며 또 HCV의 보다 일반적인 진단, 예방 또는 치료를 허용한다.
본 발명에서 사용된 E1 및 E2 항원은 전체 길이의 바이러스성 단백질, 그의 실질적으로 전체 길이 버전 또는 그의 기능적 단편(예컨대 하나 이상의 항원결정부위 및/또는 글리코실화 부위를 포함하는 단편)일 수 있다. 또한, 본 발명의 HCV 항원은 목적하는 입체적 항원결정부위의 형성을 차단하거나 방해하지 않는 다른 서열을 포함할 수 있다. 입체적 항원결정부위의 존재 또는 부재는 목적하는 항원을 항체(입체적 항원결정부위에 대한 폴리클로날 혈청 또는 모노클로날)를 사용하여 스크리닝하고 그의 반응성을, 선형 항원결정부위만을 함유하는 변성버전 항원의 반응성과 비교하는 것에 의해 용이하게 결정할 수 있다. 폴리클로날 항체를 사용한 이러한 스크리닝에서는, 변성된 항원을 사용하여 폴리클로날 혈청을 먼저 흡착한 다음 항체가 목적하는 항원을 함유하고 있는지를 조사하는 것이 바람직하다.
본 발명의 HCV 단백질은 글리코실화될 수 있다. 글리코실화된 단백질은 한 개 이상의 탄수화물 기, 특히 당기를 함유하는 단백질을 의미한다. 일반적으로, 모든 진핵생물 세포는 단백질을 글리코실화할 수 있다. HCV 유전형의 상이한 엔빌로프 단백질 서열을 정렬한 후, 적합한 접힘현상과 반응성을 위해 HCV E1 단백질상 의 6개 글리코실화 부위 모두가 필요한 것은 아니다라는 것을 유추할 수 있다. 또한 위치 325에 있는 글리코실화 부위는 N-글리코실화에 의해 변형되지 않는다는 것도 알려져 있다(Fournillier-Jacob 등, 1996, Meunier 등 1999). 또한 HCV 서브타입 1b E1 단백질은 6개의 글리코실화 부위를 함유하지만, 이들 글리코실화 부위의 일부는 특정 다른 (서브)타입에는 존재하지 않는다. 4번째 탄화수소 모티프(Asn250)는 타입 1b, 6a, 7, 8 및 9에 존재하지만, 지금까지 공지된 다른 모든 타입에는 존재하지 않는다. 이러한 당-부가 모티프는 돌연변이되어 향상된 반응성을 갖는 타입 1b E1 단백질을 생성할 수 있다. 또한 타입 2b 서열은 V5 영역(Asn299상)에서 여분의 글리코실화 부위를 나타낸다. 유전형 2c에 속하는 분리물 S83은 V1 영역(Asn 상)에서 제1 탄수화물 모티프가 결여되어 있는 반면에, 모든 다른 분미물에는 존재한다(Stuyver 등 1994). 그러나, 완전히 보존된 당-부가 모티프중에서도, 탄수화물의 존재는 접힘현상에 반드시 필요한 것은 아니지만, 면역 감독의 기피에는 어떤 역할을 가질 수 있다. 따라서, 글리코실화의 역할의 확인은 글리코실화 모티프의 돌연변이에 의해 더욱 시험될 수 있다. 글리코실화 모티프(NXS 또는 NXT 서열)의 돌연변이는 N, S 또는 T에 대한 코돈을 돌연변이 유발시켜 N의 경우 그 코돈이 N과는 상이한 아미노산을 암호화하게하고, 및/또는 S인 경우 및 T인 경우 S 또는 T와 다른 아미노산을 암호화하게 한다. 다르게는, NPS 또는 NPT는 탄수화물에 의해 흔히 변형되지 않기 때문에 X 위치는 P로 돌연변이될 수 있다. 접힘현상 및/또는 반응성에 어떤 탄수화물 부가 모티프가 필요하고 필요하지 않은지를 확립한 후, 이러한 돌연변이의 조합을 실시할 수 있다. 이러한 실 험은 Maertens 등에 의해 본 명세서에 참고문헌으로 포함된 WO96/04385호의 실시예 8에 자세하게 기재되어 있다.
본 명세서에서 사용된 용어 글리코실화는 특별히 언급하지 않는 한 N-글리코실화를 의미한다.
특히, 본 발명은 코어-글리코실화되는 HCV 엔빌로프 단백질, 또는 그의 일부에 관한 것이다. 이와 관련하여, 용어 "코어-글리코실화"는 Herscovics 및 Orlean (1993)의 도 3에서 박스 구조로 나타낸 구조와 "유사한" 구조를 의미한다. 따라서, 탄수화물 구조는 10 내지 11개 단당류를 함유하는 것을 의미한다. 상기 기재내용은 참고문헌으로 본 명세서에 포함되어 있다. 용어 "유사한"은 4개 이하의 단당류가 구조에 부가되거나 또는 약 3개 이하의 단당류가 구조로부터 제거됨을 의미한다. 따라서, 본 명세서에서 말하는 코어-글리코실화 탄화수소 구조는 최소한 7개 단당류 및 최대한 15개 단당류로 구성되며 또 8, 9, 10, 11, 12, 13 또는 14개 단당류로 구성될 수 있다. 단당류는 바람직하게는 글루코오스, 만노오스 또는 N-아세틸 글루코사민을 의미할 수 있다.
본 발명의 다른 요지는 진핵생물 세포에서의 발현산물이며 N-글리코실화 부위의 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% 또는 95% 이상이 Man(8-10)-GlcNAc(2)로 정의된 구조를 갖는 올리고만노오스에 의해 글리코실화되는 것을 특징으로 하는, 한 개 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위의 비율은 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.
본 발명의 또 다른 요지는 진핵생물 세포에서의 발현산물이며 N-글리코실화 부위가 올리고만노오스에 의해 점유되며, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스의 비율이 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하인 것을 특징으로 하는, 하나 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 또한 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.
본 발명의 다른 요지는 비-포유동물 진핵생물 세포에서의 발현산물이며 N-글리코실화 부위의 개수가, 백시니아 바이러스로 감염되기 쉬운 진핵생물에서 백시니아 바이러스로부터 발현된 단백질 또는 그의 단편에 있는 N-글리코실화 부위의 개수보다 적어도 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14% 또는 15% 미만인 것을 특징으로 하는 하나 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로 프 단백질 또는 그의 단편에 관한 것이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 N-글리코실화 부위의 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79% 또는 80%까지는 코어-글리코실화되어 있다. 보다 자세하게는, N-글리코실화 부위의 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% 또는 95% 이상이 Man(8-10)-GlcNAc(2)로 정의된 구조를 갖는 올리고만노오스에 의해 글리코실화된다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위의 비율은 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.
본 발명의 다른 요지로서, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 효모 세포에서 발현산물이다. 보다 자세하게는, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 사카로마이세스 세레비시아애 (Saccharomyces cerevisiae), 사카로마이세스 클루이베리(Saccharomyces kluyveri) 또는 사카로마이세스 우바룸 (Saccharomyces uvarum)와 같은 사카로아이세스 (Saccharomyces) 균주; 시조사카로마이세스 폼베 (Saccharomyces pombe)와 같은 시조사카로마이세스 (Schizosaccharomyces) 균주; 클루이베로마이세스 락티스 (Kluyveromyces lactis)와 같은 클루이베로마이세스 (Kluyveromyces) 균주; 야로비아 리폴리티카 (Yarowia lipolytica)와 같은 야로비아(Yarowia) 균주; 한세눌라 폴리모르파(Hansenula polymorpha)와 같은 한세눌라(Hansenula) 균주; 피치아 파스토리스(Pichia pastoris)와 같은 피치아(Pichia) 균주, 아스페르길루스(Aspergillus) 종; 뉴로스포라 크라사(Neurospora crassa)와 같은 뉴로스포라(Neurospora) 균주; 또는 슈바니오마이세스 옥시덴탈리스(Schwanniomyces occidentalis)와 같은 슈바니오마이세스(Schwanniomyces) 균주의 세포; 또는 이들로부터 유래한 돌연변이 세포에서의 발현산물이다. 보다 자세하게는, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 한세눌라(Hansenula) 세포에서의 발현산물이다. 더욱 자세하게는, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 효모, 예컨대 투니카마이신과 같은 글리코실화 억제제가 존재하지 않는 한세눌라(Hansenula) 세포에서의 발현산물이다.
본 발명의 다른 요지로서, 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 일부는 상기 HCV 엔빌로프 단백질 또는 그의 단편에 결합된 조류의 리소짐 리더 펩티드 또는 그의 기능적 변이체를 포함하는 단백질로부터 유도된다. 보다 자세하게는, 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부는 하기 구조식으로 특징지워지는 단백질로부터 유도된다:
식중에서,
CL은 조류의 리소짐 리더 펩티드 또는 그의 기능적 등가물이고,
A1, A2, A3 및 A4는 상이하거나 동일할 수 있는 어댑터(adptor) 펩티드이며,
PS1 및 PS2는 상이하거나 동일할 수 있는 가공 부위이고,
HCVENV는 HCV 엔빌로프 단백질 또는 그의 일부이며,
a, b, c, d, e 및 f는 0 또는 1이고, 또
경우에 따라, A1 및/또는 A2는 PS1의 일부이고 및/또는 A3 및/또는 A4는 PS2의 일부이다.
"HCV 엔빌로프 단백질 또는 그의 일부에 결합된 조류의 리소짐 리더 펩티드 또는 그의 기능적 등가물"은 상기 리더 펩티드의 C-말단 아미노산이 펩티드 결합을 통하여 상기 HCV 엔빌로프 단백질 또는 그의 일부의 N-말단 아미노산에 공유결합되는 것을 의미한다. 다르게는, 상기 리더 펩티드의 C-말단 아미노산은 펩티드 또는 단백질에 의해 상기 HCV 엔빌로프 단백질 또는 그의 일부의 N-말단 아미노산으로부터 분리된다. 상기 펩티드 또는 단백질은 상기 정의한 바와 같은 구조를 가질 수 있다.
HCV 엔빌로프 단백질 또는 그의 일부에 결합된 조류의 리소짐 리더 펩티드 또는 그의 기능적 등가물을 포함하는 단백질로부터 목적하는 HCV 엔빌로프 단백질의 유도 또는 구조를 특징으로 하는 단백질의 유도는 프리-단백질 단백질이 발현되어 있는 세포의 단백질 분해 기전에 의해 생체내에서 실시될 수 있다. 보다 자세하게는, 조류의 리더 펩티드를 제거하는 것으로 구성된 단계는 바람직하게는 프리-단백질이 발현되어 있는 세포의 단백질 분해 기전에 의해 생체내에서 실시된다. 그러나, 상기와 같은 유도는 프리-단백질을 발현하는 세포로부터 및/또는 프리-단백질을 발현하는 세포가 생장하는 배양액으로부터 프리-단백질 및/또는 단백질을 분리 및/또는 정제한 후 및/또는 동안 시험관내에서 모두 실시될 수 있다. 다르게는, 상기 생체내 유도는 시험관내 유도와 조합되어 실시될 수 있다. 재조합적으로 발현된 프리-단백질로부터 목적하는 HCV 단백질을 유도하는 것은 가공 단계에서 단백질분해 효소를 사용하는 것을 더 포함할 수 있으며, 목적하는 단백질과 함께 존재하는 모든 또는 대부분의 오염 단백질은 분해되고 목적하는 단백질은 상기 가공성 단백질분해 효소에 견딘다. 유도와 가공과정은 서로 배타적인 과정이 아니며 동일한 단일의 단백질분해 효소를 사용하여 실시될 수 있다. 예로서 Lys-잔기가 부족한 HCV 유전형 1b(서열번호: 2)의 HCV E1 단백질을 들 수 있다. 상기 HCV E1 단백질을 함유하는 단백질 추출물을 엔도프로테이나제 Lys-C (endo-lys C)를 사용하여 분해시키는 것에 의해, E1 단백질은 분해되지 않는 반면에 1개 이상의 Lys-잔기를 함유하는 오염 단백질은 분해된다. 이러한 과정은 HCV E1 단백질의 분리 및/또는 정제를 현저히 단순화하거나 향상시킬 수 있다. 또한, 프리-단백질에 부가적인 Lys-잔기, 예컨대 리더 펩티드 및 HCV E1 단백질을 포함하는 것에 의해, HCV E1 프리-단백질로부터 리더 펩티드의 정확한 시험관내 분리를 할 수 있는 부가적 이점을 가질 수 있다. 다른 HCV E1 단백질은 위치 4, 40, 42, 44, 61, 65 또는 179 (위치 1은 E1 단백질의제1 N-말단 천연 아미노산이고, 즉 HCV 폴리단백질중의 위치 192)의 1개 이상에서 Lys-잔기를 포함할 수 있다. 상술한 바와 같은 endo-lys C를 사용할 수 있기 위해서는, 상기 Lys-잔기는 다른 아미노산 잔기, 바람직하게는 Arg-잔기로 돌연변이될 수 있다.
"정확하게 제거된" 리더 펩티드는 고효율(즉 다수의 프리-(프로-)단백질이 (프로-)단백질로 전환됨) 및 고 적합도(즉, 프리-아미노산 서열이 제거될 뿐만 아니라 상기 프리-아미노산 서열에 결합된 목적하는 단백질의 아미노산도 제거됨)로 목적하는 단백질에 결합된 시그널 서열을 포함하는 단백질로부터 상기 리더 펩티드가 제거됨을 의미한다. "고 효율로 리더 펩티드를 제거"하는 것은 프리-단백질의 약 40% 이상, 더욱 바람직하게는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%가, 프리-서열이 제거된 단백질로 전환됨을 의미한다. 다르게는, 발현된 프리-단백질의 일부가 프리-서열이 제거된 단백질로 전환되지 않으면, 이들 프리-단백질은 더욱 정제되거나 또는 정제하는 동안 제거될 수 있다.
"조류의 리소짐(CL) 리더 펩티드의 기능적 등가물"은 CL 리더 펩티드를 의미하며, 1개 이상의 아미노산은 다른 아미노산으로 치환되며 또 상기 치환은 보존적 아미노산 치환임을 의미한다. "보존적 아미노산 치환"은 보존되는 아미노산 군에 속하는 아미노산을, 보존되는 아미노산의 동일 군에 속하는 다른 아미노산으로 치환시키는 것을 의미한다. 보존되는 아미노산 군으로서는 다음을 고려할 수 있다: Met, Ile, Leu 및 Val로 구성된 군; Arg, Lys 및 His로 구성된 군; Phe, Trp 및 Tyr로 구성된 군; Asp 및 Glu로 구성된 군; Asn 및 Gln로 구성된 군; Cys, Ser 및 Thr로 구성된 군; 및 Ala 및 Gly로 구성된 군. CL 리더 펩티드에서 보존적 아미노 산 치환의 예는 위치 6에서의 자연적 변이이며, 상기 위치에서의 아미노산은 Val 또는 Ile이며; 다른 변이는 위치 17에서 생기며, 이 위치에서의 아미노산은 그 중에서 Leu 또는 Pro (서열번호: 1 참조) 이다. 생성한 CL 리더 펩티드는 기능적 등가물로 볼 수 있다. CL 리더 펩티드의 다른 기능적 등가물은, 결실 변이체 및 삽입 변이체를 비롯하여, 본 발명을 통하여 기재된 바와 같이 CL 리더 펩티드와 동일한 기술적 특징을 재현하는 리더 펩티드를 포함한다.
"A" 또는 "어댑터 펩티드"는 예컨대 리더 펩티드와 가공 부위(PS) 사이, 리더 펩티드와 목적하는 단백질 사이, PS와 목적하는 단백질 사이, 및/또는 목적하는 단백질과 PS 사이에서 링커로서 작용할 수 있거나; 및/또는 예컨대 리더 펩티드, PS 또는 목적하는 단백질의 링커 N- 또는 C-말단으로 작용할 수 있는 펩티드(예컨대 1 내지 30개 아미노산) 또는 단백질을 의미한다. 어댑터 펩티드 "A"는 특정 3차원 구조, 예컨대 α-나선형 또는 β-쉬트 구조 또는 이들을 조합한 구조일 수 있다. 다르게는, A의 3차원 구조는 잘 규정되지 않으며, 예컨대 코일드-코일 구조일 수 있다. 어댑터 A는 예컨대 프리-서열, 프로-서열, 목적하는 서열의 단백질 또는 가공 부위의 일부일 수 있다. 어댑터 A는 A가 일부인 단백질의 결실 및/또는 정제 및/또는 가공을 향상시키거나 가능하게 하는 태그(tag)로서 작용할 수 있다. A 펩티드의 일례는 his-tag 펩티드 (HHHHHH; 서열번호: 63) Hn이며, n은 6이지만, 7, 8, 9, 10, 11 또는 12일 수 있다. A-펩티드의 다른 예는 펩티드 EEGEPK (WO 98/28429호에서 Kjeldsen 등; 서열번호: 64) 또는 EEAEPK (WO 98/28429호에서 Kjeldsen 등; 서열번호: 65)를 포함하며, 목적하는 단백질의 N-말단에 존재할 때는 발효수율을 증가시키는 것으로 보고되어 있지만, 디펩티딜 아미노펩티다제에 의한 가공으로부터 목적하는 단백질의 N-말단을 보호하므로, 폴리펩티드의 균질한 N-말단을 초래할 수 있다. 동시에, 목적하는 단백질의 시험관내 성숙, 즉 상기 펩티드 EEGEPK (서열번호: 64) 및 EEAEPK (서열번호: 65)를 목적하는 단백질로부터 제거하는 것은 상기 펩티드내의 Lys-잔기의 C-말단을 분해하는 엔도-lys C를 사용함으로써 달성할 수 있다. 따라서 상기 펩티드는 어댑터 펩티드(A) 뿐만 아니라 가공 부위(PS)의 작용도 한다 (이하 참조). 어댑터 펩티드는 서열번호: 63-65, 70-72 및 74-82에 기재되어 있다. 어댑터 펩티드의 다른 예는 G4S 면역침묵(immunosilent) 링커이다. 어댑터 펩티드 또는 어댑터 단백질의 다른 예는 Stevens (Stevens 등 2000)의 표 2에 수록되어 있다.
"PS" 또는 "가공부위"는 특정 단백질 가공 또는 가공가능한 부위를 의미한다. 상기 가공은 효소적으로 또는 화학적으로 생길 수 있다. 특정 효소적 가공되기 쉬운 가공부위의 예는 IEGR↓X (서열번호: 66), IDGR↓X (서열번호: 67), AEGR↓X (서열번호: 68)을 포함하며, 이들은 모두 Arg 및 Xaa (임의 아미노산) 잔기 사이에 "↓"로 표시한 바와 같이 소의 인자 Xa 프로테아제(나가이, 케이 및 토게르센, 에이치.씨. 1984)에 의해 인식되어 분해된다. PS 부위의 다른 예는 이염기성 부위, 예컨대 Arg-Arg, Lys-Lys, Arg-Lys 또는 Lys-Arg이며, 효모 Kex2 프로테아제에 의해 분해될 수 있다(Julius, D 등 1984). PS 부위는 단염기성 Lys-부위일 수 있다. 상기 단염기성 Lys-PS-부위는 A 펩티드의 C-말단에 포함될 수 있다. C 말단의 일염기성 Lys-PS-부위를 포함하는 A 어댑터 펩티드의 예는 서열번호: 64-65 및 74-76에 기재되어 있다. His-tag (HHHHHH; 서열번호: 63)의 엑소단백질분해 제거는 디펩티딜 아미노펩티다제 I(DAPase)를 단독 사용하거나 또는 글루타민 시클로트랜스퍼라제(Qcyclase 제조) 및 피로글루타민 아미노펩티다제 (pGAPase) (Pedersen, J 등 1999)와 조합하여 실시한다. 재조합 His-태그를 포함하는 상기 엑소펩티다제(고정 금속-치환성 크로마토그래피(IMAC)에 의해 반응 혼합물로부터 펩티다제를 제거할 수 있음)는 유니자임 라보라토리스 (Hφrsholm, DK)에 의해 TAGZyme System으로서 시판되고 있다. "가공"은 일반적으로 가공 부위가 단백질에 존재할 때, 단백질을 하나 이상의 가공 부위에서 특이적으로 분해 또는 절단되는 방법 또는 과정을 의미한다. PS는 엔도프로테오리틱 분해되기 쉽거나 또는 상기 분해가 특이적일 때, 즉 단백질분해 효소를 가공하는 것에 의해 인식된 부위 이외의 부위로 확대되지 않는 엑소프로테오리틱 분해될 수 있다. 다수의 PS 부위가 서열번호: 66-68 및 83-84에 기재되어 있다.
상기 기재한 바와 같은 구조의 다양성은 일부 실시예에 의해 예시할 수 있다. 일례로서, 상기 구조는 프리-단백질에 포함되어 있는 목적하는 단백질의 C-말단에 존재할 수 있고 또 A3은 인자 Xa "IEGRX" PS 부위(서열번호: 66)와 중복되는 "VIEGR" 펩티드 (서열번호: 69)이고 또 X = A4는 히스티딘-태그 (서열번호: 63)(이때, d, e 및 f는 상기 경우 모두 1임)이다. 목적하는 HCV 단백질은 경우에 따라 IMAC에 의해 정제될 수 있다. 인자 Xa로 가공한 후, (경우에 따라 정제된) 목적하는 HCV 단백질은, 그의 C-말단에, 가공된 PS 부 위, "IEGR"(서열번호: 70)을 가질 것이다. 변이체 가공된 인자 Xa 가공부위는 IDGR(서열번호: 71) 또는 AEGR (서열번호: 72)일 수 있다. 다른 예로서, 구조는 목적하는 HCV 단백질의 N-말단에 존재한다. 또한 A1은 히스티딘-태그(서열번호: 63)이고, PS는 인자 Xa 인식 부위 (임의의 서열번호: 66-68)이며, X는 목적하는 단백질이고, a=b=1 및 c = 0 이다. 숙주세포에 의해 리더 펩티드를 정확히 제거할 때, 생긴 목적하는 HCV 단백질은 IMAC(임의적)에 의해 정제될 수 있다. 인자 Xa를 사용하여 가공한 후, 목적하는 단백질은 구조를 갖지 않을 것이다.
A1, A2, A3, A4, PS1 및 PS2는 존재하는 경우, 반복 구조로 존재함이 분명하다. 이러한 반복 구조는, 존재할 경우, 1로 카운트하며, 즉 A1이 2 반복체(A1-A1)로 생기더라도 a, b, c, d, e 또는 f는 1이다.
본 발명의 다른 요지는 시스테인 티올 기가 화학적으로 수식(修飾)된 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.
본 발명의 다른 요지는 항원성인 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.
본 발명의 더 다른 요지는 면역원성인 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.
본 발명의 더 다른 요지는 T-세포 자극 항원결정부위를 포함하는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.
본 발명의 더 다른 요지는 단량체, 동종이합체, 이종이합체, 동종올리고머 및 이종올리고머로 구성된 군으로부터 선택되는 구조에 포함되는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.
본 발명의 또 다른 요지는 바이러스-유사 입자에 포함되는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다.
1개 이상의 시스테인 잔기를 포함하지만 바람직하게는 2개 이상의 시스테인 잔기를 포함하는 상기 기재한 바와 같은 HCV 엔빌로프 단백질 또는 그의 일부에서, 시스테인 티올 기는 화학적 또는 효소적 수단에 의해 비가역적으로 보호될 수 있다. 특히, 화학적 수단에 의한 "비가역적 보호" 또는 "비가역적 차단"은 알킬화, 바람직하게는 활성 할로겐, 에틸렌이민 또는 N-(요오도에틸)트리플루오로-아세트아미드와 같은 알킬화제를 사용하여 HCV 엔빌로프 단백질을 알킬화하는 것을 의미한다. 이와 관련하여, 시스테인 티올 기의 알킬화는 티올-수소를 (CH2)nR (n은 0, 1, 2, 3 또는 4이고 또 R = H, COOH, NH2, CONH2, 페닐 또는 그의 유도체임)에 의해 치환되는 것을 의미한다. 알킬화는 예컨대 활성 할로겐 X(CH2)nR (식중, X는 I, Br, Cl 또는 F와 같은 할로겐임)과 같이 당업자에게 공지된 방법에 의해 실시된다. 활성 할로겐의 예는 메틸요오다이드, 요오도아세트산, 요오도아세트아미드 및 2-브로모에틸아민이다. 알킬화의 다른 방법은 NEM (N-에틸말레이미드) 또는 비오틴-NEM, 그의 혼합물 또는 에틸렌이민 또는 N-(요오도에틸)트리플루오로아세트아미드의 사용을 포함하며, 그에 의해 -H가 -CH2-CH2-NH2 (Hermanson, G. T. 1996)에 의해 치환된다. 본 명세서에 사용된 용어 "알킬화제"는 본 명세서에 기재한 바와 같이 알킬 화를 실시할 수 있는 화합물을 지칭한다. 이러한 알킬화는 결국 수식된 시스테인을 초래할 것이고, 이것은 다른 아미노산을 모방할 수 있다. 에틸렌이민에 의한 알킬화는 구조적으로 유사한 리신을 초래하며, 그에 의해 트립신에 대한 새로운 분해 부위가 도입된다 (Hermanson, G.T. 1996). 유사하게, 메틸요오다이드의 사용은 메티오닌과 유사한 아미노산을 초래하는 반면, 요오도아세테이트 및 요오도아세트아미드를 사용하면 글루탐산 및 글루타민과 유사한 아미노산을 초래한다. 이와 비슷하게, 상기 아미노산은 바람직하게는 시스테인을 직접적으로 돌연변이시키는데도 사용된다. 따라서, 본 발명은 본 명세서에 기재된 HCV 엔빌로프 단백질의 하나 이상의 시스테인 잔기가 돌연변이되어 천연의 아미노산으로, 바람직하게는 메티오닌, 글루타민산, 글루타민 또는 리신으로 된 HCV 엔빌로프 단백질에도 관한 것이다. 용어 "돌연변이된"은 상기 아미노산을 암호화하는 핵산의 부위-특이적 돌연변이, 즉 예컨대 PCR에 의한 부위-특이적 돌연변이 또는 (Sambrook, J. 등 1989)에 기재된 바와 같은 올리고뉴클레오티드-매개 돌연변이를 통하는 것과 같은 당업자에게 공지된 방법을 지칭한다. 본 발명의 실시예 부분의 경우 알킬화는 특별히 언급하지 않는 한 알킬화제인 요오도-아세트아미드를 사용하는 것을 의미함을 이해해야한다.
또한 정제과정에서, 본 발명의 HCV 단백질 또는 그의 일부의 시스테인 티올-기는 가역적으로 보호될 수 있음을 이해해야한다. 가역적 보호의 목적은 HCV 단백질 또는 그의 일부를 안정화시키기 위한 것이다. 특히, 가역적 보호 후 황-함유 기능적 기(예컨대 티올 및 디술피드)는 비-반응성 조건으로 유지된다. 황-함유 기 능적 기는 다른 화합물과 반응할 수 없는데, 예컨대 다음과 같은 디술피드 결합을 형성하거나 변경하는 경향을 손실하였다:
티올 및/또는 디술피드 잔기 사이의 상기 반응은 분자상호간 과정에 한정되지 않지만, 분자내에서도 생길 수 있다.
본 명세서에서 사용된 용어 "가역적 보호" 또는 "가역적 차단"은 수식제를 시스테인 티올 기에 공유결합시키는 것 뿐만 아니라 HCV 단백질 자체의 환경을 조작하여 시스테인 티올-기의 산화환원 상태가 후속 정제단계를 통하여 영향을 받지 않고 유지되게하는(보호하는) 것을 의미한다. 시스테인 티올 기의 가역적 보호는 화학적으로 또는 효소적으로 실시할 수 있다.
본 명세서에서 사용된 용어 "효소적 수단에 의한 가역적 보호"는 예컨대 아실 트랜스퍼라제와 같은 효소에 의해 매개되는 가역적 보호를 의미할 수 있으며, 상기 아실 트랜스퍼라제는 팔미토일 아실트랜스퍼라제와 같은 티오-에스테르화를 촉진하는데 관여한다(하기 내용 참조).
본 명세서에서 사용된 용어 "화학적 수단에 의한 가역적 보호"는 다음과 같은 가역적 보호를 고려할 수 있다:
1. 예컨대 술폰화 반응 및 티오-에스테르화 반응과 같은 시스테이닐을 가역적으로 수식시키는 수식제(modification agent)에 의함;
술폰화는 디술피드 브릿지에 관여하는 티올 또는 시스테인이 수식되어 S-술포네이트를 형성하는 반응이다: RSH → RS-SO3
- (Darbre, A. 1986) 또는 RS-SR → 2 RS-SO3
- (술피톨리시스; (Kumar, N. 등 1986)). 술폰화 시약은 예컨대 Na2SO
3 또는 나트륨 테트라티오네이트이다. 술폰화를 위한 후자 시약은 10-200 mM 농도, 보다 바람직하게는 50-200 mM의 농도로 사용된다. 경우에 따라 술폰화반응은 예컨대 Cu2+ (100 μM-1mM) 또는 시스테인 (1-10 mM)과 같은 촉매 존재하에서 실시될 수 있다.
상기 반응은 단백질 변성조건 뿐만 아니라 천연 조건하에서 실시될 수 있다 (Kumar, N 등 1985, Kumar, N 등 1986). 티오에스테르 결합 형성 또는 티오-에스테르화 반응은 다음과 같이 특징지워질 수 있다:
RSH + R'COX → RS-COR'
(식중, X는 바람직하게는 화합물 R'CO-X에 있는 할로게나이드이다).
2. 예컨대 중금속, 특히 Zn2+, Cd2+, 모노-, 디티오- 및 디술피드 화합물 (예컨대 아릴- 및 알킬메탄티오술포네이트, 디티오피리딘, 디티오모르폴린, 디히드로리포아미드, 엘만 시약, 알드로티올TM (알드리히 제조) (Rein, A 등 1996), 디티오카르바메이트) 또는 티올화제 (예컨대 글루타티온, N-아세틸 시스테인, 시스테인아민)와 같은 본 발명의 시스테인을 가역적으로 수식시키는 수식제에 의함. 디티오 카르바메이트는 술피드릴 기와의 반응성을 부여하는 R1R2NC(S)SR3 작용기를 갖는 광범위한 범위의 분자를 포함한다. 티올 함유 화합물은 바람직하게는 0.1-50 mM 농도, 보다 바람직하게는 1-50 mM 농도, 더욱 바람직하게는 10-50 mM 농도로 사용된다.
3. 티올 상태를 보존하는(안정화시키는) 수식제, 특히 DTT, 디히드로아스코르베이트, 비타민 및 유도체, 만니톨, 아미노산, 펩티드 및 유도체(예컨대 히스티딘, 에르고티오네인, 카르노신, 메티오닌), 갈레이트, 히드록시아니솔, 히드록시톨루엔, 히드로퀴논, 히드록시메틸페놀 및 이들의 유도체와 같은 산화방지제가 10μM-10 mM 농도, 보다 바람직하게는 1-10 mM 농도로 존재하는 것에 의함.
4. 티올 안정화 조건에 의해, 예컨대 (i) 금속 이온(Zn2+, Mg2+), ATP와 같은 보조인자, (ii) pH 제어 (예컨대 대부분의 단백질의 경우 pH ~5 이거나 또는 pH는 바람직하게는 티올 pKa -2임; 예컨대 역상 크로마토그래피에 의해 정제된 펩티드의 경우는 pH ~2).
상기 (1), (2), (3) 및 (4)에 기재된 바와 같은 가역 보호를 조합하면 유사하게 순수하고 재구성된 HCV 단백질을 얻을 수 있다. 실제로, 예컨대 Z103 (Zn 카르노신)과 같은 조합 화합물은 바람직하게는 1-10 mM 농도로 사용될 수 있다. 가역보호는 또한 상기 기재한 바와 같은 수식기 또는 보호 이외에, 펩티드 주쇄를 파괴하지 않고 효소적으로 또는 화학적으로 가역적인 시스테이닐 보호방법을 의미함을 이해해야한다. 이와 관련하여, 본 발명은 특히 티오에스테르 결합이 티오에스 테르분해효소 (티오에스테라제), 염기성 완충액 조건(Beekman, N, J. 1997)에 의해 또는 히드록실아민 처리(Vingerhoeds, M. H. 등 1996)에 의해 분해되는 전통적인 화학적 합성법(상기 기재)에 의해 제조된 펩티드를 주목하고 있다.
티올 함유 HCV 단백질은 예컨대 (1) 디술피드 결합을 함유하는 분해가능한 커넥터 아암(connector arm) [예컨대, 고정화된 5,5' 디티오비스(2-니트로벤조산) (Jayabaskaran, C. 등 1987) 및 활성화된 티올-세파로오스 4B (파마시아 제조)상에서의 공유결합 크로마토그래피] 또는 (2) 고정화된 리간드인 아미노헥사노일-4-아미노페닐아르신을 함유하는 친화성 크로마토그래피 수지상에서 정제될 수 있다. 후자 친화성 매트릭스는 단백질의 정제를 위해 사용되었고, 산화환원 조절 및 산화적 스트레스의 표적인 티올 단백질 처리된다 (Kalef, E. 등 1993).
가역적 보호는 펩티드의 용해화 및 추출을 증가시키기 위해 사용될 수 있다 (Pomroy, N.C. 및 Deber, C. M. 1998).
가역적 보호 및 티올 안정화 화합물은 단량체성, 중합체성 또는 리포좀 형태로 존재할 수 있다.
시스테인 잔기의 가역적 보호상태의 제거는 예컨대 다음과 같이 화학적으로 또는 효소적으로 실시될 수 있다:
- 1-200 mM의 농도, 보다 바람직하게는 50-200 mM 농도의 환원제, 특히 DTT, DTE, 2-머캅토에탄올, 디티오나이트, SnCl2, 붕소수소화나트륨, 히드록실아민, TCEP.
- 예컨대 pH증가에 의한 티올 안정화 조건 또는 티올안정화제의 제거.
- 0.01-5 μM의 농도, 더욱 특히 0.1-5 μM 농도 범위의 효소, 특히 티오에스테르 분해효소, 글루타르레독신, 티오레독신.
- 상기 기재한 화학적 및/또는 효소적 조건의 조합.
시스테인 잔기의 가역적 보호상태의 제거는 시험관내 또는 생체내에서, 예컨대 세포내 또는 개체내에서 실시될 수 있다.
정제 과정에서, 시스테인 잔기는 경우에 따라 비가역적으로 차단되거나 또는 상기 수록한 가역적 수식제에 의해 치환될 수 있다.
본 발명에 따른 환원제는 시스테인 잔기, 예컨대 "S-S" 디술피드 브릿지에 있는 황을 환원시키거나, 시스테인 잔기의 탈술폰화 (RS-SO3
- → RSH)할 수 있는 물질이다. 산화방지제는 티올상태를 보존하거나 또는 "S-S"형성 및/또는 변경을 최소화시키는 물질이다. "S-S" 디술피드 브릿지의 환원은 화학적 반응이며, 그에 의해 디술피드는 티올 (-SH)로 환원된다. WO 96/04385호에서 Maertens 등에 의해 기재된 디술피드 브릿지를 파괴하는 물질 및 방법은 본 명세서에 참고문헌으로 포함된다. "S-S" 환원은 (1) 효소적 캐스케이드 경로에 의해 또는 (2) 화합물을 환원시키는 것에 의해 달성할 수 있다. 티오레독신, 글루타르레독신과 같은 효소는 디술피드의 생체내 환원에 관여하는 것으로 알려져 있으며 또한 시험관내에서 "S-S"브릿지를 환원시키는데 효과적으로 알려져 있다. 디술피드 결합은 pH 7.0에서, 환원된 티오레독신에 의해 신속하게 분해되며, DTT와의 반응에 대해 상응하는 속도 상수보다 104배 더 큰 2차 속도로 분해된다. 환원 키네틱은 단백질 용액을 1 mM DTT 또는 디히드로리포아미드와 예비배양하는 것에 의해 현저하게 증가될 수 있다 (Holmgren, A. 1979). 단백질 디술피드 브릿지를 환원시킬 수 있는 티올 화합물은 예컨대 디티오트레이톨(DTT), 디티오에리트리톨 (DTE), β-머캅토에탄올, 티오카르바메이트, 비스(2-머캅토에틸)술폰 및 N,N'-비스(머캅토아세틸)히드라진 및 나트륨-디티오나이트이다. 모노클로날 항체에서 디술피드 브릿지의 환원에 아주 유용한 (Thakur, M. L. 등 1991) 것으로 알려져 있는 아스코르베이트 또는 염화주석(SnCl2)과 같은 티올기를 갖지 않는 환원제는 HCV 단백질의 환원에도 사용될 수 있다. 또한, pH값에서의 변화는 HCV 단백질의 산화환원 상태에 영향을 줄 수 있다. 붕소수소화나트륨 처리는 펩티드중의 디술피드 브릿지의 환원에 효과적인 것으로 드러났다 (Gailit, J. 1993). 트리스(2-카르복시에틸)포스핀 (TCEP)은 낮은 pH에서 디술피드를 환원시킬 수 있다 (Burns, J. 등 1991). 셀레놀은, DTT 또는 붕소수소화 나트륨이 환원제로 사용될 때, 디술피드가 티올로 환원되는 것을 촉진한다. 상업적으로 시판되는 디셀레나이드인 셀레노시스테아민은 촉매의 전구체로서 사용되었다 (Singh, R. 및 Kats, L. 1995).
용어 "면역원성"은 단백질 또는 물질이 면역반응을 유발할 수 있는 능력을 지칭한다. 면역반응은 항원의 도입에 대한 몸의 전체적 반응으로서, 항체 형성, 세포성 면역, 과민반응 또는 면역학적 내성을 포함한다. 세포성 면역은 T-헬퍼 세포 반응 및/또는 CTL-반응이라 칭한다.
용어 "항원성"은 단백질 또는 물질이 항체형성을 유발하거나 세포성 반응을 유도하는 능력을 지칭한다.
본 발명에 따른 표현 "T-세포 자극 항원결정부위"는 T-세포 또는 CTL-세포를 각각 자극할 수 있는 항원결정부위를 지칭한다. T-헬퍼 세포 자극 항원결정부위는 자신의 아미노산 서열에 (임의의) T-세포 자극 항원결정부위를 함유하는 폴리펩티드에 대한 림프증식성 반응을 모니터링하는 것에 의해 선택될 수 있다. 상기 림프증식성 반응은 환자혈청으로부터 얻은 말초혈액 단핵성 세포(PMBC)를 시험관내에서 T-세포 자극 활성에 대해 시험할 다양한 농도의 펩티드를 사용하여 자극시킨 다음 방사성표지된 티미딘 흡수량을 계산하는 것을 포함하는 T-헬퍼 에세이법에 의해 측정할 수 있다. CTL-자극 항원결정부위는 51Cr 방출을 이용한 세포독성 세포의 용균(lytic) 활성을 측정하는 세포독성 T-세포 (CTL) 에세이법을 이용하여 선택할 수 있다. 자극지수(항원-자극된 배양액의 평균 cpm/대조용 배양액의 평균 cpm)가 1 이상, 바람직하게는 2 이상, 가장 바람직하게는 3 이상일 때 증식은 양성으로 간주된다.
본 발명의 다른 요지는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편을 포함하는 조성물에 관한 것이다. 상기 조성물은 약제학적으로 허용되는 담체를 포함할 수 있고 또 의약 또는 백신일 수 있다.
본 발명의 다른 요지는 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는 의약 또는 백신을 포함한다.
본 발명의 다른 요지는 본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부 및 경우에 따라 약제학적으로 허용되는 보조제를 포함하는, 포유동물에서 HCV 특이적 면역반응을 유발하기 위한 약제학적 조성물을 포함한다. 본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는 상기 약제학적 조성물은 포유동물에서 HCV 특이적 항체를 유발할 수 있거나, 포유동물에서 T-세포 작용을 유발할 수 있다. 본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는 상기 약제학적 조성물은 예방적 조성물 또는 치료적 조성물일 수 있다. 특정 구체예로서, 상기 포유동물은 사람이다.
"포유동물"은 사람을 비롯한 포유강(Mammalia)의 고등 척추동물로 이해되며, 출생, 체모 및 암컷에 유선세포를 갖고 있어서 어린애들을 먹이기 위한 젖을 분비하는 것을 특징으로 한다. 포유동물은 비인간 영장류 및 트리메라 마우스(Zauberman 등 1999)도 포함한다.
"백신" 또는 "의약"은 일부 또는 전면적이든 질병이든, 급성 또는 만성 질병이든 질병으로부터 보호할 수 있는 조성물이다; 백신 또는 의약은 예방적 백신 또는 의약일 수 있다. 백신 또는 의약은 이미 병에 걸린 개체의 치료에 유용하며, 이 경우 치료적 백신 또는 의약이라 불린다. 마찬가지로, 약제학적 조성물은 예방적 및/또는 치료적 조성물인 경우 예방적 및/또는 치료적 목적으로 사용될 수 있다.
본 발명의 HCV 엔빌로프 단백질은 비오티닐화된 형태(WO 93/18054호에 설명됨)로 사용될 수 있거나 및/또는 뉴트랄라이트 아비딘(Neutralite Avidin) (미국 오리건 유진에 소재하는 Molecular Probes Inc. 제조), 아비딘 또는 스트랩트아비딘에 착화될 수 있다. "백신" 또는 "의약"은 활성 물질 이외에, 그 자체로는 조성물을 받아들이는 개체에 유해한 항체 생산을 유발하지 않고 보호를 유발하지도 않는 적합한 부형제, 희석제, 담체 및/또는 보조제일 수 있는 "약제학적으로 허용되는 담체" 또는 "약제학적으로 허용되는 보조제"를 포함할 수 있다. 적합한 담체는 전형적으로 단백질, 다당류, 폴리락틱산, 폴리글리콜산, 중합성 아미노산, 아미노산 공중합체 및 불활성 바이러스 입자와 같은 전형적으로 크고 느리게 대사되는 거대분자이다. 이러한 담체는 당업자에게 공지되어 있다. 조성물의 효과를 향상시키기 위한 바람직한 보조제는 다음을 포함하지만, 이들에 한정되는 것은 아니다: 수산화알루미늄, WO 93/19780호에 기재된 바와 같은 3-O-데아실화된 모노포스포릴 지질 A와 조합된 알루미늄, WO 93/24148호에 기재된 인산알루미늄, 미국특허 4,606,918호에 기재된 N-아세틸-무라밀-L-트레오닐-D-이소글루타민, N-아세틸-노르무라밀-L-알라닐-D-이소글루타민, N-아세틸무라밀-L-알라닐-D-이소글루타밀-L-알라민 2-(1'2'디팔미토일-sn-글리세로-3-히드록시포스포릴옥시)에틸아민, 모노포스포릴 지질 A를 함유하는 RIBI (ImmunoChem Research Inc. 제조, 미국 미네소타 해밀톤 소재), 해독된 엔도톡신, 트레할로오스-6,6-디미콜레이트 및 2% 스쿠알렌/Tween 80 유제중의 세포벽 구조(MPL + TDM + CWS). 세 개 성분 MPL, TDM 또는 CWS의 어떤 것도 단독으로 또는 2개씩 조합될 수 있다. MPL은 RC-529로 불리는 그의 합성 유사체로 교체될 수 있다. 부가적으로, Stimulon (캠브릿지 바이오사이언스 제조, 미국 미네소타 와세스터 소재), SAF-1 (Syntex 제조) 또는 ISS (Dynavax 제조) 또 는 CpG (Coley Pharmaceuticals 제조)와 같은 세균성 DNA-기제 보조제와 같은 보조제는 QS21 및 3-de-O-아세틸화 모노포스포릴 지질 A (WO 94/00153)의 조합물, 또는 MF-59 (Chiron 제조), 또는 폴리[디(카르복시라토페녹시)포스파젠] 기제 보조제 (Virus Research Institute 제조), 또는 Optivax (Vaxcel, Cythx 제조)와 같은 블록공중합체 기제 보조제 또는 Algammulin 및 GammaInulin (Anutech 제조)과 같은 이눌린-기제 보조제, 불완전 프로인드 보조제 (IFA) 또는 Gerbu 제제 (Gerbu Biotechnik 제조)와 같은 보조제도 사용될 수 있다. 완전 프로인드 보조제(CFA)는 비-인간 용도 및 연구 목적에 사용될 수 있다. "백신 조성물"은 또한 고유하게 비독성이고 비치료성인 부형제 및 희석제, 예컨대 물, 염수, 글리세롤, 에탄올, 습윤제 또는 유화제, pH 완충 물질, 보존제 등을 더 함유할 수 있다. 전형적으로, 백신 조성물은 주사가능하게, 예컨대 액체 용액 또는 현탁액으로 제조된다. 주사는 피하주사, 근육내 주사, 정맥주사, 복강내주사, 지주막하 주사, 피내주사일 수 있다. 다른 형태의 투여는 이식, 좌약, 경구 섭취, 장내 적용, 흡입, 에어로졸화 또는 경비 분무 또는 점적투여를 포함한다. 주사하기 전, 액체 전색제상에서 용액 또는 액제 전색제중에서 현탁액으로 되기 적합한 고상 형태도 제조될 수 있다. 이러한 제제는 보조제 효과를 향상시키기 위하여 리포좀에 유화되거나 유제화될 수 있다. 폴리펩티드는 사포닌과 함께 면역자극 복합체(Immune Stimulating Complex), 예컨대 Quil A(ISCOMS)에 혼입될 수 있다. 백신 조성물은 유효량의 활성물질 뿐만 아니라 상술한 성분 이외의 것도 포함한다. 활성성분의 "유효량"은 단일 투여 또는 일련의 투여의 일부로서 그 양을 개체에게 투여하면 질병의 예방 또는 치료에 효과적 이거나 또는 소망하는 효과를 유발하는데 효과적이라는 것을 의미한다. 이 양은 처리될 개체의 건강 및 신체적 조건, 처리될 개체의 분류학적 그룹 (예컨대 인간, 비인간 영장류, 영장류 등), 효과적인 면역반응에 도달하는 개별 면역 계의 능력, 소망하는 보호정도, 백신의 제형, 치료 의사의 평가, 감염 병원체의 균주 및 다른 관련 인자에 따라서 달라질 수 있다. 상기 양은 일반적인 실험을 통하여 결정될 수 있는 비교적 넓은 범위내에 포함될 수 있다. 통상, 상기 양은 0.01 내지 1000 ㎍/투여, 보다 자세하게는 0.1 내지 100 ㎍/투여로 다양할 수 있다. 투여 처리는 단일 투여 스케쥴 또는 다중 투여 스케쥴일 수 있다. 백신은 다른 면역조절제와 함께 투여될 수 있다.
본 발명의 다른 요지는 본 발명에 따른 분리된 HCV 엔빌로프 단백질 또는 그의 단편을 제조하는 방법에도 관한 것이다.
HCV 엔빌로프 단백질 또는 그의 일부를 제조하는 방법은 예컨대 HCV 엔빌로프 단백질 또는 그의 일부를 암호화하는 오픈 리딩 프레임을 포함하는 재조합 핵산 또는 벡터를 사용하여 숙주 세포를 형질전환시키는 것을 포함하며, 상기 숙주 세포는 상기 HCV 엔빌로프 단백질 또는 그의 일부를 발현할 수 있다. 상기 방법은 또한 상기 숙주 세포를 적합한 배지에서 배양하여 상기 단백질의 발현을 얻고, 발현된 단백질을 상기 숙주 세포의 배양액으로부터 또는 상기 숙주 세포로부터 분리하는 것을 더 포함한다. 상기 분리는 (i) 카오트로픽제(chaotropic agent) 존재하에서 상기 숙주 세포를 용균시키거나, (ii) 분리된 단백질중에 있는 시스테인 티올 기를 가역적 또는 비가역적일 수 있게 화학적으로 수식시키거나 및 (iii) 헤파린 친화성 크로마토그래피 처리하는 등 1개 이상을 포함할 수 있다.
"카오트로픽제"의 예는 염화 구아니디늄 또는 요소이다. 일반적으로, 카오트로픽제는 물의 수소결합 구조를 파괴할 수 있는 화학물질이다. 농축 용액에서, 이들은 소수성 효과를 감소시키기 때문에 단백질을 변성시킬 수 있다.
"재조합 핵산"은 재조합 효소 분해, PCR, 결찰, 탈인산반응, 인산화반응, 돌연변이, 이종 세포에서 발현을 위한 코돈의 개질과 같은 재조합 DNA 수법 조작의 하나 이상에 처리된 천연 또는 합성 기원의 핵산을 의미한다. 일반적으로, 재조합 핵산은 천연산출 핵산의 단편이거나 또는 천연적으로 관련이 없는 2개 이상의 핵산 단편을 포함하거나 또는 완전한 합성 핵산이다.
본 명세서에 사용된 용어 "폴리뉴클레오티드", "폴리핵산", "핵산서열", "뉴클레오티드 서열", "핵산 분자", "올리고뉴클레오티드", "프로브" 또는 "프라이머"는 임의 길이 또는 형상의 중합체 형태 (예컨대 측쇄 DNA)의 뉴클레오티드, 리보뉴클레오티드, 데옥시리보뉴클레오티드, 펩티드 뉴클레오티드 또는 로크(locked)된 뉴클레오티드, 또는 이들의 조합물을 지칭한다. 상기 용어는 또한 이중 가닥(ds) 및 단일가닥(ss) 폴리뉴클레오티드 뿐만 아니라 삼중가닥 폴리뉴클레오티드를 포함한다. 상기 용어는 메틸화, 고리화 및 "캡스"와 같은 공지 뉴클레오티드 수식 및 1개 이상의 천연산출 뉴클레오티드를 이노신과 같은 유사체 또는 HEG (헥에틸렌 글리콜)과 같은 비-증식성 단량체로의 치환을 포함한다. 리보뉴클레오티드는 NTP로 표시하고, 데옥시리보뉴클레오티드는 dNTP로 표시하며 또 디데옥시리보뉴클레오티드는 ddNTP로 표시한다.
뉴클레오티드는 일반적으로 방사선, 화학적발광, 형광적으로, 인광적으로 또는 적외선 염료에 의해 또는 표면향상된 라만 표지 또는 플라스몬 공명 입자(PRP)에 의해 표지될 수 있다.
상기 용어 "폴리뉴클레오티드", "폴리핵산", "핵산 서열", "뉴클레오티드 서열", "핵산 분자", "올리고뉴클레오티드", "프로브" 또는 "프라이머"는 또한 펩티드 핵산(PNA), 주쇄가 당이 아니라 N-(2-아미노에틸)-글리신 단위체로 구성된 슈도펩티드인 DNA 유사체를 포함한다. PNA는 DNA의 특징과 유사하고 상보적 핵산 가닥과 결합된다. PNA의 중성 주쇄는 보통 얻어지는 것 보다 더 강한 결합과 더 큰 특이성을 초래한다. 또한, PNA의 독특한 화학적, 물리적 및 생물학적 특성은 강력한 바이오분자 도구, 안티센스 및 항원제, 분자 프로브 및 바이오센서를 생성하기 위해 이용될 수 있다. PNA 프로브는 DNA 프로브보다 더 짧을 수 있고 또 일반적으로 6 내지 20개 염기 길이이며, 가장 최적인 길이는 12 내지 18개 염기 길이이다(Nielsen, P. E. 2001). 상기 용어는 또한 리보오스 고리가 2'-산소와 4'-탄소 사이의 메틸렌 결합에 의해 속박되는 RNA 유도체인 로크된 핵산(LNA)를 더 포함한다. LNA는 DNA 또는 RNA 표적 서열에 대하여 예상치 못한 결합 친화력을 나타낸다. LNA 뉴클레오티드는 올리고머화될 수 있고 또 키메라 또는 혼합-mer성 LNA/DNA 또는 LNA/RNA 분자에 혼입될 수 있다. LNA는 배양액에 대하여 비독성으로 보인다(Orum, H. 및 Wngel, J. 2001, Wahlestedt, C. 등 2000). 일반적으로, DNA, RNA, PNA 및 LNA의 키메라 또는 혼합-mer는 티민이 우라실로 치환된 임의의 어느 하나로 간주될 수 있다.
상기 내용으로부터, 본 발명은 본 발명에 따른 코어-글리코실화된 HCV 엔빌로프 단백질 또는 본 발명에 따른 조성물의 HCV 백신 조성물 제조를 위한 용도에 관한 것임이 분명하다. 특히, 본 발명은 만성 HCV 보균자에서 HCV에 대한 면역성을 유발하기 위한 본 발명에 따른 코어-글리코실화된 HCV 엔빌로프 단백질의 용도에도 관한 것이다. 보다 특히, 본 발명은 소량의 HCV 치료 약물 투여와 조합하거나 또는 조합하지 않고도, 공지된 인터페론 요법과 같은 다른 요법을 실시하기 전, 실시함과 동시에 또는 실시한 후, 만성 HCV 보균자에서 HCV에 대한 면역성을 유발하기 위한 상기 정의한 바와 같은 코어-글리코실화된 HCV 엔빌로프 단백질의 용도에 관한 것이다. 이러한 조성물은 간 이식전 또는 이식후 또는 예컨대 주사바늘 손상과 같은 예상할 수 있는 감염 후 이용될 수 있다.
본 발명의 다른 요지는,
(i) HCV 엔빌로프 단백질 또는 그의 일부가 항-HCV 항체와 복합체를 형성하게하는 조건하에서, 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 항-HCV 항체를 갖는 것으로 추정되는 샘플과 접촉시키는 단계,
(ii) (i)에서 형성된 복합체를 검출하는 단계, 및
(iii) (ii)로부터 상기 샘플에 항-HCV 항체가 존재하는지를 유추하는 단계를 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플중에서 항-HCV 항체의 존재를 검출하는 방법에 관한 것이다.
특정 실시예로서, 상기 방법의 단계(i)에서의 접촉은 경쟁적 조건하에서 실시된다. 상기 방법에 대한 다른 특정 실시예로서, 상기 HCV 엔빌로프 단백질 또는 그의 일부는 고형 지지체에 부착된다. 다른 실시예로서, 항-HCV 항체를 포함할 것으로 추정되는 샘플은 생물학적 샘플이다.
본 발명의 다른 요지는 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플에서 항-HCV 항체의 존재를 검출하기 위한 진단 키트에 관한 것이다. 특정 실시예로서, 상기 HCV 엔빌로프 단백질 또는 그의 일부는 고형 지지체에 부착된다. 다른 실시예로서, 항-HCV 항체를 포함할 것으로 추정되는 샘플은 생물학적 샘플이다.
본 명세서에 사용된 용어 "생물학적 샘플"은 개체로부터 분리된 조직 또는 체액 샘플이며, 예컨대 혈청, 플라즈마, 림프액, 피부의 외부 분비물, 호흡관, 내장 또는 생식기-비뇨기, 난모세포, 눈물, 타액, 우유, 혈액세포, 종양, 기관, 위장 분비, 점액, 척수액, 대변, 소변, 정자 등과 같이 외부로 분비되는 물질을 들 수 있고, 이들에 한정되는 것은 아니다.
본 발명의 HCV 엔빌로프 단백질 또는 그의 일부는 HCV의 검출 및/또는 HCV의 유전자형 확정, HCV 질병의 진단/모니터링을 위한 면역에세이법과 같은 방법에 혼입되기에 적합하거나 또는 치료제로서 적합하다.
본 발명에 따른 면역에세이법과 같은 방법은 HCV에 의해 감염된 개체로부터 혈청에 있는 항체에 의해 확인되는 선형(펩티드인 경우) 및 입체적 항원결정부위를 유지하는 본 발명의 HCV 엔빌로프 단백질을 이용한다. 본 발명의 HCV E1 및 E2 항원은 항체를 검출하기 위한 공지된 항원을 이용하는 임의의 에세이 포맷으로 이용될 수 있다. 물론, HCV 입체적 항원결정부위를 변성시키는 포맷은 피해야하거나 또는 변경되어야한다. 이들 에세이법의 공통되는 특징은 항원이 성분중에 존재하는 항체와 결합하게하는 조건하에서 HCV 항체를 함유할 것으로 추정되는 체내 성분을 항원과 접촉시키는 것이다. 항원과 시편을 배양한 다음 항원으로 구성된 면역 복합체의 검출을 실시한다.
면역에세이법의 디자인은 다양하게 변화될 수 있으며, 많은 포맷이 당분야에 공지되어 있다. 실험방법은 예컨대 고형 지지체 또는 면역침전을 이용할 수 있다. 대부분의 에세이법은 라벨링된 항체 또는 폴리펩티드의 사용을 포함하며; 상기 라벨은 예컨대 효소적, 형광적, 화학발광적, 방사활성적 또는 염료 분자일 수 있다. 면역 복합체로부터의 신호를 증폭시키는 에세이법은 또한 공지되어 있다; 그 예는 비오틴 및 아비딘 또는 스트렙트아비딘을 이용하는 에세이법, 및 ELISA 및 RIA 에세이법과 같은 효소-라벨링된 및 매개된 면역에세이법이다.
면역에세이법은 비제한적으로 이종 또는 동종 포맷일 수 있고 또 표준형 또는 경쟁형일 수 있다. 이종 포맷의 경우, 폴리펩티드는 전형적으로 고형 매트릭스 또는 지지체에 결합되어 배양후 폴리펩티드로부터 샘플의 분리를 촉진시킨다. 사용될 수 있는 고형 지지체의 예는 니트로셀룰로오스 (예컨대 막 또는 마이크로티터 웰 형태), 염화폴리비닐 (예컨대, 쉬트 또는 마이크로티터 웰), 폴리스티렌 라텍스 (예컨대, 비이드 또는 마이크로티터 플레이트), 폴리비닐리덴 플루오라이드 (ImmunolonTM
으로 공지), 디아조화 종이, 나일론 막, 활성화된 비이드, 및 단백질 A 비이드이다. 예컨대, Dynatech ImmunolonTM
1 또는 ImmunolonTM
2 마이크로티터 플레이트는 이종 포맷으로 사용될 수 있다. 항원 폴리펩티드를 함유하는 고형 지지체는 전형적으로 시험 샘플로부터 분리한 후 및 결합항체를 검출하기 전에 세척된다. 표준 및 경쟁 표맷은 당업계에 공지되어 있다.
동종 포맷의 경우, 시험 샘플은 용액에서 항원 조합과 배양된다. 예컨대, 형성된 항원-항체 복합체를 석출하는 조건하에서 실시된다. 이들 에세이에 대한 표준 및 경쟁적 포맷은 당업계에 공지되어 있다.
표준 포맷의 경우, 항체-항원 복합체에서 항-HCV 항원과 같은 항체의 양은 직접적으로 조절된다. 이것은 상기 항-HCV 항체와 같은 항체상의 항원결정부위를 인식하는 라벨링된 항-이종발생성(xenogeneic) (항-인간) 항체가 복합체 형성으로 인하여 결합되는지 여부를 결정하는 것에 의해 달성된다. 경쟁적 포맷의 경우, 샘플에서 상기 항-HCV 항체와 같은 항체의 양은 공지 양의 복합체중의 (라벨링된) 항체 (또는 기타 경쟁적 리간드) 또는 항원의 결합에 대한 경쟁적 효과를 조절하는 것에 의해 감소된다.
항원-항체 복합체는 포맷에 따라 다수의 공지 수법에 의해 검출될 수 있다. 예컨대, 복합체중의 항-HCV 항체와 같은 라벨링되지 않은 항체는 라벨(예컨대 효소 라벨)과 복합체를 이룬 항-이종발생성 Ig 콘쥬게이트를 사용하여 검출될 수 있다.
면역석출법 또는 응집 에세이 포맷에서, 항원과 항체 사이의 반응은 용액 또는 현탁액으로부터 석출되는 단백질 덩어리를 형성하며 석출물의 가시층 또는 필름 을 형성한다. 항체가 시편 또는 샘플에 존재하지 않으면, 이러한 석출물은 형성되지 않는다.
입체적 항원결정부위로 구성된 본 발명의 HCV 엔빌로프 단백질 또는 특정 부위는 상기 면역에세이법에 사용하기 위한 키트 형태로 팩케이지된다. 상기 키트는 별도의 용기에 천연 HCV항원, 대조 항체 제제(양성 및/또는 음성), 에세이 포맷이 동일한 신호 생성 시약(예컨대 효소 기질)을 필요로 할 때 라벨이 신호를 직접적으로 발생하지 않으면, 라벨링된 항체를 함유한다. 천연 HCV 항원은 고형 매트릭스에 이미 결합되어 있거나 매트릭스에 결합되기 위한 시약과 별도로 존재한다. 상기 에세이법을 실시하기 위한 지시사항(문헌, 테이프, CD-롬 등)은 키트에 포함되어 있다.
선택된 고상은 중합성 또는 유리 비이드, 니트로셀룰로오스, 마이크로입자, 반응 트레이의 마이크로웰, 시험 관 및 자기 비이드를 포함할 수 있다. 신호 발생 화합물은 효소, 발광 화합물, 발색물질, 방사성 요소 및 화학발광성 화합물을 포함할 수 있다. 효소의 예는 알칼리성 포스파타제, 꽃양배추 퍼옥시다제 및 베타-갈락토시다제를 포함한다. 인헨서 화합물의 예는 비오틴, 항-비오틴 및 아비딘을 포함한다. 인헨서 화합물 결합 막의 예는 비오틴, 항-비오틴 및 아비딘을 포함한다. 관절염 인자 유사 물질의 효과를 차단하기 위하여, 시험 샘플을 관절염 인자 유사 물질의 효과를 차단하기에 충분한 조건에 처리시킨다. 이들 조건은 시험 샘플을 다량의 항-인간 IgG와 접촉시켜 혼합물을 형성시킨 다음, 관절염 인자 유사 물질을 실질적으로 갖지 않는 반응 혼합물 생성물을 형성하기에 충분한 시간 및 조건하에 서 상기 혼합물을 배양하는 것을 포함한다.
특히, 본 발명은 진단 키트를 제조하기 위한 본 발명에 따른 HCV 엔비로프 단백질 또는 그의 일부의 용도에 관한 것이다.
본 발명에 따른 코어-글리코실화된 HCV 엔빌로프 단백질은 면역원성이 높고 또 체액성 및 세포성 면역반응을 자극하기 때문에, 본 발명은 본 발명의 올리고머성 입자 또는 정제된 단일 HCV 엔빌로프 단백질을 포함하는 HCV 관련 T 세포 반응을 검출하기 위한 키트에 관한 것이다. HCV T 세포 반응은 WO 95/12677호에서 Leroux-Roels 등에 의해 기재된 바와 같이 측정될 수 있다.
본 발명의 다른 요지는 경우에 따라 약제학적으로 허용되는 보조제를 포함하는 유효량의 본 발명에 따른 HCV 엔빌로프 단백질 또는 그의 일부를 포유동물에 투여하는 것을 포함하는, 포유동물에서 HCV 특이적 면역반응을 유발하는 방법에 관한 것이다. 본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부를 포유동물에 투여하는 것을 포함하는 상기 방법은 포유동물에서 HCV 특이적 항체를 유발하기 위해 또는 포유동물에서 특정 T-세포 작용을 유발하기 위해 사용될 수 있다. 상기 방법에서, 상기 투여는 예방적 목적, 즉 예방적 투여 또는 치료적 목적, 즉 치료적 투여일 수 있다.
본 발명의 다른 요지는 경우에 따라 약제학적으로 허용되는 담체를 포함하는 본 발명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부를 포유동물에 투여하는 것을 포함하는 포유동물을 면역화시키는 방법에 관한 것이다.
본 발명은 또한 경우에 따라 약제학적으로 허용되는 담체를 포함하는 본 발 명에 따른 유효량의 HCV 엔빌로프 단백질 또는 그의 일부를 포유동물에 투여하는 것을 포함하는, HCV에 감염된 포유동물을 치료하는 방법에 관한 것이다.
상기 기재한 본 발명의 요지 또는 상기 요지에 특이적인 실시예는 진핵생물에서의 발현산물이고 2개의 상이한 HCV 엔빌로프 단백질에 대하여 상기 기재한 동일한 글리코실화 특성에 의해 특징지워지는 목적하는 단백질에도 적용된다.
보다 자세하게는, 본 발명은 진핵생물 세포에서의 발현산물이고 또 N-글리코실화 부위의 평균 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79% 또는 80% 까지가 코어-글리코실화되어 있는 것을 특징으로 하는, 한개 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 보다 자세하게는, N-글리코실화 부위의 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% 또는 95% 이상은 N-글리코실화 부위가 Man(8-10)-GlcNAc(2)로 정의된 구조를 갖는 올리고만노오스에 의해 글리코실화된다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위의 비율은 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하이다. 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.
본 발명의 다른 요지는 진핵생물 세포에서의 발현산물이며 N-글리코실화 부위가 올리고만노오스에 의해 점유되며, Man(8)-GlcNAc(2) 구조를 갖는 올리고만노오스에 대한 Man(7)-GlcNAc(2) 구조를 갖는 올리고만노오스의 비율이 0.15, 0.2, 0.25, 0.30, 0.35, 0.40, 0.44, 0.45 또는 0.50 이하인 것을 특징으로 하는, 한개 이상의 N-글리코실화 부위를 포함하는 분리된 HCV 엔빌로프 단백질 또는 그의 단편에 관한 것이다. 또한 상기 N-글리코실화 특징에 대하여 더욱 자세하게는, 상기 올리고만노오스는 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6% 또는 5% 미만의 말단 α1,3 만노오스를 함유한다.
특히, 상기 목적하는 분리된 단백질 또는 그의 단편은 한세눌라(Hansenula) 세포와 같은 효모 세포에서의 발현산물이다. 상기 목적하는 분리된 단백질 또는 그의 단편은 바이러스성 엔빌로프 단백질 또는 그의 단편, 예컨대 HCV 엔빌로프 단백질 또는 HBV(B형 간염) 엔빌로프 단백질, 그의 단편이다. 다른 바이러스성 엔빌로프 단백질의 예는 HIV (인간 면역결핍 바이러스) 엔빌로프 단백질 gp120 및 플라비리데아애(Flavirideae)에 속하는 바이러스의 바이러스성 엔빌로프 단백질을 포함한다. 일반적으로, 상기 목적하는 분리된 단백질 또는 그의 단편은 본 발명의 N-글리코실화 특징을 필요로하는 단백질일 수 있다.
"HCV-재조합 백시니아 바이러스"는 HCV 단백질 또는 그의 일부를 암호화하는 핵산 서열을 포함하는 백시니아 바이러스를 의미한다.
본 명세서에 기재된 "HCV 엔빌로프 단백질로 형성된 HCV 바이러스-유사 입 자", "HCV 엔빌로프 단백질로 형성된 올리고머 입자"는 스스로가 1 또는 2개의 E1 및/또는 E2 단량체로 구성되는 HCV E1 및/또는 E2 엔빌로프 단백질의 몇 개의 기본 단위를 함유하는 특정 성질 및 형상의 구조로 정의된다. 본 발명의 입자는 감염성 HCV RNA 게놈을 갖고 있지 않는 것으로 정의됨이 분명하다. 본 발명의 입자는 비어져 있을 수 있고 지질, 세제, HCV 코어 단백질 또는 보조제 분자가 혼입될 수 있는 엔빌로프 단백질의 쉘로 구성되는 구형입자의 고급 입자일 수 있다. 후자 입자는 아포리포단백질 B 또는 저밀도 리포단백질과 같은 리포좀 또는 아포리포단백질에 의해, 또는 특정 기관 또는 조직에 대해 입자를 표적화시키는 기타 수단에 의해 캡슐화될 수 있다. 상기 경우, 빈 구형 입자는 흔히 "바이러스-유사 입자" 또는 VLP라 칭한다. 다르게는, 고급 입자는 고상의 구형입자일 수 있으며, 완전한 구형은 HCV E1 또는 E2 엔빌로프 단백질 올리고머로 구성되며, 이때 지질, 세제, HCV 코어 단백질 또는 보조제 분자는 더욱 혼입될 수 있거나, 또는 다르게 리포좀 또는 아포리포단백질에 의해, 예컨대 아포리포단백질 B, 저밀도 리포단백질에 의해 또는 상기 입자를 특정 기관 또는 조직에 대하여 표적화하기 위한 다른 수단에 의해 캡슐화될 수 있다. 입자는 흔히 원형(하기 참조)이고 또 HCV 엔빌로프 단백질의 단일층 1개 이상을 함유하지 않는 소형 구조(상기 기재한 비워있거나 고형의 구형 구조)로 구성된다. 이러한 소형 입자의 전형적인 예는 적은 수의 HCV 엔빌로프 단백질, 흔히 4 내지 16개로 구성되는 장미모양 구조이다. 후자의 특정 예는 E1의 8 내지 10개 단량체를 함유하는 것으로 예시된 바와 같이 0.2% CHAPS중에서 E1으로 수득한 소형 입자를 포함한다. 이러한 장미모양 구조는 평면형으로 구성되며 원형, 예컨대 바퀴 형태이다. 지질, 세제, HCV 코어 단백질 또는 보조제 분자는 부가적으로 혼입될 수 있거나, 또는 작은 입자가 리포좀 또는 아포리포단백질, 예컨대 아포리포단백질 B 또는 저밀도 리포단백질에 의해, 또는 상기 입자를 특정 기관 또는 조직에 대하여 표적화시키는 다른 수단에 의해 캡슐화될 수 있다. 더 작은 입자는유사한 적은 개수의 HCV E1 또는 E2 엔빌로프 단백질로 구성된 작은 구형 또는 글로불라 구조를 형성할 수 있고, 지질, 세제, HCV 코어 단백질, 또는 보조제 분자는 부가적으로 혼입되거나, 또는 리포좀 또는 아포리포단백질, 예컨대 아포리포단백질 B 또는 저밀도 리포단백질에 의해, 또는 상기 입자를 특정 기관 또는 조직에 대하여 표적화시키는 다른 수단에 의해 캡슐화될 수 있다. 상기 정의된 입자의 크기(즉, 입경)은 당업자에게 공지된 동적 광산란 수법(실시예 부분 참조)에 의해 측정된 바와 같이 보통 1 내지 100 nm, 보다 바람직하게는 2 내지 70 nm, 더욱 바람직하게는 2 내지 40 nm, 3 내지 20 nm, 5 내지 16 nm, 7 내지 14 nm 또는 8 내지 12 nm 이다.
특히, 본 발명은,
(i) HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 암호화하는 엔빌로프 유전자에 의해 형질전환된 한세눌라 (Hansenula) 또는 사카로마이세스 (Saccharomyces) 글리코실화 마이너스 균주를 적합한 배지에서 생장시키는 단계;
(ii) 상기 HCV E1 및/또는 HCV E2 유전자 또는 그의 일부를 발현시키는 단계; 및
(iii) 상기 코어-글리코실화된 HCV E1 및/또는 HCV E2 단백질 또는 그의 일 부를 상기 세포 배양액으로부터 정제하는 단계를 포함하는, 면역에세이 또는 백신에서 사용하기 적합한 코어 글리코실화된 C형간염 바이러스 (HCV) 엔빌로프 단백질을 정제하는 방법에 관한 것이다.
본 발명은 또한,
(i) HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 암호화하는 엔빌로프 유전자에 의해 형질전환된 한세눌라 (Hansenula) 또는 사카로마이세스 (Saccharomyces) 글리코실화 마이너스 균주를 적합한 배지에서 생장시키는 단계;
(ii) 상기 HCV E1 및/또는 HCV E2 유전자 또는 그의 일부를 발현시키는 단계; 및
(iii) 형질전환된 숙주 세포를 용균시켜 상기 세포내 발현된 코어-글리코실화된 HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 정제하는 단계를 포함하는, 면역에세이 또는 백신에서 사용하기 적합한 코어 글리코실화된 C형간염 바이러스(HCV) 엔빌로프 단백질을 정제하는 방법에 관한 것이다.
본 발명은,
(i) 2개 이상의 Cys-아미노산을 포함하는 HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 암호화하는 엔빌로프 유전자에 의해 형질전환된 한세눌라 (Hansenula) 또는 사카로마이세스 (Saccharomyces) 글리코실화 마이너스 균주를 적합한 배지에서 생장시키는 단계;
(ii) 상기 HCV E1 및/또는 HCV E2 유전자 또는 그의 일부를 발현시키는 단계; 및
(iii) 상기 Cys-아미노산이 화학적 및/또는 효소적 수단에 의해 가역적으로 보호되는 상기 코어-글리코실화된 HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 상기 배양액으로부터 정제하는 단계를 포함하는, 면역에세이 또는 백신에서 사용하기 적합한 코어-글리코실화된 C형간염 바이러스(HCV) 엔빌로프 단백질을 정제하는 방법에 관한 것이다.
본 발명은,
(i) 2개 이상의 Cys-아미노산을 포함하는 HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 암호화하는 엔빌로프 유전자에 의해 형질전환된 한세눌라 (Hansenula) 또는 사카로마이세스 (Saccharomyces) 글리코실화 마이너스 균주를 적합한 배지에서 생장시키는 단계;
(ii) 상기 HCV E1 및/또는 HCV E2 유전자 또는 그의 일부를 발현시키는 단계; 및
(iii) 형질전환된 숙주 세포를 용균처리하여 상기 Cys-아미노산이 화학적 및/또는 효소적 수단에 의해 가역적으로 보호되는 상기 세포내 발현된 코어-글리코실화된 HCV E1 및/또는 HCV E2 단백질 또는 그의 일부를 정제하는 단계를 포함하는, 면역에세이 또는 백신에서 사용하기 적합한 코어-글리코실화된 C형 간염 바이러스(HCV) 엔빌로프 단백질을 정제하는 방법에 관한 것이다.
본 발명은 특히 헤파린 친화성 크로마토그래피를 포함하는 재조합 코어-글리코실화된 HCV 효모 단백질 또는 그의 일부를 정제하는 방법에 관한 것이다.
따라서, 본 발명은 화학적 수단이 술폰화인 것을 특징으로 하는 상기 기재한 재조합 코어-글리코실화된 HCV 효모 단백질 또는 그의 일부를 정제하는 방법에 관한 것이다.
따라서, 본 발명은 Cys-아미노산의 가역적 보호는 화학적 및/또는 효소적 수단에 의해 비가역적 보호로 변경되는 것을 특징으로 하는, 재조합 코어-글리코실화된 HCV 효모 단백질 또는 그의 일부를 정제하는 방법에 관한 것이다.
본 발명은 또한 상기 화학적 수단에 의한 비가역적 보호가 요오도-아세트아미드인 것을 특징으로 하는, 재조합 코어-글리코실화된 HCV 효모 단백질 또는 그의 일부를 정제하는 방법에 관한 것이다.
따라서, 본 발명은 상기 화학적 수단에 의한 비가역적 보호가 NEM 또는 비오틴-NEM 또는 그의 혼합물인 재조합 코어-글리코실화된 HCV 효모 단백질 또는 그의 단편을 정제하는 방법에 관한 것이다.
본 발명은 HCV 코어, E1, E2, P7, NS2, NS3, NS4A, NS4B, NS5A 및/또는 NS5B 단백질 또는 그의 일부를 또한 포함하는 상기 정의한 바와 같은 조성물에도 관한 것이다. 본 발명에 따른 코어-글리코실화된 단백질 E1, E2 및/또는 E1/E2는 예컨대 코어, P7, NS3, NS4A, NS4B, NS5A 및/또는 NS5B와 같은 기타 HCV 항원과 조합될 수 있다. 이들 NS3 단백질의 정제는 바람직하게는 시스테인 잔기의 가역적 수식을 포함하고, 또 더욱 바람직하게는 시스테인의 술폰화를 포함한다. 이러한 가역적 수식을 얻기 위한 술폰화를 비롯한 방법은 Maertens 등(PCT/EP99/02547호)에 의해 NS3 단백질에 대해 개시되었다. 후술한 문서의 모든 정의를 비롯한 전체 내용은 본 발명에 참고문헌으로 포함되어 있음을 유념해야한다.
또한 본 발명은 코어-글리코실화된 엔빌로프 단백질을 일련의 시간 및 화합물의 일부로서 사용하는 것을 특징으로 하는 HCV에 대한 면역을 유발하기 위한 본 명세서에 기재된 바와 같은 코어-글리코실화된 엔빌로프 단백질의 용도에도 관한 것이다. 이와 관련하여, 용어 "일련의 시간 및 화합물"은 면역반응을 유발하기 위해 사용된 화합물을 개체에 시간 간격을 두고 투여하는 것을 의미한다. 후자 화합물은 하기 성분을 더 포함할 수 있다: 코어-글리코실화된 엔빌로프 단백질, HCV DNA 백신 조성물, HCV 폴리펩티드. 이 점에서, 시리즈는 다음을 투여하는 것을 포함한다:
(i) 코어-글리코실화된 엔빌로프 단백질과 같은 HCV 항원을 시간 간격을 두고 투여; 또는
(ii) 코어-글리코실화된 엔빌로프 단백질 올리고머 입자 및 HCV DNA 백신 조성물을 포함하는 HCV DNA 백신 조성물과 조합된 코어-글리코실화된 엔빌로프 단백질과 같은 HCV 항원을 동시에 투여하거나, 또는 교대 시간 간격을 비롯한 상이한 시간 간격으로 투여하거나, 또는
(iii) 시간 간격을 두고 다른 HCV 펩티드와 함께 (i) 또는 (ii)를 조합하여 실시.
이렇게하여, HCV DNA 백신 조성물은 E1-, E2-, E1/E2-펩티드, NS3 펩티드, 기타 HCV 펩티드를 비롯한 HCV 엔빌로프 펩티드, 또는 상기 펩티드의 일부를 암호화하는 핵산을 포함하는 것이 분명하다. 또한, 상기 HCV 펩티드는 E1-, E2-, E1/E2-펩티드, NS3 펩티드, 기타 HCV 펩티드를 비롯한 HCV 엔빌로프 펩티드 또는 그의 일부를 포함한다. 용어 "기타 HCV 펩티드"는 HCV 펩티드 또는 그의 단편을 의미한다. 상기 계획 (ii)에서, HCV DNA 백신 조성물은 HCV 엔빌로프 펩티드를 암호화하는 핵산을 우선적으로 포함한다. 상기 계획의 (ii)에서, HCV DNA 백신 조성물은 바람직하게는 HCV-NS3 DNA 백신 조성물과 조합되어 HCV 엔빌로프 펩티드를 암호화하는 핵산으로 더욱 바람직하게 구성된다. 이렇게 하여, HCV DNA 백신 조성물은 전사 조절 요소에 기능적으로 결합된, 상기와 같은 HCV 펩티드를 암호화하는 폴리뉴클레오티드 서열을 포함한다. 본 명세서에서는, "플라스미드 벡터"는 결합된 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 바람직한 벡터는 결합된 핵산을 자동 복제 및/또는 발현할 수 있는 벡터이다. 일반적으로, 여기에 한정되는 것은 아니라, 플라스미드 벡터는 환형 이중가닥 DNA 루프이고, 이 벡터 형태에서는 염색체에 결합되지 않는다. 본 명세서에서 이용된 바와 같이, "폴리뉴클레오티드 서열"은 데옥시리보핵산(DNA)와 같은 폴리뉴클레오티드를 의미하며, 필요한 경우, 리보핵산(RNA)을 의미한다. 상기 용어는 등가물로서, 뉴클레오티드 유사체 및 단일(센스 또는 안티센스) 및 이중가닥 폴리뉴클레오티드로부터 제조된 RNA 또는 DNA의 유사체를 포함하는 것으로 이해되어야한다. 본 명세서에서는, 용어 "전사 조절 요소"는 살아있는 척추세포에 도입되면 세포성 기전에 작용하여 폴리뉴클레오티드에 의해 암호화되는 번역산물을 생성하게 하는 필수 조절서열을 함유하는 뉴클레오티드 서열을 지칭한다. 용어 "기능적으로 결합된"은 성분이 통상의 작용을 실시하도록 구성된 배치를 지칭한다. 따라서, 뉴클레오티드 서열에 기능적으로 결합된 전사조절서열은 상기 뉴클레오티드 서열의 발현에 영향을 줄 수 있다.
당업자는 상이한 전사 프로모터, 터미네이터, 캐리어 벡터 또는 특정 유전자 서열이 성공적으로 사용될 수 있음을 숙지하고 있을 것이다. 다르게는, DNA 백신은 아데노바이러스, 카나리아 수두 바이러스, MVA 등과 같은 생존 벡터를 통하여 전달될 수 있다.
본 발명은 하기 실시예에 의해 더욱 자세하게 설명한다. 이들 실시예는 예시하기 위한 것으로 어떠한 의미로든 제한을 의미하지 않는다.
도 1은 서열번호 6에 정의된 바와 같은 서열을 갖는 벡터 pGEMT-E1sH6RB의 개략도이다.
도 2는 서열번호 9에 정의된 바와 같은 서열을 갖는 벡터 pCHH-Hir의 개략도이다.
도 3은 서열번호 12에 정의된 바와 같은 서열을 갖는 벡터 pFPMT121의 개략도이다.
도 4는 서열번호 13에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-CHH-E1-H6 의 개략도이다.
도 5는 서열번호 16에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-MFa-E1-H6의 개략도이다.
도 6은 서열번호 17에 정의된 바와 같은 서열을 갖는 벡터 pUC18-FMD-MFa-E1-H6 의 개략도이다.
도 7은 서열번호 20에 정의된 바와 같은 서열을 갖는 벡터 pUC18-FMD-CL-E1- H6 의 개략도이다.
도 8은 서열번호 21에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-CL-E1-H6 의 개략도이다.
도 9는 서열번호 22에 정의된 바와 같은 서열을 갖는 벡터 pSP72E2H6 의 개략도이다.
도 10은 서열번호 23에 정의된 바와 같은 서열을 갖는 벡터 pMPT121 의 개략도이다.
도 11은 서열번호 24에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-MFa-E2-H6 의 개략도이다.
도 12는 서열번호 25에 정의된 바와 같은 서열을 갖는 벡터 pMPT-MFa-E2-H6 의 개략도이다.
도 13은 서열번호 28에 정의된 바와 같은 서열을 갖는 벡터 pMF30의 개략도이다.
도 14는 서열번호 32에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-CL-E2-H6 의 개략도이다.
도 15는 서열번호 35에 정의된 바와 같은 서열을 갖는 벡터 pUC18-FMD-CL-E1 의 개략도이다.
도 16은 서열번호 36에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-CL-E1의 개략도이다.
도 17은 서열번호 39에 정의된 바와 같은 서열을 갖는 벡터 pUC18-FMD-CL- H6-E1-K-H6 의 개략도이다.
도 18은 서열번호 40에 정의된 바와 같은 서열을 갖는 벡터 pFPMT-CL-H6-K-E1 의 개략도이다.
도 19는 서열번호 41에 정의된 바와 같은 서열을 갖는 벡터 pYIG5 의 개략도이다.
도 20은 서열번호 42에 정의된 바와 같은 서열을 갖는 벡터 pYIG5E1H6 의 개략도이다.
도 21은 서열번호 43에 정의된 바와 같은 서열을 갖는 벡터 pSY1의 개략도이다.
도 22는 서열번호 44에 정의된 바와 같은 서열을 갖는 벡터 pSY1aMFE1sH6a 의 개략도이다.
도 23은 서열번호 45에 정의된 바와 같은 서열을 갖는 벡터 pBSK-E2sH6의 개략도이다.
도 24는 서열번호 46에 정의된 바와 같은 서열을 갖는 벡터 pYIG5HCCL-22aH6 의 개략도이다.
도 25는 서열번호 47에 정의된 바와 같은 서열을 갖는 벡터 pYYIGSE2H6 의 개략도이다.
도 26은 서열번호 48에 정의된 바와 같은 서열을 갖는 벡터 pYIG7 의 개략도이다.
도 27은 서열번호 49에 정의된 바와 같은 서열을 갖는 벡터 pYIG7E1 의 개략 도이다.
도 28은 서열번호 50에 정의된 바와 같은 서열을 갖는 벡터 pSY1YIG7E1s 의 개략도이다.
도 29는 서열번호 51에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaA 의 개략도이다.
도 30은 서열번호 52에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaD' 의 개략도이다.
도 31은 서열번호 53에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaE' 의 개략도이다.
도 32는 서열번호 58에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaD'E1sH6 의 개략도이다.
도 33은 서열번호 59에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaE'E1sH6 의 개략도이다.
도 34는 서열번호 60에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaD'E2sH6의 개략도이다.
도 35는 서열번호 61에 정의된 바와 같은 서열을 갖는 벡터 pPICZalphaE'E2sH6 의 개략도이다.
도 36은 서열번호 62에 정의된 바와 같은 서열을 갖는 벡터 pUC18MFa 의 개략도이다.
도 37. MFα-E2-H6-발현 한세눌라 폴리모르파(Hansenula polymorpha)로부터 발현된 IMAC-정제된 E2-H6 단백질의 크기 배제 크로마토그래피의 용출 프로필 (실시예 15 참조). X축은 용출 부피(mL)를 나타낸다. 용출 프로필을 통과하는 수직선은 수집된 분획을 나타낸다. "P1"는 모아진 분획 4-9, "P2"는 모아진 분획 30-35, 그리고 "P3"는 모아진 분획 37-44를 나타낸다. Y축은 mAU(milli absorbance units)로 나타낸 흡수도를 나타낸다. X축은 용출부피(mL)를 나타낸다.
도 38. 크기 배제 크로마토그래피(도 37 참조) 이후 수집된 상이한 푸울(pool) 및 분획을 비환원성 SDS-PAGE에 의해 분석한 다음 폴리아크릴아미드 겔을 은 염색하였다. 분석된 푸울("P1", "P2", 및 "P3") 및 분획(16-26)은 은-염색된 겔의 사진의 상부에서 나타난다. 좌측(레인"M")에서는 분자 질량 마커의 크기를 나타낸다.
도 39. 도 37에 도시한 바와 같은 크기 배제 크로마토그래피의 분획 17-23을 모아서 알킬화시켰다. 그후, 단백질물질을 엔도 H 처리하여 탈글리코실화시켰다. 미처리 물질 및 엔도 H-처리된 물질을 SDS-PAGE 겔상에서 분리하여 PVDF 막에 블로팅시켰다. 이 블럿을 아미도 블랙으로 염색시켰다.
레인 1: 엔도 H-처리전 알킬화된 E2-H6
레인 2: 엔도 H-처리후 알킬화된 E2-H6
도 40은 사카로마이세스 세레비시아애(Saccharomyces cerevisiae)에서 발현된 E1의 세포 용균물의 웨스턴-블럿 분석이다. 웨스턴-블럿은 E1-특이적 모노클로날 항체 IGH201을 사용하여 개발되었다.
레인 1-4: E1-H6에 결합된 닭의 리소짐 리더 펩티드를 암호화하는 뉴클레오 티드 서열을 포함하는 pSY1YIG7E1s (서열번호: 50, 도 28)에 의해 형질전환된 사카로마이세스(Saccharomyces) 클론에서 각기 발현된 지 2, 3, 5 또는 7일 후의 발현산물.
레인 5-7: E1-H6에 결합된 α-메이팅 인자 리더 펩티드를 암호화하는 뉴클레오티드 서열을 포함하는 pSY1aMFE1sH6aYIG1 (서열번호: 44, 도 22)에 의해 형질전환된 사카로마이세스(Saccharomyces) 클론에서 각기 발현된 지 2, 3 또는 5일 후의 발현산물.
레인 8: 나타낸 크기를 갖는 분자량 마커.
레인 9: HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에 의해 생산된 정제된 E1s.
도 41. 에이치. 폴리모르파(H. polymorpha)에 의해 CL-E2-H6에서 부터 E2-H6 까지 발현되고 가공된 고정화된 이온 친화성 크로마토그래피(IMAC)-정제된 E2-H6 단백질의 분석(실시예 17 참조). 상이한 세척 분획(레인 2 내지 4) 및 용출 분획(레인 5 내지 7)에 있는 단백질은 환원성 SDS-PAGE 실시한 다음 겔을 은 염색(A, 도면 상부)하거나 또는 E2에 관한 특정 모노클로날 항체를 사용한 웨스턴 블럿(B, 도면 하단)에 의해 분석하였다. 분자량 마커의 크기는 좌측에 나타낸다.
도 42. 에이치. 폴리모르파(H. polymorpha)에 의해 생산된 술폰화된 H6-K-E1 단백질을 정제하기 위한 Ni-IDA 칼럼(Ni2+가 로딩된 Chelating Sepharose FF, 파마시아 제조)상에서 제1 IMAC 크로마토그래피 단계의 용출 프로파일(실시예 18 참 조). 상기 칼럼은 20 mM 이미다졸이 보충된 완충액 A(50 mM 포스페이트, 6m GuHCl, 1% Empigen BB (v/v), pH 7.2)로 균형을 이루었다. 샘플을 적용한 후, 칼럼을 20 mM 및 50 mM 이미다졸을 각각 함유하는 완충액 A를 사용하여 순차적으로 세척하였다 (크로마토그램상에 나타낸 바와 같음). 각기 50 mM 이미다졸 및 200 mM 이미다졸이 보충된 완충액 B(PBS, 1% empigen BB, pH 7.2)를 순차적으로 적용하여 His-태깅된 생성물의 추가의 세척 및 용출단계를 실시하였다 (크로마토그램상에 나타낸 바와 같음). 분획을 모았다: 세척 푸울 1(분획 8 내지 11, 50 mM 이미다졸에 의해 세척됨). 용출된 물질을 별도의 분획 63 내지 72로 수집하거나 용출 푸울(분획 63 내지 69)로서 수집하였다. Y-축은 흡수도(mAU)(milli absorbance units)를 나타낸다. X축은 용출 부피(mL)를 나타낸다.
도 43. 에이치. 폴리모르파(H. polymorpha)에 의해 발현되고 가공된 IMAC-정제된 H6-K-E1 단백질(도 42 참조)의 분석. 세척 푸울 1(레인 12) 및 용출 분획 63-72(레인 2 내지 11)중의 단백질은 환원성 SDS-PAGE를 실시한 다음 겔을 은 염색(A, 상부 도면)하여 분석하였다. IMAC 전의 샘플(레인 2), 유동 푸울(레인 4), 세척 푸울 1(레인 5) 및 용출 푸울(레인 6)에 존재하는 단백질은 E1에 대한 특이적인 모노클로날 항체를 사용한 웨스턴 블럿(B, 하부 도면; 레인 3에서는 어떤 샘플도 로딩되지 않았음)에 의해 분석하였다. 분자량 마커(레인 M)의 크기는 좌측에 나타낸다.
도 44. Endo Lys-C를 갖는 H6-K-E1 (정제: 도 42 참조)의 시험관내 가공으 로 기인한 E1의 정제에 대한 Ni-IDA 칼럼(Ni2+가 로딩된 Chelating Sepharose FF) 상에서 제2 IMAC 크로마토그래피 단계의 용출 프로필. 유량은 E1s-생성물의 존재에 대해 스크리닝된 상이한 분획(1 내지 40)으로 수집되었다. H6-K-E1으로부터 가공된 완전 E1를 함유하는 분획(7 내지 28)을 모았다. Y축은 mAU로 나타낸 흡수도이다. X축은 용출부피(mL)이다.
도 45. 비오티닐화된 헤파린과 반응하는 특정 E1s 단백질 밴드를 나타내는 웨스턴 블럿 분석(실시예 19 참조). HCV-재조합 백시니아 바이러스-감염된 포유동물 세포 배양액으로부터 정제되거나 또는 에이치. 폴리모르파(H. polymorpha)에 의해 발현된 E1s 제제를 분석하였다. 수직선으로부터 우측에 있는 패널은 비오티닐화된 E1 특정 모노클로날 IGH200에 의해 생긴 웨스턴-블럿을 도시한다. 수직선으로부터 좌측에 있는 패널은 비오티닐화된 헤파린을 사용하여 생긴 웨스턴-블럿을 도시한다. 이들 결과로부터, 글리코실화가 덜된 E1s는 헤파린에 대하여 높은 친화성을 갖는다고 결론지을 수 있다.
레인 M: 분자량 마커 (좌측에 나타낸 분자량)
레인 1: 포유동물 세포로부터 얻으며, 분리하는 동안 알킬화된 E1s.
레인 2: 에이치. 폴리모르파(H. polymorpha)에 의해 발현되며 분리하는 동안 술폰화된 E1s-H6.
레인 3: 에이치. 폴리모르파(H. polymorpha)에 의해 발현되며 분리하는 동안 알킬화된 E1s-H6.
레인 4: 레인 2에 로딩된 것과 동일 재료이지만 디티오트레이톨에 의해 처리되어 술폰화된 Cys-티올기를 Cys-티올로 전환시킴.
도 46. 베타인 대신 Empigen BB를 사용하는 것에 의해 바이러스-유사 입자 형성을 실시하기 위하여 PBS, 3% 베타인으로 실시된 술폰화된 형태로 정제된에이치. 폴리모르파(H. polymorpha)-발현된 E2-H6의 크기 배제 크로마토그래피(SEC) 프로필. 더 연구하기 위해 사용된 VLP를 함유하는 모아진 분획은 "↔"로 나타낸다. Y축은 mAU(milli absorbance units)로 나타낸 흡수도를 나타낸다. X축은 용출 부피(mL)이다. 실시예 20 참고.
도 47. 베타인 대신 Empigen BB를 사용하는 것에 의해 바이러스-유사 입자 형성을 실시하기 위하여 PBS, 3% 베타인으로 실시된 알킬화된 형태로 정제된에이치. 폴리모르파(H. polymorpha)-발현된 E2-H6의 크기 배제 크로마토그래피(SEC) 프로필. VLP를 함유하는 모아진 분획은 "↔"로 나타낸다. Y축은 mAU(milli absorbance units)로 나타낸 흡수도를 나타낸다. X축은 용출 부피(mL)이다. 실시예 20 참고.
도 48. 베타인 대신 Empigen BB를 사용하는 것에 의해 바이러스-유사 입자 형성을 실시하기 위하여 PBS, 3% 베타인으로 실시된 술폰화된 형태로 정제된에이치. 폴리모르파(H. polymorpha)-발현된 E1의 크기 배제 크로마토그래피(SEC) 프로필. VLP를 함유하는 모아진 분획은 "↔"로 나타낸다. Y축은 mAU(milli absorbance units)로 나타낸 흡수도를 나타낸다. X축은 용출 부피(mL)이다. 실시예 20 참고.
도 49. 베타인 대신 Empigen BB를 사용하는 것에 의해 바이러스-유사 입자 형성을 실시하기 위하여 PBS, 3% 베타인으로 실시된 알킬화된 형태의 정제된 에이치. 폴리모르파(H. polymorpha)-발현된 E1의 크기 배제 크로마토그래피(SEC) 프로필. VLP를 함유하는 모아진 분획은 "↔"로 나타낸다. Y축은 mAU(milli absorbance units)로 나타낸 흡수도를 나타낸다. X축은 용출 부피(mL)이다. 실시예 20 참고.
도 50. 도 48 및 49에 기재한 바와 같이 크기 배제 크로마토그래피(SEC)를 실시한 후 분리된 VLP를 SDS-PAGE(환원성 조건하) 및 웨스턴 블럿 분석. 좌측 패널: 은-염색된 SDS-PAGE 겔. 우측 패널: E1에 대한 특정 모노클로날 항체(IGH201)를 사용한 웨스턴 블럿. 레인 1: 분자량 마커 (좌측에 나타낸 분자량); 레인 2: 술폰화된 E1을 함유하는 VPS의 푸울 (도 48 참조); 레인 3: 알킬화된 E1을 함유하는 VLP의 푸울 (도 49 참조). 실시예 20 또한 참조.
도 51. 포유동물 세포에서 생산된 E1 ("M") 또는 한세눌라(Hansenula)-생산된 E1 ("H")를 ELISA 고형 지지체상에 피복함으로써, 포유동물 세포에서 생산된 E1을 사용하여 마우스를 백신처리한 후(패널 상부) 또는 한세눌라(Hansenula)-생산된 E1을 사용하여 마우스를 백신처리한 후(패널 하부) 혈청에 존재하는 항체의 종점 역가를 결정한다. 종점 역가(배가-희석)는 Y축상에 나타낸다. 실시예 22 참조.
도 52. 한세눌라(Hansenula)-생산된 E1을 알킬화("A") 또는 술폰화("S") 시킨 다음 ELISA 고형 지지체상에 피복함으로써, 알킬화된 한세눌라(Hansenula)-생산된 E1을 사용하여 마우스를 백신처리한 후(패널 상부), 또는 술폰화된 한세눌라(Hansenula)-생산된 E1을 사용하여 마우스를 백신처리한 후(패널 하부) 혈 청에 존재하는 항체의 종점 역가를 결정한다. 수평 선은 평균 항체 역가를 나타낸다. 종점 역가(배가-희석)는 Y축상에 나타낸다. 실시예 23 참조.
도 53. HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에 의해 생산된 HCV E1 및 에이치. 폴리모르파(H. polymorpha)에 의해 생산된 HCV E1을 직접적으로 ELISA 플레이트에 피복하였다. 항체의 종점 역가는 포유동물 세포에 의해 생산된 E1으로 백신처리된 침팬지의 혈청 (상부 패널) 및 포유동물 세포에 의해 생산된 E1에 대한 쥐의 모노클로날 항체의 혈청(하부 패널)에서 결정하였다. 침팬지 요란(Yoran)과 마티(Marti)를 예방적으로 백신처리하였다. 흑색 막대: 포유동물 세포에 의해 생산된 E1에 의해 피복된 ELISA 플레이트. 빈 막대: 한세눌라(Hansenula)에 의해 생산된 E1으로 피복된 ELISA 플레이트. 종점 역가(배가-희석)는 Y축에 나타낸다. 실시예 24 또한 참조.
도 54. 재조합 백시니아 바이러스-감염된 포유동물 세포로부터 방출된 올리고당 및 한세눌라(Hansenula)에 의해 생산된 E1-H6 단백질로부터 방출된 올리고당의 형광-보조된 탄수화물 겔 전기영동.
레인 1: 좌측에 단당류의 개수를 나타낸 글루코오스 사다리 표준 (3 내지 10, G3 내지 G10으로 표시).
레인 2: 포유동물 세포에 의해 생산된 (알킬화된) E1으로부터 방출된 25 ㎍ N-결합된 올리고당.
레인 3: 한세눌라(Hansenula)에 의해 생산된 (알킬화된) E1-H6으로부터 방출된 25 ㎍ N-결합된 올리고당.
레인 4: 100 피코몰의 말토테트라오스.
실시예 25 또한 참조.
도 55. 이 도면은 표준 올리고만노오스, Man-9 (도 55. A), Man-8 (도 55. B), Man-7 (도 55. C), Man-6 (도 55.D) 및 Man-5 (도 55.E)의 단순화된 구조를 도시한다. "Man" = 만노오스; "GlcNAc" = N-아세틸글루코사민; "α" = 2개 만노오스 사이의 α-결합; "β" = 2개 만노오스 사이의 β-결합; "(1-3)" , "(1-4)" 및 "(1-6)" = 2개 만노오스 사이의 (1-3), (1-4) 및 (1-6) 결합을 각각 나타낸다. 도 55.B 및 도 55.C에서 괄호는 괄호로부터 좌측에 있는 각각 2 및 1개의 만노오스 잔기가 괄호로부터 우측에 있는 3개 만노오스 잔기의 2 및 1에 대하여 α(1-2) 결합으로 결합됨을 나타낸다. 실시예 26 또한 참조.
도 56. 치토바이오스에 결합된 10개 만노오스 잔기로 구성된 고급 올리고만노오스를 도시한다. 각 말단 만노오스 잔기는 비-말단 만노오스 잔기에 대하여 α1-3 결합에 의해 연결된다. 얇은 상방향 화살표는 α1-2 만노시다제에 의해 분해되기 쉬운 올리고당 결합(이 올리고만노오스에는 적용되지 않음)을 나타내고, 두꺼운 상방향 또는 좌측을 가르키는 화살표는 α1-2 결합 만노오스의 제거후 α-만노시다제에 의해 분해되기 쉬운 올리고당 결합(상기 올리고만노오스에는 적용되지 않음)을 나타내고 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.
도 57. 치토바이오스에 결합된 9개 만노오스 잔기로 구성된 고급 올리고만 노오스를 도시한다. 상기 올리고만노오스에서, 1개 말단 만노오스 잔기는 α1-2 결합에 의해 비-말단 만노오스 잔기에 결합된다. 얇은 상방향 화살표는 α1-2 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고, 두꺼운 상방향 또는 좌측을 가르키는 화살표는 α1-2 결합 만노오스의 제거후 α-만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내며 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.
도 58. 치토바이오스에 결합된 9개 만노오스 잔기로 구성된 고급 올리고만노오스 Man-9를 도시한다. 상기 올리고만노오스에서, 모든 말단 만노오스 잔기는 α1-2 결합에 의해 비-말단성 만노오스 잔기에 결합된다. 얇은 상방을 가르키는 화살표는 α1-2 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고, 두꺼운 상방향 화살표는 α 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내며 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.
도 59. 치토바이오스에 결합된 8개 만노오스 잔기로 구성된 고급 올리고만노오스 Man-8를 도시한다. 상기 올리고만노오스에서, 모든 말단 만노오스 잔기는 α1-3 또는 α1-6 결합에 의해 비-말단성 만노오스 잔기에 결합되므로 이 구조는 α1-2 만노시다제에 의한 분해에 충분히 견딜 수 있게 된다. 두꺼운 상방향 화살표는 α 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분 해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.
도 60. 치토바이오스에 결합된 7개 만노오스 잔기로 구성된 고급 올리고만노오스 Man-7을 도시한다. 상기 올리고만노오스에서, 모든 말단 만노오스 잔기는 α1-3 결합에 의해 비-말단성 만노오스 잔기에 결합되므로 이 구조는 α1-2 만노시다제에 의한 분해에 충분히 견딜 수 있게 된다. 두꺼운 상방향 화살표는 α 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.
도 61. 치토바이오스에 결합된 9개 만노오스 잔기로 구성된 고급 올리고만노오스를 도시한다. 상기 올리고만노오스에서, 모든 말단 만노오스 잔기는 α1-2 결합에 의해 비-말단성 만노오스 잔기에 결합된다. 얇은 상방향을 가르키는 화살표는 α1-2 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고, 두꺼운 상방향 또는 좌측을 나타내는 화살표는 α 1-2 결합된 만노오스의 제거후 α 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내며 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 실시예 26 또한 참조.
도 62. 치토바이오스에 결합된 1 또는 2개의 글루코오스 잔기 및 8개의 만노오스 잔기로 구성된 임의의 글루코오스-함유 올리고당을 도시한다. 상기 올리고당에서, A- 또는 B-브랜치 (도면에서 "A →" 및 "B→")의 말단 α1-2 결합된 만노오스 잔기의 하나는 (Glc)Glc로 표시한 바와 같이 괄호의 좌측에 1 또는 2개의 글 루코오스 잔기를 갖고 있다. 얇은 상방을 가르키는 화살표는 α1-2 만노시다제에 의해 분해되기 쉬운 올리고당 결합은 말단 만노오스 잔기에 대하여 글루코오스를 부착하고 있지 않음을 나타낸다. 두꺼운 상방향 또는 좌측을 가르키는 화살표는 α 1-2 결합된 만노오스의 제거후 α만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타내고 또 비어있는 하방을 가르키는 화살표는 α-결합된 만노오스의 제거후 β 만노시다제에 의해 분해되기 쉬운 올리고당 결합을 나타낸다. 가능한 반응 산물의 개요는 실시예 26의 표 10에 나타낸다.
도 63. 엑소글리코시다제를 사용하거나 또는 사용하지 않고 철야 배양한 후 Man-9의 반응산물을 Waters Alliance HPLC 스테이션에 결합된 TSK gel-Amide-80 (0.46 x 25 cm, 토소 바이오셉 제조)상에서 분리하였다. 올리고당의 분리는 주위 온도, 1.0 mL/분으로 실시하였다. 용매 A는 아세토니트릴중 0.1% 아세트산으로 구성되고 용매 B는 물중의 0.2% 아세트산-0.2% 트리에틸아민으로 구성된다. 2-AB 라벨링된 올리고당의 분리는 5개 칼럼 부피에 대하여 28% B 이소크래틱을 사용하여 실시한 다음 15개 칼럼 부피에 대하여 45% B 까지 일직선으로 증가시켰다. 용출 용매의 조성은 용매 A중의 % 용매 B (v/v)로서 Y축 우측에 나타낸다. 용출시간은 X축 상에 분으로 나타낸다. Y축 좌측은 용출하는 2-아미노벤즈아미드 (2-AB)-라벨링된 올리고당의 형광을 나타낸다. 2-AB의 여기 파장은 330 nm이고, 방출 파장은 420 nm이다.
크로마토그램의 트레이스 1("1")은 엑소글리코시다제를 사용하지 않고 철야 배양된 Man-9의 용출을 나타낸다. 트레이스 2("2")는 α1-2 만노시다제와 함께 Man-9를 철야 배양한 후 Man-5 및 Man-6의 혼합물의 용출을 도시한다. 트레이스 3 및 4 ("3" 및 "4")는 α-만노시다제와 함께 Man-9를 1시간 및 철야 배양한 후 4'-β-만노실 치토바이오스의 용출을 도시한다. 트레이스 5 ("5")는 α- 및 β-만노시다제와 함께 Man-9를 철야 배양한 후 치토바이오스의 용출을 도시한다. 트레이스 1-5는 겹쳐서 표시되는데, 이것은 이들의 각각의 기준선이 0 수준이 아니기 때문이다. 트레이스 6 ("6")은 적용된 용매 구배를 도시한다.
도의 상단에 글자 A 내지 K로 표시한 피이크는 다음을 의미한다: A, 치토바이오스; B, 4'-β-만노실-치토바이오스; C, Man-2; D, Man-3; E, Man-4; F, Man-5; G, Man-6; H, Man-7; I, Man-7; J, Man-8; 및 K, Man-10. 실시예 26 또한 참조.
도 64. 엑소글리코시다제를 사용하거나 또는 사용하지 않고 철야 배양한 후 사카로마이세스(Saccharomyces) 생산된 E1으로부터 유도된 올리고당의 반응 산물을 Waters Alliance HPLC 스테이션에 결합된 TSK gel-Amide-80 (0.46 x 25 cm, 토소 바이오셉 제조)상에서 분리하였다. 올리고당의 분리는 주위 온도에서, 1.0 mL/분으로 실시하였다. 용매 A는 아세토니트릴중 0.1% 아세트산으로 구성되고 용매 B는 물중의 0.2% 아세트산-0.2% 트리에틸아민으로 구성된다. 2-AB 라벨링된 올리고당의 분리는 5개 칼럼 부피에 대하여 28% B 이소크래틱을 사용하여 실시한 다음 15개 칼럼 부피에 대하여 45% B 까지 일직선으로 증가시켰다. 용출 용매의 조성은 용매 A중의 % 용매 B (v/v)로서 Y축 우측에 나타낸다. 용출시간은 X축 상에 분으로 나타낸다. Y축 좌측은 용출하는 2-아미노벤즈아미드 (2-AB)-라벨링된 올리고당의 형광을 나타낸다. 2-AB의 여기 파장은 330 nm이고, 방출 파장은 420 nm이다.
크로마토그램의 트레이스 1("1")은 엑소글리코시다제를 사용하지 않고 철야 배양된 사카로마이세스(Saccharomyces) 생산된 E1으로부터 유래된 올리고당의 용출을 나타낸다. 트레이스 2("2")는 α1-2 만노시다제와 함께 Man-9를 철야 배양한 후 사카로마이세스(Saccharomyces) 생산된 E1으로부터 유래한 올리고당의 용출을 도시한다. 트레이스 3 및 4 ("3" 및 "4")는 α-만노시다제와 함께 1시간 및 철야 배양한 후 사카로마이세스(Saccharomyces) 생산된 E1으로부터 유래한 올리고당의 용출을 도시한다. 트레이스 5 ("5")는 α- 및 β-만노시다제와 함께 철야 배양한 후 사카로마이세스(Saccharomyces) 생산된 E1으로부터 유래한 올리고당의 용출을 도시한다. 트레이스 1-5는 겹쳐서 표시되는데, 이것은 이들의 각각의 기준선이 0 수준이 아니기 때문이다. 트레이스 6 ("6")은 적용된 용매 구배를 도시한다.
도의 상단에 글자 A 내지 K로 표시한 피이크는 다음을 의미한다: A, 치토바이오스; B, 4'-β-만노실-치토바이오스; C, Man-2; D, Man-3; E, Man-4; F, Man-5; G, Man-6; H, Man-7; I, Man-7; J, Man-8; 및 K, Man-10. 실시예 26 또한 참조.
도 65. 엑소글리코시다제를 사용하거나 또는 사용하지 않고 철야 배양한 후 백시니아 감염된 포유동물 세포에서 생산된 E1으로부터 유도된 올리고당의 반응산물을 Waters Alliance HPLC 스테이션에 결합된 TSK gel-Amide-80 (0.46 x 25 cm, 토소 바이오셉 제조)상에서 분리하였다. 올리고당의 분리는 주위 온도에서, 1.0 mL/분으로 실시하였다. 용매 A는 아세토니트릴중 0.1% 아세트산으로 구성되고 용매 B는 물중의 0.2% 아세트산-0.2% 트리에틸아민으로 구성된다. 2-AB 라벨링된 올리고당의 분리는 5개 칼럼 부피에 대하여 28% B 이소크래틱을 사용하여 실시한 다 음 15개 칼럼 부피에 대하여 45% B 까지 일직선으로 증가시켰다. 용출 용매의 조성은 용매 A중의 % 용매 B (v/v)로서 Y축 우측에 나타낸다. 용출시간은 X축 상에 분으로 나타낸다. Y축 좌측은 용출하는 2-아미노벤즈아미드 (2-AB)-라벨링된 올리고당의 형광을 나타낸다. 2-AB의 여기 파장은 330 nm이고, 방출 파장은 420 nm이다.
크로마토그램의 트레이스 1("1")은 엑소글리코시다제를 사용하지 않고 철야 배양된 백시니아-감염된 포유동물 세포에서 생산된 E1으로부터 유래된 올리고당의 용출을 나타낸다. 트레이스 2("2")는 α1-2 만노시다제와 함께 Man-9를 철야 배양한 후 백시니아-감염된 포유동물 세포에서 생산된 E1으로부터 유래된 올리고당의 용출 을 도시한다. 트레이스 3 및 4 ("3" 및 "4")는 α-만노시다제와 함께 1시간 및 철야 배양한 후 백시니아-감염된 포유동물 세포에서 생산된 E1으로부터 유래된 올리고당의 용출을 도시한다. 트레이스 5 ("5")는 α- 및 β-만노시다제와 함께 철야 배양한 후 백시니아-감염된 포유동물 세포에서 생산된 E1으로부터 유래된 올리고당의 용출을 도시한다. 트레이스 1-5는 겹쳐서 표시되는데, 이것은 이들의 각각의 기준선이 0 수준이 아니기 때문이다. 트레이스 6 ("6")은 적용된 용매 구배를 도시한다.
도의 상단에 글자 A 내지 K로 표시한 피이크는 다음을 의미한다: A, 치토바이오스; B, 4'-β-만노실-치토바이오스; C, Man-2; D, Man-3; E, Man-4; F, Man-5; G, Man-6; H, Man-7; I, Man-7; J, Man-8; 및 K, Man-10. 실시예 26 또한 참조.
도 66. 엑소글리코시다제를 사용하거나 또는 사용하지 않고 철야 배양한 후 한세눌라(Hansenula) 생산된 E1으로부터 유도된 올리고당의 반응산물을 Waters Alliance HPLC 스테이션에 결합된 TSK gel-Amide-80 (0.46 x 25 cm, 토소 바이오셉 제조)상에서 분리하였다. 올리고당의 분리는 주위 온도에서, 1.0 mL/분으로 실시하였다. 용매 A는 아세토니트릴중 0.1% 아세트산으로 구성되고 용매 B는 물중의 0.2% 아세트산-0.2% 트리에틸아민으로 구성된다. 2-AB 라벨링된 올리고당의 분리는 5개 칼럼 부피에 대하여 28% B 이소크래틱을 사용하여 실시한 다음 15개 칼럼 부피에 대하여 45% B 까지 일직선으로 증가시켰다. 용출 용매의 조성은 용매 A중의 % 용매 B (v/v)로서 Y축 우측에 나타낸다. 용출시간은 X축 상에 분으로 나타낸다. Y축 좌측은 용출하는 2-아미노벤즈아미드 (2-AB)-라벨링된 올리고당의 형광을 나타낸다. 2-AB의 여기 파장은 330 nm이고, 방출 파장은 420 nm이다.
크로마토그램의 트레이스 1("1")은 엑소글리코시다제를 사용하지 않고 철야 배양된 한세눌라(Hansenula) 생산된 E1으로부터 유래된 올리고당의 용출을 나타낸다. 트레이스 2("2")는 α1-2 만노시다제와 함께 Man-9를 철야 배양한 후 한세눌라(Hansenula) 생산된 E1으로부터 유래된 올리고당의 용출을 도시한다. 트레이스 3 및 4 ("3" 및 "4")는 α-만노시다제와 함께 1시간 및 철야 배양한 후 한세눌라(Hansenula) 생산된 E1으로부터 유래된 올리고당의 용출을 도시한다. 트레이스 5 ("5")는 α- 및 β-만노시다제와 함께 철야 배양한 후 한세눌라(Hansenula) 생산된 E1으로부터 유래된 올리고당의 용출을 도시한다. 트레이스 1-5는 겹쳐서 표시되는데, 이것은 이들의 각각의 기준선이 0 수준이 아니기 때문이다. 트레이스 6 ("6")은 적용된 용매구배를 도시한다.
도의 상단에 글자 A 내지 K로 표시한 피이크는 다음을 의미한다: A, 치토바이오스; B, 4'-β-만노실-치토바이오스; C, Man-2; D, Man-3; E, Man-4; F, Man-5; G, Man-6; H, Man-7; I, Man-7; J, Man-8; 및 K, Man-10. 실시예 26 또한 참조.
도 67. 한세눌라(Hansenula)에 의해 및 HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에 의해 생산된 E1 단백질의 SDS-PAGE 분석 및 쿠마씨 브릴리언트 블루 염색.
레인 1: 좌측에 나타낸 분자량을 갖는 분자량 마커; 레인 2: 한세눌라 폴리모르파(Hansenula polymorpha)에 의해 생산된 알킬화 E1 (10 ㎍); 레인 3: 한세눌라 폴리모르파(Hansenula polymorpha)에 의해 생산된 알킬화된 E1 (5 ㎍); 레인 4: 한세눌라 폴리모르파(Hansenula polymorpha)에 의해 생산된 알킬화된 E1 (2.5 ㎍); 레인 5: HCV-재조합 백시니아 바이러스-감염된 베로(vero) 세포에 의해 생산된 알킬화된 E1 (10 ㎍); 레인 6: HCV-재조합 백시니아 바이러스-감염된 베로(vero) 세포에 의해 생산된 알킬화된 E1 (5 ㎍); 레인 7: HCV-재조합 백시니아 바이러스-감염된 베로(vero) 세포에 의해 생산된 알킬화된 E1 (2.5 ㎍). 실시예 27 또한 참조.
도 68. 글리코실 제거된 단백질의 트립신 단편(박스로 표시한 서열)을 나타내는 HCV E2-H6 단백질의 서열(서열번호: 5). 글리코실화된 Asn-잔기는 PNGase F 효소에 의해 Asp-잔기로 전환되며 이는 서열하에서 "*"로 표시한다. Asn-잔기는 Asp-N 엔도프로테이나제(endoproteinase)에 의해 단백질 분해되기 쉽다. E2-H6에 서 가능한 N-글리코실화 부위는 HCV 폴리단백질내 번호에 따른 N417, N423, N430
, N448, N478, N532, N540, N556, N576, N623 및 N645 이다; 이들 부위는 도면에서 N34, N40, N47, N65
, N95, N149, N157, N173, N193, N240 및 N262 번호로 되어 있다. 실시예 28 또한 참조.
실시예 1
pFPMT-MFα-E1-H6 셔틀 벡터의 작성
한세눌라 폴리모르파(Hansenula polymorpha) 형질전환용 플라스미드는 다음과 같이 작성하였다. pFPMT-MFα-E1-H6 셔틀벡터는 다단계 과정으로 작성하였다. 먼저 HCV E1 단백질을 암호화하는 핵산서열(서열번호: 2)을 CHH 리더 서열 (CHH = 카르시누스 마애나스(Carcinus maenas) 고혈당증 호르몬) 뒤에 클로닝한 다음 MFα리더 서열 (MFα = 사카로마이세스 세레비시아애(Saccharomyces cerevisiae) α-메이팅 인자)에 대해 변경시켰다.
먼저, 이음매없는(seamless) 클로닝 방법(Padgett, K. A. 및 Sorge, J. A. 1996)에 의해 EcoRI/BamHI 단편으로서 CHH-E1-H6 단위를 포함하는 pUC18 유도체를 작성하였다. 여기에, 이하에 기재한 바와 같이 PCR에 의해 E1s-H6-암호화 DNA 단편 및 pCHH-Hir-유도된 어셉터 플라스미드를 생성하였다.
E1s-H6-암호화 DNA 단편의 생성
E1-H6-암호화 DNA 단편 (6 His-잔기에 의해 연장된 E1의 아미노산 192 내지 326으로 구성된 HCV형 1b E1 단백질을 코딩; 서열번호: 5)은 플라스미드 pGEMTE1sH6 (서열번호: 6; 도 1)로부터 PCR에 의해 분리하였다. 하기 프라이머를 사용하였다:
Eam1104I 부위는 밑줄쳐져 있고, 점은 절단부위를 나타낸다. 진하게 인쇄된(볼드체) 염기는 프라이머 CHH-링크의 염기와 상보적이다. 마킹되지 않은 염기는 센스 방향으로 E1(192-326)의 개시 영역내에서 결합된다; 및
Eam1104I 부위는 밑줄 표시하고, 점은 절단부위를 나타낸다. 진하게 인쇄된(볼드체) 염기는 프라이머 MF30-rechts 와 상보적이다. 나중의 클로닝 과정에 유용한 BamHI 부위를 형성하는 염기는 이탤릭체로 인쇄되어 있다. 마킹되지 않은 염기는 종지코돈 및 종지코돈과 BamHI 부위 사이에 3개의 부가적 염기를 포함하는 E1-H6 단위의 마지막내에서 안티센스 방향으로 결합된다.
상기 반응 혼합물은 다음과 같이 구성된다: 20 ng의 Eco311-선형화된 pGEMTE1sH6, 각각 0.2μM의 프라이머 CHHE1-F 및 CHHE1-R, dNTP (각각 0.2 μM), 1 x 완충액 2 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 2.5U 중합효소 혼합물(Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834)을 함유하는 전체 부피 50 μL.
프로그램 1을 이용하며, 이 프로그램은 다음 단계로 구성된다:
1. 변성: 95℃에서 5분;
2. 95℃에서 30초간 변성하고, 65℃에서 30초간 결합한 다음 68℃에서 130초간 연장시키는 주기 10회;
3. 4℃에서 종료.
이어, 5 μL 10 x 완충액 2 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 40 μL의 H2O 및 5 μL의 [dATP, dGTP, 및 dTTP (2mM 각각); 10 mM 5-메틸-dCTP]를 상기 프로그램 1로부터 얻은 샘플에 부가하고, 다음 단계로 구성된 프로그램 2에 의해 추가의 증폭을 실시하였다:
1. 변성: 95℃에서 5분;
2. 95℃에서 45초간 변성, 65℃에서 30초간 결합, 및 68℃에서 130초간 연장하는 주기 5회;
3. 4℃에서 종료.
pCHH-Hir-유도된 어셉터 플라스미드의 생성
어셉터 단편은 pCHH-Hir 플라스미드 (서열번호: 9; 도 2)로부터 PCR에 의해 제조하였으며 Hir-코딩 서열이 PCR 산물에 존재하지 않는 이외에는 완전한 pCHH-Hir 플라스미드로 구성된다. 하기 프라이머가 PCR에 사용되었다:
Eam1104I 부위는 밑줄쳐져 있고, 점은 절단부위를 나타낸다. 진하게 인쇄된(볼드체) 염기는 프라이머 CHHE1-F의 염기와 상보적이다. 마킹되지 않은 염 기는 CHH 서열의 마지막내에서 안티센스 방향으로 결합된다; 및
Eam1104I 부위는 밑줄쳐져 있고, 점은 절단부위를 나타낸다. 진하게 인쇄된(볼드체) 염기는 프라이머 CHHE1-R의 염기와 상보적이다. 마킹되지 않은 염기는 클론된 pCHH-Hir의 CHH-Hirudin HL 20 뒤의 pUC18 서열내에서 결합되어, 삽입물로부터 떨어져있다.
상기 반응 혼합물은 다음과 같이 구성된다: 20 ng의 Asp718I-선형화된 pCHH-Hir, 각각 0.2μM의 프라이머 CHH-링크 및 MF30-rechts, dNTP (각각 0.2 μM), 1 x 완충액 2 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 2.5U 중합효소 혼합물(Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834)을 함유하는 전체 부피 50 μL.
상기 기재한 바와 같은 프로그램 1을 이용하였다.
이어, 5 μL 10 x 완충액 2 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 40 μL의 H2O, 및 5 μL의 [dATP, dGTP, 및 dTTP (2mM 각각); 10 mM 5-메틸-dCTP]를 상기 프로그램 1로부터 얻은 샘플에 부가하고, 상기 기재한 바와 같은 프로그램 2에 의해 추가의 증폭을 실시하였다.
벡터 pCHHE1의 생성
상기 기재한 바와 같이 PCR에 의해 생성된 E1s-H6-암호화 DNA 단편 및 pCHH-Hir-유래 어셉터 플라스미드는 공급자의 명세에 따라 PCR 산물 정제키트(Quagen 제조)를 이용하여 정제하였다. 이어 정제된 단편을 Eam1104I에 의해 개별적으로 분해시켰다. 이어, E1s-H6 DNA 단편을, 공급자의 명세를 따라 T4 리가제(뵈링거 제조)를 사용하여 pCHH-Hir-유래 어셉터 플라스미드에 결찰시켰다.
대장균 XL-골드 세포를 결찰 혼합물을 사용하여 형질전환시키고 몇 개의 암피실린-내성 콜로니의 플라스미드 DNA는 EcoRI 및 BamHI를 사용한 분해에 의해 분석하였다. 양성 클론을 선택하고 pCHHE1으로 명명하였다.
벡터 pFPMT-CHH-E1H6의 생성
pCHHE1의 EcoRI/BamHI 단편을 EcoRI/BamHI 분해된 벡터 pFPMT121 (서열번호: 12; 도 3)에 결찰시켰다. 공급자의 지시에 따라서 T4 리가제(뵈링거 제조)를 사용하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시켰다. 몇 개의 형질전환체를 플라스미드 DNA의 제한패턴에 대해 분석하고 양성 클론을 pFPMT-CHH-E1H6 (서열번호: 13; 도 4)으로 명명하였다.
pFPMT-MFα-E1-H6의 생성
마지막으로, 하기에 기재한 세 개 단편을 결찰시키는 것에 의해 셔틀벡터 pFPMT-MFα-E1-H6을 생성하였다:
1. 6.961 kb의 EcoRI/BamHI 분해된 pFPMT121 (서열번호: 12; 도 3),
2. pUC18-MFα(서열번호: 62; 도 36)의 0.245 kb EcoRI/HindIII 단편, 및
3. pFPMT-CHH-E1H6으로부터 유래한 0.454 kb PCR 산물의 0.442 kb HindIII/BamHI 단편.
단편 번호 3을 생성한 0.454 kb PCR 산물은 다음과 같은 프라이머를 사용한 PCR에 의해 얻었다:
상기 반응 혼합물은 다음과 같이 구성된다: 반응 혼합물 부피 50 μL, pFPMT-CHH-E1-H6 (Eco311-선형화됨; 15 ng/μL), 0.5 μL; 프라이머 MFa-Eq f-Hi (50 μM), 0.25 μL; 프라이머 E1 back-Bam (50 μM), 0.25μL; dNTP (모두 0.2 μM), 5 μL; DMSO, 5 μL; H2O, 33.5 μL; Expand Long Template PCR System (뵈링거 만하임 제조; Cat No. 1681 834) 완충액 2 (10 x 농축), 5 μL; Expand Long Template PCR System 중합효소 혼합물 (1U/μL), 0.75 μL.
하기 단계로 구성된 PCR 프로그램을 이용하였다:
1. 변성: 95℃에서 5분;
2. 95℃에서 45초간 변성하고, 55℃에서 45초간 결합한 다음 68℃에서 40초간 연장시키는 주기 29회;
3. 4℃에서 종료.
사용된 프라이머를 기준으로 하여, 생성한 0.454 kb의 PCR 산물은 E1(192-326) 코돈에 이어, 6개의 히스티딘 코돈 및 "taa" 종지코돈, MFα 프리프로 서열 (클로닝 관련 HindIII 부위와 6개의 염기쌍 오버헹을 포함)과 접하는 상류 및 (클로닝 관련) BamHI 부위 및 6개의 염기쌍 오버헹과 접하는 하류를 함유하였다.
결찰 반응의 경우, 제조자의 조건 (샘플 부피 20 μL)에 따라 T4 DNA 리가제(뵈링거 만하임 제조)를 사용하였다.
대장균 HB101 세포를 결찰 혼합물로 형질전환시켰고 또 몇 개의 형질전환체로부터 분리된 플라스미드의 제한분석후 양성 클론을 보류시켰다. 양성 플라스미드를 선택하고 pFPMT-MFα-E1-H6 (서열번호: 16; 도 5)로 명명하였다.
실시예 2
pFPMT-CL-E1-H6 셔틀 벡터의 작성
한세눌라 폴리모르파(Hansenula polymorpha) 형질전환용 플라스미드는 다음과 같이 작성하였다. pFPMT-CL-E1-H6 셔틀 벡터는 pFPMT-MFα-E1-H6 (서열번호: 16, 도 5)로부터 출발하여 3단계로 작성하였다.
첫 단계로서, pFPMT-MFα-E1-H6의 MFα-E1-H6 리딩 프레임을 pUC18 벡터에 서브클로닝하였다. 따라서, pFPMT-MFα-E1-H6 (FMD 프로모터 및 MFα-E1-H6 함유)의 1.798 kb SalI/BamHI 단편을 제조자의 조건에 따라 T4 리가제(뵈링거 제조)를 사용하여 pUC18의 SalI/BamHI 벡터 단편에 결찰시켰다. 그 결과 도 6에 도시한 플라스미드(서열번호: 17)를 생성하며, 이것을 pMa12-1 (pUC18-FMD-MFα-E1-H6)으로 명명하였다. 이 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시켰다. 몇 개의 암피실린 내성 콜로니를 선택하고 선택된 클론으로부터 분리한 플라스미드 DNA를 제한효소 분해시켜 분석하였다. MFα-E1-H6 코딩 서열의 DNA 서열을 결정하는 것에 의해 양성 클론을 더 분석하였다. 정확한 클론을 PCR 특이적 돌연변이에 사용하여 MFα프리-프로-서열을 조류의 리소짐 프리-서열의 코돈("CL"; 조류 리소짐의 아미노산 1 내지 18에 상응; 서열번호: 1)으로 치환하였다. 적용된 PCR 특이적 돌연변이의 원리는 프라이머의 5'-말단에 위치한 소망하는 변형을 갖는 전체 플라스미드의 증폭에 기초로 한다. 하류 단계에서, 선형 PCR 산물의 말단은 자가-결찰 되기 전에 변형되어 소망하는 변형된 플라스미드를 생성한다.
하기 프라이머가 상기 PCR 반응에 사용되었다:
프라이머의 밑줄친 5' 영역은 조류의 리소짐 프리-서열의 약 1/2의 코돈을 함유한다. 프라이머 CL her neu는 SpeI 제한 부위(이탤릭체)를 포함한다. 프라이머의 밑줄치지 않은 영역은 E1의 아미노산 잔기 192-199에 대한 코돈 또는 FMD 프로모터의 위치 -19 (EcoRI 부위로부터 계산)까지의 EcoRI 부위에 대한 "atg" 개시코돈과 함께 결합된다. 프라이머는 완전한 pMa12-1를 증폭하도록 고안되어, MFα 프리-프로-서열의 코돈을 조류의 리소짐 프리 서열의 코돈으로 치환시킨다.
반응 혼합물은 다음과 같이 구성된다: pUC18-FMD-Mfα-E1-H6 (pMa12-1; 1.3 ng/μL), 1μL; 프라이머 CL hin (100 μM), 2μL; 프라이머 CL her neu (100 μM), 2μL; dNTP (모두 2.5 mM), 8μL; H2O, 76 μL; Expand Long Template PCR System (뵈링거 제조; Cat No. 1681 834) 완충액 2 (10 x 농축), 10 μL; Expand Long Template PCR System 중합효소 혼합물 (1 U/μL), 0.75 μL.
하기 단계로 구성된 PCR 프로그램을 적용하였다:
1. 변성: 95℃에서 15분;
2. 95℃에서 30초간 변성하고, 60℃에서 1분간 결합한 다음 72℃에서 1분간 연장시키는 주기 35회;
3. 4℃에서 종료.
생성한 PCR 산물은 아가로오스 겔 전기영동법에 의해 정확한 크기(3.5 kb)를 확인하였다. 상기 PCR 산물로부터 3'-A 오버헹을 T4 중합효소 반응에 의해 제거하여 3'- 및 5'-OH 기를 갖는 무딘 말단을 생성하였다. 따라서, 상기 PCR 산물을 T4 중합효소(뵈링거 제조; 1U/μL)로 처리시키고; 잔류하는 95 μL의 PCR 반응 혼합물에 1μL의 T4 중합효소 및 4 μL dNTP (모두 2.5 mM)를 부가하였다. 이 샘플을 37℃에서 20분간 배양하였다. 이어, 에탄올을 사용하여 DNA를 석출시키고 16 μL H2O에 용해시켰다.
이어, 키나제 반응에 의하여 상기 무딘 말단 PCR 산물에 5'-포스페이트를 부가하였다. 16 μL의 무딘 말단 PCR 산물에 1 μL T4 폴리뉴클레오티드 키나제(뵈링거 제조; 1U/μL), 2 μL 10배 농축된 T4 폴리뉴클레오티드 키나제 반응 완충액 (뵈링거 제조), 및 1 μL ATP (10 mM)를 부가하였다. 이 샘플을 37℃에서 30분간 배양하였다. 이어, DNA를 1% 아가로오스 겔에 가하고 정확한 생성물 밴드는 제조자의 조건에 따라 겔 추출 키트(Qiagen 제조)에 의하여 분리하였다. 정제된 생성물의 50 ng을 제조자의 조건에 따라 T4 리가제 (뵈링거)를 사용하여 자가 결찰시켰 다. 16℃에서 72시간 동안 배양한 후, 결찰 혼합물중의 DNA를 에탄올에 의해 석출시키고 20 μL 물에 용해시켰다.
대장균 DH5α-F 세포는 10 μL의 결찰 샘플을 사용하여 형질전환시켰다. 몇 개의 암피실린 내성 클론의 플라스미드 DNA는 제한효소 분해에 의해 확인하였다. 양성 클론을 유지시키고 p27d-3 (pUC18-FMD-CL-E1-H6, 서열번호: 20, 도 7)로 명명하였다. 이어 CL-E1-H6 리딩 프레임은 DNA 서열결정법에 의해 확인하였다.
마지막 단계로, pFPMT-CL-E1-H6 셔틀 벡터는 다음과 같이 작성하였다. p27d-3 (CL-E1 (192-3260)-H6 포함)의 0.486 kb EcoRI/BamHI 단편을 EcoRI/BamHI-분해된 pFPMT121 (서열번호: 12, 도 3)에 결찰시켰다. 이 반응의 경우, 제조자의 추천에 따라 T4 리가제(뵈링거 제조)를 사용하였다. 결찰 샘플중의 DNA를 에탄올을 사용하여 석출시키고 10 μL의 H2O에 용해시켰다. 대장균 DH5αF' 세포를 10 μL의 결찰 샘플을 사용하여 형질전환시키고 몇 개의 암피실린-내성 콜로니의 플라스미드 DNA를 EcoRI 및 BamHI을 사용하여 분해시킴으로써 분석하였다. 플라스미드 클론 p37-5 (pFPMT-CL-E1-H6; 서열번호: 21, 도 8)는 0.486 kb 및 6.96 kb의 소망하는 단편 크기를 나타내었다. p37-5의 CL-E1-H6의 정확한 서열은 서열결정법에 의해 확인하였다.
실시예 3
pFPMT-MFα-E2-H6 및 pMPT-MFα-E2-H6 셔틀 벡터의 작성
한세눌라 폴리모르파(Hansenula polymorpha) 형질전환용 플라스미드는 다음과 같이 작성하였다. MFα-E2s (HCV E2의 아미노산 384-673)-VIEGR-His6 (서열번호: 5)를 암호화하는 DNA 서열은 플라스미드 pSP72E2H6 (서열번호: 22, 도 9)로부터 1.331kb EcoRI/BglII 단편으로서 분리하였다. 이 단편을 제조자의 추천에 따라서 T4 DNA 리가제 (뵈링거 만하임 제조)를 사용하여 EcoRI/BglII-분해된 벡터 pFPMT121 (서열번호: 12, 도 C+2) 또는 pMPT121 (서열번호: 23, 도 10)에 결찰시켰다. 대장균을 형질전환시키고 상이한 형질전환체로부터 분리된 플라스미드 DNA를 제한효소 분해에 의해 확인한 후, 양성 클론을 유지시키고 생성한 셔틀 벡터를 각각 pFPMT-MFα-E2-H6 (서열번호: 22, 도 11) 및 pMPT-MFα-E2-H6 (서열번호: 23, 도 12)로 명명하였다.
실시예 4
pFPMT-CL-E2-H6 셔틀 벡터의 작성
셔틀 벡터 pFPMT-CL-E2-H6는 3단계 과정으로 조립하였다. E2 코딩 서열이 슈바니오마이세스 옥시덴탈리스(Schwanniomyces occidentalis)의 α-아밀라제의 시그널 서열 뒤에 클로닝된 중간체 작성물을 제조하였다. 이것은 이음매없는 클로닝방법(Padgett, K. A. 및 Sorge, J. A. 1996)에 의해 실시되었다.
E2-H6 암호화 DNA 단편의 생성
먼저, E2-H6를 암호화하는 DNA 서열(링커 펩티드 "VIEGR" 및 6개의 His 잔기를 갖도록 연장된 HCV E2의 아미노산 384 내지 673, 서열번호: 5)은 PCR에 의해 pSP72E2H6 플라스미드 (서열번호: 24, 도 11)로부터 증폭하였다. 사용된 프라이머를 MF30E2/F 및 MF30E2/R로 표시하며 다음과 같은 서열을 갖는다:
Eam1104I 부위는 밑줄로 표시하였고, 점은 효소의 절단부위를 나타내며; 에스. 옥시덴탈리스((S. occidentalis) 시그널 신호의 마지막 코돈은 볼드체로 인쇄하며; 또 마킹되지 않은 염기는 E2의 코돈(HCV E2의 아미노산 384-390)과 결합시킨다;
Eam1104I 부위는 밑줄로 표시하였고, 점은 효소의 절단부위를 나타내며; 볼드체로 인쇄된 염기는 프라이머 MF30-Rechts (이하 참조)의 볼드체 인쇄된 염기와 상보적이며; 상기 작성물에 도입될 BamHI 부위는 이탤릭체로 인쇄되며; 마킹되지 않은 서열은 종지코돈 및 E2 (384-673)-VIEGR-H6 (서열번호: 5)의 6개의 말단 His 코돈과 결합된다.
상기 반응 혼합물은 다음과 같이 구성된다: pSP72E2H6의 1.33 kb EcoRI/BglII 단편 20 ng, 각 0.2μM의 프라이머 MF30E2/F 및 MF30E2/R, dNTP (각각 0.2 μM), 1 x 완충액 2 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 2.5U 중합효소 혼합물(Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834)을 함유하는 전체 부피 50 μL.
다음 단계로 구성된 PCR 프로그램 3을 이용하였다:
1. 변성: 95℃에서 5분;
2. 95℃에서 30초간 변성하고, 65℃에서 30초간 결합한 다음 68℃에서 1분간 연장시키는 주기 10회;
3. 4℃에서 종료.
이어, 10 μL 10 x 완충액 2(Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 40 μL의 H2O 및 5 μL의 [dATP, dGTP, 및 dTTP (2mM 각각); 10 mM 5-메틸-dCTP]를 상기 PCR 프로그램 3으로부터 얻은 샘플에 부가하고, 다음 단계로 구성된 PCR 프로그램 4를 계속하였다:
1. 변성: 95℃에서 5분;
2. 95℃에서 45초간 변성, 65℃에서 30초간 결합, 및 68℃에서 1분간 연장하는 주기 5회;
3. 4℃에서 종료.
pMF30-유도된 어셉터 플라스미드의 생성
플라스미드 pMF30 (서열번호: 28, 도 13)으로부터 유래한 제2 단편, 암플리콘은 에스. 옥시덴탈리스((S. occidentalis)의 성숙 α-아밀라제의 코돈을 제외하고는 완전한 pMF30 플라스미드이고, 클로닝에 관련된 변경은 프라이머 디자인에 의해 도입되었다. 이하의 프라이머 세트가 사용되었다:
Eam1104I 부위는 밑줄로 표시하였고, 점은 효소의 절단부위를 나타내며; 볼 드체로 인쇄한 "cct"는 프라이머 MF30E2/F (상기 참조)의 볼드체 인쇄된 "agg"와 상보적이며; 마킹되지 않은 염기 및 볼드체로 인쇄된 염기는 pMF30중의 에스. 옥시덴탈리스(S. occidentalis)의 α-아밀라제의 코돈의 26개 말단 염기와 결합시킨다);
Eam1104I 부위는 밑줄로 표시하였고, 점은 효소의 절단부위를 나타내며; 볼드체로 인쇄한 "ctg"는 프라이머 MF30E2/R (상기 참조)의 볼드체 인쇄된 "cag"와 상보적이며; 마킹되지 않은 염기는 pMF30중의 에스. 옥시덴탈리스 (S. occidentalis)의 α-아밀라제의 종지코돈의 하류에 있는 pUC18 서열과 결합시킨다).
상기 반응 혼합물은 다음과 같이 구성된다: 20 ng의 BglII-선형화된 pMF30, 각 0.2μM의 프라이머 MF30-링크 및 MF30-Rechts, dNTP (각각 0.2 μM), 1 x 완충액 1 (Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834), 2.5U 중합효소 혼합물(Expand Long Template PCR System; 뵈링거 제조; Cat No. 1681 834)을 함유하는 전체 부피 50 μL. 연장 기간을 1분에서 4분으로 변경한 이외에는 상기 기재한 동일 PCR 프로그램 (프로그램 3 및 4)을 이용하였다.
벡터 pAMY-E2의 생성
E2-H6 암호화 DNA 단편 및 PCR에 의해 얻은 pMF30-유래 어셉터 플라스미드는 1% 아가로오스 겔상에서 겔 전기영동에 의해 각각의 크기별로 제어하였다. PCR 산물을 제조자의 지시에 따라 PCR 산물 정제 키트(Qiagen 제조)에 의해 정제하였다. 이어 정제된 단편을 별도로 Eam11004I로 분해시켰다. 제조자의 추천에 따라서 T4 리가제(뵈링거 제조)를 사용하여 E2-H6 단편과 pMF30-유래 어셉터 플라스미드의 결찰을 실시하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시키고 몇 개의 클론의 플라스미드 DNA를 EcoRI/BamHI 분해에 의해 분석하였다. 양성 클론을 선택하고, 그 플라스미드를 pAMY-E2로 명명하며 이하에 나타낸 추가의 변경에 이용하였다.
벡터 pUC18-CL-E2-H6의 생성
α-아밀라제 시그널 서열의 코돈을 조류의 리소짐 프리 서열의 코돈으로 치환하기 위하여 pAMY-E2를 PCR 특이적 돌연변이 처리시켰다. 이것을 "CL"로 표시하며, 조류 리소짐 ORF (서열번호: 1)의 첫째 18개 아미노산에 상응한다. 상기 돌연변이의 경우 이하의 프라이머가 사용되있다:
프라이머의 밑줄 친 5'-영역은 조류의 리소짐 프리 서열의 약 1/2의 DNA 서열을 함유한다. 프라이머 CL2 her는 SpeI (이탤릭체) 및 EcoRI(이탤릭체, 이중밑줄) 제한부위를 포함한다. 프라이머의 밑줄치지 않은 영역은 E2의 아미노산 잔기 384-392 (CL2 hin)의 코돈과 결합되거나 또는 위치-19 (EcoRI 부위로부터 계산) 프로모터 까지의 EcoRI 부위에 있는 "atg" 개시코돈과 결합된다. 이 프라이머는 완전 pAMY-E2 벡터를 증폭시키기 위하여 고안되며, 그에 의해 α-아밀라제 시그널 서열의 코돈을 조류의 리소짐 프리-서열의 코돈으로 치환한다.
하기 프로그램에 따라 PCR 반응을 실시하였다:
1. 변성: 95℃에서 15분;
2. 95℃에서 30초간 변성하고, 60℃에서 1분간 결합한 다음 72℃에서 1분간 연장시키는 주기 35회;
3. 4℃에서 종료.
하기 반응 혼합물을 사용하였다: pAMY-E2 (1 ng/μL), 1 μL; 프라이머 CL2 hin (100 μM), 2μL; 프라이머 CL2 (100 μM), 2μL; dNTP (각각 2.5 μM), 8 μL; H2O, 76 μL; Expand Long Template PCR System (뵈링거 제조; Cat No. 1681 834) 완충액 2 (10 x 농축), 10 μL; Expand Long Template PCR System 중합효소 혼합물 (1U/μL), 07.5 μL.
생성한 PCR 산물은 1% 아가로오스 겔상에서 겔 전기영동에 의해 확인하였다. 결찰하기 전에, PCR 단편은 다음과 같이 변경시켰다. T4 중합효소에 의해 3'-A 오버헹을 제거하여 3'- 및 5'-OH 기를 갖는 무딘 말단을 생성하였다. 잔류하는 95 μL의 PCR 반응 혼합물에 1μL의 T4 중합효소 (뵈링거 제조, 1U/μL)를 4 μL dNTP (각각 2.5 mM)와 함께 부가하였다. 이 샘플을 37℃에서 20분간 배양하였다. 이어, 에탄올을 사용하여 DNA를 석출시키고 16 μL 탈이온수에 용해시켰다. 이어, 키나제 처리에 의하여 상기 무딘 말단 PCR 산물에 5'-포스페이트를 부가하였다. 16 μL의 용해된 무딘 말단 PCR 산물에 1 μL T4 폴리뉴클레오티드 키나제(뵈링거 제조; 1U/μL), 2 μL 10배 농축된 T4 폴리뉴클레오티드 키나제 반응 완충액 (뵈링거 제조), 및 1 μL ATP (10 mM)를 부가하였다. 이 샘플을 37℃에서 30분간 배양하였다.
상기 키나제 처리된 샘플을 1% 아가로오스 겔상에서 분리하였다. 생성물 밴드를 분리하였다. 제조자의 추천에 따라 겔 추출 키트(Qiagen 제조)에 의하여 아가로오스로부터 DNA를 추출하였다. 정제된 생성물 50 ng을 제조자의 조건에 따라 T4 리가제 (뵈링거)를 사용하여 자가 결찰시켰다. 16℃에서 16시간 동안 배양한 후, 결찰 혼합물중의 DNA를 에탄올에 의해 석출시키고 20 μL 물에 용해시켰다(결찰 샘플).
대장균 DH5αF' 세포는 상기 10 μL의 결찰 샘플을 사용하여 형질전환시켰다. 몇 개의 암피실린 내성 클론은 분리된 플라스미드 DNA의 제한효소 분해에 의해 더 확인하였다. 양성 클론을 pUC18-CL-E2-H6로 명명하고 또 이하에 기재한 바와 같이 추가의 변경에 이용하였다.
셔틀벡터 pFPMT-CL-E2-H6의 생성
pUC18-CL-E2-H6 (CL-E2(384-673)-VIEGR-H6 포함)으로부터 0.966 kb EcoRI/BamHI 단편을 분리하고 이것을 EcoRI/BamHI-분해된 pFPMT121 (서열번호: 12, 도 3)에 결찰시켰다. 이 반응의 경우, 제조자의 조건에 따라 T4 리가제 (뵈링거 제조)를 사용하였다. 결찰 샘플중의 DNA를 에탄올을 사용하여 석출시키고 10 μL의 물에 용해시켰다. 이것을 사용하여 대장균 DH5αF' 세포를 형질전환시키고, 제 한효소 분석 후 양성 클론을 유지시키고 각각의 플라스미드를 pFPMT-CL-E2-H6 (서열번호: 32, 도 14)로 명명하였다.
실시예 5
pFPMT-CL-K-H6-E1 셔틀벡터의 작성
셔틀벡터의 작성은 다음 2단계를 포함한다.
첫 단계로서, pUC18-FMD-CL-H6-K-E1-H6 작성물은 부위특이적 돌연변이에 의해 작성하였다. pUC18-FMD-CL-E1-H6을 주형(서열번호: 20; 도 7)으로 사용하였다. 하기 프라이머를 사용하였다:
PCR 반응 혼합물은 다음과 같이 구성된다: pUC18-FMD-CL-E1-H6 (2 ng/μL), 1μL; 프라이머 H6K hin neu (100 μM), 2μL; 프라이머 H6KRK her neu (100 μM), 2μL; dNTP (각각 2.5 mM), 8μL; H2O, 76 μL; Expand Long Template PCR System (뵈링거 제조; Cat No. 1681 834) 완충액 2 (10 x 농축), 10 μL; Expand Long Template PCR System 중합효소 혼합물 (1 U/μL), 0.75 μL.
하기 단계로 구성된 PCR 프로그램을 적용하였다:
1. 변성: 95℃에서 15분;
2. 95℃에서 30초간 변성하고, 60℃에서 1분간 결합한 다음 72℃에서 5분간 연장시키는 주기 35회;
3. 4℃에서 종료.
PCR 샘플의 알리쿼트를 1% 아가로오스 겔상에서 분석하여 그 정확한 크기를 확인하였다 (~4.2 kb).
그후 상기 PCR 산물로부터 3'-A 오버헹을 T4 중합효소 반응에 의해 제거하여 3'- 및 5'-OH 기를 갖는 무딘 말단을 생성하였다. 따라서, 잔류하는 95 μL의 PCR 반응 혼합물에 1μL의 T4 중합효소(뵈링거 제조; 1U/μL) 및 4 μL dNTP (각각 2.5 mM)를 부가하였다. 이 샘플을 37℃에서 20분간 배양하였다. 이어, 에탄올을 사용하여 DNA를 석출시키고 16 μL H2O에 용해시켰다.
이어, 키나제 반응에 의하여 상기 무딘 말단 PCR 산물에 5'-포스페이트를 부가하였다. 16 μL의 무딘 말단 PCR 산물에 1 μL T4 폴리뉴클레오티드 키나제(뵈링거 제조; 1U/μL), 2 μL 10배 농축된 T4 폴리뉴클레오티드 키나제 반응 완충액 (뵈링거 제조), 및 1 μL ATP (10 mM)를 부가하였다. 이 샘플을 37℃에서 30분간 배양하였다.
이어, 샘플을 1% 아가로오스 겔에 가하고 정확한 생성물 밴드를 제조자의 조건에 따라 겔 추출 키트(Qiagen 제조)에 의하여 분리하였다. 정제된 생성물의 50 ng을 제조자의 추천에 따라 T4 리가제 (뵈링거)를 사용하여 자가결찰시켰다. 16℃에서 72시간 동안 배양한 후, 결찰 샘플중의 DNA를 에탄올에 의해 석출시키고 10 μL 물에 용해시켰다.
대장균 DH5αF' 세포는 5 μL의 결찰 샘플을 사용하여 형질전환시켰다. 몇 개의 암피실린 내성 클론의 플라스미드 DNA는 제한효소 분해에 의해 확인하며, 양성 클론을 유지시키고 pUC18-FMD-CL-H6-K-E1-H6 (서열번호: 39, 도 17)로 명명하였다.
두 번째 단계로, 전달 벡터는 2개의 단편 결찰에 의해 작성하였다. 하기 작성에서는 BclI 접착성 말단을 갖는 단편이 포함되었다. BclI는 메틸화되지 않은 DNA상에서만 그 부위를 절단할 수 있기 때문에, 대장균 dam- 균주는 관련된 플라스미드 pUC18-FMD-CL-H6-K-E1-H6 (서열번호: 39, 도 17) 및 pFPMT-CL-E1 (서열번호: 36, 도 16)에 의해 형질전환되었다. 각 형질전환으로부터, 암피실린 내성 콜로니를 선택하여, 액제 배지에서 생장시키고 메틸화되지 않은 플라스미드 DNA를 다음 사용을 위해 준비하였다. 메틸화되지 않은 플라스미드 pUC18-FMD-CL-H6-K-E1-H6 (FMD 프로모터, CL-H6-K 단위의 코돈 및 E1의 개시를 포함)의 1.273 kb BclI/HindIII 단편 및 플라스미드 pFPMT-CL-E1(BclI 부위로부터 개시하는 E1 리딩 프레임의 결실 부분, C-말단 없는 His tag, FMD 프로모터를 제외한 pFPMT121-위치 요소 포함)의 6.057 kb BclI/HindIII 단편을 준비하고 제조자의 명세에 따라 20 μL의 전체 부피의 T4 리가제 (뵈링거 제조)를 사용하여 16℃에서 72시간 동안 결찰시켰다. 이어, 결찰 혼합물을 멸균 이온수중에 떠 있는 니트로셀룰로오스 막 조각에 놓아 결찰 혼합물을 탈염시켰다 (실온에서 30분간 배양). 대장균 TOP10 세포 를 5 μL의 탈염 샘플과 함께 전기영동시키는 것에 의해 형질전환시켰다. 생성한 몇 개의 암피실린 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pFPMT-CL-H6-K-E1 (서열번호: 40, 도 18)으로 명명하였다.
실시예 6
한세눌라 폴리모르파(
Hansenula polymorpha
)의 형질전환 및 형질전환체의 선택
에이치. 폴리모르파(H. polymorpha) 균주 RB11을 실시예 1 내지 5에 기재된 상이한 어버이 셔틀벡터를 사용한 수식(Roggenkamp, R. 등 1986)에 의하여 형질전환시켰다((Klebe, R. 등 1983)에 의해 기재된 바와 같은 PEG-매개된 DNA 흡수 과정). 각 형질전환의 경우, 72개 우라실-기본영양군(prototrophic) 콜로니를 선택하여 다음 과정에 의해 균주 생성에 이용하였다. 각 콜로니의 경우, 2 mL 액체 배양액을 접종하고 또 선택 배지(YNB/글루코오스, 디프코 제조)중의 시험관에서 48시간 (37℃; 160 rpm; 각도 45°) 동안 생장시켰다. 이 단계를 제1 통과 단계로 정의한다. 상기 제1 통과 단계의 배양액의 150 μL 알리쿼트를 사용하여 2 mL의 신선한 YNB/글루코오스 배지에 접종시켰다. 다시, 상기 배양물을 상기 기재한 바와 같이 배양하였다(제2 통과 단계). 또한, 이러한 통과 단계를 8회 실시하였다. 제3 및 제8 통과 단계후의 배양의 알리쿼트를 사용하여 2 mL의 비-선택적 YPD 배지(디프코 제조)에 접종시켰다. 37℃에서 48시간 동안 배양한 후(160 rpm; 각도 45°; 소위 제1 안정화 단계), 이들 YPD 배양물의 150 μL 알리쿼트를 사용하여 신선한 2 mL YPD 배지에 접종시킨 다음 상기 기재한 바와 같이 배양하였다(제2 안정화 단계). 제2 안정화 단계의 배양액의 알리쿼트를 선택성 YNB/한천을 함유하는 플레이트상에 스트리킹하였다. 이들 플레이트를 거시적 콜로니가 보일 때 까지 4일간 배양하였다. 각 분리의 잘 정의된 단일 콜로니를 균주로 정의하고 발현 분석에 사용하였다.
발현분석은 소규모 진탕 플라스크 배양물상에서 실시하였다. 상기 언급한 YNB/한천 플레이트로부터 콜로니를 선발하고 상기 기재한 바와 같이 2 mL YPD에서 접종하여 48시간 동안 배양하였다. 2 mL-알리쿼트를 20 mL 진탕 플라스크 배양물에 대한 종자 배양으로 사용하였다. YPGlyerol (1%)를 배지로 사용하고 진탕 플라스크를 회전 진탕기(200 rpm, 37℃)상에서 배양하였다. 48시간의 생장 후 1% MeOH를 배양액에 부가하여 발현 카세트를 유발시켰다. 상이한 시간 간격으로 1 mL 알리쿼트의 세포 펠릿을 수집하고 추가의 분석때 까지 -20℃에서 저장하였다. 특정 단백질 발현은 SDS-PAGE/웨스턴 블러팅에 의해 분석하였다. 따라서 세포 펠릿은 샘플 완충액(트리스HCl-SDS)에 용해시키고 95℃에서 15분 이상 배양하였다. 15% 폴리아크릴-아미드 겔상에서 단백질을 분리하고 니트로셀룰로오스 막상에 블러팅(웨트-블러트; 중탄산염 완충액)하였다. 블러트는 제1 항체로서 특정 쥐 항-E1 (IGH201) 또는 쥐의 항-E2 (IGH216, WO 96/04385호에서 Maertens 등에 의해 기재)를 사용하고 또 제2 항체로서는 토끼-항-마우스-AP를 사용하여 발색되었다. 염색은 NBT-BCIP를 사용하여 실시하였다. 양성 균주는 다음 연구를 위해 유지하였다.
이들 양성 클론중 5개를 진탕 플라스크 발현 실험에 사용하였다. 각 균주의 콜로니를 YNB 플레이트로부터 선택하고 2mL YPD를 접종시키는데 사용하였다. 이들 배양액을 상기와 같이 배양하였다. 상기 세포 현탁액을 사용하여 500 mL 진탕 플라스크중의 100 mL YPD 배지의 제2 종자 배양액을 접종하였다. 이 진탕 플라스크를 회전 진탕기상, 37℃에서 48시간 동안 200 rpm으로 배양하였다. 상기 종자 배양액의 25 mL 알리쿼트를 사용하여 250 mL YPGlycerol (1%) 배지를 접종하였고 상기 기재한 조건하에, 격벽이 있는 2-1 진탕 플라스크에서 배양하였다. 배양한지 48시간 후 1% MeOH (프로모터 유도)를 부가하고 진탕 플라스크를 상기 기재한 조건하에서 더 배양하였다. 유도한지 24시간 후, 실험을 중지시키고 세포 펠릿을 원심분리에 의해 수집하였다. 5개의 상이한 클론의 발현수준을 SDS-PAGE/웨스턴 블럿(상기와 같은 조건)에 의해 분석하였다. 각 클론의 적정 시리즈를 겔에 로딩하고 가장 생산적인 균주를 선택하여 다음 발효 및 정제 시험용으로 준비하였다.
놀랍게도, 피치아 파스토리스(Pichia pastoris)와 가장 밀접하게 관련된 효모 균주인 에이치. 폴리모르파(H. polymorpha)는 초글리코실화없이도 HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에 의해 발현된 HCV 엔빌로프 단백질에 그 크기가 필적하는 당 잔기를 갖는 HCV 단백질을 발현할 수 있다.
한세눌라 폴리모르파(Hansenula polymorpha) 균주 RB11은 부다페스트 조약하에, Mycotheque de 1'UCL (MUCL), Universite Catholique de Louvain, Laboratoire de mycologie, Place Croix du Sud 3 bte 6, B-1348 Louvain-la-Neuve, Belgium에 2002년 4월 19일에 MUCL 수탁번호 MUCL43805로 기탁되었다.
실시예 7
pSY1aMFE1sH6a 벡터의 작성
에스. 세레비시아애(S. cerevisiae) 발현 플라스미드는 다음과 같이 작성하였다. E1 코딩 서열은, 무딘 말단으로 만들고(T4 DNA 중합효소를 사용) 또 공급자의 명세에 따라서 T4 DNA 리가제(뵈링거 제조)를 사용하여 pYIG5 벡터(서열번호: 41, 도 19)에 클로닝된 pGEMT-E1sH6 (서열번호: 6, 도 1)로부터 NsI1/Eco52I 단편으로 분리되었다. 클로닝은 E1s-H6 암호화 단편을 αMF-코딩 서열에 직접적으로 결합되도록 실시하였다. 결찰 혼합물을 대장균 DH5αF' 세포에서 형질전환시켰다. 이어, 몇 개의 암피실린 내성 클론의 플라스미드 DNA를 제한분해로 분석하고 양성 클론을 유지시켜 pYIG5E1H6 (ICCG3470; 서열번호: 42, 도 20)로 명명하였다.
발현카세트(αMF-서열 및 E1s-코딩 영역과 His-tag를 함유하는)는 pYIG5E1H6의 BamHI 단편(2790 bp)으로서 BamHI-분해된 대장균/에스.세레비시아애(S. cerevisiae) pSY1 셔틀벡터 (서열번호: 21, 도 43)에 전달되었다. 제조자의 조건에 따라 T4 DNA 리가제(뵈링거 제조)를 사용하여 결찰을 실시하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시키고, 또 몇 개 암피실린 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pSY1aMFE1sH6a (ICCG3479; 서열번호: 44, 도 22)로 명명하였다.
실시예 8
pSYYIGSE2H6 벡터의 작성
에스. 세레비시아애(S. cerevisiae) 발현 플라스미드 pSYYIGSE2H6은 다음과 같이 작성하였다. E2 코딩 서열은, 무딘 말단으로 만든(T4 DNA 중합효소를 사용) 다음 제조자의 설계에 따라 T4 DNA 리가제(뵈링거 제조)를 사용하여 pYIG5 벡터(서열번호: 41, 도 19)에 클로닝된 pBSK-E2sH6 (서열번호: 45, 도 23)으로부터 SalI/KpnI 단편으로 분리되었다. 클로닝은 E2-H6 암호화 단편을 αMF-코딩 서열에 직접적으로 결합되도록 실시하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시시키고, 몇 개의 암피실린 내성 클론의 플라스미드 DNA를 제한분해로 분석하고 양성 클론을 유지시켜 pYIG5HCCL-22aH6 (ICCG2424; 서열번호: 46, 도 24)으로 명명하였다.
발현카세트(αMF-서열 및 E2(384-673) 코딩 영역과 His-tag를 함유하는)는 pYIG5HCCL-22aH6의 BamHI 단편(3281 bp)으로서 BamHI 개방된 대장균/에스.세레비시아애(S. cerevisiae) pSY1 셔틀벡터 (서열번호: 43, 도 21)에 전달되었다. 제조자의 조건에 따라 T4 DNA 리가제(뵈링거 제조)를 사용하여 결찰을 실시하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시키고, 또 몇 개 암피실린 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pSYYIGSE2H6 (ICCG2466; 서열번호: 47, 도 25)으로 명명하였다.
실시예 9
pSY1YIG7E1s 벡터의 작성
에스. 세레비시아애(S. cerevisiae) 발현 플라스미드 pSY1YIG7E1는 다음과 같이 작성하였다. E1 코딩 서열은, 무딘 말단으로 만든 다음 제조자의 설계에 따라 T4 DNA 리가제(뵈링거 제조)를 사용하여 pYIG7 벡터(서열번호: 48, 도 26)에 클로닝된 pGEMT-E1s (서열번호: 6, 도 1)로부터 NsI1/Eco52I 단편으로 분리되었다. 클로닝은 E1-암호화 단편을 αMF-코딩 서열에 직접적으로 결합되도록 실시하였다. 결찰 혼합물을 대장균 DH5αF' 세포로 형질전환시키고, 몇 개의 암피실린 내성 클론의 플라스미드 DNA를 제한분해로 분석하고 양성 클론을 유지시켜 pYIG7E1 (서열번호: 49, 도 27)로 명명하였다.
발현카세트(CL 리더 서열 및 E1 (192-326) 코딩 영역 함유)는, pYIG7E1의 BamHI 단편 (2790 bp)으로서 BamHI-분해된 대장균/에스.세레비시아애(S. cerevisiae) pSY1 셔틀벡터 (서열번호: 43, 도 21)에 전달하였다. 제조자의 조건에 따라 T4 DNA 리가제(뵈링거 제조)를 사용하여 결찰을 실시하였다. 결찰 혼합물을 사용하여 대장균 DH5αF' 세포를 형질전환시키고, 또 몇 개 암피실린 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pSY1YIG7E1s (서열번호: 50, 도 28)로 명명하였다.
실시예 10
사카로마이세스 세레비시아애(
Saccharomyces cerevisiae
)의 형질전환 및 형질전환체의 선택
초-글리코실화 문제를 해결하기 위하여, 사카로마이세스 세레비시아애(Saccharomyces cerevisiae)에서 단백질 과발현을 위해 돌연변이 스크 리닝이 고안되었다. 이 스크리닝은 Ballou (Ballou, L. 등 1991)의 방법을 기초로하며, 그에 의해 자연적인 수동 오르토바나데이트-내성 돌연변이를 선택하였다. 초기 균주 선택은 천연의 겔 전기영동후에 관찰된 바와 같이 인버타제의 글리코실화 패턴을 기본으로 하여 실시되었다. 글리코실화 능력이 감소된 균주는 재조합 단백질 반현 실험을 위해 유지시키고 균주 IYCC155로 명명하였다. 돌연변이체의 성질은 더 이상 연구하지 않았다.
상기 글리코실화-결핍 균주 IYCC155는 Elble (Elble, R. 1992)에 의해 기재된 바와 같은 아세트산리튬 방법에 의해 실시예 7 내지 9에 기재된 바와 같이 플라스미드를 형질전환시켰다. 몇 개의 Ura 보충 균주를 선택성 YNB + 2% 한천 플레이트 (디프코 제조)로부터 선택하여 2 ml YNB+2% 글루코오스를 접종시켰다. 이들 배양물을 오르비탈 진탕기상에, 37℃에서 72시간, 200 rpm으로 배양하고, 배양 상층액 및 세포내 분획을 E1 특이적 주위 모노클로날 항체(IGH 201)를 사용하여 발색된 웨스턴 블럿에 의해 E1의 발현에 대해 분석하였다.
사용된 에스. 세레비시아애(S. cerevisiae) 글리코실화 결핍 돌연변이주에서 단백질의 발현은 이러한 균주의 차선의 생장 특성에 의해 제한됨으로써 바이오매스 수율 감소를 초래하므로 야생형 S에 대하여 소망하는 단백질의 수율이 낮다. 소망하는 단백질의 수율은 포유동물 세포에서 보다 훨씬 더 높았다.
실시예 11
pPICZalphaD'E1sH6 및 pPICZalphaE'E1sH6 벡터의 작성
셔틀벡터 pPICZalphaE'E1sH6은 pPICZalphaA 벡터 (Invitrogen 제조; 서열번호: 51, 도 29)로부터 출발하여 작성하였다. 첫 단계로서, 상기 벡터를 변경시켜 E1 코딩 서열이 KEX2 또는 STE13 가공 프로테아제의 절단부위 바로 뒤에 클로닝되도록 하였다. 따라서 pPICZalphaA를 XhoI 및 NotI로 분해시켰다. 분해물을 1% 아가로오스 겔상에서 분리하고 3519 kb 단편(벡터의 주요 부분)을 분리하고 겔 추출 키트(Qiagen 제조)에 의해 정제하였다. 이 단편은 특정 올리고뉴클레오티드의 존재하, 제조자의 조건에 따라서 T4 중합효소(베링거 제조)를 사용하여 결찰시켜 pPICZalphaD' (서열번호: 52, 도 30) 또는 pPICZalphaE' (서열번호: 53, 도 31)을 얻었다.
하기 올리고뉴클레오티드를 사용하였다.
- pPICZalphaD' 작성용:
결합후, 하기 링커 올리고뉴클레오티드를 얻음:
- pPICZalphaE' 작성용
결합후, 하기 링커 올리고뉴클레오티드를 얻음:
이들 셔틀벡터 pPICZalphaD' 및 pPICZalphaE'를 각 가공 프로테아제 KEX2 및 STE13의 절단부위 바로 뒤에 있는 클로닝 부위에 새롭게 도입하였다. E1-H6 코딩 서열은 pGEMT-E1sH6 (서열번호: 6, 도 1)로부터 NsI1/Eco52I 단편으로 분리하였다. 분해물을 1% 아가로오스 겔상에서 분리한 후 겔 추출 키트(Qiagen 제조)를 사용하여 단편을 정제하였다. 생성한 단편은 무딘 말단(T4 DNA 중합효소)이며 가공 프로테아제 절단부위 바로 뒤의 pPICZalphaD' 또는 pPICZalphaE'에 결찰시켰다.
결찰 혼합물을 대장균 TOP10F' 세포로 형질전환시키고 몇 개의 제오신 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pPICZalphaD'E1sH6 (ICCG3694; 서열번호: 58, 도 32) 및 pPICZalphaE'E1sH6 (ICCG3475; 서열번호: 59, 도 33)으로 명명하였다.
실시예 12
pPICZalphaD'E2sH6 및 pPICZalphaE'E2sH6 벡터의 작성
셔틀벡터 pPICZalphaD' 및 pPICZalphaE'는 실시예 11에 기재한 바와 같이 작성하였다.
E2-H6 코딩 서열은 pBSK-E2sH6 (서열번호: 45, 도 23)으로부터 SalI/KpnI 단편으로서 분리하였다. 분해물을 1% 아가로오스 겔상에서 분리한 후 겔 추출 키트(Qiagen 제조)에 의해 단편을 정제하였다. 생성한 단편을 무딘 말단(T4 DNA 중합효소 사용)으로 만든 다음 각 가공 프로테아제 절단 부위 바로 뒤에 있는 pPICZalphaD' 또는 pPICZalphaE'에 결찰시켰다.
결찰 혼합물을 대장균 TOP10F'세포로 형질전환시키고 몇 개의 제오신 내성 콜로니의 플라스미드 DNA를 제한효소 분해에 의해 분석하였다. 양성 클론을 유지시키고 pPICZalphaD'E2sH6 (ICCG3692; 서열번호: 60, 도 34) 및 pPICZalphaE'E2sH6 (ICGG3476; 서열번호: 61, 도 35)로 명명하였다.
실시예 13
피치아 파스토리스(
Pichia pastoris
)의 형질전환 및 형질전환체의 선택
실시예 11 및 12에 기재된 바와 같은 피. 파스토리스(P. pastoris) 셔틀벡터를 사용하여 제조자의 조건(Invitrogen 제조)에 따라 피. 파스토리스(P. pastoris) 세포를 형질전환시켰다. E1- 및 E2-생성 균주를 다음 특징화를 위해 유지시켰다.
초글리코실화가 보통 존재하지 않고(Gellissen, G. 2000) 또 전에는 dengue 바이러스 E 단백질을 GST 융합물(Sugrue, R. J. 등, 1997)로서 발현하기 위해 사용된 점에서 공지된 효모 균주인 피. 파스토리스(P. pastoris)에서 HCV 엔빌로프 단백질을 발현시켰다. 생성한 피.파스토리스(P. pastoris)-발현된 HCV 엔빌로프 단백질은 야생형 사카로마이세스 균주에서 관찰된 글리코실화에 필적하는 글리코실화를 나타내었다. 보다 자세하게는, 피. 파스토리스(P. pastoris)에 의해 생산된 HCV 엔빌로프 단백질은 초글리코실화되었다(형질전환된 피. 파스토리스 세포로부터 분리된 단백질의 웨스턴-블럿에서 검출된 발현 산물의 분자량을 기준).
실시예 14
사카로마이세스 세레비시아애(
Saccharomyces cerevisiae
), 한세눌라 폴리모르파(
Hansenula polymorpha
) 및 피치아 파스토리스(
Pichia pastoris
)에 대한 배양 조건
사카로마이세스 세레비시아애(
Saccharomyces cerevisiae
)
세포 뱅킹
선택된 재조합 클론중에서 마스터 세포 뱅크 및 작용 세포 뱅크를 제조하였다.
중간-지수적으로 생장한 진탕 플라스크 배양액으로부터 냉동-바이얼을 준비하였다(발효 종자 배양액에서와 같은 배양조건, 하기 참조). 글리세롤을 냉동보호제로서 부가하였다(50% 최종 농도).
발효
종자 배양은 냉동저장된 작용 세포 뱅크 바이얼로부터 개시하여 2L 엘렌마이어 진탕 플라스크중의 500 mL 배지(2% 수크로오스 보충된 YNB, 디프코 제조)에서 37℃, 200 rpm으로 48시간 동안 생장시켰다.
발효는 작용부피가 15 L인 Biostat C 발효기(B. Braun Int., Melsungen, 독일)중에서 전형적으로 실시하였다. 발효 배지는 1% 효모 추출액, 2% 펩톤 및 탄소 공급원으로서 2% 수크로오스를 함유하였다. 폴리-에틸렌 글리콜은 소포제로서 사용하였다.
발효하는 동안 온도, pH 및 용존산소는 전형적으로 제어되며, 적용가능한 세트 포인트는 하기 표 1에 요약하였다. 용존 산소는 교반/통기에 의해 계단식으로 제어하였다. NaOH (0.5M) 또는 H3PO4 용액 (8.5%)를 부가하는 것에 의해 pH를 제어하였다.
10% 종자-배지를 부가하는 것에 의해 발효를 개시하였다. 생장기 동안 수크로오스 농도는 HPLC 분석(Polysphere Column OAKC Merck 제조)에 의해 오프라인으로 조절하였다.
생장상 동안 용존 산소는 계단식으로 제어(교반/통기)하였다. 수크로오스를 완전히 대사시킨 후 이종 단백질 생산은 약 0.5% 농도(오프라인 HPLC 분석, Polysphere OAKC 칼럼)로 유지시키기 위하여 EtOH를 계단식으로 보충한 내인성 생산된 에탄올에 의해 유발되었다. 상기 유도 상 동안, 용존 산소는 공기량 및 교반 속도의 수동 조작을 통하여 5% 미만의 공기-포화으로 제어된다.
전형적으로, 발효는 유도한지 48 내지 74시간 후에 수확되며, 탄젠트 유동 여과에 의해 농축시킨 다음 농축된 세포 현탁액을 원심분리시킴으로써 세포 펠릿을 얻었다. 즉시 분석하지 않으면, 세포 펠릿은 -70℃에서 저장하였다.
한세눌라 폴리모르파(
Hansenula polymorpha
)
세포 뱅킹
선택된 재조합 클론중에서 마스터 세포 뱅크 및 작용 세포 뱅크를 제조하였다.
중간-지수적으로 생장한 진탕 플라스크 배양액으로부터 냉동-바이얼을 준비하였다(발효 종자 배양액에서와 같은 배양조건, 하기 참조). 글리세롤을 냉동보호제로서 부가하였다(50% 최종 농도).
발효
종자 배양은 냉동저장된 작용 세포 뱅크 바이얼로부터 개시하여 2L 엘렌마이어 진탕 플라스크중의 500 mL 배지(YNB, 디프코 제조)에서 37℃, 200 rpm으로 48시간 동안 생장시켰다.
발효는 작용부피가 15 L인 Biostat C 발효기(B. Braun Int., Melsungen, 독일)중에서 전형적으로 실시하였다. 발효 배지는 1% 효모 추출액, 2% 펩톤 및 탄소 공급원으로서 1% 글리세롤을 함유하였다. 폴리-에틸렌 글리콜은 소포제로서 사용하였다.
발효하는 동안 온도, pH 및 용존산소는 전형적으로 제어되며, 적용가능한 세트 포인트는 하기 표 2에 요약하였다. 용존 산소는 교반에 의해 계단식으로 제어하였다. NaOH (0.5M) 또는 H3PO4 용액 (8.5%)를 부가하는 것에 의해 pH를 제어하였다.
10% 종자-배지를 부가하는 것에 의해 발효를 개시하였다. 생장기 동안 글리세롤 농도는 오프라인 (Polysphere Column OAKC Merck)으로 조절하였고 완전히 글리세롤을 소비한 지 24시간 후 1% 메탄올을 부가하여 이종 단백질 발현을 유발하였다. 발효는 유도한지 24 시간 후에 수확되며, 탄젠트 유동 여과에 의해 농축시킨 다음 농축된 세포 현탁액을 원심분리시킴으로써 세포 펠릿을 얻었다. 즉시 분석하지 않으면, 세포 펠릿은 -70℃에서 저장하였다.
피치아 파스토리스(
Pichia pastoris
)
재조합 피치아 파스토리스(Pichia pastoris)를 사용한 소규모 단백질 생산실험은 진탕 플라스크 배양으로 설계하였다. 종자 배양은 YPD 배지(디프코 제조)에서 철야로 생장하였다. 초기 배지 pH는 4.5로 정하였다. 진탕 플라스크를 회전 진탕기상에서 200-250 rpm으로 37℃에서 배양하였다.
소규모 생산은 전형적으로 2L 진탕 플라스크내의 500 mL 규모로 실시하였고 1% 효모 추출액, 2% 펩톤(디프코 제조) 및 탄소 공급원으로서 2% 글리세롤을 함유하는 발현배지중에서 10% 접종시키는 것에 의해 개시하였다. 배양 조건은 종자 배 양과 동일하다. 접종한 지 약 72시간 후 1% MeOH를 부가하는 것에 의해 배양을 개시하였다. 유도한 지 24시간 후 원심분리에 의해 세포를 수집하였다. 즉시 분석하지 않을 경우, 세포 펠릿은 -70℃에서 저장하였다.
실시예 15
선택된 효모 세포에서 발현된 MFα-E1-H6 및 MFα-E2-H6 단백질로부터 리더 펩티드의 제거
에스. 세레비시아애(S. cerevisiae)의 α-메이팅 인자 (αMF) 리더 서열을 갖는 HCV E1 및 E2 단백질 작성물의 글리코실화 결핍 균주 한세눌라 폴리모르파(Hansenula polymorpha) 및 사카로마이세스 세레비시아애(Saccharomyces cerevisiae)에서 발현산물을 더욱 분석하였다. 유전형 1b HCV E1s (aa 192-326) 및 HCV E2s (VIEGR (서열번호: 69)-서열에 의해 연장된 aa 383-673)는 C-말단 his-tagged (H6, HHHHHH, 서열번호: 63; 상기 HCV 단백질은 본 실시예에서 αMF-E1-H6 및 αMF-E2-H6으로 명명됨) 단백질로 발현되기 때문에, 효모 세포의 염화 구아니디늄 (GuHCl)-용해화후 발현된 산물의 신속하고도 효과적인 정제는 Ni-IDA (Ni-이미노디아세트산)상에서 실시하였다. 320 mM (4% w/v) 아황산나트륨 및 65 mM (2% w/v) 테트라티온산 나트륨의 존재하, 실온(RT)에서 단백질을 철야로 술폰화하였다. 냉동-해동 주기후 용균물을 원심분리(10,000 g, 30 분, 4℃)에 의해 깨끗하게 만들고 Empigen (Albright & Wilson 제조, UK) 및 이미다졸을 최종 농도 1% (w/v) 및 20 mM로 각각 상층액에 부가하였다. 샘플을 여과하고(0.22 μM) 또 Ni-IDA 세파로 오스 FF 칼럼상에 걸고, 50 mM 인산염, 6M GuHCl, 20 mM 이미다졸이 보충된 1% Empigen (완충액 A)으로 평형으로 유지시켰다. 이 칼럼은, 280 nm에서 흡수도가 기저 레벨에 도달할 때 까지 20 mM 및 50 mM 이미다졸을 각각 함유하는 완충액 A로 순차적으로 세척하였다. 완충액 D, 50 mM 포스페이트, 6M GuHCl, 0.2% (E1의 경우) 또는 1% (E2의 경우) Empigen, 200 mM 이미다졸을 적용하는 것에 의해 his-태깅된 산물을 용출시켰다. 용출된 물질을 SDS-PAGE 및 E1 (IGH201) 또는 E2(IGH212)에 대해 특이적인 특정 모노클로날 항체를 사용하는 웨스턴-블럿에 의해 분석하였다.
E1-산물은 에드만 분해에 의해 즉시 분석하였다.
이 단계에서, SDS-PAGE는 HCV E2에 대한 아주 복잡한 단백질 밴드 그림을 나타내므로, 크기 배제 크로마토그래피에 의해 분별처리(fractionation)를 실시하였다. Ni-IDA 용출액을 한외여과(MWCO 10 kDa, 세??리플러스, 아미콘, 밀리포어)에 의해 농축시키고 PBS, 1% Empigen 또는 PBS, 3% Empigen중의 Superdex G200 (10/30 또는 16/60; 파마시아 제조)상에 걸었다. E2 생성물을 함유하며 Mr 범위가 ~80 kDa 내지 ~45 kDa인 용출 분획, SDS-PAGE (도 38)상의 이동을 기초로 하여 도 37에서의 용출 프로필의 분획 17-23을 모아서 알킬화시켰다 (실온에서 10 mM DTT를 사용하여 3시간 동안 배양시킨 다음 30 mM 요오도-아세트아미드를 사용하여 실온에서 3시간 동안 배양하였다). 아미노 말단 서열결정을 위한 샘플을 Endo H (로쉐 바이오케미컬스 제조)로 처리하거나 또는 처리하지 않았다. 글리코실화된 E2 생성물 및 탈글리코실화된 E2 생성물을 말단 서열결정을 위해 PVDF-막상에 블러팅시켰다. 글리코실화된 E2 및 탈글리코실화된 E2의 아미도-블랙 염색된 블럿을 도 39에 도시한다.
E1 및 E2 정제 산물의 서열결정은 HCV 엔빌로프 단백질로부터 시그널 서열의 제거가 오직 부분적으로만 생긴다는 실망스런 관찰을 초래한다(표 3). 또한, 부생성물(분해 산물 및 리더 서열 또는 그의 일부를 여전히 함유하는 생성물)의 대다수는 글리코실화되어 있다. 이러한 글리코실화는 N-글리코실화 부위를 함유하는 시그널 서열의 비-절단 단편상에서도 부분적으로 존재한다. 이러한 부위는 돌연변이되어 글리코실화가 적은 부생성물을 초래한다. 그러나, 더욱 문제가 되는 것은 일부 절단된 생성물이 소망하는 완전한 엔빌로프 단백질과 비교하여 1 내지 4개 아미노산 상이점을 갖는 점이다. 따라서, 상이한 발현산물 사이의 생화학적 특징을 충분히 구별할 수 없기 때문에, 정확하게 처리된 생성물의 정제도 실질적으로 불가능하다. 분해 생성물의 일부는 Kex-2와 유사한 절단(예컨대 아르기닌 이후의 절단인 E1의 aa 196 이후에 관측된 절단)의 결과일 수 있으며, 이것은 α-메이팅 인자 리더의 절단을 필요로하므로 상기 필수 과정을 방해함없이 차단될 수 없다.
에스. 세레비시아애(S. cerevisiae) IYCC155를 pSY1YIG7E1s (서열번호: 50, 도 28)를 사용하여 형질전환시켜 유도된 E1을 다량생산하는 클론을 에스. 세레비시아애(S. cerevisiae) IYCC155를 pSY1aMFE1sH6aYIG1E1s (서열번호: 44, 도 22)로써 형질전환시켜 유도된 고생산 클론과 비교하였다. E1 단백질의 세포내 발현은 도입한지 2 내지 7일 후에 E1 특이적 모노클로날 항체(IGH 201)를 사용하는 웨스턴-블럿에 의하여 평가하였다. 도 40으로부터 판명할 수 있듯이, 최대 발현은 양쪽 균 주 공히 2일 후에 관찰되었지만, 양쪽 균주에 대한 발현 패턴은 완전히 상이하였다. α-메이팅 인자 리더를 갖는 발현은 아주 복잡한 밴드 패턴을 초래하는데, 이는 리더의 가공이 효과적이지 않다는 사실로부터 기인한다. 이는 상이한 아미노 말단을 갖는 몇 개의 발현 산물을 초래하고 또 그 일부는 1 내지 5개 N-글리코실화에 의해 변경된다. 그러나, CL 리더와 함께 발현된 E1의 경우, 제한된 개수의 분명한 밴드가 관찰되며, 이는 정확한 CL 리더 제거가 고효율로 이루어졌음을 반영하며 또 이러한 정확하게 가공된 물질만이 N-글리코실화(1 내지 5개 사슬)에 의해 변경될 수 있다는 사실은 동일 CL 리더를 사용하여 발현된 한세눌라-유도된 E1에서 관찰된 바와 같다(실시예 16 참조).
E1에 대해 특이적인 모노클로날 항체(IGH201)를 생산하는 하이브리도마 세포주는 부다페스트 조약하에, European Collection of Cell Cultures, Centre for Applied Microbilogy & Research (영국 윌셔 에스피4 0제이지이, 살리스베리 소재)에 수탁번호 ECACC 98031216으로 1998년 3월 12일에 기탁되었다. E2에 대한 특이적인 모노클로날 항체(IGH212)는 WO 96/04385호에서 Maertens 등에 의해 실시예 7.4에 항체 12D11F2로서 기재되어있다.
주: 에스. 세레비시아애(S. cerevisiae) 및 에이치. 폴리모르파(H. polymorpha) 에서 발현된 αMF-E1-H6 및 αMF-E2-H6 단백질의 N-말단의 동정. N-말단 서열결정을 기준으로 하여, 천연 E1-H6 및 E2-H6의 N-말단의 양을 산출할 수있었다("성숙"은 αMF 시그널 서열이 정확하게 제거된 것을 지시한다). 단백질 산물의 전체량은 에드만 분해에 의해 회수된 피이크의 세기를 기초로하여 단백질의 pmol로 산출하였다. 이어, 각 특정 단백질(즉, 각각의 "검출된 N-말단"에 대하여)에 대하여, 전체량에 대한 몰%를 산출하였다.
실시예 16
대량생산에 적합한 효모에서 E1 작성물의 발현 및 정제
에스.세레비시아애 αMF 리더 펩티드를 치환하기 위하여 몇 개의 다른 리더 서열, 즉 CHH(카르시누스 마에나스(Carcinus maenas) 고혈당 호르몬의 리더 서열), Amyl1 (에스. 옥시덴탈리스(S.occidentalis)로부터 아밀라제의 리더 서열), Gam1 (에스. 옥시덴탈리스(S.occidentalis)로부터 글루코아밀라제의 리더 서열), Phy5 (진균의 피타제로 부터의 리더 서열), pho1 (피치아 파스토리스(Pichia pastoris)로 부터의 산 포스파타제의 리더 서열) 및 CL (조류의 리조짐 C, 1,4-베타-N-아세틸무라미다제 C의 리더)를 사용하여 E1-H6(즉, C-말단 his-태그를 갖는 E1)에 결찰시켰다. 모든 구조물을 한세눌라 폴리모르파(Hansenula polymorpha)에서 발현시키고 생성한 세포 용균물 각각을 웨스턴 블럿 분석처리하였다. 상기에 의해, 리더 또는 시그널 서열 또는 펩티드의 제거정도는 CL이 리더 펩티드로 사용된 구조물을 제외하고는 극히 낮다는 것을 결론지을 수 있다. 이것은 Ni-IDA 정제된 물질의 에드만 분해에 의해 CHH-E1-H6 구조물에 대해서도 확인되었다: 몇 개의 상이한 서열이 회수되긴 했으나 완전히 절단된 생성물은 검출되지 않았다 (표 4 참조).
주: SDS-PAGE 및 PVDF-막으로 블러팅하는 것에 의해 분리한 후 상이한 단백 질 밴드의 N-아미노산 서열결정을 기초로 하여 에이치. 폴리모르파(H. polymorpha)에서 발현된 CHH-E1-H6 단백질의 N-말단의 동정.
상기 기재한 바와 같이, 세포 용균물의 웨스턴-블럿에 의해 E1 특이적 단백질 밴드 패턴이 밝혀졌으며, 이는 CL 리더 펩티드의 정확한 제거 정도가 높음을 나타낸다. 이는 상기 리더가 효모로부터 유래한 것이 아니기 때문에 놀라운 것이다. GuHCl 용해되고 Ni-IDA 정제된 물질의 에드만 분해에 의해 아미노산 서열결정하면 84%의 E1 단백질이 정확하게 제거되며 또 그 물질은 분해 산물을 실질적으로 갖지 않음이 확인되었다. 16%의 가공되지 않은 물질이 존재하지만, 이 물질은 글리코실화되지 않은 것이어서 혼합물로부터 용이하게 제거될 수 있어 정확하게 절단되고 글리코실화된 E1을 특이적으로 농축시킬 수 있다. 이러한 농축방법은 렉틴상의 친화성 크로마토그래피이며, 다른 사항에 대해서는 실시예 19에 나타낸 바와 같다. 다르게는, 소수성 특징이 더 큰 비-글리코실화 물질을 선택사용하여 다른 농축과정을 최적화할 수 있다. CL-H1-H6 단백질로부터 CL 리더 펩티드를 정확하게 제거하는 것은 질량 분광계에 의해 확인하며, 이에 의해 유전형 1b E1의 5개의 N-글리코실화 부위중 4개 까지가 점유될 수 있음이 확인되며, 서열 NNSS (아미노산 233-236; 서열 번호: 73)는 단일 N-글리코실화 부위로 간주될 수 있다.
실시예 17
한세눌라 폴리모르파(
Hansenula polymorpha
)에서 CL-E2-H6 암호화 구조물로 부터 발현된 HCV E2 단백질의 정제 및 생화학적 특징
한세눌라 폴리모르파(Hansenula polymorpha)에서 발현된 CL-E2-VIEGR-H6 (본 실시예에서는 "CL-E2-H6"으로도 표시됨) 단백질로부터 CL 리더 펩티드를 제거하는 효율을 분석하였다. HCV E2s (aa 383-673)은 his-태깅된 단백질로 발현되기 때문에, 수집된 세포의 GuHCl-용해후 발현된 단백질의 신속하고 효과적인 정제를 Ni-IDA상에서 실시하였다. 간단히 말해, 세포 펠릿을 30 mM 인산염, 6M GuHCl, pH 7.2 (9 mL 완충액/g 세포)에 재현탁시켰다. 이 단백질을 320 mM (4% w/v) 아황산나트륨 및 65 mM (2% w/v) 테트라티온산 나트륨 존재하, 실온에서 철야로 술폰화시켰다. 냉동-해동 주기 후 용균물을 원심분리(10,000 g, 30분, 4℃)에 의해 깨끗하게 만들었다. Empigen BB (Albright & Wilson) 및 이미다졸을 최종 농도 1% (w/v) 및 20 mM로 각각 부가하였다. 다른 추가의 크로마토그래피 단계를 Åkta FPLC 워크스테이션(파마시아 제조)상에서 실시하였다. 샘플을 0.22 ㎛ 포어 크기의 막(셀룰로오스 아세테이트)을 통하여 여과시키고 Ni-IDA 칼럼(Ni2+가 로딩된 Chelating Sepharose FF, 파마시아 제조)상에 걸고, 50 mM 인산염, 6 M GuHCl, 20 mM 이미다졸이 보충된 1% Empigen BB, pH 7.2 (완충액 A)를 사용하여 280 nm에서 흡수도가 기저 레벨에 도달할 때 까지 평형처리시켰다. 완충액 D, 50 mM 인산염, 6M GuHCl, 0.2 % Empigen BB (pH 7.2), 200 mM 이미다졸을 적용하는 것에 의해 his-태깅된 생성물을 용출시켰다. 정제된 물질은 SDS-PAGE 및 E2에 특이적인 특정 모노클로날 항체(IGH212)를 사용하는 웨스턴-블럿에 의해 분석하였다(도 41). IMAC-정제된 E2- H6 단백질은 에드만 분해에 의해 N-말단 서열결정처리시켰다. 이 단백질을 N-글리코시다제 F(로쉐 제조) (0.2 U/㎍ E2, PBS3% empigen BB중 37℃에서 1시간 배양)처리시키거나 또는 미처리 상태로 둔다. 글리코실화된 E2-H6 단백질 및 탈글리코실화된 E2-H6 단백질을 SDS-PAGE처리시키고 PVDF-막상에 블러팅하여 아미노산 서열결정하였다(분석은 PROCISETM 492 단백질 서열결정기(어플라이드 바이오시스템스 제조) 상에서 실시하였다). 이 단계에서 SDS-PAGE는 일부 분해 산물을 나타내므로, 크기 배제 크로마토그래피에 의해 분별처리를 실시하였다. Ni-IDA 용출액을 한외여과(MWCO 10kDa, 센트리플러스, 아미콘, 밀리포어)에 의해 농축시키고 PBS, 1% Empigen BB중의 Superdex G200 (파마시아 제조)상에 로딩하였다. SDS-PAGE상에서의 이동을 기준으로 하여 ~30kDa 내지 ~70kDa사이의 Mr을 갖는 완전한 E2s 관련 생성물을 함유하는 용출 분획을 모아서 알킬화시켰다 (5 mM DTT를 사용하여 37℃에서 30분간 배양한 다음 20 mM 요오도아세트아미드를 사용하여 37℃에서 30분간 배양함). IMAC 정제후 있을 수 있는 분해 생성물은 크기 배제 크로마토그래피에 의해 완전한 생성물을 분별하는 것에 의해 극복될 수 있다. 예상치 못한 양호한 결과를 얻었다. N-말단 서열결정화를 기준으로 하여, CL 리더 펩티드가 제거된 E2 생성물의 양을 산출할 수 있었다. 단백질 생성물의 전체 양은 에드만 분해에 의해 회수된 피이크의 세기를 기본으로 하여 단백질의 pmol로 계산하였다. 이어, 각 특정 단백질(예컨대 각 "검출된 N-말단")의 경우, 전체양에 대한 몰%를 산출하였다. 현재의 실험에서, E2-H6의 정확한 N-말단만이 검출되었으며 또 E2 단백질에 포함되 지 않는 E2 단백질의 아미노산을 갖지 않거나 또는 N-말단 아미노산을 함유하는 E2-H6 변이체는 존재하지 않았다. 결론적으로, 에이치. 폴리모르파 (H. polymorpha)에 의해 CL-E2-H6 단백질로서 발현된 E2-H6 단백질은 시험관에서 추가의 가공없이 95% 이상의 정확하게 절단된 단백질로서 분리되었다. 이것은 E2-H6 단백질에 대한 αMF-E2-H6 단백질의 에이치. 폴리모르파(H. polymorpha)에 의한 리더 펩티드 제거의 충실성과 명확한 대조를 이루며, 분리된 단백질의 25%로 발생하는 것으로 계산되었다 (표 3 참조).
실시예 18
CL-H6-K-E1 암호화 구조물로부터 한세눌라 폴리모르파(
Hansenula polymorpha
)에서 발현된 HCV E1 단백질의 정제 및 생화학적 특징 및 H6-함유 단백질의 시험관내 가공
한세눌라 폴리모르파(Hansenula polymorpha)에서 발현된 CL-H6-K-E1로부터 CL 리더 펩티드의 제거 효율 뿐만 아니라 h6(his-tag)-어댑터 펩티드 및 Endo Lys-C 가공부위를 제거하기 위한 시험관내 가공의 효율을 분석하였다. HCV E1s(aa 192-326)은 N-말단 His-K-태깅된 단백질 CL-H6-K-E1으로서 발현되기 때문에, 실시예 17에 기재된 바와 같이 신속하고 효과적인 정제를 실시할 수 있다. H6-K-E1 ( 및 가능하게는 잔류 CL-H6-K-E1) 단백질의 IMAC-크로마토그래피 정제의 용출 프로필은 도 42에 도시한다. SDS-PAGE 및 겔의 은 염색 그리고 E1에 특이적인 특정 모노클로날 항체(IGH201)를 사용한 웨스턴-블럿 분석(도 43) 후, 재조합 E1s 생성물 을 함유하는 용출 분획(63-69)을 모으고('IMAC 푸울') 또 철야로 엔도프로테아나제 Lys-C (로쉐) 처리 (효소/기질 비 1/50 (w/w), 37℃)시킴으로써 H6-K-융합 테일을 제거하였다. 비-처리 융합 생성물의 제거는 Ni-IDA 칼럼상에서 음성 IMAC 크로마토그래피 단계에 의해 실시함으로써 Endo-Lys-C-가공된 단백질을 유동 분획으로 수집하였다. 여기서 Endo-Lys-C 분해된 단백질 샘플을 10 mM NaH2PO4.3H2O, 1% (v/v) Empigen B, pH 7.2 (완충액 B)에 의해 10배 희석시킨 후 Ni-IDA 칼럼상에 적용한 다음 280 nm에서 흡수도가 기저 레벨에 도달할 때 까지 완충액 B를 사용하여 세척하였다. 유량을 상이한 분획(1-40)으로 수집한 다음 E1s-생성물이 존재하는지 스크리닝하였다(도 44). N-말단 H6-K (및 가능하게는 잔류 CL-H6-K) 테일이 제거 (SDS-PAGE에서의 이동을 기준으로 하여 ~15 kDa 내지 ~30 kDa 범위의 Mr을 가짐)된 다음, 은 염색 또는 E1에 대하여 특이적인 특정 모노클로날 항체(IGH201)를 사용하여 웨스턴 블럿 분석시켜 온전한 E1을 함유하는 분획(7-28)을 모아서 알킬화시켰다 (5 mM DTT를 사용하여 37℃에서 30분간 배양한 다음 20 mM 요오도아세트아미드를 사용하여 37℃에서 30분간 배양함).
상기 물질을 N-말단 서열결정처리(에드만 분해)하였다. 단백질 샘플은 N-글리코시다제 R (로쉐 제조) (0.2U/㎍ E1, PBS/3% empigen BB중 37℃에서 1시간 배양)로 처리되거나 또는 미처리 상태로 보존한다. 글리코실화된 E1 단백질 및 탈글리코실화된 E1 단백질은 SDS-PAGE에 의해 분리하였고 PVDF-막상에 블러팅하여 에드만 분해(PROCISETM 492 단백질 서열기(어플라이드 바이오시스템스 제조)상에서 분석 을 실시함)에 의해 더욱 분석하였다. N-말단 서열결정화를 기본으로 하여 정확하게 가공된 E1 생성물의 양을 산출할 수 있었다 (가공은 H6-K-서열의 정확한 절단을 포함함). 단백질 생성물의 전체 양은 에드만 분해에 의해 회수된 피이크의 세기를 기준으로 하여 단백질의 pmol로 산출하였다. 이어, 특정 단백질(즉, 각 "검출된 N-말단")의 경우, 전체에 대한 몰%를 산출하였다. 현재 실험에서, E1의 정확한 N- 말단만이 검출되었고 또 H6-K-E1의 다른 가공 변이체의 N-말단은 검출되지 않았다. 이를 기준으로 하여, E1 단백질에 대한 H6-K-E1의 E1 (및 가능하게는 잔류하는 CL-H6-K-E1) 단백질의 Endo Lys-C에 의한 시험관내 가공은 95% 이상의 충실성을 갖도록 생성하는 것으로 산출되었다.
실시예 19
저-글리코실화된 형태의 HCV E1의 헤파린에 의한 특이적 제거
효모 세포로부터 HCV 엔빌로프 단백질을 특이적으로 정제하기 위한 단계를 찾기 위하여 헤파린과의 결합을 평가하였다. 헤파린은 몇 개의 바이러스에 결합하는 것으로 알려져 있으므로 HCV 엔빌로프에 대한 결합은 이미 제시된 바 있었다 (Garson, J. A. 등 1999). 이러한 가능한 결합을 분석하기 위하여, 헤파린을 비오티닐화시키고 HCV E1과의 상호작용을 마이크로티터플레이트에서 분석하며, 이때 마이크로티터플레이트는 에이치.폴리모르파로부터의 술폰화된 HCV E1, 에이치. 폴리모르파로부터 알킬화된 HCV E1 (양쪽 모두 실시에 16에 기재된 바와 같이 제조됨) 및 백시니아 발현벡터로 감염된 포유동물 세포 배양액으로부터 알킬화된 HCV E1으 로 피복된 것이다. 놀랍게도, 강한 결합은 에이치.폴리모르파로부터의 술폰화된 HCV E1에 의해서만 관찰될 수 있었던 반면에, 포유동물 세포 배양액으로부터의 알킬화된 HCV E1과의 결합은 전혀 존재하지 않았다. 웨스턴-블럿에 의하여, 본 발명자는 상기 결합은 HCV E1 단백질 혼합물의 저분자량 밴드, 즉 저-글리코실화된 성숙 HCV E1s에 특이적(도 45)이라는 것을 알 수 있었다. 도 45는 술폰화 결합의 제거시 저분자량 E1 (레인 4)이 여전히 관찰되기 때문에 술폰화는 헤파린 결합에 필수적이 아니라는 것을 나타낸다. 그러나, 알킬화는 상기 결합력을 실질적으로 감소시키는데, 이는 본 실시예에 사용된 특정의 알킬화제(요오도-아세트아미드)에 의해 유발될 수 있다. 이러한 발견은 또한 본 발명자들이 고도의 글리코실화를 갖는 (즉, 더 많은 글리코실화 부위가 점유됨) HCV E1 단백질 제제를 위하여 HCV E1 제제를 농축시킬 수 있기 때문에 효모용 CL-HCV-엔빌로프 발현 카세트의 공업적 능력도 나타낸다.
실시예 20
바이러스-유사 입자(virus-like particle: VLP)의 형성 및 분석
에이치. 폴리모르파에서 발현된 HCV E1 및 E2 엔빌로프 단백질이 VLP로 전환(실시예 16 내지 18)하는 것은 WO99/67285호에서 데프라 등에 의해 및 WO01/30815호에서 보스만 등에 의해 기재된 바와 같이 실질적으로 실시하였다. 간단히 말해, HCV 엔빌로프 단백질이 발현되는 형질전환된 에이치. 폴리모르파의 배양후, 세포를 수집하고 GuHCl에서 용균시키고 또 실시예 17에 기재된 바와 같이 술 폰화시켰다. His-태그된 단백질을 IMAC에 의해 정제한 다음 실시예 17에 기재된 바와 같이 한외여과에 의해 농축시켰다.
술폰화된 Cys-티올 기를 갖는 HCV 엔빌로프 단백질의 VLP-형성
분리과정 동안 술폰화된 농축 HCV 엔빌로프 단백질은 환원처리시키지 않고 크기 배제 크로마토그래피 칼럼(Superdex G200, 파마시아 제조)상에 로딩하고 PBS, 1% (v/v) Empigen으로 평형화시켰다. 용출 분획은 SDS-PAGE 및 웨스턴 블럿에 의해 분석하였다. 상대적 Mr이 ~29 내지 ~15 kD (SDS-PAGE 이동도 기본)인 분획을 모으고 농축해서 Superdex G200에 로딩하여 PBS, 3%(w/v) 베타인으로 평형화시켜 바이러스-유사 입자 형성(VLP)을 유발하였다. 분획을 모으고, 농축시키며 PBS, 0.5% (w/v) 베타인을 사용하여 탈염시켰다.
비가역적으로 수식된 Cys-티올 기를 갖는 HCV 엔빌로프 단백질의 VLP 형성
분리과정 동안 술폰화된 농축 HCV 엔빌로프 단백질을 환원처리(PBS중 5 mM DTT존재하에서 배양)시켜 술폰화 Cys-티올기를 유리 Cys-티올기로 전환시켰다. 비가역적 Cys-티올 수식은 (i) 20 mM 요오도아세트아미드 존재하에서 30분간 배양하거나, 또는 (ii) 5 mM N-에틸말레이미드 (NEM) 및 15 mM 비오틴-N-에틸말레이미드의 존재하에 30분간 배양하는 것에 의해 실시하였다. 이 단백질을 크기 배제 크로마토그래피 칼럼(Superdex G200, 파마시아 제조)상에 로딩하며, 요오도아세트아미드 블로킹인 경우 PBS, 1% (v/v) Empigen을 사용하여 평형화시키거나, 또는 NEM 및 비오틴-NEM에 의한 블로킹의 경우 PBS, 0.2% CHAPS를 사용하여 평형화시켰다. 용출된 분획을 SDS-PAGE 및 웨스턴 블럿에 의해 분석하였다. 상대적 Mr이 ~29 내지 ~15 kD (SDS-PAGE 이동도 기본)인 분획을 모으고 농축해서 Superdex G200에 로딩하여 PBS, 3%(w/v) 베타인으로 평형화시켜 바이러스-유사 입자 형성(VLP)을 유발하였다. 분획을 모으고, 농축시키며 또 요오도아세트아미드 블로킹인 경우 PBS, 0.5% (w/v) 베타인을 사용하여 탈염시키거나, 또는 NEM 및 비오틴-NEM을 사용한 블로킹인 경우 PBS, 0.05% CHAPS를 사용하여 탈염시켰다.
가역적으로 수식된 Cys-티올 기를 갖는 HCV 엔빌로프 단백질의 VLP 형성
분리과정 동안 술폰화된 농축 HCV 엔빌로프 단백질을 환원처리(PBS중 5 mM DTT 존재하에서 배양)시켜 술폰화 Cys-티올기를 유리 Cys-티올기로 전환시켰다. 가역적 Cys-티올 수식은 디티오디피리딘 (DTDP), 디티오카르바메이트(DTC) 또는 시스테인의 존재하에서 30분간 배양하는 것에 의해 실시하였다. 이 단백질을 크기 배제 크로마토그래피 칼럼(Superdex G200, 파마시아 제조)상에 로딩하고, PBS, 1% (v/v) Empigen으로 평형화시켰다. 용출된 분획을 SDS-PAGE 및 웨스턴 블럿에 의해 분석하였다. 상대적 Mr이 ~29 내지 ~15 kD (SDS-PAGE 이동도 기본)인 분획을 모으고 농축해서 Superdex G200에 로딩하여 PBS, 3%(w/v) 베타인으로 평형화시켜 바이러스-유사 입자 형성(VLP)을 유발하였다. 분획을 모으고, 농축시키며 또 PBS, 0.5% (w/v) 베타인을 사용하여 탈염시켰다.
에이치.폴리모르파-발현된 E2-H6의 VLP를 얻기 위한 PBS, 3% (w/v) 베타인을 사용한 크기 배제 크로마토그래피의 용출 프로필은 도 46 (술폰화됨) 및 도 47(요오도아세트아미드를 사용하여 알킬화됨)에 도시되어 있다.
에이치.폴리모르파-발현된 E1의 VLP를 얻기 위한 PBS, 3% (w/v) 베타인을 사 용한 크기 배제 크로마토그래피의 용출 프로필은 도 48 (술폰화됨) 및 도 49(요오도아세트아미드를 사용하여 알킬화됨)에 도시되어 있다. 생성한 VLP는 도 50에 도시한 바와 같이 SDS-PAGE 및 웨스턴-블럿에 의해 분석하였다.
에이치.폴리모르파-발현된 HCV 엔빌로프 단백질에 의해 형성된 VLP의 크기 분석
VLP 입자 크기는 동적광산란(Dynamic Light Scattering)에 의해 측정하였다. 광 산란 실험의 경우, 입자 크기 분석기 (모델 Zetasizer 1000 HS, 영국 워세스터 말버른에 소재하는 말버른 인트스루먼트 리미티드 제조)를 이용하며, 이것은 광자 상관관계 분광계(PCS) 소프트웨어에 의해 제어되었다. 광자 상관관계 분광계 또는 동적광산란(DLS)은 브라운 운동을 측정하여서 그것을 입자 크기와 관련시키는 광학적 방법이다. 연속적인, 가시 레이저 비임으로부터 광은 현탁액중의 거대분자 또는 입자의 앙상블을 직접 통과하고 브라운 운동하에서 이동한다. 레이저 광의 일부는 입자에 의해 산란되며 이러한 산란광은 광증배관에 의해 측정된다. 산란광의 세기변동은 전기적 펄스로 전환되어 상관검출기로 공급된다. 이로써 컴퓨터를 거치는 자기상관함수가 생성되며, 적합한 데이터 분석을 실시한다. 사용된 레이저는 고정파장 633 nm을 갖는 10 mW 단색성, 간섭성 He-Ne 레이저이다. 각 샘플의 경우, 3 내지 6회의 연속 측정을 실시하였다. 이 실험의 결과를 하기 표 5에 수록한다.
주: 에이치. 폴리모르파(H. polymorpha)에 의해 발현된 HCV 엔빌로프 단백질의 표시된 VLP-조성에 대한 동적광산란 분석의 결과. VLP 입자 크기는 입자의 평균 직경으로 나타낸다.
에이치.폴리모르파로부터 유도된 술폰화된 HCV E1는 여전히 한세눌라로부터 유도된 알킬화된 HCV E1과 동일한 크기 범위를 갖는 입자를 형성한다는 관찰은 놀라운 것이다. 술폰화의 결과로서 네가티브 변화의 높은 순수 증가(8개 이하의 Cys-티올 기가 HCV E1상에서 수식될 수 있다)는 서브유닛 간의 이온 반발을 유도할 것이므로 상기와 같은 효과는 예상치 못한 것이었다. 시험된 다른 가역적 시스테인 수식제는 입자 형성을 허용하였지만, 이런 방식으로 생성된 HCV E1은 술폰화된 물질에 비하여 안정하지 않은 것으로 밝혀져, HCV E1의 디술피드-기제 응집을 초래하게 된다. 이들 다른 가역적 블로커(blocker)를 사용하기 위하여, 다른 최적 조건이 필요할 수 있다.
실시예 21
한세눌라-생성된 HCV E1-H6 및 백시니아-감염된 포유동물 세포로부터 생산된 HCV E1의 항원성 등가
WO 99/67285호에서 Depla 등에 의해 기재한 바와 같이, 한세눌라-생산된 HCV E1-H6과 HCV 만성 보균자 혈청과의 반응을 HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에 의해 생산된 HCV E1의 반응성과 비교하였다. 시험된 양쪽 HCV-E1 제제는 VLP로 구성되었으며, HCV E1 제제는 NEM 및 비오틴-NEM에 의해 알킬화되어 있었다. 양쪽 HCV E1 VLP-제제와 HCV 만성 보균자 혈청과의 반응성은 ELISA에 의해 결정하였다. 결과를 하기 표 6에 수록한다. 표 6으로부터 알 수 있듯이, HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에서 발현된 HCV E1과 에이치.폴리모르파에서 발현된 HCV E1 사이에는 반응성에서 아무런 차이가 나타나지 않았다.
주: 포유동물 세포 배양액에서 생산된 E1 또는 에이치.폴리모르파에서 생산된 E1의 항원성을, 인간 HCV 만성 보균자로부터 얻은 혈청 패널상에서 평가하였다. 이를 위하여, 비오티닐화된 E1을 스트렙트아비딘 피복된 ELISA 플레이트에 결합시켰다. 그후, 인간 혈청을 1/20 희석하여 부가하고 또 혈청으로부터 E1에 결합된 면역글로불린은 퍼옥시다제로 라벨링된 토끼-항-인간 IgG-Fc 특이적 이차 항체를 이용하여 검출하였다. 결과는 OD값으로 표시한다. 평균치는 시험한 모든 혈청 샘플의 OD값의 평균치이다.
실시예 22
한세눌라 생산된 HCV E1-H6 및 백시니아-감염된 포유동물 세포에 의해 생산된 HCV E1의 면역원성 등가
WO 99/67285호에서 Depla 등에 의해 기재한 바와 같이, 한세눌라-생산된 HCV E1-H6의 면역원성을 HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에 의해 생산된 HCV E1의 면역원성반응성과 비교하였다. 시험된 양쪽 HCV-E1 제제는 VLP로 구성되었으며, HCV E1 단백질은 요오도아세트아미드에 의해 알킬화되었다. 양쪽 VLP 제제는 알룸과 함께 제형화되며 Balb/c 마우스에 주사하였다(각 주사당 3주 간격으로 3회 근육내/피하주사하며 각 주사는 0.13% Alhydrogel(덴마크 수퍼포스 제조)을 함유하는 125 ㎕중의 5㎍ E1으로 구성된다). 3회 면역화시킨지 10일 후 마우스로부터 혈액을 채취하였다.
이 실험 결과를 도 51에 도시한다. 도 51의 상부의 경우, 포유동물 세포에서 생산된 E1의 VLP에 의해 면역화되어 형성된 항체를 측정하였다. 항체 역가는 ELISA (실시예 21 참조)에 의해 측정하였으며, 이때 포유동물 세포에서 생산된 "E1"("M") 또는 한세눌라-생산된 E1 ("H")는 ELISA 고형 지지체상에 직접적으로 피복시킨 후 ELISA 플레이트를 카세인으로 블로킹하였다. 도 5의 하부의 경우, 한세눌라-생산된 E1의 VLP에 의해 면역화된 후 생성된 항체를 측정하였다. 항체 역가는 ELISA (실시예 21 참조)에 의해 측정하였으며, 이때 포유동물 세포에서 생산된 "E1" ("M") 또는 한세눌라-생산된 E1 ("H")를 ELISA 고형 지지체상에 직접적으로 피복시킨 후 ELISA 플레이트를 카세인으로 블로킹하였다.
측정된 항체 역가는 종점 역가이었다. 종점 역가는 혈청을 희석시켜 결정하며, 에세이의 바탕시험의 평균의 2배에 상당하는 OD(ELISA에 의해 측정됨)를 초래한다.
도 51은 양쪽 E1 조성물의 면역원성 특성 사이에 현저한 차이가 없고 또 측정된 항체 역가는 종점 역가를 실시하기 위한 ELISA에 사용된 항원과는 독립적이라는 것을 도시한다.
효모-유도된 HCV E1은 백신처리시 포유동물 세포 배양액으로부터 유도된 알킬화된 HCV E1을 사용한 백신처리시 얻을 수 있는 보호반응과 유사한 보호반응을 유발하였다. 후자의 반응은 급성 감염 이후 HCV의 만성적 발병을 예방할 수 있다.
실시예 23
술폰화된 한세눌라-생산된 HCV E1-H6의 항원성 및 면역원성 프로필
한세눌라-생산된 HCV E1-H6과 HCV 만성 보균자 혈청의 반응성을, WO 99/67285호에서 Depla 등에 의해 기재된 바와 같이, HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에 의해 생산된 HCV E1의 반응성과 비교하였다. 시험된 양쪽 HCV-E1 제제는 VLP로 구성되었으며, 이때 한세눌라-생산된 HCV E1 단백질은 술폰화되고 또 포유동물 세포에 의해 생산된 HCV E1은 알킬화되었다. 결과를 표 7에 나타낸다. 전체적(평균) 반응성이 동일하였지만, 개별 혈청에 대해 주요한 차이가 확인되었다. 이것은 술폰화된 물질이 알킬화된 HCV E1과는 상이한 방식으로 그의 항원결정부위의 일부를 제공한다는 사실을 의미한다.
술폰화된 한세눌라-생산된 HCV E1-H6의 면역원성을 알킬화된 한세눌라-생산된 HCV E1-H6의 면역원성과 비교하였다. 시험한 양쪽 HCV-E1 제제는 VLP로 구성되었다. 양쪽 VLP 제제를 알룸과 함께 제제화해서 Balb/c 마우스에 주사하였다((각 주사당 3주 간격으로 3회 근육내/피하주사하며 각 주사는 0.13% Alhydrogel(덴마크 수퍼포스 제조)을 함유하는 125 ㎕중의 5㎍ E1으로 구성된다. 3회 면역화시킨지 10일 후 마우스로부터 혈액을 채취하였다.
항체 역가는 실시예 22에 기재된 것과 유사하게 측정하였다. 놀랍게도, 술폰화된 물질을 사용한 면역화는 역가를 평가하기 위한 ELISA에 사용된 항체와 상관없이 더 높은 항체 역가를 초래하였다 (도 51; 상부 패널: 알킬화된 E1에 대해 생성된 항체의 적정; 하부 패널: 술폰화된 E1에 대하여 생성된 항체의 적정; "A": ELISA 플레이트상에 피복된 알킬화된 E1; "S": ELISA 플레이트상에 피복된 술폰화된 E1). 그러나, 상기 실험에서 개별 역가는 분석에 사용된 항원에 따라 상이한데, 이는 HCV 환자의 혈청에서 주목된 관찰을 확인시켜주는 것이다. 따라서, 시스테인 티올 기가 가역적 방식으로 수식된 HCV E1은 면역원성이 더 높으므로 HCV(만성 감염)로부터 보호하는 백신으로서 능력이 더 높다. 또한, 비가역적 블로킹에 의해 유발된 신-항원결정부위에 대한 반응의 유도는 덜 생길 것이다.
주: 알킬화된 E1 (포유동물 세포 배양액에서 생산) 또는 술폰화된 E1-H6 (에이치.폴리모르파에서 생산)의 항원성을, 인간 HCV 만성 보균자로부터 얻은 혈청 패널 및 대조용 혈청("혈액 공여자 혈청") 패널상에서 평가하였다. 이를 위하여 E1을 ELISA 플레이트에 결합시키고 상기 플레이트를 카세인으로 포화시켰다. 인간 혈청을 1/20 희석시켜 부가하고 또 결합된 면역글로불린은 퍼옥시다제로 라벨링된 토끼-항-인간 IgG-Fc 특이적 이차 항체를 이용하여 검출하였다. 결과는 OD값으로 표시한다. 평균치는 시험한 모든 혈청 샘플의 OD값의 평균치이다.
실시예 24
한세눌라-생산된 HCV E1-H6 및 백시니아-감염된 포유동물 세포에서 생산된 HCV E1과 백신처리된 침팬지로부터 얻은 혈청과의 동일한 항원 반응성
HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에 의해 생산된 E1 및 한세눌라에 의해 생산된 E1-H6 (양쪽 모두 알킬화됨)과 백신 처리된 침팬지의 혈청 과의 반응 및 모노클로날항체와의 반응을 비교하였다. 상기 E1 단백질을 ELISA 플레이트에 직접 피복한 다음 카세인을 사용하여 상기 플레이트를 포화시켰다. ELISA 플레이트에 피복된 E1 단백질에 결합하는 항체의 종점 역가를 침팬지 혈청에 대해 및 특정 쥐의 모노클로날 항체에 대해 측정하였으며, 이들 모두는 포유동물 세포에 의해 생산된 E1에 의해 면역화된 동물로부터 얻었다. 종점 역가 측정은 실시예 22에 기재된 바와 같이 실시하였다. 사용한 쥐의 모노클로날 항체는 IGH201 (실시예 25 참조), IGH198 (IGH198 = 23C12, WO96/04385호에 Maertens 등에 의해 기재됨), IGH203 (IGH203 = 15G6, WO96/04385호에서 Maertens 등에 의해 기재됨) 및 IGH202 (IGH202 = 3F3, WO99/50310호에 Maertens 등에 의해 기재됨)이었다.
도 53으로부터 알 수 있듯이, 한세눌라 또는 포유동물 세포에 의해 생산된 E1 단백질과 시험할 때, 7개의 상이한 침팬지의 반응성은 동일하였다. HCV E1에 대한 모노클로날 항체의 반응성 또한 거의 동일하였다. 예방적 백신 연구에는 2개의 침팬지(요란 및 마티)를 이용하였고 또 면역검사(challlenge)시 급성 감염을 일소시킬 수 있었던 반면에 대조용 동물은 감염을 일소시키지 못하였다. 5개의 다른 침팬지(톤, 필, 마셀, 페기, 펨마)를 치료적 백신 연구에 이용하였고, 혈청중의 ALT 및/또는 HCV E1 면역화시 간 생검에서 조직학적 활성 지수에 의해 측정된 바와 같이, 간 손상의 감소를 나타내었다.
이 실험에서 얻은 결과는 사카로마이세스 세레비시아애(Saccharomyces cerevisiae) 및 클루이베로마이세스 락티스(Kluyveromyces lactis)에서 HCV E2 단백질을 발현시켰던 무스틸리와 그 동료(Mustilli, A.C. 등, 1999)의 발견과는 완전히 상이하였다. 그러나, 정제된 효모-생산된 E2는 포유동물 세포에 의해 생산된 HCV E2에 의해 면역화된 침팬지로부터 얻은 혈청을 사용하는 경우 반응성이 더 낮은 반면에, 모노클로날 항체와의 반응성은 효모 생산된 HCV E2에 대해 더 높은 점에서 포유동물 세포(CHO) 세포에 의해 생산된 HCV E2와는 상이하였다.
실시예 25
형광 보조된 탄수화물 전기영동(fluorophore-assisted carbohydrate electrophoresis: FACE)에 의한 HCV E1의 글리코실화 프로필
한세눌라-생산된 HCV E1 및 HCV-재조합 백시니아 바이러스-감염된 포유동물 세포에 의해 생산된 HCV E1의 글리코실화 프로필을 WO99/67285호에서 Depla 등에 의해 기재된 바와 같이 비교하였다. 이것은 형광보조된 탄수화물 전기영동(FACE)에 의해 실시하였다. 포유동물 세포 또는 한세눌라에 의해 생산된 E1s로부터 펩티드-N-글리코시다제(PNGase F)에 의해 올리고당을 방출시키고 ANTS로 라벨링하였다(E1 단백질은 PNGase F 분해전에 요오도아세트아미드에 의해 알킬화시켰다). ANTS-라벨링된 올리고당은 21% 폴리아크릴아미드 겔상에서 PAGE에 의해 15 mA의 전류로 4℃에서 2 내지 3시간 동안 분리하였다. 도 54로부터, 포유동물 세포에 의해 생산된 E1 및 한세눌라에 의해 생산된 E1-H6상의 올리고당은 7 내지 11 단 당류의 중합도를 갖는 올리고말토오스처럼 이동한다고 결론지을 수 있었다. 이것은 한세눌라 발현 시스템은 놀랍게도 초글리코실화되지 않고 또 포유동물 세포에서 생산된 E1 단백질에 부가된 당쇄와 유사한 길이를 갖는 당쇄를 갖는 E1 단백질을 초래한다는 것을 나타낸다.
실시예 26
사카로마이세스(
Saccharomyces
)- 및 한세눌라(
Hansenula
)-생산된 E1s 및 HCV-재조합 백시니아 바이러스 감염된 포유동물 세포에 의해 생산된 E1s로부터 유도된 N-결합된 올리고당의 서열결정화
사카로마이세스(Saccharomyces) 또는 한세눌라(Hansenula) 배양액(실시예 15-16 참조) 또는 HCV-재조합 백시니아 바이러스 (WO96/04385호에서 Maertens 등 참조)에 감염된 RK13 세포의 배양액으로부터 정제되고 PBS, 05% 베타인중에 존재하는 E1s (225 ㎍)를 탈글리코실화 배양 완충액 (50 mM Na2PO4, 0.75% Nonidet P-40)을 사용하여 희석시켜 최종 농도 140 ㎍/mL로 만들었다. 이 용액의 pH를 농축 H3PO4를 사용하여 pH 5.5로 조정하였다. 이 용액에 2U PNGase F (플라보박테륨 메니고셉티쿰(Flavobacterium menigosepticum)의 펩티드-N4-(아세틸-베타-글루코사미닐)-아스파라긴 아미다제; EC 3.5.1.52; 로쉐로부터 구입)를 부가하고 그 샘플을 37℃에서 철야로 배양하였다. 철야 배양후, 용액의 pH는 농축 H3PO4를 사용하여 pH 5.5로 조정하였다. 4부피의 아세톤(-20℃에서)을 부가하는 것에 의해 단백질 및 올 리고당을 석출시키고 또 그 혼합물을 -20℃에서 15분간 배양하였다. 샘플을 4℃에서 13000 rpm으로 5분간 원심분리시켰다. 아세톤 상층액을 제거하고 펠릿은 -20℃에서 1시간 배양한 후 150 μL 빙냉된 60% 메탄올을 부가하였다. 방출된 올리고당을 함유하는 메탄올 상층액을 수집하고 회전 증발기(SpeedVac 제조)에 의해 건조시켰다.
건조된 E1s 글리칸 뿐만 아니라 기준 올리고당 (모두 Glyko 제조, 영국 비세스터 소재; 도 55 참조) Man-9 (11 당단류 단위), Man-8 (10 단당류 단위), Man-7 (9 단당류 단위), Man-6 (8 단당류 단위) 및 Man-5 (7 단당류 단위)를 5 μL의 2-아미노벤즈아미드 (2-AB) 라벨링제(30% HOAc/70% DMSO중의 ±0.35 M 2-AB+ ± 1M NaCNBH3)중에 용해시켜 최종 글리칸 농도 5 내지 100 μM로 만들었다. 상기 글리칸 용액을 65℃에서 2시간 동안 배양하였다. 30분 후, 샘플을 보르텍스에 의해 혼합하였다. 결합시킨 후, 과량의 2-AB를 제거하였다. 샘플을 16-μL 정제수(MilliQ)로 희석시키고 Sephadex G-10 칼럼(직경 1 cm, 높이 1.2 cm, 아머샴 바이오사이언스 제조; VacElut 시스템(바리언)에 결합됨)에 부가한 다음 칼럼을 건조시켰다.
2 x 100 μL 정제수(MilliQ)를 칼럼에 적용함으로써 라벨링된 올리고당을 용출시켰다. 기준 탄수화물(Man-9, Man-8, Man-7 및 Man-6)의 용출액을 건조시키고 HPLC 분석할 때 까지 -70℃에서 저장하였다. E1s 샘플 분만 아니라 Man-9 기준 글리칸의 용출물을 4개의 PCR 튜브에 분포시키고 건조시켰다. 표 8에 약술된 반응을 실시하였으며, 이들 반응 모두는 37℃에서 철야로 진행되며, 다만 튜브 3에서의 반 응은 1시간 후에 종료되었다. 사용된 엑소글리코시다제 효소(모두 Glyko로부터 구입, 영국 비세스터 소재)의 최종 농도는 다음과 같았다: α1-2 만노시다제의 경우(아스페르길루스 사이토이): 2 ml/mL; α-만노시다제 (Jack Bean): 50 U/mL; 및 β-만노시다제 (헬릭스 포마티아(Helix pomatia)): 4 U/mL.
도 56은 치토바이오스에 결합된 10개 만노오스 잔기로 구성된 고급 올리고만노오스를 도시한다. 각 말단 만노오스 잔기는 α1-3 결합에 의해 비-말단 만노오스 잔기에 결합된다. 도 56의 올리고만노오스는 엑소글리코시다제 α1-2 만노시다제에 의해 절단에 완전히 내성이다. 도 56의 올리고만노오스를 엑소글리코시다제 α-만노시다제와 장기간(철야) 배양하면 모든 α-결합(α 1-2, α1-3, α1-6)의 절단을 초래하지만, β-결합은 절단시키지 않는다. 따라서 생성한 올리고당은 4'-β-만노실 치토바이오스일 것이다. 이 4'-β-만노실 치토바이오스 잔기는 엑소글리코시다제 β만노시다제의 작용을 통하여 만노오스 및 치토바이오스로 전환될 수 있다. 공급자(Glyko)의 명세에 따르면, α-만노시다제는 기준 올리고당 Man-6 (도 55.D 참조)을 4'-β-만노실 치토바이오스로 완전히 전환시키고 또 β-만노시다제에 의한 만노오스 및 치토바이오스로 더 전환되는 것은 완전한 것으로 보고되어 있다.
도 57은 치토바이오스에 결합된 9개 만노오스 잔기로 구성된 고급 올리고만노오스를 도시한다. 이 올리고만노오스에서, 1개 말단 만노오스 잔기는 α1-2 결합에 의해 비-말단 만노오스 잔기에 결합된다. 엑소글리코시다제 α1-2 만노시다제의 작용시, 상기 α1-2-결합된 만노오스는 제거될 것이다. 이어 α-만노시다제 및 β-만노시다제를 작용시키면, 도 56의 올리고만노오스에 기재된 바와 같은 반응 생성물을 얻을 것이다. 공급자(Glyko)의 명세에 따르면, α1-2 만노시다제는 기준 올리고당 Man-9 및 Man-6을 Man-5 (도 55 참조)로 >90%의 효율로 전환시킬 수 있다.
도 58은 치토바이오스에 결합된 9게 만노오스 잔기로 구성된 기준의 고급 올리고만노오스 Man-9를 도시한다. 이 올리고만노오스에서, 모든 말단 만노오스 잔기는 α1-2 결합에 의해 비-말단 만노오스 잔기에 결합되어 있다. 엑소글리코시다제 α1-2 만노시다제를 작용시키면, Man-9는 공급자의 명세에 따른 >90%의 효율로 Man-5로 전환될 것이다. 이어 α-만노시다제를 사용하여 분해하면 Man-5를 4'-β-만노실 치오바이오스로 전환할 것이다.
표 8에 나타낸 바와 같이 상이한 반응 튜브의 함량을 원심분리성 진공 증발기 또는 냉동건조기에서 건조시키고 HPLC 분석까지 -70℃에서 저장하였다. 칼럼에 부가하기 전에, 각 샘플(E1s 및 기준용)을 25 μL 물에 용해시켜서 Waters Alliance HPLC 스테이션에 결합된 TSK gel-Amide-80 (0.46 x 25 cm, 토소 바이오셉 제조)상에 로딩시켰다.
올리고당의 분리는 주위온도에서 1.0 mL/분으로 실시하였다. 용매 A는 아세토니트릴중의 0.1% 아세트산으로 구성되며 또 용매 B는 물중의 0.2% 아세트산-0.2% 트리에틸아민으로 구성되었다. 2-AB 라벨링된 올리고당의 분리는 5개 칼럼 부피에 대해 28% B 이소크래틱을 사용한 다음 15개 칼럼 부피에 대해 45% B로 선형적으로 증가시켜 실시하였다.
기준 올리고당 Man-6은 53±1 분간 용출시켰고, Man-7은 59±분간 용출시켰으며, Man-8은 67±2분간, 그리고 Man-9는 70±1분간 용출시켰다; 4'-β-만노실 치토바이오스는 10±1분간 용출시켰고 또 치토바이오스는 6±1분간(도시하지 않음) 용출시켰다. 이것은 엑소글리코시다제없이 철야 배양한 후(도 63의 크로마토그램의 트레이스1; Man-9), α1-2 만노시아제를 사용하여 철야 배양한 후(도 63의 크로마토그램의 트레이스 2); Man-5 및 Man-6의 혼합물), α-만노시다제를 사용하여 1시간 또는 철야 배양한 후 (도 63의 크로마토그램의 트레이스 3 및 4; 4'-β-만노실 치토바이오스) 및 α- 및 β-만노시다제를 사용하여 철야 배양한 후 (도 6의 크로마토그램의 트레이스 5; 치토바이오스), Man-9의 반응 생성물에 대해 예시한 것이다. 도 63의 크로마토그램의 트레이스 6은 공급된 용매 구배를 나타낸다.
엑소글리코시다제없이 사카로마이세스-생산된 E1s(PNGaseF 처리한 후 얻음)의 올리고당의 반응생성물은 주로 59±1분(15%), 67±1분(45%), 70±1분(25%) 및 75±1분(15%)에서 용출되는 주로 4개 탄수화물이었다. 사카로마이세스-생산된 E1s 에서 Man(8)-GlcNAc(2) 및 Man(9)GlcNAc(2)의 전체 함량은 ~65% 이었다. α1-2 만노시다제와의 반응에서는 오직 70±1분의 체류시간을 갖는 탄수화물만이 사라졌다. 75±1분의 체류시간을 갖는 탄수화물의 세기 및 67±1분의 체류시간을 갖는 탄수화물의 세기는 증가하였다. 이것은 모두 말단 만노오스 단위는 α(1-2) 구조를 갖는다는 것을 의미한다. α 만노시다제와 철야 배양한 후 모든 탄수화물 사슬은 4'-β-만노실 치토바이오스로 환원된다. 이것은 탄수화물은 고 만노오스이고 또 1개를 제외한 모든 만노오스 잔기는 α 구조를 갖는다는 것을 의미한다. 상기 4'-β-만노실 치토바이오스 잔기를 치토바이오스로 환원시키는 것은 β-만노시다제를 사용하여 철야 배양한 후 분명하였다. 생성한 크로마토그램을 도 64에 도시하며, 이것은 도 63의 크로마토그램에 기재된 것과 동일한 조건하에서 얻은 것이었다. 결과를 하기 표 9에 수록한다.
백시니아 감염된 세포에 의해 생산된 E1s을 사용하여 동일 실험을 반복하면 놀랍게도 완전히 상이한 그림을 나타내었다. 효소를 사용하지 않은 반응에서, 탄수화물의 복합체 혼합물이 존재하였다(도 65 및 표 9 참조). 단당류(8)-GlcNAc(2) 및 단당류(9)-GlcNAc(2)의 전체 함량은 37% 이었다. α1-2 만노시다제를 사용한 반응후, 체류시간이 70±1분 및 59±1분인 탄수화물은 사라졌다. α 만노시다제를 사용하여 철야 배양한 후, 단당류(6)-GlcNAc(2)의 실제 양은 4'-만노실 치토바이오스 생성물과 함께 유지되었다. 이것은 올리고당 브랜치의 1개는 α만노시다제 분해를 견딘다는 것을 나타낸다. 이것은 N-결합된 올리고당의 Manα(1-2) 말단 브랜치에 결합된 1 또는 2개의 글루코오스 잔기의 존재에 의해 설명될 수 있다. 글루코 오스-함유 올리고당의 임의 구조는 도 62에 도시되어 있다. 글루코오스 함유 올리고당의 가능한 반응 생성물은 표 10에 나타내어져 있다. α1-2 만노시다제 반응후에는 Man-7-등가의 올리고당(즉, 9개 단당류로 구성된 올리고당)은 존재하지 않는 것처럼, 이들 글루코오스 잔기는 도 62에 도시된 올리고당 구조의 B-브랜치에 결합될 것으로 보인다. 그러나, 도 62에 도시된 올리고당의 A- 및 B-브랜치 모두는 글루코오스에 의해 부분적으로 종료되어 있는 것은 배제할 수 없다.
4'-β-만노실 치토바이오스 잔기를 치토바이오스로 환원하는 것은 β만노시다제와의 철야 배양후 분명하였다. 그 결과 얻은 크로마토그램은 도 65에 도시되어 있으며, 이것은 도 63-64의 크로마토그램에 기재된 것과 동일한 조건하에서 얻었다.
얻은 결과를 하기 표 9에 수록한다.
한세눌라-생산된 E1s를 사용하여 동일한 실험을 반복하면 놀랍게도 완전히 상이한 그림을 나타내었다. 효소를 사용하지 않는 반응에서는 주로 체류시간이 67±2분 및 70±1분인 2개의 탄수화물이 존재하며, 각각 Man-8 및 Man-9에 상응한다. 한세눌라-생산된 E1s에서 Man(8)-GlcNAc(2) 및 Man(9)GlcNAc(2)의 전체 함량은 ~90% 이었다. α1-2 만노시다제와 반응한 후, 탄수화물은 주로 체류시간 45±1분의 Man-5 및 체류시간 53±1분인 Man-6으로 환원되었다. α만노시다제와의 철야 배양후, 모든 탄수화물 사슬은 4'-β-만노실 치토바이오스 잔기로 환원되었다. 이것은 탄수화물은 고만노오스형이며 또 1개를 제외한 모든 만노오스 잔기는 α구조를 갖고 있음을 의미한다. 4'-β-만노실 치토바이오스 잔기가 치토바이오스로 환 원하는 것은 β-만노시다제와의 철야 반응후 분명하였다. 그 결과 얻은 크로마토그램을 도 66에 도시하며, 이것은 도 63 내지 65의 크로마토그램에 기재된 것과 동일한 조건하에서 얻은 것이었다.
얻은 결과를 하기 표 9에 수록한다.
주: 사카로마이세스("Sc") 및 한세눌라("Hp")-생산된 E1s 뿐만 아니라 HCV-재조합 백시니아-감염된 포유동물 세포("Vac")에 의해 생산된 E1s로부터 유도된 올리고만노오스를 분해시켜 얻은 올리고만노오스. 크로마토그램 체류시간("Rt", 분) 및 전체 올리고만노오스 함량(전체 줄)에 상대적인 소정 올리고만노오스의 % 뿐만 아니라 도 55-62중의 하나를 기준으로 하여 표시한 각각 관찰된 올리고만노오스의 가장 유망한 구조를 갖는 상이한 올리고만노오스를 나타내었다. 말단 α1-3 만노오스를 갖는 올리고만노오스는 "O"로 표시하였다. 말단 글루코오스를 갖는 올리고 만노오스는 "*"로 표시하였고, 일부 참조용은 "62*로부터"로 표시하였는데, 이것은 이 구조가 도 62에 도시된 구조로부터 유도될 수 있음을 의미한다. "1"은 엑소글리코시다제를 사용하지 않는 "반응"이고, "2"는 α1-2 만노시다제를 사용한 반응이다. 체류시간 45±1분인 올리고만노오스는 치토바이오스에 결합된 5개의 만노오스 잔기를 포함하는 올리고만노오스로 추정된다. 체류시간 75±1분인 올리고만노오스는 치토바이오스에 결합된 10개 만노오스 잔기를 포함하는 올리고만노오스로 추정된다.
실시예 27
재조합 HCV E1에서 N-글리코실화 부위의 점유
점유된 N-글리코실화 부위의 양에 따라서, E1s은 SDS-PAGE 분석에서 상이한 이동특성을 나타낸다. 이러한 특성을 기본으로 하여, E1 생성물중의 점유된 N-글리코실화 부위의 평균 양을 산출할 수 있었다. 지금까지, 정제된 E1-생성물의 샘플을 SDS-PAGE처리시키고 코마씨 브릴리언트 블루 염색(도 67)시킨 다음 ImageMaster 1D 프라임 소프트웨어 패킷(파마시아 제조)을 이용하여 분석하였다. 요컨대, 특정 단백질 밴드에 대해 겔을 스캐닝하고 또 % 점유(상이한 밴드의 전체 세기에 대한 그의 세기, 따라서 모든 밴드의 합은 100%임)를 산출하였다 (표 11). 각 특정 단백질 밴드는 동일한 개수의 점유된 N-글리코실화 부위를 갖는 E1s-분자를 나타낸다.
얻은 결과는 한세눌라-생산된 E1-생성물의 대부분(>90%)은 백시니아 발현 계(WO 96/04385호에서 Maertens 등에 의해 기재됨)로부터 얻은 E1s 보다 N-글리코실화 부위가 1개 이상 더 적다. 백시니아 유도된 E1 생성물에서 모든 N-글리코실화 부위가 점유 (E1의 위치 233-236상의 점유서열 "NNSS"(서열번호: 73)은 1개 글리코실화 부위로 간주됨)되어 있다고 가정하면, 한세눌라-발현된 E1 단백질에서 점유된 N-글리코실화 부위는 전체 가능한 N-글리코실화 부위의 80%를 초과하지 않는다고 결론짓는 것이 안전하다.
주: 한세눌라 폴리모르파(Hansenula polymorpha) 및 백시니아/베로 발현 계로부터 얻은 E1 단백질에서 점유된 N-글리코실화 부위의 평균 개수를 SDS-PAGE 및 쿠마씨 브릴리언트 블루 염색 세기 분석에 의해 산출함. 단백질 밴드는 분자량으로 나타낸다. 도 67 참조.
실시예 28
재조합 HCV E2에서 N-글리코실화 부위의 점유
한세눌라에 의해 생산된 E2-H6 단백질 200 ㎍을 PNGaseF를 사용하여 탈글리코실화시켰다. 탈글리코실화된 E2s-H6을 미니-겔(10 ㎍/레인)상에 로딩시켰다. 단백질 밴드를 트립신 및 endo Asp-N으로 분해시켰다. 생성한 펩티드의 질량은 Maldi-MS(건조된 방울 및 박층법)에 의해 측정하였다. 이 방법은 N-글리코실화 정도를 측정하기 위해 이용될 수 있다: 효소 PNG-ase F를 사용하여 탈글리코실화시키 는 동안, 완전한 당쇄를 절단시키고, 그와 동시에 아스파라긴(N)을 아스파탐산(D)으로 가수분해시킨다. 이들 2개 아미노산 간의 질량 차이는 1 Da이며, 이것은 질량 분광시험에 의해 측정될 수 있다. 부가적으로, N에서 D로 가수분해하는 것은 Asp-N 효소에 대한 새로운 절단부위를 만든다.
E2s에서 가능한 글리코실화 부위는 N417, N423, N430, N448, N478, N532, N540, N556, N576, N623 및 N645 (도 68 참조)이다. Maldi-MS 분석에 의하면, 각 이들 글리코실화 부위의 경우 N-글리코실화가 완전하지 않은데, 이는 PNGaseF를 사용하여 탈글리코실화시킨 후, 펩티드는 글리코실화 부위에 N 또는 D를 갖는(질량 차이 1 Da) 것으로 밝혀졌기 때문이다. N-잔기에 대한 D-잔기의 비율은 한세눌라에 의해 발현되며 분석된 샘플내에 당쇄에 의해 단일 N-글리코실화 부위로 존재하는 모든 E2 단백질에 대한 평균 점유율을 나타낸다. 이들 결과를 하기 표 12 내지 14에 수록한다.
상기 결과로부터, 평균해서 각 글리코실화 부위는 54% 정도 글리코실화됨이 산출되었다.
실시예 29
혈액 공여자 혈청과 사카로마이세스 또는 한세눌라에 의해 생산된 HCV E1의 반응성
사카로마이세스에 의해 생산된 E1s-H6 (α-MF 리더를 갖도록 발현) 및 한세눌라에 의해 생산된 E1s-H6 (CL 리더를 갖도록 발현)을 실시예 15 및 16에 기재된 바와 같이 정제하고 또 마지막으로 실시예 20에 기재된 바와 같이 알킬화처리 및 VLP 형성시켰다. 모든 단백질을 마이크로티터플레이트상에 0.5 ㎍/mL (37℃에서 1시간)으로 직접 흡착시키고 HCV-걸러진 혈청으로 플레이트(PBS-0.1% 카세인, 1시간, 37℃)를 블로킹시킨 후 음성 혈액 공여자를 1/20 (PBS-0.5% 카세인, 10%(w/v) 수크로오스, 0.2% (v/v) 트리톤 X-705, 1시간, 37℃)로 희석시켜 배양하였다. 마지 막으로, 퍼옥시다제에 결합된 이차 토끼 항-인간 IgG-FC 특이적 항혈청(Dako, 덴마크)을 1/50000 (PBS-0.1% 카세인, 1시간, RT)의 희석율로 사용하여 결합을 검출한 다음 발색처리시켰다. 모든 단계 사이에 플레이트를 PBS-0.05% (w/v) 트윈-20을 사용하여 3회 세척하였다. 대조를 위하여, WO99/67285호에서 Depla 등에 의해 기재된 바와 같이 생산되고 정제된 포유동물 세포 유도된 Els에서도 동일한 방식으로 혈청을 분석하였다.
ELISA에 대한 컷오프는 배경치(즉, 스트렙트아비딘이 웰에 흡착된 이외는 동일한 설정에서 모든 혈청의 반응성)의 평균의 2배값으로 설정되었다.
표 15로부터, 많은(75%) 혈청은 사카로마이세스-생산된 E1 에 대하여 컷오프 이상의 반응성을 나타내지만, 한세눌라-생산된 E1에 대해서는 소수의 혈청(6%)만이 컷오프 이상의 반응성을 나타내었다. 이러한 반응성 차이는 실시예 26에서도 분명한 바와 같이 사카로마이세스-생산된 E1상에 있는 α1-2 만노오스에 결합된 말단 α1-3 만노오스의 존재에 기인한 것이었다. Young과 그의 동료들(1998)은 이미 상기 유형의 만노오스는 인간 혈청과 사카로마이세스-유도 만난과의 반응성에 관여한다는 것을 이미 보고하였다. 사카로마이세스 유도 E1에 대한 반응성이 상기 유형의 만노오스 잔기에 기인한 것임을 더 확인하기 위하여, 희석 완충액에 부가된 1 또는 5 mg/mL 만난(시그마 제조)과 예비배양(37℃에서 1시간)된 혈액공여자 혈청을 희석시킴으로써 사카로마이세스-생산된 E1상에서의 ELISA를 반복하였다. 표 16으로부터 판정되듯이, 만난과의 예비배양은 상기 E1과 혈액공여자 혈청과의 반응을 농도 의존적 방식으로 분석된 1개(F556) 혈청에 대해 바탕치까지 감소시켰다. (평균 OD는 5 mg 만난/mL을 사용한 경우 만난에 의한 경쟁없이 0.24로 감소되었다)
참고목록
SEQUENCE LISTING
<110> Innogenetics N.V.
<120> Core-glycosylated HCV envelope proteins
<130> 135 PCT
<160> 98
<170> PatentIn version 3.1
<210> 1
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> avian lysozyme signal peptide
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa is Arg, Lys or Val
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa is Ser, Ala, Val, Arg or Met
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is Leu or Phe
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa is Leu or Ala
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa is Ile, Thr, Phe or Val
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa is Leu, Phe or Ala
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa is Val, Ile, Ala, Leu or Cys
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa is Leu, Phe, Ala or Ile
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa is Cys, Phe, Ser or Leu
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa is Phe, Leu, Ser or Pro
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> Xaa is Leu, Ala or Met
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa is Pro, Ala or Ile
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa is Leu or Ala
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa is Ala, Val, Ser or Met
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa is Ala, Lys or Ser
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa is Leu, Pro, Gln or Ile
<400> 1
Met Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Gly
<210> 2
<211> 135
<212> PRT
<213> hepatitis C virus
<400> 2
Tyr Glu Val Arg Asn Val Ser Gly Met Tyr His Val Thr Asn Asp Cys
1 5 10 15
Ser Asn Ser Ser Ile Val Tyr Glu Ala Ala Asp Met Ile Met His Thr
20 25 30
Pro Gly Cys Val Pro Cys Val Arg Glu Asn Asn Ser Ser Arg Cys Trp
35 40 45
Val Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr
50 55 60
Thr Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Phe
65 70 75 80
Cys Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val
85 90 95
Ser Gln Leu Phe Thr Ile Ser Pro Arg Arg His Glu Thr Val Gln Asp
100 105 110
Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala
115 120 125
Trp Asp Met Met Met Asn Trp
130 135
<210> 3
<211> 290
<212> PRT
<213> hepatitis C virus
<400> 3
His Thr Arg Val Ser Gly Gly Ala Ala Ala Ser Asp Thr Arg Gly Leu
1 5 10 15
Val Ser Leu Phe Ser Pro Gly Ser Ala Gln Lys Ile Gln Leu Val Asn
20 25 30
Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp
35 40 45
Ser Leu Gln Thr Gly Phe Phe Ala Ala Leu Phe Tyr Lys His Lys Phe
50 55 60
Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Ser Ile Asp
65 70 75 80
Lys Phe Ala Gln Gly Trp Gly Pro Leu Thr Tyr Thr Glu Pro Asn Ser
85 90 95
Ser Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala Pro Arg Pro Cys Gly
100 105 110
Ile Val Pro Ala Ser Gln Val Cys Gly Pro Val Tyr Cys Phe Thr Pro
115 120 125
Ser Pro Val Val Val Gly Thr Thr Asp Arg Phe Gly Val Pro Thr Tyr
130 135 140
Asn Trp Gly Ala Asn Asp Ser Asp Val Leu Ile Leu Asn Asn Thr Arg
145 150 155 160
Pro Pro Arg Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Gly Thr Gly
165 170 175
Phe Thr Lys Thr Cys Gly Gly Pro Pro Cys Asn Ile Gly Gly Ala Gly
180 185 190
Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu
195 200 205
Ala Thr Tyr Ala Arg Cys Gly Ser Gly Pro Trp Leu Thr Pro Arg Cys
210 215 220
Met Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn
225 230 235 240
Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg
245 250 255
Phe Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu
260 265 270
Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu
275 280 285
Trp Gln
290
<210> 4
<211> 141
<212> PRT
<213> hepatitis C virus
<400> 4
Tyr Glu Val Arg Asn Val Ser Gly Met Tyr His Val Thr Asn Asp Cys
1 5 10 15
Ser Asn Ser Ser Ile Val Tyr Glu Ala Ala Asp Met Ile Met His Thr
20 25 30
Pro Gly Cys Val Pro Cys Val Arg Glu Asn Asn Ser Ser Arg Cys Trp
35 40 45
Val Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr
50 55 60
Thr Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Phe
65 70 75 80
Cys Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val
85 90 95
Ser Gln Leu Phe Thr Ile Ser Pro Arg Arg His Glu Thr Val Gln Asp
100 105 110
Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala
115 120 125
Trp Asp Met Met Met Asn Trp His His His His His His
130 135 140
<210> 5
<211> 301
<212> PRT
<213> hepatitis C virus
<400> 5
His Thr Arg Val Ser Gly Gly Ala Ala Ala Ser Asp Thr Arg Gly Leu
1 5 10 15
Val Ser Leu Phe Ser Pro Gly Ser Ala Gln Lys Ile Gln Leu Val Asn
20 25 30
Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp
35 40 45
Ser Leu Gln Thr Gly Phe Phe Ala Ala Leu Phe Tyr Lys His Lys Phe
50 55 60
Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Ser Ile Asp
65 70 75 80
Lys Phe Ala Gln Gly Trp Gly Pro Leu Thr Tyr Thr Glu Pro Asn Ser
85 90 95
Ser Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala Pro Arg Pro Cys Gly
100 105 110
Ile Val Pro Ala Ser Gln Val Cys Gly Pro Val Tyr Cys Phe Thr Pro
115 120 125
Ser Pro Val Val Val Gly Thr Thr Asp Arg Phe Gly Val Pro Thr Tyr
130 135 140
Asn Trp Gly Ala Asn Asp Ser Asp Val Leu Ile Leu Asn Asn Thr Arg
145 150 155 160
Pro Pro Arg Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Gly Thr Gly
165 170 175
Phe Thr Lys Thr Cys Gly Gly Pro Pro Cys Asn Ile Gly Gly Ala Gly
180 185 190
Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu
195 200 205
Ala Thr Tyr Ala Arg Cys Gly Ser Gly Pro Trp Leu Thr Pro Arg Cys
210 215 220
Met Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn
225 230 235 240
Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg
245 250 255
Phe Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu
260 265 270
Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu
275 280 285
Trp Gln Val Ile Glu Gly Arg His His His His His His
290 295 300
<210> 6
<211> 3448
<212> DNA
<213> Artificial sequence
<220>
<223> vector pGEMTE1sH6
<400> 6
aatcactagt gcggccgcct gcaggtcgac catatgggag agctcccaac gcgttggatg 60
catagcttga gtattctata gtgtcaccta aatagcttgg cgtaatcatg gtcatagctg 120
tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata 180
aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca 240
ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc 300
gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg 360
cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 420
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 480
aggaaccgta aaaaggccgc gttgctggcg tttttcgata ggctccgccc ccctgacgag 540
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 600
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 660
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 720
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 780
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 840
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 900
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 960
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 1020
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 1080
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 1140
tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 1200
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 1260
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 1320
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 1380
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 1440
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 1500
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 1560
agtttgcgca acgttgttgg cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt 1620
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 1680
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 1740
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 1800
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata ccgcgcccgg 1860
cgaccgagtt gctcttgccc ggcgtcaata cgggataata gtgtatgaca tagcagaact 1920
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 1980
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 2040
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 2100
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 2160
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa 2220
caaatagggg ttccgcgcac atttccccga aaagtgccac ctgtatgcgg tgtgaaatac 2280
cgcacagatg cgtaaggaga aaataccgca tcaggcgaaa ttgtaaacgt taatattttg 2340
ttaaaattcg cgttaaatat ttgttaaatc agctcatttt ttaaccaata ggccgaaatc 2400
ggcaaaatcc cttataaatc aaaagaatag accgagatag ggttgagtgt tgttccagtt 2460
tggaacaaga gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc 2520
tatcagggcg atggcccact acgtgaacca tcacccaaat caagtttttt gcggtcgagg 2580
tgccgtaaag ctctaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga 2640
aagccggcga acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctagggcg 2700
ctggcaagtg tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg 2760
ctacagggcg cgtccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc 2820
gggcctcttc gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt 2880
gggtaacgcc agggttttcc cagtcacgac gttgtaaaac gacggccagt gaattgtaat 2940
acgactcact atagggcgaa ttgggcccga cgtcgcatgc tcccggccgc catggccgcg 3000
ggattccaat gcatatgagg tgcgcaacgt gtccgggatg taccatgtca cgaacgactg 3060
ctccaactca agcattgtgt atgaggcagc ggacatgatc atgcacaccc ccgggtgcgt 3120
gccctgcgtt cgggagaaca actcttcccg ctgctgggta gcgctcaccc ccacgctcgc 3180
agctaggaac gccagcgtcc ccactacgac aatacgacgc cacgtcgatt tgctcgttgg 3240
ggcggctgct ttctgttccg ctatgtacgt gggggatctc tgcggatctg tcttcctcgt 3300
ctcccagctg ttcaccatct cgcctcgccg gcatgagacg gtgcaggact gcaattgctc 3360
aatctatccc ggccacataa caggtcaccg tatggcttgg gatatgatga tgaactggca 3420
ccaccaccat caccattaag gatccaag 3448
<210> 7
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 7
agttactctt caaggtatga ggtgcgcaac gtgtccg 37
<210> 8
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 8
agttactctt cacagggatc ctccttaatg gtgatggtgg tggtgcc 47
<210> 9
<211> 3067
<212> DNA
<213> Artificial sequence
<220>
<223> vector pCHH-Hir
<400> 9
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagcttgc 240
atgcctgcag gtcgacccta gatctctatt actgcaggta ttcttccggg atttcttcga 300
agtcgccgtc gttgtgagac tgcggacgcg gggtaccttc gccagtaacg cactggttac 360
gttcgccttt agagcccagg atgcatttgt tgccctggcc gcaaacgtta gagccttcgc 420
acaggcacag gttctgaccg gattcagtgc agtcagtgta aacaaccctc ttttccaacg 480
ggtgtgtagt tccattctcc accgctaggg ctgcgctggg ctccattggc gaggttttca 540
aggccgctag gatgcgatcc atgcgtccgt agccttgcgt ggagcgtgcg tgtgcgtgcg 600
ggagtgcgca taggtaggct acggtgatga ttgctagcat ggcgggaata gttttgctat 660
acatgaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc 720
aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc 780
gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt 840
attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa 900
tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc 960
cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga 1020
gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg 1080
tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg 1140
gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa 1200
atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga 1260
agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc 1320
ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg 1380
gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc 1440
gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat 1500
tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg 1560
acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag 1620
aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa 1680
cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc 1740
gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca 1800
cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc 1860
tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc 1920
tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg 1980
ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta 2040
tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag 2100
gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga 2160
ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc 2220
tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa 2280
agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa 2340
aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc 2400
cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt 2460
agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc 2520
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac 2580
gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca 2640
gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg 2700
ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag 2760
gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt 2820
ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat 2880
ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc 2940
acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt 3000
gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag 3060
cggaaga 3067
<210> 10
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 10
agttactctt cacctctttt ccaacgggtg tgtag 35
<210> 11
<211> 34
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 11
agtcactctt cactgcaggc atgcaagctt ggcg 34
<210> 12
<211> 6973
<212> DNA
<213> Artificial sequence
<220>
<223> vector pFPMT121
<400> 12
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgaattcccg 360
atgaagcaga gagcgcagga ggcggtattt atagtgccat tcccctctct gagagacccg 420
gatggtagtc gagtgtatcg gagacagctt gatgtagact ccgtgcctgc cggctcctct 480
tattggcgga caccagtgag acaccccgga acttgctgtt tttctgcaaa atccggggtg 540
accagtggga gcctatttgc acacacgagc gggacacccc actctggtga agagtgccaa 600
agtcattctt tttcccgttg cggggcagcc gattgcatgt tttaggaaaa tattaccttt 660
gctacaccct gtcagattta ccctccacac atatatattc cgtcacctcc agggactatt 720
attcgtcgtt gcgccgccag cggaagatat ccagaagctg ttttccgaga gactcggttg 780
gcgcctggta tatttgatgg atgtcgcgct gcctcacgtc ccggtaccca ggaacgcggt 840
gggatctcgg gcccatcgaa gactgtgctc cagactgctc gcccagcagg tgtttcttga 900
tcgccgcctc taaattgtcc gcgcatcgcc ggtaacattt ttccagctcg gagtttgcgt 960
ttagatacag tttctgcgat gccaaaggag cctgcagatt ataacctcgg atgctgtcat 1020
tcagcgcttt taatttgacc tccagatagt tgctgtattt ctgttcccat tggctgctgc 1080
gcagcttcgt ataactcgag ttattgttgc gctctgcctc ggcgtactgg ctcatgatct 1140
ggatcttgtc cgtgtcgctt ttcttcgagt gtttctcgca aacgatgtgc acggcctgca 1200
gtgtccaatc ggagtcgagc tggcgccgaa actggcggat ctgagcctcc acactgccct 1260
gtttctctat ccacggcgga accgcctcct gccgtttcag aatgttgttc aagtggtact 1320
ctgtgcggtc aatgaaggcg ttattgccgg tgaaatcttt gggaagcggt tttcctcggg 1380
gaagattacg aaattccccg cgtcgttgcg cttcctggat ctcgaggaga tcgttctccg 1440
cgtcgaggag atcgttctcc gcgtcgacac cattccttgc ggcggcggtg ctcaacggcc 1500
tcaacctact actgggctgc ttcctaatgc aggagtcgca taagggagag cgtcgacaaa 1560
cccgcgtttg agaacttgct caagcttctg gtaaacgttg tagtactctg aaacaaggcc 1620
ctagcactct gatctgtttc tcttgggtag cggtgagtgg tttattggag ttcactggtt 1680
tcagcacatc tgtcatctag acaatattgt tactaaattt ttttgaacta caattgttcg 1740
taattcatct attattatac atcctcgtca gcaatttctg gcagacggag tttactaacg 1800
tcttgagtat gaggccgaga atccagctct gtggccatac tcagtcttga cagcctgctg 1860
atgtggctgc gttcaacgca ataagcgtgt cctccgactc cgagttgtgc tcgttatcgt 1920
cgttctcatc ctcggaaaaa tcacacgaaa gaacatactc accagtaggc tttctggtcc 1980
ctggggcacg gctgtttctg acgtattccg gcgttgataa tagctcgaaa gtgaacgccg 2040
agtcgcggga gtcgaccgat gcccttgaga gccttcaacc cagtcagctc cttccggtgg 2100
gcgcggggca tgactatcgt cgccgcactt atgactgtct tctttatcat gcaactcgta 2160
ggacaggtgc cggcagcgct ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg 2220
acgatgatcg gcctgtcgct tgcggtattc ggaatcttgc acgccctcgc tcaagccttc 2280
gtcactggtc ccgccaccaa acgtttcggc gagaagcagg ccattatcgc cggcatggcg 2340
gccgacgcgc tgggctacgt cttgctggcg ttcgcgacgc gaggctggat ggccttcccc 2400
attatgattc ttctcgcttc cggcggcatc gggatgcccg cgttgcaggc catgctgtcc 2460
aggcaggtag atgacgacca tcagggacag cttcaaggat cgctcgcggc tcttaccagc 2520
ctaacttcga tcactggacc gctgatcgtc acggcgattt atgccgcctc ggcgagcaca 2580
tggaacgggt tggcatggat tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg 2640
cgtcgcggtg catggagccg ggccacctcg acctgaatgg aagccggcgg cacctcgcta 2700
acggattcac cactccaaga attggagcca atcaattctt gcggagaact gtgaatgcgc 2760
aaaccaaccc ttggcagaac atatccatcg cgtccgccat ctccagcagc cgcacgcggc 2820
gcatcggggg gggggggggg gggggggggc aaacaattca tcattttttt tttattcttt 2880
tttttgattt cggtttcttt gaaatttttt tgattcggta atctccgaac agaaggaaga 2940
acgaaggaag gagcacagac ttagattggt atatatacgc atatgtagtg ttgaagaaac 3000
atgaaattgc ccagtattct taacccaact gcacagaaca aaaacctgca ggaaacgaag 3060
ataaatcatg tcgaaagcta catataagga acgtgctgct actcatccta gtcctgttgc 3120
tgccaagcta tttaatatca tgcacgaaaa gcaaacaaac ttgtgtgctt cattggatgt 3180
tcgtaccacc aaggaattac tggagttagt tgaagcatta ggtcccaaaa tttgtttact 3240
aaaaacacat gtggatatct tgactgattt ttccatggag ggcacagtta agccgctaaa 3300
ggcattatcc gccaagtaca attttttact cttcgaagac agaaaatttg ctgacattgg 3360
taatacagtc aaattgcagt actctgcggg tgtatacaga atagcagaat gggcagacat 3420
tacgaatgca cacggtgtgg tgggcccagg tattgttagc ggtttgaagc aggcggcaga 3480
agaagtaaca aaggaaccta gaggcctttt gatgttagca gaattgtcat gcaagggctc 3540
cctatctact ggagaatata ctaagggtac tgttgacatt gcgaagagcg acaaagattt 3600
tgttatcggc tttattgctc aaagagacat gggtggaaga gatgaaggtt acgattggtt 3660
gattatgaca cccggtgtgg gtttagatga caagggagac gcattgggtc aacagtatag 3720
aaccgtggat gatgtggtct ctacaggatc tgacattatt attgttggaa gaggactatt 3780
tgcaaaggga agggatgcta aggtagaggg tgaacgttac agaaaagcag gctgggaagc 3840
atatttgaga agatgcggcc agcaaaacta aaaaactgta ttataagtaa atgcatgtat 3900
actaaactca caaattagag cttcaattta attatatcag ttattacccg ggaatctcgg 3960
tcgtaatgat ttttataatg acgaaaaaaa aaaaattgga aagaaaagcc cccccccccc 4020
cccccccccc cccccccccc ccgcagcgtt gggtcctggc cacgggtgcg catgatcgtg 4080
ctcctgtcgt tgaggacccg gctaggctgg cggggttgcc ttactggtta gcagaatgaa 4140
tcaccgatac gcgagcgaac gtgaagcgac tgctgctgca aaacgtctgc gacctgagca 4200
acaacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc tggaaacgcg gaagtcagcg 4260
ccctgcacca ttatgttccg gatctgcatc gcaggatgct gctggctacc ctgtggaaca 4320
cctacatctg tattaacgaa gcgctggcat tgaccctgag tgatttttct ctggtcccgc 4380
cgcatccata ccgccagttg tttaccctca caacgttcca gtaaccgggc atgttcatca 4440
tcagtaaccc gtatcgtgag catcctctct cgtttcatcg gtatcattac ccccatgaac 4500
agaaattccc ccttacacgg aggcatcaag tgaccaaaca ggaaaaaacc gcccttaaca 4560
tggcccgctt tatcagaagc cagacattaa cgcttctgga gaaactcaac gagctggacg 4620
cggatgaaca ggcagacatc tgtgaatcgc ttcacgacca cgctgatgag ctttaccgca 4680
gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga 4740
cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag 4800
cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt 4860
atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg 4920
tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc 4980
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 5040
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 5100
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 5160
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 5220
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 5280
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 5340
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 5400
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 5460
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 5520
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 5580
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 5640
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 5700
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 5760
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 5820
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 5880
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 5940
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 6000
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 6060
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 6120
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 6180
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc 6240
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 6300
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 6360
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 6420
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 6480
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc 6540
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 6600
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 6660
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 6720
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 6780
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 6840
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 6900
cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 6960
ctttcgtctt caa 6973
<210> 13
<211> 7591
<212> DNA
<213> Artificial sequence
<220>
<223> vector pFPMT-CHH-E1H6
<400> 13
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttaat ggtgatggtg 360
gtggtgccag ttcatcatca tatcccaagc catacggtga cctgttatgt ggccgggata 420
gattgagcaa ttgcagtcct gcaccgtctc atgccggcga ggcgagatgg tgaacagctg 480
ggagacgagg aagacagatc cgcagagatc ccccacgtac atagcggaac agaaagcagc 540
cgccccaacc agcaaatcga cgtggcgtcg tattgtcgta gtggggacgc tggcgttcct 600
agctgcgagc gtgggggtga gcgctaccca gcagcgggaa gagttgttct cccgaacgca 660
gggcacgcac ccgggggtgt gcatgatcat gtccgctgcc tcatacacaa tgcttgagtt 720
ggagcagtcg ttcgtgacat ggtacatccc ggacacgttg cgcacctcat acctcttttc 780
caacgggtgt gtagttccat tctccaccgc tagggctgcg ctgggctcca ttggcgaggt 840
tttcaaggcc gctaggatgc gatccatgcg tccgtagcct tgcgtggagc gtgcgtgtgc 900
gtgcgggagt gcgcataggt aggctacggt gatgattgct agcatggcgg gaatagtttt 960
gctatacatg aattcccgat gaagcagaga gcgcaggagg cggtatttat agtgccattc 1020
ccctctctga gagacccgga tggtagtcga gtgtatcgga gacagcttga tgtagactcc 1080
gtgcctgccg gctcctctta ttggcggaca ccagtgagac accccggaac ttgctgtttt 1140
tctgcaaaat ccggggtgac cagtgggagc ctatttgcac acacgagcgg gacaccccac 1200
tctggtgaag agtgccaaag tcattctttt tcccgttgcg gggcagccga ttgcatgttt 1260
taggaaaata ttacctttgc tacaccctgt cagatttacc ctccacacat atatattccg 1320
tcacctccag ggactattat tcgtcgttgc gccgccagcg gaagatatcc agaagctgtt 1380
ttccgagaga ctcggttggc gcctggtata tttgatggat gtcgcgctgc ctcacgtccc 1440
ggtacccagg aacgcggtgg gatctcgggc ccatcgaaga ctgtgctcca gactgctcgc 1500
ccagcaggtg tttcttgatc gccgcctcta aattgtccgc gcatcgccgg taacattttt 1560
ccagctcgga gtttgcgttt agatacagtt tctgcgatgc caaaggagcc tgcagattat 1620
aacctcggat gctgtcattc agcgctttta atttgacctc cagatagttg ctgtatttct 1680
gttcccattg gctgctgcgc agcttcgtat aactcgagtt attgttgcgc tctgcctcgg 1740
cgtactggct catgatctgg atcttgtccg tgtcgctttt cttcgagtgt ttctcgcaaa 1800
cgatgtgcac ggcctgcagt gtccaatcgg agtcgagctg gcgccgaaac tggcggatct 1860
gagcctccac actgccctgt ttctctatcc acggcggaac cgcctcctgc cgtttcagaa 1920
tgttgttcaa gtggtactct gtgcggtcaa tgaaggcgtt attgccggtg aaatctttgg 1980
gaagcggttt tcctcgggga agattacgaa attccccgcg tcgttgcgct tcctggatct 2040
cgaggagatc gttctccgcg tcgaggagat cgttctccgc gtcgacacca ttccttgcgg 2100
cggcggtgct caacggcctc aacctactac tgggctgctt cctaatgcag gagtcgcata 2160
agggagagcg tcgacaaacc cgcgtttgag aacttgctca agcttctggt aaacgttgta 2220
gtactctgaa acaaggccct agcactctga tctgtttctc ttgggtagcg gtgagtggtt 2280
tattggagtt cactggtttc agcacatctg tcatctagac aatattgtta ctaaattttt 2340
ttgaactaca attgttcgta attcatctat tattatacat cctcgtcagc aatttctggc 2400
agacggagtt tactaacgtc ttgagtatga ggccgagaat ccagctctgt ggccatactc 2460
agtcttgaca gcctgctgat gtggctgcgt tcaacgcaat aagcgtgtcc tccgactccg 2520
agttgtgctc gttatcgtcg ttctcatcct cggaaaaatc acacgaaaga acatactcac 2580
cagtaggctt tctggtccct ggggcacggc tgtttctgac gtattccggc gttgataata 2640
gctcgaaagt gaacgccgag tcgcgggagt cgaccgatgc ccttgagagc cttcaaccca 2700
gtcagctcct tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc 2760
tttatcatgc aactcgtagg acaggtgccg gcagcgctct gggtcatttt cggcgaggac 2820
cgctttcgct ggagcgcgac gatgatcggc ctgtcgcttg cggtattcgg aatcttgcac 2880
gccctcgctc aagccttcgt cactggtccc gccaccaaac gtttcggcga gaagcaggcc 2940
attatcgccg gcatggcggc cgacgcgctg ggctacgtct tgctggcgtt cgcgacgcga 3000
ggctggatgg ccttccccat tatgattctt ctcgcttccg gcggcatcgg gatgcccgcg 3060
ttgcaggcca tgctgtccag gcaggtagat gacgaccatc agggacagct tcaaggatcg 3120
ctcgcggctc ttaccagcct aacttcgatc actggaccgc tgatcgtcac ggcgatttat 3180
gccgcctcgg cgagcacatg gaacgggttg gcatggattg taggcgccgc cctatacctt 3240
gtctgcctcc ccgcgttgcg tcgcggtgca tggagccggg ccacctcgac ctgaatggaa 3300
gccggcggca cctcgctaac ggattcacca ctccaagaat tggagccaat caattcttgc 3360
ggagaactgt gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct 3420
ccagcagccg cacgcggcgc atcggggggg gggggggggg gggggggcaa acaattcatc 3480
attttttttt tattcttttt tttgatttcg gtttctttga aatttttttg attcggtaat 3540
ctccgaacag aaggaagaac gaaggaagga gcacagactt agattggtat atatacgcat 3600
atgtagtgtt gaagaaacat gaaattgccc agtattctta acccaactgc acagaacaaa 3660
aacctgcagg aaacgaagat aaatcatgtc gaaagctaca tataaggaac gtgctgctac 3720
tcatcctagt cctgttgctg ccaagctatt taatatcatg cacgaaaagc aaacaaactt 3780
gtgtgcttca ttggatgttc gtaccaccaa ggaattactg gagttagttg aagcattagg 3840
tcccaaaatt tgtttactaa aaacacatgt ggatatcttg actgattttt ccatggaggg 3900
cacagttaag ccgctaaagg cattatccgc caagtacaat tttttactct tcgaagacag 3960
aaaatttgct gacattggta atacagtcaa attgcagtac tctgcgggtg tatacagaat 4020
agcagaatgg gcagacatta cgaatgcaca cggtgtggtg ggcccaggta ttgttagcgg 4080
tttgaagcag gcggcagaag aagtaacaaa ggaacctaga ggccttttga tgttagcaga 4140
attgtcatgc aagggctccc tatctactgg agaatatact aagggtactg ttgacattgc 4200
gaagagcgac aaagattttg ttatcggctt tattgctcaa agagacatgg gtggaagaga 4260
tgaaggttac gattggttga ttatgacacc cggtgtgggt ttagatgaca agggagacgc 4320
attgggtcaa cagtatagaa ccgtggatga tgtggtctct acaggatctg acattattat 4380
tgttggaaga ggactatttg caaagggaag ggatgctaag gtagagggtg aacgttacag 4440
aaaagcaggc tgggaagcat atttgagaag atgcggccag caaaactaaa aaactgtatt 4500
ataagtaaat gcatgtatac taaactcaca aattagagct tcaatttaat tatatcagtt 4560
attacccggg aatctcggtc gtaatgattt ttataatgac gaaaaaaaaa aaattggaaa 4620
gaaaagcccc cccccccccc cccccccccc cccccccccc gcagcgttgg gtcctggcca 4680
cgggtgcgca tgatcgtgct cctgtcgttg aggacccggc taggctggcg gggttgcctt 4740
actggttagc agaatgaatc accgatacgc gagcgaacgt gaagcgactg ctgctgcaaa 4800
acgtctgcga cctgagcaac aacatgaatg gtcttcggtt tccgtgtttc gtaaagtctg 4860
gaaacgcgga agtcagcgcc ctgcaccatt atgttccgga tctgcatcgc aggatgctgc 4920
tggctaccct gtggaacacc tacatctgta ttaacgaagc gctggcattg accctgagtg 4980
atttttctct ggtcccgccg catccatacc gccagttgtt taccctcaca acgttccagt 5040
aaccgggcat gttcatcatc agtaacccgt atcgtgagca tcctctctcg tttcatcggt 5100
atcattaccc ccatgaacag aaattccccc ttacacggag gcatcaagtg accaaacagg 5160
aaaaaaccgc ccttaacatg gcccgcttta tcagaagcca gacattaacg cttctggaga 5220
aactcaacga gctggacgcg gatgaacagg cagacatctg tgaatcgctt cacgaccacg 5280
ctgatgagct ttaccgcagc tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac 5340
acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg agcagacaag 5400
cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac 5460
gtagcgatag cggagtgtat actggcttaa ctatgcggca tcagagcaga ttgtactgag 5520
agtgcaccat atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag 5580
gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 5640
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 5700
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 5760
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 5820
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 5880
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 5940
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 6000
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 6060
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 6120
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 6180
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 6240
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 6300
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 6360
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 6420
tttggtcatg agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag 6480
ttttaaatca atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat 6540
cagtgaggca cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc 6600
cgtcgtgtag ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat 6660
accgcgagac ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag 6720
ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg 6780
ccgggaagct agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc 6840
tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca 6900
acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg 6960
tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc 7020
actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta 7080
ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc 7140
aacacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg 7200
ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc 7260
cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc 7320
aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat 7380
actcatactc ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag 7440
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 7500
ccgaaaagtg ccacctgacg tctaagaaac cattattatc atgacattaa cctataaaaa 7560
taggcgtatc acgaggccct ttcgtcttca a 7591
<210> 14
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 14
aggggtaagc ttggataaaa ggtatgaggt gcgcaacgtg tccgggatgt 50
<210> 15
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 15
agttacggat ccttaatggt gatggtggtg gtgccagttc at 42
<210> 16
<211> 7648
<212> DNA
<213> Artificial sequence
<220>
<223> vector pFPMT-Mfalfa-E1-H6
<400> 16
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttaat ggtgatggtg 360
gtggtgccag ttcatcatca tatcccaagc catacggtga cctgttatgt ggccgggata 420
gattgagcaa ttgcagtcct gcaccgtctc atgccggcga ggcgagatgg tgaacagctg 480
ggagacgagg aagacagatc cgcagagatc ccccacgtac atagcggaac agaaagcagc 540
cgccccaacg agcaaatcga cgtggcgtcg tattgtcgta gtggggacgc tggcgttcct 600
agctgcgagc gtgggggtga gcgctaccca gcagcgggaa gagttgttct cccgaacgca 660
gggcacgcac ccgggggtgt gcatgatcat gtccgctgcc tcatacacaa tgcttgagtt 720
ggagcagtcg ttcgtgacat ggtacatccc ggacacgttg cgcacctcat accttttatc 780
caagcttacc ccttcttctt tagcagcaat gctggcaata gtagtattta taaacaataa 840
cccgttattt gtgctgttgg aaaatggcaa aacagcaaca tcgaaatccc cttctaaatc 900
tgagtaaccg atgacagctt cagccggaat ttgtgccgtt tcatcttctg ttgtagtgtt 960
gactggagca gctaatgcgg aggatgctgc gaataaaact gcagtaaaaa ttgaaggaaa 1020
tctcatgaat tcccgatgaa gcagagagcg caggaggcgg tatttatagt gccattcccc 1080
tctctgagag acccggatgg tagtcgagtg tatcggagac agcttgatgt agactccgtg 1140
cctgccggct cctcttattg gcggacacca gtgagacacc ccggaacttg ctgtttttct 1200
gcaaaatccg gggtgaccag tgggagccta tttgcacaca cgagcgggac accccactct 1260
ggtgaagagt gccaaagtca ttctttttcc cgttgcgggg cagccgattg catgttttag 1320
gaaaatatta cctttgctac accctgtcag atttaccctc cacacatata tattccgtca 1380
cctccaggga ctattattcg tcgttgcgcc gccagcggaa gatatccaga agctgttttc 1440
cgagagactc ggttggcgcc tggtatattt gatggatgtc gcgctgcctc acgtcccggt 1500
acccaggaac gcggtgggat ctcgggccca tcgaagactg tgctccagac tgctcgccca 1560
gcaggtgttt cttgatcgcc gcctctaaat tgtccgcgca tcgccggtaa catttttcca 1620
gctcggagtt tgcgtttaga tacagtttct gcgatgccaa aggagcctgc agattataac 1680
ctcggatgct gtcattcagc gcttttaatt tgacctccag atagttgctg tatttctgtt 1740
cccattggct gctgcgcagc ttcgtataac tcgagttatt gttgcgctct gcctcggcgt 1800
actggctcat gatctggatc ttgtccgtgt cgcttttctt cgagtgtttc tcgcaaacga 1860
tgtgcacggc ctgcagtgtc caatcggagt cgagctggcg ccgaaactgg cggatctgag 1920
cctccacact gccctgtttc tctatccacg gcggaaccgc ctcctgccgt ttcagaatgt 1980
tgttcaagtg gtactctgtg cggtcaatga aggcgttatt gccggtgaaa tctttgggaa 2040
gcggttttcc tcggggaaga ttacgaaatt ccccgcgtcg ttgcgcttcc tggatctcga 2100
ggagatcgtt ctccgcgtcg aggagatcgt tctccgcgtc gacaccattc cttgcggcgg 2160
cggtgctcaa cggcctcaac ctactactgg gctgcttcct aatgcaggag tcgcataagg 2220
gagagcgtcg acaaacccgc gtttgagaac ttgctcaagc ttctggtaaa cgttgtagta 2280
ctctgaaaca aggccctagc actctgatct gtttctcttg ggtagcggtg agtggtttat 2340
tggagttcac tggtttcagc acatctgtca tctagacaat attgttacta aatttttttg 2400
aactacaatt gttcgtaatt catctattat tatacatcct cgtcagcaat ttctggcaga 2460
cggagtttac taacgtcttg agtatgaggc cgagaatcca gctctgtggc catactcagt 2520
cttgacagcc tgctgatgtg gctgcgttca acgcaataag cgtgtcctcc gactccgagt 2580
tgtgctcgtt atcgtcgttc tcatcctcgg aaaaatcaca cgaaagaaca tactcaccag 2640
taggctttct ggtccctggg gcacggctgt ttctgacgta ttccggcgtt gataatagct 2700
cgaaagtgaa cgccgagtcg cgggagtcga ccgatgccct tgagagcctt caacccagtc 2760
agctccttcc ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt 2820
atcatgcaac tcgtaggaca ggtgccggca gcgctctggg tcattttcgg cgaggaccgc 2880
tttcgctgga gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat cttgcacgcc 2940
ctcgctcaag ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa gcaggccatt 3000
atcgccggca tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc gacgcgaggc 3060
tggatggcct tccccattat gattcttctc gcttccggcg gcatcgggat gcccgcgttg 3120
caggccatgc tgtccaggca ggtagatgac gaccatcagg gacagcttca aggatcgctc 3180
gcggctctta ccagcctaac ttcgatcact ggaccgctga tcgtcacggc gatttatgcc 3240
gcctcggcga gcacatggaa cgggttggca tggattgtag gcgccgccct ataccttgtc 3300
tgcctccccg cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg aatggaagcc 3360
ggcggcacct cgctaacgga ttcaccactc caagaattgg agccaatcaa ttcttgcgga 3420
gaactgtgaa tgcgcaaacc aacccttggc agaacatatc catcgcgtcc gccatctcca 3480
gcagccgcac gcggcgcatc gggggggggg gggggggggg ggggcaaaca attcatcatt 3540
ttttttttat tctttttttt gatttcggtt tctttgaaat ttttttgatt cggtaatctc 3600
cgaacagaag gaagaacgaa ggaaggagca cagacttaga ttggtatata tacgcatatg 3660
tagtgttgaa gaaacatgaa attgcccagt attcttaacc caactgcaca gaacaaaaac 3720
ctgcaggaaa cgaagataaa tcatgtcgaa agctacatat aaggaacgtg ctgctactca 3780
tcctagtcct gttgctgcca agctatttaa tatcatgcac gaaaagcaaa caaacttgtg 3840
tgcttcattg gatgttcgta ccaccaagga attactggag ttagttgaag cattaggtcc 3900
caaaatttgt ttactaaaaa cacatgtgga tatcttgact gatttttcca tggagggcac 3960
agttaagccg ctaaaggcat tatccgccaa gtacaatttt ttactcttcg aagacagaaa 4020
atttgctgac attggtaata cagtcaaatt gcagtactct gcgggtgtat acagaatagc 4080
agaatgggca gacattacga atgcacacgg tgtggtgggc ccaggtattg ttagcggttt 4140
gaagcaggcg gcagaagaag taacaaagga acctagaggc cttttgatgt tagcagaatt 4200
gtcatgcaag ggctccctat ctactggaga atatactaag ggtactgttg acattgcgaa 4260
gagcgacaaa gattttgtta tcggctttat tgctcaaaga gacatgggtg gaagagatga 4320
aggttacgat tggttgatta tgacacccgg tgtgggttta gatgacaagg gagacgcatt 4380
gggtcaacag tatagaaccg tggatgatgt ggtctctaca ggatctgaca ttattattgt 4440
tggaagagga ctatttgcaa agggaaggga tgctaaggta gagggtgaac gttacagaaa 4500
agcaggctgg gaagcatatt tgagaagatg cggccagcaa aactaaaaaa ctgtattata 4560
agtaaatgca tgtatactaa actcacaaat tagagcttca atttaattat atcagttatt 4620
acccgggaat ctcggtcgta atgattttta taatgacgaa aaaaaaaaaa ttggaaagaa 4680
aagccccccc cccccccccc cccccccccc cccccccgca gcgttgggtc ctggccacgg 4740
gtgcgcatga tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact 4800
ggttagcaga atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg 4860
tctgcgacct gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa 4920
acgcggaagt cagcgccctg caccattatg ttccggatct gcatcgcagg atgctgctgg 4980
ctaccctgtg gaacacctac atctgtatta acgaagcgct ggcattgacc ctgagtgatt 5040
tttctctggt cccgccgcat ccataccgcc agttgtttac cctcacaacg ttccagtaac 5100
cgggcatgtt catcatcagt aacccgtatc gtgagcatcc tctctcgttt catcggtatc 5160
attaccccca tgaacagaaa ttccccctta cacggaggca tcaagtgacc aaacaggaaa 5220
aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt ctggagaaac 5280
tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac gaccacgctg 5340
atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 5400
tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 5460
gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta 5520
gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt 5580
gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 5640
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 5700
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 5760
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 5820
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 5880
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 5940
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 6000
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 6060
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 6120
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 6180
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 6240
gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt 6300
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 6360
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 6420
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 6480
ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 6540
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 6600
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 6660
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 6720
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 6780
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 6840
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctgc 6900
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 6960
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 7020
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 7080
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 7140
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac 7200
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 7260
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 7320
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 7380
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 7440
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 7500
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 7560
aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag 7620
gcgtatcacg aggccctttc gtcttcaa 7648
<210> 17
<211> 4453
<212> DNA
<213> Artificial sequence
<220>
<223> vector pUC18-FMD-MFalfa-E1-H6
<220>
<221> misc_feature
<222> (1207)..(1208)
<223> N is any nucleotide
<220>
<221> misc_feature
<222> (1386)..(1387)
<223> N is any nucleotide
<400> 17
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct 240
cggtacccgg ggatccttaa tggtgatggt ggtggtgcca gttcatcatc atatcccaag 300
ccatacggtg acctgttatg tggccgggat agattgagca attgcagtcc tgcaccgtct 360
catgccggcg aggcgagatg gtgaacagct gggagacgag gaagacagat ccgcagagat 420
cccccacgta catagcggaa cagaaagcag ccgccccaac gagcaaatcg acgtggcgtc 480
gtattgtcgt agtggggacg ctggcgttcc tagctgcgag cgtgggggtg agcgctaccc 540
agcagcggga agagttgttc tcccgaacgc agggcacgca cccgggggtg tgcatgatca 600
tgtccgctgc ctcatacaca atgcttgagt tggagcagtc gttcgtgaca tggtacatcc 660
cggacacgtt gcgcacctca taccttttat ccaagcttac cccttcttct ttagcagcaa 720
tgctggcaat agtagtattt ataaacaata acccgttatt tgtgctgttg gaaaatggca 780
aaacagcaac atcgaaatcc ccttctaaat ctgagtaacc gatgacagct tcagccggaa 840
tttgtgccgt ttcatcttct gttgtagtgt tgactggagc agctaatgcg gaggatgctg 900
cgaataaaac tgcagtaaaa attgaaggaa atctcatgaa ttcccgatga aggcagagag 960
cgcaaggagg cggtatttat agtgccattc ccctctctga gagacccgga tggtagtcga 1020
gtgttatcgg agacagcttg atgtagactc cgtgcctgcc ggtcctctta ttggcggaca 1080
ccagtgagac accccggaac ttgctgtttt tctgcaaaat ccggggtgac cagtgggagc 1140
ctatttgcac acacgagcgg gacaccccac tctggtgaag agtgccaaag tcattctttt 1200
tcccgtnncg gggcagccga ttgcatgttt taggaaaata ttacctttgc tacaccctgt 1260
cagatttacc ctccacacat atatattccg tcacctccag ggactattct tggctcgttg 1320
cgccgccgcg gaagatatcc agaagctgtg ttttccgaga gactcggttg gcgcctggta 1380
tatttnnagg atgtcgcgct gcctcacgtc ccggtaccca ggaacgcggt gggatctcgg 1440
gcccatcgaa gactgtgctc cagactgctc gcccagcagg tgtttcttga ttgccgcctc 1500
taaatagtcc gcgcatcgcc ggtaacattt ttccagctcg gagtttgcgt ttagatacat 1560
ttctgcgatg ccaaaggagc ctgcagatta taacctcgga tgctgtcatt cagcgctttt 1620
aatttgacct ccagatagtt gctgtatttc tgttccattg gctgctggac gttcgtataa 1680
ctcgagttat tgttgcgctc tgcctcggcg tactggctca tgactgactg cggtcgcttc 1740
tcgagtgttc tcgcaacagg acgcctgcag gtcatcgagt cgagctggcg ccgaaactgg 1800
cggatctgac ctccacactg ccctgtatct ctatccaccg ggaaccgcct cctgccgttc 1860
cagaatgttg ttcaagtggt agctctgtgc ggtcaatgaa ggcgttattg ccggtgaaat 1920
ctttgggaag cggtttatcc tcggggaaga ttacgaaatt cccgcgcgtc gttgcgcttc 1980
ctggatctcg aggaagatcg ttctccgcgt cgaggagatc gttctccgcg tcgacctgca 2040
ggcatgcaag cttggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 2100
ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 2160
aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga 2220
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca 2280
gtacaatctg ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg 2340
acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct 2400
ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg 2460
gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt 2520
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 2580
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 2640
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 2700
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 2760
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 2820
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 2880
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 2940
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 3000
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 3060
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 3120
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 3180
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 3240
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 3300
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 3360
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 3420
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 3480
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 3540
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 3600
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 3660
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 3720
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 3780
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 3840
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 3900
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 3960
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 4020
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 4080
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 4140
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 4200
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 4260
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 4320
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 4380
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 4440
aggaagcgga aga 4453
<210> 18
<211> 51
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 18
tgcttcctac cactagcagc actaggatat gaggtgcgca acgtgtccgg g 51
<210> 19
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 19
tagtactagt attagtaggc ttcgcatgaa ttcccgatga aggcagagag cg 52
<210> 20
<211> 4252
<212> DNA
<213> Artificial sequence
<220>
<223> vector pUC18-FMD-CL-E1-H6
<220>
<221> misc_feature
<222> (1006)..(1007)
<223> N is any nucleotide
<220>
<221> misc_feature
<222> (1185)..(1186)
<223> N is any nucleotide
<400> 20
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct 240
cggtacccgg ggatccttaa tggtgatggt ggtggtgcca gttcatcatc atatcccaag 300
ccatacggtg acctgttatg tggccgggat agattgagca attgcagtcc tgcaccgtct 360
catgccggcg aggcgagatg gtgaacagct gggagacgag gaagacagat ccgcagagat 420
cccccacgta catagcggaa cagaaagcag ccgccccaac gagcaaatcg acgtggcgtc 480
gtattgtcgt agtggggacg ctggcgttcc tagctgcgag cgtgggggtg agcgctaccc 540
agcagcggga agagttgttc tcccgaacgc agggcacgca cccgggggtg tgcatgatca 600
tgtccgctgc ctcatacaca atgcttgagt tggagcagtc gttcgtgaca tggtacatcc 660
cggacacgtt gcgcacctca tatcctagtg ctgctagtgg taggaagcat agtactagta 720
ttagtaggct tcgcatgaat tcccgatgaa ggcagagagc gcaaggaggc ggtatttata 780
gtgccattcc cctctctgag agacccggat ggtagtcgag tgttatcgga gacagcttga 840
tgtagactcc gtgcctgccg gtcctcttat tggcggacac cagtgagaca ccccggaact 900
tgctgttttt ctgcaaaatc cggggtgacc agtgggagcc tatttgcaca cacgagcggg 960
acaccccact ctggtgaaga gtgccaaagt cattcttttt cccgtnncgg ggcagccgat 1020
tgcatgtttt aggaaaatat tacctttgct acaccctgtc agatttaccc tccacacata 1080
tatattccgt cacctccagg gactattctt ggctcgttgc gccgccgcgg aagatatcca 1140
gaagctgtgt tttccgagag actcggttgg cgcctggtat atttnnagga tgtcgcgctg 1200
cctcacgtcc cggtacccag gaacgcggtg ggatctcggg cccatcgaag actgtgctcc 1260
agactgctcg cccagcaggt gtttcttgat tgccgcctct aaatagtccg cgcatcgccg 1320
gtaacatttt tccagctcgg agtttgcgtt tagatacatt tctgcgatgc caaaggagcc 1380
tgcagattat aacctcggat gctgtcattc agcgctttta atttgacctc cagatagttg 1440
ctgtatttct gttccattgg ctgctggacg ttcgtataac tcgagttatt gttgcgctct 1500
gcctcggcgt actggctcat gactgactgc ggtcgcttct cgagtgttct cgcaacagga 1560
cgcctgcagg tcatcgagtc gagctggcgc cgaaactggc ggatctgacc tccacactgc 1620
cctgtatctc tatccaccgg gaaccgcctc ctgccgttcc agaatgttgt tcaagtggta 1680
gctctgtgcg gtcaatgaag gcgttattgc cggtgaaatc tttgggaagc ggtttatcct 1740
cggggaagat tacgaaattc ccgcgcgtcg ttgcgcttcc tggatctcga ggaagatcgt 1800
tctccgcgtc gaggagatcg ttctccgcgt cgacctgcag gcatgcaagc ttggcactgg 1860
ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg 1920
cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt 1980
cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat gcggtatttt ctccttacgc 2040
atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc tctgatgccg 2100
catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 2160
tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 2220
ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt 2280
tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa 2340
atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca 2400
tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc 2460
aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 2520
acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 2580
acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 2640
ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 2700
ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 2760
caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 2820
ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 2880
aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 2940
aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 3000
tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 3060
aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 3120
cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca 3180
ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 3240
gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 3300
agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc 3360
atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc 3420
cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 3480
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 3540
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 3600
tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact 3660
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 3720
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 3780
aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 3840
cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 3900
ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 3960
agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 4020
ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 4080
acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg 4140
cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc 4200
gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa ga 4252
<210> 21
<211> 7447
<212> DNA
<213> Artificial sequence
<220>
<223> vector pFPMT-CL-E1-H6
<400> 21
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttaat ggtgatggtg 360
gtggtgccag ttcatcatca tatcccaagc catacggtga cctgttatgt ggccgggata 420
gattgagcaa ttgcagtcct gcaccgtctc atgccggcga ggcgagatgg tgaacagctg 480
ggagacgagg aagacagatc cgcagagatc ccccacgtac atagcggaac agaaagcagc 540
cgccccaacg agcaaatcga cgtggcgtcg tattgtcgta gtggggacgc tggcgttcct 600
agctgcgagc gtgggggtga gcgctaccca gcagcgggaa gagttgttct cccgaacgca 660
gggcacgcac ccgggggtgt gcatgatcat gtccgctgcc tcatacacaa tgcttgagtt 720
ggagcagtcg ttcgtgacat ggtacatccc ggacacgttg cgcacctcat atcctagtgc 780
tgctagtggt aggaagcata gtactagtat tagtaggctt cgcatgaatt cccgatgaag 840
cagagagcgc aggaggcggt atttatagtg ccattcccct ctctgagaga cccggatggt 900
agtcgagtgt atcggagaca gcttgatgta gactccgtgc ctgccggctc ctcttattgg 960
cggacaccag tgagacaccc cggaacttgc tgtttttctg caaaatccgg ggtgaccagt 1020
gggagcctat ttgcacacac gagcgggaca ccccactctg gtgaagagtg ccaaagtcat 1080
tctttttccc gttgcggggc agccgattgc atgttttagg aaaatattac ctttgctaca 1140
ccctgtcaga tttaccctcc acacatatat attccgtcac ctccagggac tattattcgt 1200
cgttgcgccg ccagcggaag atatccagaa gctgttttcc gagagactcg gttggcgcct 1260
ggtatatttg atggatgtcg cgctgcctca cgtcccggta cccaggaacg cggtgggatc 1320
tcgggcccat cgaagactgt gctccagact gctcgcccag caggtgtttc ttgatcgccg 1380
cctctaaatt gtccgcgcat cgccggtaac atttttccag ctcggagttt gcgtttagat 1440
acagtttctg cgatgccaaa ggagcctgca gattataacc tcggatgctg tcattcagcg 1500
cttttaattt gacctccaga tagttgctgt atttctgttc ccattggctg ctgcgcagct 1560
tcgtataact cgagttattg ttgcgctctg cctcggcgta ctggctcatg atctggatct 1620
tgtccgtgtc gcttttcttc gagtgtttct cgcaaacgat gtgcacggcc tgcagtgtcc 1680
aatcggagtc gagctggcgc cgaaactggc ggatctgagc ctccacactg ccctgtttct 1740
ctatccacgg cggaaccgcc tcctgccgtt tcagaatgtt gttcaagtgg tactctgtgc 1800
ggtcaatgaa ggcgttattg ccggtgaaat ctttgggaag cggttttcct cggggaagat 1860
tacgaaattc cccgcgtcgt tgcgcttcct ggatctcgag gagatcgttc tccgcgtcga 1920
ggagatcgtt ctccgcgtcg acaccattcc ttgcggcggc ggtgctcaac ggcctcaacc 1980
tactactggg ctgcttccta atgcaggagt cgcataaggg agagcgtcga caaacccgcg 2040
tttgagaact tgctcaagct tctggtaaac gttgtagtac tctgaaacaa ggccctagca 2100
ctctgatctg tttctcttgg gtagcggtga gtggtttatt ggagttcact ggtttcagca 2160
catctgtcat ctagacaata ttgttactaa atttttttga actacaattg ttcgtaattc 2220
atctattatt atacatcctc gtcagcaatt tctggcagac ggagtttact aacgtcttga 2280
gtatgaggcc gagaatccag ctctgtggcc atactcagtc ttgacagcct gctgatgtgg 2340
ctgcgttcaa cgcaataagc gtgtcctccg actccgagtt gtgctcgtta tcgtcgttct 2400
catcctcgga aaaatcacac gaaagaacat actcaccagt aggctttctg gtccctgggg 2460
cacggctgtt tctgacgtat tccggcgttg ataatagctc gaaagtgaac gccgagtcgc 2520
gggagtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg 2580
ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag 2640
gtgccggcag cgctctgggt cattttcggc gaggaccgct ttcgctggag cgcgacgatg 2700
atcggcctgt cgcttgcggt attcggaatc ttgcacgccc tcgctcaagc cttcgtcact 2760
ggtcccgcca ccaaacgttt cggcgagaag caggccatta tcgccggcat ggcggccgac 2820
gcgctgggct acgtcttgct ggcgttcgcg acgcgaggct ggatggcctt ccccattatg 2880
attcttctcg cttccggcgg catcgggatg cccgcgttgc aggccatgct gtccaggcag 2940
gtagatgacg accatcaggg acagcttcaa ggatcgctcg cggctcttac cagcctaact 3000
tcgatcactg gaccgctgat cgtcacggcg atttatgccg cctcggcgag cacatggaac 3060
gggttggcat ggattgtagg cgccgcccta taccttgtct gcctccccgc gttgcgtcgc 3120
ggtgcatgga gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat 3180
tcaccactcc aagaattgga gccaatcaat tcttgcggag aactgtgaat gcgcaaacca 3240
acccttggca gaacatatcc atcgcgtccg ccatctccag cagccgcacg cggcgcatcg 3300
gggggggggg gggggggggg gggcaaacaa ttcatcattt tttttttatt cttttttttg 3360
atttcggttt ctttgaaatt tttttgattc ggtaatctcc gaacagaagg aagaacgaag 3420
gaaggagcac agacttagat tggtatatat acgcatatgt agtgttgaag aaacatgaaa 3480
ttgcccagta ttcttaaccc aactgcacag aacaaaaacc tgcaggaaac gaagataaat 3540
catgtcgaaa gctacatata aggaacgtgc tgctactcat cctagtcctg ttgctgccaa 3600
gctatttaat atcatgcacg aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac 3660
caccaaggaa ttactggagt tagttgaagc attaggtccc aaaatttgtt tactaaaaac 3720
acatgtggat atcttgactg atttttccat ggagggcaca gttaagccgc taaaggcatt 3780
atccgccaag tacaattttt tactcttcga agacagaaaa tttgctgaca ttggtaatac 3840
agtcaaattg cagtactctg cgggtgtata cagaatagca gaatgggcag acattacgaa 3900
tgcacacggt gtggtgggcc caggtattgt tagcggtttg aagcaggcgg cagaagaagt 3960
aacaaaggaa cctagaggcc ttttgatgtt agcagaattg tcatgcaagg gctccctatc 4020
tactggagaa tatactaagg gtactgttga cattgcgaag agcgacaaag attttgttat 4080
cggctttatt gctcaaagag acatgggtgg aagagatgaa ggttacgatt ggttgattat 4140
gacacccggt gtgggtttag atgacaaggg agacgcattg ggtcaacagt atagaaccgt 4200
ggatgatgtg gtctctacag gatctgacat tattattgtt ggaagaggac tatttgcaaa 4260
gggaagggat gctaaggtag agggtgaacg ttacagaaaa gcaggctggg aagcatattt 4320
gagaagatgc ggccagcaaa actaaaaaac tgtattataa gtaaatgcat gtatactaaa 4380
ctcacaaatt agagcttcaa tttaattata tcagttatta cccgggaatc tcggtcgtaa 4440
tgatttttat aatgacgaaa aaaaaaaaat tggaaagaaa agcccccccc cccccccccc 4500
cccccccccc ccccccgcag cgttgggtcc tggccacggg tgcgcatgat cgtgctcctg 4560
tcgttgagga cccggctagg ctggcggggt tgccttactg gttagcagaa tgaatcaccg 4620
atacgcgagc gaacgtgaag cgactgctgc tgcaaaacgt ctgcgacctg agcaacaaca 4680
tgaatggtct tcggtttccg tgtttcgtaa agtctggaaa cgcggaagtc agcgccctgc 4740
accattatgt tccggatctg catcgcagga tgctgctggc taccctgtgg aacacctaca 4800
tctgtattaa cgaagcgctg gcattgaccc tgagtgattt ttctctggtc ccgccgcatc 4860
cataccgcca gttgtttacc ctcacaacgt tccagtaacc gggcatgttc atcatcagta 4920
acccgtatcg tgagcatcct ctctcgtttc atcggtatca ttacccccat gaacagaaat 4980
tcccccttac acggaggcat caagtgacca aacaggaaaa aaccgccctt aacatggccc 5040
gctttatcag aagccagaca ttaacgcttc tggagaaact caacgagctg gacgcggatg 5100
aacaggcaga catctgtgaa tcgcttcacg accacgctga tgagctttac cgcagctgcc 5160
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 5220
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 5280
ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg 5340
gcttaactat gcggcatcag agcagattgt actgagagtg caccatatgc ggtgtgaaat 5400
accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt cctcgctcac 5460
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 5520
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 5580
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 5640
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 5700
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 5760
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 5820
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 5880
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 5940
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 6000
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 6060
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 6120
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 6180
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 6240
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 6300
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 6360
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 6420
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 6480
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 6540
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 6600
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 6660
gccagttaat agtttgcgca acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc 6720
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 6780
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 6840
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 6900
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 6960
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca cgggataata ccgcgccaca 7020
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 7080
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 7140
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 7200
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 7260
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 7320
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 7380
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 7440
tcttcaa 7447
<210> 22
<211> 3730
<212> DNA
<213> Artificial sequence
<220>
<223> vector pSP72E2H6
<400> 22
gaactcgagc agctgaagct tgaattcatg agatttcctt caatttttac tgcagtttta 60
ttcgcagcat cctccgcatt agctgctcca gtcaacacta caacagaaga tgaaacggca 120
caaattccgg ctgaagctgt catcggttac tcagatttag aaggggattt cgatgttgct 180
gttttgccat tttccaacag cacaaataac gggttattgt ttataaatac tactattgcc 240
agcattgctg ctaaagaaga aggggtatct ctagataaaa ggcatacccg cgtgtcagga 300
ggggcagcag cctccgatac caggggcctt gtgtccctct ttagccccgg gtcggctcag 360
aaaatccagc tcgtaaacac caacggcagt tggcacatca acaggactgc cctgaactgc 420
aacgactccc tccaaacagg gttctttgcc gcactattct acaaacacaa attcaactcg 480
tctggatgcc cagagcgctt ggccagctgt cgctccatcg acaagttcgc tcaggggtgg 540
ggtcccctca cttacactga gcctaacagc tcggaccaga ggccctactg ctggcactac 600
gcgcctcgac cgtgtggtat tgtacccgcg tctcaggtgt gcggtccagt gtattgcttc 660
accccgagcc ctgttgtggt ggggacgacc gatcggtttg gtgtccccac gtataactgg 720
ggggcgaacg actcggatgt gctgattctc aacaacacgc ggccgccgcg aggcaactgg 780
ttcggctgta catggatgaa tggcactggg ttcaccaaga cgtgtggggg ccccccgtgc 840
aacatcgggg gggccggcaa caacaccttg acctgcccca ctgactgttt tcggaagcac 900
cccgaggcca cttacgccag atgcggttct gggccctggc tgacacctag gtgtatggtt 960
cattacccat ataggctctg gcactacccc tgcactgtca acttcaccat cttcaaggtt 1020
aggatgtacg tggggggcgt ggagcacagg ttcgaagccg catgcaattg gactcgagga 1080
gagcgttgtg acttggagga cagggataga tcagagctta gctcgctgct gctgtctaca 1140
acagagtggc aggtgatcga gggcagacac catcaccacc atcactaata gttaattaac 1200
gatctcgact tggttgaaca cgttgccaag gcttaagtga atttacttta aagtcttgca 1260
tttaaataaa ttttcttttt atagctttat gacttagttt caatttatat actattttaa 1320
tgacattttc gattcattga ttgaaagcta tcagatctgc cggtctccct atagtgagtc 1380
gtattaattt cgataagcca ggttaacctg cattaatgaa tcggccaacg cgcggggaga 1440
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 1500
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 1560
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 1620
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 1680
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 1740
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 1800
tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc 1860
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 1920
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 1980
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 2040
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 2100
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 2160
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 2220
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 2280
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 2340
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 2400
agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 2460
atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 2520
cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 2580
aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 2640
cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 2700
aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 2760
ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 2820
gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 2880
ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 2940
tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 3000
tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 3060
ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 3120
tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 3180
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 3240
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 3300
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 3360
gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg 3420
acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat 3480
gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg 3540
gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc 3600
tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat ggacatattg 3660
tcgttagaac gcggctacaa ttaatacata accttatgta tcatacacat acgatttagg 3720
tgacactata 3730
<210> 23
<211> 7370
<212> DNA
<213> Artificial sequence
<220>
<223> vector pMPT121
<220>
<221> misc_feature
<222> (778)..(778)
<223> N is any nucleotide
<400> 23
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgaattcgtt 360
tttgtacttt agattgatgt caccaccgtg cactggcagc agtatttata gatggaccgt 420
gtggggacgg ttgggtacac ttagcggcag cgctgacccc atctgtgatc aagtagggca 480
aaaactgggg atgtcggagt cgctgcacgg tagcataaga atttactttc tggccggttc 540
acccgcattt gcactgtgga gaaacagcct gtccgacacc ccaccagttg ccacatcggc 600
cctctgctgc tctggtgatt ttctggtagc aggcacagac agcagtgggt agcgccgtcc 660
ggttaggcaa ggtcacgttg taggctaccc cagcaaacag agcctcacat gacaccatcc 720
agctgcgtcc tcgaagcgaa aagttcggtt gcggctgcag aaccccctca gttgccanat 780
tcacaagttt tacgcgacgg ctaaagcgag tgggttttaa aaacttgcgg tgcaaggatg 840
catgcggcaa caattaattg gtgcatccag cacagcaagc ccagtctcga gatgtccagt 900
cgctacagag tggagtacgc actcaaggaa caccgtcgag atggcctcat agaatggatc 960
aagggcctgc tggccacgcc gttcgtcctg tacgcggtga agagcaacgg catctctgca 1020
gtggacgacc tcatggtaaa ctctgaggca aaacgccgct acgcggaaat cttccacgac 1080
ctcgaactcc tcatcgacga caacattgaa atgaccaaag ccggcacccc cgaattgtct 1140
cggctcgtgc agctggttcc gagcgttggc agcttcttca cgagactgcc tctggaaaag 1200
gccttctaca tcgaggacga gcgccgcgcc atcagcaaac gccggcttgt ggccccctcg 1260
ttcaacgacg tccggctcat tctcaacacg gcccagctgt tggagatgtc gcggttcttc 1320
cattccaaaa ccatccgaga tcgcaagctg cagctcatta cattcgatgg tgacatcaca 1380
ctgtacgacg acggcaaaaa tttcgatgcc gagtcgccca tcctgcccca cctcatcaaa 1440
ctaatggcca aggacctcta tgtgggtatc gtcaccgcgg ccggctacag cgacggaaca 1500
agtactacga gcgcctcaag ggcctcatcg acgccgtcca gacgtccccg ctgctcacag 1560
gccaccagaa agagaacctg ttcattatgg gcggcgaggc aaactacctc ttccggtaca 1620
gtaacgagga gcagagatta cgcttctact ccaaagacag atggctgctc gagaacatgc 1680
tgaattggtc cgaggaggac attcatctga cactggactt tgcgcaggac gttctaaacg 1740
acctcgttca caaactgggc tcgccagcca ccgtggtccg caaggagcgt cgcgtcggcc 1800
tggttccatt accgggccac aagctgatcc gcgagcagct cgaggagatc gttctccgcg 1860
tcgacaccat tccttgcggc ggcggtgctc aacggcctca acctactact gggctgcttc 1920
ctaatgcagg agtcgcataa gggagagcgt cgactcccgc gactcggcgt tcactttcga 1980
gctattatca acgccggaat acgtcagaaa cagccgtgcc ccagggacca gaaagcctac 2040
tggtgagtat gttctttcgt gtgatttttc cgaggatgag aacgacgata acgagcacaa 2100
ctcggagtcg gaggacacgc ttattgcgtt gaacgcagcc acatcagcag gctgtcaaga 2160
ctgagtatgg ccacagagct ggattctcgg cctcatactc aagacgttag taaactccgt 2220
ctgccagaaa ttgctgacga ggatgtataa taatagatga attacgaaca attgtagttc 2280
aaaaaaattt agtaacaata ttgtctagat gacagatgtg ctgaaaccag tgaactccaa 2340
taaaccactc accgctaccc aagagaaaca gatcagagtg ctagggcctt gtttcagagt 2400
actacaacgt ttaccagaag cttgagcaag ttctcaaacg cgggtttgtc gaccgatgcc 2460
cttgagagcc ttcaacccag tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc 2520
cgcacttatg actgtcttct ttatcatgca actcgtagga caggtgccgg cagcgctctg 2580
ggtcattttc ggcgaggacc gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc 2640
ggtattcgga atcttgcacg ccctcgctca agccttcgtc actggtcccg ccaccaaacg 2700
tttcggcgag aagcaggcca ttatcgccgg catggcggcc gacgcgctgg gctacgtctt 2760
gctggcgttc gcgacgcgag gctggatggc cttccccatt atgattcttc tcgcttccgg 2820
cggcatcggg atgcccgcgt tgcaggccat gctgtccagg caggtagatg acgaccatca 2880
gggacagctt caaggatcgc tcgcggctct taccagccta acttcgatca ctggaccgct 2940
gatcgtcacg gcgatttatg ccgcctcggc gagcacatgg aacgggttgg catggattgt 3000
aggcgccgcc ctataccttg tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc 3060
cacctcgacc tgaatggaag ccggcggcac ctcgctaacg gattcaccac tccaagaatt 3120
ggagccaatc aattcttgcg gagaactgtg aatgcgcaaa ccaacccttg gcagaacata 3180
tccatcgcgt ccgccatctc cagcagccgc acgcggcgca tcgggggggg gggggggggg 3240
ggggggcaaa caattcatca tttttttttt attctttttt ttgatttcgg tttctttgaa 3300
atttttttga ttcggtaatc tccgaacaga aggaagaacg aaggaaggag cacagactta 3360
gattggtata tatacgcata tgtagtgttg aagaaacatg aaattgccca gtattcttaa 3420
cccaactgca cagaacaaaa acctgcagga aacgaagata aatcatgtcg aaagctacat 3480
ataaggaacg tgctgctact catcctagtc ctgttgctgc caagctattt aatatcatgc 3540
acgaaaagca aacaaacttg tgtgcttcat tggatgttcg taccaccaag gaattactgg 3600
agttagttga agcattaggt cccaaaattt gtttactaaa aacacatgtg gatatcttga 3660
ctgatttttc catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt 3720
ttttactctt cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact 3780
ctgcgggtgt atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg 3840
gcccaggtat tgttagcggt ttgaagcagg cggcagaaga agtaacaaag gaacctagag 3900
gccttttgat gttagcagaa ttgtcatgca agggctccct atctactgga gaatatacta 3960
agggtactgt tgacattgcg aagagcgaca aagattttgt tatcggcttt attgctcaaa 4020
gagacatggg tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt 4080
tagatgacaa gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta 4140
caggatctga cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg 4200
tagagggtga acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc 4260
aaaactaaaa aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt 4320
caatttaatt atatcagtta ttacccggga atctcggtcg taatgatttt tataatgacg 4380
aaaaaaaaaa aattggaaag aaaagccccc cccccccccc cccccccccc cccccccccg 4440
cagcgttggg tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct 4500
aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg 4560
aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt 4620
ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat 4680
ctgcatcgca ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg 4740
ctggcattga ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt 4800
accctcacaa cgttccagta accgggcatg ttcatcatca gtaacccgta tcgtgagcat 4860
cctctctcgt ttcatcggta tcattacccc catgaacaga aattccccct tacacggagg 4920
catcaagtga ccaaacagga aaaaaccgcc cttaacatgg cccgctttat cagaagccag 4980
acattaacgc ttctggagaa actcaacgag ctggacgcgg atgaacaggc agacatctgt 5040
gaatcgcttc acgaccacgc tgatgagctt taccgcagct gcctcgcgcg tttcggtgat 5100
gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg tctgtaagcg 5160
gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc 5220
gcagccatga cccagtcacg tagcgatagc ggagtgtata ctggcttaac tatgcggcat 5280
cagagcagat tgtactgaga gtgcaccata tgcggtgtga aataccgcac agatgcgtaa 5340
ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 5400
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 5460
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 5520
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 5580
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 5640
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 5700
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 5760
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 5820
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 5880
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 5940
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 6000
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 6060
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 6120
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 6180
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 6240
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 6300
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 6360
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 6420
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 6480
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 6540
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 6600
gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 6660
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 6720
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 6780
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 6840
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 6900
gttgctcttg cccggcgtca acacgggata ataccgcgcc acatagcaga actttaaaag 6960
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7020
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 7080
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 7140
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 7200
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 7260
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 7320
tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtcttcaa 7370
<210> 24
<211> 8298
<212> DNA
<213> Artificial sequence
<220>
<223> vector pFMPT-MFalfa-E2-H6
<400> 24
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgatagcttt 360
caatcaatga atcgaaaatg tcattaaaat agtatataaa ttgaaactaa gtcataaagc 420
tataaaaaga aaatttattt aaatgcaaga ctttaaagta aattcactta agccttggca 480
acgtgttcaa ccaagtcgag atcgttaatt aactattagt gatggtggtg atggtgtctg 540
ccctcgatca cctgccactc tgttgtagac agcagcagcg agctaagctc tgatctatcc 600
ctgtcctcca agtcacaacg ctctcctcga gtccaattgc atgcggcttc gaacctgtgc 660
tccacgcccc ccacgtacat cctaaccttg aagatggtga agttgacagt gcaggggtag 720
tgccagagcc tatatgggta atgaaccata cacctaggtg tcagccaggg cccagaaccg 780
catctggcgt aagtggcctc ggggtgcttc cgaaaacagt cagtggggca ggtcaaggtg 840
ttgttgccgg cccccccgat gttgcacggg gggcccccac acgtcttggt gaacccagtg 900
ccattcatcc atgtacagcc gaaccagttg cctcgcggcg gccgcgtgtt gttgagaatc 960
agcacatccg agtcgttcgc cccccagtta tacgtgggga caccaaaccg atcggtcgtc 1020
cccaccacaa cagggctcgg ggtgaagcaa tacactggac cgcacacctg agacgcgggt 1080
acaataccac acggtcgagg cgcgtagtgc cagcagtagg gcctctggtc cgagctgtta 1140
ggctcagtgt aagtgagggg accccacccc tgagcgaact tgtcgatgga gcgacagctg 1200
gccaagcgct ctgggcatcc agacgagttg aatttgtgtt tgtagaatag tgcggcaaag 1260
aaccctgttt ggagggagtc gttgcagttc agggcagtcc tgttgatgtg ccaactgccg 1320
ttggtgttta cgagctggat tttctgagcc gacccggggc taaagaggga cacaaggccc 1380
ctggtatcgg aggctgctgc ccctcctgac acgcgggtat gccttttatc tagagatacc 1440
ccttcttctt tagcagcaat gctggcaata gtagtattta taaacaataa cccgttattt 1500
gtgctgttgg aaaatggcaa aacagcaaca tcgaaatccc cttctaaatc tgagtaaccg 1560
atgacagctt cagccggaat ttgtgccgtt tcatcttctg ttgtagtgtt gactggagca 1620
gctaatgcgg aggatgctgc gaataaaact gcagtaaaaa ttgaaggaaa tctcatgaat 1680
tcccgatgaa gcagagagcg caggaggcgg tatttatagt gccattcccc tctctgagag 1740
acccggatgg tagtcgagtg tatcggagac agcttgatgt agactccgtg cctgccggct 1800
cctcttattg gcggacacca gtgagacacc ccggaacttg ctgtttttct gcaaaatccg 1860
gggtgaccag tgggagccta tttgcacaca cgagcgggac accccactct ggtgaagagt 1920
gccaaagtca ttctttttcc cgttgcgggg cagccgattg catgttttag gaaaatatta 1980
cctttgctac accctgtcag atttaccctc cacacatata tattccgtca cctccaggga 2040
ctattattcg tcgttgcgcc gccagcggaa gatatccaga agctgttttc cgagagactc 2100
ggttggcgcc tggtatattt gatggatgtc gcgctgcctc acgtcccggt acccaggaac 2160
gcggtgggat ctcgggccca tcgaagactg tgctccagac tgctcgccca gcaggtgttt 2220
cttgatcgcc gcctctaaat tgtccgcgca tcgccggtaa catttttcca gctcggagtt 2280
tgcgtttaga tacagtttct gcgatgccaa aggagcctgc agattataac ctcggatgct 2340
gtcattcagc gcttttaatt tgacctccag atagttgctg tatttctgtt cccattggct 2400
gctgcgcagc ttcgtataac tcgagttatt gttgcgctct gcctcggcgt actggctcat 2460
gatctggatc ttgtccgtgt cgcttttctt cgagtgtttc tcgcaaacga tgtgcacggc 2520
ctgcagtgtc caatcggagt cgagctggcg ccgaaactgg cggatctgag cctccacact 2580
gccctgtttc tctatccacg gcggaaccgc ctcctgccgt ttcagaatgt tgttcaagtg 2640
gtactctgtg cggtcaatga aggcgttatt gccggtgaaa tctttgggaa gcggttttcc 2700
tcggggaaga ttacgaaatt ccccgcgtcg ttgcgcttcc tggatctcga ggagatcgtt 2760
ctccgcgtcg aggagatcgt tctccgcgtc gacaccattc cttgcggcgg cggtgctcaa 2820
cggcctcaac ctactactgg gctgcttcct aatgcaggag tcgcataagg gagagcgtcg 2880
acaaacccgc gtttgagaac ttgctcaagc ttctggtaaa cgttgtagta ctctgaaaca 2940
aggccctagc actctgatct gtttctcttg ggtagcggtg agtggtttat tggagttcac 3000
tggtttcagc acatctgtca tctagacaat attgttacta aatttttttg aactacaatt 3060
gttcgtaatt catctattat tatacatcct cgtcagcaat ttctggcaga cggagtttac 3120
taacgtcttg agtatgaggc cgagaatcca gctctgtggc catactcagt cttgacagcc 3180
tgctgatgtg gctgcgttca acgcaataag cgtgtcctcc gactccgagt tgtgctcgtt 3240
atcgtcgttc tcatcctcgg aaaaatcaca cgaaagaaca tactcaccag taggctttct 3300
ggtccctggg gcacggctgt ttctgacgta ttccggcgtt gataatagct cgaaagtgaa 3360
cgccgagtcg cgggagtcga ccgatgccct tgagagcctt caacccagtc agctccttcc 3420
ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt atcatgcaac 3480
tcgtaggaca ggtgccggca gcgctctggg tcattttcgg cgaggaccgc tttcgctgga 3540
gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat cttgcacgcc ctcgctcaag 3600
ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa gcaggccatt atcgccggca 3660
tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc gacgcgaggc tggatggcct 3720
tccccattat gattcttctc gcttccggcg gcatcgggat gcccgcgttg caggccatgc 3780
tgtccaggca ggtagatgac gaccatcagg gacagcttca aggatcgctc gcggctctta 3840
ccagcctaac ttcgatcact ggaccgctga tcgtcacggc gatttatgcc gcctcggcga 3900
gcacatggaa cgggttggca tggattgtag gcgccgccct ataccttgtc tgcctccccg 3960
cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg aatggaagcc ggcggcacct 4020
cgctaacgga ttcaccactc caagaattgg agccaatcaa ttcttgcgga gaactgtgaa 4080
tgcgcaaacc aacccttggc agaacatatc catcgcgtcc gccatctcca gcagccgcac 4140
gcggcgcatc gggggggggg gggggggggg ggggcaaaca attcatcatt ttttttttat 4200
tctttttttt gatttcggtt tctttgaaat ttttttgatt cggtaatctc cgaacagaag 4260
gaagaacgaa ggaaggagca cagacttaga ttggtatata tacgcatatg tagtgttgaa 4320
gaaacatgaa attgcccagt attcttaacc caactgcaca gaacaaaaac ctgcaggaaa 4380
cgaagataaa tcatgtcgaa agctacatat aaggaacgtg ctgctactca tcctagtcct 4440
gttgctgcca agctatttaa tatcatgcac gaaaagcaaa caaacttgtg tgcttcattg 4500
gatgttcgta ccaccaagga attactggag ttagttgaag cattaggtcc caaaatttgt 4560
ttactaaaaa cacatgtgga tatcttgact gatttttcca tggagggcac agttaagccg 4620
ctaaaggcat tatccgccaa gtacaatttt ttactcttcg aagacagaaa atttgctgac 4680
attggtaata cagtcaaatt gcagtactct gcgggtgtat acagaatagc agaatgggca 4740
gacattacga atgcacacgg tgtggtgggc ccaggtattg ttagcggttt gaagcaggcg 4800
gcagaagaag taacaaagga acctagaggc cttttgatgt tagcagaatt gtcatgcaag 4860
ggctccctat ctactggaga atatactaag ggtactgttg acattgcgaa gagcgacaaa 4920
gattttgtta tcggctttat tgctcaaaga gacatgggtg gaagagatga aggttacgat 4980
tggttgatta tgacacccgg tgtgggttta gatgacaagg gagacgcatt gggtcaacag 5040
tatagaaccg tggatgatgt ggtctctaca ggatctgaca ttattattgt tggaagagga 5100
ctatttgcaa agggaaggga tgctaaggta gagggtgaac gttacagaaa agcaggctgg 5160
gaagcatatt tgagaagatg cggccagcaa aactaaaaaa ctgtattata agtaaatgca 5220
tgtatactaa actcacaaat tagagcttca atttaattat atcagttatt acccgggaat 5280
ctcggtcgta atgattttta taatgacgaa aaaaaaaaaa ttggaaagaa aagccccccc 5340
cccccccccc cccccccccc cccccccgca gcgttgggtc ctggccacgg gtgcgcatga 5400
tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga 5460
atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct 5520
gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt 5580
cagcgccctg caccattatg ttccggatct gcatcgcagg atgctgctgg ctaccctgtg 5640
gaacacctac atctgtatta acgaagcgct ggcattgacc ctgagtgatt tttctctggt 5700
cccgccgcat ccataccgcc agttgtttac cctcacaacg ttccagtaac cgggcatgtt 5760
catcatcagt aacccgtatc gtgagcatcc tctctcgttt catcggtatc attaccccca 5820
tgaacagaaa ttccccctta cacggaggca tcaagtgacc aaacaggaaa aaaccgccct 5880
taacatggcc cgctttatca gaagccagac attaacgctt ctggagaaac tcaacgagct 5940
ggacgcggat gaacaggcag acatctgtga atcgcttcac gaccacgctg atgagcttta 6000
ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc 6060
ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc 6120
gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta gcgatagcgg 6180
agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatatg 6240
cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct 6300
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 6360
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 6420
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 6480
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 6540
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 6600
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 6660
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 6720
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 6780
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 6840
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 6900
ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6960
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 7020
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 7080
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 7140
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 7200
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 7260
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 7320
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 7380
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 7440
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 7500
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctgc aggcatcgtg 7560
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 7620
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 7680
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 7740
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 7800
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac acgggataat 7860
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 7920
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 7980
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 8040
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 8100
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 8160
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 8220
cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg 8280
aggccctttc gtcttcaa 8298
<210> 25
<211> 8695
<212> DNA
<213> Artificial sequence
<220>
<223> vector pMPT-Mfalfa-E2-H6
<220>
<221> misc_feature
<222> (2103)..(2103)
<223> N is any nucleotide
<400> 25
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccagatc tgatagcttt 360
caatcaatga atcgaaaatg tcattaaaat agtatataaa ttgaaactaa gtcataaagc 420
tataaaaaga aaatttattt aaatgcaaga ctttaaagta aattcactta agccttggca 480
acgtgttcaa ccaagtcgag atcgttaatt aactattagt gatggtggtg atggtgtctg 540
ccctcgatca cctgccactc tgttgtagac agcagcagcg agctaagctc tgatctatcc 600
ctgtcctcca agtcacaacg ctctcctcga gtccaattgc atgcggcttc gaacctgtgc 660
tccacgcccc ccacgtacat cctaaccttg aagatggtga agttgacagt gcaggggtag 720
tgccagagcc tatatgggta atgaaccata cacctaggtg tcagccaggg cccagaaccg 780
catctggcgt aagtggcctc ggggtgcttc cgaaaacagt cagtggggca ggtcaaggtg 840
ttgttgccgg cccccccgat gttgcacggg gggcccccac acgtcttggt gaacccagtg 900
ccattcatcc atgtacagcc gaaccagttg cctcgcggcg gccgcgtgtt gttgagaatc 960
agcacatccg agtcgttcgc cccccagtta tacgtgggga caccaaaccg atcggtcgtc 1020
cccaccacaa cagggctcgg ggtgaagcaa tacactggac cgcacacctg agacgcgggt 1080
acaataccac acggtcgagg cgcgtagtgc cagcagtagg gcctctggtc cgagctgtta 1140
ggctcagtgt aagtgagggg accccacccc tgagcgaact tgtcgatgga gcgacagctg 1200
gccaagcgct ctgggcatcc agacgagttg aatttgtgtt tgtagaatag tgcggcaaag 1260
aaccctgttt ggagggagtc gttgcagttc agggcagtcc tgttgatgtg ccaactgccg 1320
ttggtgttta cgagctggat tttctgagcc gacccggggc taaagaggga cacaaggccc 1380
ctggtatcgg aggctgctgc ccctcctgac acgcgggtat gccttttatc tagagatacc 1440
ccttcttctt tagcagcaat gctggcaata gtagtattta taaacaataa cccgttattt 1500
gtgctgttgg aaaatggcaa aacagcaaca tcgaaatccc cttctaaatc tgagtaaccg 1560
atgacagctt cagccggaat ttgtgccgtt tcatcttctg ttgtagtgtt gactggagca 1620
gctaatgcgg aggatgctgc gaataaaact gcagtaaaaa ttgaaggaaa tctcatgaat 1680
tcgtttttgt actttagatt gatgtcacca ccgtgcactg gcagcagtat ttatagatgg 1740
accgtgtggg gacggttggg tacacttagc ggcagcgctg accccatctg tgatcaagta 1800
gggcaaaaac tggggatgtc ggagtcgctg cacggtagca taagaattta ctttctggcc 1860
ggttcacccg catttgcact gtggagaaac agcctgtccg acaccccacc agttgccaca 1920
tcggccctct gctgctctgg tgattttctg gtagcaggca cagacagcag tgggtagcgc 1980
cgtccggtta ggcaaggtca cgttgtaggc taccccagca aacagagcct cacatgacac 2040
catccagctg cgtcctcgaa gcgaaaagtt cggttgcggc tgcagaaccc cctcagttgc 2100
canattcaca agttttacgc gacggctaaa gcgagtgggt tttaaaaact tgcggtgcaa 2160
ggatgcatgc ggcaacaatt aattggtgca tccagcacag caagcccagt ctcgagatgt 2220
ccagtcgcta cagagtggag tacgcactca aggaacaccg tcgagatggc ctcatagaat 2280
ggatcaaggg cctgctggcc acgccgttcg tcctgtacgc ggtgaagagc aacggcatct 2340
ctgcagtgga cgacctcatg gtaaactctg aggcaaaacg ccgctacgcg gaaatcttcc 2400
acgacctcga actcctcatc gacgacaaca ttgaaatgac caaagccggc acccccgaat 2460
tgtctcggct cgtgcagctg gttccgagcg ttggcagctt cttcacgaga ctgcctctgg 2520
aaaaggcctt ctacatcgag gacgagcgcc gcgccatcag caaacgccgg cttgtggccc 2580
cctcgttcaa cgacgtccgg ctcattctca acacggccca gctgttggag atgtcgcggt 2640
tcttccattc caaaaccatc cgagatcgca agctgcagct cattacattc gatggtgaca 2700
tcacactgta cgacgacggc aaaaatttcg atgccgagtc gcccatcctg ccccacctca 2760
tcaaactaat ggccaaggac ctctatgtgg gtatcgtcac cgcggccggc tacagcgacg 2820
gaacaagtac tacgagcgcc tcaagggcct catcgacgcc gtccagacgt ccccgctgct 2880
cacaggccac cagaaagaga acctgttcat tatgggcggc gaggcaaact acctcttccg 2940
gtacagtaac gaggagcaga gattacgctt ctactccaaa gacagatggc tgctcgagaa 3000
catgctgaat tggtccgagg aggacattca tctgacactg gactttgcgc aggacgttct 3060
aaacgacctc gttcacaaac tgggctcgcc agccaccgtg gtccgcaagg agcgtcgcgt 3120
cggcctggtt ccattaccgg gccacaagct gatccgcgag cagctcgagg agatcgttct 3180
ccgcgtcgac accattcctt gcggcggcgg tgctcaacgg cctcaaccta ctactgggct 3240
gcttcctaat gcaggagtcg cataagggag agcgtcgact cccgcgactc ggcgttcact 3300
ttcgagctat tatcaacgcc ggaatacgtc agaaacagcc gtgccccagg gaccagaaag 3360
cctactggtg agtatgttct ttcgtgtgat ttttccgagg atgagaacga cgataacgag 3420
cacaactcgg agtcggagga cacgcttatt gcgttgaacg cagccacatc agcaggctgt 3480
caagactgag tatggccaca gagctggatt ctcggcctca tactcaagac gttagtaaac 3540
tccgtctgcc agaaattgct gacgaggatg tataataata gatgaattac gaacaattgt 3600
agttcaaaaa aatttagtaa caatattgtc tagatgacag atgtgctgaa accagtgaac 3660
tccaataaac cactcaccgc tacccaagag aaacagatca gagtgctagg gccttgtttc 3720
agagtactac aacgtttacc agaagcttga gcaagttctc aaacgcgggt ttgtcgaccg 3780
atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc 3840
gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg 3900
ctctgggtca ttttcggcga ggaccgcttt cgctggagcg cgacgatgat cggcctgtcg 3960
cttgcggtat tcggaatctt gcacgccctc gctcaagcct tcgtcactgg tcccgccacc 4020
aaacgtttcg gcgagaagca ggccattatc gccggcatgg cggccgacgc gctgggctac 4080
gtcttgctgg cgttcgcgac gcgaggctgg atggccttcc ccattatgat tcttctcgct 4140
tccggcggca tcgggatgcc cgcgttgcag gccatgctgt ccaggcaggt agatgacgac 4200
catcagggac agcttcaagg atcgctcgcg gctcttacca gcctaacttc gatcactgga 4260
ccgctgatcg tcacggcgat ttatgccgcc tcggcgagca catggaacgg gttggcatgg 4320
attgtaggcg ccgccctata ccttgtctgc ctccccgcgt tgcgtcgcgg tgcatggagc 4380
cgggccacct cgacctgaat ggaagccggc ggcacctcgc taacggattc accactccaa 4440
gaattggagc caatcaattc ttgcggagaa ctgtgaatgc gcaaaccaac ccttggcaga 4500
acatatccat cgcgtccgcc atctccagca gccgcacgcg gcgcatcggg gggggggggg 4560
gggggggggg gcaaacaatt catcattttt tttttattct tttttttgat ttcggtttct 4620
ttgaaatttt tttgattcgg taatctccga acagaaggaa gaacgaagga aggagcacag 4680
acttagattg gtatatatac gcatatgtag tgttgaagaa acatgaaatt gcccagtatt 4740
cttaacccaa ctgcacagaa caaaaacctg caggaaacga agataaatca tgtcgaaagc 4800
tacatataag gaacgtgctg ctactcatcc tagtcctgtt gctgccaagc tatttaatat 4860
catgcacgaa aagcaaacaa acttgtgtgc ttcattggat gttcgtacca ccaaggaatt 4920
actggagtta gttgaagcat taggtcccaa aatttgttta ctaaaaacac atgtggatat 4980
cttgactgat ttttccatgg agggcacagt taagccgcta aaggcattat ccgccaagta 5040
caatttttta ctcttcgaag acagaaaatt tgctgacatt ggtaatacag tcaaattgca 5100
gtactctgcg ggtgtataca gaatagcaga atgggcagac attacgaatg cacacggtgt 5160
ggtgggccca ggtattgtta gcggtttgaa gcaggcggca gaagaagtaa caaaggaacc 5220
tagaggcctt ttgatgttag cagaattgtc atgcaagggc tccctatcta ctggagaata 5280
tactaagggt actgttgaca ttgcgaagag cgacaaagat tttgttatcg gctttattgc 5340
tcaaagagac atgggtggaa gagatgaagg ttacgattgg ttgattatga cacccggtgt 5400
gggtttagat gacaagggag acgcattggg tcaacagtat agaaccgtgg atgatgtggt 5460
ctctacagga tctgacatta ttattgttgg aagaggacta tttgcaaagg gaagggatgc 5520
taaggtagag ggtgaacgtt acagaaaagc aggctgggaa gcatatttga gaagatgcgg 5580
ccagcaaaac taaaaaactg tattataagt aaatgcatgt atactaaact cacaaattag 5640
agcttcaatt taattatatc agttattacc cgggaatctc ggtcgtaatg atttttataa 5700
tgacgaaaaa aaaaaaattg gaaagaaaag cccccccccc cccccccccc cccccccccc 5760
ccccgcagcg ttgggtcctg gccacgggtg cgcatgatcg tgctcctgtc gttgaggacc 5820
cggctaggct ggcggggttg ccttactggt tagcagaatg aatcaccgat acgcgagcga 5880
acgtgaagcg actgctgctg caaaacgtct gcgacctgag caacaacatg aatggtcttc 5940
ggtttccgtg tttcgtaaag tctggaaacg cggaagtcag cgccctgcac cattatgttc 6000
cggatctgca tcgcaggatg ctgctggcta ccctgtggaa cacctacatc tgtattaacg 6060
aagcgctggc attgaccctg agtgattttt ctctggtccc gccgcatcca taccgccagt 6120
tgtttaccct cacaacgttc cagtaaccgg gcatgttcat catcagtaac ccgtatcgtg 6180
agcatcctct ctcgtttcat cggtatcatt acccccatga acagaaattc ccccttacac 6240
ggaggcatca agtgaccaaa caggaaaaaa ccgcccttaa catggcccgc tttatcagaa 6300
gccagacatt aacgcttctg gagaaactca acgagctgga cgcggatgaa caggcagaca 6360
tctgtgaatc gcttcacgac cacgctgatg agctttaccg cagctgcctc gcgcgtttcg 6420
gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt 6480
aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc 6540
ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc 6600
ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 6660
cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg 6720
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 6780
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 6840
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 6900
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 6960
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 7020
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 7080
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 7140
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 7200
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 7260
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 7320
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 7380
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 7440
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 7500
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 7560
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 7620
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 7680
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 7740
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 7800
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 7860
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 7920
tttgcgcaac gttgttgcca ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat 7980
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 8040
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 8100
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 8160
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 8220
accgagttgc tcttgcccgg cgtcaacacg ggataatacc gcgccacata gcagaacttt 8280
aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 8340
gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 8400
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 8460
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 8520
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 8580
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat 8640
tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc ttcaa 8695
<210> 26
<211> 36
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 26
agtcactctt caaggcatac ccgcgtgtca ggaggg 36
<210> 27
<211> 39
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 27
agtcactctt cacagggatc cttagtgatg gtggtgatg 39
<210> 28
<211> 4190
<212> DNA
<213> Artificial sequence
<220>
<223> vector pMF30
<400> 28
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagcttgc 240
atgcctgcag ttgattgcag atgccagatc ccgaaagaac agaggacgga gcgtaaactt 300
gtggcattcc accagaaatt gatacagata agcttccgga gtcaccagct aaaacggaat 360
tgcaagaaat aatatcgata actttatcac cactagaata gccggtgttg ctgacagtaa 420
tatcctgtga cccgtttgaa cctaaattat taaaaatgga aatcaattga ttagcatcgc 480
tacccttcct agtggctata tagtggtctg aagaagaaac aactgaggat ttgtaagttg 540
aataggcaga atccttctta atagcttgat ttcttatttg atttagttta ctgattagct 600
cgtagtattc tgaatcggta ttatatccac ttaaccataa agcttctcta ttggcaggat 660
cggaaccacc attgagacct tgttcttggc cataataaat aattgggata ccatcaccca 720
aaattataaa agccatgtca ttcttaatca aggatgtgtc tgaggtaact gatggaaatc 780
taacttggtc atggttttca ataaagtttc ccaacaaaga gacgtccgaa caagatgact 840
gtaacgtgga gatcattgaa gttaactcac tggaagtcgc cgaagtatca ctgaagaatc 900
tatatactgg atagtataat ggatagttgg taactccttt catataattc tgatatggac 960
aagtataagt tggatctcct tgataaactt cacctaagtt ataaacacca gaagcgtcct 1020
caaacttcgt taatgaagcg gtatctacgt gctttgcact atcaattctt aaaccatcga 1080
ttgaatagtt ttgaacaaaa tctgacaccc aagtttgaaa tactcctata acttcattat 1140
cctcggtact taaatctgga agggagactt cagtatcacc ttcccaacaa tcttcaacat 1200
tggtttgatc attataattt gtaatcaaac aataatcgtg gaagtaagat tgttgattga 1260
atggagtgaa actagaataa tctacgcttg aaccatctcc gttccaagca taatggttgt 1320
aaacaacgtc gaccatcaat aacatgcttc tggaatgcaa ttcgctagct aattgtttca 1380
attcatcagc ggtaccaaaa ttagtgttca attcatcaat atttttcatc caataaccat 1440
ggtaagcata accataagca gtattgtcag gaatttgctc aacaactggg gagatccaga 1500
tcgcagtgaa acccatacct tgaatataat ccaacttgtc gataatccct ttataagatc 1560
caccacagta cttgcgatca ctcactaaac agtcagctgt ggtcgagcca tcagatctgg 1620
caaacctatc agtaacgatt tgataaatcg attggtcttt ccatttatca gctgacgagc 1680
taacatccct cttgtcaaaa ataatcggtt gagcagatac caatcttgag aatgctaaaa 1740
ttgctgcaac aactttactt gtaaatcctt cagttgaaaa tctcattgaa ttcactggcc 1800
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 1860
gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 1920
caacagttgc gcagcctgaa tggcgaatgg cgcctgatgc ggtattttct ccttacgcat 1980
ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca 2040
tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 2100
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 2160
ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg cctattttta 2220
taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt tcggggaaat 2280
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg 2340
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa 2400
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac 2460
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac 2520
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt 2580
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc 2640
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca 2700
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc 2760
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag 2820
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa 2880
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg 2940
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa 3000
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg 3060
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt 3120
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt 3180
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag 3240
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat 3300
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct 3360
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct 3420
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca 3480
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc 3540
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc 3600
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct 3660
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag 3720
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc 3780
tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg 3840
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag 3900
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt 3960
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac 4020
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg 4080
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc 4140
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 4190
<210> 29
<211> 38
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 29
agtcactctt cacctcttgt caaaaataat cggttgag 38
<210> 30
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 30
tgcttcctac cactagcagc actaggacat acccgcgtgt caggaggggc ag 52
<210> 31
<211> 57
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 31
tagtactagt attagtaggc ttcgcatgga attcactggc cgtcgtttta caacgtc 57
<210> 32
<211> 7927
<212> DNA
<213> Artificial sequence
<220>
<223> vector pFMPT-CL-E2-H6
<400> 32
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttagt gatggtggtg 360
atggtgtctg ccctcgatca cctgccactc tgttgtagac agcagcagcg agctaagctc 420
tgatctatcc ctgtcctcca agtcacaacg ctctcctcga gtccaattgc atgcggcttc 480
gaacctgtgc tccacgcccc ccacgtacat cctaaccttg aagatggtga agttgacagt 540
gcaggggtag tgccagagcc tatatgggta atgaaccata cacctaggtg tcagccaggg 600
cccagaaccg catctggcgt aagtggcctc ggggtgcttc cgaaaacagt cagtggggca 660
ggtcaaggtg ttgttgccgg cccccccgat gttgcacggg gggcccccac acgtcttggt 720
gaacccagtg ccattcatcc atgtacagcc gaaccagttg cctcgcggcg gccgcgtgtt 780
gttgagaatc agcacatccg agtcgttcgc cccccagtta tacgtgggga caccaaaccg 840
atcggtcgtc cccaccacaa cagggctcgg ggtgaagcaa tacactggac cgcacacctg 900
agacgcgggt acaataccac acggtcgagg cgcgtagtgc cagcagtagg gcctctggtc 960
cgagctgtta ggctcagtgt aagtgagggg accccacccc tgagcgaact tgtcgatgga 1020
gcgacagctg gccaagcgct ctgggcatcc agacgagttg aatttgtgtt tgtagaatag 1080
tgcggcaaag aaccctgttt ggagggagtc gttgcagttc agggcagtcc tgttgatgtg 1140
ccaactgccg ttggtgttta cgagctggat tttctgagcc gacccggggc taaagaggga 1200
cacaaggccc ctggtatcgg aggctgctgc ccctcctgac acgcgggtat gtcctagtgc 1260
tgctagtggt aggaagcata gtactagtat tagtaggctg cgcatgaatt cccgatgaag 1320
cagagagcgc aggaggcggt atttatagtg ccattcccct ctctgagaga cccggatggt 1380
agtcgagtgt atcggagaca gcttgatgta gactccgtgc ctgccggctc ctcttattgg 1440
cggacaccag tgagacaccc cggaacttgc tgtttttctg caaaatccgg ggtgaccagt 1500
gggagcctat ttgcacacac gagcgggaca ccccactctg gtgaagagtg ccaaagtcat 1560
tctttttccc gttgcggggc agccgattgc atgttttagg aaaatattac ctttgctaca 1620
ccctgtcaga tttaccctcc acacatatat attccgtcac ctccagggac tattattcgt 1680
cgttgcgccg ccagcggaag atatccagaa gctgttttcc gagagactcg gttggcgcct 1740
ggtatatttg atggatgtcg cgctgcctca cgtcccggta cccaggaacg cggtgggatc 1800
tcgggcccat cgaagactgt gctccagact gctcgcccag caggtgtttc ttgatcgccg 1860
cctctaaatt gtccgcgcat cgccggtaac atttttccag ctcggagttt gcgtttagat 1920
acagtttctg cgatgccaaa ggagcctgca gattataacc tcggatgctg tcattcagcg 1980
cttttaattt gacctccaga tagttgctgt atttctgttc ccattggctg ctgcgcagct 2040
tcgtataact cgagttattg ttgcgctctg cctcggcgta ctggctcatg atctggatct 2100
tgtccgtgtc gcttttcttc gagtgtttct cgcaaacgat gtgcacggcc tgcagtgtcc 2160
aatcggagtc gagctggcgc cgaaactggc ggatctgagc ctccacactg ccctgtttct 2220
ctatccacgg cggaaccgcc tcctgccgtt tcagaatgtt gttcaagtgg tactctgtgc 2280
ggtcaatgaa ggcgttattg ccggtgaaat ctttgggaag cggttttcct cggggaagat 2340
tacgaaattc cccgcgtcgt tgcgcttcct ggatctcgag gagatcgttc tccgcgtcga 2400
ggagatcgtt ctccgcgtcg acaccattcc ttgcggcggc ggtgctcaac ggcctcaacc 2460
tactactggg ctgcttccta atgcaggagt cgcataaggg agagcgtcga caaacccgcg 2520
tttgagaact tgctcaagct tctggtaaac gttgtagtac tctgaaacaa ggccctagca 2580
ctctgatctg tttctcttgg gtagcggtga gtggtttatt ggagttcact ggtttcagca 2640
catctgtcat ctagacaata ttgttactaa atttttttga actacaattg ttcgtaattc 2700
atctattatt atacatcctc gtcagcaatt tctggcagac ggagtttact aacgtcttga 2760
gtatgaggcc gagaatccag ctctgtggcc atactcagtc ttgacagcct gctgatgtgg 2820
ctgcgttcaa cgcaataagc gtgtcctccg actccgagtt gtgctcgtta tcgtcgttct 2880
catcctcgga aaaatcacac gaaagaacat actcaccagt aggctttctg gtccctgggg 2940
cacggctgtt tctgacgtat tccggcgttg ataatagctc gaaagtgaac gccgagtcgc 3000
gggagtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg 3060
ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag 3120
gtgccggcag cgctctgggt cattttcggc gaggaccgct ttcgctggag cgcgacgatg 3180
atcggcctgt cgcttgcggt attcggaatc ttgcacgccc tcgctcaagc cttcgtcact 3240
ggtcccgcca ccaaacgttt cggcgagaag caggccatta tcgccggcat ggcggccgac 3300
gcgctgggct acgtcttgct ggcgttcgcg acgcgaggct ggatggcctt ccccattatg 3360
attcttctcg cttccggcgg catcgggatg cccgcgttgc aggccatgct gtccaggcag 3420
gtagatgacg accatcaggg acagcttcaa ggatcgctcg cggctcttac cagcctaact 3480
tcgatcactg gaccgctgat cgtcacggcg atttatgccg cctcggcgag cacatggaac 3540
gggttggcat ggattgtagg cgccgcccta taccttgtct gcctccccgc gttgcgtcgc 3600
ggtgcatgga gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat 3660
tcaccactcc aagaattgga gccaatcaat tcttgcggag aactgtgaat gcgcaaacca 3720
acccttggca gaacatatcc atcgcgtccg ccatctccag cagccgcacg cggcgcatcg 3780
gggggggggg gggggggggg gggcaaacaa ttcatcattt tttttttatt cttttttttg 3840
atttcggttt ctttgaaatt tttttgattc ggtaatctcc gaacagaagg aagaacgaag 3900
gaaggagcac agacttagat tggtatatat acgcatatgt agtgttgaag aaacatgaaa 3960
ttgcccagta ttcttaaccc aactgcacag aacaaaaacc tgcaggaaac gaagataaat 4020
catgtcgaaa gctacatata aggaacgtgc tgctactcat cctagtcctg ttgctgccaa 4080
gctatttaat atcatgcacg aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac 4140
caccaaggaa ttactggagt tagttgaagc attaggtccc aaaatttgtt tactaaaaac 4200
acatgtggat atcttgactg atttttccat ggagggcaca gttaagccgc taaaggcatt 4260
atccgccaag tacaattttt tactcttcga agacagaaaa tttgctgaca ttggtaatac 4320
agtcaaattg cagtactctg cgggtgtata cagaatagca gaatgggcag acattacgaa 4380
tgcacacggt gtggtgggcc caggtattgt tagcggtttg aagcaggcgg cagaagaagt 4440
aacaaaggaa cctagaggcc ttttgatgtt agcagaattg tcatgcaagg gctccctatc 4500
tactggagaa tatactaagg gtactgttga cattgcgaag agcgacaaag attttgttat 4560
cggctttatt gctcaaagag acatgggtgg aagagatgaa ggttacgatt ggttgattat 4620
gacacccggt gtgggtttag atgacaaggg agacgcattg ggtcaacagt atagaaccgt 4680
ggatgatgtg gtctctacag gatctgacat tattattgtt ggaagaggac tatttgcaaa 4740
gggaagggat gctaaggtag agggtgaacg ttacagaaaa gcaggctggg aagcatattt 4800
gagaagatgc ggccagcaaa actaaaaaac tgtattataa gtaaatgcat gtatactaaa 4860
ctcacaaatt agagcttcaa tttaattata tcagttatta cccgggaatc tcggtcgtaa 4920
tgatttttat aatgacgaaa aaaaaaaaat tggaaagaaa agcccccccc cccccccccc 4980
cccccccccc ccccccgcag cgttgggtcc tggccacggg tgcgcatgat cgtgctcctg 5040
tcgttgagga cccggctagg ctggcggggt tgccttactg gttagcagaa tgaatcaccg 5100
atacgcgagc gaacgtgaag cgactgctgc tgcaaaacgt ctgcgacctg agcaacaaca 5160
tgaatggtct tcggtttccg tgtttcgtaa agtctggaaa cgcggaagtc agcgccctgc 5220
accattatgt tccggatctg catcgcagga tgctgctggc taccctgtgg aacacctaca 5280
tctgtattaa cgaagcgctg gcattgaccc tgagtgattt ttctctggtc ccgccgcatc 5340
cataccgcca gttgtttacc ctcacaacgt tccagtaacc gggcatgttc atcatcagta 5400
acccgtatcg tgagcatcct ctctcgtttc atcggtatca ttacccccat gaacagaaat 5460
tcccccttac acggaggcat caagtgacca aacaggaaaa aaccgccctt aacatggccc 5520
gctttatcag aagccagaca ttaacgcttc tggagaaact caacgagctg gacgcggatg 5580
aacaggcaga catctgtgaa tcgcttcacg accacgctga tgagctttac cgcagctgcc 5640
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 5700
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 5760
ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg 5820
gcttaactat gcggcatcag agcagattgt actgagagtg caccatatgc ggtgtgaaat 5880
accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt cctcgctcac 5940
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 6000
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 6060
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 6120
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 6180
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 6240
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 6300
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 6360
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 6420
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 6480
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 6540
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 6600
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 6660
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 6720
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 6780
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 6840
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 6900
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 6960
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 7020
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 7080
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 7140
gccagttaat agtttgcgca acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc 7200
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 7260
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 7320
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 7380
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 7440
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaaca cgggataata ccgcgccaca 7500
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 7560
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 7620
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 7680
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 7740
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 7800
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 7860
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 7920
tcttcaa 7927
<210> 33
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 33
taaggatccc cgggtaccga gctc 24
<210> 34
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 34
ccagttcatc atcatatccc aagcc 25
<210> 35
<211> 4234
<212> DNA
<213> Artificial sequence
<220>
<223> vector pUC18-FMD-CL-E1
<220>
<221> misc_feature
<222> (988)..(989)
<223> N is any nucleotide
<220>
<221> misc_feature
<222> (1167)..(1168)
<223> N is any nucleotide
<400> 35
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct 240
cggtacccgg ggatccttac cagttcatca tcatatccca agccatacgg tgacctgtta 300
tgtggccggg atagattgag caattgcagt cctgcaccgt ctcatgccgg cgaggcgaga 360
tggtgaacag ctgggagacg aggaagacag atccgcagag atcccccacg tacatagcgg 420
aacagaaagc agccgcccca acgagcaaat cgacgtggcg tcgtattgtc gtagtgggga 480
cgctggcgtt cctagctgcg agcgtggggg tgagcgctac ccagcagcgg gaagagttgt 540
tctcccgaac gcagggcacg cacccggggg tgtgcatgat catgtccgct gcctcataca 600
caatgcttga gttggagcag tcgttcgtga catggtacat cccggacacg ttgcgcacct 660
catatcctag tgctgctagt ggtaggaagc atagtactag tattagtagg cttcgcatga 720
attcccgatg aaggcagaga gcgcaaggag gcggtattta tagtgccatt cccctctctg 780
agagacccgg atggtagtcg agtgttatcg gagacagctt gatgtagact ccgtgcctgc 840
cggtcctctt attggcggac accagtgaga caccccggaa cttgctgttt ttctgcaaaa 900
tccggggtga ccagtgggag cctatttgca cacacgagcg ggacacccca ctctggtgaa 960
gagtgccaaa gtcattcttt ttcccgtnnc ggggcagccg attgcatgtt ttaggaaaat 1020
attacctttg ctacaccctg tcagatttac cctccacaca tatatattcc gtcacctcca 1080
gggactattc ttggctcgtt gcgccgccgc ggaagatatc cagaagctgt gttttccgag 1140
agactcggtt ggcgcctggt atatttnnag gatgtcgcgc tgcctcacgt cccggtaccc 1200
aggaacgcgg tgggatctcg ggcccatcga agactgtgct ccagactgct cgcccagcag 1260
gtgtttcttg attgccgcct ctaaatagtc cgcgcatcgc cggtaacatt tttccagctc 1320
ggagtttgcg tttagataca tttctgcgat gccaaaggag cctgcagatt ataacctcgg 1380
atgctgtcat tcagcgcttt taatttgacc tccagatagt tgctgtattt ctgttccatt 1440
ggctgctgga cgttcgtata actcgagtta ttgttgcgct ctgcctcggc gtactggctc 1500
atgactgact gcggtcgctt ctcgagtgtt ctcgcaacag gacgcctgca ggtcatcgag 1560
tcgagctggc gccgaaactg gcggatctga cctccacact gccctgtatc tctatccacc 1620
gggaaccgcc tcctgccgtt ccagaatgtt gttcaagtgg tagctctgtg cggtcaatga 1680
aggcgttatt gccggtgaaa tctttgggaa gcggtttatc ctcggggaag attacgaaat 1740
tcccgcgcgt cgttgcgctt cctggatctc gaggaagatc gttctccgcg tcgaggagat 1800
cgttctccgc gtcgacctgc aggcatgcaa gcttggcact ggccgtcgtt ttacaacgtc 1860
gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 1920
ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 1980
tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 2040
accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 2100
gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 2160
acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 2220
cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 2280
taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 2340
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 2400
aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 2460
ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 2520
aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 2580
acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 2640
ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 2700
gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 2760
atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 2820
acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 2880
tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 2940
ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 3000
aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 3060
aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 3120
ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 3180
atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 3240
aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 3300
accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 3360
tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 3420
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 3480
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 3540
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 3600
caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 3660
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 3720
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 3780
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 3840
acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 3900
atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 3960
cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 4020
gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt 4080
tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg 4140
tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg 4200
agcgcagcga gtcagtgagc gaggaagcgg aaga 4234
<210> 36
<211> 7429
<212> DNA
<213> Artificial sequence
<220>
<223> vector pFPMT-CL-E1
<400> 36
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttacc agttcatcat 360
catatcccaa gccatacggt gacctgttat gtggccggga tagattgagc aattgcagtc 420
ctgcaccgtc tcatgccggc gaggcgagat ggtgaacagc tgggagacga ggaagacaga 480
tccgcagaga tcccccacgt acatagcgga acagaaagca gccgccccaa cgagcaaatc 540
gacgtggcgt cgtattgtcg tagtggggac gctggcgttc ctagctgcga gcgtgggggt 600
gagcgctacc cagcagcggg aagagttgtt ctcccgaacg cagggcacgc acccgggggt 660
gtgcatgatc atgtccgctg cctcatacac aatgcttgag ttggagcagt cgttcgtgac 720
atggtacatc ccggacacgt tgcgcacctc atatcctagt gctgctagtg gtaggaagca 780
tagtactagt attagtaggc ttcgcatgaa ttcccgatga agcagagagc gcaggaggcg 840
gtatttatag tgccattccc ctctctgaga gacccggatg gtagtcgagt gtatcggaga 900
cagcttgatg tagactccgt gcctgccggc tcctcttatt ggcggacacc agtgagacac 960
cccggaactt gctgtttttc tgcaaaatcc ggggtgacca gtgggagcct atttgcacac 1020
acgagcggga caccccactc tggtgaagag tgccaaagtc attctttttc ccgttgcggg 1080
gcagccgatt gcatgtttta ggaaaatatt acctttgcta caccctgtca gatttaccct 1140
ccacacatat atattccgtc acctccaggg actattattc gtcgttgcgc cgccagcgga 1200
agatatccag aagctgtttt ccgagagact cggttggcgc ctggtatatt tgatggatgt 1260
cgcgctgcct cacgtcccgg tacccaggaa cgcggtggga tctcgggccc atcgaagact 1320
gtgctccaga ctgctcgccc agcaggtgtt tcttgatcgc cgcctctaaa ttgtccgcgc 1380
atcgccggta acatttttcc agctcggagt ttgcgtttag atacagtttc tgcgatgcca 1440
aaggagcctg cagattataa cctcggatgc tgtcattcag cgcttttaat ttgacctcca 1500
gatagttgct gtatttctgt tcccattggc tgctgcgcag cttcgtataa ctcgagttat 1560
tgttgcgctc tgcctcggcg tactggctca tgatctggat cttgtccgtg tcgcttttct 1620
tcgagtgttt ctcgcaaacg atgtgcacgg cctgcagtgt ccaatcggag tcgagctggc 1680
gccgaaactg gcggatctga gcctccacac tgccctgttt ctctatccac ggcggaaccg 1740
cctcctgccg tttcagaatg ttgttcaagt ggtactctgt gcggtcaatg aaggcgttat 1800
tgccggtgaa atctttggga agcggttttc ctcggggaag attacgaaat tccccgcgtc 1860
gttgcgcttc ctggatctcg aggagatcgt tctccgcgtc gaggagatcg ttctccgcgt 1920
cgacaccatt ccttgcggcg gcggtgctca acggcctcaa cctactactg ggctgcttcc 1980
taatgcagga gtcgcataag ggagagcgtc gacaaacccg cgtttgagaa cttgctcaag 2040
cttctggtaa acgttgtagt actctgaaac aaggccctag cactctgatc tgtttctctt 2100
gggtagcggt gagtggttta ttggagttca ctggtttcag cacatctgtc atctagacaa 2160
tattgttact aaattttttt gaactacaat tgttcgtaat tcatctatta ttatacatcc 2220
tcgtcagcaa tttctggcag acggagttta ctaacgtctt gagtatgagg ccgagaatcc 2280
agctctgtgg ccatactcag tcttgacagc ctgctgatgt ggctgcgttc aacgcaataa 2340
gcgtgtcctc cgactccgag ttgtgctcgt tatcgtcgtt ctcatcctcg gaaaaatcac 2400
acgaaagaac atactcacca gtaggctttc tggtccctgg ggcacggctg tttctgacgt 2460
attccggcgt tgataatagc tcgaaagtga acgccgagtc gcgggagtcg accgatgccc 2520
ttgagagcct tcaacccagt cagctccttc cggtgggcgc ggggcatgac tatcgtcgcc 2580
gcacttatga ctgtcttctt tatcatgcaa ctcgtaggac aggtgccggc agcgctctgg 2640
gtcattttcg gcgaggaccg ctttcgctgg agcgcgacga tgatcggcct gtcgcttgcg 2700
gtattcggaa tcttgcacgc cctcgctcaa gccttcgtca ctggtcccgc caccaaacgt 2760
ttcggcgaga agcaggccat tatcgccggc atggcggccg acgcgctggg ctacgtcttg 2820
ctggcgttcg cgacgcgagg ctggatggcc ttccccatta tgattcttct cgcttccggc 2880
ggcatcggga tgcccgcgtt gcaggccatg ctgtccaggc aggtagatga cgaccatcag 2940
ggacagcttc aaggatcgct cgcggctctt accagcctaa cttcgatcac tggaccgctg 3000
atcgtcacgg cgatttatgc cgcctcggcg agcacatgga acgggttggc atggattgta 3060
ggcgccgccc tataccttgt ctgcctcccc gcgttgcgtc gcggtgcatg gagccgggcc 3120
acctcgacct gaatggaagc cggcggcacc tcgctaacgg attcaccact ccaagaattg 3180
gagccaatca attcttgcgg agaactgtga atgcgcaaac caacccttgg cagaacatat 3240
ccatcgcgtc cgccatctcc agcagccgca cgcggcgcat cggggggggg gggggggggg 3300
gggggcaaac aattcatcat ttttttttta ttcttttttt tgatttcggt ttctttgaaa 3360
tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc acagacttag 3420
attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag tattcttaac 3480
ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga aagctacata 3540
taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta atatcatgca 3600
cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg aattactgga 3660
gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg atatcttgac 3720
tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca agtacaattt 3780
tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat tgcagtactc 3840
tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg gtgtggtggg 3900
cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg aacctagagg 3960
ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag aatatactaa 4020
gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta ttgctcaaag 4080
agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg gtgtgggttt 4140
agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg tggtctctac 4200
aggatctgac attattattg ttggaagagg actatttgca aagggaaggg atgctaaggt 4260
agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat gcggccagca 4320
aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa ttagagcttc 4380
aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt ataatgacga 4440
aaaaaaaaaa attggaaaga aaagcccccc cccccccccc cccccccccc ccccccccgc 4500
agcgttgggt cctggccacg ggtgcgcatg atcgtgctcc tgtcgttgag gacccggcta 4560
ggctggcggg gttgccttac tggttagcag aatgaatcac cgatacgcga gcgaacgtga 4620
agcgactgct gctgcaaaac gtctgcgacc tgagcaacaa catgaatggt cttcggtttc 4680
cgtgtttcgt aaagtctgga aacgcggaag tcagcgccct gcaccattat gttccggatc 4740
tgcatcgcag gatgctgctg gctaccctgt ggaacaccta catctgtatt aacgaagcgc 4800
tggcattgac cctgagtgat ttttctctgg tcccgccgca tccataccgc cagttgttta 4860
ccctcacaac gttccagtaa ccgggcatgt tcatcatcag taacccgtat cgtgagcatc 4920
ctctctcgtt tcatcggtat cattaccccc atgaacagaa attccccctt acacggaggc 4980
atcaagtgac caaacaggaa aaaaccgccc ttaacatggc ccgctttatc agaagccaga 5040
cattaacgct tctggagaaa ctcaacgagc tggacgcgga tgaacaggca gacatctgtg 5100
aatcgcttca cgaccacgct gatgagcttt accgcagctg cctcgcgcgt ttcggtgatg 5160
acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg 5220
atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggcg 5280
cagccatgac ccagtcacgt agcgatagcg gagtgtatac tggcttaact atgcggcatc 5340
agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag 5400
gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 5460
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 5520
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 5580
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 5640
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 5700
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 5760
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 5820
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 5880
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 5940
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 6000
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 6060
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 6120
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 6180
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 6240
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 6300
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 6360
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 6420
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 6480
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 6540
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 6600
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 6660
caacgttgtt gccattgctg caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 6720
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 6780
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 6840
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 6900
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 6960
ttgctcttgc ccggcgtcaa cacgggataa taccgcgcca catagcagaa ctttaaaagt 7020
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 7080
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 7140
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 7200
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 7260
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 7320
ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat 7380
gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtcttcaa 7429
<210> 37
<211> 39
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 37
catcacaaat atgaggtgcg caacgtgtcc gggatgtac 39
<210> 38
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 38
gtgatggtgg tgtcctagtg ctgctagtgg taggaagcat ag 42
<210> 39
<211> 4273
<212> DNA
<213> Artificial sequence
<220>
<223> vector pUC18-FMD-CL-E1-H-K6
<220>
<221> misc_feature
<222> (1027)..(1028)
<223> N is any nucleotide
<220>
<221> misc_feature
<222> (1206)..(1207)
<223> N is any nucleotide
<400> 39
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg aattcgagct 240
cggtacccgg ggatccttaa tggtgatggt ggtggtgcca gttcatcatc atatcccaag 300
ccatacggtg acctgttatg tggccgggat agattgagca attgcagtcc tgcaccgtct 360
catgccggcg aggcgagatg gtgaacagct gggagacgag gaagacagat ccgcagagat 420
cccccacgta catagcggaa cagaaagcag ccgccccaac gagcaaatcg acgtggcgtc 480
gtattgtcgt agtggggacg ctggcgttcc tagctgcgag cgtgggggtg agcgctaccc 540
agcagcggga agagttgttc tcccgaacgc agggcacgca cccgggggtg tgcatgatca 600
tgtccgctgc ctcatacaca atgcttgagt tggagcagtc gttcgtgaca tggtacatcc 660
cggacacgtt gcgcacctca tatttgtgat ggtgatggtg gtgtcctagt gctgctagtg 720
gtaggaagca tagtactagt attagtaggc ttcgcatgaa ttcccgatga aggcagagag 780
cgcaaggagg cggtatttat agtgccattc ccctctctga gagacccgga tggtagtcga 840
gtgttatcgg agacagcttg atgtagactc cgtgcctgcc ggtcctctta ttggcggaca 900
ccagtgagac accccggaac ttgctgtttt tctgcaaaat ccggggtgac cagtgggagc 960
ctatttgcac acacgagcgg gacaccccac tctggtgaag agtgccaaag tcattctttt 1020
tcccgtnncg gggcagccga ttgcatgttt taggaaaata ttacctttgc tacaccctgt 1080
cagatttacc ctccacacat atatattccg tcacctccag ggactattct tggctcgttg 1140
cgccgccgcg gaagatatcc agaagctgtg ttttccgaga gactcggttg gcgcctggta 1200
tatttnnagg atgtcgcgct gcctcacgtc ccggtaccca ggaacgcggt gggatctcgg 1260
gcccatcgaa gactgtgctc cagactgctc gcccagcagg tgtttcttga ttgccgcctc 1320
taaatagtcc gcgcatcgcc ggtaacattt ttccagctcg gagtttgcgt ttagatacat 1380
ttctgcgatg ccaaaggagc ctgcagatta taacctcgga tgctgtcatt cagcgctttt 1440
aatttgacct ccagatagtt gctgtatttc tgttccattg gctgctggac gttcgtataa 1500
ctcgagttat tgttgcgctc tgcctcggcg tactggctca tgactgactg cggtcgcttc 1560
tcgagtgttc tcgcaacagg acgcctgcag gtcatcgagt cgagctggcg ccgaaactgg 1620
cggatctgac ctccacactg ccctgtatct ctatccaccg ggaaccgcct cctgccgttc 1680
cagaatgttg ttcaagtggt agctctgtgc ggtcaatgaa ggcgttattg ccggtgaaat 1740
ctttgggaag cggtttatcc tcggggaaga ttacgaaatt cccgcgcgtc gttgcgcttc 1800
ctggatctcg aggaagatcg ttctccgcgt cgaggagatc gttctccgcg tcgacctgca 1860
ggcatgcaag cttggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 1920
ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 1980
aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga 2040
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca 2100
gtacaatctg ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg 2160
acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct 2220
ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg 2280
gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt 2340
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 2400
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 2460
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 2520
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 2580
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 2640
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 2700
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 2760
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 2820
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 2880
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 2940
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 3000
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 3060
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 3120
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 3180
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 3240
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 3300
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 3360
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 3420
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 3480
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 3540
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 3600
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 3660
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 3720
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 3780
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 3840
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 3900
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 3960
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 4020
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 4080
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 4140
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 4200
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 4260
aggaagcgga aga 4273
<210> 40
<211> 7330
<212> DNA
<213> Artificial sequence
<220>
<223> vector pFPMT-CL-H6-K-E1
<220>
<221> misc_feature
<222> (1098)..(1099)
<223> N is any nucleotide
<220>
<221> misc_feature
<222> (1277)..(1278)
<223> N is any nucleotide
<400> 40
ggtaccctgc tcaatctccg gaatggtgat ctgatcgttc ctgaaaacct cgacattggc 60
tccctcctga cacaggtact cgtacaggtt ccaggtaaac gagtcgtagt tgtcgatcat 120
gacaacgttc ttagaagcgg ccggcatttt gaaggtgact aatagcctaa gaaaatattt 180
aatttaattt tcattaaatt ttcctatact cgctatttca gcttttcatc tcatcacttc 240
ataaacgata taaaccagaa aaagaactat tttcaaacac gcttctcaaa agcggtatgt 300
ccttccacgt ctccttagaa tctggcaagt ccgcgagggg gatccttacc agttcatcat 360
catatcccaa gccatacggt gacctgttat gtggccggga tagattgagc aattgcagtc 420
ctgcaccgtc tcatgccggc gaggcgagat ggtgaacagc tgggagacga ggaagacaga 480
tccgcagaga tcccccacgt acatagcgga acagaaagca gccgccccaa cgagcaaatc 540
gacgtggcgt cgtattgtcg tagtggggac gctggcgttc ctagctgcga gcgtgggggt 600
gagcgctacc cagcagcggg aagagttgtt ctcccgaacg cagggcacgc acccgggggt 660
gtgcatgatc atgtccgctg cctcatacac aatgcttgag ttggagcagt cgttcgtgac 720
atggtacatc ccggacacgt tgcgcacctc atatttgtga tggtgatggt ggtgtcctag 780
tgctgctagt ggtaggaagc atagtactag tattagtagg cttcgcatga attcccgatg 840
aaggcagaga gcgcaaggag gcggtattta tagtgccatt cccctctctg agagacccgg 900
atggtagtcg agtgttatcg gagacagctt gatgtagact ccgtgcctgc cggtcctctt 960
attggcggac accagtgaga caccccggaa cttgctgttt ttctgcaaaa tccggggtga 1020
ccagtgggag cctatttgca cacacgagcg ggacacccca ctctggtgaa gagtgccaaa 1080
gtcattcttt ttcccgtnnc ggggcagccg attgcatgtt ttaggaaaat attacctttg 1140
ctacaccctg tcagatttac cctccacaca tatatattcc gtcacctcca gggactattc 1200
ttggctcgtt gcgccgccgc ggaagatatc cagaagctgt gttttccgag agactcggtt 1260
ggcgcctggt atatttnnag gatgtcgcgc tgcctcacgt cccggtaccc aggaacgcgg 1320
tgggatctcg ggcccatcga agactgtgct ccagactgct cgcccagcag gtgtttcttg 1380
attgccgcct ctaaatagtc cgcgcatcgc cggtaacatt tttccagctc ggagtttgcg 1440
tttagataca tttctgcgat gccaaaggag cctgcagatt ataacctcgg atgctgtcat 1500
tcagcgcttt taatttgacc tccagatagt tgctgtattt ctgttccatt ggctgctgga 1560
cgttcgtata actcgagtta ttgttgcgct ctgcctcggc gtactggctc atgactgact 1620
gcggtcgctt ctcgagtgtt ctcgcaacag gacgcctgca ggtcatcgag tcgagctggc 1680
gccgaaactg gcggatctga cctccacact gccctgtatc tctatccacc gggaaccgcc 1740
tcctgccgtt ccagaatgtt gttcaagtgg tagctctgtg cggtcaatga aggcgttatt 1800
gccggtgaaa tctttgggaa gcggtttatc ctcggggaag attacgaaat tcccgcgcgt 1860
cgttgcgctt cctggatctc gaggaagatc gttctccgcg tcgaggagat cgttctccgc 1920
gtcgacctgc aggcatgcaa gcttctggta aacgttgtag tactctgaaa caaggcccta 1980
gcactctgat ctgtttctct tgggtagcgg tgagtggttt attggagttc actggtttca 2040
gcacatctgt catctagaca atattgttac taaatttttt tgaactacaa ttgttcgtaa 2100
ttcatctatt attatacatc ctcgtcagca atttctggca gacggagttt actaacgtct 2160
tgagtatgag gccgagaatc cagctctgtg gccatactca gtcttgacag cctgctgatg 2220
tggctgcgtt caacgcaata agcgtgtcct ccgactccga gttgtgctcg ttatcgtcgt 2280
tctcatcctc ggaaaaatca cacgaaagaa catactcacc agtaggcttt ctggtccctg 2340
gggcacggct gtttctgacg tattccggcg ttgataatag ctcgaaagtg aacgccgagt 2400
cgcgggagtc gaccgatgcc cttgagagcc ttcaacccag tcagctcctt ccggtgggcg 2460
cggggcatga ctatcgtcgc cgcacttatg actgtcttct ttatcatgca actcgtagga 2520
caggtgccgg cagcgctctg ggtcattttc ggcgaggacc gctttcgctg gagcgcgacg 2580
atgatcggcc tgtcgcttgc ggtattcgga atcttgcacg ccctcgctca agccttcgtc 2640
actggtcccg ccaccaaacg tttcggcgag aagcaggcca ttatcgccgg catggcggcc 2700
gacgcgctgg gctacgtctt gctggcgttc gcgacgcgag gctggatggc cttccccatt 2760
atgattcttc tcgcttccgg cggcatcggg atgcccgcgt tgcaggccat gctgtccagg 2820
caggtagatg acgaccatca gggacagctt caaggatcgc tcgcggctct taccagccta 2880
acttcgatca ctggaccgct gatcgtcacg gcgatttatg ccgcctcggc gagcacatgg 2940
aacgggttgg catggattgt aggcgccgcc ctataccttg tctgcctccc cgcgttgcgt 3000
cgcggtgcat ggagccgggc cacctcgacc tgaatggaag ccggcggcac ctcgctaacg 3060
gattcaccac tccaagaatt ggagccaatc aattcttgcg gagaactgtg aatgcgcaaa 3120
ccaacccttg gcagaacata tccatcgcgt ccgccatctc cagcagccgc acgcggcgca 3180
tcgggggggg gggggggggg ggggggcaaa caattcatca tttttttttt attctttttt 3240
ttgatttcgg tttctttgaa atttttttga ttcggtaatc tccgaacaga aggaagaacg 3300
aaggaaggag cacagactta gattggtata tatacgcata tgtagtgttg aagaaacatg 3360
aaattgccca gtattcttaa cccaactgca cagaacaaaa acctgcagga aacgaagata 3420
aatcatgtcg aaagctacat ataaggaacg tgctgctact catcctagtc ctgttgctgc 3480
caagctattt aatatcatgc acgaaaagca aacaaacttg tgtgcttcat tggatgttcg 3540
taccaccaag gaattactgg agttagttga agcattaggt cccaaaattt gtttactaaa 3600
aacacatgtg gatatcttga ctgatttttc catggagggc acagttaagc cgctaaaggc 3660
attatccgcc aagtacaatt ttttactctt cgaagacaga aaatttgctg acattggtaa 3720
tacagtcaaa ttgcagtact ctgcgggtgt atacagaata gcagaatggg cagacattac 3780
gaatgcacac ggtgtggtgg gcccaggtat tgttagcggt ttgaagcagg cggcagaaga 3840
agtaacaaag gaacctagag gccttttgat gttagcagaa ttgtcatgca agggctccct 3900
atctactgga gaatatacta agggtactgt tgacattgcg aagagcgaca aagattttgt 3960
tatcggcttt attgctcaaa gagacatggg tggaagagat gaaggttacg attggttgat 4020
tatgacaccc ggtgtgggtt tagatgacaa gggagacgca ttgggtcaac agtatagaac 4080
cgtggatgat gtggtctcta caggatctga cattattatt gttggaagag gactatttgc 4140
aaagggaagg gatgctaagg tagagggtga acgttacaga aaagcaggct gggaagcata 4200
tttgagaaga tgcggccagc aaaactaaaa aactgtatta taagtaaatg catgtatact 4260
aaactcacaa attagagctt caatttaatt atatcagtta ttacccggga atctcggtcg 4320
taatgatttt tataatgacg aaaaaaaaaa aattggaaag aaaagccccc cccccccccc 4380
cccccccccc cccccccccg cagcgttggg tcctggccac gggtgcgcat gatcgtgctc 4440
ctgtcgttga ggacccggct aggctggcgg ggttgcctta ctggttagca gaatgaatca 4500
ccgatacgcg agcgaacgtg aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca 4560
acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc 4620
tgcaccatta tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct 4680
acatctgtat taacgaagcg ctggcattga ccctgagtga tttttctctg gtcccgccgc 4740
atccataccg ccagttgttt accctcacaa cgttccagta accgggcatg ttcatcatca 4800
gtaacccgta tcgtgagcat cctctctcgt ttcatcggta tcattacccc catgaacaga 4860
aattccccct tacacggagg catcaagtga ccaaacagga aaaaaccgcc cttaacatgg 4920
cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg 4980
atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct 5040
gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 5100
tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 5160
gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata 5220
ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga 5280
aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 5340
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 5400
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 5460
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 5520
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 5580
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 5640
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 5700
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 5760
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 5820
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 5880
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 5940
tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 6000
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 6060
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 6120
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 6180
aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 6240
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 6300
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 6360
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 6420
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 6480
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 6540
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg 6600
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 6660
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 6720
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 6780
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 6840
atagtgtatg cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc 6900
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 6960
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 7020
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 7080
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 7140
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 7200
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 7260
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 7320
tcgtcttcaa 7330
<210> 41
<211> 5202
<212> DNA
<213> Artificial sequence
<220>
<223> vector pYIG5
<400> 41
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata 240
cgactcacta tagggaattc gaggatcctt caatatgcgc acatacgctg ttatgttcaa 300
ggtcccttcg tttaagaacg aaagcggtct tccttttgag ggatgtttca agttgttcaa 360
atctatcaaa tttgcaaatc cccagtctgt atctagagcg ttgaatcggt gatgcgattt 420
gttaattaaa ttgatggtgt caccattacc aggtctagat ataccaatgg caaactgagc 480
acaacaatac cagtccggat caactggcac catctctccc gtagtctcat ctaatttttc 540
ttccggatga ggttccagat ataccgcaac acctttatta tggtttccct gagggaataa 600
tagaatgtcc cattcgaaat caccaattct aaacctgggc gaattgtatt tcgggtttgt 660
taactcgttc cagtcaggaa tgttccacgt gaagctatct tccagcaaag tctccacttc 720
ttcatcaaat tgtggagaat actcccaatg ctcttatcta tgggacttcc gggaaacaca 780
gtaccgatac ttcccaattc gtcttcagag ctcattgttt gtttgaagag actaatcaaa 840
gaatcgtttt ctcaaaaaaa ttaatatctt aactgatagt ttgatcaaag gggcaaaacg 900
taggggcaaa caaacggaaa aatcgtttct caaattttct gatgccaaga actctaacca 960
gtcttatcta aaaattgcct tatgatccgt ctctccggtt acagcctgtg taactgatta 1020
atcctgcctt tctaatcacc attctaatgt tttaattaag ggattttgtc ttcattaacg 1080
gctttcgctc ataaaaatgt tatgacgttt tgcccgcagg cgggaaacca tccacttcac 1140
gagactgatc tcctctgccg gaacaccggg catctccaac ttataagttg gagaaataag 1200
agaatttcag attgagagaa tgaaaaaaaa aaaccctgaa aaaaaaggtt gaaaccagtt 1260
ccctgaaatt attcccctac ttgactaata agtatataaa gacggtaggt attgattgta 1320
attctgtaaa tctatttctt aaacttctta aattctactt ttatagttag tctttttttt 1380
agttttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac accatgagat 1440
ttccttcaat ttttactgca gttttattcg cagcatcctc cgcattagct gctccagtca 1500
acactacaac agaagatgaa acggcacaaa ttccggctga agctgtcatc ggttactcag 1560
atttagaagg ggatttcgat gttgctgttt tgccattttc caacagcaca aataacgggt 1620
tattgtttat aaatactact attgccagca ttgctgctaa agaagaaggg gtatctctag 1680
ataaaaggcc tgtcgacggt accagatctc gacttggttg aacacgttgc caaggcttaa 1740
gtgaatttac tttaaagtct tgcatttaaa taaattttct ttttatagct ttatgactta 1800
gtttcaattt atatactatt ttaatgacat tttcgattca ttgattgaaa gctttgtgtt 1860
ttttcttgat gcgctattgc attgttcttg tctttttcgc cacatgtaat atctgtagta 1920
gatacctgat acattgtgga tgctgagtga aattttagtt aataatggag gcgctcttaa 1980
taattttggg gatattggct ttttttttta aagtttacaa atgaattttt tccgccagga 2040
taacgattct gaagttactc ttagcgttcc tatcggtaca gccatcaaat catgcctata 2100
aatcatgcct atatttgcgt gcagtcagta tcatctacat gaaaaaaact cccgcaattt 2160
cttatagaat acgttgaaaa ttaaatgtac gcgccaagat aagataacat atatctagct 2220
agatgcagta atatacacag attcccgcgg acgtgggaag gaaaaaatta gataacaaaa 2280
tctgagtgat atggaaattc cgctgtatag ctcatatctt tcccttcaac accagaaatg 2340
taaaaatctt gttacgaagg atctttttgc taatgtttct cgctcaatcc tcatttcttc 2400
cctacgaaga gtcaaatcta cttgttttct gccggtatca agatccatat cttctagttt 2460
caccatcaaa gtccaatttc tagtatacag tttatgtccc aacgtaacag acaatcaaaa 2520
ttggaaagga taagtatcct tcaaagaatg attctgcgct ggctcctgaa ccgcctaatg 2580
ggaacagaga agtccaaaac gatgctataa gaaccagaaa taaaacgata aaaccatacc 2640
aggatccaag cttggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 2700
ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 2760
aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tgggaaattg 2820
taaacgttaa tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta 2880
accaataggc cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt 2940
tgagtgttgt tccagtttgg aacaagagtc cactattaaa gaacgtggac tccaacgtca 3000
aagggcgaaa aaccgtctat cagggcgatg gcccactacg tgaaccatca ccctaatcaa 3060
gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa ccctaaaggg agcccccgat 3120
ttagagcttg acggggaaag ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag 3180
gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct gcgcgtaacc accacacccg 3240
ccgcgcttaa tgcgccgcta cagggcgcgt caggtggcac ttttcgggga aatgtgcgcg 3300
gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat 3360
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc 3420
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa 3480
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac 3540
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga 3600
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag 3660
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca 3720
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca 3780
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa 3840
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc 3900
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa 3960
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag 4020
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct 4080
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac 4140
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa 4200
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt 4260
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat 4320
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg 4380
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc 4440
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg 4500
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag 4560
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact 4620
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg 4680
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc 4740
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg 4800
aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg 4860
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag 4920
ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc 4980
gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct 5040
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc 5100
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc 5160
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga ag 5202
<210> 42
<211> 5613
<212> DNA
<213> Artificial sequence
<220>
<223> vector pYIG5E1H6
<400> 42
ggatccttca atatgcgcac atacgctgtt atgttcaagg tcccttcgtt taagaacgaa 60
agcggtcttc cttttgaggg atgtttcaag ttgttcaaat ctatcaaatt tgcaaatccc 120
cagtctgtat ctagagcgtt gaatcggtga tgcgatttgt taattaaatt gatggtgtca 180
ccattaccag gtctagatat accaatggca aactgagcac aacaatacca gtccggatca 240
actggcacca tctctcccgt agtctcatct aatttttctt ccggatgagg ttccagatat 300
accgcaacac ctttattatg gtttccctga gggaataata gaatgtccca ttcgaaatca 360
ccaattctaa acctgggcga attgtatttc gggtttgtta actcgttcca gtcaggaatg 420
ttccacgtga agctatcttc cagcaaagtc tccacttctt catcaaattg tggagaatac 480
tcccaatgct cttatctatg ggacttccgg gaaacacagt accgatactt cccaattcgt 540
cttcagagct cattgtttgt ttgaagagac taatcaaaga atcgttttct caaaaaaatt 600
aatatcttaa ctgatagttt gatcaaaggg gcaaaacgta ggggcaaaca aacggaaaaa 660
tcgtttctca aattttctga tgccaagaac tctaaccagt cttatctaaa aattgcctta 720
tgatccgtct ctccggttac agcctgtgta actgattaat cctgcctttc taatcaccat 780
tctaatgttt taattaaggg attttgtctt cattaacggc tttcgctcat aaaaatgtta 840
tgacgttttg cccgcaggcg ggaaaccatc cacttcacga gactgatctc ctctgccgga 900
acaccgggca tctccaactt ataagttgga gaaataagag aatttcagat tgagagaatg 960
aaaaaaaaaa accctgaaaa aaaaggttga aaccagttcc ctgaaattat tcccctactt 1020
gactaataag tatataaaga cggtaggtat tgattgtaat tctgtaaatc tatttcttaa 1080
acttcttaaa ttctactttt atagttagtc ttttttttag ttttaaaaca ccaagaactt 1140
agtttcgaat aaacacacat aaacaaacac catgagattt ccttcaattt ttactgcagt 1200
tttattcgca gcatcctccg cattagctgc tccagtcaac actacaacag aagatgaaac 1260
ggcacaaatt ccggctgaag ctgtcatcgg ttacttagat ttagaagggg atttcgatgt 1320
tgctgttttg ccattttcca acagcacaaa taacgggtta ttgtttataa atactactat 1380
tgccagcatt gctgctaaag aagaaggggt atctctagat aaaaggtatg aggtgcgcaa 1440
cgtgtccggg atgtaccatg tcacgaacga ctgctccaac tcaagcattg tgtatgaggc 1500
agcggacatg atcatgcaca cccccgggtg cgtgccctgc gttcgggaga acaactcttc 1560
ccgctgctgg gtagcgctca cccccacgct cgcagctagg aacgccagcg tccccactac 1620
gacaatacga cgccacgtcg atttgctcgt tggggcggct gctttctgtt ccgctatgta 1680
cgtgggggat ctctgcggat ctgtcttcct cgtctcccag ctgttcacca tctcgcctcg 1740
ccggcatgag acggtgcagg actgcaattg ctcaatctat cccggccaca taacaggtca 1800
ccgtatggct tgggatatga tgatgaactg gcaccaccac catcaccatt aaagatctcg 1860
acttggttga acacgttgcc aaggcttaag tgaatttact ttaaagtctt gcatttaaat 1920
aaattttctt tttatagctt tatgacttag tttcaattta tatactattt taatgacatt 1980
ttcgattcat tgattgaaag ctttgtgttt tttcttgatg cgctattgca ttgttcttgt 2040
ctttttcgcc acatgtaata tctgtagtag atacctgata cattgtggat gctgagtgaa 2100
attttagtta ataatggagg cgctcttaat aattttgggg atattggctt ttttttttaa 2160
agtttacaaa tgaatttttt ccgccaggat aacgattctg aagttactct tagcgttcct 2220
atcggtacag ccatcaaatc atgcctataa atcatgccta tatttgcgtg cagtcagtat 2280
catctacatg aaaaaaactc ccgcaatttc ttatagaata cgttgaaaat taaatgtacg 2340
cgccaagata agataacata tatctagcta gatgcagtaa tatacacaga ttcccgcgga 2400
cgtgggaagg aaaaaattag ataacaaaat ctgagtgata tggaaattcc gctgtatagc 2460
tcatatcttt cccttcaaca ccagaaatgt aaaaatcttg ttacgaagga tctttttgct 2520
aatgtttctc gctcaatcct catttcttcc ctacgaagag tcaaatctac ttgttttctg 2580
ccggtatcaa gatccatatc ttctagtttc accatcaaag tccaatttct agtatacagt 2640
ttatgtccca acgtaacaga caatcaaaat tggaaaggat aagtatcctt caaagaatga 2700
ttctgcgctg gctcctgaac cgcctaatgg gaacagagaa gtccaaaacg atgctataag 2760
aaccagaaat aaaacgataa aaccatacca ggatccaagc ttggcactgg ccgtcgtttt 2820
acaacgtcgt gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc 2880
ccctttcgcc agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt 2940
gcgcagcctg aatggcgaat gggaaattgt aaacgttaat attttgttaa aattcgcgtt 3000
aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta 3060
taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc 3120
actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg 3180
cccactacgt gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact 3240
aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt 3300
ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc 3360
ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc 3420
aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 3480
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 3540
aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 3600
ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 3660
gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 3720
ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 3780
ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 3840
gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 3900
aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 3960
gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 4020
aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 4080
caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 4140
tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 4200
acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 4260
gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 4320
agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 4380
gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 4440
ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 4500
taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 4560
agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 4620
aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 4680
ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc ttctagtgta 4740
gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 4800
aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 4860
aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 4920
gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agcattgaga 4980
aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 5040
aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 5100
cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 5160
cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 5220
tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 5280
tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 5340
ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 5400
atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 5460
tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 5520
gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 5580
cgaatttaat acgactcact atagggaatt cga 5613
<210> 43
<211> 13020
<212> DNA
<213> Artificial sequence
<220>
<223> vector pSY1
<400> 43
atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt 60
ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc 120
acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag 180
tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga 240
aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta 300
atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg 360
aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg 420
atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca 480
agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat 540
tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg 600
gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg 660
aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag 720
aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta 780
ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg 840
gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg 900
tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg 960
atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat 1020
gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa 1080
ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt 1140
ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt 1200
taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc 1260
tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc 1320
tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc 1380
tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg 1440
gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg 1500
cgaccacacc cgtcctgtgg atcctctacg ccggacgcat cgtggccggc atcaccggcg 1560
ccacaggtgc ggttgctggc ccctatatcg ccgacatcac cgatggggaa gatcgggctc 1620
gccacttcgg gctcatgagc gcttgtttcg gcgtgggtat ggtggcaggc cccgtggccg 1680
ggggactgtt gggcgccatc tccttgcatg caccattcct tgcggcggcg gtgctcaacg 1740
gcctcaacct actactgggc tgcttcctaa tgcaggagtc gcataaggga gagcgtcgac 1800
cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg ggcatgacta 1860
tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag gtgccggcag 1920
cgctctgggt cattttcggc gaggaccgct ttcgctggag cgcgacgatg atcggcctgt 1980
cgcttgcggt attcggaatc ttgcacgccc tcgctcaagc cttcgtcact ggtcccgcca 2040
ccaaacgttt cggcgagaag caggccatta tcgccggcat ggcggccgac gcgctgggct 2100
acgtcttgct ggcgttcgcg acgcgaggct ggatggcctt ccccattatg attcttctcg 2160
cttccggcgg catcgggatg cccgcgttgc aggccatgct gtccaggcag gtagatgacg 2220
accatcaggg acagcttcaa ggatcgctcg cggctcttac cagcctaact tcgatcactg 2280
gaccgctgat cgtcacggcg atttatgccg cctcggcgag cacatggaac gggttggcat 2340
ggattgtagg cgccgcccta taccttgtct gcctccccgc gttgcgtcgc ggtgcatgga 2400
gccgggccac ctcgacctga atggaagccg gcggcacctc gctaacggat tcaccactcc 2460
aagaattgga gccaatcaat tcttgcggag aactgtgaat gcgcaaacca acccttggca 2520
gaacatatcc atcgcgtccg ccatctccag cagccgcacg cggcgcatct cgggcagcgt 2580
tgggtcctgg ccacgggtgc gcatgatcgt gctcctgtcg ttgaggaccc ggctaggctg 2640
gcggggttgc cttactggtt agcagaatga atcaccgata cgcgagcgaa cgtgaagcga 2700
ctgctgctgc aaaacgtctg cgacctgagc aacaacatga atggtcttcg gtttccgtgt 2760
ttcgtaaagt ctggaaacgc ggaagtcagc gccctgcacc attatgttcc ggatctgcat 2820
cgcaggatgc tgctggctac cctgtggaac acctacatct gtattaacga agcgctggca 2880
ttgaccctga gtgatttttc tctggtcccg ccgcatccat accgccagtt gtttaccctc 2940
acaacgttcc agtaaccggg catgttcatc atcagtaacc cgtatcgtga gcatcctctc 3000
tcgtttcatc ggtatcatta cccccatgaa cagaaattcc cccttacacg gaggcatcaa 3060
gtgaccaaac aggaaaaaac cgcccttaac atggcccgct ttatcagaag ccagacatta 3120
acgcttctgg agaaactcaa cgagctggac gcggatgaac aggcagacat ctgtgaatcg 3180
cttcacgacc acgctgatga gctttaccgc agctgcctcg cgcgtttcgg tgatgacggt 3240
gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggtgccg 3300
ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca 3360
tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg catcagagca 3420
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa 3480
ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 3540
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 3600
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 3660
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 3720
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 3780
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 3840
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 3900
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 3960
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 4020
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 4080
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 4140
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 4200
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 4260
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 4320
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 4380
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 4440
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 4500
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 4560
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 4620
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 4680
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 4740
tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 4800
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 4860
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 4920
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 4980
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 5040
ttgcccggcg tcaacacggg ataataccgc gccacatagc agaactttaa aagtgctcat 5100
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 5160
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 5220
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 5280
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 5340
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 5400
gcgcacattt ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt 5460
aacctataaa aaataggcgt atcacgaggc cctttcgtct tcaagaattc tcatgtttga 5520
cagcttatca tcgatccact tgtatatttg gatgaatttt tgaggaattc tgaaccagtc 5580
ctaaaacgag taaataggac cggcaattct tcaagcaata aacaggaata ccaattatta 5640
aaagataact tagtcagatc gtacaataaa gctttgaaga aaaatgcgcc ttattcaatc 5700
tttgcataaa aaaatggccc aaaatctcac attggaagac atttgatgac ctcatttctt 5760
tcaatgaagg gcctaacgga gttgactaat gttgtgggaa attggaccga taagcgtgct 5820
tctgccgtgg ccaggacaac gtatactcat cagataacag caatacctga tcactacttc 5880
gcactagttt ctcggtacta tgcatatgat ccaatatcaa aggaaatgat agcattgaag 5940
gatgagacta atccaattga ggagtggcag catatagaac agctaaaggg tagtgctgaa 6000
ggaagcatac gataccccgc atggaatggg ataatatcac aggaggtact agactacctt 6060
tcatcctaca taaatagacg catataagta cgcatttaag cataaacacg cactatgccg 6120
ttcttctcat gtatatatat atacaggcaa cacgcagata taggtgcgac gtgaacagtg 6180
agctgtatgt gcgcagctcg cgttgcattt tcggaagcgc tcgttttcgg aaacgctttg 6240
aagttcctat tccgaagttc ctattctcta gaaagtatag gaacttcaga gcgcttttga 6300
aaaccaaaag cgctctgaag acgcactttc aaaaaaccaa aaacgcaccg gactgtaacg 6360
agctactaaa atattgcgaa taccgcttcc acaaacattg ctcaaaagta tctctttgct 6420
atatatctct gtgctatatc cctatataac catcccatcc acctttcgct ccttgaactt 6480
gcatctaaac tcgacctcta cattttttat gtttatctct agtattacct cttagacaaa 6540
aaaattgtag taagaactat tcatagagtt aatcgaaaac aatacgaaaa tgtaaacatt 6600
tcctatacgt agtatataga gacaaaatag aagaaaccgt tcataatttt ctgaccaatg 6660
aagaatcatc aacgctatca ctttctgttc acaaagtatg cgcaatccac atcggtatag 6720
aatataatcg gggatgcctt tatcttgaaa aaatgcaccc gcagcttcgc tagtaatcag 6780
taaacgcggg aagtggagtc aggctttttt tatggaagag aaaatagaca ccaaagtagc 6840
cttcttctaa ccttaacgga cctacagtgc aaaaagttat caagagactg cattatagag 6900
cgcacaaagg agaaaaaaag taatctaaga tgctttgtta gaaaaatagc gctctcggga 6960
tgcatttttg tagaacaaaa aagaagtata gattcttgtt ggtaaaatag cgctctcgcg 7020
ttgcatttct gttctgtaaa aatgcagctc agattctttg tttgaaaaat tagcgctctc 7080
gcgttgcatt tttgttttac aaaaatgaag cacagattct tcgttggtaa aatagcgctt 7140
tcgcgttgca tttctgttct gtaaaaatgc agctcagatt ctttgtttga aaaattagcg 7200
ctctcgcgtt gcatttttgt tctacaaaat gaagcacaga tgcttcgtta acaaagatat 7260
gctattgaag tgcaagatgg aaacgcagaa aatgaaccgg ggatgcgacg tgcaagatta 7320
cctatgcaat agatgcaata gtttctccag gaaccgaaat acatacattg tcttccgtaa 7380
agcgctagac tatatattat tatacaggtt caaatatact atctgtttca gggaaaactc 7440
ccaggttcgg atgttcaaaa ttcaatgatg ggtaacaagt acgatcgtaa atctgtaaaa 7500
cagtttgtcg gatattaggc tgtatctcct caaagcgtat tcgaatatca ttgagaagct 7560
gcattttttt tttttttttt tttttttttt tttttatata tatttcaagg atataccatt 7620
gtaatgtctg cccctaagaa gatcgtcgtt ttgccaggtg accacgttgg tcaagaaatc 7680
acagccgaag ccattaaggt tcttaaagct atttctgatg ttcgttccaa tgtcaagttc 7740
gatttcgaaa atcatttaat tggtggtgct gctatcgatg ctacaggtgt cccacttcca 7800
gatgaggcgc tggaagcctc caagaaggtt gatgccgttt tgttaggtgc tgtgggtggt 7860
cctaaatggg gtaccggtag tgttagacct gaacaaggtt tactaaaaat ccgtaaagaa 7920
cttcaattgt acgccaactt aagaccatgt aactttgcat ccgactctct tttagactta 7980
tctccaatca agccacaatt tgctaaaggt actgacttcg ttgttgtcag agaattagtg 8040
ggaggtattt actttggtaa gagaaaggaa gacgatggtg atggtgtcgc ttgggatagt 8100
gaacaataca ccgttccaga agtgcaaaga atcacaagaa tggccgcttt catggcccta 8160
caacatgagc caccattgcc tatttggtcc ttggataaag ctaatgtttt ggcctcttca 8220
agattatgga gaaaaactgt ggaggaaacc atcaagaacg aattccctac attgaaggtt 8280
caacatcaat tgattgattc tgccgccatg atcctagtta agaacccaac ccacctaaat 8340
ggtattataa tcaccagcaa catgtttggt gatatcatct ccgatgaagc ctccgttatc 8400
ccaggttcct tgggtttgtt gccatctgcg tccttggcct ctttgccaga caagaacacc 8460
gcatttggtt tgtacgaacc atgccacggt tctgctccag atttgccaaa gaataaggtt 8520
gaccctatcg ccactatctt gtctgctgca atgatgttga aattgtcatt gaacttgcct 8580
gaagaaggta aggccattga agatgcagtt aaaaaggttt tggatgcagg tatcagaact 8640
ggtgatttag gtggttccaa cagtaccacc gaagtcggtg atgctgtcgc cgaagaagtt 8700
aagaaaatcc ttgcttaaaa agattctctt tttttatgat atttgtacaa aaaaaaaaaa 8760
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcagc gtcacatcgg ataataatga 8820
tggcagccat tgtagaagtg ccttttgcat ttctagtctc tttctcggtc tagctagttt 8880
tactacatcg cgaagataga atcttagatc acactgcctt tgctgagctg gatcatatga 8940
gtaacaaaag agtggtaagg cctcgttaaa ggacaaggac ctgagcggaa gtgtatcgta 9000
aagtagacgg agtatactag tatagtctat agtccgtgga attctaagtg ccagctttat 9060
aatgtcattc tccttactac agacccgcct gaaagtagac acatcatcat cagtaagctt 9120
tgacaaaaag cattgagtag ctaactcttc tatgcaatct atagctgttt tataaggcat 9180
tcaatggaca gattgaggtt tttgaaacat actagtgaaa ttagccttaa tcccttctcg 9240
aagttaatca tgcattatgg tgtaaaaaat gcaactcgcg ttgctctact ttttcccgaa 9300
tttccaaata cgcagctggg gtgattgctc gatttcgtaa cgaaagtttt gtttataaaa 9360
accgcgaaaa ccttctgtaa cagatagatt tttacagcgc tgatatacaa tgacatcagc 9420
tgtaatggaa aataactgaa atatgaatgg cgagagactg cttgcttgta ttaagcaatg 9480
tattatgcag cacttccaac ctatggtgta cgatgaaagt aggtgtgtaa tcgagacgac 9540
aagggggact tttccagttc ctgatcatta taagaaatac aaaacgttag catttgcatt 9600
tgttggacat gtactgaata cagacgacac accggtaatt gaaaaagaac tggattggcc 9660
tgatcctgca ctagtgtaca atacaattgt cgatcgaatc ataaatcacc cagaattatc 9720
acagtttata tcggttgcat ttattagtca gttaaaggcc accatcggag agggtttaga 9780
tattaatgta aaaggcacgc taaaccgcag gggaaagggt atcagaaggc ctaaaggcgt 9840
attttttaga tacatggaat ctccatttgt caatacaaag gtcactgcat tcttctctta 9900
tcttcgagat tataataaaa ttgcctcaga atatcacaat aatactaaat tcattctcac 9960
gttttcatgt caagcatatt gggcatctgg cccaaacttc tccgccttga agaatgttat 10020
ttggtgctcc ataattcatg aatacatttc taagtttgtg gaaagagaac aggataaagg 10080
tcatatagga gatcaggagc taccgcctga agaggaccct tctcgtgaac taaacaatgt 10140
acaacatgaa gtcaatagtt taacggaaca agatgcggag gcggatgaag gattgtgggg 10200
tgaaatagat tcattatgtg aaaaatggca gtctgaagcg gagagtcaaa ctgaggcgga 10260
gataatagcc gacaggataa ttggaaatag ccagaggatg gcgaacctca aaattcgtcg 10320
tacaaagttc aaaagtgtct tgtatcatat actaaaggaa ctaattcaat ctcagggaac 10380
cgtaaaggtt tatcgcggta gtagtttttc acacgattcg ataaagataa gcttacatta 10440
tgaagagcag catattacag ccgtatgggt ctacttgata gtaaaatttg aagagcattg 10500
gaagcctgtt gatgtagagg tcgagtttag atgcaagttc aaggagcgaa aggtggatgg 10560
gtaggttata tagggatata gcacagagat atatagcaaa gagatacttt tgaggcaatg 10620
tttgtggaag cggtattcgc aatattttag tagctcgtta cagtccggtg cgtttttggt 10680
tttttgaaag tgcgtcttca gagcgctttt ggttttcaaa agcgctctga agttcctata 10740
ctttctagag aataggaact tcggaatagg aacttcaaag cgtttccgaa aacgagcgct 10800
tccgaaaatg caacgcgagc tgcgcacata cagctcactg ttcacgtcgc acctatatct 10860
gcgtgttgcc tgtatatata tatacatgag aagaacggca tagtgcgtgt ttatgcttaa 10920
atgcgtactt atatgcgtct atttatgtag gatgaaaggt agtctagtac ctcctgtgat 10980
attatcccat tccatgcggg gtatcgtatg cttccttcag cactaccctt tagctgttct 11040
atatgctgcc actcctcaat tggattagtc tcatccttca atgcattcat ttcctttgat 11100
attggatcat accctagaag tattacgtga ttttctgccc cttaccctcg ttgctactct 11160
cctttttttc gtgggaaccg ctttagggcc ctcagtgatg gtgttttgta atttatatgc 11220
tcctcttgca tttgtgtctc tacttcttgt tcgcctggag ggaacttctt catttgtatt 11280
agcatggttc acttcagtcc ttccttccaa ctcactcttt ttttgctgta aacgattctc 11340
tgccgccagt tcattgaaac tattgaatat atcctttaga gattccggga tgaataaatc 11400
acctattaaa gcagcttgac gatctggtgg aactaaagta agcaattggg taacgacgct 11460
tacgagcttc ataacatctt cttccgttgg agctggtggg actaataact gtgtacaatc 11520
catttttctc atgagcattt cggtagctct cttcttgtct ttctcgggca atcttcctat 11580
tattatagca atagatttgt atagttgctt tctattgtct aacagcttgt tattctgtag 11640
catcaaatct atggcagcct gacttgcttc ttgtgaagag agcataccat ttccaatcga 11700
agatacgctg gaatcttctg cgctagaatc aagaccatac ggcctaccgg ttgtgagaga 11760
ttccatgggc cttatgacat atcctggaaa gagtagctca tcagacttac gtttactctc 11820
tatatcaata tctacatcag gagcaatcat ttcaataaac agccgacata catcccagac 11880
gctataagct gtacgtgctt ttaccgtcag attcttggct gtttcaatgt cgtccatttt 11940
ggttttcttt taccagtatt gttcgtttga taatgtattc ttgcttatta cattataaaa 12000
tctgtgcaga tcacatgtca aaacaacttt ttatcacaag atagtaccgc aaaacgaacc 12060
tgcgggccgt ctaaaaatta aggaaaagca gcaaaggtgc atttttaaaa tatgaaatga 12120
agataccgca gtaccaatta ttttcgcagt acaaataatg cgcggccggt gcatttttcg 12180
aaagaacgcg agacaaacag gacaattaaa gttagttttt cgagttagcg tgtttgaata 12240
ctgcaagata caagataaat agagtagttg aaactagata tcaattgcac acaagatcgg 12300
cgctaagcat gccacaattt ggtatattat gtaaaacacc acctaaggtg cttgttcgtc 12360
agtttgtgga aaggtttgaa agaccttcag gtgagaaaat agcattatgt gctgctgaac 12420
taacctattt atgttggatg attacacata acggaacagc aatcaagaga gccacattca 12480
tgagctataa tactatcata agcaattcgc tgagtttcga tattgtcaat aaatcactcc 12540
agtttaaata caagacgcaa aaagcaacaa ttctggaagc ctcattaaag aaattgattc 12600
ctgcttggga atttacaatt attccttact atggacaaaa acatcaatct gatatcactg 12660
atattgtaag tagtttgcaa ttacagttcg aatcatcgga agaagcagat aagggaaata 12720
gccacagtaa aaaaatgcta aagcacttct aagtgagggt gaaagcatct gggagatcac 12780
tgagaaaata ctaaattcgt ttgagtatac ttcgagattt acaaaaacaa aaactttata 12840
ccaattcctc ttcctagcta ctttcatcaa ttgtggaaga ttcagcgata ttaagaacgt 12900
tgatccgaaa tcatttaaat tagtccaaaa taagtatctg ggagtaataa tccagtgttt 12960
agtgacagag acaaagacaa gcgttagtag gcacatatac ttctttagcg caaggggtag 13020
<210> 44
<211> 15810
<212> DNA
<213> Artificial sequence
<220>
<223> vector pSY1AMFE1sH6a
<400> 44
atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt 60
ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc 120
acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag 180
tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga 240
aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta 300
atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg 360
aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg 420
atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca 480
agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat 540
tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg 600
gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg 660
aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag 720
aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta 780
ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg 840
gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg 900
tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg 960
atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat 1020
gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa 1080
ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt 1140
ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt 1200
taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc 1260
tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc 1320
tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc 1380
tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg 1440
gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg 1500
cgaccacacc cgtcctgtgg atccttcaat atgcgcacat acgctgttat gttcaaggtc 1560
ccttcgttta agaacgaaag cggtcttcct tttgagggat gtttcaagtt gttcaaatct 1620
atcaaatttg caaatcccca gtctgtatct agagcgttga atcggtgatg cgatttgtta 1680
attaaattga tggtgtcacc attaccaggt ctagatatac caatggcaaa ctgagcacaa 1740
caataccagt ccggatcaac tggcaccatc tctcccgtag tctcatctaa tttttcttcc 1800
ggatgaggtt ccagatatac cgcaacacct ttattatggt ttccctgagg gaataataga 1860
atgtcccatt cgaaatcacc aattctaaac ctgggcgaat tgtatttcgg gtttgttaac 1920
tcgttccagt caggaatgtt ccacgtgaag ctatcttcca gcaaagtctc cacttcttca 1980
tcaaattgtg gagaatactc ccaatgctct tatctatggg acttccggga aacacagtac 2040
cgatacttcc caattcgtct tcagagctca ttgtttgttt gaagagacta atcaaagaat 2100
cgttttctca aaaaaattaa tatcttaact gatagtttga tcaaaggggc aaaacgtagg 2160
ggcaaacaaa cggaaaaatc gtttctcaaa ttttctgatg ccaagaactc taaccagtct 2220
tatctaaaaa ttgccttatg atccgtctct ccggttacag cctgtgtaac tgattaatcc 2280
tgcctttcta atcaccattc taatgtttta attaagggat tttgtcttca ttaacggctt 2340
tcgctcataa aaatgttatg acgttttgcc cgcaggcggg aaaccatcca cttcacgaga 2400
ctgatctcct ctgccggaac accgggcatc tccaacttat aagttggaga aataagagaa 2460
tttcagattg agagaatgaa aaaaaaaaac cctgaaaaaa aaggttgaaa ccagttccct 2520
gaaattattc ccctacttga ctaataagta tataaagacg gtaggtattg attgtaattc 2580
tgtaaatcta tttcttaaac ttcttaaatt ctacttttat agttagtctt ttttttagtt 2640
ttaaaacacc aagaacttag tttcgaataa acacacataa acaaacacca tgagatttcc 2700
ttcaattttt actgcagttt tattcgcagc atcctccgca ttagctgctc cagtcaacac 2760
tacaacagaa gatgaaacgg cacaaattcc ggctgaagct gtcatcggtt actcagattt 2820
agaaggggat ttcgatgttg ctgttttgcc attttccaac agcacaaata acgggttatt 2880
gtttataaat actactattg ccagcattgc tgctaaagaa gaaggggtat ctctagataa 2940
aaggtatgag gtgcgcaacg tgtccgggat gtaccatgtc acgaacgact gctccaactc 3000
aagcattgtg tatgaggcag cggacatgat catgcacacc cccgggtgcg tgccctgcgt 3060
tcgggagaac aactcttccc gctgctgggt agcgctcacc cccacgctcg cagctaggaa 3120
cgccagcgtc cccactacga caatacgacg ccacgtcgat ttgctcgttg gggcggctgc 3180
tttctgttcc gctatgtacg tgggggatct ctgcggatct gtcttcctcg tctcccagct 3240
gttcaccatc tcgcctcgcc ggcatgagac ggtgcaggac tgcaattgct caatctatcc 3300
cggccacata acgggtcacc gtatggcttg ggatatgatg atgaactggc accaccacca 3360
tcaccattaa agatctcgac ttggttgaac acgttgccaa ggcttaagtg aatttacttt 3420
aaagtcttgc atttaaataa attttctttt tatagcttta tgacttagtt tcaatttata 3480
tactatttta atgacatttt cgattcattg attgaaagct ttgtgttttt tcttgatgcg 3540
ctattgcatt gttcttgtct ttttcgccac atgtaatatc tgtagtagat acctgataca 3600
ttgtggatgc tgagtgaaat tttagttaat aatggaggcg ctcttaataa ttttggggat 3660
attggctttt ttttttaaag tttacaaatg aattttttcc gccaggataa cgattctgaa 3720
gttactctta gcgttcctat cggtacagcc atcaaatcat gcctataaat catgcctata 3780
tttgcgtgca gtcagtatca tctacatgaa aaaaactccc gcaatttctt atagaatacg 3840
ttgaaaatta aatgtacgcg ccaagataag ataacatata tctagctaga tgcagtaata 3900
tacacagatt cccgcggacg tgggaaggaa aaaattagat aacaaaatct gagtgatatg 3960
gaaattccgc tgtatagctc atatctttcc cttcaacacc agaaatgtaa aaatcttgtt 4020
acgaaggatc tttttgctaa tgtttctcgc tcaatcctca tttcttccct acgaagagtc 4080
aaatctactt gttttctgcc ggtatcaaga tccatatctt ctagtttcac catcaaagtc 4140
caatttctag tatacagttt atgtcccaac gtaacagaca atcaaaattg gaaaggataa 4200
gtatccttca aagaatgatt ctgcgctggc tcctgaaccg cctaatggga acagagaagt 4260
ccaaaacgat gctataagaa ccagaaataa aacgataaaa ccataccagg atcctctacg 4320
ccggacgcat cgtggccggc atcaccggcg ccacaggtgc ggttgctggc ccctatatcg 4380
ccgacatcac cgatggggaa gatcgggctc gccacttcgg gctcatgagc gcttgtttcg 4440
gcgtgggtat ggtggcaggc cccgtggccg ggggactgtt gggcgccatc tccttgcatg 4500
caccattcct tgcggcggcg gtgctcaacg gcctcaacct actactgggc tgcttcctaa 4560
tgcaggagtc gcataaggga gagcgtcgac cgatgccctt gagagccttc aacccagtca 4620
gctccttccg gtgggcgcgg ggcatgacta tcgtcgccgc acttatgact gtcttcttta 4680
tcatgcaact cgtaggacag gtgccggcag cgctctgggt cattttcggc gaggaccgct 4740
ttcgctggag cgcgacgatg atcggcctgt cgcttgcggt attcggaatc ttgcacgccc 4800
tcgctcaagc cttcgtcact ggtcccgcca ccaaacgttt cggcgagaag caggccatta 4860
tcgccggcat ggcggccgac gcgctgggct acgtcttgct ggcgttcgcg acgcgaggct 4920
ggatggcctt ccccattatg attcttctcg cttccggcgg catcgggatg cccgcgttgc 4980
aggccatgct gtccaggcag gtagatgacg accatcaggg acagcttcaa ggatcgctcg 5040
cggctcttac cagcctaact tcgatcactg gaccgctgat cgtcacggcg atttatgccg 5100
cctcggcgag cacatggaac gggttggcat ggattgtagg cgccgcccta taccttgtct 5160
gcctccccgc gttgcgtcgc ggtgcatgga gccgggccac ctcgacctga atggaagccg 5220
gcggcacctc gctaacggat tcaccactcc aagaattgga gccaatcaat tcttgcggag 5280
aactgtgaat gcgcaaacca acccttggca gaacatatcc atcgcgtccg ccatctccag 5340
cagccgcacg cggcgcatct cgggcagcgt tgggtcctgg ccacgggtgc gcatgatcgt 5400
gctcctgtcg ttgaggaccc ggctaggctg gcggggttgc cttactggtt agcagaatga 5460
atcaccgata cgcgagcgaa cgtgaagcga ctgctgctgc aaaacgtctg cgacctgagc 5520
aacaacatga atggtcttcg gtttccgtgt ttcgtaaagt ctggaaacgc ggaagtcagc 5580
gccctgcacc attatgttcc ggatctgcat cgcaggatgc tgctggctac cctgtggaac 5640
acctacatct gtattaacga agcgctggca ttgaccctga gtgatttttc tctggtcccg 5700
ccgcatccat accgccagtt gtttaccctc acaacgttcc agtaaccggg catgttcatc 5760
atcagtaacc cgtatcgtga gcatcctctc tcgtttcatc ggtatcatta cccccatgaa 5820
cagaaattcc cccttacacg gaggcatcaa gtgaccaaac aggaaaaaac cgcccttaac 5880
atggcccgct ttatcagaag ccagacatta acgcttctgg agaaactcaa cgagctggac 5940
gcggatgaac aggcagacat ctgtgaatcg cttcacgacc acgctgatga gctttaccgc 6000
agctgcctcg cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag 6060
acggtcacag cttgtctgta agcggtgccg ggagcagaca agcccgtcag ggcgcgtcag 6120
cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt 6180
atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg 6240
tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc 6300
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 6360
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 6420
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 6480
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 6540
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 6600
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 6660
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 6720
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 6780
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 6840
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 6900
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 6960
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 7020
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 7080
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 7140
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 7200
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 7260
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 7320
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 7380
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 7440
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 7500
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc 7560
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 7620
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 7680
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 7740
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 7800
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg ataataccgc 7860
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 7920
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 7980
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 8040
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 8100
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 8160
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 8220
cgtctaagaa accattatta tcatgacatt aacctataaa aaataggcgt atcacgaggc 8280
cctttcgtct tcaagaattc tcatgtttga cagcttatca tcgatccact tgtatatttg 8340
gatgaatttt tgaggaattc tgaaccagtc ctaaaacgag taaataggac cggcaattct 8400
tcaagcaata aacaggaata ccaattatta aaagataact tagtcagatc gtacaataaa 8460
gctttgaaga aaaatgcgcc ttattcaatc tttgcataaa aaaatggccc aaaatctcac 8520
attggaagac atttgatgac ctcatttctt tcaatgaagg gcctaacgga gttgactaat 8580
gttgtgggaa attggaccga taagcgtgct tctgccgtgg ccaggacaac gtatactcat 8640
cagataacag caatacctga tcactacttc gcactagttt ctcggtacta tgcatatgat 8700
ccaatatcaa aggaaatgat agcattgaag gatgagacta atccaattga ggagtggcag 8760
catatagaac agctaaaggg tagtgctgaa ggaagcatac gataccccgc atggaatggg 8820
ataatatcac aggaggtact agactacctt tcatcctaca taaatagacg catataagta 8880
cgcatttaag cataaacacg cactatgccg ttcttctcat gtatatatat atacaggcaa 8940
cacgcagata taggtgcgac gtgaacagtg agctgtatgt gcgcagctcg cgttgcattt 9000
tcggaagcgc tcgttttcgg aaacgctttg aagttcctat tccgaagttc ctattctcta 9060
gaaagtatag gaacttcaga gcgcttttga aaaccaaaag cgctctgaag acgcactttc 9120
aaaaaaccaa aaacgcaccg gactgtaacg agctactaaa atattgcgaa taccgcttcc 9180
acaaacattg ctcaaaagta tctctttgct atatatctct gtgctatatc cctatataac 9240
catcccatcc acctttcgct ccttgaactt gcatctaaac tcgacctcta cattttttat 9300
gtttatctct agtattacct cttagacaaa aaaattgtag taagaactat tcatagagtt 9360
aatcgaaaac aatacgaaaa tgtaaacatt tcctatacgt agtatataga gacaaaatag 9420
aagaaaccgt tcataatttt ctgaccaatg aagaatcatc aacgctatca ctttctgttc 9480
acaaagtatg cgcaatccac atcggtatag aatataatcg gggatgcctt tatcttgaaa 9540
aaatgcaccc gcagcttcgc tagtaatcag taaacgcggg aagtggagtc aggctttttt 9600
tatggaagag aaaatagaca ccaaagtagc cttcttctaa ccttaacgga cctacagtgc 9660
aaaaagttat caagagactg cattatagag cgcacaaagg agaaaaaaag taatctaaga 9720
tgctttgtta gaaaaatagc gctctcggga tgcatttttg tagaacaaaa aagaagtata 9780
gattcttgtt ggtaaaatag cgctctcgcg ttgcatttct gttctgtaaa aatgcagctc 9840
agattctttg tttgaaaaat tagcgctctc gcgttgcatt tttgttttac aaaaatgaag 9900
cacagattct tcgttggtaa aatagcgctt tcgcgttgca tttctgttct gtaaaaatgc 9960
agctcagatt ctttgtttga aaaattagcg ctctcgcgtt gcatttttgt tctacaaaat 10020
gaagcacaga tgcttcgtta acaaagatat gctattgaag tgcaagatgg aaacgcagaa 10080
aatgaaccgg ggatgcgacg tgcaagatta cctatgcaat agatgcaata gtttctccag 10140
gaaccgaaat acatacattg tcttccgtaa agcgctagac tatatattat tatacaggtt 10200
caaatatact atctgtttca gggaaaactc ccaggttcgg atgttcaaaa ttcaatgatg 10260
ggtaacaagt acgatcgtaa atctgtaaaa cagtttgtcg gatattaggc tgtatctcct 10320
caaagcgtat tcgaatatca ttgagaagct gcattttttt tttttttttt tttttttttt 10380
tttttatata tatttcaagg atataccatt gtaatgtctg cccctaagaa gatcgtcgtt 10440
ttgccaggtg accacgttgg tcaagaaatc acagccgaag ccattaaggt tcttaaagct 10500
atttctgatg ttcgttccaa tgtcaagttc gatttcgaaa atcatttaat tggtggtgct 10560
gctatcgatg ctacaggtgt cccacttcca gatgaggcgc tggaagcctc caagaaggtt 10620
gatgccgttt tgttaggtgc tgtgggtggt cctaaatggg gtaccggtag tgttagacct 10680
gaacaaggtt tactaaaaat ccgtaaagaa cttcaattgt acgccaactt aagaccatgt 10740
aactttgcat ccgactctct tttagactta tctccaatca agccacaatt tgctaaaggt 10800
actgacttcg ttgttgtcag agaattagtg ggaggtattt actttggtaa gagaaaggaa 10860
gacgatggtg atggtgtcgc ttgggatagt gaacaataca ccgttccaga agtgcaaaga 10920
atcacaagaa tggccgcttt catggcccta caacatgagc caccattgcc tatttggtcc 10980
ttggataaag ctaatgtttt ggcctcttca agattatgga gaaaaactgt ggaggaaacc 11040
atcaagaacg aattccctac attgaaggtt caacatcaat tgattgattc tgccgccatg 11100
atcctagtta agaacccaac ccacctaaat ggtattataa tcaccagcaa catgtttggt 11160
gatatcatct ccgatgaagc ctccgttatc ccaggttcct tgggtttgtt gccatctgcg 11220
tccttggcct ctttgccaga caagaacacc gcatttggtt tgtacgaacc atgccacggt 11280
tctgctccag atttgccaaa gaataaggtt gaccctatcg ccactatctt gtctgctgca 11340
atgatgttga aattgtcatt gaacttgcct gaagaaggta aggccattga agatgcagtt 11400
aaaaaggttt tggatgcagg tatcagaact ggtgatttag gtggttccaa cagtaccacc 11460
gaagtcggtg atgctgtcgc cgaagaagtt aagaaaatcc ttgcttaaaa agattctctt 11520
tttttatgat atttgtacaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 11580
aaaatgcagc gtcacatcgg ataataatga tggcagccat tgtagaagtg ccttttgcat 11640
ttctagtctc tttctcggtc tagctagttt tactacatcg cgaagataga atcttagatc 11700
acactgcctt tgctgagctg gatcatatga gtaacaaaag agtggtaagg cctcgttaaa 11760
ggacaaggac ctgagcggaa gtgtatcgta aagtagacgg agtatactag tatagtctat 11820
agtccgtgga attctaagtg ccagctttat aatgtcattc tccttactac agacccgcct 11880
gaaagtagac acatcatcat cagtaagctt tgacaaaaag cattgagtag ctaactcttc 11940
tatgcaatct atagctgttt tataaggcat tcaatggaca gattgaggtt tttgaaacat 12000
actagtgaaa ttagccttaa tcccttctcg aagttaatca tgcattatgg tgtaaaaaat 12060
gcaactcgcg ttgctctact ttttcccgaa tttccaaata cgcagctggg gtgattgctc 12120
gatttcgtaa cgaaagtttt gtttataaaa accgcgaaaa ccttctgtaa cagatagatt 12180
tttacagcgc tgatatacaa tgacatcagc tgtaatggaa aataactgaa atatgaatgg 12240
cgagagactg cttgcttgta ttaagcaatg tattatgcag cacttccaac ctatggtgta 12300
cgatgaaagt aggtgtgtaa tcgagacgac aagggggact tttccagttc ctgatcatta 12360
taagaaatac aaaacgttag catttgcatt tgttggacat gtactgaata cagacgacac 12420
accggtaatt gaaaaagaac tggattggcc tgatcctgca ctagtgtaca atacaattgt 12480
cgatcgaatc ataaatcacc cagaattatc acagtttata tcggttgcat ttattagtca 12540
gttaaaggcc accatcggag agggtttaga tattaatgta aaaggcacgc taaaccgcag 12600
gggaaagggt atcagaaggc ctaaaggcgt attttttaga tacatggaat ctccatttgt 12660
caatacaaag gtcactgcat tcttctctta tcttcgagat tataataaaa ttgcctcaga 12720
atatcacaat aatactaaat tcattctcac gttttcatgt caagcatatt gggcatctgg 12780
cccaaacttc tccgccttga agaatgttat ttggtgctcc ataattcatg aatacatttc 12840
taagtttgtg gaaagagaac aggataaagg tcatatagga gatcaggagc taccgcctga 12900
agaggaccct tctcgtgaac taaacaatgt acaacatgaa gtcaatagtt taacggaaca 12960
agatgcggag gcggatgaag gattgtgggg tgaaatagat tcattatgtg aaaaatggca 13020
gtctgaagcg gagagtcaaa ctgaggcgga gataatagcc gacaggataa ttggaaatag 13080
ccagaggatg gcgaacctca aaattcgtcg tacaaagttc aaaagtgtct tgtatcatat 13140
actaaaggaa ctaattcaat ctcagggaac cgtaaaggtt tatcgcggta gtagtttttc 13200
acacgattcg ataaagataa gcttacatta tgaagagcag catattacag ccgtatgggt 13260
ctacttgata gtaaaatttg aagagcattg gaagcctgtt gatgtagagg tcgagtttag 13320
atgcaagttc aaggagcgaa aggtggatgg gtaggttata tagggatata gcacagagat 13380
atatagcaaa gagatacttt tgaggcaatg tttgtggaag cggtattcgc aatattttag 13440
tagctcgtta cagtccggtg cgtttttggt tttttgaaag tgcgtcttca gagcgctttt 13500
ggttttcaaa agcgctctga agttcctata ctttctagag aataggaact tcggaatagg 13560
aacttcaaag cgtttccgaa aacgagcgct tccgaaaatg caacgcgagc tgcgcacata 13620
cagctcactg ttcacgtcgc acctatatct gcgtgttgcc tgtatatata tatacatgag 13680
aagaacggca tagtgcgtgt ttatgcttaa atgcgtactt atatgcgtct atttatgtag 13740
gatgaaaggt agtctagtac ctcctgtgat attatcccat tccatgcggg gtatcgtatg 13800
cttccttcag cactaccctt tagctgttct atatgctgcc actcctcaat tggattagtc 13860
tcatccttca atgcattcat ttcctttgat attggatcat accctagaag tattacgtga 13920
ttttctgccc cttaccctcg ttgctactct cctttttttc gtgggaaccg ctttagggcc 13980
ctcagtgatg gtgttttgta atttatatgc tcctcttgca tttgtgtctc tacttcttgt 14040
tcgcctggag ggaacttctt catttgtatt agcatggttc acttcagtcc ttccttccaa 14100
ctcactcttt ttttgctgta aacgattctc tgccgccagt tcattgaaac tattgaatat 14160
atcctttaga gattccggga tgaataaatc acctattaaa gcagcttgac gatctggtgg 14220
aactaaagta agcaattggg taacgacgct tacgagcttc ataacatctt cttccgttgg 14280
agctggtggg actaataact gtgtacaatc catttttctc atgagcattt cggtagctct 14340
cttcttgtct ttctcgggca atcttcctat tattatagca atagatttgt atagttgctt 14400
tctattgtct aacagcttgt tattctgtag catcaaatct atggcagcct gacttgcttc 14460
ttgtgaagag agcataccat ttccaatcga agatacgctg gaatcttctg cgctagaatc 14520
aagaccatac ggcctaccgg ttgtgagaga ttccatgggc cttatgacat atcctggaaa 14580
gagtagctca tcagacttac gtttactctc tatatcaata tctacatcag gagcaatcat 14640
ttcaataaac agccgacata catcccagac gctataagct gtacgtgctt ttaccgtcag 14700
attcttggct gtttcaatgt cgtccatttt ggttttcttt taccagtatt gttcgtttga 14760
taatgtattc ttgcttatta cattataaaa tctgtgcaga tcacatgtca aaacaacttt 14820
ttatcacaag atagtaccgc aaaacgaacc tgcgggccgt ctaaaaatta aggaaaagca 14880
gcaaaggtgc atttttaaaa tatgaaatga agataccgca gtaccaatta ttttcgcagt 14940
acaaataatg cgcggccggt gcatttttcg aaagaacgcg agacaaacag gacaattaaa 15000
gttagttttt cgagttagcg tgtttgaata ctgcaagata caagataaat agagtagttg 15060
aaactagata tcaattgcac acaagatcgg cgctaagcat gccacaattt ggtatattat 15120
gtaaaacacc acctaaggtg cttgttcgtc agtttgtgga aaggtttgaa agaccttcag 15180
gtgagaaaat agcattatgt gctgctgaac taacctattt atgttggatg attacacata 15240
acggaacagc aatcaagaga gccacattca tgagctataa tactatcata agcaattcgc 15300
tgagtttcga tattgtcaat aaatcactcc agtttaaata caagacgcaa aaagcaacaa 15360
ttctggaagc ctcattaaag aaattgattc ctgcttggga atttacaatt attccttact 15420
atggacaaaa acatcaatct gatatcactg atattgtaag tagtttgcaa ttacagttcg 15480
aatcatcgga agaagcagat aagggaaata gccacagtaa aaaaatgcta aagcacttct 15540
aagtgagggt gaaagcatct gggagatcac tgagaaaata ctaaattcgt ttgagtatac 15600
ttcgagattt acaaaaacaa aaactttata ccaattcctc ttcctagcta ctttcatcaa 15660
ttgtggaaga ttcagcgata ttaagaacgt tgatccgaaa tcatttaaat tagtccaaaa 15720
taagtatctg ggagtaataa tccagtgttt agtgacagag acaaagacaa gcgttagtag 15780
gcacatatac ttctttagcg caaggggtag 15810
<210> 45
<211> 3928
<212> DNA
<213> Artificial sequence
<220>
<223> vector pBKS-E2sH6
<400> 45
cacctaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag 60
ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac 120
cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 180
ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 240
accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 300
gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 360
gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 420
caccacaccc gccgcgctta atgcgccgct acagggcgcg tcccattcgc cattcaggct 480
gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa 540
agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg 600
ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggtaccgg 660
gccccccctc gaggtcgacg gtatcgataa gcttgcatgc ctgcagttaa ttaactatta 720
gtgatggtgg tgatggtgtc tgccctcgat cacctgccac tctgttgtag acagcagcag 780
cgggctaagc tctgatctat ccctgtcctc caagtcacaa cgctctcctc gagtccaatt 840
gcatgcggct tcgaacctgt gctccacgcc ccccacgtac atcctaacct tgaagatggt 900
gaagttgaca gtgcaggggt agtgccagag cctatatggg taatgaacca tacacctagg 960
tgtcagccag ggcccagaac cgcatctggc gtaggtggcc tcggggtgct tccgaaaaca 1020
gtcagtgggg caggtcaagg tgttgttgcc ggcccccccg atgttgcacg gggggccccc 1080
acacgtcttg gtgaacccag tgccattcat ccatgtacag ccgaaccagt tgcctcgcgg 1140
cggccgcgtg ttgttgagaa tcagcacatc cgagtcgttc gccccccagt tatacgtggg 1200
gacaccaaac cgatcggtcg tccccaccac aacagggctc ggggtgaagc aatacactgg 1260
accgcacacc tgagacgcgg gtacaatacc acacggtcga ggcgcgtagt gccagcagta 1320
gggcctctgg tccgagctgt taggctcagt gtaagtgagg ggaccccacc cctgagcgaa 1380
cttgtcgatg gagcgacagc tggccaagcg ctctgggcat ccagacgagt tgaatttgtg 1440
tttgtagaat agtgcggcaa agaaccctgt ttggagggag tcgttgcagt tcagggcagt 1500
cctgttgatg tgccaactgc cgttggtgtt tacgagctgg attttctgag ccgacccggg 1560
gctaaagagg gacacaaggc ccctggtatc ggaggctgct gcccctcctg acacgcgggt 1620
atggtaccgg gccccccctc gaggtcgacg gtatcgataa gcttgatatc gaattcctgc 1680
agcccggggg atccactagt tctagagcgg ccgccaccgc ggtggagctc cagcttttgt 1740
tccctttagt gagggttaat ttcgagcttg gcgtaatcat ggtcatagct gtttcctgtg 1800
tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat aaagtgtaaa 1860
gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc actgcccgct 1920
ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga 1980
ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 2040
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 2100
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 2160
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 2220
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 2280
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 2340
tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 2400
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 2460
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 2520
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 2580
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 2640
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 2700
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 2760
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 2820
aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 2880
ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 2940
agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 3000
atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 3060
cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 3120
aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 3180
cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 3240
aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca 3300
ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa 3360
gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca 3420
ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt 3480
tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt 3540
tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg 3600
ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga 3660
tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc 3720
agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg 3780
acacggaaat gttgaatact catactcttc ctttttcaat attattgaag catttatcag 3840
ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg 3900
gttccgcgca catttccccg aaaagtgc 3928
<210> 46
<211> 6104
<212> DNA
<213> Artificial sequence
<220>
<223> vector pYIG5HCCL-22aH6
<400> 46
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata 240
cgactcacta tagggaattc gaggatcctt caatatgcgc acatacgctg ttatgttcaa 300
ggtcccttcg tttaagaacg aaagcggtct tccttttgag ggatgtttca agttgttcaa 360
atctatcaaa tttgcaaatc cccagtctgt atctagagcg ttgaatcggt gatgcgattt 420
gttaattaaa ttgatggtgt caccattacc aggtctagat ataccaatgg caaactgagc 480
acaacaatac cagtccggat caactggcac catctctccc gtagtctcat ctaatttttc 540
ttccggatga ggttccagat ataccgcaac acctttatta tggtttccct gagggaataa 600
tagaatgtcc cattcgaaat caccaattct aaacctgggc gaattgtatt tcgggtttgt 660
taactcgttc cagtcaggaa tgttccacgt gaagctatct tccagcaaag tctccacttc 720
ttcatcaaat tgtggagaat actcccaatg ctcttatcta tgggacttcc gggaaacaca 780
gtaccgatac ttcccaattc gtcttcagag ctcattgttt gtttgaagag actaatcaaa 840
gaatcgtttt ctcaaaaaaa ttaatatctt aactgatagt ttgatcaaag gggcaaaacg 900
taggggcaaa caaacggaaa aatcgtttct caaattttct gatgccaaga actctaacca 960
gtcttatcta aaaattgcct tatgatccgt ctctccggtt acagcctgtg taactgatta 1020
atcctgcctt tctaatcacc attctaatgt tttaattaag ggattttgtc ttcattaacg 1080
gctttcgctc ataaaaatgt tatgacgttt tgcccgcagg cgggaaacca tccacttcac 1140
gagactgatc tcctctgccg gaacaccggg catctccaac ttataagttg gagaaataag 1200
agaatttcag attgagagaa tgaaaaaaaa aaaccctgaa aaaaaaggtt gaaaccagtt 1260
ccctgaaatt attcccctac ttgactaata agtatataaa gacggtaggt attgattgta 1320
attctgtaaa tctatttctt aaacttctta aattctactt ttatagttag tctttttttt 1380
agttttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac accatgagat 1440
ttccttcaat ttttactgca gttttattcg cagcatcctc cgcattagct gctccagtca 1500
acactacaac agaagatgaa acggcacaaa ttccggctga agctgtcatc ggttactcag 1560
atttagaagg ggatttcgat gttgctgttt tgccattttc caacagcaca aataacgggt 1620
tattgtttat aaatactact attgccagca ttgctgctaa agaagaaggg gtatctctag 1680
ataaaaggca tacccgcgtg tcaggagggg cagcagcctc cgataccagg ggccttgtgt 1740
ccctctttag ccccgggtcg gctcagaaaa tccagctcgt aaacaccaac ggcagttggc 1800
acatcaacag gactgccctg aactgcaacg actccctcca aacagggttc tttgccgcac 1860
tattctacaa acacaaattc aactcgtctg gatgcccaga gcgcttggcc agctgtcgct 1920
ccatcgacaa gttcgctcag gggtggggtc ccctcactta cactgagcct aacagctcgg 1980
accagaggcc ctactgctgg cactacgcgc ctcgaccgtg tggtattgta cccgcgtctc 2040
aggtgtgcgg tccagtgtat tgcttcaccc cgagccctgt tgtggtgggg acgaccgatc 2100
ggtttggtgt ccccacgtat aactgggggg cgaacgactc ggatgtgctg attctcaaca 2160
acacgcggcc gccgcgaggc aactggttcg gctgtacatg gatgaatggc actgggttca 2220
ccaagacgtg tgggggcccc ccgtgcaaca tcgggggggc cggcaacaac accttgacct 2280
gccccactga ctgttttcgg aagcaccccg aggccactta cgccagatgc ggttctgggc 2340
cctggctgac acctaggtgt atggttcatt acccatatag gctctggcac tacccctgca 2400
ctgtcaactt caccatcttc aaggttagga tgtacgtggg gggcgtggag cacaggttcg 2460
aagccgcatg caattggact cgaggagagc gttgtgactt ggaggacagg gatagatcag 2520
agcttagctc gctgctgctg tctacaacag agtggcaggt gatcgagggc agacaccatc 2580
accaccatca ctaatagtta attaacgatc tcgacttggt tgaacacgtt gccaaggctt 2640
aagtgaattt actttaaagt cttgcattta aataaatttt ctttttatag ctttatgact 2700
tagtttcaat ttatatacta ttttaatgac attttcgatt cattgattga aagctttgtg 2760
ttttttcttg atgcgctatt gcattgttct tgtctttttc gccacatgta atatctgtag 2820
tagatacctg atacattgtg gatgctgagt gaaattttag ttaataatgg aggcgctctt 2880
aataattttg gggatattgg cttttttttt taaagtttac aaatgaattt tttccgccag 2940
gataacgatt ctgaagttac tcttagcgtt cctatcggta cagccatcaa atcatgccta 3000
taaatcatgc ctatatttgc gtgcagtcag tatcatctac atgaaaaaaa ctcccgcaat 3060
ttcttataga atacgttgaa aattaaatgt acgcgccaag ataagataac atatatctag 3120
ctagatgcag taatatacac agattcccgc ggacgtggga aggaaaaaat tagataacaa 3180
aatctgagtg atatggaaat tccgctgtat agctcatatc tttcccttca acaccagaaa 3240
tgtaaaaatc ttgttacgaa ggatcttttt gctaatgttt ctcgctcaat cctcatttct 3300
tccctacgaa gagtcaaatc tacttgtttt ctgccggtat caagatccat atcttctagt 3360
ttcaccatca aagtccaatt tctagtatac agtttatgtc ccaacgtaac agacaatcaa 3420
aattggaaag gataagtatc cttcaaagaa tgattctgcg ctggctcctg aaccgcctaa 3480
tgggaacaga gaagtccaaa acgatgctat aagaaccaga aataaaacga taaaaccata 3540
ccaggatcca agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 3600
cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 3660
agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatgggaaat 3720
tgtaaacgtt aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt 3780
taaccaatag gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg 3840
gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt 3900
caaagggcga aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc 3960
aagttttttg gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg 4020
atttagagct tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa 4080
aggagcgggc gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc 4140
cgccgcgctt aatgcgccgc tacagggcgc gtcaggtggc acttttcggg gaaatgtgcg 4200
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 4260
ataaccctga taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt 4320
ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 4380
aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 4440
actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 4500
gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 4560
agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 4620
cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 4680
catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 4740
aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 4800
gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag caatggcaac 4860
aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 4920
agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 4980
ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc 5040
actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 5100
aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 5160
gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta 5220
atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg 5280
tgagttttcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga 5340
tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt 5400
ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag 5460
agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa 5520
ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag 5580
tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca 5640
gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac 5700
cgaactgaga tacctacagc gtgagcattg agaaagcgcc acgcttcccg aagggagaaa 5760
ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc 5820
agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg 5880
tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc 5940
ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc 6000
ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag 6060
ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaag 6104
<210> 47
<211> 16301
<212> DNA
<213> Artificial sequence
<220>
<223> vector pYYIGSE2H6
<400> 47
atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt 60
ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc 120
acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag 180
tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga 240
aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta 300
atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg 360
aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg 420
atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca 480
agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat 540
tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg 600
gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg 660
aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag 720
aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta 780
ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg 840
gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg 900
tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg 960
atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat 1020
gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa 1080
ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt 1140
ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt 1200
taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc 1260
tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc 1320
tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc 1380
tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg 1440
gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg 1500
cgaccacacc cgtcctgtgg atccttcaat atgcgcacat acgctgttat gttcaaggtc 1560
ccttcgttta agaacgaaag cggtcttcct tttgagggat gtttcaagtt gttcaaatct 1620
atcaaatttg caaatcccca gtctgtatct agagcgttga atcggtgatg cgatttgtta 1680
attaaattga tggtgtcacc attaccaggt ctagatatac caatggcaaa ctgagcacaa 1740
caataccagt ccggatcaac tggcaccatc tctcccgtag tctcatctaa tttttcttcc 1800
ggatgaggtt ccagatatac cgcaacacct ttattatggt ttccctgagg gaataataga 1860
atgtcccatt cgaaatcacc aattctaaac ctgggcgaat tgtatttcgg gtttgttaac 1920
tcgttccagt caggaatgtt ccacgtgaag ctatcttcca gcaaagtctc cacttcttca 1980
tcaaattgtg gagaatactc ccaatgctct tatctatggg acttccggga aacacagtac 2040
cgatacttcc caattcgtct tcagagctca ttgtttgttt gaagagacta atcaaagaat 2100
cgttttctca aaaaaattaa tatcttaact gatagtttga tcaaaggggc aaaacgtagg 2160
ggcaaacaaa cggaaaaatc gtttctcaaa ttttctgatg ccaagaactc taaccagtct 2220
tatctaaaaa ttgccttatg atccgtctct ccggttacag cctgtgtaac tgattaatcc 2280
tgcctttcta atcaccattc taatgtttta attaagggat tttgtcttca ttaacggctt 2340
tcgctcataa aaatgttatg acgttttgcc cgcaggcggg aaaccatcca cttcacgaga 2400
ctgatctcct ctgccggaac accgggcatc tccaacttat aagttggaga aataagagaa 2460
tttcagattg agagaatgaa aaaaaaaaac cctgaaaaaa aaggttgaaa ccagttccct 2520
gaaattattc ccctacttga ctaataagta tataaagacg gtaggtattg attgtaattc 2580
tgtaaatcta tttcttaaac ttcttaaatt ctacttttat agttagtctt ttttttagtt 2640
ttaaaacacc aagaacttag tttcgaataa acacacataa acaaacacca tgagatttcc 2700
ttcaattttt actgcagttt tattcgcagc atcctccgca ttagctgctc cagtcaacac 2760
tacaacagaa gatgaaacgg cacaaattcc ggctgaagct gtcatcggtt actcagattt 2820
agaaggggat ttcgatgttg ctgttttgcc attttccaac agcacaaata acgggttatt 2880
gtttataaat actactattg ccagcattgc tgctaaagaa gaaggggtat ctctagataa 2940
aaggcatacc cgcgtgtcag gaggggcagc agcctccgat accaggggcc ttgtgtccct 3000
ctttagcccc gggtcggctc agaaaatcca gctcgtaaac accaacggca gttggcacat 3060
caacaggact gccctgaact gcaacgactc cctccaaaca gggttctttg ccgcactatt 3120
ctacaaacac aaattcaact cgtctggatg cccagagcgc ttggccagct gtcgctccat 3180
cgacaagttc gctcaggggt ggggtcccct cacttacact gagcctaaca gctcggacca 3240
gaggccctac tgctggcact acgcgcctcg accgtgtggt attgtacccg cgtctcaggt 3300
gtgcggtcca gtgtattgct tcaccccgag ccctgttgtg gtggggacga ccgatcggtt 3360
tggtgtcccc acgtataact ggggggcgaa cgactcggat gtgctgattc tcaacaacac 3420
gcggccgccg cgaggcaact ggttcggctg tacatggatg aatggcactg ggttcaccaa 3480
gacgtgtggg ggccccccgt gcaacatcgg gggggccggc aacaacacct tgacctgccc 3540
cactgactgt tttcggaagc accccgaggc cacttacgcc agatgcggtt ctgggccctg 3600
gctgacacct aggtgtatgg ttcattaccc atataggctc tggcactacc cctgcactgt 3660
caacttcacc atcttcaagg ttaggatgta cgtggggggc gtggagcaca ggttcgaagc 3720
cgcatgcaat tggactcgag gagagcgttg tgacttggag gacagggata gatcagagct 3780
tagctcgctg ctgctgtcta caacagagtg gcaggtgatc gagggcagac accatcacca 3840
ccatcactaa tagttaatta acgatctcga cttggttgaa cacgttgcca aggcttaagt 3900
gaatttactt taaagtcttg catttaaata aattttcttt ttatagcttt atgacttagt 3960
ttcaatttat atactatttt aatgacattt tcgattcatt gattgaaagc tttgtgtttt 4020
ttcttgatgc gctattgcat tgttcttgtc tttttcgcca catgtaatat ctgtagtaga 4080
tacctgatac attgtggatg ctgagtgaaa ttttagttaa taatggaggc gctcttaata 4140
attttgggga tattggcttt tttttttaaa gtttacaaat gaattttttc cgccaggata 4200
acgattctga agttactctt agcgttccta tcggtacagc catcaaatca tgcctataaa 4260
tcatgcctat atttgcgtgc agtcagtatc atctacatga aaaaaactcc cgcaatttct 4320
tatagaatac gttgaaaatt aaatgtacgc gccaagataa gataacatat atctagctag 4380
atgcagtaat atacacagat tcccgcggac gtgggaagga aaaaattaga taacaaaatc 4440
tgagtgatat ggaaattccg ctgtatagct catatctttc ccttcaacac cagaaatgta 4500
aaaatcttgt tacgaaggat ctttttgcta atgtttctcg ctcaatcctc atttcttccc 4560
tacgaagagt caaatctact tgttttctgc cggtatcaag atccatatct tctagtttca 4620
ccatcaaagt ccaatttcta gtatacagtt tatgtcccaa cgtaacagac aatcaaaatt 4680
ggaaaggata agtatccttc aaagaatgat tctgcgctgg ctcctgaacc gcctaatggg 4740
aacagagaag tccaaaacga tgctataaga accagaaata aaacgataaa accataccag 4800
gatcctctac gccggacgca tcgtggccgg catcaccggc gccacaggtg cggttgctgg 4860
cccctatatc gccgacatca ccgatgggga agatcgggct cgccacttcg ggctcatgag 4920
cgcttgtttc ggcgtgggta tggtggcagg ccccgtggcc gggggactgt tgggcgccat 4980
ctccttgcat gcaccattcc ttgcggcggc ggtgctcaac ggcctcaacc tactactggg 5040
ctgcttccta atgcaggagt cgcataaggg agagcgtcga ccgatgccct tgagagcctt 5100
caacccagtc agctccttcc ggtgggcgcg gggcatgact atcgtcgccg cacttatgac 5160
tgtcttcttt atcatgcaac tcgtaggaca ggtgccggca gcgctctggg tcattttcgg 5220
cgaggaccgc tttcgctgga gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat 5280
cttgcacgcc ctcgctcaag ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa 5340
gcaggccatt atcgccggca tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc 5400
gacgcgaggc tggatggcct tccccattat gattcttctc gcttccggcg gcatcgggat 5460
gcccgcgttg caggccatgc tgtccaggca ggtagatgac gaccatcagg gacagcttca 5520
aggatcgctc gcggctctta ccagcctaac ttcgatcact ggaccgctga tcgtcacggc 5580
gatttatgcc gcctcggcga gcacatggaa cgggttggca tggattgtag gcgccgccct 5640
ataccttgtc tgcctccccg cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg 5700
aatggaagcc ggcggcacct cgctaacgga ttcaccactc caagaattgg agccaatcaa 5760
ttcttgcgga gaactgtgaa tgcgcaaacc aacccttggc agaacatatc catcgcgtcc 5820
gccatctcca gcagccgcac gcggcgcatc tcgggcagcg ttgggtcctg gccacgggtg 5880
cgcatgatcg tgctcctgtc gttgaggacc cggctaggct ggcggggttg ccttactggt 5940
tagcagaatg aatcaccgat acgcgagcga acgtgaagcg actgctgctg caaaacgtct 6000
gcgacctgag caacaacatg aatggtcttc ggtttccgtg tttcgtaaag tctggaaacg 6060
cggaagtcag cgccctgcac cattatgttc cggatctgca tcgcaggatg ctgctggcta 6120
ccctgtggaa cacctacatc tgtattaacg aagcgctggc attgaccctg agtgattttt 6180
ctctggtccc gccgcatcca taccgccagt tgtttaccct cacaacgttc cagtaaccgg 6240
gcatgttcat catcagtaac ccgtatcgtg agcatcctct ctcgtttcat cggtatcatt 6300
acccccatga acagaaattc ccccttacac ggaggcatca agtgaccaaa caggaaaaaa 6360
ccgcccttaa catggcccgc tttatcagaa gccagacatt aacgcttctg gagaaactca 6420
acgagctgga cgcggatgaa caggcagaca tctgtgaatc gcttcacgac cacgctgatg 6480
agctttaccg cagctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc 6540
agctcccgga gacggtcaca gcttgtctgt aagcggtgcc gggagcagac aagcccgtca 6600
gggcgcgtca gcgggtgttg gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga 6660
tagcggagtg tatactggct taactatgcg gcatcagagc agattgtact gagagtgcac 6720
catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgctct 6780
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 6840
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 6900
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 6960
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 7020
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 7080
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 7140
gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 7200
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 7260
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 7320
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 7380
aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 7440
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 7500
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 7560
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 7620
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 7680
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 7740
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 7800
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 7860
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 7920
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 7980
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctgcaggc 8040
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 8100
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 8160
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 8220
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 8280
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaacacgg 8340
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 8400
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 8460
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 8520
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 8580
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 8640
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 8700
gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaaataggcg 8760
tatcacgagg ccctttcgtc ttcaagaatt ctcatgtttg acagcttatc atcgatccac 8820
ttgtatattt ggatgaattt ttgaggaatt ctgaaccagt cctaaaacga gtaaatagga 8880
ccggcaattc ttcaagcaat aaacaggaat accaattatt aaaagataac ttagtcagat 8940
cgtacaataa agctttgaag aaaaatgcgc cttattcaat ctttgcataa aaaaatggcc 9000
caaaatctca cattggaaga catttgatga cctcatttct ttcaatgaag ggcctaacgg 9060
agttgactaa tgttgtggga aattggaccg ataagcgtgc ttctgccgtg gccaggacaa 9120
cgtatactca tcagataaca gcaatacctg atcactactt cgcactagtt tctcggtact 9180
atgcatatga tccaatatca aaggaaatga tagcattgaa ggatgagact aatccaattg 9240
aggagtggca gcatatagaa cagctaaagg gtagtgctga aggaagcata cgataccccg 9300
catggaatgg gataatatca caggaggtac tagactacct ttcatcctac ataaatagac 9360
gcatataagt acgcatttaa gcataaacac gcactatgcc gttcttctca tgtatatata 9420
tatacaggca acacgcagat ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc 9480
gcgttgcatt ttcggaagcg ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt 9540
cctattctct agaaagtata ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa 9600
gacgcacttt caaaaaacca aaaacgcacc ggactgtaac gagctactaa aatattgcga 9660
ataccgcttc cacaaacatt gctcaaaagt atctctttgc tatatatctc tgtgctatat 9720
ccctatataa ccatcccatc cacctttcgc tccttgaact tgcatctaaa ctcgacctct 9780
acatttttta tgtttatctc tagtattacc tcttagacaa aaaaattgta gtaagaacta 9840
ttcatagagt taatcgaaaa caatacgaaa atgtaaacat ttcctatacg tagtatatag 9900
agacaaaata gaagaaaccg ttcataattt tctgaccaat gaagaatcat caacgctatc 9960
actttctgtt cacaaagtat gcgcaatcca catcggtata gaatataatc ggggatgcct 10020
ttatcttgaa aaaatgcacc cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt 10080
caggcttttt ttatggaaga gaaaatagac accaaagtag ccttcttcta accttaacgg 10140
acctacagtg caaaaagtta tcaagagact gcattataga gcgcacaaag gagaaaaaaa 10200
gtaatctaag atgctttgtt agaaaaatag cgctctcggg atgcattttt gtagaacaaa 10260
aaagaagtat agattcttgt tggtaaaata gcgctctcgc gttgcatttc tgttctgtaa 10320
aaatgcagct cagattcttt gtttgaaaaa ttagcgctct cgcgttgcat ttttgtttta 10380
caaaaatgaa gcacagattc ttcgttggta aaatagcgct ttcgcgttgc atttctgttc 10440
tgtaaaaatg cagctcagat tctttgtttg aaaaattagc gctctcgcgt tgcatttttg 10500
ttctacaaaa tgaagcacag atgcttcgtt aacaaagata tgctattgaa gtgcaagatg 10560
gaaacgcaga aaatgaaccg gggatgcgac gtgcaagatt acctatgcaa tagatgcaat 10620
agtttctcca ggaaccgaaa tacatacatt gtcttccgta aagcgctaga ctatatatta 10680
ttatacaggt tcaaatatac tatctgtttc agggaaaact cccaggttcg gatgttcaaa 10740
attcaatgat gggtaacaag tacgatcgta aatctgtaaa acagtttgtc ggatattagg 10800
ctgtatctcc tcaaagcgta ttcgaatatc attgagaagc tgcatttttt tttttttttt 10860
tttttttttt ttttttatat atatttcaag gatataccat tgtaatgtct gcccctaaga 10920
agatcgtcgt tttgccaggt gaccacgttg gtcaagaaat cacagccgaa gccattaagg 10980
ttcttaaagc tatttctgat gttcgttcca atgtcaagtt cgatttcgaa aatcatttaa 11040
ttggtggtgc tgctatcgat gctacaggtg tcccacttcc agatgaggcg ctggaagcct 11100
ccaagaaggt tgatgccgtt ttgttaggtg ctgtgggtgg tcctaaatgg ggtaccggta 11160
gtgttagacc tgaacaaggt ttactaaaaa tccgtaaaga acttcaattg tacgccaact 11220
taagaccatg taactttgca tccgactctc ttttagactt atctccaatc aagccacaat 11280
ttgctaaagg tactgacttc gttgttgtca gagaattagt gggaggtatt tactttggta 11340
agagaaagga agacgatggt gatggtgtcg cttgggatag tgaacaatac accgttccag 11400
aagtgcaaag aatcacaaga atggccgctt tcatggccct acaacatgag ccaccattgc 11460
ctatttggtc cttggataaa gctaatgttt tggcctcttc aagattatgg agaaaaactg 11520
tggaggaaac catcaagaac gaattcccta cattgaaggt tcaacatcaa ttgattgatt 11580
ctgccgccat gatcctagtt aagaacccaa cccacctaaa tggtattata atcaccagca 11640
acatgtttgg tgatatcatc tccgatgaag cctccgttat cccaggttcc ttgggtttgt 11700
tgccatctgc gtccttggcc tctttgccag acaagaacac cgcatttggt ttgtacgaac 11760
catgccacgg ttctgctcca gatttgccaa agaataaggt tgaccctatc gccactatct 11820
tgtctgctgc aatgatgttg aaattgtcat tgaacttgcc tgaagaaggt aaggccattg 11880
aagatgcagt taaaaaggtt ttggatgcag gtatcagaac tggtgattta ggtggttcca 11940
acagtaccac cgaagtcggt gatgctgtcg ccgaagaagt taagaaaatc cttgcttaaa 12000
aagattctct ttttttatga tatttgtaca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 12060
aaaaaaaaaa aaaaatgcag cgtcacatcg gataataatg atggcagcca ttgtagaagt 12120
gccttttgca tttctagtct ctttctcggt ctagctagtt ttactacatc gcgaagatag 12180
aatcttagat cacactgcct ttgctgagct ggatcatatg agtaacaaaa gagtggtaag 12240
gcctcgttaa aggacaagga cctgagcgga agtgtatcgt aaagtagacg gagtatacta 12300
gtatagtcta tagtccgtgg aattctaagt gccagcttta taatgtcatt ctccttacta 12360
cagacccgcc tgaaagtaga cacatcatca tcagtaagct ttgacaaaaa gcattgagta 12420
gctaactctt ctatgcaatc tatagctgtt ttataaggca ttcaatggac agattgaggt 12480
ttttgaaaca tactagtgaa attagcctta atcccttctc gaagttaatc atgcattatg 12540
gtgtaaaaaa tgcaactcgc gttgctctac tttttcccga atttccaaat acgcagctgg 12600
ggtgattgct cgatttcgta acgaaagttt tgtttataaa aaccgcgaaa accttctgta 12660
acagatagat ttttacagcg ctgatataca atgacatcag ctgtaatgga aaataactga 12720
aatatgaatg gcgagagact gcttgcttgt attaagcaat gtattatgca gcacttccaa 12780
cctatggtgt acgatgaaag taggtgtgta atcgagacga caagggggac ttttccagtt 12840
cctgatcatt ataagaaata caaaacgtta gcatttgcat ttgttggaca tgtactgaat 12900
acagacgaca caccggtaat tgaaaaagaa ctggattggc ctgatcctgc actagtgtac 12960
aatacaattg tcgatcgaat cataaatcac ccagaattat cacagtttat atcggttgca 13020
tttattagtc agttaaaggc caccatcgga gagggtttag atattaatgt aaaaggcacg 13080
ctaaaccgca ggggaaaggg tatcagaagg cctaaaggcg tattttttag atacatggaa 13140
tctccatttg tcaatacaaa ggtcactgca ttcttctctt atcttcgaga ttataataaa 13200
attgcctcag aatatcacaa taatactaaa ttcattctca cgttttcatg tcaagcatat 13260
tgggcatctg gcccaaactt ctccgccttg aagaatgtta tttggtgctc cataattcat 13320
gaatacattt ctaagtttgt ggaaagagaa caggataaag gtcatatagg agatcaggag 13380
ctaccgcctg aagaggaccc ttctcgtgaa ctaaacaatg tacaacatga agtcaatagt 13440
ttaacggaac aagatgcgga ggcggatgaa ggattgtggg gtgaaataga ttcattatgt 13500
gaaaaatggc agtctgaagc ggagagtcaa actgaggcgg agataatagc cgacaggata 13560
attggaaata gccagaggat ggcgaacctc aaaattcgtc gtacaaagtt caaaagtgtc 13620
ttgtatcata tactaaagga actaattcaa tctcagggaa ccgtaaaggt ttatcgcggt 13680
agtagttttt cacacgattc gataaagata agcttacatt atgaagagca gcatattaca 13740
gccgtatggg tctacttgat agtaaaattt gaagagcatt ggaagcctgt tgatgtagag 13800
gtcgagttta gatgcaagtt caaggagcga aaggtggatg ggtaggttat atagggatat 13860
agcacagaga tatatagcaa agagatactt ttgaggcaat gtttgtggaa gcggtattcg 13920
caatatttta gtagctcgtt acagtccggt gcgtttttgg ttttttgaaa gtgcgtcttc 13980
agagcgcttt tggttttcaa aagcgctctg aagttcctat actttctaga gaataggaac 14040
ttcggaatag gaacttcaaa gcgtttccga aaacgagcgc ttccgaaaat gcaacgcgag 14100
ctgcgcacat acagctcact gttcacgtcg cacctatatc tgcgtgttgc ctgtatatat 14160
atatacatga gaagaacggc atagtgcgtg tttatgctta aatgcgtact tatatgcgtc 14220
tatttatgta ggatgaaagg tagtctagta cctcctgtga tattatccca ttccatgcgg 14280
ggtatcgtat gcttccttca gcactaccct ttagctgttc tatatgctgc cactcctcaa 14340
ttggattagt ctcatccttc aatgcattca tttcctttga tattggatca taccctagaa 14400
gtattacgtg attttctgcc ccttaccctc gttgctactc tccttttttt cgtgggaacc 14460
gctttagggc cctcagtgat ggtgttttgt aatttatatg ctcctcttgc atttgtgtct 14520
ctacttcttg ttcgcctgga gggaacttct tcatttgtat tagcatggtt cacttcagtc 14580
cttccttcca actcactctt tttttgctgt aaacgattct ctgccgccag ttcattgaaa 14640
ctattgaata tatcctttag agattccggg atgaataaat cacctattaa agcagcttga 14700
cgatctggtg gaactaaagt aagcaattgg gtaacgacgc ttacgagctt cataacatct 14760
tcttccgttg gagctggtgg gactaataac tgtgtacaat ccatttttct catgagcatt 14820
tcggtagctc tcttcttgtc tttctcgggc aatcttccta ttattatagc aatagatttg 14880
tatagttgct ttctattgtc taacagcttg ttattctgta gcatcaaatc tatggcagcc 14940
tgacttgctt cttgtgaaga gagcatacca tttccaatcg aagatacgct ggaatcttct 15000
gcgctagaat caagaccata cggcctaccg gttgtgagag attccatggg ccttatgaca 15060
tatcctggaa agagtagctc atcagactta cgtttactct ctatatcaat atctacatca 15120
ggagcaatca tttcaataaa cagccgacat acatcccaga cgctataagc tgtacgtgct 15180
tttaccgtca gattcttggc tgtttcaatg tcgtccattt tggttttctt ttaccagtat 15240
tgttcgtttg ataatgtatt cttgcttatt acattataaa atctgtgcag atcacatgtc 15300
aaaacaactt tttatcacaa gatagtaccg caaaacgaac ctgcgggccg tctaaaaatt 15360
aaggaaaagc agcaaaggtg catttttaaa atatgaaatg aagataccgc agtaccaatt 15420
attttcgcag tacaaataat gcgcggccgg tgcatttttc gaaagaacgc gagacaaaca 15480
ggacaattaa agttagtttt tcgagttagc gtgtttgaat actgcaagat acaagataaa 15540
tagagtagtt gaaactagat atcaattgca cacaagatcg gcgctaagca tgccacaatt 15600
tggtatatta tgtaaaacac cacctaaggt gcttgttcgt cagtttgtgg aaaggtttga 15660
aagaccttca ggtgagaaaa tagcattatg tgctgctgaa ctaacctatt tatgttggat 15720
gattacacat aacggaacag caatcaagag agccacattc atgagctata atactatcat 15780
aagcaattcg ctgagtttcg atattgtcaa taaatcactc cagtttaaat acaagacgca 15840
aaaagcaaca attctggaag cctcattaaa gaaattgatt cctgcttggg aatttacaat 15900
tattccttac tatggacaaa aacatcaatc tgatatcact gatattgtaa gtagtttgca 15960
attacagttc gaatcatcgg aagaagcaga taagggaaat agccacagta aaaaaatgct 16020
aaagcacttc taagtgaggg tgaaagcatc tgggagatca ctgagaaaat actaaattcg 16080
tttgagtata cttcgagatt tacaaaaaca aaaactttat accaattcct cttcctagct 16140
actttcatca attgtggaag attcagcgat attaagaacg ttgatccgaa atcatttaaa 16200
ttagtccaaa ataagtatct gggagtaata atccagtgtt tagtgacaga gacaaagaca 16260
agcgttagta ggcacatata cttctttagc gcaaggggta g 16301
<210> 48
<211> 4989
<212> DNA
<213> Artificial sequence
<220>
<223> vector pYIG7
<400> 48
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata 240
cgactcacta tagggaattc ggatccttca atatgcgcac atacgctgtt atgttcaagg 300
tcccttcgtt taagaacgaa agcggtcttc cttttgaggg atgtttcaag ttgttcaaat 360
ctatcaaatt tgcaaatccc cagtctgtat ctagagcgtt gaatcggtga tgcgatttgt 420
taattaaatt gatggtgtca ccattaccag gtctagatat accaatggca aactgagcac 480
aacaatacca gtccggatca actggcacca tctctcccgt agtctcatct aatttttctt 540
ccggatgagg ttccagatat accgcaacac ctttattatg gtttccctga gggaataata 600
gaatgtccca ttcgaaatca ccaattctaa acctgggcga attgtatttc gggtttgtta 660
actcgttcca gtcaggaatg ttccacgtga agctatcttc cagcaaagtc tccacttctt 720
catcaaattg tggagaatac tcccaatgct cttatctatg ggacttccgg gaaacacagt 780
accgatactt cccaattcgt cttcagagct cattgtttgt ttgaagagac taatcaaaga 840
atcgttttct caaaaaaatt aatatcttaa ctgatagttt gatcaaaggg gcaaaacgta 900
ggggcaaaca aacggaaaaa tcgtttctca aattttctga tgccaagaac tctaaccagt 960
cttatctaaa aattgcctta tgatccgtct ctccggttac agcctgtgta actgattaat 1020
cctgcctttc taatcaccat tctaatgttt taattaaggg attttgtctt cattaacggc 1080
tttcgctcat aaaaatgtta tgacgttttg cccgcaggcg ggaaaccatc cacttcacga 1140
gactgatctc ctctgccgga acaccgggca tctccaactt ataagttgga gaaataagag 1200
aatttcagat tgagagaatg aaaaaaaaaa accctgaaaa aaaaggttga aaccagttcc 1260
ctgaaattat tcccctactt gactaataag tatataaaga cggtaggtat tgattgtaat 1320
tctgtaaatc tatttcttaa acttcttaaa ttctactttt atagttagtc ttttttttag 1380
ttttaaaaca ccaagaactt agtttcgaat aaacacacat aaacaaacac catgaggtct 1440
ttgctaatac tagtgctttg cttcctgccc ctggctgctc tgggggtacc agatctcgac 1500
ttggttgaac acgttgccaa ggcttaagtg aatttacttt aaagtcttgc atttaaataa 1560
attttctttt tatagcttta tgacttagtt tcaatttata tactatttta atgacatttt 1620
cgattcattg attgaaagct ttgtgttttt tcttgatgcg ctattgcatt gttcttgtct 1680
ttttcgccac atgtaatatc tgtagtagat acctgataca ttgtggatgc tgagtgaaat 1740
tttagttaat aatggaggcg ctcttaataa ttttggggat attggctttt ttttttaaag 1800
tttacaaatg aattttttcc gccaggataa cgattctgaa gttactctta gcgttcctat 1860
cggtacagcc atcaaatcat gcctataaat catgcctata tttgcgtgca gtcagtatca 1920
tctacatgaa aaaaactccc gcaatttctt atagaatacg ttgaaaatta aatgtacgcg 1980
ccaagataag ataacatata tctagctaga tgcagtaata tacacagatt cccgcggacg 2040
tgggaaggaa aaaattagat aacaaaatct gagtgatatg gaaattccgc tgtatagctc 2100
atatctttcc cttcaacacc agaaatgtaa aaatcttgtt acgaaggatc tttttgctaa 2160
tgtttctcgc tcaatcctca tttcttccct acgaagagtc aaatctactt gttttctgcc 2220
ggtatcaaga tccatatctt ctagtttcac catcaaagtc caatttctag tatacagttt 2280
atgtcccaac gtaacagaca atcaaaattg gaaaggataa gtatccttca aagaatgatt 2340
ctgcgctggc tcctgaaccg cctaatggga acagagaagt ccaaaacgat gctataagaa 2400
ccagaaataa aacgataaaa ccataccagg atccaagctt ggcactggcc gtcgttttac 2460
aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc 2520
ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc 2580
gcagcctgaa tggcgaatgg gaaattgtaa acgttaatat tttgttaaaa ttcgcgttaa 2640
atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa atcccttata 2700
aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac aagagtccac 2760
tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag ggcgatggcc 2820
cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt aaagcactaa 2880
atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg gcgaacgtgg 2940
cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca agtgtagcgg 3000
tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag ggcgcgtcag 3060
gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 3120
caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 3180
ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 3240
gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 3300
tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 3360
ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 3420
tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 3480
atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 3540
gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 3600
caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 3660
ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 3720
ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 3780
ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 3840
ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 3900
gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 3960
ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 4020
taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 4080
agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 4140
atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 4200
aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 4260
caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 4320
ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 4380
cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 4440
tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 4500
gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 4560
ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag cattgagaaa 4620
gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 4680
caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 4740
ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 4800
tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 4860
ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 4920
agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 4980
aagcggaag 4989
<210> 49
<211> 5422
<212> DNA
<213> Artificial sequence
<220>
<223> vector pYIG7E1
<400> 49
agcgcccaat acgcaaaccg cctctccccg cgcgttggcc gattcattaa tgcagctggc 60
acgacaggtt tcccgactgg aaagcgggca gtgagcgcaa cgcaattaat gtgagttagc 120
tcactcatta ggcaccccag gctttacact ttatgcttcc ggctcgtatg ttgtgtggaa 180
ttgtgagcgg ataacaattt cacacaggaa acagctatga ccatgattac gaatttaata 240
cgactcacta tagggaattc ggatccttca atatgcgcac atacgctgtt atgttcaagg 300
tcccttcgtt taagaacgaa agcggtcttc cttttgaggg atgtttcaag ttgttcaaat 360
ctatcaaatt tgcaaatccc cagtctgtat ctagagcgtt gaatcggtga tgcgatttgt 420
taattaaatt gatggtgtca ccattaccag gtctagatat accaatggca aactgagcac 480
aacaatacca gtccggatca actggcacca tctctcccgt agtctcatct aatttttctt 540
ccggatgagg ttccagatat accgcaacac ctttattatg gtttccctga gggaataata 600
gaatgtccca ttcgaaatca ccaattctaa acctgggcga attgtatttc gggtttgtta 660
actcgttcca gtcaggaatg ttccacgtga agctatcttc cagcaaagtc tccacttctt 720
catcaaattg tggagaatac tcccaatgct cttatctatg ggacttccgg gaaacacagt 780
accgatactt cccaattcgt cttcagagct cattgtttgt ttgaagagac taatcaaaga 840
atcgttttct caaaaaaatt aatatcttaa ctgatagttt gatcaaaggg gcaaaacgta 900
ggggcaaaca aacggaaaaa tcgtttctca aattttctga tgccaagaac tctaaccagt 960
cttatctaaa aattgcctta tgatccgtct ctccggttac agcctgtgta actgattaat 1020
cctgcctttc taatcaccat tctaatgttt taattaaggg attttgtctt cattaacggc 1080
tttcgctcat aaaaatgtta tgacgttttg cccgcaggcg ggaaaccatc cacttcacga 1140
gactgatctc ctctgccgga acaccgggca tctccaactt ataagttgga gaaataagag 1200
aatttcagat tgagagaatg aaaaaaaaaa accctgaaaa aaaaggttga aaccagttcc 1260
ctgaaattat tcccctactt gactaataag tatataaaga cggtaggtat tgattgtaat 1320
tctgtaaatc tatttcttaa acttcttaaa ttctactttt atagttagtc ttttttttag 1380
ttttaaaaca ccaagaactt agtttcgaat aaacacacat aaacaaacac catgaggtct 1440
ttgctaatac tagtgctttg cttcctgccc ctggctgctc tggggtatga ggtgcgcaac 1500
gtgtccggga tgtaccatgt cacgaacgac tgctccaact caagcattgt gtatgaggca 1560
gcggacatga tcatgcacac ccccgggtgc gtgccctgcg ttcgggagaa caactcttcc 1620
cgctgctggg tagcgctcac ccccacgctc gcagctagga acgccagcgt ccccaccacg 1680
acaatacgac gccacgtcga tttgctcgtt ggggcggctg ctttctgttc cgctatgtac 1740
gtgggggacc tctgcggatc tgtcttcctc gtctcccagc tgttcaccat ctcgcctcgc 1800
cggcatgaga cggtgcagga ctgcaattgc tcaatctatc ccggccacat aacgggtcac 1860
cgtatggctt gggatatgat gatgaactgg taatagaccc ttctcacctc ggccgataag 1920
ctcagatctc gacttggttg aacacgttgc caaggcttaa gtgaatttac tttaaagtct 1980
tgcatttaaa taaattttct ttttatagct ttatgactta gtttcaattt atatactatt 2040
ttaatgacat tttcgattca ttgattgaaa gctttgtgtt ttttcttgat gcgctattgc 2100
attgttcttg tctttttcgc cacatgtaat atctgtagta gatacctgat acattgtgga 2160
tgctgagtga aattttagtt aataatggag gcgctcttaa taattttggg gatattggct 2220
ttttttttta aagtttacaa atgaattttt tccgccagga taacgattct gaagttactc 2280
ttagcgttcc tatcggtaca gccatcaaat catgcctata aatcatgcct atatttgcgt 2340
gcagtcagta tcatctacat gaaaaaaact cccgcaattt cttatagaat acgttgaaaa 2400
ttaaatgtac gcgccaagat aagataacat atatctagct agatgcagta atatacacag 2460
attcccgcgg acgtgggaag gaaaaaatta gataacaaaa tctgagtgat atggaaattc 2520
cgctgtatag ctcatatctt tcccttcaac accagaaatg taaaaatctt gttacgaagg 2580
atctttttgc taatgtttct cgctcaatcc tcatttcttc cctacgaaga gtcaaatcta 2640
cttgttttct gccggtatca agatccatat cttctagttt caccatcaaa gtccaatttc 2700
tagtatacag tttatgtccc aacgtaacag acaatcaaaa ttggaaagga taagtatcct 2760
tcaaagaatg attctgcgct ggctcctgaa ccgcctaatg ggaacagaga agtccaaaac 2820
gatgctataa gaaccagaaa taaaacgata aaaccatacc aggatccaag cttggcactg 2880
gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt 2940
gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct 3000
tcccaacagt tgcgcagcct gaatggcgaa tgggaaattg taaacgttaa tattttgtta 3060
aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc 3120
aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg 3180
aacaagagtc cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat 3240
cagggcgatg gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc 3300
cgtaaagcac taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag 3360
ccggcgaacg tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg 3420
gcaagtgtag cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta 3480
cagggcgcgt caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt 3540
ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa 3600
taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt 3660
tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat 3720
gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag 3780
atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg 3840
ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata 3900
cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat 3960
ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc 4020
aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg 4080
ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac 4140
gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact 4200
ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa 4260
gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct 4320
ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc 4380
tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga 4440
cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac 4500
tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag 4560
atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg 4620
tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc 4680
tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag 4740
ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc 4800
cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac 4860
ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc 4920
gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt 4980
tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt 5040
gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc 5100
ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt 5160
tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca 5220
ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt 5280
tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt 5340
attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag 5400
tcagtgagcg aggaagcgga ag 5422
<210> 50
<211> 15621
<212> DNA
<213> Artificial sequence
<220>
<223> vector pSY1YIG7E1s
<400> 50
atcgataagc ttttcaattc aattcatcat ttttttttta ttcttttttt tgatttcggt 60
ttctttgaaa tttttttgat tcggtaatct ccgaacagaa ggaagaacga aggaaggagc 120
acagacttag attggtatat atacgcatat gtagtgttga agaaacatga aattgcccag 180
tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa atcatgtcga 240
aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc aagctattta 300
atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt accaccaagg 360
aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa acacatgtgg 420
atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca ttatccgcca 480
agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat acagtcaaat 540
tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg aatgcacacg 600
gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcagaagaa gtaacaaagg 660
aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta tctactggag 720
aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt atcggcttta 780
ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt atgacacccg 840
gtgtgggttt agatgacaag ggagacgcat tgggtcaaca gtatagaacc gtggatgatg 900
tggtctctac aggatctgac attattattg ttggaagagg actatttgca aagggaaggg 960
atgctaaggt agagggtgaa cgttacagaa aagcaggctg ggaagcatat ttgagaagat 1020
gcggccagca aaactaaaaa actgtattat aagtaaatgc atgtatacta aactcacaaa 1080
ttagagcttc aatttaatta tatcagttat tacccgggaa tctcggtcgt aatgattttt 1140
ataatgacga aaaaaaaaaa attggaaaga aaaagcttta atgcggtagt ttatcacagt 1200
taaattgcta acgcagtcag gcaccgtgta tgaaatctaa caatgcgctc atcgtcatcc 1260
tcggcaccgt caccctggat gctgtaggca taggcttggt tatgccggta ctgccgggcc 1320
tcttgcggga tatcgtccat tccgacagca tcgccagtca ctatggcgtg ctgctagcgc 1380
tatatgcgtt gatgcaattt ctatgcgcac ccgttctcgg agcactgtcc gaccgctttg 1440
gccgccgccc agtcctgctc gcttcgctac ttggagccac tatcgactac gcgatcatgg 1500
cgaccacacc cgtcctgtgg atcctggtat ggttttatcg ttttatttct ggttcttata 1560
gcatcgtttt ggacttctct gttcccatta ggcggttcag gagccagcgc agaatcattc 1620
tttgaaggat acttatcctt tccaattttg attgtctgtt acgttgggac ataaactgta 1680
tactagaaat tggactttga tggtgaaact agaagatatg gatcttgata ccggcagaaa 1740
acaagtagat ttgactcttc gtagggaaga aatgaggatt gagcgagaaa cattagcaaa 1800
aagatccttc gtaacaagat ttttacattt ctggtgttga agggaaagat atgagctata 1860
cagcggaatt tccatatcac tcagattttg ttatctaatt ttttccttcc cacgtccgcg 1920
ggaatctgtg tatattactg catctagcta gatatatgtt atcttatctt ggcgcgtaca 1980
tttaattttc aacgtattct ataagaaatt gcgggagttt ttttcatgta gatgatactg 2040
actgcacgca aatataggca tgatttatag gcatgatttg atggctgtac cgataggaac 2100
gctaagagta acttcagaat cgttatcctg gcggaaaaaa ttcatttgta aactttaaaa 2160
aaaaaagcca atatccccaa aattattaag agcgcctcca ttattaacta aaatttcact 2220
cagcatccac aatgtatcag gtatctacta cagatattac atgtggcgaa aaagacaaga 2280
acaatgcaat agcgcatcaa gaaaaaacac aaagctttca atcaatgaat cgaaaatgtc 2340
attaaaatag tatataaatt gaaactaagt cataaagcta taaaaagaaa atttatttaa 2400
atgcaagact ttaaagtaaa ttcacttaag ccttggcaac gtgttcaacc aagtcgagat 2460
ctgagcttat cggccgaggt gagaagggtc tattaccagt tcatcatcat atcccaagcc 2520
atacggtgac ccgttatgtg gccgggatag attgagcaat tgcagtcctg caccgtctca 2580
tgccggcgag gcgagatggt gaacagctgg gagacgagga agacagatcc gcagaggtcc 2640
cccacgtaca tagcggaaca gaaagcagcc gccccaacga gcaaatcgac gtggcgtcgt 2700
attgtcgtgg tggggacgct ggcgttccta gctgcgagcg tgggggtgag cgctacccag 2760
cagcgggaag agttgttctc ccgaacgcag ggcacgcacc cgggggtgtg catgatcatg 2820
tccgctgcct catacacaat gcttgagttg gagcagtcgt tcgtgacatg gtacatcccg 2880
gacacgttgc gcacctcata ccccagagca gccaggggca ggaagcaaag cactagtatt 2940
agcaaagacc tcatggtgtt tgtttatgtg tgtttattcg aaactaagtt cttggtgttt 3000
taaaactaaa aaaaagacta actataaaag tagaatttaa gaagtttaag aaatagattt 3060
acagaattac aatcaatacc taccgtcttt atatacttat tagtcaagta ggggaataat 3120
ttcagggaac tggtttcaac cttttttttc agggtttttt tttttcattc tctcaatctg 3180
aaattctctt atttctccaa cttataagtt ggagatgccc ggtgttccgg cagaggagat 3240
cagtctcgtg aagtggatgg tttcccgcct gcgggcaaaa cgtcataaca tttttatgag 3300
cgaaagccgt taatgaagac aaaatccctt aattaaaaca ttagaatggt gattagaaag 3360
gcaggattaa tcagttacac aggctgtaac cggagagacg gatcataagg caatttttag 3420
ataagactgg ttagagttct tggcatcaga aaatttgaga aacgattttt ccgtttgttt 3480
gcccctacgt tttgcccctt tgatcaaact atcagttaag atattaattt ttttgagaaa 3540
acgattcttt gattagtctc ttcaaacaaa caatgagctc tgaagacgaa ttgggaagta 3600
tcggtactgt gtttcccgga agtcccatag ataagagcat tgggagtatt ctccacaatt 3660
tgatgaagaa gtggagactt tgctggaaga tagcttcacg tggaacattc ctgactggaa 3720
cgagttaaca aacccgaaat acaattcgcc caggtttaga attggtgatt tcgaatggga 3780
cattctatta ttccctcagg gaaaccataa taaaggtgtt gcggtatatc tggaacctca 3840
tccggaagaa aaattagatg agactacggg agagatggtg ccagttgatc cggactggta 3900
ttgttgtgct cagtttgcca ttggtatatc tagacctggt aatggtgaca ccatcaattt 3960
aattaacaaa tcgcatcacc gattcaacgc tctagataca gactggggat ttgcaaattt 4020
gatagatttg aacaacttga aacatccctc aaaaggaaga ccgctttcgt tcttaaacga 4080
agggaccttg aacataacag cgtatgtgcg catattgaag gatcctctac gccggacgca 4140
tcgtggccgg catcaccggc gccacaggtg cggttgctgg cccctatatc gccgacatca 4200
ccgatgggga agatcgggct cgccacttcg ggctcatgag cgcttgtttc ggcgtgggta 4260
tggtggcagg ccccgtggcc gggggactgt tgggcgccat ctccttgcat gcaccattcc 4320
ttgcggcggc ggtgctcaac ggcctcaacc tactactggg ctgcttccta atgcaggagt 4380
cgcataaggg agagcgtcga ccgatgccct tgagagcctt caacccagtc agctccttcc 4440
ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt atcatgcaac 4500
tcgtaggaca ggtgccggca gcgctctggg tcattttcgg cgaggaccgc tttcgctgga 4560
gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat cttgcacgcc ctcgctcaag 4620
ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa gcaggccatt atcgccggca 4680
tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc gacgcgaggc tggatggcct 4740
tccccattat gattcttctc gcttccggcg gcatcgggat gcccgcgttg caggccatgc 4800
tgtccaggca ggtagatgac gaccatcagg gacagcttca aggatcgctc gcggctctta 4860
ccagcctaac ttcgatcact ggaccgctga tcgtcacggc gatttatgcc gcctcggcga 4920
gcacatggaa cgggttggca tggattgtag gcgccgccct ataccttgtc tgcctccccg 4980
cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg aatggaagcc ggcggcacct 5040
cgctaacgga ttcaccactc caagaattgg agccaatcaa ttcttgcgga gaactgtgaa 5100
tgcgcaaacc aacccttggc agaacatatc catcgcgtcc gccatctcca gcagccgcac 5160
gcggcgcatc tcgggcagcg ttgggtcctg gccacgggtg cgcatgatcg tgctcctgtc 5220
gttgaggacc cggctaggct ggcggggttg ccttactggt tagcagaatg aatcaccgat 5280
acgcgagcga acgtgaagcg actgctgctg caaaacgtct gcgacctgag caacaacatg 5340
aatggtcttc ggtttccgtg tttcgtaaag tctggaaacg cggaagtcag cgccctgcac 5400
cattatgttc cggatctgca tcgcaggatg ctgctggcta ccctgtggaa cacctacatc 5460
tgtattaacg aagcgctggc attgaccctg agtgattttt ctctggtccc gccgcatcca 5520
taccgccagt tgtttaccct cacaacgttc cagtaaccgg gcatgttcat catcagtaac 5580
ccgtatcgtg agcatcctct ctcgtttcat cggtatcatt acccccatga acagaaattc 5640
ccccttacac ggaggcatca agtgaccaaa caggaaaaaa ccgcccttaa catggcccgc 5700
tttatcagaa gccagacatt aacgcttctg gagaaactca acgagctgga cgcggatgaa 5760
caggcagaca tctgtgaatc gcttcacgac cacgctgatg agctttaccg cagctgcctc 5820
gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 5880
gcttgtctgt aagcggtgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 5940
gcgggtgtcg gggcgcagcc atgacccagt cacgtagcga tagcggagtg tatactggct 6000
taactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt gtgaaatacc 6060
gcacagatgc gtaaggagaa aataccgcat caggcgctct tccgcttcct cgctcactga 6120
ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 6180
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 6240
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 6300
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 6360
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 6420
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 6480
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 6540
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 6600
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 6660
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 6720
gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 6780
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 6840
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 6900
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 6960
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 7020
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 7080
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 7140
gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 7200
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 7260
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 7320
agttaatagt ttgcgcaacg ttgttgccat tgctgcaggc atcgtggtgt cacgctcgtc 7380
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 7440
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 7500
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 7560
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 7620
tatgcggcga ccgagttgct cttgcccggc gtcaacacgg gataataccg cgccacatag 7680
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 7740
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 7800
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 7860
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 7920
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 7980
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 8040
aaccattatt atcatgacat taacctataa aaaataggcg tatcacgagg ccctttcgtc 8100
ttcaagaatt ctcatgtttg acagcttatc atcgatccac ttgtatattt ggatgaattt 8160
ttgaggaatt ctgaaccagt cctaaaacga gtaaatagga ccggcaattc ttcaagcaat 8220
aaacaggaat accaattatt aaaagataac ttagtcagat cgtacaataa agctttgaag 8280
aaaaatgcgc cttattcaat ctttgcataa aaaaatggcc caaaatctca cattggaaga 8340
catttgatga cctcatttct ttcaatgaag ggcctaacgg agttgactaa tgttgtggga 8400
aattggaccg ataagcgtgc ttctgccgtg gccaggacaa cgtatactca tcagataaca 8460
gcaatacctg atcactactt cgcactagtt tctcggtact atgcatatga tccaatatca 8520
aaggaaatga tagcattgaa ggatgagact aatccaattg aggagtggca gcatatagaa 8580
cagctaaagg gtagtgctga aggaagcata cgataccccg catggaatgg gataatatca 8640
caggaggtac tagactacct ttcatcctac ataaatagac gcatataagt acgcatttaa 8700
gcataaacac gcactatgcc gttcttctca tgtatatata tatacaggca acacgcagat 8760
ataggtgcga cgtgaacagt gagctgtatg tgcgcagctc gcgttgcatt ttcggaagcg 8820
ctcgttttcg gaaacgcttt gaagttccta ttccgaagtt cctattctct agaaagtata 8880
ggaacttcag agcgcttttg aaaaccaaaa gcgctctgaa gacgcacttt caaaaaacca 8940
aaaacgcacc ggactgtaac gagctactaa aatattgcga ataccgcttc cacaaacatt 9000
gctcaaaagt atctctttgc tatatatctc tgtgctatat ccctatataa ccatcccatc 9060
cacctttcgc tccttgaact tgcatctaaa ctcgacctct acatttttta tgtttatctc 9120
tagtattacc tcttagacaa aaaaattgta gtaagaacta ttcatagagt taatcgaaaa 9180
caatacgaaa atgtaaacat ttcctatacg tagtatatag agacaaaata gaagaaaccg 9240
ttcataattt tctgaccaat gaagaatcat caacgctatc actttctgtt cacaaagtat 9300
gcgcaatcca catcggtata gaatataatc ggggatgcct ttatcttgaa aaaatgcacc 9360
cgcagcttcg ctagtaatca gtaaacgcgg gaagtggagt caggcttttt ttatggaaga 9420
gaaaatagac accaaagtag ccttcttcta accttaacgg acctacagtg caaaaagtta 9480
tcaagagact gcattataga gcgcacaaag gagaaaaaaa gtaatctaag atgctttgtt 9540
agaaaaatag cgctctcggg atgcattttt gtagaacaaa aaagaagtat agattcttgt 9600
tggtaaaata gcgctctcgc gttgcatttc tgttctgtaa aaatgcagct cagattcttt 9660
gtttgaaaaa ttagcgctct cgcgttgcat ttttgtttta caaaaatgaa gcacagattc 9720
ttcgttggta aaatagcgct ttcgcgttgc atttctgttc tgtaaaaatg cagctcagat 9780
tctttgtttg aaaaattagc gctctcgcgt tgcatttttg ttctacaaaa tgaagcacag 9840
atgcttcgtt aacaaagata tgctattgaa gtgcaagatg gaaacgcaga aaatgaaccg 9900
gggatgcgac gtgcaagatt acctatgcaa tagatgcaat agtttctcca ggaaccgaaa 9960
tacatacatt gtcttccgta aagcgctaga ctatatatta ttatacaggt tcaaatatac 10020
tatctgtttc agggaaaact cccaggttcg gatgttcaaa attcaatgat gggtaacaag 10080
tacgatcgta aatctgtaaa acagtttgtc ggatattagg ctgtatctcc tcaaagcgta 10140
ttcgaatatc attgagaagc tgcatttttt tttttttttt tttttttttt ttttttatat 10200
atatttcaag gatataccat tgtaatgtct gcccctaaga agatcgtcgt tttgccaggt 10260
gaccacgttg gtcaagaaat cacagccgaa gccattaagg ttcttaaagc tatttctgat 10320
gttcgttcca atgtcaagtt cgatttcgaa aatcatttaa ttggtggtgc tgctatcgat 10380
gctacaggtg tcccacttcc agatgaggcg ctggaagcct ccaagaaggt tgatgccgtt 10440
ttgttaggtg ctgtgggtgg tcctaaatgg ggtaccggta gtgttagacc tgaacaaggt 10500
ttactaaaaa tccgtaaaga acttcaattg tacgccaact taagaccatg taactttgca 10560
tccgactctc ttttagactt atctccaatc aagccacaat ttgctaaagg tactgacttc 10620
gttgttgtca gagaattagt gggaggtatt tactttggta agagaaagga agacgatggt 10680
gatggtgtcg cttgggatag tgaacaatac accgttccag aagtgcaaag aatcacaaga 10740
atggccgctt tcatggccct acaacatgag ccaccattgc ctatttggtc cttggataaa 10800
gctaatgttt tggcctcttc aagattatgg agaaaaactg tggaggaaac catcaagaac 10860
gaattcccta cattgaaggt tcaacatcaa ttgattgatt ctgccgccat gatcctagtt 10920
aagaacccaa cccacctaaa tggtattata atcaccagca acatgtttgg tgatatcatc 10980
tccgatgaag cctccgttat cccaggttcc ttgggtttgt tgccatctgc gtccttggcc 11040
tctttgccag acaagaacac cgcatttggt ttgtacgaac catgccacgg ttctgctcca 11100
gatttgccaa agaataaggt tgaccctatc gccactatct tgtctgctgc aatgatgttg 11160
aaattgtcat tgaacttgcc tgaagaaggt aaggccattg aagatgcagt taaaaaggtt 11220
ttggatgcag gtatcagaac tggtgattta ggtggttcca acagtaccac cgaagtcggt 11280
gatgctgtcg ccgaagaagt taagaaaatc cttgcttaaa aagattctct ttttttatga 11340
tatttgtaca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaatgcag 11400
cgtcacatcg gataataatg atggcagcca ttgtagaagt gccttttgca tttctagtct 11460
ctttctcggt ctagctagtt ttactacatc gcgaagatag aatcttagat cacactgcct 11520
ttgctgagct ggatcatatg agtaacaaaa gagtggtaag gcctcgttaa aggacaagga 11580
cctgagcgga agtgtatcgt aaagtagacg gagtatacta gtatagtcta tagtccgtgg 11640
aattctaagt gccagcttta taatgtcatt ctccttacta cagacccgcc tgaaagtaga 11700
cacatcatca tcagtaagct ttgacaaaaa gcattgagta gctaactctt ctatgcaatc 11760
tatagctgtt ttataaggca ttcaatggac agattgaggt ttttgaaaca tactagtgaa 11820
attagcctta atcccttctc gaagttaatc atgcattatg gtgtaaaaaa tgcaactcgc 11880
gttgctctac tttttcccga atttccaaat acgcagctgg ggtgattgct cgatttcgta 11940
acgaaagttt tgtttataaa aaccgcgaaa accttctgta acagatagat ttttacagcg 12000
ctgatataca atgacatcag ctgtaatgga aaataactga aatatgaatg gcgagagact 12060
gcttgcttgt attaagcaat gtattatgca gcacttccaa cctatggtgt acgatgaaag 12120
taggtgtgta atcgagacga caagggggac ttttccagtt cctgatcatt ataagaaata 12180
caaaacgtta gcatttgcat ttgttggaca tgtactgaat acagacgaca caccggtaat 12240
tgaaaaagaa ctggattggc ctgatcctgc actagtgtac aatacaattg tcgatcgaat 12300
cataaatcac ccagaattat cacagtttat atcggttgca tttattagtc agttaaaggc 12360
caccatcgga gagggtttag atattaatgt aaaaggcacg ctaaaccgca ggggaaaggg 12420
tatcagaagg cctaaaggcg tattttttag atacatggaa tctccatttg tcaatacaaa 12480
ggtcactgca ttcttctctt atcttcgaga ttataataaa attgcctcag aatatcacaa 12540
taatactaaa ttcattctca cgttttcatg tcaagcatat tgggcatctg gcccaaactt 12600
ctccgccttg aagaatgtta tttggtgctc cataattcat gaatacattt ctaagtttgt 12660
ggaaagagaa caggataaag gtcatatagg agatcaggag ctaccgcctg aagaggaccc 12720
ttctcgtgaa ctaaacaatg tacaacatga agtcaatagt ttaacggaac aagatgcgga 12780
ggcggatgaa ggattgtggg gtgaaataga ttcattatgt gaaaaatggc agtctgaagc 12840
ggagagtcaa actgaggcgg agataatagc cgacaggata attggaaata gccagaggat 12900
ggcgaacctc aaaattcgtc gtacaaagtt caaaagtgtc ttgtatcata tactaaagga 12960
actaattcaa tctcagggaa ccgtaaaggt ttatcgcggt agtagttttt cacacgattc 13020
gataaagata agcttacatt atgaagagca gcatattaca gccgtatggg tctacttgat 13080
agtaaaattt gaagagcatt ggaagcctgt tgatgtagag gtcgagttta gatgcaagtt 13140
caaggagcga aaggtggatg ggtaggttat atagggatat agcacagaga tatatagcaa 13200
agagatactt ttgaggcaat gtttgtggaa gcggtattcg caatatttta gtagctcgtt 13260
acagtccggt gcgtttttgg ttttttgaaa gtgcgtcttc agagcgcttt tggttttcaa 13320
aagcgctctg aagttcctat actttctaga gaataggaac ttcggaatag gaacttcaaa 13380
gcgtttccga aaacgagcgc ttccgaaaat gcaacgcgag ctgcgcacat acagctcact 13440
gttcacgtcg cacctatatc tgcgtgttgc ctgtatatat atatacatga gaagaacggc 13500
atagtgcgtg tttatgctta aatgcgtact tatatgcgtc tatttatgta ggatgaaagg 13560
tagtctagta cctcctgtga tattatccca ttccatgcgg ggtatcgtat gcttccttca 13620
gcactaccct ttagctgttc tatatgctgc cactcctcaa ttggattagt ctcatccttc 13680
aatgcattca tttcctttga tattggatca taccctagaa gtattacgtg attttctgcc 13740
ccttaccctc gttgctactc tccttttttt cgtgggaacc gctttagggc cctcagtgat 13800
ggtgttttgt aatttatatg ctcctcttgc atttgtgtct ctacttcttg ttcgcctgga 13860
gggaacttct tcatttgtat tagcatggtt cacttcagtc cttccttcca actcactctt 13920
tttttgctgt aaacgattct ctgccgccag ttcattgaaa ctattgaata tatcctttag 13980
agattccggg atgaataaat cacctattaa agcagcttga cgatctggtg gaactaaagt 14040
aagcaattgg gtaacgacgc ttacgagctt cataacatct tcttccgttg gagctggtgg 14100
gactaataac tgtgtacaat ccatttttct catgagcatt tcggtagctc tcttcttgtc 14160
tttctcgggc aatcttccta ttattatagc aatagatttg tatagttgct ttctattgtc 14220
taacagcttg ttattctgta gcatcaaatc tatggcagcc tgacttgctt cttgtgaaga 14280
gagcatacca tttccaatcg aagatacgct ggaatcttct gcgctagaat caagaccata 14340
cggcctaccg gttgtgagag attccatggg ccttatgaca tatcctggaa agagtagctc 14400
atcagactta cgtttactct ctatatcaat atctacatca ggagcaatca tttcaataaa 14460
cagccgacat acatcccaga cgctataagc tgtacgtgct tttaccgtca gattcttggc 14520
tgtttcaatg tcgtccattt tggttttctt ttaccagtat tgttcgtttg ataatgtatt 14580
cttgcttatt acattataaa atctgtgcag atcacatgtc aaaacaactt tttatcacaa 14640
gatagtaccg caaaacgaac ctgcgggccg tctaaaaatt aaggaaaagc agcaaaggtg 14700
catttttaaa atatgaaatg aagataccgc agtaccaatt attttcgcag tacaaataat 14760
gcgcggccgg tgcatttttc gaaagaacgc gagacaaaca ggacaattaa agttagtttt 14820
tcgagttagc gtgtttgaat actgcaagat acaagataaa tagagtagtt gaaactagat 14880
atcaattgca cacaagatcg gcgctaagca tgccacaatt tggtatatta tgtaaaacac 14940
cacctaaggt gcttgttcgt cagtttgtgg aaaggtttga aagaccttca ggtgagaaaa 15000
tagcattatg tgctgctgaa ctaacctatt tatgttggat gattacacat aacggaacag 15060
caatcaagag agccacattc atgagctata atactatcat aagcaattcg ctgagtttcg 15120
atattgtcaa taaatcactc cagtttaaat acaagacgca aaaagcaaca attctggaag 15180
cctcattaaa gaaattgatt cctgcttggg aatttacaat tattccttac tatggacaaa 15240
aacatcaatc tgatatcact gatattgtaa gtagtttgca attacagttc gaatcatcgg 15300
aagaagcaga taagggaaat agccacagta aaaaaatgct aaagcacttc taagtgaggg 15360
tgaaagcatc tgggagatca ctgagaaaat actaaattcg tttgagtata cttcgagatt 15420
tacaaaaaca aaaactttat accaattcct cttcctagct actttcatca attgtggaag 15480
attcagcgat attaagaacg ttgatccgaa atcatttaaa ttagtccaaa ataagtatct 15540
gggagtaata atccagtgtt tagtgacaga gacaaagaca agcgttagta ggcacatata 15600
cttctttagc gcaaggggta g 15621
<210> 51
<211> 3593
<212> DNA
<213> Artificial sequence
<220>
<223> vector pPICZalphaA
<400> 51
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc 1200
tgaagctgaa ttcacgtggc ccagccggcc gtctcggatc ggtacctcga gccgcggcgg 1260
ccgccagctt tctagaacaa aaactcatct cagaagagga tctgaatagc gccgtcgacc 1320
atcatcatca tcatcattga gtttgtagcc ttagacatga ctgttcctca gttcaagttg 1380
ggcacttacg agaagaccgg tcttgctaga ttctaatcaa gaggatgtca gaatgccatt 1440
tgcctgagag atgcaggctt catttttgat acttttttat ttgtaaccta tatagtatag 1500
gatttttttt gtcattttgt ttcttctcgt acgagcttgc tcctgatcag cctatctcgc 1560
agctgatgaa tatcttgtgg taggggtttg ggaaaatcat tcgagtttga tgtttttctt 1620
ggtatttccc actcctcttc agagtacaga agattaagtg agaccttcgt ttgtgcggat 1680
cccccacaca ccatagcttc aaaatgtttc tactcctttt ttactcttcc agattttctc 1740
ggactccgcg catcgccgta ccacttcaaa acacccaagc acagcatact aaattttccc 1800
tctttcttcc tctagggtgt cgttaattac ccgtactaaa ggtttggaaa agaaaaaaga 1860
gaccgcctcg tttctttttc ttcgtcgaaa aaggcaataa aaatttttat cacgtttctt 1920
tttcttgaaa tttttttttt tagttttttt ctctttcagt gacctccatt gatatttaag 1980
ttaataaacg gtcttcaatt tctcaagttt cagtttcatt tttcttgttc tattacaact 2040
ttttttactt cttgttcatt agaaagaaag catagcaatc taatctaagg ggcggtgttg 2100
acaattaatc atcggcatag tatatcggca tagtataata cgacaaggtg aggaactaaa 2160
ccatggccaa gttgaccagt gccgttccgg tgctcaccgc gcgcgacgtc gccggagcgg 2220
tcgagttctg gaccgaccgg ctcgggttct cccgggactt cgtggaggac gacttcgccg 2280
gtgtggtccg ggacgacgtg accctgttca tcagcgcggt ccaggaccag gtggtgccgg 2340
acaacaccct ggcctgggtg tgggtgcgcg gcctggacga gctgtacgcc gagtggtcgg 2400
aggtcgtgtc cacgaacttc cgggacgcct ccgggccggc catgaccgag atcggcgagc 2460
agccgtgggg gcgggagttc gccctgcgcg acccggccgg caactgcgtg cacttcgtgg 2520
ccgaggagca ggactgacac gtccgacggc ggcccacggg tcccaggcct cggagatccg 2580
tccccctttt cctttgtcga tatcatgtaa ttagttatgt cacgcttaca ttcacgccct 2640
ccccccacat ccgctctaac cgaaaaggaa ggagttagac aacctgaagt ctaggtccct 2700
atttattttt ttatagttat gttagtatta agaacgttat ttatatttca aatttttctt 2760
ttttttctgt acagacgcgt gtacgcatgt aacattatac tgaaaacctt gcttgagaag 2820
gttttgggac gctcgaaggc tttaatttgc aagctggaga ccaacatgtg agcaaaaggc 2880
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 2940
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 3000
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 3060
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa 3120
tgctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 3180
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 3240
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 3300
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 3360
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 3420
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 3480
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 3540
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag atc 3593
<210> 52
<211> 3547
<212> DNA
<213> Artificial sequence
<220>
<223> vector pPICZalphaD'
<400> 52
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaaggggccc 1200
gaattcgcat gcggccgcca gctttctaga acaaaaactc atctcagaag aggatctgaa 1260
tagcgccgtc gaccatcatc atcatcatca ttgagtttgt agccttagac atgactgttc 1320
ctcagttcaa gttgggcact tacgagaaga ccggtcttgc tagattctaa tcaagaggat 1380
gtcagaatgc catttgcctg agagatgcag gcttcatttt tgatactttt ttatttgtaa 1440
cctatatagt ataggatttt ttttgtcatt ttgtttcttc tcgtacgagc ttgctcctga 1500
tcagcctatc tcgcagctga tgaatatctt gtggtagggg tttgggaaaa tcattcgagt 1560
ttgatgtttt tcttggtatt tcccactcct cttcagagta cagaagatta agtgagacct 1620
tcgtttgtgc ggatccccca cacaccatag cttcaaaatg tttctactcc ttttttactc 1680
ttccagattt tctcggactc cgcgcatcgc cgtaccactt caaaacaccc aagcacagca 1740
tactaaattt tccctctttc ttcctctagg gtgtcgttaa ttacccgtac taaaggtttg 1800
gaaaagaaaa aagagaccgc ctcgtttctt tttcttcgtc gaaaaaggca ataaaaattt 1860
ttatcacgtt tctttttctt gaaatttttt tttttagttt ttttctcttt cagtgacctc 1920
cattgatatt taagttaata aacggtcttc aatttctcaa gtttcagttt catttttctt 1980
gttctattac aacttttttt acttcttgtt cattagaaag aaagcatagc aatctaatct 2040
aaggggcggt gttgacaatt aatcatcggc atagtatatc ggcatagtat aatacgacaa 2100
ggtgaggaac taaaccatgg ccaagttgac cagtgccgtt ccggtgctca ccgcgcgcga 2160
cgtcgccgga gcggtcgagt tctggaccga ccggctcggg ttctcccggg acttcgtgga 2220
ggacgacttc gccggtgtgg tccgggacga cgtgaccctg ttcatcagcg cggtccagga 2280
ccaggtggtg ccggacaaca ccctggcctg ggtgtgggtg cgcggcctgg acgagctgta 2340
cgccgagtgg tcggaggtcg tgtccacgaa cttccgggac gcctccgggc cggccatgac 2400
cgagatcggc gagcagccgt gggggcggga gttcgccctg cgcgacccgg ccggcaactg 2460
cgtgcacttc gtggccgagg agcaggactg acacgtccga cggcggccca cgggtcccag 2520
gcctcggaga tccgtccccc ttttcctttg tcgatatcat gtaattagtt atgtcacgct 2580
tacattcacg ccctcccccc acatccgctc taaccgaaaa ggaaggagtt agacaacctg 2640
aagtctaggt ccctatttat ttttttatag ttatgttagt attaagaacg ttatttatat 2700
ttcaaatttt tctttttttt ctgtacagac gcgtgtacgc atgtaacatt atactgaaaa 2760
ccttgcttga gaaggttttg ggacgctcga aggctttaat ttgcaagctg gagaccaaca 2820
tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 2880
tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 2940
gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 3000
ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 3060
tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 3120
agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 3180
atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 3240
acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 3300
actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 3360
tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 3420
tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 3480
tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 3540
tgagatc 3547
<210> 53
<211> 3558
<212> DNA
<213> Artificial sequence
<220>
<223> vector pPICZalphaE'
<400> 53
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc 1200
tgaagcctgc agcatatgct cgaggccgcc agctttctag aacaaaaact catctcagaa 1260
gaggatctga atagcgccgt cgaccatcat catcatcatc attgagtttg tagccttaga 1320
catgactgtt cctcagttca agttgggcac ttacgagaag accggtcttg ctagattcta 1380
atcaagagga tgtcagaatg ccatttgcct gagagatgca ggcttcattt ttgatacttt 1440
tttatttgta acctatatag tataggattt tttttgtcat tttgtttctt ctcgtacgag 1500
cttgctcctg atcagcctat ctcgcagctg atgaatatct tgtggtaggg gtttgggaaa 1560
atcattcgag tttgatgttt ttcttggtat ttcccactcc tcttcagagt acagaagatt 1620
aagtgagacc ttcgtttgtg cggatccccc acacaccata gcttcaaaat gtttctactc 1680
cttttttact cttccagatt ttctcggact ccgcgcatcg ccgtaccact tcaaaacacc 1740
caagcacagc atactaaatt ttccctcttt cttcctctag ggtgtcgtta attacccgta 1800
ctaaaggttt ggaaaagaaa aaagagaccg cctcgtttct ttttcttcgt cgaaaaaggc 1860
aataaaaatt tttatcacgt ttctttttct tgaaattttt ttttttagtt tttttctctt 1920
tcagtgacct ccattgatat ttaagttaat aaacggtctt caatttctca agtttcagtt 1980
tcatttttct tgttctatta caactttttt tacttcttgt tcattagaaa gaaagcatag 2040
caatctaatc taaggggcgg tgttgacaat taatcatcgg catagtatat cggcatagta 2100
taatacgaca aggtgaggaa ctaaaccatg gccaagttga ccagtgccgt tccggtgctc 2160
accgcgcgcg acgtcgccgg agcggtcgag ttctggaccg accggctcgg gttctcccgg 2220
gacttcgtgg aggacgactt cgccggtgtg gtccgggacg acgtgaccct gttcatcagc 2280
gcggtccagg accaggtggt gccggacaac accctggcct gggtgtgggt gcgcggcctg 2340
gacgagctgt acgccgagtg gtcggaggtc gtgtccacga acttccggga cgcctccggg 2400
ccggccatga ccgagatcgg cgagcagccg tgggggcggg agttcgccct gcgcgacccg 2460
gccggcaact gcgtgcactt cgtggccgag gagcaggact gacacgtccg acggcggccc 2520
acgggtccca ggcctcggag atccgtcccc cttttccttt gtcgatatca tgtaattagt 2580
tatgtcacgc ttacattcac gccctccccc cacatccgct ctaaccgaaa aggaaggagt 2640
tagacaacct gaagtctagg tccctattta tttttttata gttatgttag tattaagaac 2700
gttatttata tttcaaattt ttcttttttt tctgtacaga cgcgtgtacg catgtaacat 2760
tatactgaaa accttgcttg agaaggtttt gggacgctcg aaggctttaa tttgcaagct 2820
ggagaccaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 2880
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 2940
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 3000
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 3060
ttcgggaagc gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt 3120
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 3180
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 3240
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 3300
gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 3360
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 3420
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 3480
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 3540
gattttggtc atgagatc 3558
<210> 54
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 54
tcgagaaaag gggcccgaat tcgcatgc 28
<210> 55
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 55
ggccgcatgc gaattcgggc cccttttc 28
<210> 56
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 56
tcgagaaaag agaggctgaa gcctgcagca tatgc 35
<210> 57
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic probe or primer
<400> 57
ggccgcatat gctgcaggct tcagcctctc ttttc 35
<210> 58
<211> 3997
<212> DNA
<213> Artificial sequence
<220>
<223> vector pPICZalphaD' E1sH6
<400> 58
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaaggtatga 1200
ggtgcgcaac gtgtccggga tgtaccatgt cacgaacgac tgctccaact caagcattgt 1260
gtatgaggca gcggacatga tcatgcacac ccccgggtgc gtgccctgcg ttcgggagaa 1320
caactcttcc cgctgctggg tagcgctcac ccccacgctc gcagctagga acgccagcgt 1380
ccccactacg acaatacgac gccacgtcga tttgctcgtt ggggcggctg ctttctgttc 1440
cgctatgtac gtgggggatc tctgcggatc tgtcttcctc gtctcccagc tgttcaccat 1500
ctcgcctcgc cggcatgaga cggtgcagga ctgcaattgc tcaatctatc ccggccacat 1560
aacaggtcac cgtatggctt gggatatgat gatgaactgg caccaccacc atcaccatta 1620
aagatctaag cttgaatccc gcggccatgc gaattcgcat gcggccgcca gctttctaga 1680
acaaaaactc atctcagaag aggatctgaa tagcgccgtc gaccatcatc atcatcatca 1740
ttgagtttgt agccttagac atgactgttc ctcagttcaa gttgggcact tacgagaaga 1800
ccggtcttgc tagattctaa tcaagaggat gtcagaatgc catttgcctg agagatgcag 1860
gcttcatttt tgatactttt ttatttgtaa cctatatagt ataggatttt ttttgtcatt 1920
ttgtttcttc tcgtacgagc ttgctcctga tcagcctatc tcgcagctga tgaatatctt 1980
gtggtagggg tttgggaaaa tcattcgagt ttgatgtttt tcttggtatt tcccactcct 2040
cttcagagta cagaagatta agtgagacct tcgtttgtgc ggatccccca cacaccatag 2100
cttcaaaatg tttctactcc ttttttactc ttccagattt tctcggactc cgcgcatcgc 2160
cgtaccactt caaaacaccc aagcacagca tactaaattt tccctctttc ttcctctagg 2220
gtgtcgttaa ttacccgtac taaaggtttg gaaaagaaaa aagagaccgc ctcgtttctt 2280
tttcttcgtc gaaaaaggca ataaaaattt ttatcacgtt tctttttctt gaaatttttt 2340
tttttagttt ttttctcttt cagtgacctc cattgatatt taagttaata aacggtcttc 2400
aatttctcaa gtttcagttt catttttctt gttctattac aacttttttt acttcttgtt 2460
cattagaaag aaagcatagc aatctaatct aaggggcggt gttgacaatt aatcatcggc 2520
atagtatatc ggcatagtat aatacgacaa ggtgaggaac taaaccatgg ccaagttgac 2580
cagtgccgtt ccggtgctca ccgcgcgcga cgtcgccgga gcggtcgagt tctggaccga 2640
ccggctcggg ttctcccggg acttcgtgga ggacgacttc gccggtgtgg tccgggacga 2700
cgtgaccctg ttcatcagcg cggtccagga ccaggtggtg ccggacaaca ccctggcctg 2760
ggtgtgggtg cgcggcctgg acgagctgta cgccgagtgg tcggaggtcg tgtccacgaa 2820
cttccgggac gcctccgggc cggccatgac cgagatcggc gagcagccgt gggggcggga 2880
gttcgccctg cgcgacccgg ccggcaactg cgtgcacttc gtggccgagg agcaggactg 2940
acacgtccga cggcggccca cgggtcccag gcctcggaga tccgtccccc ttttcctttg 3000
tcgatatcat gtaattagtt atgtcacgct tacattcacg ccctcccccc acatccgctc 3060
taaccgaaaa ggaaggagtt agacaacctg aagtctaggt ccctatttat ttttttatag 3120
ttatgttagt attaagaacg ttatttatat ttcaaatttt tctttttttt ctgtacagac 3180
gcgtgtacgc atgtaacatt atactgaaaa ccttgcttga gaaggttttg ggacgctcga 3240
aggctttaat ttgcaagctg gagaccaaca tgtgagcaaa aggccagcaa aaggccagga 3300
accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 3360
acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 3420
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 3480
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt 3540
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 3600
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 3660
acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 3720
gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg 3780
gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 3840
gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 3900
gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 3960
acgaaaactc acgttaaggg attttggtca tgagatc 3997
<210> 59
<211> 4004
<212> DNA
<213> Artificial sequence
<220>
<223> vector pPICZalphaE' E1sH6
<400> 59
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc 1200
tgaagcctat gaggtgcgca acgtgtccgg gatgtaccat gtcacgaacg actgctccaa 1260
ctcaagcatt gtgtatgagg cagcggacat gatcatgcac acccccgggt gcgtgccctg 1320
cgttcgggag aacaactctt cccgctgctg ggtagcgctc acccccacgc tcgcagctag 1380
gaacgccagc gtccccacta cgacaatacg acgccacgtc gatttgctcg ttggggcggc 1440
tgctttctgt tccgctatgt acgtggggga tctctgcgga tctgtcttcc tcgtctccca 1500
gctgttcacc atctcgcctc gccggcatga gacggtgcag gactgcaatt gctcaatcta 1560
tcccggccac ataacgggtc accgtatggc ttgggatatg atgatgaact ggcaccacca 1620
ccatcaccat taaagatcta agcttgaatc ccgcggccat ggcatatgcg gccgccagct 1680
ttctagaaca aaaactcatc tcagaagagg atctgaatag cgccgtcgac catcatcatc 1740
atcatcattg agtttgtagc cttagacatg actgttcctc agttcaagtt gggcacttac 1800
gagaagaccg gtcttgctag attctaatca agaggatgtc agaatgccat ttgcctgaga 1860
gatgcaggct tcatttttga tactttttta tttgtaacct atatagtata ggattttttt 1920
tgtcattttg tttcttctcg tacgagcttg ctcctgatca gcctatctcg cagctgatga 1980
atatcttgtg gtaggggttt gggaaaatca ttcgagtttg atgtttttct tggtatttcc 2040
cactcctctt cagagtacag aagattaagt gagaccttcg tttgtgcgga tcccccacac 2100
accatagctt caaaatgttt ctactccttt tttactcttc cagattttct cggactccgc 2160
gcatcgccgt accacttcaa aacacccaag cacagcatac taaattttcc ctctttcttc 2220
ctctagggtg tcgttaatta cccgtactaa aggtttggaa aagaaaaaag agaccgcctc 2280
gtttcttttt cttcgtcgaa aaaggcaata aaaattttta tcacgtttct ttttcttgaa 2340
attttttttt ttagtttttt tctctttcag tgacctccat tgatatttaa gttaataaac 2400
ggtcttcaat ttctcaagtt tcagtttcat ttttcttgtt ctattacaac tttttttact 2460
tcttgttcat tagaaagaaa gcatagcaat ctaatctaag gggcggtgtt gacaattaat 2520
catcggcata gtatatcggc atagtataat acgacaaggt gaggaactaa accatggcca 2580
agttgaccag tgccgttccg gtgctcaccg cgcgcgacgt cgccggagcg gtcgagttct 2640
ggaccgaccg gctcgggttc tcccgggact tcgtggagga cgacttcgcc ggtgtggtcc 2700
gggacgacgt gaccctgttc atcagcgcgg tccaggacca ggtggtgccg gacaacaccc 2760
tggcctgggt gtgggtgcgc ggcctggacg agctgtacgc cgagtggtcg gaggtcgtgt 2820
ccacgaactt ccgggacgcc tccgggccgg ccatgaccga gatcggcgag cagccgtggg 2880
ggcgggagtt cgccctgcgc gacccggccg gcaactgcgt gcacttcgtg gccgaggagc 2940
aggactgaca cgtccgacgg cggcccacgg gtcccaggcc tcggagatcc gtcccccttt 3000
tcctttgtcg atatcatgta attagttatg tcacgcttac attcacgccc tccccccaca 3060
tccgctctaa ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt 3120
tttatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg 3180
tacagacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga 3240
cgctcgaagg ctttaatttg caagctggag accaacatgt gagcaaaagg ccagcaaaag 3300
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 3360
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 3420
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 3480
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 3540
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 3600
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 3660
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 3720
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 3780
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 3840
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 3900
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3960
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gatc 4004
<210> 60
<211> 4492
<212> DNA
<213> Artificial sequence
<220>
<223> vector pPICZalphaD' E2sH6
<400> 60
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaaggcatac 1200
ccgcgtgtca ggaggggcag cagcctccga taccaggggc cttgtgtccc tctttagccc 1260
cgggtcggct cagaaaatcc agctcgtaaa caccaacggc agttggcaca tcaacaggac 1320
tgccctgaac tgcaacgact ccctccaaac agggttcttt gccgcactat tctacaaaca 1380
caaattcaac tcgtctggat gcccagagcg cttggccagc tgtcgctcca tcgacaagtt 1440
cgctcagggg tggggtcccc tcacttacac tgagcctaac agctcggacc agaggcccta 1500
ctgctggcac tacgcgcctc gaccgtgtgg tattgtaccc gcgtctcagg tgtgcggtcc 1560
agtgtattgc ttcaccccga gccctgttgt ggtggggacg accgatcggt ttggtgtccc 1620
cacgtataac tggggggcga acgactcgga tgtgctgatt ctcaacaaca cgcggccgcc 1680
gcgaggcaac tggttcggct gtacatggat gaatggcact gggttcacca agacgtgtgg 1740
gggccccccg tgcaacatcg ggggggccgg caacaacacc ttgacctgcc ccactgactg 1800
ttttcggaag caccccgagg ccacctacgc cagatgcggt tctgggccct ggctgacacc 1860
taggtgtatg gttcattacc catataggct ctggcactac ccctgcactg tcaacttcac 1920
catcttcaag gttaggatgt acgtgggggg cgtggagcac aggttcgaag ccgcatgcaa 1980
ttggactcga ggagagcgtt gtgacttgga ggacagggat agatcagagc ttagcccgct 2040
gctgctgtct acaacagagt ggcaggtgat cgagggcaga caccatcacc accatcacta 2100
atagttaatt aactgcaggc atgcaagctt atcgataccg tcgacgaatt cgcatgcggc 2160
cgccagcttt ctagaacaaa aactcatctc agaagaggat ctgaatagcg ccgtcgacca 2220
tcatcatcat catcattgag tttgtagcct tagacatgac tgttcctcag ttcaagttgg 2280
gcacttacga gaagaccggt cttgctagat tctaatcaag aggatgtcag aatgccattt 2340
gcctgagaga tgcaggcttc atttttgata cttttttatt tgtaacctat atagtatagg 2400
attttttttg tcattttgtt tcttctcgta cgagcttgct cctgatcagc ctatctcgca 2460
gctgatgaat atcttgtggt aggggtttgg gaaaatcatt cgagtttgat gtttttcttg 2520
gtatttccca ctcctcttca gagtacagaa gattaagtga gaccttcgtt tgtgcggatc 2580
ccccacacac catagcttca aaatgtttct actccttttt tactcttcca gattttctcg 2640
gactccgcgc atcgccgtac cacttcaaaa cacccaagca cagcatacta aattttccct 2700
ctttcttcct ctagggtgtc gttaattacc cgtactaaag gtttggaaaa gaaaaaagag 2760
accgcctcgt ttctttttct tcgtcgaaaa aggcaataaa aatttttatc acgtttcttt 2820
ttcttgaaat tttttttttt agtttttttc tctttcagtg acctccattg atatttaagt 2880
taataaacgg tcttcaattt ctcaagtttc agtttcattt ttcttgttct attacaactt 2940
tttttacttc ttgttcatta gaaagaaagc atagcaatct aatctaaggg gcggtgttga 3000
caattaatca tcggcatagt atatcggcat agtataatac gacaaggtga ggaactaaac 3060
catggccaag ttgaccagtg ccgttccggt gctcaccgcg cgcgacgtcg ccggagcggt 3120
cgagttctgg accgaccggc tcgggttctc ccgggacttc gtggaggacg acttcgccgg 3180
tgtggtccgg gacgacgtga ccctgttcat cagcgcggtc caggaccagg tggtgccgga 3240
caacaccctg gcctgggtgt gggtgcgcgg cctggacgag ctgtacgccg agtggtcgga 3300
ggtcgtgtcc acgaacttcc gggacgcctc cgggccggcc atgaccgaga tcggcgagca 3360
gccgtggggg cgggagttcg ccctgcgcga cccggccggc aactgcgtgc acttcgtggc 3420
cgaggagcag gactgacacg tccgacggcg gcccacgggt cccaggcctc ggagatccgt 3480
cccccttttc ctttgtcgat atcatgtaat tagttatgtc acgcttacat tcacgccctc 3540
cccccacatc cgctctaacc gaaaaggaag gagttagaca acctgaagtc taggtcccta 3600
tttatttttt tatagttatg ttagtattaa gaacgttatt tatatttcaa atttttcttt 3660
tttttctgta cagacgcgtg tacgcatgta acattatact gaaaaccttg cttgagaagg 3720
ttttgggacg ctcgaaggct ttaatttgca agctggagac caacatgtga gcaaaaggcc 3780
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 3840
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 3900
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 3960
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 4020
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 4080
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 4140
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 4200
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 4260
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 4320
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 4380
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 4440
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga tc 4492
<210> 61
<211> 4431
<212> DNA
<213> Artificial sequence
<220>
<223> vector pPICZalphaE' E2sH6
<400> 61
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaaacg atgagatttc cttcaatttt 960
tactgctgtt ttattcgcag catcctccgc attagctgct ccagtcaaca ctacaacaga 1020
agatgaaacg gcacaaattc cggctgaagc tgtcatcggt tactcagatt tagaagggga 1080
tttcgatgtt gctgttttgc cattttccaa cagcacaaat aacgggttat tgtttataaa 1140
tactactatt gccagcattg ctgctaaaga agaaggggta tctctcgaga aaagagaggc 1200
tgaagcccat acccgcgtgt caggaggggc agcagcctcc gataccaggg gccttgtgtc 1260
cctctttagc cccgggtcgg ctcagaaaat ccagctcgta aacaccaacg gcagttggca 1320
catcaacagg actgccctga actgcaacga ctccctccaa acagggttct ttgccgcact 1380
attctacaaa cacaaattca actcgtctgg atgcccagag cgcttggcca gctgtcgctc 1440
catcgacaag ttcgctcagg ggtggggtcc cctcacttac actgagccta acagctcgga 1500
ccagaggccc tactgctggc actacgcgcc tcgaccgtgt ggtattgtac ccgcgtctca 1560
ggtgtgcggt ccagtgtatt gcttcacccc gagccctgtt gtggtgggga cgaccgatcg 1620
gtttggtgtc cccacgtata actggggggc gaacgactcg gatgtgctga ttctcaacaa 1680
cacgcggccg ccgcgaggca actggttcgg ctgtacatgg atgaatggca ctgggttcac 1740
caagacgtgt gggggccccc cgtgcaacat cgggggggcc ggcaacaaca ccttgacctg 1800
ccccactgac tgttttcgga agcaccccga ggccacctac gccagatgcg gttctgggcc 1860
ctggctgaca cctaggtgta tggttcatta cccatatagg ctctggcact acccctgcac 1920
tgtcaacttc accatcttca aggttaggat gtacgtgggg ggcgtggagc acaggttcga 1980
agccgcatgc aattggactc gaggagagcg ttgtgacttg gaggacaggg atagatcaga 2040
gcttagcccg ctgctgctgt ctacaacaga gtggcaggtg atcgagggca gacaccatca 2100
ccaccatcac taatagttaa ttaactgcag gcatgcaagc ttatcgatac cgtcgaccat 2160
catcatcatc atcattgagt ttgtagcctt agacatgact gttcctcagt tcaagttggg 2220
cacttacgag aagaccggtc ttgctagatt ctaatcaaga ggatgtcaga atgccatttg 2280
cctgagagat gcaggcttca tttttgatac ttttttattt gtaacctata tagtatagga 2340
ttttttttgt cattttgttt cttctcgtac gagcttgctc ctgatcagcc tatctcgcag 2400
ctgatgaata tcttgtggta ggggtttggg aaaatcattc gagtttgatg tttttcttgg 2460
tatttcccac tcctcttcag agtacagaag attaagtgag accttcgttt gtgcggatcc 2520
cccacacacc atagcttcaa aatgtttcta ctcctttttt actcttccag attttctcgg 2580
actccgcgca tcgccgtacc acttcaaaac acccaagcac agcatactaa attttccctc 2640
tttcttcctc tagggtgtcg ttaattaccc gtactaaagg tttggaaaag aaaaaagaga 2700
ccgcctcgtt tctttttctt cgtcgaaaaa ggcaataaaa atttttatca cgtttctttt 2760
tcttgaaatt ttttttttta gtttttttct ctttcagtga cctccattga tatttaagtt 2820
aataaacggt cttcaatttc tcaagtttca gtttcatttt tcttgttcta ttacaacttt 2880
ttttacttct tgttcattag aaagaaagca tagcaatcta atctaagggg cggtgttgac 2940
aattaatcat cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc 3000
atggccaagt tgaccagtgc cgttccggtg ctcaccgcgc gcgacgtcgc cggagcggtc 3060
gagttctgga ccgaccggct cgggttctcc cgggacttcg tggaggacga cttcgccggt 3120
gtggtccggg acgacgtgac cctgttcatc agcgcggtcc aggaccaggt ggtgccggac 3180
aacaccctgg cctgggtgtg ggtgcgcggc ctggacgagc tgtacgccga gtggtcggag 3240
gtcgtgtcca cgaacttccg ggacgcctcc gggccggcca tgaccgagat cggcgagcag 3300
ccgtgggggc gggagttcgc cctgcgcgac ccggccggca actgcgtgca cttcgtggcc 3360
gaggagcagg actgacacgt ccgacggcgg cccacgggtc ccaggcctcg gagatccgtc 3420
ccccttttcc tttgtcgata tcatgtaatt agttatgtca cgcttacatt cacgccctcc 3480
ccccacatcc gctctaaccg aaaaggaagg agttagacaa cctgaagtct aggtccctat 3540
ttattttttt atagttatgt tagtattaag aacgttattt atatttcaaa tttttctttt 3600
ttttctgtac agacgcgtgt acgcatgtaa cattatactg aaaaccttgc ttgagaaggt 3660
tttgggacgc tcgaaggctt taatttgcaa gctggagacc aacatgtgag caaaaggcca 3720
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 3780
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 3840
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 3900
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg 3960
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 4020
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 4080
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 4140
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 4200
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 4260
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 4320
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 4380
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat c 4431
<210> 62
<211> 2880
<212> DNA
<213> Artificial sequence
<220>
<223> vector pUC18MFa
<400> 62
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagcttac 240
cccttcttct ttagcagcaa tgctggcaat agtagtattt ataaacaata acccgttatt 300
tgtgctgttg gaaaatggca aaacagcaac atcgaaatcc ccttctaaat ctgagtaacc 360
gatgacagct tcagccggaa tttgtgccgt ttcatcttct gttgtagtgt tgactggagc 420
agctaatgcg gaggatgctg cgaataaaac tgcagtaaaa attgaaggaa atctcatgaa 480
ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa 540
tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga 600
tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg cgcctgatgc ggtattttct 660
ccttacgcat ctgtgcggta tttcacaccg catatggtgc actctcagta caatctgctc 720
tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg cgccctgacg 780
ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat 840
gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc tcgtgatacg 900
cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag gtggcacttt 960
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta 1020
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat 1080
gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt 1140
ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg 1200
agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga 1260
agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg 1320
tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt 1380
tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg 1440
cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg 1500
aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga 1560
tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc 1620
tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc 1680
ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc 1740
ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg 1800
cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac 1860
gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc 1920
actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt 1980
aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac 2040
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa 2100
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc 2160
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt 2220
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg 2280
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc 2340
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt 2400
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga 2460
gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct 2520
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg 2580
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca 2640
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa 2700
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt 2760
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 2820
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 2880
<210> 63
<211> 6
<212> PRT
<213> Artificial sequence
<220>
<223> adaptor peptide
<400> 63
His His His His His His
1 5
<210> 64
<211> 6
<212> PRT
<213> Artificial sequence
<220>
<223> adaptor peptide
<400> 64
Glu Glu Gly Glu Pro Lys
1 5
<210> 65
<211> 6
<212> PRT
<213> Artificial sequence
<220>
<223> adaptor peptide
<400> 65
Glu Glu Ala Glu Pro Lys
1 5
<210> 66
<211> 5
<212> PRT
<213> Artificial sequence
<220>
<223> processing site
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> X is any amino acid
<400> 66
Ile Glu Gly Arg Xaa
1 5
<210> 67
<211> 5
<212> PRT
<213> Artificial sequence
<220>
<223> processing site
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> X is any amino acid
<400> 67
Ile Asp Gly Arg Xaa
1 5
<210> 68
<211> 5
<212> PRT
<213> Artificial sequence
<220>
<223> processing site
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> X is any amino acid
<400> 68
Ala Glu Gly Arg Xaa
1 5
<210> 69
<211> 5
<212> PRT
<213> Artificial sequence
<220>
<223> adaptor peptide
<400> 69
Val Ile Glu Gly Arg
1 5
<210> 70
<211> 4
<212> PRT
<213> Artificial sequence
<220>
<223> adaptor peptide
<400> 70
Ile Glu Gly Arg
1
<210> 71
<211> 4
<212> PRT
<213> Artificial sequence
<220>
<223> adaptor peptide
<400> 71
Ile Asp Gly Arg
1
<210> 72
<211> 4
<212> PRT
<213> Artificial sequence
<220>
<223> adaptor peptide
<400> 72
Ala Glu Gly Arg
1
<210> 73
<211> 4
<212> PRT
<213> Artificial sequence
<220>
<223> HCV E1
<400> 73
Asn Asn Ser Ser
1
<210> 74
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> FLAG epitope
<400> 74
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 75
<211> 12
<212> PRT
<213> Artificial sequence
<220>
<223> Protein C epitope
<400> 75
Glu Asp Gln Val Asp Pro Arg Leu Ile Asp Gly Lys
1 5 10
<210> 76
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> VSV epitope
<400> 76
Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys
1 5 10
<210> 77
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> streptag
<400> 77
Ala Trp Arg His Pro Gln Phe Gly Gly
1 5
<210> 78
<211> 12
<212> PRT
<213> Artificial sequence
<220>
<223> Tag100 epitope
<400> 78
Glu Glu Thr Ala Arg Phe Gln Pro Gly Tyr Arg Ser
1 5 10
<210> 79
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> c-myc epitope
<400> 79
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1 5 10
<210> 80
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> HA epitope
<400> 80
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu
1 5 10
<210> 81
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> HA epitope
<400> 81
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 82
<211> 12
<212> PRT
<213> Artificial sequence
<220>
<223> HA epitope
<400> 82
Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu
1 5 10
<210> 83
<211> 6
<212> PRT
<213> Artificial sequence
<220>
<223> thrombin cleavage site
<400> 83
Leu Val Pro Arg Gly Ser
1 5
<210> 84
<211> 4
<212> PRT
<213> Artificial sequence
<220>
<223> collagenase recognition site
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa is any amino acid but most frequently a neutral amino acid
<400> 84
Pro Xaa Gly Pro
1
<210> 85
<211> 192
<212> PRT
<213> hepatitis C virus
<400> 85
Tyr Gln Val Arg Asn Ser Ser Gly Leu Tyr His Val Thr Asn Asp Cys
1 5 10 15
Pro Asn Ser Ser Val Val Tyr Glu Ala Ala Asp Ala Ile Leu His Thr
20 25 30
Pro Gly Cys Val Pro Cys Val Arg Glu Gly Asn Ala Ser Arg Cys Trp
35 40 45
Val Ala Val Thr Pro Thr Val Ala Thr Arg Asp Gly Lys Leu Pro Thr
50 55 60
Thr Gln Leu Arg Arg His Ile Asp Leu Leu Val Gly Ser Ala Thr Leu
65 70 75 80
Cys Ser Ala Leu Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val
85 90 95
Gly Gln Leu Phe Thr Phe Ser Pro Arg His His Trp Thr Thr Gln Asp
100 105 110
Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala
115 120 125
Trp Asp Met Met Met Asn Trp Ser Pro Thr Ala Ala Leu Val Val Ala
130 135 140
Gln Leu Leu Arg Ile Pro Gln Ala Ile Met Asp Met Ile Ala Gly Ala
145 150 155 160
His Trp Gly Val Leu Ala Gly Ile Ala Tyr Phe Ser Met Val Gly Asn
165 170 175
Trp Ala Glu Val Leu Val Val Leu Leu Leu Phe Ala Gly Val Asp Ala
180 185 190
<210> 86
<211> 209
<212> PRT
<213> hepatitis C virus
<400> 86
Met Leu Gly Lys Leu Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1 5 10 15
Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala Ala Arg
20 25 30
Ala Leu Ala His Gly Ala Arg Val Leu Glu Asp Gly Val Ile Tyr Ala
35 40 45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
50 55 60
Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Tyr Gln Val Arg Asn Ser
65 70 75 80
Ser Gly Leu Tyr His Val Thr Asn Asp Cys Pro Asn Ser Ser Val Val
85 90 95
Tyr Glu Ala Ala Asp Ala Ile Leu His Thr Pro Gly Cys Val Pro Cys
100 105 110
Val Arg Glu Gly Asn Ala Ser Arg Cys Trp Val Ala Val Thr Pro Thr
115 120 125
Val Ala Thr Arg Asp Gly Lys Leu Pro Thr Thr Gln Leu Arg Arg His
130 135 140
Ile Asp Leu Leu Val Gly Ser Ala Thr Leu Cys Ser Ala Leu Tyr Val
145 150 155 160
Gly Asp Leu Cys Gly Ser Val Phe Leu Val Gly Gln Leu Phe Thr Phe
165 170 175
Ser Pro Arg His His Trp Thr Thr Gln Asp Cys Asn Cys Ser Ile Tyr
180 185 190
Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
195 200 205
Trp
<210> 87
<211> 192
<212> PRT
<213> hepatitis C virus
<400> 87
Tyr Glu Val Arg Asn Val Ser Gly Met Tyr His Val Thr Asn Asp Cys
1 5 10 15
Ser Asn Ser Ser Ile Val Tyr Glu Ala Ala Asp Met Ile Met His Thr
20 25 30
Pro Gly Cys Val Pro Cys Val Arg Glu Asn Asn Ser Ser Arg Cys Trp
35 40 45
Val Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr
50 55 60
Thr Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Phe
65 70 75 80
Cys Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val
85 90 95
Ser Gln Leu Phe Thr Ile Ser Pro Arg Arg His Glu Thr Val Gln Asp
100 105 110
Cys Asn Cys Ser Ile Tyr Pro Gly His Ile Thr Gly His Arg Met Ala
115 120 125
Trp Asp Met Met Met Asn Trp Ser Pro Thr Thr Ala Leu Val Val Ser
130 135 140
Gln Leu Leu Arg Ile Pro Gln Ala Val Val Asp Met Val Ala Gly Ala
145 150 155 160
His Trp Gly Val Leu Ala Gly Leu Ala Tyr Tyr Ser Met Val Gly Asn
165 170 175
Trp Ala Lys Val Leu Val Val Met Leu Leu Phe Ala Gly Val Asp Gly
180 185 190
<210> 88
<211> 209
<212> PRT
<213> hepatitis C virus
<400> 88
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1 5 10 15
Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu Gly Gly Ala Ala Arg
20 25 30
Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala
35 40 45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
50 55 60
Leu Ser Cys Leu Thr Ile Pro Ala Ser Ala Tyr Glu Val Arg Asn Val
65 70 75 80
Ser Gly Met Tyr His Val Thr Asn Asp Cys Ser Asn Ser Ser Ile Val
85 90 95
Tyr Glu Ala Ala Asp Met Ile Met His Thr Pro Gly Cys Val Pro Cys
100 105 110
Val Arg Glu Asn Asn Ser Ser Arg Cys Trp Val Ala Leu Thr Pro Thr
115 120 125
Leu Ala Ala Arg Asn Ala Ser Val Pro Thr Thr Thr Ile Arg Arg His
130 135 140
Val Asp Leu Leu Val Gly Ala Ala Ala Phe Cys Ser Ala Met Tyr Val
145 150 155 160
Gly Asp Leu Cys Gly Ser Val Phe Leu Val Ser Gln Leu Phe Thr Ile
165 170 175
Ser Pro Arg Arg His Glu Thr Val Gln Asp Cys Asn Cys Ser Ile Tyr
180 185 190
Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
195 200 205
Trp
<210> 89
<211> 209
<212> PRT
<213> hepatitis C virus
<400> 89
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1 5 10 15
Met Gly Tyr Ile Pro Val Val Gly Ala Pro Val Gly Gly Val Ala Arg
20 25 30
Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Ile Asn Tyr Ala
35 40 45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
50 55 60
Leu Ser Cys Ile Thr Thr Pro Val Ser Ala Val Glu Val Lys Asn Asn
65 70 75 80
Ser Asn Ser Tyr Met Ala Thr Asn Asp Cys Ser Asn Ser Ser Ile Ile
85 90 95
Trp Gln Leu Glu Gly Ala Val Leu His Thr Pro Gly Cys Val Pro Cys
100 105 110
Glu Leu Ala Asp Asn Thr Ser Arg Cys Trp Val Pro Val Thr Pro Asn
115 120 125
Met Ala Ile Arg Gln Pro Gly Glu Leu Thr Lys Gly Leu Arg Ala His
130 135 140
Val Asp Val Ile Val Met Ser Ala Thr Leu Cys Ser Ala Leu Tyr Val
145 150 155 160
Gly Asp Val Cys Gly Ala Leu Met Ile Ala Ala Gln Val Val Val Val
165 170 175
Ser Pro Gln His His His Phe Val Gln Glu Cys Asn Cys Ser Ile Tyr
180 185 190
Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
195 200 205
Trp
<210> 90
<211> 209
<212> PRT
<213> hepatitis C virus
<400> 90
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1 5 10 15
Met Gly Tyr Ile Pro Val Val Gly Ala Pro Val Gly Gly Val Ala Arg
20 25 30
Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Ile Asn Tyr Ala
35 40 45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
50 55 60
Leu Ser Cys Val Thr Ala Pro Val Ser Ala Val Glu Val Lys Asn Thr
65 70 75 80
Ser Gln Ala Tyr Met Ala Thr Asn Asp Cys Ser Asn Asn Ser Ile Val
85 90 95
Trp Gln Leu Glu Asp Ala Val Leu His Val Pro Gly Cys Val Pro Cys
100 105 110
Glu Asn Ser Ser Gly Arg Phe His Cys Trp Ile Pro Ile Ser Pro Asn
115 120 125
Ile Ala Val Ser Lys Pro Gly Ala Leu Thr Lys Gly Leu Arg Ala Arg
130 135 140
Ile Asp Ala Val Val Met Ser Ala Thr Leu Cys Ser Ala Leu Tyr Val
145 150 155 160
Gly Asp Val Cys Gly Ala Val Met Ile Ala Ala Gln Ala Phe Ile Val
165 170 175
Ala Pro Lys Arg His Tyr Phe Val Gln Glu Cys Asn Cys Ser Ile Tyr
180 185 190
Pro Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
195 200 205
Trp
<210> 91
<211> 209
<212> PRT
<213> hepatitis C virus
<400> 91
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1 5 10 15
Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Val Gly Gly Val Ala Arg
20 25 30
Ala Leu Ala His Gly Val Arg Ala Leu Glu Asp Gly Ile Asn Phe Ala
35 40 45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
50 55 60
Phe Ser Cys Leu Ile His Pro Ala Ala Ser Leu Glu Trp Arg Asn Thr
65 70 75 80
Ser Gly Leu Tyr Val Leu Thr Asn Asp Cys Ser Asn Ser Ser Ile Val
85 90 95
Tyr Glu Ala Asp Asp Val Ile Leu His Thr Pro Gly Cys Ile Pro Cys
100 105 110
Val Gln Asp Gly Asn Thr Ser Thr Cys Trp Thr Pro Val Thr Pro Thr
115 120 125
Val Ala Val Lys Tyr Val Gly Ala Thr Thr Ala Ser Ile Arg Ser His
130 135 140
Val Asp Leu Leu Val Gly Ala Ala Thr Met Cys Ser Ala Leu Tyr Val
145 150 155 160
Gly Asp Met Cys Gly Ala Val Phe Leu Val Gly Gln Ala Phe Thr Phe
165 170 175
Arg Pro Arg Arg His Gln Thr Val Gln Thr Cys Asn Cys Ser Leu Tyr
180 185 190
Pro Gly His Leu Ser Gly His Arg Met Ala Trp Asp Met Met Met Asn
195 200 205
Trp
<210> 92
<211> 209
<212> PRT
<213> hepatitis C virus
<400> 92
Met Ser Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1 5 10 15
Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Val Gly Gly Val Ala Arg
20 25 30
Ala Leu Ala His Gly Val Arg Ala Val Glu Asp Gly Ile Asn Tyr Ala
35 40 45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
50 55 60
Leu Ser Cys Leu Thr Val Pro Thr Ser Ala Val Asn Tyr Arg Asn Ala
65 70 75 80
Ser Gly Val Tyr His Ile Thr Asn Asp Cys Pro Asn Ser Ser Ile Val
85 90 95
Tyr Glu Thr Glu His His Ile Leu His Leu Pro Gly Cys Leu Pro Cys
100 105 110
Val Arg Val Gly Asn Gln Ser Arg Cys Trp Val Ala Leu Thr Pro Thr
115 120 125
Val Ala Ala Pro Tyr Ile Gly Ala Pro Leu Glu Ser Leu Arg Ser His
130 135 140
Val Asp Leu Met Val Gly Ala Ala Thr Ala Cys Ser Ala Leu Tyr Ile
145 150 155 160
Gly Asp Leu Cys Gly Gly Val Phe Leu Val Gly Gln Met Phe Ser Phe
165 170 175
Gln Pro Arg Arg His Trp Thr Thr Gln Asp Cys Asn Cys Ser Ile Tyr
180 185 190
Ala Gly His Val Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
195 200 205
Trp
<210> 93
<211> 209
<212> PRT
<213> hepatitis C virus
<400> 93
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1 5 10 15
Met Gly Tyr Ile Pro Leu Val Gly Gly Pro Ile Gly Gly Val Ala Arg
20 25 30
Ala Leu Ala His Gly Val Arg Val Leu Glu Asp Gly Val Asn Tyr Ala
35 40 45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Ile Leu Ala Leu
50 55 60
Leu Ser Cys Leu Thr Val Pro Ala Ser Ala Val Pro Tyr Arg Asn Ala
65 70 75 80
Ser Gly Ile Tyr His Val Thr Asn Asp Cys Pro Asn Ser Ser Ile Val
85 90 95
Tyr Glu Ala Asp Asn Leu Ile Leu His Ala Pro Gly Cys Val Pro Cys
100 105 110
Val Met Thr Gly Asn Val Ser Arg Cys Trp Val Gln Ile Thr Pro Thr
115 120 125
Leu Ser Ala Pro Ser Leu Gly Ala Val Thr Ala Pro Leu Arg Arg Ala
130 135 140
Val Asp Tyr Leu Ala Gly Gly Ala Ala Leu Cys Ser Ala Leu Tyr Val
145 150 155 160
Gly Asp Ala Cys Gly Ala Leu Phe Leu Val Gly Gln Met Phe Thr Tyr
165 170 175
Arg Pro Arg Gln His Ala Thr Val Gln Asn Cys Asn Cys Ser Ile Tyr
180 185 190
Ser Gly His Val Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
195 200 205
Trp
<210> 94
<211> 209
<212> PRT
<213> hepatitis C virus
<400> 94
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1 5 10 15
Met Gly Tyr Ile Pro Val Val Gly Ala Pro Leu Gly Gly Val Ala Ala
20 25 30
Ala Phe Ala His Gly Val Arg Ala Leu Glu Asp Gly Ile Asn Tyr Ala
35 40 45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
50 55 60
Leu Ser Cys Leu Thr Thr Pro Ala Ser Ala Leu Thr Tyr Gly Asn Ser
65 70 75 80
Ser Gly Leu Tyr His Leu Thr Asn Asp Cys Pro Asn Ser Ser Ile Val
85 90 95
Leu Glu Ala Asp Ala Met Ile Leu His Leu Pro Gly Cys Leu Pro Cys
100 105 110
Val Arg Val Asn Asn Gln Ser Thr Cys Trp His Ala Val Ser Pro Thr
115 120 125
Leu Ala Ile Pro Asn Ala Ser Thr Pro Ala Thr Gly Phe Arg Arg His
130 135 140
Val Asp Leu Leu Ala Gly Ala Ala Val Val Cys Ser Ser Leu Tyr Ile
145 150 155 160
Gly Asp Leu Cys Gly Ser Leu Phe Leu Ala Gly Gln Leu Phe Thr Phe
165 170 175
Gln Pro Arg Arg His Trp Thr Val Gln Asp Cys Asn Cys Ser Ile Tyr
180 185 190
Thr Gly His Val Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
195 200 205
Trp
<210> 95
<211> 209
<212> PRT
<213> hepatitis C virus
<400> 95
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Phe Ala Asp Leu
1 5 10 15
Met Gly Tyr Ile Pro Val Val Gly Ala Pro Leu Gly Gly Ile Ala Ala
20 25 30
Ala Leu Ala His Gly Val Arg Ala Val Glu Asp Gly Ile Asn Tyr Ala
35 40 45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu
50 55 60
Leu Ser Cys Leu Thr Thr Pro Ala Ser Ala Val His Tyr Ala Asn Lys
65 70 75 80
Ser Gly Leu Tyr His Leu Thr Asn Asp Cys Pro Asn Ser Ser Ile Val
85 90 95
Tyr Glu Ala Pro Ala Val Ile Met His Leu Pro Gly Cys Val Pro Cys
100 105 110
Val Lys Val Gly Asn Gln Ser Thr Cys Trp Leu Pro Ala Ser Pro Thr
115 120 125
Leu Ala Val Pro Asn Ala Ser Thr Pro Leu Thr Arg Phe Arg Lys His
130 135 140
Val Asp Leu Met Val Gly Ala Ala Ala Phe Cys Ser Ala Met Tyr Val
145 150 155 160
Gly Asp Ile Cys Gly Gly Leu Phe Leu Leu Gly Gln Val Val Thr Ile
165 170 175
Arg Pro Arg Leu His Gln Thr Val Gln Glu Cys Asn Cys Ser Ile Tyr
180 185 190
Thr Gly Lys Ile Thr Gly His Arg Met Ala Trp Asp Ile Met Met Asn
195 200 205
Trp
<210> 96
<211> 209
<212> PRT
<213> hepatitis C virus
<400> 96
Met Leu Gly Lys Val Ile Asp Thr Leu Thr Cys Gly Leu Ala Asp Leu
1 5 10 15
Met Gly Tyr Ile Pro Val Leu Gly Gly Pro Leu Gly Gly Val Ala Ala
20 25 30
Ala Leu Ala His Gly Val Arg Ala Ile Glu Asp Gly Val Asn Tyr Ala
35 40 45
Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Ile Leu Leu Leu Ala Leu
50 55 60
Leu Ser Cys Leu Thr Ile Pro Ala Ser Ala Ile Gln Val Lys Asn Ala
65 70 75 80
Ser Gly Ile Tyr His Leu Thr Asn Asp Cys Ser Asn Asn Ser Ile Val
85 90 95
Phe Glu Ala Glu Thr Met Ile Leu His Leu Pro Gly Cys Val Pro Cys
100 105 110
Ile Lys Ala Gly Asn Glu Ser Arg Cys Trp Leu Pro Val Ser Pro Thr
115 120 125
Leu Ala Val Pro Asn Ser Ser Val Pro Ile His Gly Phe Arg Arg His
130 135 140
Val Asp Leu Leu Val Gly Ala Ala Ala Phe Cys Ser Ala Met Tyr Ile
145 150 155 160
Gly Asp Leu Cys Gly Ser Ile Phe Leu Val Gly Gln Leu Phe Thr Phe
165 170 175
Arg Pro Lys Tyr His Gln Val Thr Gln Asp Cys Asn Cys Ser Ile Tyr
180 185 190
Ala Gly His Ile Thr Gly His Arg Met Ala Trp Asp Met Met Met Asn
195 200 205
Trp
<210> 97
<211> 363
<212> PRT
<213> hepatitis C virus
<400> 97
Glu Thr His Val Thr Gly Gly Asn Ala Gly Arg Thr Thr Ala Gly Pro
1 5 10 15
Val Gly Leu Leu Thr Pro Gly Ala Lys Gln Asn Ile Gln Leu Ile Asn
20 25 30
Thr Asn Gly Ser Trp His Ile Asn Ser Thr Ala Leu Asn Cys Asn Glu
35 40 45
Ser Leu Asn Thr Gly Trp Leu Ala Gly Leu Phe Tyr Gln His Lys Phe
50 55 60
Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Arg Leu Thr
65 70 75 80
Asp Phe Ala Gln Gly Trp Gly Pro Ile Ser Tyr Ala Asn Gly Ser Gly
85 90 95
Leu Asp Glu Arg Pro Tyr Cys Trp His Tyr Pro Pro Arg Pro Cys Gly
100 105 110
Ile Val Pro Ala Lys Ser Val Cys Gly Pro Val Tyr Cys Phe Thr Pro
115 120 125
Ser Pro Val Val Val Gly Thr Thr Asp Arg Ser Gly Ala Pro Thr Tyr
130 135 140
Ser Trp Gly Ala Asn Asp Thr Asp Val Phe Val Leu Asn Asn Thr Arg
145 150 155 160
Pro Pro Leu Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Ser Thr Gly
165 170 175
Phe Thr Lys Val Cys Gly Ala Pro Pro Cys Val Ile Gly Gly Val Gly
180 185 190
Asn Asn Thr Leu Leu Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu
195 200 205
Ala Thr Tyr Ser Arg Cys Gly Ser Gly Pro Trp Ile Thr Pro Arg Cys
210 215 220
Met Val Asp Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Ile Asn
225 230 235 240
Tyr Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg
245 250 255
Leu Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu
260 265 270
Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Gln
275 280 285
Trp Gln Val Leu Pro Cys Ser Phe Thr Thr Leu Pro Ala Leu Ser Thr
290 295 300
Gly Leu Ile His Leu His Gln Asn Ile Val Asp Val Gln Tyr Leu Tyr
305 310 315 320
Gly Val Gly Ser Ser Ile Ala Ser Trp Ala Ile Lys Trp Glu Tyr Val
325 330 335
Val Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ser Glu Phe
340 345 350
Trp Met Met Leu Leu Ile Ser Gln Ala Glu Ala
355 360
<210> 98
<211> 363
<212> PRT
<213> hepatitis C virus
<400> 98
His Thr Arg Val Ser Gly Gly Ala Ala Ala Ser Asp Thr Arg Gly Leu
1 5 10 15
Val Ser Leu Phe Ser Pro Gly Ser Ala Gln Lys Ile Gln Leu Val Asn
20 25 30
Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp
35 40 45
Ser Leu Gln Thr Gly Phe Phe Ala Ala Leu Phe Tyr Lys His Lys Phe
50 55 60
Asn Ser Ser Gly Cys Pro Glu Arg Leu Ala Ser Cys Arg Ser Ile Asp
65 70 75 80
Lys Phe Ala Gln Gly Trp Gly Pro Leu Thr Tyr Thr Glu Pro Asn Ser
85 90 95
Ser Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala Pro Arg Pro Cys Gly
100 105 110
Ile Val Pro Ala Ser Gln Val Cys Gly Pro Val Tyr Cys Phe Thr Pro
115 120 125
Ser Pro Val Val Val Gly Thr Thr Asp Arg Phe Gly Val Pro Thr Tyr
130 135 140
Asn Trp Gly Ala Asn Asp Ser Asp Val Leu Ile Leu Asn Asn Thr Arg
145 150 155 160
Pro Pro Arg Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Gly Thr Gly
165 170 175
Phe Thr Lys Thr Cys Gly Gly Pro Pro Cys Asn Ile Gly Gly Ala Gly
180 185 190
Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu
195 200 205
Ala Thr Tyr Ala Arg Cys Gly Ser Gly Pro Trp Leu Thr Pro Arg Cys
210 215 220
Met Val His Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn
225 230 235 240
Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg
245 250 255
Phe Glu Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu
260 265 270
Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu
275 280 285
Trp Gln Ile Leu Pro Cys Ser Phe Thr Thr Leu Pro Ala Leu Ser Thr
290 295 300
Gly Leu Ile His Leu His Gln Asn Ile Val Asp Val Gln Tyr Leu Tyr
305 310 315 320
Gly Val Gly Ser Ala Val Val Ser Leu Val Ile Lys Trp Glu Tyr Val
325 330 335
Leu Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Ile Cys Ala Cys Leu
340 345 350
Trp Met Met Leu Leu Ile Ala Gln Ala Glu Ala
355 360
Claims (33)
- 한 개 이상의 N-글리코실화 부위를 포함하는 분리된 HCV(C형 간염바이러스) E1 또는 E2 단백질에 있어서:상기 단백질이 메틸로트로픽(methylotrophic) 효모 세포에서의 발현산물이고 또 (포유동물세포에서 발현된) N-글리코실화 부위의 50~80% 까지가 코어-글리코실화되어 있으며;상기 효모 세포가 한세눌라(Hansenulla) 세포인 것을 특징으로 하는 분리된 HCV(C형 간염바이러스) E1 또는 E2 단백질.
- 제 1항에 있어서, 상기 코어-글리코실화 부위의 70% 이상이 8 내지 10개 만노오스를 함유하는 올리고만노오스에 의해 글리코실화되는 분리된 HCV E1 또는 E2 단백질.
- 제2항에 있어서, Man(8)GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위에 대한 Man(7)GlcNAc(2) 구조를 갖는 올리고만노오스에 의해 코어-글리코실화된 부위의 비율이 0.45 이하인 분리된 HCV E1 또는 E2 단백질.
- 제3항에 있어서, 상기 올리고만노오스는 10% 미만의 말단 α1,3 만노오스를 함유하는 분리된 HCV E1 또는 E2 단백질.
- 삭제
- 삭제
- 제4항에 있어서, HCV E1 또는 E2 단백질에 결합된 조류의 리소짐(lysozyme) 리더 펩티드 또는 그의 기능적 변이체를 포함하는 단백질로부터 유도되는 분리된 HCV E1 또는 E2 단백질.
- 제 7항에 있어서, 하기 구조식을 갖는 것을 특징으로 하는 단백질로부터 유도되는 분리된 HCV E1 또는 E2 단백질.CL-[(Al)a-(PS1)b-(A2)c]-HCVENV-[(A3)d-(PS2)e-(A4)f]식중에서,CL은 조류의 리소짐 리더 펩티드 또는 그의 기능적 등가물이고,A1, A2, A3 및 A4는 상이하거나 동일할 수 있는 어댑터(adptor) 펩티드이며,PS1 및 PS2는 상이하거나 동일할 수 있는 가공 부위이고,HCVENV는 HCV E1 또는 E2 단백질이며,a, b, c, d, e 및 f는 0 또는 1이고, 또경우에 따라, A1나 A2는 PS1의 일부이고, A3나 A4는 PS2의 일부임.
- 제 8항에 있어서, 상기 조류의 리소짐 리더 펩티드 CL은 서열번호: 1에 정의된 아미노산 서열을 갖는 분리된 HCV E1 또는 E2 단백질.
- 제 8항에 있어서, A는 서열번호: 63-65, 70-72 및 74-82로부터 선택된 아미노산 서열을 갖고, PS는 서열번호: 66-68 및 83-84으로부터 선택된 아미노산 서열을 갖거나, 또는 PS는 Lys-Lys, Arg-Arg, Lys-Arg 및 Arg-Lys와 같은 이염기성 부위 또는 Lys와 같은 일염기성이며, 또 HCVENV는 서열번호: 85-98로부터 선택되는 분리된 HCV E1 또는 E2 단백질.
- 제10항에 있어서, 단량체, 동종이합체, 이종이합체, 동종올리고머 및 이종올리고머로 구성된 군으로부터 선택된 구조에 포함되는 분리된 HCV E1 또는 E2 단백질.
- 제10항에 있어서, 바이러스-유사 입자에 포함되는 분리된 HCV E1 또는 E2 단백질.
- 제12항에 있어서, 시스테인 티올 기가 화학적으로 수식된 분리된 HCV E1 또는 E2 단백질.
- 제13항에 있어서, 항원성인 분리된 HCV E1 또는 E2 단백질.
- 제13항에 있어서, 면역원성인 분리된 HCV E1 또는 E2 단백질.
- 제13항에 있어서, T-세포 항원결정부위를 포함하는 분리된 HCV E1 또는 E2 단백질.
- 제16항에 따른 분리된 HCV E1 또는 E2 단백질을 포함한 C형 간염치료용 조성물.
- 제 17항에 있어서, 약제학적으로 허용되는 담체를 더 포함하는 C형 간염치료용 조성물.
- 제 17항에 있어서, 약제학적으로 허용되는 담체를 더 포함하며 또 백신인 조성물.
- 제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 분리된 HCV E1 또는 E2 단백질을 생산하는 방법.
- (i) 제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 HCV E1 또는 E2 단백질을, HCV E1 또는 E2 단백질과 항-HCV 항체의 복합체화를 허용하는 조건하에서 항-HCV 항체를 포함할 것으로 추정되는 샘플과 접촉시키는 단계,(ii) (i)에서 형성된 복합체를 검출하는 단계, 및(iii) (ii)으로부터 상기 샘플에서 항-HCV 항체의 존재를 유추하는 단계를 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플에서 항-HCV 항체의 존재를 검출하는 방법.
- 제 21항에 있어서, 상기 단계(i)에서의 접촉은 경쟁 조건하에서 생기는 방법.
- 제 21항에 있어서, 상기 HCV E1 또는 E2 단백질이 고형 지지체에 부착되는 방법.
- 제1항 내지 제16항중 어느 한 항에 따른 HCV E1 또는 E2 단백질을 포함하는, 항-HCV 항체를 포함할 것으로 추정되는 샘플에서 항-HCV 항체의 존재를 검출하기 위한 진단 키트.
- 제 24항에 있어서, 상기 HCV E1 또는 E2 단백질이 고형 지지체에 부착되어 있는 진단 키트.
- 제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 HCV E1 또는 E2 단백질을 포함하는 HCV 감염치료용 의약.
- 제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 HCV E1 또는 E2 단백질을 포함하는 백신.
- 제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 유효량의 HCV E1 또는 E2 단백질 및 경우에 따라 약제학적으로 허용되는 보조제를 포함하는, 포유동물에서 HCV-특이적 면역반응을 유발하는 약제학적 조성물.
- 제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 유효량의 HCV E1 또는 E2 단백질 및 약제학적으로 허용되는 보조제를 포함하는, 포유동물에서 HCV-특이적 항체를 유발하기 위한 약제학적 조성물.
- 제1항 내지 제4항 및 제7항 내지 제16항 중의 어느 한 항에 따른 유효량의 HCV E1 또는 E2 단백질 및 약제학적으로 허용되는 보조제를 포함하는, 포유동물에서 T-세포 작용을 유발하기 위한 약제학적 조성물.
- 제30항에 있어서, 예방적 조성물인 약제학적 조성물.
- 제30항에 있어서, 치료적 조성물인 약제학적 조성물.
- 제30항에 있어서, 상기 포유동물이 인간인 약제학적 조성물.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01870088 | 2001-04-24 | ||
EP01870088.0 | 2001-04-24 | ||
US30560401P | 2001-07-17 | 2001-07-17 | |
US60/305.604 | 2001-07-17 | ||
PCT/BE2002/000064 WO2002086101A2 (en) | 2001-04-24 | 2002-04-24 | Core-glycosylated hcv envelope proteins |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20030094359A KR20030094359A (ko) | 2003-12-11 |
KR100950104B1 true KR100950104B1 (ko) | 2010-03-30 |
Family
ID=34072546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020037013778A KR100950104B1 (ko) | 2001-04-24 | 2002-04-24 | 코어 글리코실화된 hcv 엔빌로프 단백질 |
Country Status (20)
Country | Link |
---|---|
US (3) | US7238356B2 (ko) |
EP (3) | EP1414942A2 (ko) |
JP (2) | JP4261195B2 (ko) |
KR (1) | KR100950104B1 (ko) |
CN (1) | CN1636050A (ko) |
AR (3) | AR035867A1 (ko) |
AU (3) | AU2002252856A1 (ko) |
BR (2) | BR0209034A (ko) |
CA (3) | CA2443781A1 (ko) |
CZ (1) | CZ20032853A3 (ko) |
HU (1) | HUP0303924A2 (ko) |
MX (2) | MXPA03009626A (ko) |
NZ (2) | NZ529019A (ko) |
OA (1) | OA13092A (ko) |
PL (1) | PL366621A1 (ko) |
RU (1) | RU2274643C2 (ko) |
SK (1) | SK13142003A3 (ko) |
WO (3) | WO2002086101A2 (ko) |
YU (1) | YU84103A (ko) |
ZA (3) | ZA200308272B (ko) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040185061A1 (en) * | 1994-07-29 | 2004-09-23 | Innogenetics N.V. | Redox reversible HCV proteins with native-like conformation |
US7238356B2 (en) * | 2001-04-24 | 2007-07-03 | Innogenetics N.V. | Core-glycosylated HCV envelope proteins |
DE10143490C2 (de) * | 2001-09-05 | 2003-12-11 | Gsf Forschungszentrum Umwelt | Rekombinantes MVA mit der Fähigkeit zur Expression von HCV Struktur-Antigenen |
EP1558283A2 (en) * | 2002-11-08 | 2005-08-03 | Innogenetics N.V. | Hcv vaccine compositions comprising e1 and ns3 peptides |
US7439042B2 (en) * | 2002-12-16 | 2008-10-21 | Globeimmune, Inc. | Yeast-based therapeutic for chronic hepatitis C infection |
JP4371739B2 (ja) * | 2003-09-02 | 2009-11-25 | 株式会社東芝 | シリアルataインタフェースを持つ電子機器及びシリアルataバスのパワーセーブ方法 |
EP1602664A1 (en) * | 2004-03-08 | 2005-12-07 | Innogenetics N.V. | HCV E1 comprising specific disulfide bridges |
EP1574517A1 (en) * | 2004-03-09 | 2005-09-14 | Innogenetics N.V. | HCV E1 comprising specific disulfide bridges |
JP4885476B2 (ja) * | 2004-05-21 | 2012-02-29 | 株式会社日本触媒 | タンパク質及び/又はペプチドの細胞内導入方法 |
KR20070068460A (ko) * | 2004-10-18 | 2007-06-29 | 글로브이뮨 | 만성 c형 간염에 대한 효모계 치료 |
AU2011254055B2 (en) * | 2004-10-18 | 2012-12-20 | Globeimmune, Inc. | Yeast-based therapeutic for chronic hepatitis C infection |
US20060234360A1 (en) * | 2005-04-13 | 2006-10-19 | Paola Branduardi | Ascorbic acid production from D-glucose in yeast |
US7951384B2 (en) * | 2005-08-05 | 2011-05-31 | University Of Massachusetts | Virus-like particles as vaccines for paramyxovirus |
US9216212B2 (en) | 2005-08-05 | 2015-12-22 | University Of Massachusetts | Virus-like particles as vaccines for paramyxovirus |
AR058140A1 (es) * | 2005-10-24 | 2008-01-23 | Wyeth Corp | Metodo de produccion proteica utilizando compuestos anti-senescencia |
CA2651456A1 (en) * | 2006-05-19 | 2007-11-29 | Glycofi, Inc. | Recombinant vectors |
AU2015234338C1 (en) * | 2006-07-28 | 2017-07-20 | The Trustees Of The University Of Pennsylvania | Improved vaccines and methods for using the same |
AU2007288129B2 (en) * | 2006-08-25 | 2013-03-07 | The Macfarlane Burnet Institute For Medical Research And Public Health Limited | Recombinant HCV E2 glycoprotein |
WO2010033841A1 (en) | 2008-09-19 | 2010-03-25 | Globeimmune, Inc. | Immunotherapy for chronic hepatitis c virus infection |
WO2010039224A2 (en) | 2008-09-30 | 2010-04-08 | University Of Massachusetts Medical School | Respiratory syncytial virus (rsv) sequences for protein expression and vaccines |
US20100104555A1 (en) * | 2008-10-24 | 2010-04-29 | The Scripps Research Institute | HCV neutralizing epitopes |
DE102009044224A1 (de) * | 2009-10-09 | 2011-04-28 | PomBio Tech GmbH Starterzentrum der Universität des Saarlandes Campus Geb. A1-1 | Methode zur Produktion von HCV Virus-ähnlichen Partikeln |
MY167159A (en) | 2010-12-22 | 2018-08-13 | Bayer Ip Gmbh | Enhanced immune response in bovine species |
US20140155469A1 (en) | 2011-04-19 | 2014-06-05 | The Research Foundation Of State University Of New York | Adeno-associated-virus rep sequences, vectors and viruses |
EP3590950A1 (en) | 2011-05-09 | 2020-01-08 | Ablynx NV | Method for the production of immunoglobulin single varible domains |
CA2940794C (en) * | 2014-02-28 | 2022-05-31 | Bayer Animal Health Gmbh | Immunostimulatory plasmids |
EP3374500A1 (en) * | 2015-11-13 | 2018-09-19 | Mammedov, Tarlan | Production of in vivo n-deglycosylated recombinant proteins by co-expression with endo h |
DK3184642T3 (da) * | 2015-12-22 | 2019-08-12 | Bisy E U | Gærcelle |
AU2017332854A1 (en) | 2016-09-21 | 2019-04-11 | The Governors Of The University Of Alberta | Hepatitis C virus immunogenic compositions and methods of use thereof |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1996004385A2 (en) * | 1994-07-29 | 1996-02-15 | Innogenetics N.V. | Purified hepatitis c virus envelope proteins for diagnostic and therapeutic use |
WO1999067285A1 (en) * | 1998-06-24 | 1999-12-29 | Innogenetics N.V. | Particles of hcv envelope proteins: use for vaccination |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4395395A (en) * | 1979-05-21 | 1983-07-26 | The United States Of America As Represented By The Department Of Health And Human Services | Detection of non-A, non-B hepatitis associated antigen |
EP0288198A3 (en) | 1987-04-20 | 1989-03-29 | Takeda Chemical Industries, Ltd. | Production of peptide |
US5135854A (en) * | 1987-10-29 | 1992-08-04 | Zymogenetics, Inc. | Methods of regulating protein glycosylation |
US5698390A (en) * | 1987-11-18 | 1997-12-16 | Chiron Corporation | Hepatitis C immunoassays |
US5350671A (en) * | 1987-11-18 | 1994-09-27 | Chiron Corporation | HCV immunoassays employing C domain antigens |
US5683864A (en) * | 1987-11-18 | 1997-11-04 | Chiron Corporation | Combinations of hepatitis C virus (HCV) antigens for use in immunoassays for anti-HCV antibodies |
JP2791418B2 (ja) * | 1987-12-02 | 1998-08-27 | 株式会社ミドリ十字 | 異種蛋白質の製造方法、組換えdna、形質転換体 |
NO177065C (no) * | 1988-09-26 | 1995-07-12 | Labofina Sa | Framgangsmåte for framstilling av enzymatisk aktivt humant lysozym |
US5747239A (en) * | 1990-02-16 | 1998-05-05 | United Biomedical, Inc. | Synthetic peptides specific for the detection of antibodies to HCV, diagnosis of HCV infection and preventions thereof as vaccines |
US5712087A (en) * | 1990-04-04 | 1998-01-27 | Chiron Corporation | Immunoassays for anti-HCV antibodies employing combinations of hepatitis C virus (HCV) antigens |
WO1992001800A1 (en) * | 1990-07-20 | 1992-02-06 | Chiron Corporation | Method for integrative transformation of yeast using dispersed repetitive elements |
CA2047792C (en) | 1990-07-26 | 2002-07-02 | Chang Y. Wang | Synthetic peptides specific for the detection of antibodies to hcv, diagnosis of hcv infection and prevention thereof as vaccines |
RO117329B1 (ro) | 1991-06-24 | 2002-01-30 | Chiron Corp Emeryville | Polipeptide care contin o secventa a virusului hepatitei c |
AU4659993A (en) | 1992-07-07 | 1994-01-31 | Merck & Co., Inc. | Vaccine comprising mixed pres1+pres2+s and core particle |
DK0992580T3 (da) * | 1993-11-04 | 2005-07-11 | Innogenetics Nv | Epitoper på human T-celler, som er immundominante for hepatitis C-virus |
ZA9610456B (en) * | 1995-12-20 | 1997-06-20 | Novo Nordisk As | N-terminally extended proteins expressed in yeast |
US5935824A (en) * | 1996-01-31 | 1999-08-10 | Technologene, Inc. | Protein expression system |
WO1998028429A1 (en) * | 1996-12-20 | 1998-07-02 | Novo Nordisk A/S | N-terminally extended proteins expressed in yeast |
WO1999024466A2 (en) | 1997-11-06 | 1999-05-20 | Innogenetics N.V. | Multi-mer peptides derived from hepatitis c virus envelope proteins for diagnostic use and vaccination purposes |
KR20010034305A (ko) * | 1998-01-23 | 2001-04-25 | 한센 핀 베네드 | 효모에서 원하는 폴리펩티드를 만드는 방법 |
DE69920895T3 (de) | 1998-04-17 | 2009-09-03 | N.V. Innogenetics S.A. | Verbessertes immundiagnostische tests durch verwendung von reduzierende agenzien |
NZ518095A (en) * | 1999-10-27 | 2003-09-26 | Innogenetics N | Redox reversible HCV proteins with native-like conformation |
CZ20032164A3 (cs) | 2001-01-11 | 2003-10-15 | Innogenetics N. V. | Purifikované obalové proteiny viru hepatitidy C pro diagnostické a terapeutické použití |
US7238356B2 (en) * | 2001-04-24 | 2007-07-03 | Innogenetics N.V. | Core-glycosylated HCV envelope proteins |
WO2003051912A2 (en) | 2001-12-18 | 2003-06-26 | Innogenetics N.V. | Purified hepatitis c virus envelope proteins for diagnostic and therapeutic use |
EP1558283A2 (en) * | 2002-11-08 | 2005-08-03 | Innogenetics N.V. | Hcv vaccine compositions comprising e1 and ns3 peptides |
-
2002
- 2002-04-24 US US10/128,590 patent/US7238356B2/en not_active Expired - Fee Related
- 2002-04-24 US US10/128,578 patent/US7048930B2/en not_active Expired - Fee Related
- 2002-04-24 JP JP2002583615A patent/JP4261195B2/ja not_active Expired - Fee Related
- 2002-04-24 NZ NZ529019A patent/NZ529019A/en unknown
- 2002-04-24 SK SK1314-2003A patent/SK13142003A3/sk unknown
- 2002-04-24 RU RU2003130955/13A patent/RU2274643C2/ru not_active IP Right Cessation
- 2002-04-24 WO PCT/BE2002/000064 patent/WO2002086101A2/en active IP Right Grant
- 2002-04-24 NZ NZ529324A patent/NZ529324A/en unknown
- 2002-04-24 AR ARP020101493A patent/AR035867A1/es unknown
- 2002-04-24 CN CNA028126076A patent/CN1636050A/zh active Pending
- 2002-04-24 EP EP02721875A patent/EP1414942A2/en not_active Withdrawn
- 2002-04-24 MX MXPA03009626A patent/MXPA03009626A/es not_active Application Discontinuation
- 2002-04-24 MX MXPA03009632A patent/MXPA03009632A/es not_active Application Discontinuation
- 2002-04-24 WO PCT/BE2002/000062 patent/WO2002085932A2/en active IP Right Grant
- 2002-04-24 JP JP2002583616A patent/JP4173741B2/ja not_active Expired - Fee Related
- 2002-04-24 PL PL02366621A patent/PL366621A1/xx not_active Application Discontinuation
- 2002-04-24 AR ARP020101494A patent/AR035868A1/es unknown
- 2002-04-24 EP EP02764023A patent/EP1381671A2/en not_active Withdrawn
- 2002-04-24 HU HU0303924A patent/HUP0303924A2/hu unknown
- 2002-04-24 BR BR0209034-1A patent/BR0209034A/pt not_active IP Right Cessation
- 2002-04-24 AR ARP020101495A patent/AR035869A1/es unknown
- 2002-04-24 CA CA002443781A patent/CA2443781A1/en not_active Abandoned
- 2002-04-24 AU AU2002252856A patent/AU2002252856A1/en not_active Abandoned
- 2002-04-24 BR BR0209033-3A patent/BR0209033A/pt not_active IP Right Cessation
- 2002-04-24 EP EP02727059A patent/EP1417298A2/en not_active Withdrawn
- 2002-04-24 CZ CZ20032853A patent/CZ20032853A3/cs unknown
- 2002-04-24 YU YU84103A patent/YU84103A/sh unknown
- 2002-04-24 CA CA002443740A patent/CA2443740A1/en not_active Abandoned
- 2002-04-24 US US10/128,587 patent/US7314925B2/en not_active Expired - Fee Related
- 2002-04-24 KR KR1020037013778A patent/KR100950104B1/ko not_active IP Right Cessation
- 2002-04-24 AU AU2002308449A patent/AU2002308449B2/en not_active Ceased
- 2002-04-24 CA CA002444006A patent/CA2444006A1/en not_active Abandoned
- 2002-04-24 WO PCT/BE2002/000063 patent/WO2002086100A2/en active Application Filing
- 2002-04-24 OA OA1200500194A patent/OA13092A/en unknown
- 2002-04-24 AU AU2002257392A patent/AU2002257392B2/en not_active Ceased
-
2003
- 2003-10-23 ZA ZA200308272A patent/ZA200308272B/en unknown
- 2003-10-23 ZA ZA200308274A patent/ZA200308274B/en unknown
- 2003-10-23 ZA ZA200308277A patent/ZA200308277B/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1996004385A2 (en) * | 1994-07-29 | 1996-02-15 | Innogenetics N.V. | Purified hepatitis c virus envelope proteins for diagnostic and therapeutic use |
WO1999067285A1 (en) * | 1998-06-24 | 1999-12-29 | Innogenetics N.V. | Particles of hcv envelope proteins: use for vaccination |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100950104B1 (ko) | 코어 글리코실화된 hcv 엔빌로프 단백질 | |
AU2018229561B2 (en) | Recombinant adenoviruses and use thereof | |
US6090393A (en) | Recombinant canine adenoviruses, method for making and uses thereof | |
KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
KR20220141332A (ko) | 홍역-벡터화된 covid-19 면역원성 조성물 및 백신 | |
KR102266691B1 (ko) | 항원 전달 플랫폼 | |
US6156567A (en) | Truncated transcriptionally active cytomegalovirus promoters | |
AU2021204620A1 (en) | Central nervous system targeting polynucleotides | |
KR101982360B1 (ko) | 콤팩트 tale-뉴클레아제의 발생 방법 및 이의 용도 | |
DK2718440T3 (en) | NUCLEASE ACTIVITY PROTEIN, FUSION PROTEINS AND APPLICATIONS THEREOF | |
KR101499750B1 (ko) | 가감염성 플라비바이러스 및 이들의 용도 | |
AU774643B2 (en) | Compositions and methods for use in recombinational cloning of nucleic acids | |
CA2834053C (en) | Yeast strains engineered to produce ethanol from glycerol | |
AU2016343979A1 (en) | Delivery of central nervous system targeting polynucleotides | |
US20040003420A1 (en) | Modified recombinase | |
CN107574156A (zh) | 类病毒组合物颗粒及其使用方法 | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
KR20210080375A (ko) | 암 면역요법을 위한 재조합 폭스바이러스 | |
CN107849583B (zh) | 使用细胞分裂基因座控制细胞增殖的工具和方法 | |
KR20180016722A (ko) | 재조합 glut1 아데노-관련 바이러스 벡터 작제물 및 glut1 발현을 회복하기 위한 관련된 방법 | |
CN114126645A (zh) | 冠状病毒刺突蛋白的修饰的s1亚基 | |
KR20220130093A (ko) | 오토펄린 듀얼 벡터 시스템을 사용한 감각신경성 난청을 치료하기 위한 조성물 및 방법 | |
WO2002038613A2 (en) | Modified recombinase | |
CN112203697A (zh) | 编码氨基己糖苷酶alpha和beta亚基的双顺反子AAV载体及其用途 | |
KR20230112625A (ko) | 나이세리아 고노레아에 대한 백신접종을 위한 조성물 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
B701 | Decision to grant | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |