KR20230154261A - N-연결된 글리코실화가 없거나 감소된 외인성 단백질의 생산을 위한 유전적으로 변형된 사상 진균 - Google Patents
N-연결된 글리코실화가 없거나 감소된 외인성 단백질의 생산을 위한 유전적으로 변형된 사상 진균 Download PDFInfo
- Publication number
- KR20230154261A KR20230154261A KR1020237034361A KR20237034361A KR20230154261A KR 20230154261 A KR20230154261 A KR 20230154261A KR 1020237034361 A KR1020237034361 A KR 1020237034361A KR 20237034361 A KR20237034361 A KR 20237034361A KR 20230154261 A KR20230154261 A KR 20230154261A
- Authority
- KR
- South Korea
- Prior art keywords
- filamentous fungus
- genetically modified
- protein
- ascomycete
- stt3
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 215
- 241000233866 Fungi Species 0.000 title claims abstract description 140
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 130
- 238000004519 manufacturing process Methods 0.000 title claims description 27
- 230000004988 N-glycosylation Effects 0.000 title claims description 26
- 241000235349 Ascomycota Species 0.000 claims abstract description 63
- 101150099625 STT3 gene Proteins 0.000 claims abstract description 61
- 238000012217 deletion Methods 0.000 claims abstract description 51
- 230000037430 deletion Effects 0.000 claims abstract description 51
- 230000014509 gene expression Effects 0.000 claims description 66
- 238000000034 method Methods 0.000 claims description 38
- 230000000694 effects Effects 0.000 claims description 31
- 150000007523 nucleic acids Chemical group 0.000 claims description 29
- 108010089072 Dolichyl-diphosphooligosaccharide-protein glycotransferase Proteins 0.000 claims description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 20
- 241000123346 Chrysosporium Species 0.000 claims description 19
- 108091033319 polynucleotide Proteins 0.000 claims description 19
- 239000002157 polynucleotide Substances 0.000 claims description 19
- 102000040430 polynucleotide Human genes 0.000 claims description 19
- 101100438523 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CAX4 gene Proteins 0.000 claims description 16
- 241000894007 species Species 0.000 claims description 15
- 108091005804 Peptidases Proteins 0.000 claims description 13
- 238000012239 gene modification Methods 0.000 claims description 13
- 230000005017 genetic modification Effects 0.000 claims description 13
- 235000013617 genetically modified food Nutrition 0.000 claims description 13
- 102000004190 Enzymes Human genes 0.000 claims description 12
- 108090000790 Enzymes Proteins 0.000 claims description 12
- 239000004365 Protease Substances 0.000 claims description 12
- 241001313536 Thermothelomyces thermophila Species 0.000 claims description 12
- 150000001413 amino acids Chemical class 0.000 claims description 12
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 11
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 11
- 230000004048 modification Effects 0.000 claims description 11
- 238000012986 modification Methods 0.000 claims description 11
- 230000003197 catalytic effect Effects 0.000 claims description 10
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 9
- 230000006378 damage Effects 0.000 claims description 9
- 235000011180 diphosphates Nutrition 0.000 claims description 8
- 241000228212 Aspergillus Species 0.000 claims description 7
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 claims description 7
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 claims description 7
- 241000223259 Trichoderma Species 0.000 claims description 7
- 241000226677 Myceliophthora Species 0.000 claims description 6
- 241000228341 Talaromyces Species 0.000 claims description 6
- 230000001225 therapeutic effect Effects 0.000 claims description 6
- 241001252397 Corynascus Species 0.000 claims description 5
- 241000228143 Penicillium Species 0.000 claims description 5
- 241001326562 Pezizomycotina Species 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 5
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 claims description 4
- 241000223218 Fusarium Species 0.000 claims description 4
- 241000221960 Neurospora Species 0.000 claims description 4
- 102000035195 Peptidases Human genes 0.000 claims description 4
- 241000678519 Rasamsonia Species 0.000 claims description 4
- 241001238980 Thermothelomyces Species 0.000 claims description 4
- 241001100181 Thermothelomyces heterothallica Species 0.000 claims description 4
- 102000036639 antigens Human genes 0.000 claims description 3
- 108091007433 antigens Proteins 0.000 claims description 3
- 238000003421 catalytic decomposition reaction Methods 0.000 claims description 3
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 claims description 3
- 229960005486 vaccine Drugs 0.000 claims description 3
- 108020005364 Dolichyldiphosphatase Proteins 0.000 claims description 2
- 101710172711 Structural protein Proteins 0.000 claims description 2
- -1 antibodies Proteins 0.000 claims description 2
- 239000000427 antigen Substances 0.000 claims description 2
- 102000006839 dolichyldiphosphatase Human genes 0.000 claims description 2
- 235000018102 proteins Nutrition 0.000 description 108
- 210000004027 cell Anatomy 0.000 description 44
- 108020004414 DNA Proteins 0.000 description 36
- 239000013615 primer Substances 0.000 description 32
- 230000002538 fungal effect Effects 0.000 description 30
- 239000003550 marker Substances 0.000 description 29
- 230000010354 integration Effects 0.000 description 25
- 229960003301 nivolumab Drugs 0.000 description 23
- 108090000765 processed proteins & peptides Proteins 0.000 description 21
- 101150052795 cbh-1 gene Proteins 0.000 description 19
- 239000012634 fragment Substances 0.000 description 18
- 229920001542 oligosaccharide Polymers 0.000 description 16
- 150000002482 oligosaccharides Chemical class 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- 229920001184 polypeptide Polymers 0.000 description 14
- 230000001105 regulatory effect Effects 0.000 description 14
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 13
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 13
- 108090000288 Glycoproteins Proteins 0.000 description 12
- 102000003886 Glycoproteins Human genes 0.000 description 12
- 241000282414 Homo sapiens Species 0.000 description 12
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 12
- 150000004676 glycans Chemical group 0.000 description 12
- 102000039446 nucleic acids Human genes 0.000 description 12
- 108020004707 nucleic acids Proteins 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 11
- 229940088598 enzyme Drugs 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 239000002609 medium Substances 0.000 description 10
- 235000001014 amino acid Nutrition 0.000 description 9
- 229940024606 amino acid Drugs 0.000 description 9
- 150000002632 lipids Chemical class 0.000 description 9
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 8
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 8
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 8
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 8
- 229910052799 carbon Inorganic materials 0.000 description 8
- 239000008103 glucose Substances 0.000 description 8
- 238000003752 polymerase chain reaction Methods 0.000 description 8
- 235000000346 sugar Nutrition 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 7
- 108010076504 Protein Sorting Signals Proteins 0.000 description 7
- 230000003321 amplification Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 210000003527 eukaryotic cell Anatomy 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 230000037361 pathway Effects 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 101150089778 pyr-4 gene Proteins 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 239000003643 water by type Substances 0.000 description 7
- 101150015099 CHIA1 gene Proteins 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 101150014959 chi1 gene Proteins 0.000 description 6
- 239000001963 growth medium Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 108020005065 3' Flanking Region Proteins 0.000 description 5
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 5
- 108700023372 Glycosyltransferases Proteins 0.000 description 5
- 102000051366 Glycosyltransferases Human genes 0.000 description 5
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 5
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 5
- 230000013595 glycosylation Effects 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 108020005029 5' Flanking Region Proteins 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 108700010070 Codon Usage Proteins 0.000 description 4
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 4
- 101100032166 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) pyr5 gene Proteins 0.000 description 4
- 101150024193 alp1 gene Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 4
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 4
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 4
- 239000012228 culture supernatant Substances 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 4
- 102000035122 glycosylated proteins Human genes 0.000 description 4
- 108091005608 glycosylated proteins Proteins 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000012510 peptide mapping method Methods 0.000 description 4
- 230000004481 post-translational protein modification Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 150000008163 sugars Chemical class 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 241000351920 Aspergillus nidulans Species 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical group CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 3
- 229930091371 Fructose Natural products 0.000 description 3
- 239000005715 Fructose Substances 0.000 description 3
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 3
- 241000223195 Fusarium graminearum Species 0.000 description 3
- 241000235058 Komagataella pastoris Species 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- 108010054377 Mannosidases Proteins 0.000 description 3
- 102000001696 Mannosidases Human genes 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 3
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 3
- 101001010097 Shigella phage SfV Bactoprenol-linked glucose translocase Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 108020004566 Transfer RNA Proteins 0.000 description 3
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 229930182830 galactose Natural products 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 210000002288 golgi apparatus Anatomy 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 125000000311 mannosyl group Chemical group C1([C@@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 229920002477 rna polymer Polymers 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 2
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 2
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 2
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000750534 Aspergillus funiculosus Species 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- 240000006439 Aspergillus oryzae Species 0.000 description 2
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 2
- 239000002028 Biomass Substances 0.000 description 2
- 108010059892 Cellulase Proteins 0.000 description 2
- 241000513025 Corynascus fumimontanus Species 0.000 description 2
- 241000287781 Crassicarpon thermophilum Species 0.000 description 2
- GUBGYTABKSRVRQ-CUHNMECISA-N D-Cellobiose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-CUHNMECISA-N 0.000 description 2
- 241000567178 Fusarium venenatum Species 0.000 description 2
- 108060003306 Galactosyltransferase Proteins 0.000 description 2
- 102000030902 Galactosyltransferase Human genes 0.000 description 2
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 2
- 241000323642 Myceliophthora lutea Species 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 2
- 108091006036 N-glycosylated proteins Proteins 0.000 description 2
- 241000221961 Neurospora crassa Species 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241000228150 Penicillium chrysogenum Species 0.000 description 2
- 241000864266 Penicillium verrucosum Species 0.000 description 2
- 102000001105 Phosphofructokinases Human genes 0.000 description 2
- 108010069341 Phosphofructokinases Proteins 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- FHJQROWZEJFZPO-SRVKXCTJSA-N Pro-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FHJQROWZEJFZPO-SRVKXCTJSA-N 0.000 description 2
- 241000959173 Rasamsonia emersonii Species 0.000 description 2
- 108020001027 Ribosomal DNA Proteins 0.000 description 2
- 101100424621 Schizosaccharomyces pombe (strain 972 / ATCC 24843) tub1 gene Proteins 0.000 description 2
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 2
- 102000003838 Sialyltransferases Human genes 0.000 description 2
- 108090000141 Sialyltransferases Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 241000223260 Trichoderma harzianum Species 0.000 description 2
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- 241000223261 Trichoderma viride Species 0.000 description 2
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 2
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- YKZVPMUGEJXEOR-JYJNAYRXSA-N Val-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N YKZVPMUGEJXEOR-JYJNAYRXSA-N 0.000 description 2
- MXGLYEVGJRXBTP-QOLULZROSA-N [(6z,10e,14e)-3,7,11,15,19-pentamethylicosa-6,10,14,18-tetraenyl] phosphono hydrogen phosphate Chemical compound OP(=O)(O)OP(O)(=O)OCCC(C)CC\C=C(\C)CC\C=C(/C)CC\C=C(/C)CCC=C(C)C MXGLYEVGJRXBTP-QOLULZROSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 108010087924 alanylproline Proteins 0.000 description 2
- 101150084761 alp2 gene Proteins 0.000 description 2
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 238000010923 batch production Methods 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 150000001720 carbohydrates Chemical group 0.000 description 2
- 229940106157 cellulase Drugs 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000001177 diphosphate Substances 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 108010054155 lysyllysine Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 238000007747 plating Methods 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- BWBDAEIIXBEFSS-UHFFFAOYSA-N (2,5-dioxopyrrolidin-1-yl) n-[2-[2-(diethylamino)ethylcarbamoyl]quinolin-6-yl]carbamate Chemical compound C1=CC2=NC(C(=O)NCCN(CC)CC)=CC=C2C=C1NC(=O)ON1C(=O)CCC1=O BWBDAEIIXBEFSS-UHFFFAOYSA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- 101100001031 Acetobacter aceti adhA gene Proteins 0.000 description 1
- 101150021974 Adh1 gene Proteins 0.000 description 1
- YHOPXCAOTRUGLV-XAMCCFCMSA-N Ala-Ala-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YHOPXCAOTRUGLV-XAMCCFCMSA-N 0.000 description 1
- PIPTUBPKYFRLCP-NHCYSSNCSA-N Ala-Ala-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PIPTUBPKYFRLCP-NHCYSSNCSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 1
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- XHNLCGXYBXNRIS-BJDJZHNGSA-N Ala-Lys-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XHNLCGXYBXNRIS-BJDJZHNGSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- CUOMGDPDITUMIJ-HZZBMVKVSA-N Ala-Phe-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 CUOMGDPDITUMIJ-HZZBMVKVSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- VQBULXOHAZSTQY-GKCIPKSASA-N Ala-Trp-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VQBULXOHAZSTQY-GKCIPKSASA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- YEBZNKPPOHFZJM-BPNCWPANSA-N Ala-Tyr-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O YEBZNKPPOHFZJM-BPNCWPANSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- ZDILXFDENZVOTL-BPNCWPANSA-N Ala-Val-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZDILXFDENZVOTL-BPNCWPANSA-N 0.000 description 1
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 1
- 229910000013 Ammonium bicarbonate Inorganic materials 0.000 description 1
- LLZXKVAAEWBUPB-KKUMJFAQSA-N Arg-Gln-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLZXKVAAEWBUPB-KKUMJFAQSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- NOZYDJOPOGKUSR-AVGNSLFASA-N Arg-Leu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O NOZYDJOPOGKUSR-AVGNSLFASA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 1
- UOUHBHOBGDCQPQ-IHPCNDPISA-N Asn-Phe-Trp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)NC(=O)[C@H](CC(=O)N)N UOUHBHOBGDCQPQ-IHPCNDPISA-N 0.000 description 1
- YHXNKGKUDJCAHB-PBCZWWQYSA-N Asn-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YHXNKGKUDJCAHB-PBCZWWQYSA-N 0.000 description 1
- RTFXPCYMDYBZNQ-SRVKXCTJSA-N Asn-Tyr-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O RTFXPCYMDYBZNQ-SRVKXCTJSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 1
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- JJQGZGOEDSSHTE-FOHZUACHSA-N Asp-Thr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JJQGZGOEDSSHTE-FOHZUACHSA-N 0.000 description 1
- CXEFNHOVIIDHFU-IHPCNDPISA-N Asp-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC(=O)O)N CXEFNHOVIIDHFU-IHPCNDPISA-N 0.000 description 1
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 1
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 1
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 1
- 241000726103 Atta Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 101710099628 Beta-glucosidase 1 Proteins 0.000 description 1
- 108010084185 Cellulases Proteins 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 1
- 101710151413 Chitinase 1 Proteins 0.000 description 1
- 101710132290 Chitotriosidase-1 Proteins 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 241001362614 Crassa Species 0.000 description 1
- BVFQOPGFOQVZTE-ACZMJKKPSA-N Cys-Gln-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O BVFQOPGFOQVZTE-ACZMJKKPSA-N 0.000 description 1
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 1
- MHYHLWUGWUBUHF-GUBZILKMSA-N Cys-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N MHYHLWUGWUBUHF-GUBZILKMSA-N 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 101710107327 Endochitinase 1 Proteins 0.000 description 1
- 102100021771 Endoplasmic reticulum mannosyl-oligosaccharide 1,2-alpha-mannosidase Human genes 0.000 description 1
- 241000228427 Eurotiales Species 0.000 description 1
- 108010019236 Fucosyltransferases Proteins 0.000 description 1
- 102000006471 Fucosyltransferases Human genes 0.000 description 1
- KUYCTNQKTFGPMI-SXHURMOUSA-N Glc(a1-2)Glc(a1-3)Glc(a1-3)Man(a1-2)Man(a1-2)Man(a1-3)[Man(a1-2)Man(a1-3)[Man(a1-2)Man(a1-6)]Man(a1-6)]Man(b1-4)GlcNAc(b1-4)GlcNAc Chemical compound O[C@@H]1[C@@H](NC(=O)C)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](NC(C)=O)[C@@H](O)[C@H](O[C@H]2[C@H]([C@@H](O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O3)O[C@@H]3[C@H]([C@@H](O[C@@H]4[C@@H]([C@@H](O[C@@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O[C@@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO[C@@H]3[C@H]([C@@H](O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O[C@@H]4[C@H]([C@@H](O)[C@H](O)[C@@H](CO)O4)O)O3)O)O2)O)[C@@H](CO)O1 KUYCTNQKTFGPMI-SXHURMOUSA-N 0.000 description 1
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- GLEGHWQNGPMKHO-DCAQKATOSA-N Gln-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GLEGHWQNGPMKHO-DCAQKATOSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- RONJIBWTGKVKFY-HTUGSXCWSA-N Gln-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O RONJIBWTGKVKFY-HTUGSXCWSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- BUVMZWZNWMKASN-QEJZJMRPSA-N Glu-Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 BUVMZWZNWMKASN-QEJZJMRPSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 1
- XOIATPHFYVWFEU-DCAQKATOSA-N Glu-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOIATPHFYVWFEU-DCAQKATOSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- YHOJJFFTSMWVGR-HJGDQZAQSA-N Glu-Met-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YHOJJFFTSMWVGR-HJGDQZAQSA-N 0.000 description 1
- TWYFJOHWGCCRIR-DCAQKATOSA-N Glu-Pro-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYFJOHWGCCRIR-DCAQKATOSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- 102000004366 Glucosidases Human genes 0.000 description 1
- KRRMJKMGWWXWDW-STQMWFEESA-N Gly-Arg-Phe Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KRRMJKMGWWXWDW-STQMWFEESA-N 0.000 description 1
- GGEJHJIXRBTJPD-BYPYZUCNSA-N Gly-Asn-Gly Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GGEJHJIXRBTJPD-BYPYZUCNSA-N 0.000 description 1
- KQDMENMTYNBWMR-WHFBIAKZSA-N Gly-Asp-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KQDMENMTYNBWMR-WHFBIAKZSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- FJWSJWACLMTDMI-WPRPVWTQSA-N Gly-Met-Val Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O FJWSJWACLMTDMI-WPRPVWTQSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 1
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 1
- NIOPEYHPOBWLQO-KBPBESRZSA-N Gly-Trp-Glu Chemical compound NCC(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCC(O)=O)C(O)=O NIOPEYHPOBWLQO-KBPBESRZSA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 1
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 1
- 241000842631 Gymnomitrion verrucosum Species 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 241000512244 Hedwigia Species 0.000 description 1
- 229920002488 Hemicellulose Polymers 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- QIVPRLJQQVXCIY-HGNGGELXSA-N His-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)Cc1cnc[nH]1)C(=O)N[C@@H](CCC(N)=O)C(O)=O QIVPRLJQQVXCIY-HGNGGELXSA-N 0.000 description 1
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 1
- UMBKDWGQESDCTO-KKUMJFAQSA-N His-Lys-Lys Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O UMBKDWGQESDCTO-KKUMJFAQSA-N 0.000 description 1
- FJCGVRRVBKYYOU-DCAQKATOSA-N His-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N FJCGVRRVBKYYOU-DCAQKATOSA-N 0.000 description 1
- YERBCFWVWITTEJ-NAZCDGGXSA-N His-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N)O YERBCFWVWITTEJ-NAZCDGGXSA-N 0.000 description 1
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 1
- DMAPKBANYNZHNR-ULQDDVLXSA-N His-Val-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N DMAPKBANYNZHNR-ULQDDVLXSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 241000221775 Hypocreales Species 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- JHCVYQKVKOLAIU-NAKRPEOUSA-N Ile-Cys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)O)N JHCVYQKVKOLAIU-NAKRPEOUSA-N 0.000 description 1
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 1
- KOPIAUWNLKKELG-SIGLWIIPSA-N Ile-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N KOPIAUWNLKKELG-SIGLWIIPSA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241001099157 Komagataella Species 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- PTRKPHUGYULXPU-KKUMJFAQSA-N Leu-Phe-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O PTRKPHUGYULXPU-KKUMJFAQSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- UIIMIKFNIYPDJF-WDSOQIARSA-N Leu-Trp-Met Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCSC)C(O)=O)NC(=O)[C@@H](N)CC(C)C)=CNC2=C1 UIIMIKFNIYPDJF-WDSOQIARSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- NTXYXFDMIHXTHE-WDSOQIARSA-N Leu-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 NTXYXFDMIHXTHE-WDSOQIARSA-N 0.000 description 1
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 1
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- VSRXPEHZMHSFKU-IUCAKERBSA-N Lys-Gln-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VSRXPEHZMHSFKU-IUCAKERBSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 1
- OEYKVQKYCHATHO-SZMVWBNQSA-N Lys-Trp-Gln Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N OEYKVQKYCHATHO-SZMVWBNQSA-N 0.000 description 1
- 239000012515 MabSelect SuRe Substances 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- CWFYZYQMUDWGTI-GUBZILKMSA-N Met-Arg-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O CWFYZYQMUDWGTI-GUBZILKMSA-N 0.000 description 1
- DSWOTZCVCBEPOU-IUCAKERBSA-N Met-Arg-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCNC(N)=N DSWOTZCVCBEPOU-IUCAKERBSA-N 0.000 description 1
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- SLQDSYZHHOKQSR-QXEWZRGKSA-N Met-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCSC SLQDSYZHHOKQSR-QXEWZRGKSA-N 0.000 description 1
- NHXXGBXJTLRGJI-GUBZILKMSA-N Met-Pro-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O NHXXGBXJTLRGJI-GUBZILKMSA-N 0.000 description 1
- CIDICGYKRUTYLE-FXQIFTODSA-N Met-Ser-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O CIDICGYKRUTYLE-FXQIFTODSA-N 0.000 description 1
- MIXPUVSPPOWTCR-FXQIFTODSA-N Met-Ser-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MIXPUVSPPOWTCR-FXQIFTODSA-N 0.000 description 1
- CQRGINSEMFBACV-WPRPVWTQSA-N Met-Val-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O CQRGINSEMFBACV-WPRPVWTQSA-N 0.000 description 1
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 229930182474 N-glycoside Natural products 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010065395 Neuropep-1 Proteins 0.000 description 1
- 101100494726 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pep-4 gene Proteins 0.000 description 1
- 230000004989 O-glycosylation Effects 0.000 description 1
- 241000320412 Ogataea angusta Species 0.000 description 1
- 241001465194 Onygenales Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 101150113367 PRT1 gene Proteins 0.000 description 1
- 241000534579 Persoonia Species 0.000 description 1
- BJEYSVHMGIJORT-NHCYSSNCSA-N Phe-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 BJEYSVHMGIJORT-NHCYSSNCSA-N 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- DPUOLKQSMYLRDR-UBHSHLNASA-N Phe-Arg-Ala Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 DPUOLKQSMYLRDR-UBHSHLNASA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- CBENHWCORLVGEQ-HJOGWXRNSA-N Phe-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CBENHWCORLVGEQ-HJOGWXRNSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- BPIFSOUEUYDJRM-DCPHZVHLSA-N Phe-Trp-Ala Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](C)C(O)=O)C1=CC=CC=C1 BPIFSOUEUYDJRM-DCPHZVHLSA-N 0.000 description 1
- ZYNBEWGJFXTBDU-ACRUOGEOSA-N Phe-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N ZYNBEWGJFXTBDU-ACRUOGEOSA-N 0.000 description 1
- VXCHGLYSIOOZIS-GUBZILKMSA-N Pro-Ala-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 VXCHGLYSIOOZIS-GUBZILKMSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- UPJGUQPLYWTISV-GUBZILKMSA-N Pro-Gln-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UPJGUQPLYWTISV-GUBZILKMSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- UIMCLYYSUCIUJM-UWVGGRQHSA-N Pro-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 UIMCLYYSUCIUJM-UWVGGRQHSA-N 0.000 description 1
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 1
- CFVRJNZJQHDQPP-CYDGBPFRSA-N Pro-Ile-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 CFVRJNZJQHDQPP-CYDGBPFRSA-N 0.000 description 1
- FMLRRBDLBJLJIK-DCAQKATOSA-N Pro-Leu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FMLRRBDLBJLJIK-DCAQKATOSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- VPBQDHMASPJHGY-JYJNAYRXSA-N Pro-Trp-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CO)C(=O)O VPBQDHMASPJHGY-JYJNAYRXSA-N 0.000 description 1
- OOZJHTXCLJUODH-QXEWZRGKSA-N Pro-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 OOZJHTXCLJUODH-QXEWZRGKSA-N 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 1
- DGHFNYXVIXNNMC-GUBZILKMSA-N Ser-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N DGHFNYXVIXNNMC-GUBZILKMSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- GVIGVIOEYBOTCB-XIRDDKMYSA-N Ser-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC(C)C)C(O)=O)=CNC2=C1 GVIGVIOEYBOTCB-XIRDDKMYSA-N 0.000 description 1
- XNXRTQZTFVMJIJ-DCAQKATOSA-N Ser-Met-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNXRTQZTFVMJIJ-DCAQKATOSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- TYIHBQYLIPJSIV-NYVOZVTQSA-N Ser-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CO)N TYIHBQYLIPJSIV-NYVOZVTQSA-N 0.000 description 1
- GSCVDSBEYVGMJQ-SRVKXCTJSA-N Ser-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)O GSCVDSBEYVGMJQ-SRVKXCTJSA-N 0.000 description 1
- OSFZCEQJLWCIBG-BZSNNMDCSA-N Ser-Tyr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSFZCEQJLWCIBG-BZSNNMDCSA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- 241000221926 Sordariales Species 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 241001136494 Talaromyces funiculosus Species 0.000 description 1
- 241000758531 Taphrinomycotina Species 0.000 description 1
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 1
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- KDGBLMDAPJTQIW-RHYQMDGZSA-N Thr-Met-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N)O KDGBLMDAPJTQIW-RHYQMDGZSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- STUAPCLEDMKXKL-LKXGYXEUSA-N Thr-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O STUAPCLEDMKXKL-LKXGYXEUSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- BJJRNAVDQGREGC-HOUAVDHOSA-N Thr-Trp-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O BJJRNAVDQGREGC-HOUAVDHOSA-N 0.000 description 1
- NDLHSJWPCXKOGG-VLCNGCBASA-N Thr-Trp-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N)O NDLHSJWPCXKOGG-VLCNGCBASA-N 0.000 description 1
- JNKAYADBODLPMQ-HSHDSVGOSA-N Thr-Trp-Val Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)=CNC2=C1 JNKAYADBODLPMQ-HSHDSVGOSA-N 0.000 description 1
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 1
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 1
- FEZASNVQLJQBHW-CABZTGNLSA-N Trp-Gly-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O)=CNC2=C1 FEZASNVQLJQBHW-CABZTGNLSA-N 0.000 description 1
- WLBZWXXGSOLJBA-HOCLYGCPSA-N Trp-Gly-Lys Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 WLBZWXXGSOLJBA-HOCLYGCPSA-N 0.000 description 1
- IMYTYAWRKBYTSX-YTQUADARSA-N Trp-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O IMYTYAWRKBYTSX-YTQUADARSA-N 0.000 description 1
- ILDJYIDXESUBOE-HSCHXYMDSA-N Trp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ILDJYIDXESUBOE-HSCHXYMDSA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- WLQRIHCMPFHGKP-PMVMPFDFSA-N Trp-Leu-Phe Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CC(C)C)C(O)=O)C1=CC=CC=C1 WLQRIHCMPFHGKP-PMVMPFDFSA-N 0.000 description 1
- SLOYNOMYOAOUCX-BVSLBCMMSA-N Trp-Phe-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SLOYNOMYOAOUCX-BVSLBCMMSA-N 0.000 description 1
- LFMLXCJYCFZBKE-IHPCNDPISA-N Trp-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N LFMLXCJYCFZBKE-IHPCNDPISA-N 0.000 description 1
- XGFOXYJQBRTJPO-PJODQICGSA-N Trp-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XGFOXYJQBRTJPO-PJODQICGSA-N 0.000 description 1
- GQNCRIFNDVFRNF-BPUTZDHNSA-N Trp-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O GQNCRIFNDVFRNF-BPUTZDHNSA-N 0.000 description 1
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 1
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 1
- ZWZOCUWOXSDYFZ-CQDKDKBSSA-N Tyr-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ZWZOCUWOXSDYFZ-CQDKDKBSSA-N 0.000 description 1
- QYSBJAUCUKHSLU-JYJNAYRXSA-N Tyr-Arg-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O QYSBJAUCUKHSLU-JYJNAYRXSA-N 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- UXUFNBVCPAWACG-SIUGBPQLSA-N Tyr-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N UXUFNBVCPAWACG-SIUGBPQLSA-N 0.000 description 1
- CVXURBLRELTJKO-BWAGICSOSA-N Tyr-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)O CVXURBLRELTJKO-BWAGICSOSA-N 0.000 description 1
- AVIQBBOOTZENLH-KKUMJFAQSA-N Tyr-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N AVIQBBOOTZENLH-KKUMJFAQSA-N 0.000 description 1
- DWAMXBFJNZIHMC-KBPBESRZSA-N Tyr-Leu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O DWAMXBFJNZIHMC-KBPBESRZSA-N 0.000 description 1
- DAOREBHZAKCOEN-ULQDDVLXSA-N Tyr-Leu-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O DAOREBHZAKCOEN-ULQDDVLXSA-N 0.000 description 1
- GZOCMHSZGGJBCX-ULQDDVLXSA-N Tyr-Lys-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O GZOCMHSZGGJBCX-ULQDDVLXSA-N 0.000 description 1
- KHUVIWRRFMPVHD-JYJNAYRXSA-N Tyr-Met-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O KHUVIWRRFMPVHD-JYJNAYRXSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- ZPFLBLFITJCBTP-QWRGUYRKSA-N Tyr-Ser-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)NCC(O)=O ZPFLBLFITJCBTP-QWRGUYRKSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- 108010008393 UDP-N-acetylglucosamine N-acetyl-D-glucosaminyl-1-6-(N-acetylglucosaminyl-1-2)mannopyranosyl-1-R(N-acetylglucosamine to mannose)-1,4N-acetylglucosaminyltransferase VI Proteins 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- VJOWWOGRNXRQMF-UVBJJODRSA-N Val-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 VJOWWOGRNXRQMF-UVBJJODRSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- PFNZJEPSCBAVGX-CYDGBPFRSA-N Val-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](C(C)C)N PFNZJEPSCBAVGX-CYDGBPFRSA-N 0.000 description 1
- XQVRMLRMTAGSFJ-QXEWZRGKSA-N Val-Asp-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XQVRMLRMTAGSFJ-QXEWZRGKSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- SYOMXKPPFZRELL-ONGXEEELSA-N Val-Gly-Lys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N SYOMXKPPFZRELL-ONGXEEELSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- KTEZUXISLQTDDQ-NHCYSSNCSA-N Val-Lys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KTEZUXISLQTDDQ-NHCYSSNCSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 235000012538 ammonium bicarbonate Nutrition 0.000 description 1
- 239000001099 ammonium carbonate Substances 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 235000021120 animal protein Nutrition 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010027234 aspartyl-glycyl-glutamyl-alanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 1
- 101150100570 bglA gene Proteins 0.000 description 1
- 238000010364 biochemical engineering Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000004807 desolvation Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000033581 fucosylation Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000009454 functional inhibition Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 108010050669 glucosidase I Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010038983 glycyl-histidyl-lysine Proteins 0.000 description 1
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 101150073906 gpdA gene Proteins 0.000 description 1
- 101150095733 gpsA gene Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 238000009630 liquid culture Methods 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 108010009689 mannosyl-oligosaccharide 1,2-alpha-mannosidase Proteins 0.000 description 1
- 108010083819 mannosyl-oligosaccharide 1,3 - 1,6-alpha-mannosidase Proteins 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 235000013379 molasses Nutrition 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229950006780 n-acetylglucosamine Drugs 0.000 description 1
- 101150061302 och1 gene Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 229930000044 secondary metabolite Natural products 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013595 supernatant sample Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 238000001195 ultra high performance liquid chromatography Methods 0.000 description 1
- 238000004704 ultra performance liquid chromatography Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/28—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
- C07K16/2803—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily
- C07K16/2818—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the immunoglobulin superfamily against CD28 or CD152
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1081—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/005—Glycopeptides, glycoproteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y306/00—Hydrolases acting on acid anhydrides (3.6)
- C12Y306/01—Hydrolases acting on acid anhydrides (3.6) in phosphorus-containing anhydrides (3.6.1)
- C12Y306/01043—Dolichyldiphosphatase (3.6.1.43)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2317/00—Immunoglobulins specific features
- C07K2317/40—Immunoglobulins specific features characterized by post-translational modification
- C07K2317/41—Glycosylation, sialylation, or fucosylation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/645—Fungi ; Processes using fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/99—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
- C12Y204/99018—Dolichyl-diphosphooligosaccharide—protein glycotransferase (2.4.99.18)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Mycology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
stt3 및/또는 cw13 db 유전자의 결실 또는 파괴를 포함하는, 포유동물 단백질의 N-글리칸이 감소되어 있거나 없는 단백질을 생산하도록 유전적으로 변형된 자낭균류 사상 진균이 제공된다.
Description
본 발명은 STT3 및/또는 CWH8 단백질의 발현 및/또는 활성이 감소된, 유전적으로 변형된 자낭균류 사상 진균(genetically-modified ascomycetous filamentous fungi)에 관한 것이다. 유전적으로 변형된 사상 진균은 N-연결된 글리코실화가 부분적이거나 없는 재조합 단백질(recombinant protein)의 견고한 생산을 위해 사용된다.
해독후 단백질 변형(post-translational protein modification), 예를 들면, 글리코실화(glycosylation) 또는 인산화(phosphorylation)를 갖는 재조합 단백질의 발현 및 정제는 단지 진핵 발현 시스템을 사용하여 달성될 수 있다. 진핵세포 단백질 발현 시스템, 예를 들면, 포유동물 및 곤충 세포주, 식물 및 진균은 기능성 진핵세포 단백질의 생산을 위해 필수적으로 되어 왔다.
진핵세포 유기체로서, 효모 및 진균은 해독후 변형, 예를 들면, N- 및 O-글리코실화를 수행할 수 있지만, 효모 및 진균에서 단백질 글리코실화는 포유동물 세포에서의 것과는 상이하다. 이러한 문제점을 극복하기 위하여, N-글리코실화 경로를 재가공할 가능성이 특히 이종 단백질의 생산에 가장 흔히 사용된 종(예컨대, 사카로마이세스 세레비지아에(Saccharomyces cerevisiae), 피치아 파스토리스(Pichia pastoris), 야로위아 리폴리티카(Yarrowia lipolytica), 한세눌라 폴리모르파(Hansenula polymorpha), 및 아스퍼길러스(Aspergillus) 및 트리초데르마(Trichoderma) 종)에서 탐구되어 왔다.
문헌: Parsaie Nasab et al., (2013, Appl Environ Microbiol., 79(3): 997-1007)은 에스. 세레비지아에(S. cerevisiae)에서 사람 N-글리칸을 수반하는 재조합 단백질을 생산하기 위한 합성 N-글리코실화 경로를 기술하고 있다. 파르사이에 나삽(Parsaie Nasab) 등에 의한 연구는 또한 US 2011/0207214에 기술되어 있으며, 이는 ER 막에서 지질-연결된 올리고사카라이드(lipid-linked oligosaccharide; LLO) 플립파제(flippase) 활성을 발현시키기 위해 변형시킨 세포를 개시하고 있다. 플립파제는 ER의 사이토졸 측면(cytosolic side)에서 내강 측면(luminal side)으로 1, 2, 또는 3개의 만노스를 함유하는 LLO의 플립핑(flipping)을 가능하도록 한다. 이러한 연구는 문헌: De Wachter et al., (2018, Engineering of Yeast Glycoprotein Expression. In: Advances in Biochemical Engineering/Biotechnology. Springer, Berlin, Heidelberg)에서의 다른 관련된 연구와 함께 추가로 고찰되고 있다.
미국 특허 제7,029,872호, 미국 특허 제7,326,681호, 미국 특허 제7,629,163호, 및 미국 특허 제7,981,660호는 사람에서 당단백질의 공정을 모사(mimic)하는, 효소 반응의 순서를 세포가 수행하도록 하는 유전적으로 변형된 글리코실화 경로를 갖는 세포주를 개시하고 있다. 진핵세포, 예를 들면, 높은 만노스-함유 N-글리칸을 흔히 생산하는, 단세포 및 다세포 진균은 변형되어 사람 글리코실화 경로를 따라 N-글리칸, 예를 들면, Man5GlcNAc2 또는 다른 구조를 생산한다.
미국 특허 제9,359,628호는 보다 작은 글리칸을 지닌 단백질을 생산할 수 있는 피치아의 유전적으로 가공된 균주를 개시하고 있다. 특히, 유전적으로 가공된 균주는 α-1,2-만노시다제 및 글루코시다제 중 어느 하나 또는 둘 다를 발현할 수 있다. 유전적으로 가공된 균주는 추가로 변형시켜 OCH1 유전자가 파괴되도록 할 수 있다. 이러한 유전적으로 가공된 피치아 균주를 사용하여 보다 작은 글리칸을 지닌 당단백질을 생산하는 방법이 또한 제공된다.
본 발명의 출원인에 대한 미국 특허 제8,268,585호 및 미국 특허 제8,871,493호는 이종 단백질 또는 폴리펩타이드를 발현 및 분비하기 위한 사상 진균 숙주 분야에서의 형질전환 시스템을 개시하고 있다. 또한 폴리펩타이드 또는 단백질을 경제적인 방식으로 다량 생산하는 공정이 개시되어 있다. 시스템은 크리소스포리움(Chrysosporium), 보다 특히 크리소스포리움 루크노웬세(Chrysosporium lucknowense) 속의 형질전환되거나 형질감염된 진균 균주 및 이의 돌연변이체 또는 유도체를 포함한다. 또한 크리소스포리움(Chrysosporium) 암호화 서열을 함유하는 형질전환체 뿐만 아니라, 크리소스포리움 유전자의 발현-조절 서열을 함유하는 형질전환체가 또한 개시되어 있다.
써모텔로마이세스 헤테로탈리카(Thermothelomyces heterothallica)(Th. 헤테로탈리카(Th. heterothallica)) 균주 C1(최근에 마이셀리오프토라 써모필라(Myceliophthora thermophila)로부터 재명명되었고, 이는 크리소스포리움 루크노웬세로부터 재명명되었다)은 고 수준의 셀룰라제를 생산하는 열-내성 자낭균류 사상 진균이며, 이러한 셀룰라제는 상기 균주가 이러한 및 다른 효소를 상업적 규모로 생산하는데 매력적이도록 한다.
야생형 C1은 부다페스트 조약(Budapest Treaty)에 따라 1996년 8월 29일의 기탁일에, 제VKM F-3500 D호로 기탁되었다. 고 셀룰라제(High Cellulase; HC) 및 저 셀룰라제(Low Cellulase; LC) 균주는 또한 예를 들면, 미국 특허 제8,268,585호에 기술된 바와 같이, 기탁되었다.
미국 특허 제9,695,454호는 감소된 프로테아제 활성을 가지고 푸코실화 경로를 발현하는, 사상 진균 세포, 예를 들면, 트리초데르마 진균 세포를 포함하는 조성물을 개시하고 있다. 또한 발현 시스템으로서, 유전적으로 변형된 사상 진균 세포, 예를 들면, 트리초데르마 진균 세포를 사용하여, 푸코실화된 N-글리칸을 갖는 당단백질을 생산하는 방법을 기술하고 있다.
미국 특허 제7,449,308호 및 미국 특허 제7,935,513호는 글리코실트랜스퍼라제, 당 트랜스포터(sugar transporter) 및 만노시다제의 세트의 이종 발현에 의해 변형되어 포유동물, 예컨대, 사람 치료학적 당단백질을 생산하기 위한 숙주-균주가 될 수 있도록 하는 변형된 올리고사카라이드를 갖는 진핵 숙주 세포를 개시하고 있다. 가공된 숙주 세포에서 제조된 N-글리칸은 Man5GlcNAc2 코어 구조를 가지고 이는 이후에 하나 이상의 효소, 예컨대, 글리코실트랜스퍼라제, 당 트랜스포터 및 만노시다제의 이종 발현에 의해 추가로 변형되어 사람-유사 당단백질을 생성할 수 있다.
미국 특허 제8,268,585호 및 미국 특허 제8,871,493호는 이종 단백질 또는 폴리펩타이드를 발현 및 분비하기 위한 사상 진균 숙주 분야에서의 형질전환을 개시하고 있다. 또한 다량의 폴리펩타이드 또는 단백질을 경제적인 방식으로 생산하는 공정을 개시하고 있다. 시스템은 크리소스포리움, 보다 특히 크리소스포리움 루크노웬세 속의 형질전환되거나 형질감염된 진균 균주 및 이의 돌연변이체 또는 유도체를 포함한다. 또한 크리소스포리움 암호화 서열, 뿐만 아니라 크리소스포리움 유전자의 발현-조절 서열을 함유하는 형질전환체가 개시되어 있다.
미국 특허 제9,175,296호는 크리소스포리움 루크노웬세의 진균 숙주 균주를 개시하고 있다. 또한 순도가 75% 초과인 순수한 단백질의 동종 및/또는 이종 생산 방법, 인공 단백질 혼합물을 생산하는 방법 및 목적한 효소를 기능적으로 발현하는 균주의 단순화된 스크리닝(screening)을 위한 방법이 개시되어 있다. 미국 특허 제9,175,296호는 또한 크리소스포리움 루크노웬세(최근에 써모텔로마이세스 헤테로탈리카(써모텔로마이세스 헤테로탈리카)로 재명명됨)에서 유전자 발현의 전사 제어에 적합한 단리된 프로모터 서열 및 크리소스포리움루크노웬세의 진균 숙주 균주를 단리하는 방법을 개시하고 있으며, 여기서 프로테아제 분비는 크리소스포리움루크노웬세 균주 UV 18-25의 프로테아제 분비의 20% 미만이다.
N-연결된 글리코실화가 부분적이거나 없는 단백질을 고 수율로 생산함으로써, 단백질이 다양한 산업적 및 약제학적 용도에 적합하도록 할 수 있는 재조합 단백질의 생산을 위한 발현 시스템에 대한 요구가 존재한다.
발명의 요약
본 발명은 포유동물 단백질의 n-글리칸 변형이 감소되어 있거나 없는 단백질을 생산하도록 유전적으로 변형시킨, 유전적으로 변형된 자낭균류 사상 진균을 제공한다. 특히, 본 발명은 N-글리칸 변형이 감소되어 있거나 없는 재조합 단백질을 생산하도록 유전적으로 변형시킨 예시적인 자낭균류 사상 진균으로서 써모텔로마이세스 헤테로탈리카(Thermothelomyces heterothallica) 균주 C1을 제공한다. 일부 구현예에서, 본원에 개시된 진균은 stt3 및/또는 cwh8 유전자가 결여되도록 변형되었다.
본 발명은 부분적으로 본원에 개시된 바와 같은 써모텔로마이세스 헤테로탈리카가 변형되지 않은 균주와 비교하여 글리칸이 감소되어 있거나 없는 단백질을 생산한다는 발견을 기반으로 한다. 이는 수득된 N-글리칸내에 큰 변이(variation)를 지닌 단백질을 생산하는, 지금까지 기술된 발현 시스템과는 대조적이다.
유리하게는, 본 발명의 변형된 자낭균류 사상 진균 세포는 부분적인 해독 후 변형(post-translational modification)을 갖는 이종 단백질의 생산을 가능하도록 한다. 이러한 단백질은 다양한 적용에 사용될 수 있으며, 여기서 완전히 글리코실화된 단백질은 이에 적합하지 않다. 예를 들면, 단백질은 목적한 용해도 및/또는 생물학적 활성을 위해 설계될 수 있다. N-글리칸의 양이 감소된 단백질은 완전히 글리코실화된 단백질과 비교하여 감소된 면역원성을 나타낼 수 있다. 본 발명의 부분적으로 N-글리코실화된 단백질은 추가의 또는 다른 단백질 변형을 위한 1차 물질로서 사용될 수 있다. 또한, 비-N-글리코실화된 단백질은 약동학/약력한 연구에서 다양한 글리코실화된 형태 및 혼합물을 위한 잠재적인 제어 단백질로서 사용될 수 있다. 더욱이, 본원에 기술된 부분적인 글리코실화된 단백질은, 치료학적 효과가 흔히 N-글리코실화에 의존하므로, 천연적으로 글리코실화된 단백질과 비교하여 상이한 치료학적 효과를 가질 수 있다.
유리하게는, 본 발명의 변형된 자낭균류 사상 진균 세포는 고 수율 및 안정성을 지닌 단백질을 생산한다. 본 발명의 써모텔로마이세스 헤테로탈리카 세포를 사용하여 수득된 단백질 수준는 포유동물 세포, 예를 들면, CHO 세포, 또는 효모를 사용하여 수득된 것보다 훨씬 더 높다.
따라서, 본 발명은 약제 및 비-약제 산업에서 다양한 용도에 적합한, N-글리칸이 감소되거나 없는 진핵세포 재조합 단백질을 생산하기 위한 효율적인 시스템을 제공한다.
일 양태에 따라서, 본 발명은 N-연결된 글리코실화가 감소되어 있거나 없는 목적한 단백질을 생산할 수 있는 유전적으로 변형된 자낭균류 사상 진균을 제공하며, 이러한 유전적으로 변형된 사상 진균은 STT3 및/또는 CWH8의 발현 및/또는 활성이 감소된 적어도 하나의 세포를 포함한다.
일부 구현예에 따라서, 적어도 하나의 세포는 목적한 단백질을 암호화(encoding)하는 적어도 하나의 외인성 폴리뉴클레오타이드를 포함한다.
일부 구현예에 따라서, 적어도 하나의 세포는 STT3의 감소된 발현 및/또는 활성을 갖는다.
일부 구현예에 따라서, STT3은 써모텔로마이세스 헤테로탈리카 STT3의 아미노산에 대해 적어도 75%, 또는 적어도 80%, 또는 적어도 85%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 99%, 또는 100%의 동일성(identity)을 갖는 아미노산 서열을 포함한다. 특정의 구현예에 따라서, 써모텔로마이세스 헤테로탈리카 STT3은 서열 번호: 27의 아미노산을 포함한다.
일부 구현예에 따라서, 적어도 하나의 세포는 CWH8의 감소된 발현 및/또는 활성을 갖는다.
일부 구현예에 따라서, CWH8은 써모텔로마이세스 헤테로탈리카 CWH8의 아미노산에 대해 적어도 75%, 또는 적어도 80%, 또는 적어도 85%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 99%, 또는 100%의 동일성을 갖는 아미노산 서열을 포함한다. 특정의 구현예에 따라서, 써모텔로마이세스 헤테로탈리카 CWH8은 서열 번호: 28의 아미노산을 포함한다.
일부 구현예에 따라서, 변형된 사상 진균은 STT3 및 CWH8 단백질의 감소된 발현 및/또는 활성을 갖는 적어도 하나의 세포를 포함한다.
일부 구현예에 따라서, 유전적 변형은 stt3 유전자의 결실 또는 파괴를 포함한다. 일부 구현예에 따라서, 유전적 변형은 stt3 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 올리고사카릴트랜스퍼라제(올리고사카릴트랜스퍼라제; OST) 복합체의 촉매분해적 소단위(subunit)를 감소된 양으로 생산하도록 한다. 일부 구현예에 따라서, 유전적 변형은 stt3 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 올리고사카릴트랜스퍼라제(OST) 복합체의 촉매분해적 양을 생산하지 못하도록 한다.
일부 구현예에 따라서, 유전적 변형은 cwh8 유전자의 결실 또는 파괴를 포함한다. 일부 구현예에 따라서 유전적 변형은 cwh8 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 기능적 돌리칠(functional dolichyl) 피로포스페이트 포스파타제를 감소된 양으로 생산하도록 한다. 일부 구현예에 따라서, 유전적 변형은 cwh8 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 기능적 돌리칠 피로포스페이트 포스파타제를 생산하지 못하도록 한다.
일부 구현예에 따라서, 변형된 사상 진균은 감소된 양의 N-연결된 글리코실화를 지닌 단백질을 발현한다. 특정의 구현예에 따라서, 변형된 사상 진균은 변형되지 않은 진균과 비교하여 20% 미만의 N-연결된 글리코실화를 지닌 단배질을 발현한다. 추가의 구현예에 따라, 변형된 사상 진균은 N-연결된 글리코실화가 없는 단백질을 발현한다.
일부 구현예에 따라서, 자낭균류 사상 진균은 페지조마이코티나(Pezizomycotina) 그룹 내의 속(genus)의 것이다.
일부 구현예에 따라서, 자낭균류 사상 진균은 써모텔로마이세스(Thermothelomyces), 마이셀리오프토라(Myceliophthora), 트리초데르마(Trichoderma), 아스퍼길러스(Aspergillus), 페니실리움(Penicillium), 라삼소니아(Rasamsonia), 크리소스포리움(Chrysosporium), 코리나스쿠스(Corynascus), 푸사리움(Fusarium), 뉴로스포라(Neurospora), 및 탈라로마이세스(Talaromyces)로 이루어진 그룹으로부터 선택된 속의 것이다.
일부 구현예에 따라서, 자낭균류 사상 진균은 써모텔로마이세스 헤테로탈리카(또한 마이셀리오프토라 써모필라(Myceliophthora thermophila)로서 나타냄), 마이셀리오프토라 루테아(Myceliophthora lutea), 아스퍼길러스 니둘란스(Aspergillus nidulans), 아스퍼길러스 푸니쿨로수스(Aspergillus funiculosus), 아스퍼길러스 니거(Aspergillus niger), 아스퍼길러스 오리자에(Aspergillus oryzae), 트리초데르마 레에세이(Trichoderma reesei), 트리초데르마 하르지아눔(Trichoderma harzianum), 트리초데르마 론기브라티아툼(Trichoderma longibrachiatum), 트리초데르마 비리데(Trichoderma viride), 라삼소니아 에메르소니이(Rasamsonia emersonii), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 베루코숨(Penicillium verrucosum), 스포로트리쿰 써모필레(Sporotrichum thermophile), 코리나스쿠스 푸미몬타누스(Corynascus fumimontanus), 코리나스쿠스 써모필루스(Corynascus thermophilus), 크리소스포리움 루크노웬세, 푸사리움 그라미네룸(Fusarium graminearum), 푸사리움 베네나툼(Fusarium venenatum), 뉴로스포라 크라싸(Neurospora crassa), 및 탈라로마이세스 피니틸루스(Talaromyces piniphilus)로 이루어진 그룹으로부터 선택된 종(species)의 것이다.
일부 구현예에 따라서, 자낭균류 사상 진균은 서열 번호: 29에 제시된 핵산 서열에 대해 적어도 95%, 또는 적어도 96%, 또는 적어도 97%, 또는 적어도 98%, 또는 적어도 99% 또는 100% 동일성을 갖는 rDNA 서열을 포함하는 써모텔로마이세스 헤테로탈리카 균주이다.
일부 구현예에 따라서, 자낭균류 사상 진균은 써모텔로마이세스 헤테로탈리카이다. 일부 구현예에 따라서, 자낭균류 사상 진균은 써모텔로마이세스 헤테로탈리카 C1이다.
일부 구현예에서, C1은 다음으로 이루어진 그룹으로부터 선택된다: W1L#100I(prt-△alp1△chi1△alp2△pyr5) 기탁 번호 제CBS141153호, UV18-100f (prt-△alp1,△pyr5) 기탁 번호 제CBS141147호, W1L#100I(prt-△alp1△chi1△pyr5) 기탁 번호 제CBS141149호, 및 UV18-100f(prt-△alp1△pep4△alp2△prt1△pyr5) 기탁 번호 제CBS141143호 및 이의 유도체. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다.
일부 구현예에 따라서, 목적한 단백질은 효소, 구조 단백질, 백신 항원 및 이의 구성성분으로 이루어진 그룹으로부터 선택된다.
일부 구현예에 따라서, 목적한 단백질은 분비된 단백질이다. 특정의 구현예에 따라서, 목적한 단백질은 리더 펩타이드이다. 다른 구현예에 따라서, 목적한 단백질은 세포내 단백질이다. 특정의 구현예에서, 세포내 단백질은 막 또는 소낭 결합된 단백질이다.
일부 구현예에 따라서, 목적한 단백질은 항체 또는 이의 단편이다. 특정의 구현예에 따라서, 항체는 IgG4 또는 IgG1이다. 추가의 구현예에 따라서, 항체는 이중-특이적(bi-specific) 또는 다중 특이적(multi specific) 항체이다.
일부 구현예에 따라서, 목적한 단백질은 치료학적 단백질이다.
일부 구현예에 따라서, 목적한 단백질은 백신 단백질 항원이다.
목적한 단백질을 암호화하는 폴리뉴클레오타이드는 DNA 작제물 또는 발현 벡터의 부분을 형성할 수 있다.
일부 구현예에 따라서, 적어도 하나의 외인성 폴리뉴클레오타이드는 상기 자낭균류 사상 진균에서 작동가능한 적어도 하나의 조절 성분을 추가로 포함하는 DNA 작제물 또는 발현 벡터이다. 특정의 구현예에 따라서, 조절 성분은 상기 진균에 대해 내인성인 조절 성분 및 상기 진균에 대해 이종인 조절 성분으로 이루어진 그룹으로부터 선택된다.
일부 구현예에 따라서, 유전적으로 변형된 자낭균류 사상 진균은 분비된 단백질을 생산하도록 설계된다.
일부 구현예에서, 본 발명에 따른 자낭균류 사상 진균은 유전적으로 변형되어 항체를 발현한다.
일부 구현예에서, 자낭균류 사상 진균은 내인성 프로테아제를 암호화하는 하나 이상의 유전자를 결실하도록 추가로 변형된 균주이다.
일부 구현예에 따라서, 유전적으로 변형된 자낭균류 사상 진균은 적어도 5, 6, 7, 8, 9, 10, 11, 12, 13, 또는 14개의 프로테아제의 감소된 발현 및/또는 활성을 가진 적어도 하나의 세포를 포함한다. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다. 특정의 구현예에 따라서, 변형된 사상 진균은 적어도 9, 10, 11, 12, 13, 또는 14개의 프로테아제의 감소된 발현 및/또는 활성을 가진 적어도 하나의 세포를 포함한다. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다.
다른 양태에 따라서, 본 발명은:
(a) 자낭균류 사상 진균의 STT3 단백질의 발현 및/또는 활성을 감소시키는 단계; 및/또는
(b) 자낭균류 사상 진균의 CHW8 단백질의 발현 및/또는 활성을 감소시키는 단계를 포함하여, N-연결된 글리코실화가 감소되어 있거나 없는 단백질을 생산할 수 있는 자낭균류 사상 진균을 생성하기 위한 방법을 제공한다.
일부 구현예에 따라서, 방법은:
(a) 자낭균류 사상 진균의 stt3 유전자를 결실시키거나 파괴함으로써 올리고사카릴트랜스퍼라제(OST) 복합체(complex)의 기능적 촉매분해 소단위(functional catalytic subunit)의 생산을 감소시키는 단계; 및/또는
(b) 자낭균류 사상 진균의 chw8 유전자를 결실시키거나 파괴함으로써 기능적 돌리칠 피로포스페이트 포스파타제의 생산을 감소시키는 단계를 포함한다.
일부 구현예에 따라서, 진균은 올리고사카릴트랜스퍼라제(OST) 복합체의 기능적 촉매분해 소단위를 생산하지 못한다.
일부 구현예에 따라서, 진균은 기능적 돌리칠 피로포스페이트 포스파타제를 생산하지 못한다.
일부 구현예에 따라서, 진균은 올리고사카릴트랜스퍼라제(OST) 복합체 및 기능적 돌리칠 피로포스페이트 포스파타제의 기능적 촉매분해 소단위를 생산하지 못한다.
일부 구현예에 따라서, 방법은 목적한 이종 단백질을 암호화하는 외인성 폴리뉴클레오타이드를 자낭균류 사상 진균 내로 도입시킴으로써 진균 내에서 N-글리칸이 감소되어 있거나 없는 이종 단백질을 발현시키는 단계를 추가로 포함한다.
다른 양태에 따라서, 본 발명은 N-글리칸 변형이 감소되어 있거나 없는 이종 단백질을 생산하기 위한 방법을 제공하고, 이러한 방법은:
(i) 본원에 기술된 바와 같은 STT3 및/또는 CWH8의 발현 및/또는 활성이 감소되어 있고 본 발명에 따른 목적한 단백질을 암호화하는 적어도 하나의 외인성 폴리뉴클레오타이드를 갖는 적어도 하나의 세포를 포함하는 유전적으로 변형된 자낭균류 사상 진균을 제공하는 단계;
(ii) 자낭균류 사상 진균을 단백질을 발현하기에 적합한 조건 하에서 배양하는 단계; 및
(iii) 단백질을 회수하는 단계를 포함한다.
일부 구현예에서, 단백질은 자낭균류 사상 진균 내에서 재조합적으로 발현된 이종의 포유동물 단백질이다. 일부 특수한 구현예에서, 단백질은 자낭균류 사상 진균에서 재조합적으로 발현된 사람 단백질이다. 다른 구현예에서, 단백질은 자낭균류 사상 진균 내에서 재조합적으로 발현된 반려 및/또는 농장 동물의 단백질이다.
추가의 양태에 따라서, 본 발명은 본 발명에 따라 유전적으로 변형된 자낭균류 사상 진균에 의해 생산된 재조합 단백질을 제공한다.
일부 구현예에서, 본 발명에 따라 유전적으로 변형된 자낭균류 사상 진균에 의해 생산된 재조합 단백질은 약제학적 등급의 단백질이다.
추가의 구현예에 따라서, 본 발명은 적어도 하나의 목적한 단백질을 생산하는 방법을 제공하고, 이러한 방법은 본원에 기술된 바와 같은 유전적으로 변형된 진균을 적합한 배지 속에서 배양하는 단계; 및 적어도 하나의 단백질 생성물을 회수하는 단계를 포함한다.
일부 구현예에 따라서, 회수하는 단계는 성장 배지로부터, 진균 덩어리로부터, 또는 둘 다로부터 회수하는 단백질을 포함한다.
일부 구현예에 따라서 단백질은 성장 배지로부터 회수된다. 특정의 구현예에 따라서, 단백질의 적어도 50%, 60%, 70%, 80%, 90% 또는 95%가 분비된다.
본원에 개시된 양태 및 구현예 각각의 어떠한 조합도 본 발명의 개시내용 내에 명확하게 포함됨이 이해되어야 한다.
본 발명의 이러한 및 추가의 양태 및 특징은 하기한 상세한 설명, 실시예 및 청구범위로부터 명백해질 것이다.
도 1. 지질-연결된 올리고사카라이드 생합성 경로 및 진핵 세포 내 소포체(endoplasmic reticulum; ER)의 막에서 올리고사카라이드의 발생기(nascent) 폴리펩타이드로의 이전.
도 2a 및 2b. 당변형되지 않은(non-glycomodified) C1 균주(2A) 및 stt3 결실 균주 M3210(2B)에서 생반응기 내에 생산된 진균의 천연 단백질에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성(abundance).
도 3a 및 3b. 당변형되지 않은 C1 균주(3A) 및 cwh8 결실 균주 M3211(3B)에서 생물반응기(bioreactor) 내에 생산된 진균의 천연 단백질에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성.
도 4a 및 4b. 당변형되지 않은 C1 균주(4A) 및 stt3 결실 균주 M3480(4B)에서 생산된 모노클로날 항체에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성.
도 5a 및 5b. 당변형되지 않은 C1 균주(5A) 및 cwh8 결실 균주 M3481(5B)에서 생산된 모노클로날 항체에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성.
도 2a 및 2b. 당변형되지 않은(non-glycomodified) C1 균주(2A) 및 stt3 결실 균주 M3210(2B)에서 생반응기 내에 생산된 진균의 천연 단백질에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성(abundance).
도 3a 및 3b. 당변형되지 않은 C1 균주(3A) 및 cwh8 결실 균주 M3211(3B)에서 생물반응기(bioreactor) 내에 생산된 진균의 천연 단백질에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성.
도 4a 및 4b. 당변형되지 않은 C1 균주(4A) 및 stt3 결실 균주 M3480(4B)에서 생산된 모노클로날 항체에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성.
도 5a 및 5b. 당변형되지 않은 C1 균주(5A) 및 cwh8 결실 균주 M3481(5B)에서 생산된 모노클로날 항체에서 N-글리칸 패턴 및 상이한 글리칸 형태의 풍부성.
발명의 상세한 설명
본 발명은 N-연결된 글리코실화가 감소되어 있거나 없는 단백질을 생산하기 위한 대안적인, 고 효율적인 시스템을 제공한다. 본 발명의 시스템은 부분적으로 사상 진균 써모텔로마이세스 헤테로탈리카 C1 및 이의 특수한 균주를 기반으로 하며, 이는 단백질 뿐만 아니라 이차적인 대사산물 생산을 위한 천연 생물학적 공장으로서 이미 개발되었다. 본 발명은 일부 구현예에서 STT3 및/또는 CWH8 단백질의 발현 및/또는 활성이 감소된 유전적으로 변형된 진균을 제공한다. 일부 구현예에서, 유전적으로 변형된 진균은 다수의 프로테아제의 감소되거나 폐지된(abolished) 발현 및/또는 활성을 갖는다.
본원에 기술된 바와 같은 유전적으로 변형된 진균에 의해 생산된 단백질은 다양한 약제학적 및 비-약제학적 적용에 적합하다.
일 양태에 따라서, 본 발명은 목적한 단백질을 생산하기 위한 유전적으로 변형된 사상 진균을 제공하고, 유전적으로 변형된 사상 진균은 STT3 및/또는 CWH8 단백질의 발현 및/또는 활성이 감소된 적어도 하나의 세포를 포함한다.
추가의 양태에 따라서, 본 발명은 N-연결된 글리코실화가 감소되어 있거나 없는 재조합 단백질을 생산할 수 있는 유전적으로 변형된 사상 진균을 제공하고, 여기서 유전적 변형은:
(i) 유전적으로 변형된 사상 진균이 올리고사카릴트랜스퍼라제(OST) 복합체의 촉매분해적 소단위를 생산하지 못하도록 하는 stt3 유전자의 결실 또는 파괴;
(ii) 유전적으로 변형된 사상 진균이 기능적 돌리칠 피로포스페이트 포스파타제의 촉매분해적 소단위를 생산하지 못하도록 하는 cwh8 유전자의 결실 또는 파괴; 또는
(iii) stt3 및 cwh8 유전자 둘 다의 결실 또는 파괴를 포함한다.
용어 "파괴"는 유전자가 구조적으로 파괴되어 적어도 하나의 돌연변이 또는 구조적 변경을 포함함으로써 파괴된 유전자가 전체 길이의 기능성 유전자 생성물의 효율적인 발현을 지시할 수 없도록 함을 의미한다. 용어 "파괴"는 또한 파괴된 유전자 또는 이의 생성물 중 하나가 기능적으로 억제되거나 불활성화되어 유전자가 전체 길이 및/또는 완전한 기능의 유전자 생성물을 발현하지 않거나 효율적으로 발현할 수 없음을 의미한다. 기능적 억제 또는 불활성화는 전사 또는 해독의 어느 하나의 수준에서 발현의 구조적 파괴 및/또는 차단으로부터 야기될 수 있다. 용어 "파괴"는 또한 유전자 발현의 약화 또는 녹 다운(knocking down)을 포함한다.
단백질 글리코실화, 즉, 세포 내에서 새로이 합성된 폴리펩타이드 쇄의 측쇄에 대한 올리고사카라이드의 공유결합성 부착은 사카라이드 모이어티(moiety)를 순차적으로 가하고 제거하는 일련의 효소를 포함하는 진핵 세포내 정돈된 공정이다. N-글리코실화는 아스파라긴 잔기, 특히 서열 Asn-Xaa-Ser/Thr(여기서 Xaa는 Pro를 제외한 임의의 아미노산을 나타낸다)에서 발생하는 아스파라긴의 측쇄에 부착된다.
N-글리코실화는 소포체(ER) 내에서 개시되며, 여기서 올리고사카라이드 Glc3Man9GlcNAc2는 지질 담체(lipid carrier)인, 돌리콜-피로포스페이트 상에서 조립되고, 후속적으로 ER의 내강으로 도입되는 폴리펩타이드의 선택된 아스파라긴 잔기로 이전된다. 도 1은 지질-연결된 올리고사카라이드의 생합성 경로 및 진핵 세포 내 ER의 막에서 발생기 폴리펩타이드로의 이전을 나타낸다. 지질-연결된 올리고사카라이드의 생합성은 수개의 특이적인 글리코실트랜스퍼라제의 활성을 요구한다. 이는 ER 막의 세포질 측면에서 시작하여 내강에서 끝나며 여기서 올리고사카릴트랜스퍼라제(OST)는 발생기의 폴리펩타이드의 N-X-S/T 시쿠온스(sequons)를 선택하여 아스파라긴의 측쇄 아미드와 올리고사카라이드 사이에 N-글리코시드성 연결을 생성한다. ER의 외부로부터 내부로 지질-연결된 올리고사카라이드의 플립핑(flipping)은 ER 막에 위치한 플립파제에 의해 수행된다. 발생기의 폴리펩타이드로의 이전 후, 올리고사카라이드는 글리코시다제 및 만노시다제에 의해 전형적으로 트리밍(trimming)된 다음 발생기의 당단백질이 추가의 공정을 위해 골지체로 이전된다.
돌리콜-피로포스페이트-결합된 올리고사카라이드의 합성은 필수적으로 모든 공지된 진핵세포에서 보존된다. 그러나, 당단백질로서 올리고사카라이드의 추가의 공정은 하등 진균세포, 예를 들면, 진균 또는 효모와 고등 진핵세포, 예를 들면, 동물 및 식물 상에서 크게 변하는 분비 경로를 따라 이동한다. 따라서, 당 측쇄의 최종 조성은 다양한 유기체 사이에서 상이하고, 숙주에 의존한다.
미생물, 예를 들면, 효모에서는, 추가의 만노스 및/또는 만노실포스페이트 당이 가해져서, 30 내지 50개까지의 만노스 잔기를 함유할 수 있는 "초만노실화된(hypermannosylated)" 유형의 N-글리칸을 생성한다.
동물 세포, 예를 들면, 사람, 반려 동물 및 다른 포유동물 세포에서는, 발생기의 당단백질(nascent glycoprotein)이 골지체로 이전되며 여기서 만노스 잔기는 골지-특이적인 1,2-만노시다제에 의해 제거된다. 단백질로서 지속되는 공정은 첨가되어 특이적인 당 잔기를 제거하는 다수의 변형 효소, 예를 들면, N-아세틸글루코스아민 트랜스퍼라제(GnT I, GnT II, GnT III, GnT IV, GnT V, GnT VI), 만노시다제 II 및 푸코실트랜스퍼라제에 의해 골지체를 통해 진행된다. 최종적으로, N-글리칸은 갈락토실 트랜스퍼라제(GalT) 및 시알릴트랜스퍼라제(ST)에 의해 작동하며 최종의 당단백질이 골치체로부터 방출된다. 동물 당단백질의 N-글리칸은 비(bi)-, 트리(tri)-, 또는 테트라(tetra)-안테너리(antennary) 구조를 가지며, 전형적으로 갈락토스, 만토스, 프럭토스 및 N-아세틸글루코스아민을 포함할 수 있다. 일반적으로 N-글리칸의 말단 잔기는 시알산으로 이루어진다.
효모와는 달리, 써모텔로마이세스 헤테로탈리카는 초만노실화된 N-글리칸을 가지지 않지만, 오히려 "올리고 만노스" 글리칸- - Man3 내지 Man8-9 - 및 Man 및 HexNAc 잔기 둘 다를 함유하는 하이브리드 유형 글리칸(Man3HexNac-Man8HexNac)을 갖는다. 이러한 하이브리드 글리칸의 정확한 구조는 완전하게 알려져 있지 않다. 하이브리드 글리칸은 대표적인 만노스 잔기를 가지지만 또한 여전히 특성화되지 않은 결합을 통해 부착된 알려지지 않은 HexNAc를 갖는다.
본 발명은 N-글리코실화 경로의 유전적 변형으로 이것이 감소된 양의 N-글리칸을 생산하도록 하는 것에 관한 것이다.
본원에 사용된 바와 같은 "글리칸"은 담체, 예를 들면, 아미노산, 펩타이드, 폴리펩타이드, 지질 또는 환원 말단 접합체에 연결될 수 있는 올리고사카라이드 쇄를 지칭한다. 본 발명은 특히 아스파라긴 잔기(Asn)의 측쇄 아미드 질소에 N-결합에 의해 폴리펩타이드 N-글리코실화 부위, 예를 들면, -Asn-Xaa-Ser/Thr-에 접합된 N-연결된 글리칸("N-글리칸")에 관한 것이고, 여기서 Xaa는 Pro를 제외한 임의의 아미노산 잔기이다. 본 발명은 또한 돌리콜-포스포-올리고사카라이드(Dol-P-P-OS) 전구체 지질 구조의 부분으로서 글리칸에 관한 것이고, 이는 진핵 세포의 소포체 내에서 N-연결된 글리칸의 전구체이다. 전구체 올리고사카라이드는 이의 환원 말단에 의해 돌리콜 지질 상의 2개의 포스페이트 잔기에 결합된다.
용어 "stt3 유전자"는 돌리칠-디포스포올리고사카라이드-단백질 글리코실트랜스퍼라제 소단위를 암호화하는 유전자를 지칭한다. 이는 단백질 N-글리코실화의 제1 단계인, 발생기의 폴리펩타이드 쇄 내 Asn-X-Ser/Thr 컨센서스 모티프(consensus motif) 내의 아스파라긴 잔기로 지질 담체로부터의 정의된 글리칸(진핵세포에서 Glc3Man9GlcNAc2)의 초기 이전을 촉매하는 올리고사카릴트랜스퍼라제(OST) 복합체의 촉매분해 소단위이다. STT3 단백질은 다음의 반응을 촉매한다:
돌리칠 디포스포올리고사카라이드-(1→4)-N-아세틸-β-D-글리코스아미닐-(1→4)-N-아세틸--D-글리코스아미닐) + L-아스파라기닐-[단백질] →
돌리칠 디포스페이트 + H+ + N4-(올리고사카라이드-(1→4)-N-아세틸-β-D-글리코스아미닐-(1→4)-N-아세틸--D-글리코스아미닐)-L-아스파라기닐-[단백질].
본 발명의 유전적으로 변형된 자낭균류 사상 진균은 stt3 유전자의 결실 또는 파괴에 의해 유전적으로 변형됨으로써 올리고사카릴트랜스퍼라제(OST) 복합체의 기능적인 촉매분해 소단위를 생산한다. 본 발명의 유전적으로 변형된 자낭균류 사상 진균은 검출가능한 올리고사카릴트랜스퍼라제(OST) 활성을 나타내지 않는다.
용어 "cwh8 유전자"는 돌리칠디포스파타제를 암호화하는 유전자를 지칭한다. CWH8은 다음의 반응을 촉매한다:
돌리칠 디포스페이트 + H2O = 돌리칠 포스페이트 + H+ + 포스페이트
본 발명의 유전적으로 변형된 자낭균류 사상 진균은 cwh8 유전자의 결실 또는 파괴에 의해 유전적으로 변형됨으로써 진균이 기능적 돌리칠디포스파타제를 생산하지 못하도록 한다. 본 발명의 유전적으로 변형된 자낭균류 사상 진균은 검출가능한 돌리칠디포스파타제 활성을 나타내지 않는다.
본원에 정의된 바와 같은 자낭균류 사상 진균은 그룹 페지조마이코티나(Pezizomycotina)에 속하는 임의의 진균 균주를 지칭한다. 페지조마이코티나는 하기 그룹을 포함하나, 이에 한정되지 않는다:
다음의 속(genus)을 포함하는, 소르다리알레스(Sordariales):
써모텔로마이세스(예를 들면, 헤테로탈리카(heterothallica) 및 서모필라(thermophila) 종),
마이셀리오프토라(Myceliophthora)(예를 들면, 루테아(lutea) 종 및 명명되지 않은 종),
코리나스쿠스(Corynascus)(예를 들면, 푸미몬타누스(fumimontanus) 종),
뉴로스포라(Neurospora)(예를 들면, 크라싸(crassa) 종);
다음의 속을 포함하는 하이포크레알레스(Hypocreales):
푸사리움(Fusarium)(예를 들면, 그라미네아룸(graminearum) 및 베네나툼(venenatum) 종),
트리초데르마(Trichoderma)(예를 들면, 레에세이(reesei), 하르지아눔(harzianum), 론기브라치아툼(longibrachiatum) 및 비리데(viride) 종);
다음의 속을 포함하는 오니게날레스(Onygenales):
크리소스포리움(예를 들면, 루크노웬세 종);
다음의 속을 포함하는 유로티알레스(Eurotiales):
라삼소니아(Rasamsonia)(예를 들면, 에메르소니이(emersonii) 종),
페니실리움(Penicillium)(예를 들면, 베르루코숨(verrucosum) 종),
아스퍼길러스(Aspergillus)(예를 들면, 푸니쿨로수스(funiculosus), 니둘란스(nidulans), 니거(niger) 및 오리자에(oryzae) 종),
탈라로마이세스(Talaromyces)(예를 들면, 피니필루스(piniphilus)(이전에 페니실리움 푸니쿨로숨(Penicillium funiculosum) 종).
상기 목록은 결정적인 것이 아닌 것으로 이해되어야 하고, 산업적으로 관련된 사상 자낭균류 진균 종의 불완전 목록을 제공함을 의미한다.
페지조마이코티나(Pezizomycotina) 외의 사상성 자낭?着? 종이 존재할 수 있지만, 이는 가장 일반적으로 공지된 비-사상의 산업적으로 관련된 속, 예를 들면, 사카로마이세스(Saccharomyces), 코마가타엘라(Komagataella)(예를 들면, 이전에 피치아 파스토리스(Pichia pastoris), 클루이베로마이세스(Kluyveromyces) 또는 타프리노마이소티나(Taphrinomycotina)를 함유하고, 이는 다른 일반적으로 공지된 비-사상성의 산업적으로 관련된 속, 예를 들면, 스키조사카로마이세스(Schizosaccharomyces)를 함유한다.
상기 모든 분류학적 범주는 특허 출원일의 NCBI 분류학 브로셔(Taxonomy browser)(ncbi.nlm.nih.gov/taxonomy)에 따라 정의된다.
진균 분류학은 지속적으로 변하고 있으며, 분류군(taxa)의 명명 및 계층적 위치는 앞으로도 변할 수 있음을 인식하여야 한다. 그러나, 당해 분야의 숙련가는 특수한 진균 균주가 상기 정의된 바와 같은 그룹에 속하는 경우를 명확하게 결정할 수 있을 것이다.
특정의 구현예에 따라서, 사상 진균 속은 마이셀로프토라(Myceliophthora), 써모텔로마이세스, 아스퍼길러스, 페니실리움, 트리초데르마(Trichoderma), 라삼소니아(Rasamsonia), 크리소스포리움(Chrysosporium), 코리나스쿠스(Corynascus), 푸사리움(Fusarium), 뉴로스포라(Neurospora), 탈라로마이세스(Talaromyces) 등으로 이루어진 그룹으로부터 선택된다. 일부 구현예에 따라서, 진균은 마이셀리오프토라 써모필라(Myceliophthora thermophila), 써모텔로마이세스 써모틸라( Thermothelomyces thermophila)(이전에, 엠. 써모필라(M. thermophila), 써모텔로마이세스 헤테로탈리카(이전에, 엠. 써모필라(M. thermophila) 및 헤테로탈리카(heterothallica)), 마이셀리오프토라 루테아(Myceliophthora lutea), 아스퍼길러스 니둘란스(Aspergillus nidulans), 아스퍼길러스 푸니쿨로수스(Aspergillus funiculosus), 아스퍼길러스 니거(Aspergillus niger), 아스퍼길러스 오리자에(Aspergillus oryzae), 페니실리움 크리소게눔(Penicillium chrysogenum), 페니실리움 베루코숨(Penicillium verrucosum), 트리초데르마 레에세이(Trichoderma reesei), 트리초데르마 하르지아눔(Trichoderma harzianum), 트리초데르마 론기브라치아툼(Trichoderma longibrachiatum), 트리초데르마 비리데(Trichoderma viride), 크리소스포리움루크노웬세, 라삼소니아 에메르소니이(Rasamsonia emersonii), 스포로트리쿰 써모필레(Sporotrichum thermophile), 코리나스쿠스 푸미몬타누스(Corynascus fumimontanus), 코리나스쿠스 써모필루스(Corynascus thermophilus), 푸사리움 그라미네아룸(Fusarium graminearum), 푸사리움 베네아툼(Fusarium venenatum), 뉴로스포라 크라싸(Neurospora crassa), 및 탈라로마이세스 피니필루스(Talaromyces piniphilus)로 이루어진 그룹으로부터 선택된다.
특히, 본 발명은 다량의 안정한 단백질을 생산할 수 있는, 자낭균류 사상 진균에 대한 모델로서 써모텔로마이세스 헤테로탈리카 균주 C1을 제공한다.
용어 "써모텔로마이세스(Thermothelomyces)" 및 이의 종 "써모텔로마이세스 헤테로탈리카" 및 써모필라(thermophila)는 본원에 공지된 바와 같은 가장 광의적인 영역에서 본원에 사용된다. 속 및 이의 종의 설명은 예를 들면, 마린-펠릭스 와이(Marin-Felix Y)(2015. Mycologica 107(3): 619-632 doi.org/10.3852/14-228) 및 반 덴 브링크 제이(van den Brink J) 등(2012, Fungal Diversity 52(1):197-207)에 기술되어 있다. 본원에 사용된 바와 같은 "C1" 또는 "써모텔로마이세스 헤테로탈리카 C1" 또는 Th. 헤테로탈리카 C1, 또는 C1 모두는 써모텔로마이세스 헤테로탈리카 균주 C1을 지칭한다.
상기 저자(Marin-Felix et al., 2015)는 최적의 성장 온도, 분생자(condiospore)의 형태학, 및 유성 생식 주기(sexual reproduction cycle)에서의 차이를 기반으로 하는 마이셀리오프토라(Myceliophthora) 속의 분할, 및 유성 생식 주기의 세부사항을 제안하였음을 유의한다. 제안된 범주에 따라서, C1은 새로이 확립된 써모텔로마이세스 속에 속하며, 이는 비-열내성 종에 포함되는 것으로 남은, 마이셀로프토라 속 이외의 전자의 열내성 마이셀리오프토라 종을 함유한다. C1은 써모텔로마이세스 써모필라 C1보다는 오히려 써모텔로마이세스 헤테로탈리카 균주 C1으로서 대치되는 접합형(opposite mating type)을 지닌 일부 다른 써모텔로마이세스(이전에는 마이셀리오프토라) 균주와 함께 자낭포자를 형성할 수 있기 때문에, C1은 써모텔로마이세스 써모필라 C1보다는 오히려, 써모텔로마이세스 헤테로탈리카 균주 C1으로 가장 잘 분류된다.
진균 분류학은 또한 과거에 지속적인 변화가 있었으므로, 상기 나열된 현재의 명칭은 현재 동의어로 고려되는, 마이셀리오프토라 써모필라(van Oorschot, 1977. Persoonia 9(3):403) 이상의 다양한 보다 오래된 명칭이 선행될 수 있다는 것을 인식하여야만 한다. 예를 들면, 써모텔로마이세스 헤테로탈리카(Marin-Felix et al., 2015. Mycologica, 3:619-63)는 코리나스쿠스 헤테로트찰리쿠스(Corynascus heterotchallicus), 티엘라비아 헤테로탈리카(Thielavia heterothallica), 크리소스포리움루크노웬세 및 써모필(thermophile) 뿐만 아니라 스포로트리치움 써모필레(Sporotrichium thermophile)와 동의어이다(Alpinis 1963. Nova Hedwigia 5:74).
본 발명은 서열 번호: 29에 대해 99% 이상의 상동성(homology)을 나타내는 리보소옴 DNA(rDNA) 서열을 함유하는 어떠한 균주도 포함함이 또한 명확하게 이해되어야 하며, 모든 이러한 균주는 에 대해 동종(conspecific)인 것으로 고려된다.
특히, 용어 써모텔로마이세스 헤테로탈리카 균주 C1은 야생형 균주로부터 유래된 유전적으로 변형된 서브-균주(sub-strain)을 포함하고, 이는 무작위 또는 직접적인 접근법, 예를 들면, UV 돌연변이유발을 사용하거나, 또는 하나 이상의 내인성 유전자를 결실시킴으로써 돌연변이되어 왔다. 예를 들면, C1 균주는 내인성 프로테아제를 암호화하는 하나 이상의 유전자를 결실하도록 변형된 야생형 균주를 지칭한다. 예를 들면, 본 발명에 포함된 C1 균주는 기탁 번호 제VKM F-3631 D호의 균주 UV18-25; 기탁 번호 제VKM F-3633 D호의 균주 NG7C-19; 및 기탁 번호 제VKM F-3632 D호의 균주 UV13-6를 포함한다. 본 발명의 교시에 따라 사용될 수 있는 추가의 C1 균주는 UV18-100f 기탁 번호 제CBS141147호의 HC 균주; 기탁 번호 제CBS141143호의 HC 균주 UV18-100f; 기탁 번호 제CBS141153호의 LC 균주 W1L#100I; 및 기탁 번호 제CBS141149호의 LC 균주 W1L#100I 및 이의 유도체를 포함한다.
본 발명의 교시는, 써모텔로마이세스 헤테로탈리카 C1 균주의 유도체, 후대세포, 및 클론이 본 발명의 교시에 따라 유전적으로 변형될 때, 본 발명의 교시에 따른 적어도 하나의 단백질 생성물을 생산할 수 있는 한, 써모텔로마이세스 헤테로탈리카 C1 균주의 돌연변이체, 유도체, 후대세포, 및 클론을 포함하는 것으로 명확하게 이해되어야 한다. 본원에 사용된 바와 같은 용어 "후대세포"는 모 진균주(parent fungal line)로부터 변형되지 않거나 부분적으로 변형된 후대세포, 예를 들면, 세포로부터의 세포를 지칭한다. 용어 "모 균주"는 본 발명에 따른 특정 프로테아제의 감소된 발현 또는 활성을 가지지 않는 상응하는 진균 균주를 지칭한다.
본 발명의 출원인에 의해 개발된 수개의 써모텔로마이세스 헤테로탈리카 C1 균주는 통상의 효모 균주 및 또한 대부분의 다른 자낭균류 사상 진균보다 탄소원으로서 성장 배지 속에 존재하는 글루코스 및 다른 발효가능한 당에 의한 피드백 억제(feedback repression)에 대해 덜 민감하며, 결과적으로 보다 높은 탄소원의 공급 율을 견딜 수 있어, 이러한 진균에 의한 높은 수율의 생산을 유도한다.
일부 구현예에 따라서, 진균 성장 배지는 글루코스, 슈크로스, 크실로스, 아라비노스, 갈락토스, 프럭토스, 락토스, 셀로비오스, 글리세롤 및 이의 임의의 조합으로 이루어진 그룹으로부터 선택된 탄소원(carbon source)을 포함한다.
본 발명은 또한 N-글리코실화 변형이 감소되거나 없도록 가공하는 것에 관한 것이다. O-글리칸은 존재할 수 있거나 또는 진균의 추가의 유전적 변형에 의해 제거 또는 변경될 수 있음을 유의한다.
본원에 기술된 바와 같은 용어 "감소된 발현" 또는 "억제된 발현"은 상호교환적으로 사용되며 단백질을 암호화하는 유전자를 결실시키거나 파괴함을 포함하나, 이에 한정되지 않는다.
본원에 기술된 바와 같은 용어 단백질의 "감소된 활성" 또는 "억제된 활성"은 해독 후 변형으로 단백질의 감소되거나 또는 폐지된 활성을 야기하는 것을 포함하나, 이에 한정되지 않는다.
본 발명에 따른 유전적 변형은 유전적으로-변형된 진균이 이의 의도된 용도에 적합한 충분한 속도에서 성장할 수 있도록 하는 것으로 이해되어야 한다.
상기 용어는 또한 야생형 균주로부터 유래된 유전적으로 변형된 서브-균주(sub-strain)를 포함하며, 이는 무작위 또는 직접적인 접근법, 예를 들면, UV 돌연변이유발을 사용하거나, 또는 하나 이상의 내인성 유전자를 결실시킴에 의해 돌연변이되었다.
일반적으로 Th. 헤테로탈리카 진균 및 특히 균주 C1은 적합한 조건에서 성장시키는 경우 효모 균주와 비교하여 보다 높은 생물량(biomass) 생산을 나타낸다. Th. 헤테로탈리카 진균은 다량의 3 차원(3 dimension; 3D) 액체 배양물 뿐만 아니라 고체 배지 속에서 성장할 수 있다. 본 발명의 출원인에 의해 개발된 수개의 균주는 통상의 효모 및 다른 진균과 비교하여 탄소원으로서 진균 성장 배지 속에 존재하는 글루코스 및 다른 발효가능한 당에 의한 피드백 억제에 대해 거의 민감하지 않고, 탄소원의 높은 공급 속도를 견뎌셔 고 수율을 이끌 수 있다. 더욱이, 이러한 균주 중 일부는 비-글루코스 억제된 야생형 Th. 헤테로탈리카 진균 또는 단백질 생산에 사용된 것으로 알려진 다른 사상 진균으로 수득된 고 점도와 비교하여 통상의 발효기 속에서 성장시키는 경우 유의적으로 감소된 배지 점도를 제공한다. 저 밀도는 모 균주(들)에서 길고 높은 긴 및 높은 교차된 균사(interlaced hyphae)를 갖는것으로부터 개발된 균주(들)에서 짧고 거의 교차되지 않은 균사로의 형태학적 변화에 기여할 수 있다. 낮은 배지 점도는 발효기 속에서 대규모 산업적 생산에 매우 유리하다. 예를 들면, 글루코스 억제에 대해 감소된 민감성을 나타내는, 기탁 번호 제VKM F-3631 D의 Th. 헤테로탈리카 C1 균주 UV18-25는 100,000 리터 이상의 용적에서 재조합 효소를 생산하기 위해 산업적으로 성장되었다.
용어 "이종"은, 유전자, 효소, 단백질 또는 펩타이드 서열을 지칭하는 경우, 본원에서 자낭균류 사상 진균에서 천연적으로 발견되거나 발현된 유전자, 효소, 단백질 또는 펩타이드 서열을 설명하기 위해 사용된다.
용어 "내인성"은, 유전자, 효소, 단백질 또는 펩타이드 서열, 예를 들면, 소세포 국재화 신호(subcellular localization signal)를 지칭하는 경우, 자낭균류 사상 진균에 천연적으로 존재하는 유전자, 효소, 단백질 또는 펩타이드 서열을 지칭한다.
용어 "외인성"은 폴리뉴클레오타이드를 지칭하는 경우, 본원에서 형질전환을 통해 자낭균류 사상 진균으로 외인성으로 도입된 합성 폴리뉴클레오타이드를 기술하기 위해 사용된다. 외인성 폴리뉴클레오타이드는 안정하거나 일시적인 방식으로 자낭균류 사상 진균 내에 도입되어 리보핵산(RNA) 분자 및 후속적으로 폴리펩타이드 분자를 생산할 수 있다.
발현 벡터(expression vector)
일부 구현예에 따라서, 본원에 기술된 유전적으로 변형된 자낭균류 사상 진균은 목적한 단백질을 암호화하는 적어도 하나의 외인성 폴리뉴클레오타이드를 포함한다.
목적한 단백질을 암호화하는 폴리뉴클레오타이드는 DNA 작제물(construct) 또는 발현 벡터의 부분을 형성할 수 있다.
용어 "발현 작제물" 및 "DNA 작제물" 또는 "발현 카세트(expression cassette)"는 본원에서 상호교환적으로 사용되며 목적한 단백질을 암호화하는 핵산 서열을 포함하고 조립되어 목적한 단백질이 표적 숙주 세포 내에서 발현되도록 하는 인공적으로 조립되거나 단리된 핵산 분자를 지칭한다. 발현 작제물은 전형적으로 목적한 단백질을 암호화하는 핵산 서열에 작동적으로 연결된 적절한 조절 서열을 포함한다. 발현 작제물은 선택 마커를 암호화하는 핵산 분자를 추가로 포함할 수 있다.
용어 "핵산 서열", "뉴클레오타이드 서열" 및 "폴리뉴클레오타이드"는 본원에서 별개의 단편의 형태 또는 보다 큰 작제물의 구성성분으로서 데옥시리보뉴클레오타이드(DNA), 리보뉴클레오타이드(RNA), 및 이의 변형된 형태의 중합체를 지칭하기 위해 사용된다. 핵산 서열은 암호화 서열, 즉, 세포 내에서 최종 생성물, 예를 들면, 단백질을 암호화하는 서열일 수 있다. 핵산 서열은 또한 예를 들면, 프로모터와 같은, 조절 서열일 수 있다.
용어 "펩타이드", "폴리펩타이드" 및 "단백질"은 본원에서 아미노산 잔기의 중합체를 지칭하기 위해 사용된다. 용어 "펩타이드"는 전형적으로 2 내지 50개의 아미노산으로 이루어진 아미노산 서열을 나타내지만, "단백질"은 50개 이상의 아미노산 잔기로 이루어진 아미노산 서열을 나타낸다.
참고 서열에 대해 "상동성"인 서열(예를 들면, 핵산 서열 및 아미노산 서열)은 본원에서 서열 간의 동일성 퍼센트(identity percent)를 지칭하고, 여기서 동일성 퍼센트는 적어도 75%, 바람직하게는 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%또는 적어도 99%이다. 각각의 가능성은 본 발명의 별개의 구현예를 나타낸다. 본원에 기술된 서열의 동족체는 본 발명 내에 포함된다. 단백질 동족체는 원래의 단백질의 활성을 유지하는 한 포함된다. 상동성 핵산 서열은 코돈 사용 및 유전 코드(genetic code)의 변성과 관련된 변화(variation)를 포함한다. 서열 동일성은 당해 분야에 공지된 바와 같은 뉴클레오타이드/아미노산 서열 비교를 사용하여 측정할 수 있다.
목적한 단백질을 암호화하는 핵산 서열은 발현에 대해 최적화될 수 있다. 이러한 서열 변형의 예는 낭균류 사상 진균에서 전형적으로 발견된 가장 근접한 접근법에 대한 변경된 G/C 함량 및 코돈 최적화로 일반적으로 지칭된, 진균에서 비정형적으로 발견된 코돈의 제거를 포함하나, 이에 한정되지 않는다.
어구 "코돈 최적화(codon optimization)"는 목적한 유기체 내에서 코돈 사용에 접근하는 구조 유전자 또는 이의 단편 내에서 사용하기 위한 적절한 DNA 뉴클레오타이드의 선택, 및/또는 천연 서열의 적어도 하나의 코돈(예컨대, 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 50개 이상의 코돈)을 천연의 아미노산 서열을 유지하면서 이러한 숙주 세포의 유전자에 보다 흔히 또는 가장 흔히 사용된 코돈으로 대체함으로써 목적한 숙주 세포 내에서 향상된 발현시키기 위해 핵산 서열을 변형시키는 공정을 지칭한다. 다양한 종이 특수한 아미노산의 특정 코돈에 대해 특수한 편향(bias)을 나타낸다. 코돈 편향(유기체 사이의 코돈 사용에서의 차이)는 흔히 전령(messenger) RNA(mRNA)의 해독의 효능과 관련되며, 이는 궁극적으로 다른 것들 중에서, 해독되는 코돈의 특성 및 특수한 전달 RNA(tRNA) 분자의 이용가능성에 의존하는 것으로 여겨진다. 세포 내에서 선택된 tRNA의 우위는 일반적으로 단백질 합성에 가장 흔히 사용된 코돈을 반형한다. 따라서, 유전자는 코돈 최적화를 기반으로 주어진 유기체에서 최적의 유전자 발현을 위해 조절(tailor)될 수 있다. 따라서, 최적화된 유전자 또는 핵산 서열은 천연의 또는 천연적으로 발생하는 유전자의 뉴클레오타이드 서열이 변형되어 유기체 내에서 통계적으로 바람직하거나 통계적으로 선호된 코돈을 활용하도록 하는 유전자를 지칭한다.
용어 "조절 서열(regulatory sequence)"은 암호화 서열, 예를 들면, 프로모터 및 터미네이터(terminator)의 발현(전사)를 제어하는 DNA 서열을 지칭한다.
용어 "프로모터"는 생체 내(in vivo) 또는 시험관 내(in vitro)에서 다른 DNA 서열의 전사를 제어하거나 지시하는 조절성 DNA 서열에 관한 것이다. 일반적으로, 프로모터는 전사된 서열의 5' 영역 내에 위치(즉, 앞에, 상부(upstream)에 위치)한다. 프로모터는 천연 공급원으로부터의 이의 실체로부터 유래될 수 있거나, 천연에서 발견된 상이한 프로모터로부터 유래된 상이한 성분으로 구성될 수 있거나, 또는 심지어 합성 뉴클레오타이드 분절을 포함할 수 있다. 프로모터는 구성적이거나(즉, 프로모터 활성화는 유도제에 의해 조절되지 않으므로 전사 속도는 일정하다), 또는 유도성이다(즉, 프로모터 활성화는 유도제에 의해 조절된다). 대부분의 경우에서 조절 서열의 정확한 경계부는 완전히 정의되지 않았으며, 일부 경우는 완전히 정의될 수 없으므로, 일부 변이의 DNA 서열은 동일한 프로모터 활성을 가질 수 있다.
용어 "터미네이터"는 전사 종결을 조절하는 다른 조절 DNA 서열에 관한 것이다. 터미네이터 서열은 전사될 핵산 서열의 3' 말단에 작동적으로 연결된다.
일부 구현예에 따라서, 사상 진균은 써모텔로마이세스 헤테로탈리카이고 목적한 단백질은 써모텔로마이세스 헤테로탈리카의 조절 성분을 갖는 작제물에서 발현된다. 특정 구현예에 따라서, 목적한 단백질을 발현하는 작제물은 써모텔로마이세스 헤테로탈리카 프로모터 및/또는 써모텔로마이세스 헤테로탈리카 터미네이터를 포함한다.
용어 "써모텔로마이세스 헤테로탈리카 프로모터" 및 "써모텔로마이세스 헤테로탈리카 터미네이터"는 써모텔로마이세스 헤테로탈리카에서 유전자 발현을 지시할 수 있는 써모텔로마이세스 헤테로탈리카에서 사용하기에 적합한 프로모터 및 터미네이터 서열을 나타낸다. 일부 특수한 구현예에서, C1 프로모터 및 C1 터미네이터가 사용되며, 이는 C1에서 유전자 발현을 지시할 수 있는 프로모터 및 터미네이터 서열을 나타낸다.
일부 구현예에 따라서, 써모텔로마이세스 헤테로탈리카 프로모터/터미네이터는 써모텔로마이세스 헤테로탈리카의 내인성 유전자로부터 유래된다. 다른 구현예에 따라서, 써모텔로마이세스 헤테로탈리카 프로모터/터미네이터는 써모텔로마이세스 헤테로탈리카에 대해 외인성인 유전자로부터 유래된다.
적합한 구성적 프로모터 및 터미네이터는 예를 들면, C1 당분해 유전자, 예를 들면, 포스포글리세레이트 키나제 유전자(phosphoglycerate kinase gene; PGK)(Uniprot: G2QLD8, NCBI 참고 서열: XM_003665967), 글리세르알데하이드 3-포스페이트 데하이드로게나제(GPD)(Uniprot: G2QPQ8, NCBI 참고 서열: XM_003666768), 포스포프럭토키나제(PFK)(Uniprot: G2Q605, NCBI 참고 서열: XM_003659879); 또는 β-글루코시다제 1 유전자 bgl1(수탁 번호: XM_003662656); 또는 트리오스 포스페이트 이소머라제(TPI)(Uniprot: G2QBR0, NCBI 참고 서열: XM_003663200); 또는 액틴(ACT)(Uniprot: G2Q7Q5, NCBI 참고 서열: XM_003662111);또는 C1 cbh1 프로모터(GenBank AX284115)또는 C1 chi1 프로모터(GenBank HI550986)의 것을 포함한다. 사용될 수 있는 추가의 프로모터는 아스퍼길러스 나둘란스(Aspergillus nidulans) gpdA 프로모터; 및 Rantasalo et al. (2018 NAR 46(18):e111)에 기술된 합성 프로모터이다. 예시적인 터미네이터로서, C1 키티나제 1 유전자 chi1(GenBank HI550986), 셀로비오하이드롤라제 1 cbh1(GenBank AX284115)의 터미네이터, 또는 효모 adh1 터미네이터가 사용될 수 있다.
용어 "작동적으로 연결된"은 선택된 핵산 서열이 조절 성분(프로모터 또는 터미네이터)에 근접하여 존재함으로써 선택된 핵산 서열의 발현을 조절하도록 함을 의미한다.
본 발명의 일부 구현예에 따른 발현 작제물은 단백질을 암호화하는 핵산 서열에 작동적으로 연결된 써모텔로마이세스 헤테로탈리카 프로모터 서열 및 써모텔로마이세스 헤테로탈리카 터미네이터 서열을 포함한다. 일부 특수한 구현예에서, 본 발명의 발현 작제물은 효소를 암호화하는 핵산 서열에 작동적으로 연결된 C1 프로모터 서열 및 C1 터미네이터 서열을 포함한다.
특수한 발현 작제물은 다양한 상이한 방법, 예를 들면, 통상의 분자 생물학 방법, 예를 들면, 폴리머라제 쇄 반응(polymerase chain reaction; PCR), 제한 엔도뉴클레아제 분해, 시험관 내 및 생체 내 조립 방법 뿐만 아니라, 유전자 합성 방법에 의해 조립될 수 있다. 예시적인 발현 작제물 및 이의 작제 방법은 하기 실시예 단락에서 제공된다.
stt3
및/또는
cwh8
유전자의 결실
유전자 결실 기술은 유전자의 부분적인 또는 완전한 제거에 의해 이의 발현을 제거하는 것을 가능하도록 한다. 이러한 방법에서, 유전자의 결실은 유전자를 플랭킹(flanking)하는 5' 및 3' 영역을 연속적으로 함유하도록 작제된 플라스미드를 사용한 동종 재조합에 의해 달성될 수 있다.
유전자 결실은 또한 유전자를 본원에서 또한 결실 작제물로 명명된 파괴 핵산 작제물(disruptive nucleic acid construct) 내로 삽입함으써 수행될 수 있다. 파괴 작제물은 단순히 유전자에 대해 상동성인 5' 및 3' 영역이 동반하는 선택가능한 마커 유전자일 수 있다. 선택가능한 마커는 파괴된 유전자를 함유하는 형질전환체의 확인을 가능하도록 한다. 대안적으로 또는 추가로, 파괴 핵산 작제물은 숙주 세포 내에 존재할 이종 단백질을 암호화하는 하나 이상의 폴리뉴클레오타이드를 포함할 수 있다.
stt3 및 cwh8에 대한 예시적인 결실 작제물 및 결실을 수반하는 과정은 하기 실시예 단락에서 제공된다. 본원에 기술된 바와 같이, stt3 및 cwh8 유전자는 하기 실시예 1에 나타낸 바와 같이, 선택가능한 마커를 포함하는 파괴 작제물을 사용하여 결실된다.
결실(들)은 파괴 작제물(들)을 플랭킹(flanking)하는 적절한 프로모터를 지닌 PCR을 사용하여 확인될 수 있다.
유전적으로 가공된 써모텔로마이세스 헤테로탈리카
본 발명에 따르 N-연결된 글리칸이 감소되어 있거나 없는 단백질을 생산하도록 유전적으로 가공된 써모텔로마이세스 헤테로탈리카 세포는 써모텔로마이세스 헤테로탈리카의 2개의 내인성 유전자, stt3 및 cwh8 중 적어도 하나를 변형, 예를 들면 결실시킴으로써 유전자가 기능성 단백질을 생산하지 못하도록 함에 의해 생성된다.
내인성 유전자의 결실은 상기 기술되어 있고 또한 하기 실시예 단락에 입증되어 있다.
여전히 다른 양태에 따라서, 본 발명은 외인성 단백질을 생산하는 방법을 제공하며, 이러한 방법은 유전적으로 변형된 진균, 특히 본 발명의 써모텔로마이세스 헤테로탈리카 C1 진균을 적합한 배지 속에서 배양하는 단계; 및 단백질 생성물을 회수하는 단계를 포함한다.
특정의 구현예에 따라서, 배지는 글루코스, 슈크로스, 크실로스, 아라비노스, 갈락토스, 프럭토스, 락토스, 셀로비오스, 및 글리세롤로 이루어진 그룹으로부터 선택된 탄소원을 포함한다. 특정의 구현예에 따라서, 탄소원은 에탄올 생산 또는 전분, 사탕무 및 사탕 수수, 예를 들면, 발효가능한 당을 포함하는 당밀, 전분, 중합성 탄수화물, 예를 들면, 셀룰로스 및 헤미셀룰로스를 포함하는 리그노셀룰로스성 생물량으로부터의 다른 생물생성(bioproduction)으로부터 수득된 폐기물이다.
일부 구현예에 따라서, 외인성 단백질은 진균 성장 배지로부터 정제된다.
다른 구현예에 따라서, 외인성 단백질은 진균 덩어리(fungal mass)로부터 추출된다. 영양 조직(vegetative tissue)으로부터 단백질을 추출 및 정제하기 위해 당해 분야에 공지된 바와 같은 어떠한 방법도 사용될 수 있다.
추가의 양태에 따라서, 본 발명은 유전적으로 변형된 진균, 특히 본 발명의 유전적으로 변형된 써모텔로마이세스 헤테로탈리카 C1에 의해 생산된 외인성 단백질을 제공한다.
외인성 폴리뉴클레오타이드의 발현은 진균 세포, 특히 핵 내로 진균 내에서 발현될 단백질을 암호화하는 핵산을 포함하는 발현 작제물을 도입시킴으로써 수행된다. 특히, 본 발명에 따른 유전적 변형은 숙주 게놈으로 발현 작제물의 혼입을 의미한다.
진균 세포 내로 발현 작제물의 도입, 즉, 진균의 형질감염은 예를 들면, 하기 실시예 단락에 기술된 원형질 형질전환 방법을 사용하여, 당해 분야에 공지된 방법으로 수행할 수 있다.
형질전환된 세포의 용이한 선택을 촉진하기 위해, 선택 마커(selection marker)를 진균 세포 내로 형질전환시킬 수 있다. "선택 마커"는 형질전환되지 않은 세포 속에 존재하지 않는 특정 유형의 표현형, 예를 들면, 항생제 내성(내성 마커), 특정의 자원(resource)(활용/영양요구성 마커)를 활용하는 능력 또는 예컨대, 스펙트럼 측정에 의해 검출될 수 있는 리포터 단백질의 발현을 부여하는 유전자 생성물을 암호화하는 폴리뉴클레오타이드를 나타낸다. 영양요구성 마커는 전형적으로 식품 또는 약제 산업에서 선택 수단으로서 바람직하다. 선택 마커는 발현 작제물로 공-형질전환된 별개의 폴리뉴클레오타이드 상에, 또는 발현 작제물의 동일한 폴리뉴클레오탕드 상에 존재할 수 있다. 형질전환 후, 양성 형질전환체는 세포를 예컨대, 선택된 선택 마커에 따른 선택 배지에서 배양함으로써 선택된다. 일부 경우에, 분할 마커 시스템(split marker system)이 사용되며, 여기서 선택 마커는 2개의 플라스미드로 분할되고 기능성 선택 마커는 2개의 플라스미드가 공-형질전환되어 동종 재조합을 통해 함께 연결되는 경우에만 형성된다.
서열의 목록
다음의 실시예는 본 발명의 특정의 구현예를 보다 충분히 나열하기 위해 제시된다. 그러나, 이는 어떠한 방식으로도 본 발명의 광범위한 영역을 제한하는 것으로 고려되지 않아야 한다. 당해 분야의 숙련가는 본 발명의 영역으로부터 벗어니지 않고 본원에 개시된 원리의 많은 변화 및 변형을 용이하게 고안할 수 있다.
실시예
실시예 1 - C1
stt3
및
cwh8
유전자의 결실
C1에서 분비된 단백질의 N-글리코실화를 감소시키거나 제거하기 위하여, 돌리칠-디포스포-올리고사카라이드 단백질 글리코실트랜스퍼라제 촉매 소단위 STT3 및 돌리칠디포스파타제 CWH8를 암호화하는 유전자를 결실시켰다. STT3은 다량체성 올리고사카릴트랜스퍼라제(OST) 복합체의 소단위이고 복합체의 촉매 활성에 필수적이다(Zufferey et al. 1995, EMBO Journal 14, 4949-4960). OST 복합체는 지질 담체 돌리칠피로포스페이트로부터 폴리펩타이드 쇄의 선택된 아스파라긴 잔기의 이전을 촉매한다. 돌리칠피로포스페이트 포스파타제 CWH8는 액체 담체 돌리칠피로포스페이트의 재순환에 포함되는 것으로 간주된다. CWH8은 세포의 생존에 필수적이지 않지만 상응하는 유전자의 결실은 N-글리코실화 결함을 야기한다(van Berkel et al. 1999, Glycobiology 9, 243-253).
결실은 stt3 및 cwh8 결실 작제물을 개별적으로(1개의 결실/균주) C1 내로 형질전환시킴으로써 수행하였다. stt3 또는 cwh8를 결실시키기 위한 DNA 작제물은 2개의 별개의 플라스미드로 작제되었다. 5' 아암(arm) 플라스미드는 통합을 위해 stt3/cwh8 5' 플랭킹 영역 단편 및 pyr4 마커 유전자의 처음 1/2을 함유하였다. 3' 아암 플라스미드는 pyr4 마커의 두번째 1/2 및 통합을 위한 stt3/cwh8 3' 플랭킹 영역 단편을 함유하였다. 이러한 2개의 플라스미드내 pyr4 마커 단편은 서로 오버랩되어 있다. 2개의 플라스미드의 C1으로의 형질전환 동안, 5' 및 3' 플랭킹 영역 단편은 결실된 유전자의 양쪽 측면에서 게놈 DNA와 재조합되므로 동시에 플라스미드 사이에서 동종 재조합(homologous recombination)을 겪는다. 선택 마커 단편 사이의 재조합은 마커 유전자가 기능성이 되도록 하는데 필수적이므로 형질전환체가 선택 하에 성장할 수 있도록 한다. 5' 플랭킹 영역의 말단으로부터 대략 500 bp는 마커의 두번째 1/2 이후에 가해져서 필요한 경우, 마커 유전자를 루핑 아웃(looping out)시킬 수 있다. stt3 및 cwh8 5' 및 3' 아암 벡터의 상이한 단편은 C1 게놈 DNA로부터 증폭되고 효모 재조합 클로닝에 의해 마커 유전자와 함께 골격 벡터(pRS426) 내로 클로닝시켰다(Colot et al. 2006, PNAS 103, 10352-10357).
stt3 결실 작제물의 5' 아암은 서열 번호: 1에 제시되어 있다. 5' 플랭크 서열(flank sequence)은 서열 번호: 1의 1 내지 930번 위치에 상응하고 pyr4 마커 유전자의 처음 1/2은 서열 번호: 1의 938 내지 2,717번 위치에 상응한다. stt3 결실 작제물의 3' 아암은 서열 번호: 2에 제시되어 있다. pyr4 마커 유전자의 두번째 1/2은 서열 번호 1 내지 1,257번 위치에 상응한다. 직접적인 반복 서열은 서열 번호: 2의 1,266 내지 1,777번 위치에 상응한다. 3' 플랭킹 서열을 서열 번호: 1,785 내지 2,715번 위치에 상응한다.
cwh8 결실 작제물의 5' 아암은 서열 번호: 3에 제시되어 있다. 5' 플랭크 서열은 서열 번호: 3의 1 내지 1,000번 위치에 상응하고 pyr4 m마커 유전자의 처음 1/2은 서열 번호: 3의 1,008 내지 2,787번 위치에 상응한다. cwh8 결실 작제물의 3' 아암은 서열 번호: 4에 제시되어 있다. pyr4 마커 유전자의 두번째 1/2은 서열 번호: 4의 1 내지 1,257번 위치에 상응한다. 직접적인 반복 서열은 서열 번호: 4의 1,266 내지 1,765번 위치에 상응한다. 3' 플랭킹 서열은 서열 번호: 4의 1,774 내지 2,973번 위치에 상응한다.
stt3/cwh8 결실 작제물의 아암 둘 다는 플라스미드 골격으로부터 절개되어 프로테아제 유전자의 9개의 결실을 갖는 C1 균주 DNL132 내로 동시에 형질전환된다. 하나의 5' 아암 벡터 및 3' 아암 벡터의 쌍은 각각의 형질전환에서 사용되었다.
선택 배지 플레이트에서 성장하는 형질전환 콜로니는 선택 배지에서 스트리킹(streaking)으로서 배양하였다. 결실 작제물이 정확하게 통합된 형질전환체의 확인은 PCR로 수행하였다. 형질전환체 스트리킹으로부터의 균사체를 20 mM의 NaOH 속에 용해하고 100℃에서 항온처리하여 세포를 분해하였다. 1 내지 2 ㎕의 이러한 분해물을 Phire Plant PCR kitTM(Thermo Fisher)를 사용한 PCR용 주형으로서 사용하였다. 사용된 올리고뉴클레오타이드 프라이머는 표 1에 나타낸다.
결실 작제물의 stt3 유전자자리(locus)로의 통합은 2개의 PCR 반응에 의해 입증되었다. 유전자의 5' 말단에서 통합은 서열 번호: 5 및 서열 번호: 6에 제시된 프라이머 세트와의 반응에 의해 입증되었다. 1152 bp의 단편의 증폭은 유전자의 5' 말단에서 stt3 유전자자리로의 성공적인 통합을 나타내었다. stt3의 3' 말단에서 통합은 서열 번호: 7 및 서열 번호: 8에 제시된 프라이모로 입증되었다. 1752 bp 단편의 증폭은 유전자의 3' 말단에서 stt3 유전자자리로의 성공적인 통합을 나타내었다. stt3 유전자자리로의 통합에 대해 양성인 형질전환체는 서열 번호: 9 및 서열 번호: 10에 제시된 프라이머 및 서열 번호: 11 및 서열 번호: 12에 제시된 프라이머를 사용한 정량적 PCR에 의해 추가로 분석하여 stt3 유전자가 이로부터 완전히 결실되었음을 입증하였다. stt3 유전자자리로의 작제물의 통합에 대해 양성이고 stt3 유전자의 존재에 대해 음성인, 형질전환체 C1 균주를 -80℃에서 저장하고 균주 번호 M3210으로 제공하였다.
결실 작제물의 cwh8 유전자자리로의 통합은 2개의 PCR 반응에 의해 입증되었다. 유전자의 5' 말단에서의 통합은 서열 번호: 13 및 서열 번호: 6에 제시된 프라이머를 사용한 반응에 의해 입증되었다. 1243 bp 단편의 증폭은 유전자의 5' 말단에서 cwh8 유전자자리의 성공적인 통합을 나타내었다. 유전자의 3' 말단에서 통합은 서열 번호: 14 및 서열 번호: 8에 제시된 프라이머를 사용하여 입증하였다. 2009 bp 단편의 증폭은 유전자의 3' 말단에서 cwh8 유전자자리로의 성공적인 통합을 나타내었다. cwh8 유전자자리로의 통합에 대해 양성인 형질전환체를 서열 번호: 15 및 서열 번호: 18에 제시된 프라이머 및 서열 번호: 17 및 서열 번호: 18에 제시된 프라이머를 사용하는 정량적 PCR에 의해 추가로 분석함으로써 cwh8 유전자가 이들로부터 완전히 결실되었음을 입증하였다. 유전자자리 내로의 작제물의 통합에 대해 양성이고 cwh8 유전자자리 내로의 작제물의 통합에 대해 양성이고 cwh8 유전자의 존재에 대해 음성인, 형질전환체 C1 균주를 -80℃에서 저장하고 균주 번호 M3211로 제공하였다.
[표 1]
M3210 및 M3211 균주를 1 L의 생물반응기 속에서 공급-배치 공정(fed-batch process)으로 효모 추출물 및 탕소원으로서 글루코스를 함유하는 배지 속에서 7일 동안 배양하였다. 7일째로부터의 상층액 샘플을 13 500 rpm, 15분으로 3회 원심분리하고, 상층액 속에 존재하는 총 단백질로부터의 글리칸 분석을 GlycoWorksTM RapiFluor-MSTM N-글리칸 키트(Waters)를 사용하여 제조업자의 프로토콜에 따라 수행하였다. 9개의 프로테아제 결실을 지닌 균주 M2864를 N-글리칸 분석에서 대조군으로서 사용하였다. N-글리칸은 stt3 결실 균주의 배양 상층액으로부터 검출될 수 있었지만 대조군 균주는 정상적인 C1 글리칸 패턴을 나타내었다(도 2a 및 2b). cwh8 결실 균주의 배양물 상층액으로부터 검출된 N-글리칸은 양은 대조군 균주의 N-글리칸 양의 대략 10%이었다(도 3a 및 3b).
실시예 2 - 균주 M3210 및 M3211에서 모노클로날 항체의 생산
N-글리코실화되지 않고 N-글리코실화가 감소된 모노클로날 항체의 생산을 입증하기 위하여, 치료학적 항체 니볼루맙의 중쇄 및 경쇄를 stt3 또는 cwh8 결실 각각을 갖는 M3210 및 M3211 균주 내에서 발현시켰다.
발현 카세트를 실시예 1에 설명된 바와 같이 2개의 별개의 플라스미드 내로 2개 부분으로 작제하였다. 작제물의 5' 아암은 통합을 위한 cbh1 5' 플랭킹 영역, C1 CBH1 신호 서열에 융합된 니볼루맙 경쇄 유전자가 bgl8 프로모터 및 bgl8 터미네이터 사이에 융합된 발현 카세트, nia1 마커 유전자 및 하이그로마이신 마커 유전자의 처음 1/2을 함유하였다. 작제물의 3' 아암은 하이그로마이신 마커의 마지막 1/2, bgl8 터미네이터로부터의 직접적인 반복 서열, C1으로부터의 CBH1 신호 서열에 융합된 니볼루맙 중쇄 유전자가 bgl8 프로모터와 chi1 터미네이터 사이에 존재하는 발현 카세트, 및 통합을 위한 cbh1 3' 플랭킹 영역을 함유하였다.
니볼루맙 발현 카세트의 5' 아암은 서열 번호: 19에 제시된다. cbh1 5' 플랭크 서열은 서열 번호: 19의 1 내지 1,957번 위치에 상응한다. bgl8 프로모터 서열은 서열 번호: 19의 1,966 내지 3,357번 위치에 상응한다. C1 CBH1 신호 서열에 융합된 경쇄를 암호화하는 서열은 서열 번호: 19의 3,358 내지 4,053번 위치에 상응하고, 여기서 3,358 내지 3,408번 위치는 CBH1 신호 서열을 암호화하고 3,409 내지 4,053번 위치는 경쇄를 암호화한다. 이러한 서열은 C1에 대한 사람 경쇄 유전자를 코돈-최적화하고, Geenscript로 합성함으로써 수득하였다. 합성된 서열은 bgl8 프로모터 및 터미네이터를 위한 40 bp의 프랭크를 함유하였다. bgl8 터미네이터 서열은 서열 번호: 19의 4,054 내지 4,520번 위치에 상응한다. nia1 마커 유전자는 서열 번호: 19의 4,537 내지 8,651번 위치에 상응한다. 하이그로마이신 마커 유전자의 처음 1/2은 서열 번호: 19의 8,660 내지 10,360번 위치에 상응한다. 상기 기술된 단편 및 골격 벡터 pRS426를 깁슨 조립(Gibson assembly)을 함께 조립하여 5' 아암 벡터를 수득하였다.
니볼루맙 발현 작제물의 3' 아암은 서열 번호: 20으로 제시된다. 하이그로마이신 마커 유전자의 1/2은 서열 번호: 20의 1 내지 1,732번 위치에 상응한다. chi1 터미네이터 서열은 서열 번호: 20의 2,082 내지 2,727번 위치에 상응한다. C1 CBH1 신호 서열에 융합된 경쇄를 암호화하는 서열은 서열 번호: 20의 2,736 내지 4,109번 위치에 상응하고 여기서 4,059 내지 4,109번 위치는 CBH1 신호 서열을 암호화하고 2,736 내지 4,058번 위치는 중쇄를 암호화한다. 이러한 서열은 C1에 대한 사람 중쇄를 코돈-최적화하고, Genscript로 합성함으로써 수득하였다. 이는 bgl8 프로모터 및 chi1 터미네이터를 위한 40 bp 플랭크를 포함한다. bgl8 프로모터 서열은 서열 번호: 20의 4,110 내지 5,501번 위치에 상응한다. 3' 플랭크 서열은 서열 번호: 20의 5,510 내지 6,266번 위치에 상응한다. 상술된 단편 및 골격 벡터 pRS426는 깁슨 조립에 의해 함께 조립하여 3' 아암 벡터를 수득하였다.
니볼루맙 발현 플라스미드의 stt3 또는 cwh8 결실 각각을 수반하는 M3210 및 M3211 균주 내로의 형질전환, 및 형질전환체의 선택은 50 mg/l의 하이그로마이신을 함유하는 선택 배지에서 수행하였다. 형질전환체를 PCR로 스크리닝(screening)하여 클론을 발견하였고, 여기서 cbh1 유전자는 작제물에 의해 대체되었다. 스크리닝을 위해 사용된 프라이머는 표 2에 나타낸다. 서열 번호: 21 및 서열 번호: 22로 제시된 프라이머를 사용하여 정확한 통합이 cbh1 유전자의 5' 말단에서 일어났음을 입증하였다. 3592 bp 단편의 증폭은 유전자의 5' 말단에서 cbh1 유전자자리로의 성공적인 통합을 나타내었다. 서열 번호: 23 및 서열 번호: 24로서 제시된 프라이머를 사용하여 cbh1 유전자의 3' 말단에서 정확한 통합을 입증하였다. 1477 bp 단편의 증폭은 유전자의 3' 말단에서 cbh1 유전자자리로의 성공적인 통합을 나타내었다. 프라이머 서열 번호: 25 및 서열 번호: 26을 사용하여 cbh1 개방 판독 프레임(open reading frame)으로부터 500 bp 단편의 증폭이 없음을 입증함으로써 cbh1 유전자의 완전한 결실을 입증하였다.
[표 2]
작제된 C1 균주를 24-웰 플레이트 속에서 실시예 1에서와 같은 액체 배지 속에서 성장시켰다. 균사체를 250 ㎕의 샘플을 0.65 ㎛ MultiScreen 여과기 플레이트(Merck Millipore)를 통해 3500 RPM에서 10분 동안 원심분리하여 제거하여다. 형질전환체에 의한 니볼루맙의 생산을 웨스턴 블롯 분석(Western blot analysis)으로 확인하였다. 니볼루맙을 생산하는 것으로 밝혀진 형질전환체를 다음과 같이 선택 배지 플레이트 상에서 단일 콜로니 플레이팅(plating)을 통해 정제하였다. 스트리크(streak)으로부터의 균사체를 800 ㎕의 0.9 % NaCl - 0.025% 트윈(Tween) 20 용액 속에 현탁시켰다. 단일 콜로니를 0.9% NaCl - 0.025% 트윈 20 용액에 현탁액의 상이한 희석물을 제조하고 선택 배지 상에 100 ㎕의 희석물을 플레이팅함으로써 제조하였다. 정제된 형질전환체에 의한 니볼루맙의 생산을 실시예 1에서와 같이 수행된 24-웰 플레이트 배양에 이은 웨스턴 블롯 분석으로 입증하였다.
cbh1 유전자자리내로의 발현 작제물의 통합에 대해 양성이고 니볼루맙 중쇄 및 경쇄를 생산하는 stt3 결실 균주 M3210의 정제된 형질전환체를 -80℃에서 저장하고 균주 번호 M3480을 지정하였다. 발현 작제물의 cbh1 유전자자리내로의 통합에 대해 양성이고 니볼루맙의 중쇄 및 경쇄 둘 다를 생산하는, cwh8 결실 균주 M3211의 형질전환체를 -80℃에서 저장하고 균주 번호 M3481을 제공하였다.
균주 M3480 및 M3481을 1 L의 생물반응기 속에서 공급-배치 공정으로 효모 추출물 및 탄소원으로서 글루코스를 함유하는 배지 속에서 7일 동안 성장시켰다. 균주에 의해 생산된 니볼루맙을 1 ml의 MabSelect SuRe 단백질 A 컬럼(GE Healthcare)을 통해 단백질 정제 시스템(GE Healthcare)을 사용하여 정제하였다. 정제된 항체로부터의 글리칸 분석을 GlycoWorksTM RapiFluor-MSTM N-글리칸 키트(Waters)를 사용하여 제조업자의 프로토콜에 따라 수행하였다. 비-글리코 변형된 균주 M3242의 발효 상층액으로부터 정제된 니볼루맙을 글리칸 분석에서 대조군으로서 사용하였다. N-글리칸은 m3480 배양 상층액으로부터 정제된 니볼루맙으로부터 검출될 수 없었지만 대조군 균주로부터 정제된 니볼루맙은 정상적인 c1 글리칸 패턴을 나타내었다(도 4a 및 4b). cwh8 결실 균주 M3481 배양 상층액으로부터 정제된 니볼루맙으로부터의 N-글리칸의 양은 대조군 균주로부터 정제된 니볼루맙의 N-글리칸 양의 대략 11%이었다(도 5a 및 5b).
정제된 니볼루맙에 대한 펩타이드 맵핑(mapping)을 다음의 방법에 따라 수행하였다. 100 ㎍의 샘플은 50 mM 중탄산암모늄으로 Vivaspin 500(10,000 MWCO, PES, Sartorius)에 의해 3회 교환한 제1의 완충제이었다. 라피게스트(Rapigest) SF(Waters)를 0.1%의 최종 농도로 및 디티오트레이톨(DTT)을 5 mM의 최종 농도로 가하였다. 샘플을 60℃에서 40분 동안 항온처리하였다. 다음에, 요오도아세트아미드(IAM)를 15 mM의 최종 농도로 가하고 샘플을 실온에서 40분 동안 암실에서 항온처리하였다. 트립신(Promega) 용액을 각각의 샘플에 1:50(w/w)의 최종 프로테아제:단백질 비 또는 또는 50 ㎍의 단백질에 대해 1 ㎕ 트립신(1 ㎍/ml)의 비로 가하였다. 샘플을 37℃에서 밤새 항온처리하였다. 4 ㎕의 20% TFA를 가하여 반응을 중지시킨 후 샘플을 30분 동안 37℃에서 항온처리하고 5분 동안 10000 rpm에서 원심분리하였다. 최종적으로, 샘플을 SpeedVac으로 증발시키고 50 ㎕ Water/AcCN/TFA 20/80/0.1(v/v/v) 속에 재구성시켰다. 다음의 LC-MS 조건을 사용하였다: Acquity UHPLC system, Waters(Milford, 미국 매사추세츠주) 및 Waters Synapt G2-S MS 시스템(Milford, 미국 매사추세츠 주). 컬럼: 60℃에서 ACQUITY UPLC 당단백질 아미드 300A, 1.7um, 2.1x150mm(Waters). 용매: A 수 중 0.1% TFA 및 B 아세토니트릴 중 0.1% TFA. 구배 프로그램: 10% A로 0분, 50% A로 70분, 유동 속도 0.2 ml/min. 상용된 질량 분광법 매개변수는 25 V의 원뿔 전압(cone voltage) 및 3 kV의 모세관 전압(capillary voltage)을 사용하는 양성의 극성, 350℃의 탈용매화 온도, 및 120℃의 공급원 온도이었다. 데이타를 m/z 범위 50 내지 2000에서 MSE 방식으로 에너지 램프(energy ramp) 25 내지 40 V를 사용하여 수집하였다. 데이타는 UNIFI 소프트웨어(Waters)를 사용하여 가공하였다.
당변형되지 않은 균주 M3242의 발효 상층액으로부터 정제된 니볼루맙을 펩타이드 맵핑 분석에서 대조군으로서 사용하였다. 펩타이드 맵핑 결과에 따르면, stt3 결실 균주 M3480에서 생산된 니볼루맙의 중쇄에 부착된 N-글리칸은 존재하지 않는다(표 3). N-글리코실화의 26.6% 만이 cwh8 결실 균주 M3481에서 생산된 니볼루맙의 중쇄로부터 검출된 반면(표 4) N-글리코실화의 95.8%는 당변형되지 않은 C1 균주 M3242내에서 생산된 니볼루맙의 중쇄로부터 검출되었다(표 5).
[표 3]
stt3 결실 균주 M3480에서 생산된 니볼루맙의 N-글리코실화를 지닌 펩타이드의 펩타이드 맵핑 결과
[표 4]
[표 5]
구체적인 구현예의 앞서의 설명은 본 발명의 일반적인 특성을 충분히 나타낼 것이므로, 다른 것을 현재의 지식을 적용하여 과도한 실험없이 및 일반적인 개념으로부터 벗어나지 않고 이러한 구체적인 구현예를 용이하게 변형시키고/시키거나 다양한 적용을 위해 개조할 수 있으므로, 이러한 개조 및 변형은 개시된 구현예의 등가물의 의미 및 범위 내에서 이해되는 것으로 의도된다. 본원에 사용된 어법 또는 전문용어는 설명의 목적이며 제한하는 것이 아님이 이해되어야 한다. 다양한 개시된 화학 구조 및 기능을 수행하기 위한 수단, 물질, 및 단계는 본 발명으로부터 벗어나지 않고 다양한 대안적인 형태를 취할 수 있다.
SEQUENCE LISTING
<110> DYADIC INTERNATIONAL (USA), INC.
<120> GENETICALLY-MODIFIED FILAMENTOUS FUNGI FOR PRODUCTION OF
EXOGENOUS PROTEINS HAVING REDUCED OR NO N-LINKED GLYCOSYLATION
<130> DYD/006 PCT
<150> US 63/159492
<151> 2021-03-11
<160> 29
<170> PatentIn version 3.5
<210> 1
<211> 8247
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleic acids
<400> 1
aggcgttttc gtgggtaatg ggatggttgt atctaggggc actcctggcg cggtttataa 60
aaacatttgg cactcaacac attgcatcat cccgggaatt ctgcttcagg gtttggggtg 120
ttatacgagg tcaatgattt ctcggtcccg gcttggtatc tataccactg ccgaatgaaa 180
gcgctgcgct gaacacccag cctcagacca ggccctcgtt ggtgatctac atccggtgat 240
gattgctggg attgtgtgcc ggcaattggg cctcgaccgc gtccagtgat ggatcagtga 300
acccagtcgc gagcgggttc gtagttcacc ttataccccg cctgagatat gatacagtta 360
cccaaagcca gggcgttcta ggtttgctcc atccgcgatc tgatgtgata gatccgtgcc 420
ccacacaatc gccaagagtc ccatcagatc aatggatctc tgttttccca aggttatgca 480
catatatatg gtcatggacc tggtgataga tccatcaaca tgagttgttt cgcagttctc 540
cgggagttac gcctcgcgga tcttcttaat cccagatctc tccctctgta tctttcggcc 600
tctgcattgc cacccctata cgaagtattg gaccctttgt actgcgtacg gatttggttt 660
tctgctcttt ctttggcccc tccaactttc tacatattaa tcggacttct gccgggcggt 720
gaagcgttga gcaacgaggc tgagtgggtc ttgggcgcga atcaagcatg ccaaggcgga 780
cccctggagc attccactcc agttgcatgc agaagctcca aactgtcctc tccaaaggcc 840
agagctcgct cgtctgcgct tgtccttggt gttagcctcc gacttcaact gggcgagagg 900
cagcaccaca ccccgcaaac gcaggccacc ggcgcgccgt tggcggtaac agcaggtgcc 960
gttcgctgct gctcggtcct tttcccgaaa gtaccctgcc ttcctggcct cgacctccgc 1020
ctgcggggct ctgggcactg tcaaactttc gcagttttgc acccgcagcg attcgagcgg 1080
gacccgcttc gccaacgcgg atcaggagag gtaaaagtct cccctgtcct ttctgccgga 1140
gcatcctccg tccgtcgttc gctggttgtt gtgtgtgtgt gtgtgtacag tactgtaggt 1200
acatagtgct caccccaggg catttcccca atccgcgatt gcgcatacca taggcgtcat 1260
ctgaatctgc gttacgtccg gataacacta cgcagtacga aggagtcggt gctactacgc 1320
ccgcaagttc aagtctacgg tgtggctaag gtgctcaagg gcatagttac acgcaccccg 1380
ggcgagcttc tcgcacctcg accctttgcc ggggcgtcac tggtccgaca actcataatc 1440
caccatcgct tgggcaggcc tgcatccccc gtgggtcgca tccaagccgc cggtaaatac 1500
cggccgacac acacacacac acacgcaccc tgtctagcgc gacgctacaa aagagaccgg 1560
caggcactcc ccgcgaccgc ttgttctggc catcccgtct ctcgcctctg cagttatcgc 1620
ctgcctcatc tctgcgtcct gataactttt gtcacctctg atcccccccc gacgagacgg 1680
tctcgccgac caggacccga gatggcggac cgccatccta ctctgtccca gtccttcgcc 1740
gagcgggcga agacggctag ccacccgctc acccgctacc tctttcggct catggacctc 1800
aaggcctcga acctgtgcct gagcgccgac gtgtccaccg cgcgcgagct tctgacgctg 1860
gccgaccggg tcggcccctc gatcgtcgtg ctcaagacgc actacgacct gatctcgggc 1920
tgggactaca acccgcaaac cggcaccggc gcgaagctgg ccgccctggc gaggaagcat 1980
ggcttcctca tctttgagga ccgcaagttt gtcgacattg gtaagacggt gcagatgcag 2040
tacacggctg gcactgcgcg cataatagag tgggcgcaca tcaccaacgc caacatcgac 2100
gccggcaagg acatggtgcg cgccatggcc gaggcggccg ccaagtggaa ggaacgcatc 2160
aactacgagg tcaagacctc cgtcacggtg ggcacgcccg tctcggacca gttcgacgat 2220
gcggaagagc aagcgcagtg gccgcagcac cagcagcacc agcaccagca ccagcaccag 2280
caacagcgag atgaaaaagg tgggccccgc aggctcggca ctcgggagga gcagcaccaa 2340
caggacaacg gagacggtga cggccggaaa gggagcattg tctcgatcac tacggtgacg 2400
cagtcatttg agcccgctca ctccccacgc ctgtccaaga gcaacgagct gggcgacgac 2460
gccgtcttcc ccggcatcga ggaggccccc gtcgaccgcg gcctgcttct gctcgcccag 2520
atgtcgtcca agggctgcct catgaccaag gagtacaccc aggcctgcgt cgaggccgcg 2580
cgcgagcata aggattttgt catgggcttc gtctcacagg agtcgctcaa ctcggccccg 2640
gacgacactt tcatccacat gacccccgga tgcaagcttc cgccgccagg cgaggacgaa 2700
gagagcggcc agatcgagtt taaacggcgc gccgctgttt cctgtgtgaa attgttatcc 2760
gctcacaatt ccacacaaca taggagccgg aagcataaag tgtaaagcct ggggtgccta 2820
atgagtgagg taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 2880
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat 2940
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 3000
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 3060
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 3120
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 3180
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 3240
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 3300
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 3360
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 3420
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 3480
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 3540
gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa 3600
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 3660
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 3720
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 3780
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 3840
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 3900
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 3960
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 4020
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 4080
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 4140
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 4200
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 4260
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 4320
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 4380
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 4440
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 4500
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 4560
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 4620
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 4680
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 4740
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 4800
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 4860
tccccgaaaa gtgccacctg aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca 4920
acgcgagagc gctaattttt caaacaaaga atctgagctg catttttaca gaacagaaat 4980
gcaacgcgaa agcgctattt taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa 5040
atgcaacgcg agagcgctaa tttttcaaac aaagaatctg agctgcattt ttacagaaca 5100
gaaatgcaac gcgagagcgc tattttacca acaaagaatc tatacttctt ttttgttcta 5160
caaaaatgca tcccgagagc gctatttttc taacaaagca tcttagatta ctttttttct 5220
cctttgtgcg ctctataatg cagtctcttg ataacttttt gcactgtagg tccgttaagg 5280
ttagaagaag gctactttgg tgtctatttt ctcttccata aaaaaagcct gactccactt 5340
cccgcgttta ctgattacta gcgaagctgc gggtgcattt tttcaagata aaggcatccc 5400
cgattatatt ctataccgat gtggattgcg catactttgt gaacagaaag tgatagcgtt 5460
gatgattctt cattggtcag aaaattatga acggtttctt ctattttgtc tctatatact 5520
acgtatagga aatgtttaca ttttcgtatt gttttcgatt cactctatga atagttctta 5580
ctacaatttt tttgtctaaa gagtaatact agagataaac ataaaaaatg tagaggtcga 5640
gtttagatgc aagttcaagg agcgaaaggt ggatgggtag gttatatagg gatatagcac 5700
agagatatat agcaaagaga tacttttgag caatgtttgt ggaagcggta ttcgcaatat 5760
tttagtagct cgttacagtc cggtgcgttt ttggtttttt gaaagtgcgt cttcagagcg 5820
cttttggttt tcaaaagcgc tctgaagttc ctatactttc tagagaatag gaacttcgga 5880
ataggaactt caaagcgttt ccgaaaacga gcgcttccga aaatgcaacg cgagctgcgc 5940
acatacagct cactgttcac gtcgcaccta tatctgcgtg ttgcctgtat atatatatac 6000
atgagaagaa cggcatagtg cgtgtttatg cttaaatgcg tacttatatg cgtctattta 6060
tgtaggatga aaggtagtct agtacctcct gtgatattat cccattccat gcggggtatc 6120
gtatgcttcc ttcagcacta ccctttagct gttctatatg ctgccactcc tcaattggat 6180
tagtctcatc cttcaatgct atcatttcct ttgatattgg atcatactaa gaaaccatta 6240
ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt 6300
tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc acagcttgtc 6360
tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt 6420
gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg caccatacca 6480
cagcttttca attcaattca tcattttttt tttattcttt tttttgattt cggtttcttt 6540
gaaatttttt tgattcggta atctccgaac agaaggaaga acgaaggaag gagcacagac 6600
ttagattggt atatatacgc atatgtagtg ttgaagaaac atgaaattgc ccagtattct 6660
taacccaact gcacagaaca aaaacctgca ggaaacgaag ataaatcatg tcgaaagcta 6720
catataagga acgtgctgct actcatccta gtcctgttgc tgccaagcta tttaatatca 6780
tgcacgaaaa gcaaacaaac ttgtgtgctt cattggatgt tcgtaccacc aaggaattac 6840
tggagttagt tgaagcatta ggtcccaaaa tttgtttact aaaaacacat gtggatatct 6900
tgactgattt ttccatggag ggcacagtta agccgctaaa ggcattatcc gccaagtaca 6960
attttttact cttcgaagac agaaaatttg ctgacattgg taatacagtc aaattgcagt 7020
actctgcggg tgtatacaga atagcagaat gggcagacat tacgaatgca cacggtgtgg 7080
tgggcccagg tattgttagc ggtttgaagc aggcggcaga agaagtaaca aaggaaccta 7140
gaggcctttt gatgttagca gaattgtcat gcaagggctc cctatctact ggagaatata 7200
ctaagggtac tgttgacatt gcgaagagcg acaaagattt tgttatcggc tttattgctc 7260
aaagagacat gggtggaaga gatgaaggtt acgattggtt gattatgaca cccggtgtgg 7320
gtttagatga caagggagac gcattgggtc aacagtatag aaccgtggat gatgtggtct 7380
ctacaggatc tgacattatt attgttggaa gaggactatt tgcaaaggga agggatgcta 7440
aggtagaggg tgaacgttac agaaaagcag gctgggaagc atatttgaga agatgcggcc 7500
agcaaaacta aaaaactgta ttataagtaa atgcatgtat actaaactca caaattagag 7560
cttcaattta attatatcag ttattaccct atgcggtgtg aaataccgca cagatgcgta 7620
aggagaaaat accgcatcag gaaattgtaa acgttaatat tttgttaaaa ttcgcgttaa 7680
atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa atcccttata 7740
aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac aagagtccac 7800
tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag ggcgatggcc 7860
cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt aaagcactaa 7920
atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg gcgaacgtgg 7980
cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca agtgtagcgg 8040
tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag ggcgcgtcgc 8100
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 8160
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 8220
ggttttccca gtcacgacgg tttaaac 8247
<210> 2
<211> 8245
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleic acids
<400> 2
gaacctgtgc ctgagcgccg acgtgtccac cgcgcgcgag cttctgacgc tggccgaccg 60
ggtcggcccc tcgatcgtcg tgctcaagac gcactacgac ctgatctcgg gctgggacta 120
caacccgcaa accggcaccg gcgcgaagct ggccgccctg gcgaggaagc atggcttcct 180
catctttgag gaccgcaagt ttgtcgacat tggtaagacg gtgcagatgc agtacacggc 240
tggcactgcg cgcataatag agtgggcgca catcaccaac gccaacatcg acgccggcaa 300
ggacatggtg cgcgccatgg ccgaggcggc cgccaagtgg aaggaacgca tcaactacga 360
ggtcaagacc tccgtcacgg tgggcacgcc cgtctcggac cagttcgacg atgcggaaga 420
gcaagcgcag tggccgcagc accagcagca ccagcaccag caccagcacc agcaacagcg 480
agatgaaaaa ggtgggcccc gcaggctcgg cactcgggag gagcagcacc aacaggacaa 540
cggagacggt gacggccgga aagggagcat tgtctcgatc actacggtga cgcagtcatt 600
tgagcccgct cactccccac gcctgtccaa gagcaacgag ctgggcgacg acgccgtctt 660
ccccggcatc gaggaggccc ccgtcgaccg cggcctgctt ctgctcgccc agatgtcgtc 720
caagggctgc ctcatgacca aggagtacac ccaggcctgc gtcgaggccg cgcgcgagca 780
taaggatttt gtcatgggct tcgtctcaca ggagtcgctc aactcggccc cggacgacac 840
tttcatccac atgacccccg gatgcaagct tccgccgcca ggcgaggacg aagagagcgg 900
ccagatcgag ggcgacggcc tcggccagca gtacaactcg cccagcaagt tgatcaacat 960
ttgcggcacc gacattgtca tcgtagggcg tggcatcacc gccgccggcg acccgccctc 1020
cgaggctgag aggtacagga gaaaagcctg gaaggcctat ctggcgcgtc tggcgtgatt 1080
tggggggagg gggagaggag atgggggacg ggaggggtcg ccttggtcag tcttgtgcgt 1140
gtcctgcagc ggattcgtca ccggggcagc acccaaaaga gggagaaaaa ggggaaaaaa 1200
aataaataaa taaaaagggt taagttgttg aaaaaagtgt tgtgagctct ctggcaaggc 1260
gcgcccccca cacaatcgcc aagagtccca tcagatcaat ggatctctgt tttcccaagg 1320
ttatgcacat atatatggtc atggacctgg tgatagatcc atcaacatga gttgtttcgc 1380
agttctccgg gagttacgcc tcgcggatct tcttaatccc agatctctcc ctctgtatct 1440
ttcggcctct gcattgccac ccctatacga agtattggac cctttgtact gcgtacggat 1500
ttggttttct gctctttctt tggcccctcc aactttctac atattaatcg gacttctgcc 1560
gggcggtgaa gcgttgagca acgaggctga gtgggtcttg ggcgcgaatc aagcatgcca 1620
aggcggaccc ctggagcatt ccactccagt tgcatgcaga agctccaaac tgtcctctcc 1680
aaaggccaga gctcgctcgt ctgcgcttgt ccttggtgtt agcctccgac ttcaactggg 1740
cgagaggcag caccacaccc cgcaaacgca ggccaccatt taaataaagg tcagcagcgg 1800
gtggatttgt gtacaaagaa gtatgttaga gttgattctt ttattttgcg acatgcggat 1860
tgggaaaagg gcatcgggtc ggtcgtattg tgtacaacac aagcacgttg attgcgctac 1920
atggtgccac agaacacatg gttgaaagtg acctcgtcca acggcggctc caactgtgag 1980
caaccagcca aatgtgcatt catcgtcgcg cccgaacaga gatcgaagtg tcgaagaaga 2040
agcggcagcg atttgcgcga tttccagcca tggtaagtaa acaaggaaaa aaaaaaaaag 2100
ggggggggga cagcaggcgt tgctgttaaa gtgtcaagaa gcgctcaatg atttctgcct 2160
ctctcatgag tcttcctcgc cctatgattt ctgcctctct catgagtctt cctcgccctt 2220
tgacagctcc caccactgcg ggttctttac cagcctttca actgatctct ttcatcccat 2280
tagcatgcaa caggtcccgt gggcctaggc gcccgggcga aatttcagtg cagcatttga 2340
gatgagccca gttcgcacaa ctttgcccat acgggaacat tccctgcttg ttgcgtttgt 2400
tcttatagcc tacctatcag ccattccatc ctctcacagc tgttcccgct gctcaacttc 2460
gtttccttcc tcctctccct acataacctg ccgattctgt tcggacctac ggattcctac 2520
aatagtgtag tcaacgaact ctggctaccg gaccgcaaga tgcatttcag tgtgtaagtc 2580
agtctcatgg gtttgctggt ttcctttccc ttcgagacag gtcgctagtt tcttccgttc 2640
gctagctttc tgccaggagg ccaggagggc tcccaagacg ttccgccatg gctacattgc 2700
tcctcgctga ctgttgttta aacgctgttt cctgtgtgaa attgttatcc gctcacaatt 2760
ccacacaaca taggagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagg 2820
taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 2880
cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 2940
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 3000
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 3060
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 3120
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 3180
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 3240
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 3300
gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 3360
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 3420
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 3480
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 3540
aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 3600
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 3660
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 3720
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 3780
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 3840
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 3900
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 3960
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 4020
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 4080
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 4140
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 4200
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 4260
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 4320
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 4380
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 4440
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 4500
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 4560
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 4620
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 4680
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 4740
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 4800
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 4860
gtgccacctg aacgaagcat ctgtgcttca ttttgtagaa caaaaatgca acgcgagagc 4920
gctaattttt caaacaaaga atctgagctg catttttaca gaacagaaat gcaacgcgaa 4980
agcgctattt taccaacgaa gaatctgtgc ttcatttttg taaaacaaaa atgcaacgcg 5040
agagcgctaa tttttcaaac aaagaatctg agctgcattt ttacagaaca gaaatgcaac 5100
gcgagagcgc tattttacca acaaagaatc tatacttctt ttttgttcta caaaaatgca 5160
tcccgagagc gctatttttc taacaaagca tcttagatta ctttttttct cctttgtgcg 5220
ctctataatg cagtctcttg ataacttttt gcactgtagg tccgttaagg ttagaagaag 5280
gctactttgg tgtctatttt ctcttccata aaaaaagcct gactccactt cccgcgttta 5340
ctgattacta gcgaagctgc gggtgcattt tttcaagata aaggcatccc cgattatatt 5400
ctataccgat gtggattgcg catactttgt gaacagaaag tgatagcgtt gatgattctt 5460
cattggtcag aaaattatga acggtttctt ctattttgtc tctatatact acgtatagga 5520
aatgtttaca ttttcgtatt gttttcgatt cactctatga atagttctta ctacaatttt 5580
tttgtctaaa gagtaatact agagataaac ataaaaaatg tagaggtcga gtttagatgc 5640
aagttcaagg agcgaaaggt ggatgggtag gttatatagg gatatagcac agagatatat 5700
agcaaagaga tacttttgag caatgtttgt ggaagcggta ttcgcaatat tttagtagct 5760
cgttacagtc cggtgcgttt ttggtttttt gaaagtgcgt cttcagagcg cttttggttt 5820
tcaaaagcgc tctgaagttc ctatactttc tagagaatag gaacttcgga ataggaactt 5880
caaagcgttt ccgaaaacga gcgcttccga aaatgcaacg cgagctgcgc acatacagct 5940
cactgttcac gtcgcaccta tatctgcgtg ttgcctgtat atatatatac atgagaagaa 6000
cggcatagtg cgtgtttatg cttaaatgcg tacttatatg cgtctattta tgtaggatga 6060
aaggtagtct agtacctcct gtgatattat cccattccat gcggggtatc gtatgcttcc 6120
ttcagcacta ccctttagct gttctatatg ctgccactcc tcaattggat tagtctcatc 6180
cttcaatgct atcatttcct ttgatattgg atcatactaa gaaaccatta ttatcatgac 6240
attaacctat aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga 6300
cggtgaaaac ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga 6360
tgccgggagc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg 6420
gcttaactat gcggcatcag agcagattgt actgagagtg caccatacca cagcttttca 6480
attcaattca tcattttttt tttattcttt tttttgattt cggtttcttt gaaatttttt 6540
tgattcggta atctccgaac agaaggaaga acgaaggaag gagcacagac ttagattggt 6600
atatatacgc atatgtagtg ttgaagaaac atgaaattgc ccagtattct taacccaact 6660
gcacagaaca aaaacctgca ggaaacgaag ataaatcatg tcgaaagcta catataagga 6720
acgtgctgct actcatccta gtcctgttgc tgccaagcta tttaatatca tgcacgaaaa 6780
gcaaacaaac ttgtgtgctt cattggatgt tcgtaccacc aaggaattac tggagttagt 6840
tgaagcatta ggtcccaaaa tttgtttact aaaaacacat gtggatatct tgactgattt 6900
ttccatggag ggcacagtta agccgctaaa ggcattatcc gccaagtaca attttttact 6960
cttcgaagac agaaaatttg ctgacattgg taatacagtc aaattgcagt actctgcggg 7020
tgtatacaga atagcagaat gggcagacat tacgaatgca cacggtgtgg tgggcccagg 7080
tattgttagc ggtttgaagc aggcggcaga agaagtaaca aaggaaccta gaggcctttt 7140
gatgttagca gaattgtcat gcaagggctc cctatctact ggagaatata ctaagggtac 7200
tgttgacatt gcgaagagcg acaaagattt tgttatcggc tttattgctc aaagagacat 7260
gggtggaaga gatgaaggtt acgattggtt gattatgaca cccggtgtgg gtttagatga 7320
caagggagac gcattgggtc aacagtatag aaccgtggat gatgtggtct ctacaggatc 7380
tgacattatt attgttggaa gaggactatt tgcaaaggga agggatgcta aggtagaggg 7440
tgaacgttac agaaaagcag gctgggaagc atatttgaga agatgcggcc agcaaaacta 7500
aaaaactgta ttataagtaa atgcatgtat actaaactca caaattagag cttcaattta 7560
attatatcag ttattaccct atgcggtgtg aaataccgca cagatgcgta aggagaaaat 7620
accgcatcag gaaattgtaa acgttaatat tttgttaaaa ttcgcgttaa atttttgtta 7680
aatcagctca ttttttaacc aataggccga aatcggcaaa atcccttata aatcaaaaga 7740
atagaccgag atagggttga gtgttgttcc agtttggaac aagagtccac tattaaagaa 7800
cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag ggcgatggcc cactacgtga 7860
accatcaccc taatcaagtt ttttggggtc gaggtgccgt aaagcactaa atcggaaccc 7920
taaagggagc ccccgattta gagcttgacg gggaaagccg gcgaacgtgg cgagaaagga 7980
agggaagaaa gcgaaaggag cgggcgctag ggcgctggca agtgtagcgg tcacgctgcg 8040
cgtaaccacc acacccgccg cgcttaatgc gccgctacag ggcgcgtcgc gccattcgcc 8100
attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 8160
gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 8220
gtcacgacgg gcgcgccgtt taaac 8245
<210> 3
<211> 8317
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleic acids
<400> 3
atagcgcgat ctgtgcctcc ttgtatgtat gtatgtagtc cgtacaacat acagtactat 60
acgggacacg cattccatag agcggattac actagaactg cccattctgc gaacctgaga 120
accaaggtca cataccacgt tcttgatttg agatttccac aaatacatcg ttcgcacgtt 180
ggccttctgt ctgacttaga acgccaagta accgtctcta aaagcgctta gggcctagaa 240
gctgcgcaag taccctacaa gtatgctttg tatgtacata catacataca tacctacgtc 300
catcaggtat gtacctaagt caggtcgctt gagggccttc catacttggg agaagcggat 360
gcaattaccc acatgataat agaggcacct acagaccgcc cacaattgtg tagttttggc 420
aagcttcgtc actcagcact cctttattct cttctttaat gaattatatg aagaactatc 480
agtcaagtaa cccagtgcat tgtgtgagat caatacgata tgcagtgaaa ggtgcattta 540
ccgacttagc gcatcacgcg ggaatgggtg gagtactacg gataccgcta cgagttggag 600
gtacagtagt taccccgggg ggaaggggtt ggcggtttgg gggtttggcc tctgccgatt 660
ggccaacttc tgccaaggcc ggcctttctg ccgttcacat ttcaacggcg aagggcagct 720
gcttgaaaca aacttcggcc cctaacgacg gcgcacgcaa actcgcggta accacttacc 780
cggccaggcc aactgatatg agggcttgaa agagccaaac caacgatgca gcgaactaac 840
aagcagcgct gctgataaaa cgatcagaaa gagcctcgac ctctctcctt tttttctaga 900
gccgtgcgca tacttcttgc tgctcgcaac caacaacaac agtacagaac acaacaaaat 960
agcagagttc cgagaaacag tgcagaagag agttgccacc ggcgcgccgt tggcggtaac 1020
agcaggtgcc gttcgctgct gctcggtcct tttcccgaaa gtaccctgcc ttcctggcct 1080
cgacctccgc ctgcggggct ctgggcactg tcaaactttc gcagttttgc acccgcagcg 1140
attcgagcgg gacccgcttc gccaacgcgg atcaggagag gtaaaagtct cccctgtcct 1200
ttctgccgga gcatcctccg tccgtcgttc gctggttgtt gtgtgtgtgt gtgtgtacag 1260
tactgtaggt acatagtgct caccccaggg catttcccca atccgcgatt gcgcatacca 1320
taggcgtcat ctgaatctgc gttacgtccg gataacacta cgcagtacga aggagtcggt 1380
gctactacgc ccgcaagttc aagtctacgg tgtggctaag gtgctcaagg gcatagttac 1440
acgcaccccg ggcgagcttc tcgcacctcg accctttgcc ggggcgtcac tggtccgaca 1500
actcataatc caccatcgct tgggcaggcc tgcatccccc gtgggtcgca tccaagccgc 1560
cggtaaatac cggccgacac acacacacac acacgcaccc tgtctagcgc gacgctacaa 1620
aagagaccgg caggcactcc ccgcgaccgc ttgttctggc catcccgtct ctcgcctctg 1680
cagttatcgc ctgcctcatc tctgcgtcct gataactttt gtcacctctg atcccccccc 1740
gacgagacgg tctcgccgac caggacccga gatggcggac cgccatccta ctctgtccca 1800
gtccttcgcc gagcgggcga agacggctag ccacccgctc acccgctacc tctttcggct 1860
catggacctc aaggcctcga acctgtgcct gagcgccgac gtgtccaccg cgcgcgagct 1920
tctgacgctg gccgaccggg tcggcccctc gatcgtcgtg ctcaagacgc actacgacct 1980
gatctcgggc tgggactaca acccgcaaac cggcaccggc gcgaagctgg ccgccctggc 2040
gaggaagcat ggcttcctca tctttgagga ccgcaagttt gtcgacattg gtaagacggt 2100
gcagatgcag tacacggctg gcactgcgcg cataatagag tgggcgcaca tcaccaacgc 2160
caacatcgac gccggcaagg acatggtgcg cgccatggcc gaggcggccg ccaagtggaa 2220
ggaacgcatc aactacgagg tcaagacctc cgtcacggtg ggcacgcccg tctcggacca 2280
gttcgacgat gcggaagagc aagcgcagtg gccgcagcac cagcagcacc agcaccagca 2340
ccagcaccag caacagcgag atgaaaaagg tgggccccgc aggctcggca ctcgggagga 2400
gcagcaccaa caggacaacg gagacggtga cggccggaaa gggagcattg tctcgatcac 2460
tacggtgacg cagtcatttg agcccgctca ctccccacgc ctgtccaaga gcaacgagct 2520
gggcgacgac gccgtcttcc ccggcatcga ggaggccccc gtcgaccgcg gcctgcttct 2580
gctcgcccag atgtcgtcca agggctgcct catgaccaag gagtacaccc aggcctgcgt 2640
cgaggccgcg cgcgagcata aggattttgt catgggcttc gtctcacagg agtcgctcaa 2700
ctcggccccg gacgacactt tcatccacat gacccccgga tgcaagcttc cgccgccagg 2760
cgaggacgaa gagagcggcc agatcgagtt taaacggcgc gccgctgttt cctgtgtgaa 2820
attgttatcc gctcacaatt ccacacaaca taggagccgg aagcataaag tgtaaagcct 2880
ggggtgccta atgagtgagg taactcacat taattgcgtt gcgctcactg cccgctttcc 2940
agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 3000
gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 3060
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 3120
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 3180
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 3240
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 3300
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 3360
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 3420
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 3480
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 3540
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 3600
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 3660
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 3720
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 3780
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 3840
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 3900
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 3960
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 4020
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 4080
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 4140
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 4200
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 4260
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 4320
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 4380
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 4440
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 4500
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 4560
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 4620
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 4680
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 4740
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 4800
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 4860
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 4920
cgcgcacatt tccccgaaaa gtgccacctg aacgaagcat ctgtgcttca ttttgtagaa 4980
caaaaatgca acgcgagagc gctaattttt caaacaaaga atctgagctg catttttaca 5040
gaacagaaat gcaacgcgaa agcgctattt taccaacgaa gaatctgtgc ttcatttttg 5100
taaaacaaaa atgcaacgcg agagcgctaa tttttcaaac aaagaatctg agctgcattt 5160
ttacagaaca gaaatgcaac gcgagagcgc tattttacca acaaagaatc tatacttctt 5220
ttttgttcta caaaaatgca tcccgagagc gctatttttc taacaaagca tcttagatta 5280
ctttttttct cctttgtgcg ctctataatg cagtctcttg ataacttttt gcactgtagg 5340
tccgttaagg ttagaagaag gctactttgg tgtctatttt ctcttccata aaaaaagcct 5400
gactccactt cccgcgttta ctgattacta gcgaagctgc gggtgcattt tttcaagata 5460
aaggcatccc cgattatatt ctataccgat gtggattgcg catactttgt gaacagaaag 5520
tgatagcgtt gatgattctt cattggtcag aaaattatga acggtttctt ctattttgtc 5580
tctatatact acgtatagga aatgtttaca ttttcgtatt gttttcgatt cactctatga 5640
atagttctta ctacaatttt tttgtctaaa gagtaatact agagataaac ataaaaaatg 5700
tagaggtcga gtttagatgc aagttcaagg agcgaaaggt ggatgggtag gttatatagg 5760
gatatagcac agagatatat agcaaagaga tacttttgag caatgtttgt ggaagcggta 5820
ttcgcaatat tttagtagct cgttacagtc cggtgcgttt ttggtttttt gaaagtgcgt 5880
cttcagagcg cttttggttt tcaaaagcgc tctgaagttc ctatactttc tagagaatag 5940
gaacttcgga ataggaactt caaagcgttt ccgaaaacga gcgcttccga aaatgcaacg 6000
cgagctgcgc acatacagct cactgttcac gtcgcaccta tatctgcgtg ttgcctgtat 6060
atatatatac atgagaagaa cggcatagtg cgtgtttatg cttaaatgcg tacttatatg 6120
cgtctattta tgtaggatga aaggtagtct agtacctcct gtgatattat cccattccat 6180
gcggggtatc gtatgcttcc ttcagcacta ccctttagct gttctatatg ctgccactcc 6240
tcaattggat tagtctcatc cttcaatgct atcatttcct ttgatattgg atcatactaa 6300
gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag gccctttcgt 6360
ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc 6420
acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt 6480
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 6540
caccatacca cagcttttca attcaattca tcattttttt tttattcttt tttttgattt 6600
cggtttcttt gaaatttttt tgattcggta atctccgaac agaaggaaga acgaaggaag 6660
gagcacagac ttagattggt atatatacgc atatgtagtg ttgaagaaac atgaaattgc 6720
ccagtattct taacccaact gcacagaaca aaaacctgca ggaaacgaag ataaatcatg 6780
tcgaaagcta catataagga acgtgctgct actcatccta gtcctgttgc tgccaagcta 6840
tttaatatca tgcacgaaaa gcaaacaaac ttgtgtgctt cattggatgt tcgtaccacc 6900
aaggaattac tggagttagt tgaagcatta ggtcccaaaa tttgtttact aaaaacacat 6960
gtggatatct tgactgattt ttccatggag ggcacagtta agccgctaaa ggcattatcc 7020
gccaagtaca attttttact cttcgaagac agaaaatttg ctgacattgg taatacagtc 7080
aaattgcagt actctgcggg tgtatacaga atagcagaat gggcagacat tacgaatgca 7140
cacggtgtgg tgggcccagg tattgttagc ggtttgaagc aggcggcaga agaagtaaca 7200
aaggaaccta gaggcctttt gatgttagca gaattgtcat gcaagggctc cctatctact 7260
ggagaatata ctaagggtac tgttgacatt gcgaagagcg acaaagattt tgttatcggc 7320
tttattgctc aaagagacat gggtggaaga gatgaaggtt acgattggtt gattatgaca 7380
cccggtgtgg gtttagatga caagggagac gcattgggtc aacagtatag aaccgtggat 7440
gatgtggtct ctacaggatc tgacattatt attgttggaa gaggactatt tgcaaaggga 7500
agggatgcta aggtagaggg tgaacgttac agaaaagcag gctgggaagc atatttgaga 7560
agatgcggcc agcaaaacta aaaaactgta ttataagtaa atgcatgtat actaaactca 7620
caaattagag cttcaattta attatatcag ttattaccct atgcggtgtg aaataccgca 7680
cagatgcgta aggagaaaat accgcatcag gaaattgtaa acgttaatat tttgttaaaa 7740
ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 7800
atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc agtttggaac 7860
aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac cgtctatcag 7920
ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc gaggtgccgt 7980
aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg gggaaagccg 8040
gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag ggcgctggca 8100
agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc gccgctacag 8160
ggcgcgtcgc gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg 8220
gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg 8280
gtaacgccag ggttttccca gtcacgacgg tttaaac 8317
<210> 4
<211> 8503
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleic acids
<400> 4
gaacctgtgc ctgagcgccg acgtgtccac cgcgcgcgag cttctgacgc tggccgaccg 60
ggtcggcccc tcgatcgtcg tgctcaagac gcactacgac ctgatctcgg gctgggacta 120
caacccgcaa accggcaccg gcgcgaagct ggccgccctg gcgaggaagc atggcttcct 180
catctttgag gaccgcaagt ttgtcgacat tggtaagacg gtgcagatgc agtacacggc 240
tggcactgcg cgcataatag agtgggcgca catcaccaac gccaacatcg acgccggcaa 300
ggacatggtg cgcgccatgg ccgaggcggc cgccaagtgg aaggaacgca tcaactacga 360
ggtcaagacc tccgtcacgg tgggcacgcc cgtctcggac cagttcgacg atgcggaaga 420
gcaagcgcag tggccgcagc accagcagca ccagcaccag caccagcacc agcaacagcg 480
agatgaaaaa ggtgggcccc gcaggctcgg cactcgggag gagcagcacc aacaggacaa 540
cggagacggt gacggccgga aagggagcat tgtctcgatc actacggtga cgcagtcatt 600
tgagcccgct cactccccac gcctgtccaa gagcaacgag ctgggcgacg acgccgtctt 660
ccccggcatc gaggaggccc ccgtcgaccg cggcctgctt ctgctcgccc agatgtcgtc 720
caagggctgc ctcatgacca aggagtacac ccaggcctgc gtcgaggccg cgcgcgagca 780
taaggatttt gtcatgggct tcgtctcaca ggagtcgctc aactcggccc cggacgacac 840
tttcatccac atgacccccg gatgcaagct tccgccgcca ggcgaggacg aagagagcgg 900
ccagatcgag ggcgacggcc tcggccagca gtacaactcg cccagcaagt tgatcaacat 960
ttgcggcacc gacattgtca tcgtagggcg tggcatcacc gccgccggcg acccgccctc 1020
cgaggctgag aggtacagga gaaaagcctg gaaggcctat ctggcgcgtc tggcgtgatt 1080
tggggggagg gggagaggag atgggggacg ggaggggtcg ccttggtcag tcttgtgcgt 1140
gtcctgcagc ggattcgtca ccggggcagc acccaaaaga gggagaaaaa ggggaaaaaa 1200
aataaataaa taaaaagggt taagttgttg aaaaaagtgt tgtgagctct ctggcaaggc 1260
gcgcctgtgt gagatcaata cgatatgcag tgaaaggtgc atttaccgac ttagcgcatc 1320
acgcgggaat gggtggagta ctacggatac cgctacgagt tggaggtaca gtagttaccc 1380
cggggggaag gggttggcgg tttgggggtt tggcctctgc cgattggcca acttctgcca 1440
aggccggcct ttctgccgtt cacatttcaa cggcgaaggg cagctgcttg aaacaaactt 1500
cggcccctaa cgacggcgca cgcaaactcg cggtaaccac ttacccggcc aggccaactg 1560
atatgagggc ttgaaagagc caaaccaacg atgcagcgaa ctaacaagca gcgctgctga 1620
taaaacgatc agaaagagcc tcgacctctc tccttttttt ctagagccgt gcgcatactt 1680
cttgctgctc gcaaccaaca acaacagtac agaacacaac aaaatagcag agttccgaga 1740
aacagtgcag aagagagttg ccaccattta aatggatccc ggttagagca ggtgggaaac 1800
catttgtgaa tgggttggca tgagggctca aatgcaagta atctatttac tctctctaat 1860
cgatgcaaat agtttcgacc gttcctgata aagcacatta caactcagct ctacttttta 1920
tcaacatttg aagcactgac tcgtccaaat aaaccgctgc tgtctcatcg gcttgccccg 1980
gaaccacaag tagcacggtt tcgacatctt accggtgata cacaccggga ttgtcatacc 2040
gatacccggc actaccattc gggtaactcc cgagcggaat gtcattgccg gcgccatacg 2100
gtgacttggt cgagccgttg cccaacccgc catacccgcc gccgctgccc acccgggtct 2160
gctcggtcgc atagctattg cgcagatcct ccggggtaga gtgctggggc agcgcgttgg 2220
gatccggaat gccgtccacc ggtgcagtgc gcttccggcc gaggccgaac cagttaaagc 2280
gcttgcggcg gccgtagccc tcggtgtagt tgttggccgg ggacgggccg aagcgcgcct 2340
ccttacggcg gtggcgaacg agggccaggc taacgaacgg agtgatggcg aacaagatgc 2400
tatcgtcaac tcacatgtca gcctacgaga ggtattctcg tcgagggaag ggaaagaggg 2460
ccggggggag ggggaaggga ggaaatgagg acgtacactg caacgatcga tactgccaaa 2520
catgccgact ccatcttgca agccgtcctc aaactaggca gcgccgtaaa cccgccgctg 2580
ccgttatcca ccacattggt attcgcatct cctttgccat acaccgtgtc gacctccccg 2640
ttacaagacg acgccccgcc gcggttcgca gtagcaatgt aaatgaagcc gccgatgaag 2700
gccacatcga ggaccatcgt gatgaatgac gggaatgagc ggccgggtac gcagcagagc 2760
atgagcaggg caaggatagt gtagaggaca ccaacgccag agatgcctgc gaccgcccgt 2820
gcccaagtag ggatgtgcat attatggttg gtaagagtcg cgagaaagta ggagaagagc 2880
gcgagcacga tcgcggcgca gcagaactga atggctcgca agaggaacat caagccccga 2940
agggcaatgc ctttggccgc gcccatggcg ttggtttaaa cgctgtttcc tgtgtgaaat 3000
tgttatccgc tcacaattcc acacaacata ggagccggaa gcataaagtg taaagcctgg 3060
ggtgcctaat gagtgaggta actcacatta attgcgttgc gctcactgcc cgctttccag 3120
tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 3180
ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 3240
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 3300
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 3360
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 3420
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 3480
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 3540
tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 3600
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 3660
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 3720
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 3780
ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct 3840
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 3900
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 3960
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 4020
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 4080
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 4140
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 4200
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt 4260
gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag 4320
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 4380
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 4440
gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 4500
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt 4560
agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg 4620
gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg 4680
actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct 4740
tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc 4800
attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt 4860
tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt 4920
tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg 4980
aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat 5040
tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 5100
cgcacatttc cccgaaaagt gccacctgaa cgaagcatct gtgcttcatt ttgtagaaca 5160
aaaatgcaac gcgagagcgc taatttttca aacaaagaat ctgagctgca tttttacaga 5220
acagaaatgc aacgcgaaag cgctatttta ccaacgaaga atctgtgctt catttttgta 5280
aaacaaaaat gcaacgcgag agcgctaatt tttcaaacaa agaatctgag ctgcattttt 5340
acagaacaga aatgcaacgc gagagcgcta ttttaccaac aaagaatcta tacttctttt 5400
ttgttctaca aaaatgcatc ccgagagcgc tatttttcta acaaagcatc ttagattact 5460
ttttttctcc tttgtgcgct ctataatgca gtctcttgat aactttttgc actgtaggtc 5520
cgttaaggtt agaagaaggc tactttggtg tctattttct cttccataaa aaaagcctga 5580
ctccacttcc cgcgtttact gattactagc gaagctgcgg gtgcattttt tcaagataaa 5640
ggcatccccg attatattct ataccgatgt ggattgcgca tactttgtga acagaaagtg 5700
atagcgttga tgattcttca ttggtcagaa aattatgaac ggtttcttct attttgtctc 5760
tatatactac gtataggaaa tgtttacatt ttcgtattgt tttcgattca ctctatgaat 5820
agttcttact acaatttttt tgtctaaaga gtaatactag agataaacat aaaaaatgta 5880
gaggtcgagt ttagatgcaa gttcaaggag cgaaaggtgg atgggtaggt tatataggga 5940
tatagcacag agatatatag caaagagata cttttgagca atgtttgtgg aagcggtatt 6000
cgcaatattt tagtagctcg ttacagtccg gtgcgttttt ggttttttga aagtgcgtct 6060
tcagagcgct tttggttttc aaaagcgctc tgaagttcct atactttcta gagaatagga 6120
acttcggaat aggaacttca aagcgtttcc gaaaacgagc gcttccgaaa atgcaacgcg 6180
agctgcgcac atacagctca ctgttcacgt cgcacctata tctgcgtgtt gcctgtatat 6240
atatatacat gagaagaacg gcatagtgcg tgtttatgct taaatgcgta cttatatgcg 6300
tctatttatg taggatgaaa ggtagtctag tacctcctgt gatattatcc cattccatgc 6360
ggggtatcgt atgcttcctt cagcactacc ctttagctgt tctatatgct gccactcctc 6420
aattggatta gtctcatcct tcaatgctat catttccttt gatattggat catactaaga 6480
aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 6540
cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac 6600
agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt 6660
tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac tgagagtgca 6720
ccataccaca gcttttcaat tcaattcatc attttttttt tattcttttt tttgatttcg 6780
gtttctttga aatttttttg attcggtaat ctccgaacag aaggaagaac gaaggaagga 6840
gcacagactt agattggtat atatacgcat atgtagtgtt gaagaaacat gaaattgccc 6900
agtattctta acccaactgc acagaacaaa aacctgcagg aaacgaagat aaatcatgtc 6960
gaaagctaca tataaggaac gtgctgctac tcatcctagt cctgttgctg ccaagctatt 7020
taatatcatg cacgaaaagc aaacaaactt gtgtgcttca ttggatgttc gtaccaccaa 7080
ggaattactg gagttagttg aagcattagg tcccaaaatt tgtttactaa aaacacatgt 7140
ggatatcttg actgattttt ccatggaggg cacagttaag ccgctaaagg cattatccgc 7200
caagtacaat tttttactct tcgaagacag aaaatttgct gacattggta atacagtcaa 7260
attgcagtac tctgcgggtg tatacagaat agcagaatgg gcagacatta cgaatgcaca 7320
cggtgtggtg ggcccaggta ttgttagcgg tttgaagcag gcggcagaag aagtaacaaa 7380
ggaacctaga ggccttttga tgttagcaga attgtcatgc aagggctccc tatctactgg 7440
agaatatact aagggtactg ttgacattgc gaagagcgac aaagattttg ttatcggctt 7500
tattgctcaa agagacatgg gtggaagaga tgaaggttac gattggttga ttatgacacc 7560
cggtgtgggt ttagatgaca agggagacgc attgggtcaa cagtatagaa ccgtggatga 7620
tgtggtctct acaggatctg acattattat tgttggaaga ggactatttg caaagggaag 7680
ggatgctaag gtagagggtg aacgttacag aaaagcaggc tgggaagcat atttgagaag 7740
atgcggccag caaaactaaa aaactgtatt ataagtaaat gcatgtatac taaactcaca 7800
aattagagct tcaatttaat tatatcagtt attaccctat gcggtgtgaa ataccgcaca 7860
gatgcgtaag gagaaaatac cgcatcagga aattgtaaac gttaatattt tgttaaaatt 7920
cgcgttaaat ttttgttaaa tcagctcatt ttttaaccaa taggccgaaa tcggcaaaat 7980
cccttataaa tcaaaagaat agaccgagat agggttgagt gttgttccag tttggaacaa 8040
gagtccacta ttaaagaacg tggactccaa cgtcaaaggg cgaaaaaccg tctatcaggg 8100
cgatggccca ctacgtgaac catcacccta atcaagtttt ttggggtcga ggtgccgtaa 8160
agcactaaat cggaacccta aagggagccc ccgatttaga gcttgacggg gaaagccggc 8220
gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg ggcgctaggg cgctggcaag 8280
tgtagcggtc acgctgcgcg taaccaccac acccgccgcg cttaatgcgc cgctacaggg 8340
cgcgtcgcgc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 8400
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 8460
aacgccaggg ttttcccagt cacgacgggc gcgccgttta aac 8503
<210> 5
<211> 20
<212> DNA
<213> Primer
<400> 5
ccgtcaaggt acgagaaacc 20
<210> 6
<211> 20
<212> DNA
<213> Primer
<400> 6
agtttgacag tgcccagagc 20
<210> 7
<211> 20
<212> DNA
<213> primer
<400> 7
ttcttaacac cgagggttgg 20
<210> 8
<211> 20
<212> DNA
<213> Primer
<400> 8
agcctggaag gcctatctgg 20
<210> 9
<211> 20
<212> DNA
<213> Primer
<400> 9
acaacaacct cttccctcct 20
<210> 10
<211> 18
<212> DNA
<213> Primer
<400> 10
tcgtgaaagc ctcctcca 18
<210> 11
<211> 18
<212> DNA
<213> Primer
<400> 11
acaacgaagc cattgcca 18
<210> 12
<211> 20
<212> DNA
<213> Primer
<400> 12
caaccatgta gccgtaggag 20
<210> 13
<211> 20
<212> DNA
<213> Primer
<400> 13
gtttcggttt ttgagaacgg 20
<210> 14
<211> 20
<212> DNA
<213> Primer
<400> 14
cgtcctaaag cgtccaatcg 20
<210> 15
<211> 20
<212> DNA
<213> Primer
<400> 15
ggtgacgtat ctgatgaggg 20
<210> 16
<211> 20
<212> DNA
<213> Primer
<400> 16
cacaaatctt cctcgaccac 20
<210> 17
<211> 20
<212> DNA
<213> Primer
<400> 17
gtggtcgagg aagatttgtg 20
<210> 18
<211> 20
<212> DNA
<213> Primer
<400> 18
tcacaaatgg tttcccacct 20
<210> 19
<211> 15882
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleic acids
<400> 19
tgcgcaagcg cccttcatct cttcagccga gaatctgttg cctaattaca tagtagatgc 60
tgggaacagt ctgagaagcc tgcgcaggtt cttcattaat taccaagaac gcgggagagg 120
tgggaagacg ccgaaaactc gacgcggacc attcgctgtt ttccgatctt acaaaaaaaa 180
ggtatccgat ttggggaacg tcgatgaaag tattgcaaaa gtgacgagag ttgcgcaact 240
aactcgctgc cgaagaagct gcggaagaaa gagaacaccg aaagtggaat aacgttacgg 300
atgtcctgac ctcaaagttg aaaccagccc ttcctgctct atttgggaaa gcggcttgcc 360
cttgaatgcg ctgcactgtg gcacgactac cagtgatcgg gaggagcaaa ctaccctggt 420
ccgttccttg gtggggcggc actaggccca acttagggtg atcggaggtc gatgccgcgg 480
tcctcgttgg tctgggctct tctcatttcc cggtttgcac cccccgttgc acctgctgat 540
cgcccgccaa cgccgatgag gttgcgccca gaccgacaat caccgcggct gcattcccaa 600
gtatattgaa gatggcacca ggtacccggt tttgcgtccc agtcgtttgg tgccaaattt 660
gggagttttt gagcctcaag atctggggaa atcgacctca acttccatac aagttaaagt 720
cgcacacacg gcgagttcca cgaagagaca catttttttc tgaaggcctc tctccccgca 780
catcagaaac caccaaatac caagactgca gaagccgggg taagtgggcc accgggacta 840
cactaaaatg cggggagaag cgagatccgt tgcgaaggga agggatgggg tgtgctgcgg 900
ctttctccgc tctcgtgcgc cttttgcttg aatctagtgt acaccagggt aggctccgaa 960
ggagtatcta cggcagcgct gttcgtgctg cgttgagagt cagggcggag acgagcaggc 1020
gacaggagcc tcgcaccggc acttcggatc gcatttgcgc ggagcgtcaa atacgctctt 1080
ctgcggtcat cagagagcat cgtgaaccaa ggttcttccg cagggcggcc tgggcttcgc 1140
agagtcgcac tcggcggacg ccttccgtgt cacccctgat aacctggctg ccgcgcccag 1200
actcctccaa tgaggtgtgt ggttgccctc gccgaccctt cagcaacctt aatcgcttcc 1260
atcgcacggc tccacgtcct cgaacgatgc cctcagtccg tgcccggccg tggcaaccat 1320
aacgtgacat cgccgcccag cctactagcc gctatcgacc ggttaggctt gtcaccgcag 1380
cgcccattct ccatcgggcc tctactctga tccacctcac ccaccgcaag cactagcgag 1440
cctcaccaga gtgcaagcga cacgacccgc ttggcccttc gtccttgact atctcccaga 1500
cctcttgcca tcttgccgac gccgccccct tttttttctc ctccccctgc cggcaggtcg 1560
gtggccccag tcccgagatg gcattgctcc gttgtccatg acgacccatc attcgatggc 1620
tgactggcac actcgtcttg tttgagcatc gacggcccgc ggcccgtctc ccacggtacg 1680
gaacctcgtt gtacagtacc tctcgtaatg atacccaaca ccggggccga gcgctgggag 1740
ggcggcgttc ccgagaagcc gggaaggcgg ctggccggct gacctttgtg acttggcgat 1800
ggatgcggcc atggagaatg tccgtccgaa gcgacgcgac aattagcctg gctaccatcg 1860
atataaattg ggtgattccc agctcttgat gggcgtgtct tctgcctggc agccctcgtc 1920
ttcagatcaa gcaactgtgt gctgatcctc ttccgcccgc cggcgggttg ccacggtcac 1980
ggaatgatgg agcgggtctg acacaccaaa cactcgataa gcagagcggc gatgtccatg 2040
ctccggaaca gccagcccga gttgccgtcg cccatagtgt tccaagtaag cgtatgggac 2100
gagaagaaag aagagaaaag aagaagagag ccgcccggct cgttcagagt cggccgcacg 2160
gttcggtttc ctgggagcga agggacgtga atcgccagag cgaccgaggt ttagccacgg 2220
caagaaagca aaatccggag ttttgccaga gagggcgcgc atcgctaaag tgctccttgg 2280
cccggatgcg tctcgtctcg cctcagagag atggataccc cgtgccttgg ctagaaagcc 2340
tggcttgcga gatgctcctc tcggcgcggg cggcgtggtg ccgtggttcg tttgctgagc 2400
tagaacgacg cccctgcgcg tgaccagcgt gtttttggtt tgttcacccc cagaatcagc 2460
cgaggtttac ccagccggag cgctcgtcag gtccttcacg ggccgtggat ccggaaacta 2520
tgcgaaggtg gagagagcga ctcggagcga ctttcgcgat tattctggcg agttttcgag 2580
ggcgcggtaa ctgcgaaagc tgaccttctt caattcaatc aacaatggaa ggagaggtcg 2640
aattcggagg tttacccccc ccccgcgcca aaatagtctc tcccaggtgc ccatgtaagg 2700
cacgggaata cctgcctaac ttggggttgg gaaagaaaag aaaggcagga aaaaaataca 2760
ctatcatacc atgctcaagc tttctctttc cagaaacatg tgtttcgggt tctccttccg 2820
tgctcccaga gctggccctt tggcccgttg ggggttggcg gggcccaagg gtgcgctagt 2880
ggggctcctc agtctccgca atatcgtgca tcgcaacgcg caaggccctt gcccactatc 2940
aacagccccc cggattgctg accgttggcc attcacggcc cttcgtttgc cagtccttcg 3000
ccagggtcaa cctaccccgc ggtggggggt tgttcttgga tccttgtcga ggccccggct 3060
gcccacatcg cccacgctgt gcactcagcg taacacaggg cccggatctc tcaagcgatg 3120
cccagctttt tttcatcggt gttgacggtc cgaaactcgc gggagagatg ggggcagatc 3180
atggcgggaa acggccgtga tggttcctgg atataaagga gatcaggcct tccctcctcg 3240
gctcattggg gcctactagc acatcatcat ccgtcttcca tccctcctca gaacttcctt 3300
ccccttcctc ctatccacct ttcccttact cacacagaca atcgtccatc gtccaccatg 3360
tacgccaagt tcgccaccct ggccgccctg gtcgccggcg ccgccgccga gatcgtcctc 3420
acccagtcgc ccgccaccct ctccctgagc cccggcgagc gcgccaccct gtcctgccgc 3480
gcctcccagt cggtctcctc ctacctggcc tggtaccagc agaagcccgg ccaggccccc 3540
aggctcctga tctacgacgc ctcgaaccgc gccaccggca tccccgcccg cttcagcggc 3600
tcgggctccg gcaccgactt caccctcacc atcagctccc tggagcccga ggacttcgcc 3660
gtctactact gccagcagtc gagcaactgg ccccgcacct tcggccaggg caccaaggtc 3720
gagatcaagc gcaccgtcgc cgccccctcg gtcttcatct tcccgccctc ggacgagcag 3780
ctcaagtcgg gcaccgcctc cgtcgtctgc ctcctgaaca acttctaccc gcgcgaggcc 3840
aaggtccagt ggaaggtcga caacgccctc cagagcggca actcccagga gtcggtcacc 3900
gagcaggaca gcaaggactc cacctactcg ctgtcctcga ccctcaccct gagcaaggcc 3960
gactacgaga agcacaaggt ctacgcctgc gaggtcaccc accagggcct gagctccccc 4020
gtcaccaagt ccttcaaccg cggcgagtgc taaggcaggc aggagttgga gtatgagggt 4080
agccgctgat ggctattctt cccacgtttt tgtgtgtttc ctcttcattt ttttttctct 4140
tgccgcaaca tgacggctcc tgtctctgaa gggaacccct gaaattcagg gttatcatga 4200
cttggttacg aatgagctac gacatgttca attgagtgac tctttactac caaagtactg 4260
ctaccatgac actcgaatcg tctcgtgact gaaaggagaa tcatgttggc attggttcgc 4320
gtagtacgga gtaacgacaa cggcattggt caacatctgg caggtatttg aggtagaata 4380
taccaacctg cctgaggctc tcggtatcaa gatttggaag gccaaagggt tggatgagca 4440
cttgagagca aagtcggact actggctgaa gaaggtaaac aaactaacgt acagtaccta 4500
cttaacttat gatacacgtc cgcgcgcggg cgcgccttat cggacggcct gatttgcggc 4560
atgcctcatc gcggcgaaac tgctgataag acctgctgcc gcagtccgcc cattcctgtg 4620
tctgacgcac accgattggg gcatgtccgc ggaaaaagag acgatcctct ccactaggtg 4680
gtttccgcct ttaacggatc gaggaaacat tagttgttag tagtaacacg ccttgaacgc 4740
cttgatctcc ggggctcctc ctcggacgac cgcggaccgc cggtcagagt gggtgggtac 4800
accacactac acgatactat cgcgcatcgt cgttgtccct gctctctccc catatggcgt 4860
cacggggtag tatatattct acacggagct ggagccaagg caggcccacc gtacggatta 4920
caccgccatg gttccaagtt tcttcgccat tgaatctgtt attcgtgtac tagtagatca 4980
agccattgcc ggttgccgat atcatgcaac tccggtcagg ccacggagaa gccatgcccg 5040
ctacgggttg atgttccctg ttccctttca taaacgggaa taagacgaag tgcgcggcgg 5100
gagttgggag cccatacccg acctcgatgc tttccccggt tcttccattc cctagtacta 5160
gtgtagctat ttcagagtct tcatgccagc ccttccccgg aggcccctgg cgccccccca 5220
ccccttcctc tcctggcgag agtgcacaca gtctttttgt acagtcttgg tcccatctag 5280
tgggcgtttt ccccttcttt cgtccccatt gtccgtagag agagtgttgg gtccgaccgc 5340
ctaccgacga caatggagat ggcgccctcg acgacctcct cctcttcttc ccttgaaggg 5400
tccccgatga ccttcccatc acacctgccg ccaacccctc cgctgcagga ttttgacgaa 5460
tatcagaaac taggtctcag cctgccgaca gatggcctcg gacgatccgt ccctccgtac 5520
cctctccctc cgccgtcgag gcagaacaag gtgctgcccg aggacctcaa aacgccggat 5580
gaccacgtgg agcgggaccc ccgcctgatc cggctcaccg gagtccaccc cttcaacgtc 5640
gagccccccc tgaccgacct ctttgacgaa ggcttcctga ccaccaagga cctgcactac 5700
gtccgcaacc atggcgccgt cccccgggtc gaggactcat ccgtgctcga ctgggacttc 5760
accgtcgagg gcatggtcgc ccacccgatc acgctcacgc tgcgcgacct gatccggacg 5820
tacgaccagg tgacgtaccc ggtcaccctg gtgtgcgcgg gcaaccggcg caaggagcag 5880
aacgtggtgc gcaagaccaa gggtttctcg tggggtgccg ccggcctgtc gacggcgctg 5940
tggacgggcg tcgccctgcc cgacctcctc gcccgcgccg ccccgctgcg cggtgcgcgg 6000
tacgtctgct tcgagggcgc cgaccgcctg cccaacggct gctacggcac ctcggtccgc 6060
ctcggctggg ccacggaccc ggcgcgtggc atcatgctcg cccaccgcat gaacggcgag 6120
ccgctgcccc cggaccacgg caagcccctc cgcgtcatca tcccgggcca gatcggcggc 6180
aggagcgtca agtggctcaa gcgcatcatc gtcacggcga agcccagcga cagctggtac 6240
cacatctacg acaaccgcgt gctgcccacc gtgatcagcc ccgaggagag cgccgaccgg 6300
cccgacgtct ggaaggacga gcggtacgcc atctacgacc tcaacaccaa cagcgccatc 6360
tgctatccgg cgcacgacga gagggtgccg ctcgggatcg cgcgcgggga cgcggcgacg 6420
tacaagctgc gggggtacgc ctacgccggc ggcggcaaga gggtgacccg tctggaggtg 6480
acgctcgacc agggccggac gtggatgctg gcgaccatgt cgtacccgga agacctgtac 6540
cggctcgcgc ccgaggggga gacgctgttt ggcgggaggc tggacgtgtc ctggcgcgag 6600
acgtgcttct gctggtgctt ctggtcgctg gacgtgccgc tgtcgcggct gcgagacgcc 6660
cgcgacgtca tgatccgggc gatggacgag tccatgatgg tgcagccgcg ggacatgtac 6720
tggagcgtgc tgggcatgat gaacaaccca tggtaccggg tcgtcatcca caaggagagc 6780
gacacgttgc gattcgagca ccccacccag ccggcgctga tgcccggcgg ttggatggag 6840
cgggtcaaga aagaaggggg caaccttacc aatgggtttt ggggcgagaa ggtgggcggc 6900
caggacgcgg cgccggccga cgaggctccc gccgccaaag agatcagcat ggtaaacgag 6960
aaggtcaccc gccgcatcac ccccgaagaa ctccgccagc actcgggcga ggatgagccg 7020
tggttcgtcg tcaacggcca ggtctatgac ggcaccaagt tcctcgaagg ccatcccggc 7080
ggcgccgcct ccatcatcaa cgccgcggga caagacgtga gcgaggagtt cctcgcgatt 7140
cgtaagttgc cctccctcct tcctttcttc cccccctccc accccctctc ccttcttccc 7200
ttccaaattt atctcggcaa ccaaccctga cacggccaaa aaaaaaaaaa aaaaaacgaa 7260
acacagacag cgagaacgcc aaggccatga tgccgagtta ccacattggc acgctgccgg 7320
cctcggccga cctctccgag gagccctcgg acgaggcggt ctcctcctcc tccgccgtct 7380
tcctccaacc caaaacctgg cgccgcgccc tcctcgcctc caagacggcc gtatcaccgg 7440
acaccaaggt cttccacttc accctgccct cgccggcgca ggccgtcggc ctcccggtgg 7500
gccagcacct cctcgtccgc ctgcgcgacc cggtcacgcg cgaggccatc atccgcgcct 7560
acacgccgct gtccgagggc ggcgaggtgg gcaccctgcg cgtgctcgtc aagatctacc 7620
gcgactcgcc cgacgggtcg cgcaagggcg gccgcatgac gcaggcgctc gactccctgc 7680
ccgtcggcca ccccgtcgag ttcaagggcc ccgtgggcaa gttcgagtac ctgggcgcgg 7740
ggaggtgcgt cgtcggcggc cgggagcgga cggtcgcccg gttcgtcatg gtctgcggcg 7800
ggtccggcgt gacccccatc tttgccgtcc tccgggccgt ggcgaggggc gagcgggacg 7860
agacggcgtg tctggtgctc gacggcaacc gcggggaagg ggacatcttg ctgcgcgagg 7920
aactggatgg gctggtgcgg gagagccggg ggaggtgtag gattgtgcac gctctgagca 7980
ggccgagaga cgggtggaag gggttgaagg ggcggatgga tagggccttc ttcgagaggg 8040
aggttggcgc tccgccggct gaaaggaacg cgatggtatt aatttgcggg cccgaaggca 8100
tggagaaggc agcgagggaa gcattcttgg ggatgggctg ggatgaggac gatctccttt 8160
tcttttagtt tagcatcatg acatgaactt tggaagggcg acgtggcgtt ggcaggcgtc 8220
gggaaaatgc atggtcccgg tattcttgtt tttgattcta agagggaggg ggggaagggg 8280
gagagaaatg taaagaaaag ggcacagcca tgattcatga ttctcaaatg accgaccact 8340
ctggcgaact cgaggggcca tgaaagagag tcctcaaggt tgaaccgcac atcaaccgag 8400
gtggggtgcc gtgaaggaag ggtgaagtgg cgctgcagaa ctgatttccc cggaggtact 8460
caatctttag gcggagactt ccagtttagc ttgtttatta gcccagctgc ttgcatctcc 8520
ggcgctgtca gccgagaatg gaaggcaccg tgtaacgcag agcacgattt ggtgtatttc 8580
atccgtataa ttaactaggg aaaagtgagc tggaaatacg caggtactgt acggattacc 8640
ttcgttgcac aatttaaatt ctccttagct ctgtacagtg accggtgact ctttctggca 8700
tgcggagaga cggacggacg cagagagaag ggctgagtaa taagcgccac tgcgccagac 8760
agctctggcg gctctgaggt gcagtggatg attattaatc agggaccggc cgcccctccg 8820
ccccgaagtg gaaaggctgg tgtgcccctc gttgaccaag aatctattgc atcatcggag 8880
aatatggagc ttcatcgaat caccggcagt aagcgaagga gaatgtgaag ccaggggtgt 8940
atagccgtcg gcgaaatagc atgccattaa cctaggtaca gaagtccaat tgcttccgat 9000
ctggtaaaag attcacgaga tagtaccttc tccgaagtag gtagagcgag tacccggcgc 9060
gtaagctccc taattggccc atccggcatc tgtagggcgt ccaaatatcg tgcctctcct 9120
gctttgcccg gtgtatgaaa ccggaaaggc cgctcaggag ctggccagcg gcgcagaccg 9180
ggaacacaag ctggcagtcg acccatccgg tgctctgcac tcgacctgct gaggtccctc 9240
agtccctggt aggcagcttt gccccgtctg tccgcccggt gtgtcggcgg ggttgacaag 9300
gtcgttgcgt cagtccaaca tttgttgcca tattttcctg ctctccccac cagctgctct 9360
tttcttttct ctttcttttc ccatcttcag tatattcatc ttcccatcca agaaccttta 9420
tttcccctaa gtaagtactt tgctacatcc atactccatc cttcccatcc cttattcctt 9480
tgaacctttc agttcgagct ttcccacttc atcgcagctt gactaacagc taccccgctt 9540
gagcagacat caccatgcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa 9600
agttcgacag cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca 9660
gcttcgatgt aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct 9720
acaaagatcg ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc 9780
ttgacattgg ggaattcagc gagagcctga cctattgcat ctcccgccgt gcacagggtg 9840
tcacgttgca agacctgcct gaaaccgaac tgcccgctgt tctgcagccg gtcgcggagg 9900
ccatggatgc gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac 9960
cgcaaggaat cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc 10020
atgtgtatca ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc 10080
tcgatgagct gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg 10140
atttcggctc caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga 10200
gcgaggcgat gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt 10260
ggttggcttg tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag 10320
gatcgccgcg gctccgggcg tatatgctcc gcattggtct gtttaaacgc tgtttcctgt 10380
gtgaaattgt tatccgctca caattccaca caacatagga gccggaagca taaagtgtaa 10440
agcctggggt gcctaatgag tgaggtaact cacattaatt gcgttgcgct cactgcccgc 10500
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 10560
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 10620
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 10680
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 10740
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 10800
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 10860
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 10920
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 10980
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 11040
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 11100
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 11160
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 11220
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 11280
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 11340
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 11400
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 11460
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 11520
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc 11580
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg 11640
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat 11700
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat 11760
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg 11820
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc 11880
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa 11940
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc 12000
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt 12060
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag 12120
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt 12180
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag 12240
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac 12300
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc 12360
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca 12420
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 12480
ggttccgcgc acatttcccc gaaaagtgcc acctgaacga agcatctgtg cttcattttg 12540
tagaacaaaa atgcaacgcg agagcgctaa tttttcaaac aaagaatctg agctgcattt 12600
ttacagaaca gaaatgcaac gcgaaagcgc tattttacca acgaagaatc tgtgcttcat 12660
ttttgtaaaa caaaaatgca acgcgagagc gctaattttt caaacaaaga atctgagctg 12720
catttttaca gaacagaaat gcaacgcgag agcgctattt taccaacaaa gaatctatac 12780
ttcttttttg ttctacaaaa atgcatcccg agagcgctat ttttctaaca aagcatctta 12840
gattactttt tttctccttt gtgcgctcta taatgcagtc tcttgataac tttttgcact 12900
gtaggtccgt taaggttaga agaaggctac tttggtgtct attttctctt ccataaaaaa 12960
agcctgactc cacttcccgc gtttactgat tactagcgaa gctgcgggtg cattttttca 13020
agataaaggc atccccgatt atattctata ccgatgtgga ttgcgcatac tttgtgaaca 13080
gaaagtgata gcgttgatga ttcttcattg gtcagaaaat tatgaacggt ttcttctatt 13140
ttgtctctat atactacgta taggaaatgt ttacattttc gtattgtttt cgattcactc 13200
tatgaatagt tcttactaca atttttttgt ctaaagagta atactagaga taaacataaa 13260
aaatgtagag gtcgagttta gatgcaagtt caaggagcga aaggtggatg ggtaggttat 13320
atagggatat agcacagaga tatatagcaa agagatactt ttgagcaatg tttgtggaag 13380
cggtattcgc aatattttag tagctcgtta cagtccggtg cgtttttggt tttttgaaag 13440
tgcgtcttca gagcgctttt ggttttcaaa agcgctctga agttcctata ctttctagag 13500
aataggaact tcggaatagg aacttcaaag cgtttccgaa aacgagcgct tccgaaaatg 13560
caacgcgagc tgcgcacata cagctcactg ttcacgtcgc acctatatct gcgtgttgcc 13620
tgtatatata tatacatgag aagaacggca tagtgcgtgt ttatgcttaa atgcgtactt 13680
atatgcgtct atttatgtag gatgaaaggt agtctagtac ctcctgtgat attatcccat 13740
tccatgcggg gtatcgtatg cttccttcag cactaccctt tagctgttct atatgctgcc 13800
actcctcaat tggattagtc tcatccttca atgctatcat ttcctttgat attggatcat 13860
actaagaaac cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct 13920
ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga 13980
cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag 14040
cgggtgttgg cgggtgtcgg ggctggctta actatgcggc atcagagcag attgtactga 14100
gagtgcacca taccacagct tttcaattca attcatcatt ttttttttat tctttttttt 14160
gatttcggtt tctttgaaat ttttttgatt cggtaatctc cgaacagaag gaagaacgaa 14220
ggaaggagca cagacttaga ttggtatata tacgcatatg tagtgttgaa gaaacatgaa 14280
attgcccagt attcttaacc caactgcaca gaacaaaaac ctgcaggaaa cgaagataaa 14340
tcatgtcgaa agctacatat aaggaacgtg ctgctactca tcctagtcct gttgctgcca 14400
agctatttaa tatcatgcac gaaaagcaaa caaacttgtg tgcttcattg gatgttcgta 14460
ccaccaagga attactggag ttagttgaag cattaggtcc caaaatttgt ttactaaaaa 14520
cacatgtgga tatcttgact gatttttcca tggagggcac agttaagccg ctaaaggcat 14580
tatccgccaa gtacaatttt ttactcttcg aagacagaaa atttgctgac attggtaata 14640
cagtcaaatt gcagtactct gcgggtgtat acagaatagc agaatgggca gacattacga 14700
atgcacacgg tgtggtgggc ccaggtattg ttagcggttt gaagcaggcg gcagaagaag 14760
taacaaagga acctagaggc cttttgatgt tagcagaatt gtcatgcaag ggctccctat 14820
ctactggaga atatactaag ggtactgttg acattgcgaa gagcgacaaa gattttgtta 14880
tcggctttat tgctcaaaga gacatgggtg gaagagatga aggttacgat tggttgatta 14940
tgacacccgg tgtgggttta gatgacaagg gagacgcatt gggtcaacag tatagaaccg 15000
tggatgatgt ggtctctaca ggatctgaca ttattattgt tggaagagga ctatttgcaa 15060
agggaaggga tgctaaggta gagggtgaac gttacagaaa agcaggctgg gaagcatatt 15120
tgagaagatg cggccagcaa aactaaaaaa ctgtattata agtaaatgca tgtatactaa 15180
actcacaaat tagagcttca atttaattat atcagttatt accctatgcg gtgtgaaata 15240
ccgcacagat gcgtaaggag aaaataccgc atcaggaaat tgtaaacgtt aatattttgt 15300
taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag gccgaaatcg 15360
gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt gttccagttt 15420
ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga aaaaccgtct 15480
atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg gggtcgaggt 15540
gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct tgacggggaa 15600
agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc gctagggcgc 15660
tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt aatgcgccgc 15720
tacagggcgc gtcgcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg 15780
tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa 15840
gttgggtaac gccagggttt tcccagtcac gacggtttaa ac 15882
<210> 20
<211> 11788
<212> DNA
<213> Artificial sequence
<220>
<223> Nucleic acids
<400> 20
tcgaaaagtt cgacagcgtc tccgacctga tgcagctctc ggagggcgaa gaatctcgtg 60
ctttcagctt cgatgtagga gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg 120
gtttctacaa agatcgttat gtttatcggc actttgcatc ggccgcgctc ccgattccgg 180
aagtgcttga cattggggaa ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac 240
agggtgtcac gttgcaagac ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg 300
cggaggccat ggatgcgatc gctgcggccg atcttagcca gacgagcggg ttcggcccat 360
tcggaccgca aggaatcggt caatacacta catggcgtga tttcatatgc gcgattgctg 420
atccccatgt gtatcactgg caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc 480
aggctctcga tgagctgatg ctttgggccg aggactgccc cgaagtccgg cacctcgtgc 540
acgcggattt cggctccaac aatgtcctga cggacaatgg ccgcataaca gcggtcattg 600
actggagcga ggcgatgttc ggggattccc aatacgaggt cgccaacatc ttcttctgga 660
ggccgtggtt ggcttgtatg gagcagcaga cgcgctactt cgagcggagg catccggagc 720
ttgcaggatc gccgcggctc cgggcgtata tgctccgcat tggtcttgac caactctatc 780
agagcttggt tgacggcaat ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa 840
tcgtccgatc cggagccggg actgtcgggc gtacacaaat cgcccgcaga agcgcggccg 900
tctggaccga tggctgtgta gaagtactcg ccgatagtgg aaaccgacgc cccagcactc 960
gtccgagggc aaaggaatag agtagatgcc gaccgggatc cacttaacgt tactgaaatc 1020
atcaaacagc ttgacgaatc tggatataag atcgttggtg tcgatgtcag ctccggagtt 1080
gagacaaatg gtgttcagga tctcgataag atacgttcat ttgtccaagc agcaaagagt 1140
gccttctagt gatttaatag ctccatgtca acaagaataa aacgcgtttc gggtttacct 1200
cttccagata cagctcatct gcaatgcatt aatgcattgg acctcgcaac cctagtacgc 1260
ccttcaggct ccggcgaagc agaagaatag cttagcagag tctattttca ttttcgggag 1320
acgagatcaa gcagatcaac ggtcgtcaag agacctacga gactgaggaa tccgctcttg 1380
gctccacgcg actatatatt tgtctctaat tgtactttga catgctcctc ttctttactc 1440
tgatagcttg actatgaaaa ttccgtcacc agcccctggg ttcgcaaaga taattgcact 1500
gtttcttcct tgaactctca agcctacagg acacacattc atcgtaggta taaacctcga 1560
aaatcattcc tactaagatg ggtatacaat agtaaccatg catggttgcc tagtgaatgc 1620
tccgtaacac ccaatacgcc ggccgaaact tttttacaac tctcctatga gtcgtttacc 1680
cagaatgcac aggtacactt gtttagaggt aatccttctt tctagaagga gaatttaaat 1740
catgacttgg ttacgaatga gctacgacat gttcaattga gtgactcttt actaccaaag 1800
tactgctacc atgacactcg aatcgtctcg tgactgaaag gagaatcatg ttggcattgg 1860
ttcgcgtagt acggagtaac gacaacggca ttggtcaaca tctggcaggt atttgaggta 1920
gaatatacca acctgcctga ggctctcggt atcaagattt ggaaggccaa agggttggat 1980
gagcacttga gagcaaagtc ggactactgg ctgaagaagg taaacaaact aacgtacagt 2040
acctacttaa cttatgatac acgtcggcgc gcccgcgcgc gacgggcagg tgagaaatcg 2100
atgtgtgtct ccgtcacaaa cctctgcagc agctcgcggc cggcgaacat cggtatgtaa 2160
gttaggtagg ttgacaagac gggcatggtg caggtgtggt tggtagggga gatgtctagc 2220
ctgaagccat acgaagaatg tattgtccat gtgtatgtac aagcgaagcg aatgaaatgc 2280
ccaaaccggg ggcaaaacac tgaacgatag gtacaacatg aaagaaacac catgcatcga 2340
tgtgtgtgct cgcaagcata ccactggtcc tcccgagccc caagaagcgg tcccgcaaag 2400
cgaaggagga ggaggaggag gaagaagaag aagaagaaga agaagaagaa gaagtgaaaa 2460
gagaaatgag aagaagaaaa aaggcccagg gccaaacaat gaacaacaag aggaaaacaa 2520
aacaaaaaat atgtataacg aatggagaga aaaaagaaaa gcggctaata ataatgcaaa 2580
ccatccaaga agagaaaacg aaggtaaaca tgtccaggct tcaaaatggt ttgccgaatc 2640
agtacggctt catgctccct ctctctctct ctctctctct ctctccagct cccctctctc 2700
gaccaggact cgggaggtca tagggcctta attaattact tgccgaggga caggctgagc 2760
gacttctggg tgtagtggtt gtggagggcc tcgtgcatga cggagcagct gaagacgttg 2820
ccctcttgcc agcggctctt gtcgacggtg aggcgggagt acaggaagaa cgagccgtcc 2880
gagtccagga cgggcggggt ggtcttgtag ttgttctcgg gctggccgtt ggactcccac 2940
tcgacggcga tgtcgctggg gtagaagccc ttgacgaggc aggtcagcga gacctggttc 3000
ttggtcatct cctcttggga gggcgggagg gtgtagacct ggggctcgcg gggctggccc 3060
ttggccttcg agatggtctt ctcgatcgag gaggggaggc ccttgttcga gaccttgcac 3120
ttgtactcct tgccgttcag ccagtcctgg tggaggacgg tcaggaccga gacgacgcgg 3180
taggtggagt tgaactgctc ctcgcggggc ttggtcttgg cgttgtggac ctcgacgccg 3240
tcgacgtacc agttgaactg gacctcgggg tcctcttggg agacgtcgac gacgacgcag 3300
gtgacctcgg gcgtgcgcga gatcatgagg gtgtccttgg gcttgggcgg gaagaggaag 3360
acggaggggc cgcccaggaa ctcgggggcg gggcagggcg ggcagggagg gccgtacttg 3420
ctctcgacgc gcttgtcgac cttggtgttc gagggcttgt ggtcgacgtt gcaggtgtag 3480
gtcttggtgc ccaggctgga ggaggggacg gtgacgacgc tcgagagcga gtacaggccc 3540
gagctctgga ggacggcggg gaaggtgtgg acgcccgagg tcagggcgcc cgagttccac 3600
gagacggtga cgggctcggg gaagtagtcc ttgacgaggc agcccagggc ggcggtcgac 3660
tccgaggtgc tgcgcgagca gggggccagg gggaagacgc tggggccctt ggtggaggcg 3720
gaggagacgg tgaccagggt gccctggccc cagtagtcgt cgttggtggc gcagtagtag 3780
acggcggtgt cctcggcgcg cagggagttc atctgcagga agagggtgtt cttggagttg 3840
tcgcggctga tggtgaagcg gcccttgacg gagtcggcgt agtagcgctt gctgccgtcg 3900
taccagatga cggcgaccca ctcgaggccc ttgccggggg cctggcggac ccagtgcatg 3960
ccggagttgc tgaaggtgat gcccgaggcc ttgcagtcca ggcggaggga gcggccgggc 4020
tggacgacgc cgccgccgga ctcgaccagc tggacctggg cggcggcgcc ggcgacgagg 4080
gcggcgaggg tggcgaactt ggcgtacatg gtggacgatg gacgattgtc tgtgtgagta 4140
agggaaaggt ggataggaga aaggggaagg aagttctgag gagggatgga agacggatga 4200
tgatgtgcta gtaggcccca atgagccgag gagggaaggc ctgatctcct ttatatccag 4260
gaaccatcac ggccgtttcc cgccatgatc tgcccccatc tctcccgcga gtttcggacc 4320
gtcaacaccg atgaaaaaaa gctgggcatc gcttgagaga tccgggccct gtgttacgct 4380
gagtgcacag cgtgggcgat gtgggcagcc ggggcctcga caaggatcca agaacaaccc 4440
cccaccgcgg ggtaggttga ccctggcgaa ggactggcaa acgaagggcc gtgaatggcc 4500
aacggtcagc aatccggggg gctgttgata gtgggcaagg gccttgcgcg ttgcgatgca 4560
cgatattgcg gagactgagg agccccacta gcgcaccctt gggccccgcc aacccccaac 4620
gggccaaagg gccagctctg ggagcacgga aggagaaccc gaaacacatg tttctggaaa 4680
gagaaagctt gagcatggta tgatagtgta tttttttcct gcctttcttt tctttcccaa 4740
ccccaagtta ggcaggtatt cccgtgcctt acatgggcac ctgggagaga ctattttggc 4800
gcgggggggg ggtaaacctc cgaattcgac ctctccttcc attgttgatt gaattgaaga 4860
aggtcagctt tcgcagttac cgcgccctcg aaaactcgcc agaataatcg cgaaagtcgc 4920
tccgagtcgc tctctccacc ttcgcatagt ttccggatcc acggcccgtg aaggacctga 4980
cgagcgctcc ggctgggtaa acctcggctg attctggggg tgaacaaacc aaaaacacgc 5040
tggtcacgcg caggggcgtc gttctagctc agcaaacgaa ccacggcacc acgccgcccg 5100
cgccgagagg agcatctcgc aagccaggct ttctagccaa ggcacggggt atccatctct 5160
ctgaggcgag acgagacgca tccgggccaa ggagcacttt agcgatgcgc gccctctctg 5220
gcaaaactcc ggattttgct ttcttgccgt ggctaaacct cggtcgctct ggcgattcac 5280
gtcccttcgc tcccaggaaa ccgaaccgtg cggccgactc tgaacgagcc gggcggctct 5340
cttcttcttt tctcttcttt cttctcgtcc catacgctta cttggaacac tatgggcgac 5400
ggcaactcgg gctggctgtt ccggagcatg gacatcgccg ctctgcttat cgagtgtttg 5460
gtgtgtcaga cccgctccat cattccgtga ccgtggcaac ccgccggcga cgaacctctc 5520
tgaaggaggt tctgagacac gcgcgattct tctgtatata gttttatttt tcactctgga 5580
gtgcttcgct ccaccagtac ataaaccttt tttttcacgt aacaaaatgg cttcttttca 5640
gaccatgtga accatcttga tgccttgacc tcttcagttc tcactttaac gtagttcgcg 5700
tttgtctgta tgtcccagtt gcatgtagtt gagataaata cccctggaag tgggtctggg 5760
cctttgtggg acggagccct ctttctgtgg tctggagagc ccgctctcta ccgcctacct 5820
tcttaccaca gtacactact cacacattgc tgaactgacc catcataccg tactttatcc 5880
tgttaattcg tggtgctgtc gactattcta tttgctcaaa tggagagcac attcatcggc 5940
gcagggatac acggtttatg gaccccaaga gtgtaaggac tattattagt aatattatat 6000
gcctctaggc gccttaactt caacaggcga gcactactaa tcaacttttg gtagacccaa 6060
ttacaaacga ccatacgtgc cggaaatttt gggattccgt ccgctctccc caaccaagct 6120
agaagaggca acgaacagcc aatcccggtg ctaattaaat tatatggttc atttttttta 6180
aaaaaatttt ttcttcccat tttcctctcg cttttctttt tcgcatcgta gttgatcaaa 6240
gtccaagtca agcgagctat ttgtgcgttt aaacgctgtt tcctgtgtga aattgttatc 6300
cgctcacaat tccacacaac ataggagccg gaagcataaa gtgtaaagcc tggggtgcct 6360
aatgagtgag gtaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 6420
acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 6480
ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 6540
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 6600
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 6660
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 6720
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 6780
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 6840
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 6900
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 6960
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 7020
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 7080
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 7140
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 7200
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 7260
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 7320
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 7380
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 7440
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 7500
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 7560
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 7620
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 7680
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 7740
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 7800
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 7860
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 7920
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 7980
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 8040
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 8100
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 8160
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 8220
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 8280
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 8340
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 8400
ttccccgaaa agtgccacct gaacgaagca tctgtgcttc attttgtaga acaaaaatgc 8460
aacgcgagag cgctaatttt tcaaacaaag aatctgagct gcatttttac agaacagaaa 8520
tgcaacgcga aagcgctatt ttaccaacga agaatctgtg cttcattttt gtaaaacaaa 8580
aatgcaacgc gagagcgcta atttttcaaa caaagaatct gagctgcatt tttacagaac 8640
agaaatgcaa cgcgagagcg ctattttacc aacaaagaat ctatacttct tttttgttct 8700
acaaaaatgc atcccgagag cgctattttt ctaacaaagc atcttagatt actttttttc 8760
tcctttgtgc gctctataat gcagtctctt gataactttt tgcactgtag gtccgttaag 8820
gttagaagaa ggctactttg gtgtctattt tctcttccat aaaaaaagcc tgactccact 8880
tcccgcgttt actgattact agcgaagctg cgggtgcatt ttttcaagat aaaggcatcc 8940
ccgattatat tctataccga tgtggattgc gcatactttg tgaacagaaa gtgatagcgt 9000
tgatgattct tcattggtca gaaaattatg aacggtttct tctattttgt ctctatatac 9060
tacgtatagg aaatgtttac attttcgtat tgttttcgat tcactctatg aatagttctt 9120
actacaattt ttttgtctaa agagtaatac tagagataaa cataaaaaat gtagaggtcg 9180
agtttagatg caagttcaag gagcgaaagg tggatgggta ggttatatag ggatatagca 9240
cagagatata tagcaaagag atacttttga gcaatgtttg tggaagcggt attcgcaata 9300
ttttagtagc tcgttacagt ccggtgcgtt tttggttttt tgaaagtgcg tcttcagagc 9360
gcttttggtt ttcaaaagcg ctctgaagtt cctatacttt ctagagaata ggaacttcgg 9420
aataggaact tcaaagcgtt tccgaaaacg agcgcttccg aaaatgcaac gcgagctgcg 9480
cacatacagc tcactgttca cgtcgcacct atatctgcgt gttgcctgta tatatatata 9540
catgagaaga acggcatagt gcgtgtttat gcttaaatgc gtacttatat gcgtctattt 9600
atgtaggatg aaaggtagtc tagtacctcc tgtgatatta tcccattcca tgcggggtat 9660
cgtatgcttc cttcagcact accctttagc tgttctatat gctgccactc ctcaattgga 9720
ttagtctcat ccttcaatgc tatcatttcc tttgatattg gatcatacta agaaaccatt 9780
attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg tctcgcgcgt 9840
ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt 9900
ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg 9960
tgtcggggct ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatacc 10020
acagcttttc aattcaattc atcatttttt ttttattctt ttttttgatt tcggtttctt 10080
tgaaattttt ttgattcggt aatctccgaa cagaaggaag aacgaaggaa ggagcacaga 10140
cttagattgg tatatatacg catatgtagt gttgaagaaa catgaaattg cccagtattc 10200
ttaacccaac tgcacagaac aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct 10260
acatataagg aacgtgctgc tactcatcct agtcctgttg ctgccaagct atttaatatc 10320
atgcacgaaa agcaaacaaa cttgtgtgct tcattggatg ttcgtaccac caaggaatta 10380
ctggagttag ttgaagcatt aggtcccaaa atttgtttac taaaaacaca tgtggatatc 10440
ttgactgatt tttccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac 10500
aattttttac tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag 10560
tactctgcgg gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg 10620
gtgggcccag gtattgttag cggtttgaag caggcggcag aagaagtaac aaaggaacct 10680
agaggccttt tgatgttagc agaattgtca tgcaagggct ccctatctac tggagaatat 10740
actaagggta ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct 10800
caaagagaca tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg 10860
ggtttagatg acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc 10920
tctacaggat ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct 10980
aaggtagagg gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc 11040
cagcaaaact aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga 11100
gcttcaattt aattatatca gttattaccc tatgcggtgt gaaataccgc acagatgcgt 11160
aaggagaaaa taccgcatca ggaaattgta aacgttaata ttttgttaaa attcgcgtta 11220
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 11280
aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca 11340
ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 11400
ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta 11460
aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg 11520
gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg 11580
gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcg 11640
cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg 11700
ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca 11760
gggttttccc agtcacgacg gtttaaac 11788
<210> 21
<211> 18
<212> DNA
<213> Primer
<400> 21
atcagaccac gacgggac 18
<210> 22
<211> 21
<212> DNA
<213> Primer
<400> 22
caggtaggag gagaccgact g 21
<210> 23
<211> 20
<212> DNA
<213> Primer
<400> 23
tagcgcgaat actgctgtgg 20
<210> 24
<211> 19
<212> DNA
<213> Primer
<400> 24
catgccggag ttgctgaag 19
<210> 25
<211> 19
<212> DNA
<213> Primer
<400> 25
gctgacgcga atgacacag 19
<210> 26
<211> 19
<212> DNA
<213> Primer
<400> 26
catgcccttg ccgtagaag 19
<210> 27
<211> 750
<212> PRT
<213> Myceliophthora thermophila
<400> 27
Met Ser Ala Asp Pro Leu Gln Val Leu Ala Ser Val Gly Lys Gly Lys
1 5 10 15
Ser Thr Arg Gly Val Leu Arg Val Ile Ile Leu Ala Leu Ile Ala Ala
20 25 30
Ala Ala Ile Ala Ser Arg Leu Phe Ser Val Ile Arg Phe Glu Ser Ile
35 40 45
Ile His Glu Phe Asp Pro Trp Phe Asn Phe Arg Ala Thr Lys Tyr Leu
50 55 60
Val Ala Asn Gly Phe Tyr Asn Phe Trp Asp Trp Phe Asp Asp Arg Thr
65 70 75 80
Trp His Pro Leu Gly Arg Val Thr Gly Gly Thr Leu Tyr Pro Gly Leu
85 90 95
Met Val Thr Ser Gly Val Ile Tyr His Ala Leu Arg Ala Leu Thr Ile
100 105 110
Pro Val Asp Ile Arg Asn Ile Cys Val Leu Leu Ala Pro Gly Phe Ser
115 120 125
Gly Leu Thr Ala Ile Ala Ala Tyr Leu Leu Thr Asn Glu Met Thr Pro
130 135 140
Ser Pro Ser Ala Gly Leu Leu Ala Ala Leu Phe Met Gly Ile Ala Pro
145 150 155 160
Gly Tyr Ile Ser Arg Ser Val Ala Gly Ser Tyr Asp Asn Glu Ala Ile
165 170 175
Ala Ile Phe Leu Leu Val Phe Thr Phe Tyr Leu Trp Ile Lys Ala Leu
180 185 190
Lys Gln Gly Ser Met Leu Trp Gly Ala Leu Cys Ala Leu Ser Tyr Gly
195 200 205
Tyr Met Val Ala Ser Trp Gly Gly Tyr Ala Phe Ile Thr Cys Leu Val
210 215 220
Pro Leu His Ser Phe Val Leu Ile Cys Met Gly Arg Tyr Ser Thr Arg
225 230 235 240
Leu Tyr Val Ala Tyr Thr Thr Trp Tyr Ala Leu Gly Thr Leu Ala Ser
245 250 255
Met Gln Ile Pro Phe Val Gly Phe Leu Pro Val Lys Thr Ser Glu His
260 265 270
Met Pro Ala Leu Gly Ile Phe Gly Phe Leu Gln Leu Leu Gly Phe Leu
275 280 285
Asp Tyr Val Arg Ser Ala Ile Pro Ser Arg Gln Phe Gln Thr Phe Leu
290 295 300
Trp Leu Phe Ala Gly Ala Thr Phe Gly Leu Gly Leu Leu Gly Leu Val
305 310 315 320
Ile Ala Thr Ser Ala Gly Phe Ile Ala Pro Trp Ser Gly Arg Phe Tyr
325 330 335
Ser Leu Trp Asp Thr Gly Tyr Ala Lys Ile His Ile Pro Ile Ile Ala
340 345 350
Ser Val Ser Glu His Gln Pro Thr Ala Trp Pro Ala Phe Phe Phe Asp
355 360 365
Leu Asn Leu Leu Val Trp Leu Phe Pro Val Gly Val Tyr Leu Cys Phe
370 375 380
Gln Gln Leu Ala Asp Glu His Val Phe Ile Val Val Tyr Ala Leu Phe
385 390 395 400
Gly Ser Tyr Phe Ala Gly Val Met Val Arg Leu Met Leu Thr Leu Thr
405 410 415
Pro Val Val Cys Val Ala Ala Ala Ile Ala Val Ser Thr Leu Leu Asp
420 425 430
Thr Tyr Leu Ser Thr Lys Ser Leu Lys Pro Gln Glu Ser Gln Ala Thr
435 440 445
Glu Gly Pro Glu Ser Lys Lys Ala Ala Lys Ser Ser Gly Leu Lys Ser
450 455 460
Thr Ser Lys Pro Val Val Gly Val Tyr Ala Leu Trp Gly Lys Ser Met
465 470 475 480
Met Val Gly Ala Leu Ala Val Tyr Leu Leu Leu Phe Val Leu His Cys
485 490 495
Thr Trp Val Thr Ser Asn Ala Tyr Ser Ser Pro Ser Val Val Leu Ala
500 505 510
Ser Arg Leu Pro Asp Gly Ser Gln His Ile Ile Asp Asp Tyr Arg Glu
515 520 525
Ala Tyr Gln Trp Leu Arg Gln Asn Thr Arg Glu Asp Ala Lys Ile Met
530 535 540
Ser Trp Trp Asp Tyr Gly Tyr Gln Ile Gly Gly Met Ala Asp Arg Pro
545 550 555 560
Thr Leu Val Asp Asn Asn Thr Trp Asn Asn Thr His Ile Ala Thr Val
565 570 575
Gly Lys Ala Met Ser Ser Arg Glu Glu Val Ser Tyr Pro Ile Met Arg
580 585 590
Gln His Glu Val Asp Tyr Val Leu Val Val Phe Gly Gly Leu Leu Gly
595 600 605
Tyr Ser Gly Asp Asp Ile Asn Lys Phe Leu Trp Met Val Arg Ile Ala
610 615 620
Glu Gly Ile Trp Pro Asp Glu Val Asn Glu Arg Ser Phe Phe Thr Ala
625 630 635 640
Arg Gly Glu Tyr Arg Val Asp Gly Glu Ala Thr Glu Thr Met Lys Asn
645 650 655
Ser Leu Met Tyr Lys Met Ser Tyr Tyr Asn Tyr Asn Asn Leu Phe Pro
660 665 670
Pro Gly Gln Ala Val Asp Arg Met Arg Gly Ala Arg Leu Pro Glu Val
675 680 685
Gly Pro Thr Leu Ser Thr Leu Glu Glu Ala Phe Thr Ser Glu Asn Trp
690 695 700
Ile Ile Arg Ile Tyr Lys Val Lys Asp Leu Asp Asn Leu Gly Arg Asp
705 710 715 720
His Met Ser Ala Ala Ala Phe Asp Arg Gly His Lys Lys Lys Ser Lys
725 730 735
Gly Ile Thr Lys Lys Lys Gly Pro Arg Gln Leu Arg Ile Asp
740 745 750
<210> 28
<211> 309
<212> PRT
<213> Myceliophthora thermophila
<400> 28
Met Ala Ala Asp Asp Asp Ile Thr Pro Leu Ala Ser Leu Ser Leu Thr
1 5 10 15
His Val Tyr Tyr Asn Pro Thr Asp Pro Leu Ser Thr Ala Ser Ala Phe
20 25 30
Leu Ser Leu Leu Pro Gln Ala Leu Cys Val Val Tyr Ala Thr Leu Leu
35 40 45
Trp Ser Thr Arg Glu Ala Glu Val Leu Leu Met Phe Leu Gly Gln Leu
50 55 60
Ala Cys Glu Ala Ile Asn Phe Ala Leu Lys Arg Leu Ile Lys Glu Glu
65 70 75 80
Arg Pro Pro Arg Leu Gly Val Gly Lys Gly Tyr Gly Met Pro Ser Ser
85 90 95
His Ala Gln Phe Ala Ala Phe Trp Ala Val Ala Leu Ala Leu Phe Leu
100 105 110
Cys Val Arg His Arg Pro Ala Arg Leu Gly Pro Pro Arg Arg Pro Pro
115 120 125
Arg Leu Arg Leu Gly Gly Arg Ala Val Val Pro Pro Gly Lys Gly Asp
130 135 140
Arg Ala Ala Ala Thr Val Ala Asp Gly Asn Arg Asn Gly Asn Gly Asn
145 150 155 160
Gly Asp Ala Glu Pro Arg Leu Ser Asp Val His Arg Ala Tyr Val Ser
165 170 175
Gly Gly Leu Ala Ala Ala Ser Arg Ser Ile Glu Ala Tyr Ser His Ser
180 185 190
His Trp Thr Met Ala Gln Arg Val Val Val Ser Ala Gly Ala Leu Leu
195 200 205
Val Ala Gly Leu Val Ala Trp Ser Arg Val Tyr Leu Gly Tyr His Thr
210 215 220
Val Arg Gln Val Val Ala Gly Ser Ala Ala Gly Ala Gly Cys Ala Ala
225 230 235 240
Ala Trp Phe Ala Val Thr Tyr Leu Met Arg Glu Thr Gly Met Val Ala
245 250 255
Trp Ala Leu Glu Leu Pro Pro Ala Arg Trp Phe Arg Met Arg Asp Leu
260 265 270
Val Val Glu Glu Asp Leu Cys Gln Ala Gly Trp Glu Lys Trp Gln Glu
275 280 285
Lys Arg Gln Leu Ala Leu Glu Arg Glu Gln Ser Arg Glu Arg Val Arg
290 295 300
Glu Lys Lys Gly Gln
305
<210> 29
<211> 8017
<212> DNA
<213> Myceliophthora thermophila
<400> 29
agggtaggtg ggatgggcgg ggtgtagggt aggtcggtgt agggtaggtc ggctgggcgg 60
ggtgtagggt aggtcggttg ggcggggtgt agggtaggtc ggttgggatg ggtgtagggt 120
aggtcggccg ggtgtagggt aggtcggctg ggcggggtgt agggtaggtc ggtgtagggt 180
aggtgggatg gggcgctatg tgcggccgcg agctcgcgag cccattttta gcgaaggcca 240
tacaaacgag ttttgcggaa cccgggattc cacccccgaa gccgccggcg cgtgcgcccc 300
gctgcgcatc ggtcggtggg tatatgagaa gggggcgggc aagccggaag ccagaggcaa 360
ctgctactgt tagctgccgc tggcctccgc ggcccagggc gcggcacggc tgcgttgaag 420
tctcccagtc tcccacccgt tggctgcgcg gatccgcccg tcttggtggt tgcgagctcg 480
cgagcccatt tttagcgaag gccatacaaa cgagttttgc ggggcccggg attccacccc 540
ggaacccgcc ggcgcgtgcg ccccgctgcg catcggtcgg tgggtatgtg agggaggaag 600
aagaaaaaaa aaaaaagctc ctgcgggggg gctgtcgggc acgcctactt tcgggcgacc 660
cggcacctct ccgcggcagc cttcgcaggc cgctgttggt cccatttcat acgtcgccgc 720
cttcgcgtgg tgccctacgg tctgccgggg taccgacgat tgcggcgagc accgcctcag 780
caccgctgct gccaccggcg cgacctcgcc cgggggtgcg cgcggcatct gggaagactc 840
tgcaggcgta agggaatacc ccatgtgcgc cgaggggtgg gctatgtggg tgcttggcgg 900
ttcgccagac ctttctaaag ccaccggggg tacctaccgg ttggggacgc ctacagggct 960
gaacctcccg gtcgggcctc ctcttggggc gcttaggcgg cgacttcggg gcgcgatcgc 1020
tccccgctct cgcccgccga cggcgctctg gggaattcag gaggggaaag cagatgtgac 1080
ccgcggctcg accggcgcat tgccggacga gctgcgcggc cacgcgggcc cccgcgcccg 1140
ccgacccagt aacttagtga actcttccgc cctgaaacac gggcggttgg ccctaaccgg 1200
ctcacgatag ttacctggtt gattctgcca gtagtcatat gcttgtctca aagattaagc 1260
catgcatgtc taagtataag caattataca gcgaaactgc gaatggctca ttaaatcagt 1320
tatcgtttat ttgatagtac cttactacat ggataaccgt ggtaattcta gagctaatac 1380
atgctaaaaa tcccgacttc ggaagggatg tatttattag attaaaaacc aatgccctcc 1440
ggggctctct ggtgattcat gataacttct cgaatcgcac ggccttgcgc cggcgatggt 1500
tcattcaaat ttctgcccta tcaactttcg acggctgggt cttggccagc cgtggtgaca 1560
acgggtaacg gagggttagg gctcgacccc ggagaaggag cctgagaaac ggctactaca 1620
tccaaggaag gcagcaggcg cgcaaattac ccaatcccga cacggggagg tagtgacaat 1680
aaatactgat acagggctct tttgggtctt gtaattggaa tgagtacaat ttaaatccct 1740
taacgaggaa caattggagg gcaagtctgg tgccagcagc cgcggtaatt ccagctccaa 1800
tagcgtatat taaagttgtt gaggttaaaa agctcgtagt tgaaccttgg gcctagccgg 1860
ccggtccgcc tcaccgcgtg cactggctcg gctgggtctt tccttctgga gaaccgcatg 1920
cccttcactg ggtgtgccgg ggaaccagga cttttactct gaacaaatta gatcgcttaa 1980
agaaggccta tgctcgaata cattagcatg gaataataga ataggacgtg tggttctatt 2040
ttgttggttt ctaggaccgc cgtaatgatt aatagggaca gtcgggggca tcagtattca 2100
attgtcagag gtgaaattct tggatttatt gaagactaac tactgcgaaa gcatttgcca 2160
aggatgtttt cattaatcag gaacgaaagt taggggatcg aagacgatca gataccgtcg 2220
tagtcttaac cataaactat gccgattagg gatcggacgg cgttattttt tgacccgttc 2280
ggcaccttac gataaatcaa aatgtttggg ctcctggggg agtatggtcg caaggctgaa 2340
acttaaagaa attgacggaa gggcaccacc aggggtggag cctgcggctt aatttgactc 2400
aacacgggga aactcaccag gtccagacac gatgaggatt gacagattga gagctctttc 2460
ttgatttcgt gggtggtggt gcatggccgt tcttagttgg tggagtgatt tgtctgctta 2520
attgcgataa cgaacgagac cttaacctgc taaatagccc gtattgcttt ggcagtacgc 2580
cggcttctta gagggactat cggctcaagc cgatggaagt ttgaggcaat aacaggtctg 2640
tgatgccctt agatgttctg ggccgcacgc gcgctacact gacagagcca gcgagtactc 2700
ccttggccgg aaggcccggg taatcttgtt aaactctgtc gtgctgggga tagagcattg 2760
caattattgc tcttcaacga ggaatcccta gtaagcgcaa gtcatcagct tgcgttgatt 2820
acgtccctgc cctttgtaca caccgcccgt cgctactacc gattgaatgg ctcagtgagg 2880
ctttcggact ggcccagaga ggtcggcaac gaccactcag ggccggaaag ttatccaaac 2940
tcggtcattt agaggaagta aaagtcgtaa caaggtctcc gttggtgaac cagcggaggg 3000
atcattacag agctgcaaaa ctccctaaac catcgtgaac gctacctaga ccgttgcttc 3060
ggcgggcggc gccctcgcgc gccccccctg gggcccgcac cgcgggcgcc cgccggaggt 3120
acaccaaact cttgatatgt tatggccact ctgagtctcc tgtactgaat aagtcaaaac 3180
tttcaacaac ggatctcttg gttctggcat cgatgaagaa cgcagcgaaa tgcgataagt 3240
aatgtgaatt gcagaattca gtgaatcatc gaatctttga acgcacattg cgcccgccag 3300
catcctggcg ggcatgcctg ttcgagcgtc atttcaaccc atcaagccca cggcttgtgt 3360
tggggacctg cggctgcccg caggccctga aaaccagtgg cgggctcgct agtcacaccg 3420
ggcgtagtag catacgacct cgctcagggc gtgctgcggg ttccagccgt aaaacgacct 3480
tcacaaccca aggttgacct cggatcaggt aggaggaccc gctgaactta agcatatcaa 3540
taagcggagg aaaagaaacc aacagggatt gccctagtaa cggcgagtga agcggcaaca 3600
gctcaaattt gaaatctggc ttcggcccga gttgtaattt gcagaggaag ctttaggcgc 3660
ggcaccttct gagtcccctg gaacggggcg ccatagaggg tgagagcccc gtatagttgg 3720
atgcctagcc tgtgtaaagc tccttcgacg agtcgagtag tttgggaatg ctgctcaaaa 3780
tgggaggtaa atttcttcta aagctaaata ccggccagag accgatagcg cacaagtaga 3840
gtgatcgaaa gatgaaaagc actttgaaaa gagggttaaa tagcacgtga aattgttgaa 3900
agggaagcgc ttgtgaccag acttgcgccg ggctgatcat ccggtgttct caccggtgca 3960
ctctgcccgg ctcaggccag catcggttct cgcgggggga taaaggcccg gggaatgtag 4020
ctcctccggg agtgttatag ccccgggtgt aataccctcg cggggaccga ggttcgcgca 4080
tctgcaagga tgctggcgta atggtcatca gcgacccgtc ttgaaacacg gaccaaggag 4140
tcaaggtttt gcgcgagtgt ttgggtgtaa aacccgcacg cgtaatgaaa gtgaacgtag 4200
gtgagagctt cggcgcatca tcgaccgatc ctgatgtttt cggatggatt tgagtaggag 4260
cgttaagcct tggacccgaa agatggtgaa ctatgcttgg atagggtgaa gccagaggaa 4320
actctggtgg aggctcgcag cggttctgac gtgcaaatcg atcgtcaaat ctgagcatgg 4380
gggcgaaaga ctaatcgaac catctagtag ctggttaccg ccgaagtttc cctcaggata 4440
gcagtgttgt cttcagtttt atgaggtaaa gcgaatgatt agggactcgg gggcgctttt 4500
tagccttcat ccattctcaa actttaaata tgtaagaagc ccttgttact tagttgaacg 4560
tgggccttcg aatgtatcaa cactagtggg ccatttttgg taagcagaac tggcgatgcg 4620
ggatgaaccg aacgcggggt taaggtgccg gagtggacgc tcatcagaca ccacaaaagg 4680
cgttagtaca tcttgacagc aggacggtgg ccatggaagt cggaatccgc taaggactgt 4740
gtaacaactc acctgccgaa tgtactagcc ctgaaaatgg atggcgctca agcgtcccac 4800
ccataccccg ccctcagggt agaaacgacg ccctgaggag taggcggccg tggaggtcag 4860
tgacgaagcc tagggcgtga gcccgggtcg aacggcctct agtgcagatc ttggtggtag 4920
tagcaaatac ttcaatgaga acttgaagga ccgaagtggg gaaaggttcc atgtgaacag 4980
cggttggaca tgggttagtc gatcctaagc catagggaag ttccgtttca aaggggcact 5040
cgtgccccgt gtggcgaaag ggaagccggt taacattccg gcacctggat gtgggttttg 5100
cgcggtaacg caactgaacg cggagacgac ggcgggggcc ccgggcagag ttctcttttc 5160
ttcttaacgg tctatcaccc tggaaacagt ttgtctggag atagggttta acggccggaa 5220
gagcccgaca cttctgtcgg gtccggtgcg ctctcgacgt cccttgaaaa tccgcgggag 5280
ggaataattc tcacgccagg tcgtactcat aaccgcagca ggtccccaag gtgaacagcc 5340
tctggttgat agaacaatgt agataaggga agtcggcaaa atagatccgt aacttcggga 5400
taaggattgg ctctaagggt tgggcacgtt gggctttggg cggacgccct gggagcaggt 5460
cgcctctagc cgggcaaccg gcggggggct tccagcatcc gggtgcagat gcccttagca 5520
ggcttcggcc gtccggcgcg cggttaacaa ccaacttaga actggtacgg acagggggaa 5580
tctgactgtc taattaaaac atagcattgc gatggccaga aagtggtgtt gacgcaatgt 5640
gatttctgcc cagtgctctg aatgtcaaag tgaagaaatt caaccaagcg cgggtaaacg 5700
gcgggagtaa ctatgactct cttaaggtag ccaaatgcct cgtcatctaa ttagtgacgc 5760
gcatgaatgg attaacgaga ttcccactgt ccctatctac tatctagcga aaccacagcc 5820
aagggaacgg gcttggcaga atcagcgggg aaagaagacc ctgttgagct tgactctagt 5880
ttgacattgt gaaaagacat aggaggtgta gaataggtgg gagcttcggc gccggtgaaa 5940
taccactact cctattgttt ttttacttat tcaatgaagc ggggctggat tttcgtccaa 6000
cttctggttt taaggtcctt cgcgggccga cccgggttga agacattgtc aggtggggag 6060
tttggctggg gcggcacatc tgttaaacca taacgcaggt gtcctaaggg gggctcatgg 6120
agaacagaaa tctccagtag aacaaaaggg taaaagtccc cttgattttg attttcagtg 6180
tgaatacaaa ccatgaaagt gtggcctatc gatcctttag tccctcgaaa tttgaggcta 6240
gaggtgccag aaaagttacc acagggataa ctggcttgtg gcggccaagc gttcatagcg 6300
acgtcgcttt ttgatccttc gatgtcggct cttcctatca taccgaagca gaattcggta 6360
agcgttggat tgttcaccca ctaataggga acgtgagctg ggtttagacc gtcgtgagac 6420
aggttagttt taccctactg atgaactcat cgcaatggta attcagctta gtacgagagg 6480
aaccgctgat tcagataatt ggtttttgcg gttgtccgac cgggcagtgc cgcgaagcta 6540
ccatctgctg gataatggct gaacgcctct aagtcagaat ccatgccaga acgcgatgat 6600
actacccgca cgttgtagac gtataagaat aggctccggc ctcgtatcct agcaggcgat 6660
tcctccgccg gcctcgaagt tggccggcgg taattcgcgt attgcaattt cgacacgcgc 6720
gggatcaaat cctttgcaga cgacttagat gtgcgaaagg gtcctgtaag cagtagagta 6780
gccttgttgt tacgatctgc tgagggtaag ccctccttcg cctagatttc ccagcgagag 6840
cccgccggcg gaacagccgg gcgagcctta cgggggaagc cttaagggga ttgagaagtg 6900
gtgccgtgcg ttcgcgcgcc cctaggtcct ttagccggcc gcaggtgtag ggtaggtcgg 6960
ttgggaggat ggggtgtagg gtaggtcggt gtagggtagg ttggttggga ggatggggtg 7020
tagggtaggt cggccgggtg tagggtaggt cggtgtaggg taggtgggat ggggcgctat 7080
atgcggccgc gagctcgcga gcctattttt agtgaaggct atataaataa gctttacgtt 7140
accgggcctt gctaccctcg agtggcgtgg gccgtgctgc ctactgggca ttgctcgccg 7200
ggctgtataa gggaggggtc ggggtcgcgg tctagggtag gtcgggtggg atggggtgta 7260
gggtaggaga agcgctctag tcgtgtgtct ttttctctag gtctattatt agtactggct 7320
gtagggcgac gtgccctgcc ttgttataat attatattgt atgtttaggc ctatactagc 7380
ttgtaatcta tttgtatctg gcttattagg tacggcttcc tttgtatata actagagagg 7440
ctctggtatg cttcttagta tagcggtata ggattcataa tcatagtaat gataatcata 7500
atagtaataa taataataat agtaatgata ataataataa tctatttata tcttatttaa 7560
aatgcttgta cggctgcctg ctcttaagga gtagctagat atgagatggt agggtagcta 7620
gctaacctag gctagacgtt ctcgtccctt agctatataa gtgctatata ttatagttag 7680
ttatctaacc taccttctta cttgagcaga agaggtaggg ttctagtata gctagtaggg 7740
cttctaggcc taagggcctg ttattcgagt tattataggt tagtatttaa tatagttata 7800
gggataggcc tcgattacgg gtataggata ggtaggatag gtatagggta ggtcggttag 7860
gaggataggg tgtaaggtag gtcggccggg tatagggtag gtagtaggtt aggcggggtg 7920
tagggtaggt cggtgtaggg taggtgggat gggcggggtg tagggtaggt cggttgggag 7980
gatggggtgt agggtaggtc ggtgtagggt aggtcgg 8017
Claims (27)
- N-연결된 글리코실화(N-linked glycosylation)가 감소되거나 없는 목적한 단백질을 생산할 수 있는 유전적으로 변형된 자낭균류 사상 진균(genetically modified ascomycetous filamentous fungus)으로서, 이러한 유전적으로 변형된 사상 진균은 STT3 및/또는 CWH8의 감소된 발현 및/또는 활성을 갖는 적어도 하나의 세포를 포함하는, 유전적으로 변형된 자낭균류 사상 진균.
- 제1항에 있어서, 적어도 하나의 세포가 목적한 단백질을 암호화하는 적어도 하나의 외인성 폴리뉴클레오타이드를 포함하는, 유전적으로 변형된 자낭균류 사상 진균.
- 제1항 또는 제2항에 있어서, 적어도 하나의 세포가 STT2의 감소된 발현 및/또는 활성을 갖는, 유전적으로 변형된 자낭균류 사상 진균.
- 제3항에 있어서, STT3이 써모텔로마이세스 헤테로탈리카(Thermothelomyces heterothallica) STT3의 아미노산에 대해 적어도 75%, 또는 적어도 80%, 또는 적어도 85%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 99%, 또는 100%의 동일성(identity)을 갖는 아미노산 서열을 포함하는, 유전적으로 변형된 사상 진균.
- 제4항에 있어서, 써모텔로마이세스 헤테로탈리카 STT3이 서열 번호: 27의 아미노산을 포함하는, 유전적으로 변형된 사상 진균.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 적어도 하나의 세포가 CWH3의 감소된 발현 및/또는 활성을 갖는, 유전적으로 변형된 사상 진균.
- 제6항에 있어서, CWH3가 써모텔로마이세스 헤테로탈리카 CWH3의 아미노산에 대해 적어도 75%, 또는 적어도 80%, 또는 적어도 85%, 또는 적어도 90%, 또는 적어도 95%, 또는 적어도 99%, 또는 100%의 동일성을 갖는 아미노산 서열을 포함하는, 유전적으로 변형된 사상 진균.
- 제7항에 있어서, 써모텔로마이세스 헤테로탈리카 CWH3가 서열 번호: 28의 아미노산 서열을 포함하는, 유전적으로 변형된 사상 진균.
- 제1항 내지 제8항 중 어느 한 항에 있어서, STT3 및 CWH8의 감소된 발현 및/또는 활성을 갖는 적어도 하나의 세포를 포함하는, 유전적으로 변형된 사상 진균.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 유전적 변형이 stt3 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 올리고사카릴트랜스퍼라제(OST) 복합체(complex)의 촉매 소단위(catalytic subunit)를 생산하지 못하도록 하는, 유전적으로 변형된 사상 진균.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 유전적 변형이 cwh8 유전자의 결실 또는 파괴를 포함함으로써 변형된 사상 진균이 기능성 돌리칠 피로포스페이트 포스파타제(functional dolichyl pyrophosphate phosphatase)를 생산하지 못하도록 하는, 유전적으로 변형된 사상 진균.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 자낭균류 사상 진균이 페지조마이코티나(Pezizomycotina) 내의 속(genus)의 것인, 유전적으로 변형된 사상 진균.
- 제12항에 있어서, 자낭균류 사상 진균이 써모텔로마이세스(Thermothelomyces), 마이셀리오프토라(Myceliophthora), 트리초데르마(Trichoderma), 아스퍼길러스(Aspergillus), 페니실리움(Penicillium), 라삼소니아(Rasamsonia), 크리소스포리움(Chrysosporium), 코리나스쿠스(Corynascus), 푸사리움(Fusarium), 뉴로스포라(Neurospora), 및 탈라로마이세스(Talaromyces)로 이루어진 그룹으로부터 선택된 속의 것인, 유전적으로 변형된 사상 진균.
- 제13항에 있어서, 자낭균류 사상 진균이 써모텔로마이세스 헤테로탈리카(또한 마이셀리오프토라 써모필라(Myceliophthora thermophila)로서 나타냄) 종(species)의 것인, 유전적으로 변형된 사상 진균.
- 제14항에 있어서, 자낭균류 사상 진균이 서열 번호: 29로 제시된 핵산 서열에 대해 적어도 95%, 또는 적어도 96%, 또는 적어도 97%, 또는 적어도 98%, 또는 적어도 99%또는 100%의 동일성을 갖는 rDNA를 포함하는 써모텔로마이세스 헤테로탈리카 균주인, 유전적으로 변형된 사상 진균.
- 제15항에 있어서, 자낭균류 사상 진균이 써모텔로마이세스 헤테로탈리카 C1인, 유전적으로 변형된 사상 진균.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 목적한 단백질이 항원, 치료학적 단백질, 항체, 효소, 백신 및 구조적 단백질(structural protein)로 이루어진 그룹으로부터 선택되는, 유전적으로 변형된 사상 진균.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 목적한 단백질이 분비된 단백질인, 유전적으로 변형된 사상 진균.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 자낭균류 사상 진균이 내인성 단백질을 암호화하는 하나 이상의 유전자를 결실하도록 추가로 변형된 균주인, 유전적으로 변형된 사상 진균.
- 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 진균이 적어도 5개의 프로테아제의 감소된 발현 및/또는 활성을 갖는 적어도 하나의 세포를 포함하는, 유전적으로 변형된 사상 진균.
- (a) 자낭균류 사상 진균의 STT3 단백질의 발현 및/또는 활성을 감소시키는 단계; 및/또는
(b) 자낭균류 사상 진균의 CHW8 단백질의 발현 및/또는 활성을 감소시키는 단계를 포함하여, N-글리칸이 감소되어 있거나 없는 단백질을 생산할 수 있는 자낭균류 사상 진균을 생성하기 위한 방법. - 제21항에 있어서,
(a) 자낭균류 사상 진균의 stt3 유전자를 결실시키거나 파괴함으로써 올리고사카릴트랜스퍼라제(oligosacchryltransferase; OST) 복합체의 기능성 촉매분해 소단위의 생산을 감소시키는 단계; 및/또는
(b) 자낭균류 사상 진균의 chw8 유전자를 결실시키거나 파괴함으로써 기능적 돌리칠 피로포스페이트 포스파타제의 생산을 감소시키는 단계를 포함하는, 방법. - 제22항에 있어서, 목적한 이종 단백질을 암호화하는 외인성 폴리뉴클레오타이드를 자낭균류 사상 진균 내로 도입시킴으로써 진균 내에서 N-글리칸이 감소되어 있거나 없는 이종 단백질을 발현시키는 단계를 추가로 포함하는, 방법.
- N-글리칸 변형이 감소되어 있거나 없는 이종 단백질을 생산하기 위한 방법으로서, 이러한 방법이:
a) 제1항 내지 제20항 중 어느 한 항에 따른 유전적으로 변형된 자낭균류 사상 진균을 제공하는 단계로서, 여기서 상기 진균이 목적한 이종 단백질을 암호화(encoding)하는 외인성 폴리뉴클레오타이드를 포함하는, 단계;
b) 자낭균류 사상 진균을 이종 단백질을 발현하기에 적합한 조건 하에서 배양하는 단계; 및
c) 이종 단백질을 회수하는 단계를 포함하는, 방법. - 제24항에 있어서, 이종 단백질이 자낭균류 사상 진균 내에서 재조합적으로 발현된 이종 포유동물 단백질인, 방법.
- 제1항 내지 제20항 중 어느 한 항에 따라 유전적으로 변형된 자낭균류 사상 진균에 의해 생산된 재조합 단백질(recombinant protein).
- 제26항에 있어서, 단백질이 약제학적 등급인, 재조합 단백질.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163159492P | 2021-03-11 | 2021-03-11 | |
US63/159,492 | 2021-03-11 | ||
PCT/IB2022/052138 WO2022190022A1 (en) | 2021-03-11 | 2022-03-10 | Genetically-modified filamentous fungi for production of exogenous proteins having reduced or no n-linked glycosylation |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230154261A true KR20230154261A (ko) | 2023-11-07 |
Family
ID=83226380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237034361A KR20230154261A (ko) | 2021-03-11 | 2022-03-10 | N-연결된 글리코실화가 없거나 감소된 외인성 단백질의 생산을 위한 유전적으로 변형된 사상 진균 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP4291632A1 (ko) |
JP (1) | JP2024509895A (ko) |
KR (1) | KR20230154261A (ko) |
CN (1) | CN117377752A (ko) |
BR (1) | BR112023018120A2 (ko) |
WO (1) | WO2022190022A1 (ko) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11738080B2 (en) * | 2017-08-21 | 2023-08-29 | Dyadic International Inc. | Production of flu vaccine in Myceliophthora thermophila |
-
2022
- 2022-03-10 KR KR1020237034361A patent/KR20230154261A/ko unknown
- 2022-03-10 EP EP22766495.0A patent/EP4291632A1/en active Pending
- 2022-03-10 BR BR112023018120A patent/BR112023018120A2/pt unknown
- 2022-03-10 JP JP2023554870A patent/JP2024509895A/ja active Pending
- 2022-03-10 CN CN202280034224.7A patent/CN117377752A/zh active Pending
- 2022-03-10 WO PCT/IB2022/052138 patent/WO2022190022A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022190022A1 (en) | 2022-09-15 |
JP2024509895A (ja) | 2024-03-05 |
BR112023018120A2 (pt) | 2023-12-12 |
EP4291632A1 (en) | 2023-12-20 |
CN117377752A (zh) | 2024-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102700050B1 (ko) | 조작된 내수송/외수송을 가진 미생물 숙주에서 모유 올리고당류의 생산 | |
AU2016203445B2 (en) | Integration of a polynucleotide encoding a polypeptide that catalyzes pyruvate to acetolactate conversion | |
AU2020264412B2 (en) | Dna-binding protein using ppr motif, and use thereof | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
CN108138155A (zh) | 经由指导cas系统恢复非功能性基因产物的功能及使用方法 | |
KR20140146616A (ko) | 부타놀로겐용 배지의 아세테이트 보충물 | |
IL236992A (en) | Genetically modified cyanobacteria that produce ethanol | |
KR20130087013A (ko) | 추출 발효에서의 알코올 제거를 위한 오일로부터 유래되는 추출 용매 | |
BRPI0711020A2 (pt) | polinucleotìdeo isolado, construto de dna recombinente, célula, método para transformar uma célula, método para produzir uma planta trasfornanda, sementes transgênicas, método para a produção de ácidos graxos poliinsaturados de cadeia longa em uma célula vegetal, óleos ou subporudots, método para produzir pelo menos um ácido graxo poliinsaturado em uma célula vegetal de uma semente oleaginosa, plantas de semente oleoginosa, sementes transgênicas, produto alimentìcios, progênies de plantas e molécula de ácido nucléico isolada | |
KR20070085665A (ko) | 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주 | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
CN108473968A (zh) | 生产植物鞘氨醇或二氢神经鞘氨醇的方法 | |
KR20180084135A (ko) | 감소된 clr2 활성을 갖는 사상 진균에서 단백질을 생산하는 방법 | |
CN114729387A (zh) | 遗传修饰真菌和与其相关方法和用途 | |
DK2935601T3 (en) | RECOMBINANT MICROBELL CELLS PRODUCING AT LEAST 28% EICOSAPENTAIC ACID AS DRY WEIGHT | |
KR20180081817A (ko) | 감소된 clr1 활성을 갖는 사상 진균에서 단백질을 생산하는 방법 | |
JP2024037797A (ja) | がんを処置するための感染性核酸の使用 | |
KR20230154261A (ko) | N-연결된 글리코실화가 없거나 감소된 외인성 단백질의 생산을 위한 유전적으로 변형된 사상 진균 | |
CN109652325B (zh) | δ整合并分泌表达纤维素酶的酿酒酵母工业菌株及应用 | |
KR102287810B1 (ko) | Msn2의 활성이 증가되도록 유전적으로 조작된, 스트레스 내성을 갖는 효모 세포 및 그를 이용하여 락테이트를 생산하는 방법 | |
RU2798786C2 (ru) | Производство молочных олигосахаридов человека в микробных продуцентах с искусственным импортом/экспортом | |
KR20230159994A (ko) | 하이브리드 신호서열을 포함하는 재조합 벡터 및 이를 이용한 인간 인슐린 유사 성장인자-1의 분비 생산방법 | |
KR20230007808A (ko) | 재배열 레오바이러스과 바이러스를 제조하는 방법 및 이를 위한 벡터 라이브러리 | |
CN115003815A (zh) | 小麦转基因事件ind-øø412-7 |