JP2023145678A - エプスタインバールウイルス抗原構築物 - Google Patents
エプスタインバールウイルス抗原構築物 Download PDFInfo
- Publication number
- JP2023145678A JP2023145678A JP2023126388A JP2023126388A JP2023145678A JP 2023145678 A JP2023145678 A JP 2023145678A JP 2023126388 A JP2023126388 A JP 2023126388A JP 2023126388 A JP2023126388 A JP 2023126388A JP 2023145678 A JP2023145678 A JP 2023145678A
- Authority
- JP
- Japan
- Prior art keywords
- leu
- gly
- pro
- ala
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000701044 Human gammaherpesvirus 4 Species 0.000 title claims abstract description 221
- 108091007433 antigens Proteins 0.000 title claims abstract description 209
- 102000036639 antigens Human genes 0.000 title claims abstract description 209
- 239000000427 antigen Substances 0.000 title claims abstract description 208
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 187
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 168
- 239000013598 vector Substances 0.000 claims abstract description 165
- 229920001184 polypeptide Polymers 0.000 claims abstract description 154
- 230000002163 immunogen Effects 0.000 claims abstract description 131
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 118
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 118
- 239000002157 polynucleotide Substances 0.000 claims abstract description 117
- 239000000203 mixture Substances 0.000 claims abstract description 46
- 201000010099 disease Diseases 0.000 claims abstract description 24
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 24
- 206010015108 Epstein-Barr virus infection Diseases 0.000 claims abstract description 19
- 201000006417 multiple sclerosis Diseases 0.000 claims abstract description 11
- 238000011282 treatment Methods 0.000 claims abstract description 11
- 206010039073 rheumatoid arthritis Diseases 0.000 claims abstract description 7
- 201000000596 systemic lupus erythematosus Diseases 0.000 claims abstract description 6
- 201000011510 cancer Diseases 0.000 claims abstract description 4
- 239000012634 fragment Substances 0.000 claims description 421
- 150000001413 amino acids Chemical class 0.000 claims description 193
- 238000000034 method Methods 0.000 claims description 76
- 241000283070 Equus zebra Species 0.000 claims description 44
- 239000002671 adjuvant Substances 0.000 claims description 41
- 230000014509 gene expression Effects 0.000 claims description 38
- 241000700605 Viruses Species 0.000 claims description 32
- 230000028993 immune response Effects 0.000 claims description 31
- 241000701161 unidentified adenovirus Species 0.000 claims description 27
- 230000001939 inductive effect Effects 0.000 claims description 23
- 239000002245 particle Substances 0.000 claims description 22
- 241000700618 Vaccinia virus Species 0.000 claims description 18
- 150000007523 nucleic acids Chemical group 0.000 claims description 16
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 13
- 238000004519 manufacturing process Methods 0.000 claims description 13
- 239000013604 expression vector Substances 0.000 claims description 11
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 11
- 241000990167 unclassified Simian adenoviruses Species 0.000 claims description 10
- 241001217856 Chimpanzee adenovirus Species 0.000 claims description 7
- 239000003814 drug Substances 0.000 claims description 7
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 5
- 230000006806 disease prevention Effects 0.000 claims description 5
- 206010028980 Neoplasm Diseases 0.000 claims description 4
- 206010046865 Vaccinia virus infection Diseases 0.000 claims description 4
- 230000036210 malignancy Effects 0.000 claims description 4
- 208000007089 vaccinia Diseases 0.000 claims description 4
- 208000023275 Autoimmune disease Diseases 0.000 claims description 3
- 101150113776 LMP1 gene Proteins 0.000 claims 9
- 101001136981 Homo sapiens Proteasome subunit beta type-9 Proteins 0.000 claims 7
- 102100035764 Proteasome subunit beta type-9 Human genes 0.000 claims 7
- 101150059079 EBNA1 gene Proteins 0.000 claims 2
- 229960005486 vaccine Drugs 0.000 abstract description 23
- 230000002265 prevention Effects 0.000 abstract description 5
- 235000001014 amino acid Nutrition 0.000 description 144
- 229940024606 amino acid Drugs 0.000 description 143
- 108090000623 proteins and genes Proteins 0.000 description 101
- 241001526368 Callitrichine gammaherpesvirus 3 Species 0.000 description 68
- 102000004169 proteins and genes Human genes 0.000 description 66
- 101710122231 Epstein-Barr nuclear antigen 3 Proteins 0.000 description 65
- 235000018102 proteins Nutrition 0.000 description 64
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 59
- 101710192602 Latent membrane protein 1 Proteins 0.000 description 48
- 101710192606 Latent membrane protein 2 Proteins 0.000 description 48
- 230000005867 T cell response Effects 0.000 description 46
- 108010079364 N-glycylalanine Proteins 0.000 description 39
- 210000004027 cell Anatomy 0.000 description 38
- 108010031111 EBV-encoded nuclear antigen 1 Proteins 0.000 description 35
- 241000699670 Mus sp. Species 0.000 description 33
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 33
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 33
- 230000037430 deletion Effects 0.000 description 29
- 238000012217 deletion Methods 0.000 description 29
- 108010047495 alanylglycine Proteins 0.000 description 23
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 22
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 22
- 108010077515 glycylproline Proteins 0.000 description 22
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 20
- 230000002101 lytic effect Effects 0.000 description 20
- 108010077112 prolyl-proline Proteins 0.000 description 20
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 19
- 210000001744 T-lymphocyte Anatomy 0.000 description 19
- 230000003053 immunization Effects 0.000 description 19
- 238000002649 immunization Methods 0.000 description 19
- 108010026333 seryl-proline Proteins 0.000 description 18
- 101100283436 Human herpesvirus 8 type P (isolate GK18) gM gene Proteins 0.000 description 17
- 101150016564 ORF39 gene Proteins 0.000 description 17
- 101100378791 Paenarthrobacter nicotinovorans aldh gene Proteins 0.000 description 17
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 17
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 17
- 108010057821 leucylproline Proteins 0.000 description 17
- 230000003612 virological effect Effects 0.000 description 16
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 15
- 108010087924 alanylproline Proteins 0.000 description 15
- 108010093581 aspartyl-proline Proteins 0.000 description 15
- 108010050848 glycylleucine Proteins 0.000 description 15
- 241001515942 marmosets Species 0.000 description 14
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 13
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 13
- 241001465754 Metazoa Species 0.000 description 13
- 108010062796 arginyllysine Proteins 0.000 description 13
- 230000004044 response Effects 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- -1 BNLF2 Proteins 0.000 description 12
- 108020004414 DNA Proteins 0.000 description 12
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 12
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 12
- 241000880493 Leptailurus serval Species 0.000 description 12
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 12
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 12
- 108010060199 cysteinylproline Proteins 0.000 description 12
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 12
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 11
- 101100165660 Alternaria brassicicola bsc6 gene Proteins 0.000 description 11
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 11
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 11
- 101100499295 Bacillus subtilis (strain 168) disA gene Proteins 0.000 description 11
- 108010069621 Epstein-Barr virus EBV-associated membrane antigen Proteins 0.000 description 11
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 11
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 11
- 101150007210 ORF6 gene Proteins 0.000 description 11
- 101100226894 Phomopsis amygdali PaGT gene Proteins 0.000 description 11
- 108010047857 aspartylglycine Proteins 0.000 description 11
- 108010078144 glutaminyl-glycine Proteins 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- 108010080629 tryptophan-leucine Proteins 0.000 description 11
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 10
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 10
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 10
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 10
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 10
- 108010038633 aspartylglutamate Proteins 0.000 description 10
- 108010036413 histidylglycine Proteins 0.000 description 10
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 10
- 108010053725 prolylvaline Proteins 0.000 description 10
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 9
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 9
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 9
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 9
- 108700019146 Transgenes Proteins 0.000 description 9
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 9
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 9
- 108010025306 histidylleucine Proteins 0.000 description 9
- 230000005847 immunogenicity Effects 0.000 description 9
- 239000002502 liposome Substances 0.000 description 9
- 108010068488 methionylphenylalanine Proteins 0.000 description 9
- 239000013603 viral vector Substances 0.000 description 9
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 8
- TWTPDFFBLQEBOE-IUCAKERBSA-N Gly-Leu-Gln Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O TWTPDFFBLQEBOE-IUCAKERBSA-N 0.000 description 8
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 8
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 8
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 8
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 8
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 8
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 8
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 8
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 8
- 108010077245 asparaginyl-proline Proteins 0.000 description 8
- 238000013461 design Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 8
- 108010037850 glycylvaline Proteins 0.000 description 8
- 108010028295 histidylhistidine Proteins 0.000 description 8
- 208000015181 infectious disease Diseases 0.000 description 8
- 238000002347 injection Methods 0.000 description 8
- 239000007924 injection Substances 0.000 description 8
- 239000013642 negative control Substances 0.000 description 8
- 108010090894 prolylleucine Proteins 0.000 description 8
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 7
- ICRHGPYYXMWHIE-LPEHRKFASA-N Arg-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ICRHGPYYXMWHIE-LPEHRKFASA-N 0.000 description 7
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 7
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 7
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 7
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 7
- PPQRKXHCLYCBSP-IHRRRGAJSA-N Leu-Leu-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N PPQRKXHCLYCBSP-IHRRRGAJSA-N 0.000 description 7
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 7
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 7
- MAXILRZVORNXBE-PMVMPFDFSA-N Leu-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MAXILRZVORNXBE-PMVMPFDFSA-N 0.000 description 7
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 7
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 7
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 7
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 7
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 7
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 7
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 7
- 108010041407 alanylaspartic acid Proteins 0.000 description 7
- 125000003275 alpha amino acid group Chemical group 0.000 description 7
- 108010068265 aspartyltyrosine Proteins 0.000 description 7
- 239000000969 carrier Substances 0.000 description 7
- 230000001186 cumulative effect Effects 0.000 description 7
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 7
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 7
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 7
- 108010089804 glycyl-threonine Proteins 0.000 description 7
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 7
- 210000004988 splenocyte Anatomy 0.000 description 7
- 108010061238 threonyl-glycine Proteins 0.000 description 7
- 238000002255 vaccination Methods 0.000 description 7
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 6
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 6
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 6
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 6
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 6
- GWWSUMLEWKQHLR-NUMRIWBASA-N Asp-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GWWSUMLEWKQHLR-NUMRIWBASA-N 0.000 description 6
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 6
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 6
- 108010065920 Insulin Lispro Proteins 0.000 description 6
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 6
- FOBUGKUBUJOWAD-IHPCNDPISA-N Leu-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FOBUGKUBUJOWAD-IHPCNDPISA-N 0.000 description 6
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 6
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 6
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 6
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 6
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 6
- VFWQQZMRKFOGLE-ZLUOBGJFSA-N Ser-Ser-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O VFWQQZMRKFOGLE-ZLUOBGJFSA-N 0.000 description 6
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 6
- RFKJNTRMXGCKFE-FHWLQOOXSA-N Val-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC(C)C)C(O)=O)=CNC2=C1 RFKJNTRMXGCKFE-FHWLQOOXSA-N 0.000 description 6
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 6
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 6
- 108010068380 arginylarginine Proteins 0.000 description 6
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 108010018006 histidylserine Proteins 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 6
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 6
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 6
- 229930182490 saponin Natural products 0.000 description 6
- 150000007949 saponins Chemical class 0.000 description 6
- 235000017709 saponins Nutrition 0.000 description 6
- 230000017613 viral reproduction Effects 0.000 description 6
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 5
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 5
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 5
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 5
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 5
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 5
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 5
- 241000288950 Callithrix jacchus Species 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 5
- WVLZTXGTNGHPBO-SRVKXCTJSA-N Cys-Leu-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O WVLZTXGTNGHPBO-SRVKXCTJSA-N 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 5
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 5
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 5
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 5
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 5
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 5
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 5
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 5
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 5
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 5
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 5
- CHZRWFUGWRTUOD-IUCAKERBSA-N His-Gly-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N CHZRWFUGWRTUOD-IUCAKERBSA-N 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 241000598171 Human adenovirus sp. Species 0.000 description 5
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 5
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 5
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 5
- 102000008070 Interferon-gamma Human genes 0.000 description 5
- 108010074328 Interferon-gamma Proteins 0.000 description 5
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 5
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 5
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 5
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 5
- SEMUSFOBZGKBGW-YTFOTSKYSA-N Leu-Ile-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SEMUSFOBZGKBGW-YTFOTSKYSA-N 0.000 description 5
- HGUUMQWGYCVPKG-DCAQKATOSA-N Leu-Pro-Cys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N HGUUMQWGYCVPKG-DCAQKATOSA-N 0.000 description 5
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 5
- 241000124008 Mammalia Species 0.000 description 5
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 5
- PZSCUPVOJGKHEP-CIUDSAMLSA-N Pro-Gln-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PZSCUPVOJGKHEP-CIUDSAMLSA-N 0.000 description 5
- FISHYTLIMUYTQY-GUBZILKMSA-N Pro-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 FISHYTLIMUYTQY-GUBZILKMSA-N 0.000 description 5
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 5
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 5
- CXGLFEOYCJFKPR-RCWTZXSCSA-N Pro-Thr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O CXGLFEOYCJFKPR-RCWTZXSCSA-N 0.000 description 5
- JXVXYRZQIUPYSA-NHCYSSNCSA-N Pro-Val-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JXVXYRZQIUPYSA-NHCYSSNCSA-N 0.000 description 5
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 5
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 5
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 5
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 5
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 5
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 5
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 5
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 5
- 230000000890 antigenic effect Effects 0.000 description 5
- 108010089442 arginyl-leucyl-alanyl-arginine Proteins 0.000 description 5
- 108010060035 arginylproline Proteins 0.000 description 5
- 210000003719 b-lymphocyte Anatomy 0.000 description 5
- 239000003085 diluting agent Substances 0.000 description 5
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 5
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 5
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 5
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 5
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 5
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 5
- 230000036039 immunity Effects 0.000 description 5
- 230000003308 immunostimulating effect Effects 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 229960003130 interferon gamma Drugs 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 108010031719 prolyl-serine Proteins 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- 108010084932 tryptophyl-proline Proteins 0.000 description 5
- 108010003137 tyrosyltyrosine Proteins 0.000 description 5
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 4
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 4
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 4
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 4
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 4
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 4
- MTDDMSUUXNQMKK-BPNCWPANSA-N Ala-Tyr-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N MTDDMSUUXNQMKK-BPNCWPANSA-N 0.000 description 4
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 4
- 241000710929 Alphavirus Species 0.000 description 4
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 4
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 4
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 4
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 4
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 4
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 4
- AUZAXCPWMDBWEE-HJGDQZAQSA-N Arg-Thr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O AUZAXCPWMDBWEE-HJGDQZAQSA-N 0.000 description 4
- PQAIOUVVZCOLJK-FXQIFTODSA-N Asn-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PQAIOUVVZCOLJK-FXQIFTODSA-N 0.000 description 4
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 4
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 4
- QCLHLXDWRKOHRR-GUBZILKMSA-N Asp-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N QCLHLXDWRKOHRR-GUBZILKMSA-N 0.000 description 4
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 4
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 4
- 238000011748 CB6F1 mouse Methods 0.000 description 4
- LDIKUWLAMDFHPU-FXQIFTODSA-N Cys-Cys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LDIKUWLAMDFHPU-FXQIFTODSA-N 0.000 description 4
- GHUVBPIYQYXXEF-SRVKXCTJSA-N Cys-Cys-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 GHUVBPIYQYXXEF-SRVKXCTJSA-N 0.000 description 4
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 4
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 4
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 4
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 4
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 4
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 4
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 4
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 4
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 4
- DBJYVKDPGIFXFO-BQBZGAKWSA-N Gly-Met-Ala Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O DBJYVKDPGIFXFO-BQBZGAKWSA-N 0.000 description 4
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 4
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 4
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 4
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 4
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 4
- DURWCDDDAWVPOP-JBDRJPRFSA-N Ile-Cys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N DURWCDDDAWVPOP-JBDRJPRFSA-N 0.000 description 4
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 4
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 4
- XVUAQNRNFMVWBR-BLMTYFJBSA-N Ile-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N XVUAQNRNFMVWBR-BLMTYFJBSA-N 0.000 description 4
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 4
- LZDNBBYBDGBADK-UHFFFAOYSA-N L-valyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C(C)C)C(O)=O)=CNC2=C1 LZDNBBYBDGBADK-UHFFFAOYSA-N 0.000 description 4
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 4
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 4
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 4
- PKKMDPNFGULLNQ-AVGNSLFASA-N Leu-Met-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O PKKMDPNFGULLNQ-AVGNSLFASA-N 0.000 description 4
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 4
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 4
- QQXJROOJCMIHIV-AVGNSLFASA-N Leu-Val-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O QQXJROOJCMIHIV-AVGNSLFASA-N 0.000 description 4
- 102000043131 MHC class II family Human genes 0.000 description 4
- 108091054438 MHC class II family Proteins 0.000 description 4
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 4
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 4
- 108010066427 N-valyltryptophan Proteins 0.000 description 4
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 4
- DVOCGBNHAUHKHJ-DKIMLUQUSA-N Phe-Ile-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O DVOCGBNHAUHKHJ-DKIMLUQUSA-N 0.000 description 4
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 4
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 4
- FXEKNHAJIMHRFJ-ULQDDVLXSA-N Phe-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N FXEKNHAJIMHRFJ-ULQDDVLXSA-N 0.000 description 4
- HPXVFFIIGOAQRV-DCAQKATOSA-N Pro-Arg-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O HPXVFFIIGOAQRV-DCAQKATOSA-N 0.000 description 4
- CJZTUKSFZUSNCC-FXQIFTODSA-N Pro-Asp-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 CJZTUKSFZUSNCC-FXQIFTODSA-N 0.000 description 4
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 4
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 4
- GBRUQFBAJOKCTF-DCAQKATOSA-N Pro-His-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O GBRUQFBAJOKCTF-DCAQKATOSA-N 0.000 description 4
- JLMZKEQFMVORMA-SRVKXCTJSA-N Pro-Pro-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 JLMZKEQFMVORMA-SRVKXCTJSA-N 0.000 description 4
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 4
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 4
- WWXNZNWZNZPDIF-SRVKXCTJSA-N Pro-Val-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 WWXNZNWZNZPDIF-SRVKXCTJSA-N 0.000 description 4
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 4
- XERQKTRGJIKTRB-CIUDSAMLSA-N Ser-His-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CN=CN1 XERQKTRGJIKTRB-CIUDSAMLSA-N 0.000 description 4
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 4
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 4
- WNDUPCKKKGSKIQ-CIUDSAMLSA-N Ser-Pro-Gln Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O WNDUPCKKKGSKIQ-CIUDSAMLSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 4
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 4
- 230000006044 T cell activation Effects 0.000 description 4
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 4
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 4
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 4
- RZRDCZDUYHBGDT-BVSLBCMMSA-N Trp-Met-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RZRDCZDUYHBGDT-BVSLBCMMSA-N 0.000 description 4
- HTGJDTPQYFMKNC-VFAJRCTISA-N Trp-Thr-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 HTGJDTPQYFMKNC-VFAJRCTISA-N 0.000 description 4
- QHEGAOPHISYNDF-XDTLVQLUSA-N Tyr-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHEGAOPHISYNDF-XDTLVQLUSA-N 0.000 description 4
- UMSZZGTXGKHTFJ-SRVKXCTJSA-N Tyr-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 UMSZZGTXGKHTFJ-SRVKXCTJSA-N 0.000 description 4
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 4
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 4
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 4
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 4
- DAVNYIUELQBTAP-XUXIUFHCSA-N Val-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N DAVNYIUELQBTAP-XUXIUFHCSA-N 0.000 description 4
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 4
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 4
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- 229940037003 alum Drugs 0.000 description 4
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 4
- 210000000234 capsid Anatomy 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 231100000673 dose–response relationship Toxicity 0.000 description 4
- 238000013401 experimental design Methods 0.000 description 4
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 4
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 4
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 4
- 108010010147 glycylglutamine Proteins 0.000 description 4
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 4
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 4
- 108010070643 prolylglutamic acid Proteins 0.000 description 4
- 239000001397 quillaja saponaria molina bark Substances 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- PQFMROVJTOPVDF-JBDRJPRFSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PQFMROVJTOPVDF-JBDRJPRFSA-N 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 3
- JUEUYDRZJNQZGR-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JUEUYDRZJNQZGR-UHFFFAOYSA-N 0.000 description 3
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 3
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 3
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 3
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 3
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 3
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 3
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 3
- DVJSJDDYCYSMFR-ZKWXMUAHSA-N Ala-Ile-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O DVJSJDDYCYSMFR-ZKWXMUAHSA-N 0.000 description 3
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 3
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 3
- VHVVPYOJIIQCKS-QEJZJMRPSA-N Ala-Leu-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VHVVPYOJIIQCKS-QEJZJMRPSA-N 0.000 description 3
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 3
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 3
- JAQNUEWEJWBVAY-WBAXXEDZSA-N Ala-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 JAQNUEWEJWBVAY-WBAXXEDZSA-N 0.000 description 3
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 3
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 3
- JNLDTVRGXMSYJC-UVBJJODRSA-N Ala-Pro-Trp Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O JNLDTVRGXMSYJC-UVBJJODRSA-N 0.000 description 3
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 3
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 3
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 3
- WZGZDOXCDLLTHE-SYWGBEHUSA-N Ala-Trp-Ile Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 WZGZDOXCDLLTHE-SYWGBEHUSA-N 0.000 description 3
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 3
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 3
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 3
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 3
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 3
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 3
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 3
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 3
- WMEVEPXNCMKNGH-IHRRRGAJSA-N Arg-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WMEVEPXNCMKNGH-IHRRRGAJSA-N 0.000 description 3
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 3
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 3
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 3
- OGZBJJLRKQZRHL-KJEVXHAQSA-N Arg-Thr-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OGZBJJLRKQZRHL-KJEVXHAQSA-N 0.000 description 3
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 3
- ZDOQDYFZNGASEY-BIIVOSGPSA-N Asn-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZDOQDYFZNGASEY-BIIVOSGPSA-N 0.000 description 3
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 3
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 3
- QXOPPIDJKPEKCW-GUBZILKMSA-N Asn-Pro-Arg Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O QXOPPIDJKPEKCW-GUBZILKMSA-N 0.000 description 3
- REQUGIWGOGSOEZ-ZLUOBGJFSA-N Asn-Ser-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N REQUGIWGOGSOEZ-ZLUOBGJFSA-N 0.000 description 3
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 3
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 3
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 3
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 3
- CASGONAXMZPHCK-FXQIFTODSA-N Asp-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N CASGONAXMZPHCK-FXQIFTODSA-N 0.000 description 3
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 3
- XACXDSRQIXRMNS-OLHMAJIHSA-N Asp-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)O XACXDSRQIXRMNS-OLHMAJIHSA-N 0.000 description 3
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 3
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 3
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 3
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 3
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 3
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 3
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 3
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 3
- LEYKQPDPZJIRTA-AQZXSJQPSA-N Asp-Trp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LEYKQPDPZJIRTA-AQZXSJQPSA-N 0.000 description 3
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 3
- 102100021277 Beta-secretase 2 Human genes 0.000 description 3
- 101710150190 Beta-secretase 2 Proteins 0.000 description 3
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 3
- VPQZSNQICFCCSO-BJDJZHNGSA-N Cys-Leu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VPQZSNQICFCCSO-BJDJZHNGSA-N 0.000 description 3
- QQOWCDCBFFBRQH-IXOXFDKPSA-N Cys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N)O QQOWCDCBFFBRQH-IXOXFDKPSA-N 0.000 description 3
- 102000004127 Cytokines Human genes 0.000 description 3
- 108090000695 Cytokines Proteins 0.000 description 3
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 3
- JFSNBQJNDMXMQF-XHNCKOQMSA-N Gln-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)C(=O)O JFSNBQJNDMXMQF-XHNCKOQMSA-N 0.000 description 3
- XSBGUANSZDGULP-IUCAKERBSA-N Gln-Gly-Lys Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O XSBGUANSZDGULP-IUCAKERBSA-N 0.000 description 3
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 3
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 3
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 3
- WLRYGVYQFXRJDA-DCAQKATOSA-N Gln-Pro-Pro Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 WLRYGVYQFXRJDA-DCAQKATOSA-N 0.000 description 3
- MFHVAWMMKZBSRQ-ACZMJKKPSA-N Gln-Ser-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N MFHVAWMMKZBSRQ-ACZMJKKPSA-N 0.000 description 3
- SYZZMPFLOLSMHL-XHNCKOQMSA-N Gln-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SYZZMPFLOLSMHL-XHNCKOQMSA-N 0.000 description 3
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 3
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 3
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 3
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 3
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 3
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 3
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 3
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 3
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 3
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 3
- DMYACXMQUABZIQ-NRPADANISA-N Glu-Ser-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O DMYACXMQUABZIQ-NRPADANISA-N 0.000 description 3
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 3
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 3
- ZTNHPMZHAILHRB-JSGCOSHPSA-N Glu-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)NCC(O)=O)=CNC2=C1 ZTNHPMZHAILHRB-JSGCOSHPSA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 3
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 3
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 3
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 3
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 3
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 3
- ZOTGXWMKUFSKEU-QXEWZRGKSA-N Gly-Ile-Met Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O ZOTGXWMKUFSKEU-QXEWZRGKSA-N 0.000 description 3
- WMGHDYWNHNLGBV-ONGXEEELSA-N Gly-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 WMGHDYWNHNLGBV-ONGXEEELSA-N 0.000 description 3
- JYPCXBJRLBHWME-IUCAKERBSA-N Gly-Pro-Arg Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JYPCXBJRLBHWME-IUCAKERBSA-N 0.000 description 3
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 3
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 3
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 3
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- BQFGKVYHKCNEMF-DCAQKATOSA-N His-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 BQFGKVYHKCNEMF-DCAQKATOSA-N 0.000 description 3
- KAFZDWMZKGQDEE-SRVKXCTJSA-N His-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KAFZDWMZKGQDEE-SRVKXCTJSA-N 0.000 description 3
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 3
- GIRSNERMXCMDBO-GARJFASQSA-N His-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O GIRSNERMXCMDBO-GARJFASQSA-N 0.000 description 3
- FOCSWPCHUDVNLP-PMVMPFDFSA-N His-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CC4=CN=CN4)N FOCSWPCHUDVNLP-PMVMPFDFSA-N 0.000 description 3
- 101000669447 Homo sapiens Toll-like receptor 4 Proteins 0.000 description 3
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 3
- WTOAPTKSZJJWKK-HTFCKZLJSA-N Ile-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WTOAPTKSZJJWKK-HTFCKZLJSA-N 0.000 description 3
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 3
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 3
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 3
- XLXPYSDGMXTTNQ-DKIMLUQUSA-N Ile-Phe-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CC(C)C)C(O)=O XLXPYSDGMXTTNQ-DKIMLUQUSA-N 0.000 description 3
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 3
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 3
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 3
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 3
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 3
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 3
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 3
- HYMLKESRWLZDBR-WEDXCCLWSA-N Leu-Gly-Thr Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HYMLKESRWLZDBR-WEDXCCLWSA-N 0.000 description 3
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 3
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 3
- ORWTWZXGDBYVCP-BJDJZHNGSA-N Leu-Ile-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(C)C ORWTWZXGDBYVCP-BJDJZHNGSA-N 0.000 description 3
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 3
- TVEOVCYCYGKVPP-HSCHXYMDSA-N Leu-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N TVEOVCYCYGKVPP-HSCHXYMDSA-N 0.000 description 3
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 3
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 3
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 3
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 3
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 3
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 3
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 3
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 3
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 3
- URHJPNHRQMQGOZ-RHYQMDGZSA-N Leu-Thr-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O URHJPNHRQMQGOZ-RHYQMDGZSA-N 0.000 description 3
- RNYLNYTYMXACRI-VFAJRCTISA-N Leu-Thr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O RNYLNYTYMXACRI-VFAJRCTISA-N 0.000 description 3
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 3
- QQYRCUXKLDGCQN-SRVKXCTJSA-N Lys-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N QQYRCUXKLDGCQN-SRVKXCTJSA-N 0.000 description 3
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 3
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 3
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 3
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 3
- GFWLIJDQILOEPP-HSCHXYMDSA-N Lys-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N GFWLIJDQILOEPP-HSCHXYMDSA-N 0.000 description 3
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 3
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 3
- ZAJNRWKGHWGPDQ-SDDRHHMPSA-N Met-Arg-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N ZAJNRWKGHWGPDQ-SDDRHHMPSA-N 0.000 description 3
- ZEVPMOHYCQFWSE-NAKRPEOUSA-N Met-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N ZEVPMOHYCQFWSE-NAKRPEOUSA-N 0.000 description 3
- UDOYVQQKQHZYMB-DCAQKATOSA-N Met-Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDOYVQQKQHZYMB-DCAQKATOSA-N 0.000 description 3
- PHKBGZKVOJCIMZ-SRVKXCTJSA-N Met-Pro-Arg Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PHKBGZKVOJCIMZ-SRVKXCTJSA-N 0.000 description 3
- BJPQKNHZHUCQNQ-SRVKXCTJSA-N Met-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCSC)N BJPQKNHZHUCQNQ-SRVKXCTJSA-N 0.000 description 3
- RDLSEGZJMYGFNS-FXQIFTODSA-N Met-Ser-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RDLSEGZJMYGFNS-FXQIFTODSA-N 0.000 description 3
- GGXZOTSDJJTDGB-GUBZILKMSA-N Met-Ser-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O GGXZOTSDJJTDGB-GUBZILKMSA-N 0.000 description 3
- GHQFLTYXGUETFD-UFYCRDLUSA-N Met-Tyr-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N GHQFLTYXGUETFD-UFYCRDLUSA-N 0.000 description 3
- 241001183012 Modified Vaccinia Ankara virus Species 0.000 description 3
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 3
- FSPGBMWPNMRWDB-AVGNSLFASA-N Phe-Cys-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N FSPGBMWPNMRWDB-AVGNSLFASA-N 0.000 description 3
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 3
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 3
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 3
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 3
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 3
- VHDNDCPMHQMXIR-IHRRRGAJSA-N Phe-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHDNDCPMHQMXIR-IHRRRGAJSA-N 0.000 description 3
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 3
- ZJPGOXWRFNKIQL-JYJNAYRXSA-N Phe-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 ZJPGOXWRFNKIQL-JYJNAYRXSA-N 0.000 description 3
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 3
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 3
- SSSFPISOZOLQNP-GUBZILKMSA-N Pro-Arg-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSFPISOZOLQNP-GUBZILKMSA-N 0.000 description 3
- OLHDPZMYUSBGDE-GUBZILKMSA-N Pro-Arg-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O OLHDPZMYUSBGDE-GUBZILKMSA-N 0.000 description 3
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 3
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 3
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 3
- DIZLUAZLNDFDPR-CIUDSAMLSA-N Pro-Cys-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 DIZLUAZLNDFDPR-CIUDSAMLSA-N 0.000 description 3
- CMOIIANLNNYUTP-SRVKXCTJSA-N Pro-Gln-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CMOIIANLNNYUTP-SRVKXCTJSA-N 0.000 description 3
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 3
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 3
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 3
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 3
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 3
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 3
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 3
- WIPAMEKBSHNFQE-IUCAKERBSA-N Pro-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@@H]1CCCN1 WIPAMEKBSHNFQE-IUCAKERBSA-N 0.000 description 3
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 3
- SEZGGSHLMROBFX-CIUDSAMLSA-N Pro-Ser-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O SEZGGSHLMROBFX-CIUDSAMLSA-N 0.000 description 3
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 3
- STGVYUTZKGPRCI-GUBZILKMSA-N Pro-Val-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 STGVYUTZKGPRCI-GUBZILKMSA-N 0.000 description 3
- 101500027983 Rattus norvegicus Octadecaneuropeptide Proteins 0.000 description 3
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 3
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 3
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 3
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 3
- YMAWDPHQVABADW-CIUDSAMLSA-N Ser-Gln-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O YMAWDPHQVABADW-CIUDSAMLSA-N 0.000 description 3
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 3
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 3
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 3
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 3
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 3
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 3
- AABIBDJHSKIMJK-FXQIFTODSA-N Ser-Ser-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O AABIBDJHSKIMJK-FXQIFTODSA-N 0.000 description 3
- KKKVOZNCLALMPV-XKBZYTNZSA-N Ser-Thr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O KKKVOZNCLALMPV-XKBZYTNZSA-N 0.000 description 3
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 3
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 3
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 3
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 3
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 3
- YOSLMIPKOUAHKI-OLHMAJIHSA-N Thr-Asp-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YOSLMIPKOUAHKI-OLHMAJIHSA-N 0.000 description 3
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 3
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 3
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 3
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 3
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 3
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 3
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 3
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 3
- ABWNZPOIUJMNKT-IXOXFDKPSA-N Thr-Phe-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O ABWNZPOIUJMNKT-IXOXFDKPSA-N 0.000 description 3
- NYQIZWROIMIQSL-VEVYYDQMSA-N Thr-Pro-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O NYQIZWROIMIQSL-VEVYYDQMSA-N 0.000 description 3
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 3
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 3
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 3
- 102100039360 Toll-like receptor 4 Human genes 0.000 description 3
- PXYJUECTGMGIDT-WDSOQIARSA-N Trp-Arg-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 PXYJUECTGMGIDT-WDSOQIARSA-N 0.000 description 3
- XZSJDSBPEJBEFZ-QRTARXTBSA-N Trp-Asn-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O XZSJDSBPEJBEFZ-QRTARXTBSA-N 0.000 description 3
- YDTKYBHPRULROG-LTHWPDAASA-N Trp-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YDTKYBHPRULROG-LTHWPDAASA-N 0.000 description 3
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 3
- UKWSFUSPGPBJGU-VFAJRCTISA-N Trp-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O UKWSFUSPGPBJGU-VFAJRCTISA-N 0.000 description 3
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 3
- NGALWFGCOMHUSN-AVGNSLFASA-N Tyr-Gln-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NGALWFGCOMHUSN-AVGNSLFASA-N 0.000 description 3
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 3
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 3
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 3
- BIWVVOHTKDLRMP-ULQDDVLXSA-N Tyr-Pro-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BIWVVOHTKDLRMP-ULQDDVLXSA-N 0.000 description 3
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 3
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 3
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 3
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 3
- AGKDVLSDNSTLFA-UMNHJUIQSA-N Val-Gln-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N AGKDVLSDNSTLFA-UMNHJUIQSA-N 0.000 description 3
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 3
- WDIWOIRFNMLNKO-ULQDDVLXSA-N Val-Leu-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WDIWOIRFNMLNKO-ULQDDVLXSA-N 0.000 description 3
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 3
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 3
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 3
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 3
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 3
- PMKQKNBISAOSRI-XHSDSOJGSA-N Val-Tyr-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N PMKQKNBISAOSRI-XHSDSOJGSA-N 0.000 description 3
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 3
- UZQJVUCHXGYFLQ-AYDHOLPZSA-N [(2s,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-4-[(2r,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-3,5-dihydroxy-6-(hydroxymethyl)-4-[(2s,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-3,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-3,5-dihydroxy-6-(hy Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@]([C@@]3(CC[C@H]2[C@@]1(C=O)C)C)(C)CC(O)[C@]1(CCC(CC14)(C)C)C(=O)O[C@H]1[C@@H]([C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O[C@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UZQJVUCHXGYFLQ-AYDHOLPZSA-N 0.000 description 3
- 239000013543 active substance Substances 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 3
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 3
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 3
- 235000012000 cholesterol Nutrition 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 3
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 3
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 3
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 3
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 3
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 3
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 3
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 108010028930 invariant chain Proteins 0.000 description 3
- 108010027338 isoleucylcysteine Proteins 0.000 description 3
- 108010009932 leucyl-alanyl-glycyl-valine Proteins 0.000 description 3
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 239000007764 o/w emulsion Substances 0.000 description 3
- 229940046166 oligodeoxynucleotide Drugs 0.000 description 3
- 108010018625 phenylalanylarginine Proteins 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 108010079892 phosphoglycerol kinase Proteins 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 108010087846 prolyl-prolyl-glycine Proteins 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 239000003381 stabilizer Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000004094 surface-active agent Substances 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 108700004896 tripeptide FEG Proteins 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- 241001529453 unidentified herpesvirus Species 0.000 description 3
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 2
- VWWKKDNCCLAGRM-GVXVVHGQSA-N (2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]propanoyl]amino]acetyl]amino]-3-methylbutanoic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VWWKKDNCCLAGRM-GVXVVHGQSA-N 0.000 description 2
- CUVSTAMIHSSVKL-UWVGGRQHSA-N (4s)-4-[(2-aminoacetyl)amino]-5-[[(2s)-6-amino-1-(carboxymethylamino)-1-oxohexan-2-yl]amino]-5-oxopentanoic acid Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN CUVSTAMIHSSVKL-UWVGGRQHSA-N 0.000 description 2
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 2
- OZRFYUJEXYKQDV-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-carboxypropanoyl)amino]-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound OC(=O)CC(N)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(O)=O OZRFYUJEXYKQDV-UHFFFAOYSA-N 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 2
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 2
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 2
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 2
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 2
- JWUZOJXDJDEQEM-ZLIFDBKOSA-N Ala-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 JWUZOJXDJDEQEM-ZLIFDBKOSA-N 0.000 description 2
- RAAWHFXHAACDFT-FXQIFTODSA-N Ala-Met-Asn Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CC(N)=O)C(O)=O RAAWHFXHAACDFT-FXQIFTODSA-N 0.000 description 2
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 2
- DYJJJCHDHLEFDW-FXQIFTODSA-N Ala-Pro-Cys Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)O)N DYJJJCHDHLEFDW-FXQIFTODSA-N 0.000 description 2
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 2
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 2
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 2
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 2
- BIOCIVSVEDFKDJ-GUBZILKMSA-N Arg-Arg-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O BIOCIVSVEDFKDJ-GUBZILKMSA-N 0.000 description 2
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 2
- JTKLCCFLSLCCST-SZMVWBNQSA-N Arg-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JTKLCCFLSLCCST-SZMVWBNQSA-N 0.000 description 2
- GHNDBBVSWOWYII-LPEHRKFASA-N Arg-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GHNDBBVSWOWYII-LPEHRKFASA-N 0.000 description 2
- DXQIQUIQYAGRCC-CIUDSAMLSA-N Arg-Asp-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)CN=C(N)N DXQIQUIQYAGRCC-CIUDSAMLSA-N 0.000 description 2
- ZATRYQNPUHGXCU-DTWKUNHWSA-N Arg-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZATRYQNPUHGXCU-DTWKUNHWSA-N 0.000 description 2
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 2
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 2
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 2
- IIAXFBUTKIDDIP-ULQDDVLXSA-N Arg-Leu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IIAXFBUTKIDDIP-ULQDDVLXSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- JBIRFLWXWDSDTR-CYDGBPFRSA-N Arg-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCN=C(N)N)N JBIRFLWXWDSDTR-CYDGBPFRSA-N 0.000 description 2
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 2
- BSYKSCBTTQKOJG-GUBZILKMSA-N Arg-Pro-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BSYKSCBTTQKOJG-GUBZILKMSA-N 0.000 description 2
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 2
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 2
- QHVRVUNEAIFTEK-SZMVWBNQSA-N Arg-Pro-Trp Chemical compound N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O QHVRVUNEAIFTEK-SZMVWBNQSA-N 0.000 description 2
- BXLDDWZOTGGNOJ-SZMVWBNQSA-N Arg-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCCN=C(N)N)N BXLDDWZOTGGNOJ-SZMVWBNQSA-N 0.000 description 2
- NMTANZXPDAHUKU-ULQDDVLXSA-N Arg-Tyr-Lys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 NMTANZXPDAHUKU-ULQDDVLXSA-N 0.000 description 2
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 2
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 2
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 2
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 2
- KOWWUKUFQYDZID-SRVKXCTJSA-N Asn-Gly-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KOWWUKUFQYDZID-SRVKXCTJSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 2
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 2
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 2
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 2
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 2
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 2
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 2
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 2
- VBVKSAFJPVXMFJ-CIUDSAMLSA-N Asp-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N VBVKSAFJPVXMFJ-CIUDSAMLSA-N 0.000 description 2
- UGIBTKGQVWFTGX-BIIVOSGPSA-N Asp-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O UGIBTKGQVWFTGX-BIIVOSGPSA-N 0.000 description 2
- NYQHSUGFEWDWPD-ACZMJKKPSA-N Asp-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N NYQHSUGFEWDWPD-ACZMJKKPSA-N 0.000 description 2
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 2
- GHODABZPVZMWCE-FXQIFTODSA-N Asp-Glu-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GHODABZPVZMWCE-FXQIFTODSA-N 0.000 description 2
- DGKCOYGQLNWNCJ-ACZMJKKPSA-N Asp-Glu-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O DGKCOYGQLNWNCJ-ACZMJKKPSA-N 0.000 description 2
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 2
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 2
- QHHVSXGWLYEAGX-GUBZILKMSA-N Asp-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QHHVSXGWLYEAGX-GUBZILKMSA-N 0.000 description 2
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 2
- SCQIQCWLOMOEFP-DCAQKATOSA-N Asp-Leu-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SCQIQCWLOMOEFP-DCAQKATOSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 2
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 2
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 2
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 2
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 2
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 2
- GCACQYDBDHRVGE-LKXGYXEUSA-N Asp-Thr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC(O)=O GCACQYDBDHRVGE-LKXGYXEUSA-N 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- SQJSYLDKQBZQTG-FXQIFTODSA-N Cys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N SQJSYLDKQBZQTG-FXQIFTODSA-N 0.000 description 2
- ZWNFOZNJYNDNGM-UBHSHLNASA-N Cys-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N ZWNFOZNJYNDNGM-UBHSHLNASA-N 0.000 description 2
- UFOBYROTHHYVGW-CIUDSAMLSA-N Cys-Cys-His Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O UFOBYROTHHYVGW-CIUDSAMLSA-N 0.000 description 2
- ZMWOJVAXTOUHAP-ZKWXMUAHSA-N Cys-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N ZMWOJVAXTOUHAP-ZKWXMUAHSA-N 0.000 description 2
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 2
- CIVXDCMSSFGWAL-YUMQZZPRSA-N Cys-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N CIVXDCMSSFGWAL-YUMQZZPRSA-N 0.000 description 2
- RESAHOSBQHMOKH-KKUMJFAQSA-N Cys-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N RESAHOSBQHMOKH-KKUMJFAQSA-N 0.000 description 2
- ZGERHCJBLPQPGV-ACZMJKKPSA-N Cys-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N ZGERHCJBLPQPGV-ACZMJKKPSA-N 0.000 description 2
- ALNKNYKSZPSLBD-ZDLURKLDSA-N Cys-Thr-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ALNKNYKSZPSLBD-ZDLURKLDSA-N 0.000 description 2
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 2
- FNXOZWPPOJRBRE-XGEHTFHBSA-N Cys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)N)O FNXOZWPPOJRBRE-XGEHTFHBSA-N 0.000 description 2
- 101150029662 E1 gene Proteins 0.000 description 2
- 101150113929 EBNA2 gene Proteins 0.000 description 2
- 238000011510 Elispot assay Methods 0.000 description 2
- 206010014611 Encephalitis venezuelan equine Diseases 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000700662 Fowlpox virus Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 2
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 2
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 2
- OVQXQLWWJSNYFV-XEGUGMAKSA-N Gln-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(N)=O)C)C(O)=O)=CNC2=C1 OVQXQLWWJSNYFV-XEGUGMAKSA-N 0.000 description 2
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 2
- DXMPMSWUZVNBSG-QEJZJMRPSA-N Gln-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N DXMPMSWUZVNBSG-QEJZJMRPSA-N 0.000 description 2
- QFTRCUPCARNIPZ-XHNCKOQMSA-N Gln-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)C(=O)O QFTRCUPCARNIPZ-XHNCKOQMSA-N 0.000 description 2
- LPYPANUXJGFMGV-FXQIFTODSA-N Gln-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N LPYPANUXJGFMGV-FXQIFTODSA-N 0.000 description 2
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 2
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 2
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 2
- JXFLPKSDLDEOQK-JHEQGTHGSA-N Gln-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O JXFLPKSDLDEOQK-JHEQGTHGSA-N 0.000 description 2
- BVELAHPZLYLZDJ-HGNGGELXSA-N Gln-His-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O BVELAHPZLYLZDJ-HGNGGELXSA-N 0.000 description 2
- OOLCSQQPSLIETN-JYJNAYRXSA-N Gln-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)O OOLCSQQPSLIETN-JYJNAYRXSA-N 0.000 description 2
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 2
- GURIQZQSTBBHRV-SRVKXCTJSA-N Gln-Lys-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GURIQZQSTBBHRV-SRVKXCTJSA-N 0.000 description 2
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 2
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 2
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 2
- VXAIXLOYBPMZPT-JBACZVJFSA-N Gln-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VXAIXLOYBPMZPT-JBACZVJFSA-N 0.000 description 2
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 2
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 2
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 2
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 2
- OBIHEDRRSMRKLU-ACZMJKKPSA-N Glu-Cys-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OBIHEDRRSMRKLU-ACZMJKKPSA-N 0.000 description 2
- AIGROOHQXCACHL-WDSKDSINSA-N Glu-Gly-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O AIGROOHQXCACHL-WDSKDSINSA-N 0.000 description 2
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 2
- XMPAXPSENRSOSV-RYUDHWBXSA-N Glu-Gly-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XMPAXPSENRSOSV-RYUDHWBXSA-N 0.000 description 2
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 2
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 2
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 2
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 2
- JRDYDYXZKFNNRQ-XPUUQOCRSA-N Gly-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN JRDYDYXZKFNNRQ-XPUUQOCRSA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- AIJAPFVDBFYNKN-WHFBIAKZSA-N Gly-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN)C(=O)N AIJAPFVDBFYNKN-WHFBIAKZSA-N 0.000 description 2
- XQHSBNVACKQWAV-WHFBIAKZSA-N Gly-Asp-Asn Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O XQHSBNVACKQWAV-WHFBIAKZSA-N 0.000 description 2
- LGQZOQRDEUIZJY-YUMQZZPRSA-N Gly-Cys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CS)NC(=O)CN)C(O)=O LGQZOQRDEUIZJY-YUMQZZPRSA-N 0.000 description 2
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 2
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 2
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 2
- JUBDONGMHASUCN-IUCAKERBSA-N Gly-Glu-His Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O JUBDONGMHASUCN-IUCAKERBSA-N 0.000 description 2
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 2
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 2
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 2
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 2
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 2
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 2
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 2
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 2
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 2
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 2
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 2
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 2
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 2
- JWLWNCVBBSBCEM-NKIYYHGXSA-N His-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N)O JWLWNCVBBSBCEM-NKIYYHGXSA-N 0.000 description 2
- PYNUBZSXKQKAHL-UWVGGRQHSA-N His-Gly-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O PYNUBZSXKQKAHL-UWVGGRQHSA-N 0.000 description 2
- QAMFAYSMNZBNCA-UWVGGRQHSA-N His-Gly-Met Chemical compound CSCC[C@H](NC(=O)CNC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O QAMFAYSMNZBNCA-UWVGGRQHSA-N 0.000 description 2
- QCBYAHHNOHBXIH-UWVGGRQHSA-N His-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CN=CN1 QCBYAHHNOHBXIH-UWVGGRQHSA-N 0.000 description 2
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 2
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 2
- GGXUJBKENKVYNV-ULQDDVLXSA-N His-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N GGXUJBKENKVYNV-ULQDDVLXSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 2
- ZGGWRNBSBOHIGH-HVTMNAMFSA-N Ile-Gln-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZGGWRNBSBOHIGH-HVTMNAMFSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- AREBLHSMLMRICD-PYJNHQTQSA-N Ile-His-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AREBLHSMLMRICD-PYJNHQTQSA-N 0.000 description 2
- GLLAUPMJCGKPFY-BLMTYFJBSA-N Ile-Ile-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 GLLAUPMJCGKPFY-BLMTYFJBSA-N 0.000 description 2
- KLBVGHCGHUNHEA-BJDJZHNGSA-N Ile-Leu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)O)N KLBVGHCGHUNHEA-BJDJZHNGSA-N 0.000 description 2
- TWYOYAKMLHWMOJ-ZPFDUUQYSA-N Ile-Leu-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O TWYOYAKMLHWMOJ-ZPFDUUQYSA-N 0.000 description 2
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 2
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 2
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 2
- JJQQGCMKLOEGAV-OSUNSFLBSA-N Ile-Thr-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)O)N JJQQGCMKLOEGAV-OSUNSFLBSA-N 0.000 description 2
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 2
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 2
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- 108090000171 Interleukin-18 Proteins 0.000 description 2
- 108010002350 Interleukin-2 Proteins 0.000 description 2
- 108010002586 Interleukin-7 Proteins 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 108700042652 LMP-2 Proteins 0.000 description 2
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 2
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 2
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 2
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 2
- KGCLIYGPQXUNLO-IUCAKERBSA-N Leu-Gly-Glu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O KGCLIYGPQXUNLO-IUCAKERBSA-N 0.000 description 2
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 2
- ARRIJPQRBWRNLT-DCAQKATOSA-N Leu-Met-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ARRIJPQRBWRNLT-DCAQKATOSA-N 0.000 description 2
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 2
- HDHQQEDVWQGBEE-DCAQKATOSA-N Leu-Met-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O HDHQQEDVWQGBEE-DCAQKATOSA-N 0.000 description 2
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 2
- MUCIDQMDOYQYBR-IHRRRGAJSA-N Leu-Pro-His Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N MUCIDQMDOYQYBR-IHRRRGAJSA-N 0.000 description 2
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 2
- IDGRADDMTTWOQC-WDSOQIARSA-N Leu-Trp-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IDGRADDMTTWOQC-WDSOQIARSA-N 0.000 description 2
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 2
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 2
- 241000712899 Lymphocytic choriomeningitis mammarenavirus Species 0.000 description 2
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 2
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- JPYPRVHMKRFTAT-KKUMJFAQSA-N Lys-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N JPYPRVHMKRFTAT-KKUMJFAQSA-N 0.000 description 2
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 2
- HYSVGEAWTGPMOA-IHRRRGAJSA-N Lys-Pro-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O HYSVGEAWTGPMOA-IHRRRGAJSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 2
- DTICLBJHRYSJLH-GUBZILKMSA-N Met-Ala-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O DTICLBJHRYSJLH-GUBZILKMSA-N 0.000 description 2
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 2
- YORIKIDJCPKBON-YUMQZZPRSA-N Met-Glu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YORIKIDJCPKBON-YUMQZZPRSA-N 0.000 description 2
- 102000003792 Metallothionein Human genes 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241000282576 Pan paniscus Species 0.000 description 2
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 2
- LXUJDHOKVUYHRC-KKUMJFAQSA-N Phe-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N LXUJDHOKVUYHRC-KKUMJFAQSA-N 0.000 description 2
- NKLDZIPTGKBDBB-HTUGSXCWSA-N Phe-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N)O NKLDZIPTGKBDBB-HTUGSXCWSA-N 0.000 description 2
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 2
- MMYUOSCXBJFUNV-QWRGUYRKSA-N Phe-Gly-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N MMYUOSCXBJFUNV-QWRGUYRKSA-N 0.000 description 2
- OVJMCXAPGFDGMG-HKUYNNGSSA-N Phe-Gly-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OVJMCXAPGFDGMG-HKUYNNGSSA-N 0.000 description 2
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 2
- RGZYXNFHYRFNNS-MXAVVETBSA-N Phe-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGZYXNFHYRFNNS-MXAVVETBSA-N 0.000 description 2
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 2
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 2
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 2
- AOKZOUGUMLBPSS-PMVMPFDFSA-N Phe-Trp-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O AOKZOUGUMLBPSS-PMVMPFDFSA-N 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 2
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 2
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 2
- VJLJGKQAOQJXJG-CIUDSAMLSA-N Pro-Asp-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJLJGKQAOQJXJG-CIUDSAMLSA-N 0.000 description 2
- OGRYXQOUFHAMPI-DCAQKATOSA-N Pro-Cys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O OGRYXQOUFHAMPI-DCAQKATOSA-N 0.000 description 2
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 2
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 2
- NMELOOXSGDRBRU-YUMQZZPRSA-N Pro-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 NMELOOXSGDRBRU-YUMQZZPRSA-N 0.000 description 2
- ZTVCLZLGHZXLOT-ULQDDVLXSA-N Pro-Glu-Trp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O ZTVCLZLGHZXLOT-ULQDDVLXSA-N 0.000 description 2
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 2
- ULIWFCCJIOEHMU-BQBZGAKWSA-N Pro-Gly-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 ULIWFCCJIOEHMU-BQBZGAKWSA-N 0.000 description 2
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 2
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 2
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 2
- XFFIGWGYMUFCCQ-ULQDDVLXSA-N Pro-His-Tyr Chemical compound C1=CC(O)=CC=C1C[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H]1[NH2+]CCC1)CC1=CN=CN1 XFFIGWGYMUFCCQ-ULQDDVLXSA-N 0.000 description 2
- IBGCFJDLCYTKPW-NAKRPEOUSA-N Pro-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 IBGCFJDLCYTKPW-NAKRPEOUSA-N 0.000 description 2
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 2
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 2
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 2
- WOIFYRZPIORBRY-AVGNSLFASA-N Pro-Lys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O WOIFYRZPIORBRY-AVGNSLFASA-N 0.000 description 2
- APIAILHCTSBGLU-JYJNAYRXSA-N Pro-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@@H]2CCCN2 APIAILHCTSBGLU-JYJNAYRXSA-N 0.000 description 2
- WLJYLAQSUSIQNH-GUBZILKMSA-N Pro-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@@H]1CCCN1 WLJYLAQSUSIQNH-GUBZILKMSA-N 0.000 description 2
- BUEIYHBJHCDAMI-UFYCRDLUSA-N Pro-Phe-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BUEIYHBJHCDAMI-UFYCRDLUSA-N 0.000 description 2
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 2
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 2
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 2
- KBUAPZAZPWNYSW-SRVKXCTJSA-N Pro-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KBUAPZAZPWNYSW-SRVKXCTJSA-N 0.000 description 2
- CZCCVJUUWBMISW-FXQIFTODSA-N Pro-Ser-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O CZCCVJUUWBMISW-FXQIFTODSA-N 0.000 description 2
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 2
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 2
- VBZXFFYOBDLLFE-HSHDSVGOSA-N Pro-Trp-Thr Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H]([C@H](O)C)C(O)=O)C(=O)[C@@H]1CCCN1 VBZXFFYOBDLLFE-HSHDSVGOSA-N 0.000 description 2
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 2
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 2
- 241000710961 Semliki Forest virus Species 0.000 description 2
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 2
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 2
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 2
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 2
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 2
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 2
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 2
- BEAFYHFQTOTVFS-VGDYDELISA-N Ser-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N BEAFYHFQTOTVFS-VGDYDELISA-N 0.000 description 2
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 2
- DOSZISJPMCYEHT-NAKRPEOUSA-N Ser-Ile-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O DOSZISJPMCYEHT-NAKRPEOUSA-N 0.000 description 2
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 2
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 2
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 2
- WMZVVNLPHFSUPA-BPUTZDHNSA-N Ser-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 WMZVVNLPHFSUPA-BPUTZDHNSA-N 0.000 description 2
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 2
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 2
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 2
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 2
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 2
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 2
- VIBXMCZWVUOZLA-OLHMAJIHSA-N Thr-Asn-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O VIBXMCZWVUOZLA-OLHMAJIHSA-N 0.000 description 2
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 2
- JEDIEMIJYSRUBB-FOHZUACHSA-N Thr-Asp-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O JEDIEMIJYSRUBB-FOHZUACHSA-N 0.000 description 2
- UHBPFYOQQPFKQR-JHEQGTHGSA-N Thr-Gln-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UHBPFYOQQPFKQR-JHEQGTHGSA-N 0.000 description 2
- DIPIPFHFLPTCLK-LOKLDPHHSA-N Thr-Gln-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O DIPIPFHFLPTCLK-LOKLDPHHSA-N 0.000 description 2
- WDFPMSHYMRBLKM-NKIYYHGXSA-N Thr-Glu-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O WDFPMSHYMRBLKM-NKIYYHGXSA-N 0.000 description 2
- OQCXTUQTKQFDCX-HTUGSXCWSA-N Thr-Glu-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O OQCXTUQTKQFDCX-HTUGSXCWSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 2
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 2
- NCGUQWSJUKYCIT-SZZJOZGLSA-N Thr-His-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NCGUQWSJUKYCIT-SZZJOZGLSA-N 0.000 description 2
- XUGYQLFEJYZOKQ-NGTWOADLSA-N Thr-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XUGYQLFEJYZOKQ-NGTWOADLSA-N 0.000 description 2
- NDXSOKGYKCGYKT-VEVYYDQMSA-N Thr-Pro-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O NDXSOKGYKCGYKT-VEVYYDQMSA-N 0.000 description 2
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 2
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 2
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 2
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 2
- PJCYRZVSACOYSN-ZJDVBMNYSA-N Thr-Thr-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O PJCYRZVSACOYSN-ZJDVBMNYSA-N 0.000 description 2
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 2
- ZESGVALRVJIVLZ-VFCFLDTKSA-N Thr-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O ZESGVALRVJIVLZ-VFCFLDTKSA-N 0.000 description 2
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 2
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 2
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 2
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 2
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 2
- 102000008229 Toll-like receptor 1 Human genes 0.000 description 2
- 108010060889 Toll-like receptor 1 Proteins 0.000 description 2
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 2
- MDDYTWOFHZFABW-SZMVWBNQSA-N Trp-Gln-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 MDDYTWOFHZFABW-SZMVWBNQSA-N 0.000 description 2
- BEWOXKJJMBKRQL-AAEUAGOBSA-N Trp-Gly-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N BEWOXKJJMBKRQL-AAEUAGOBSA-N 0.000 description 2
- NOFFAYIYPAUNRM-HKUYNNGSSA-N Trp-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC2=CNC3=CC=CC=C32)N NOFFAYIYPAUNRM-HKUYNNGSSA-N 0.000 description 2
- NXQAOORHSYJRGH-AAEUAGOBSA-N Trp-Gly-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 NXQAOORHSYJRGH-AAEUAGOBSA-N 0.000 description 2
- HLDFBNPSURDYEN-VHWLVUOQSA-N Trp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HLDFBNPSURDYEN-VHWLVUOQSA-N 0.000 description 2
- LFMMXTLRXKBPMC-FDARSICLSA-N Trp-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N LFMMXTLRXKBPMC-FDARSICLSA-N 0.000 description 2
- MEZCXKYMMQJRDE-PMVMPFDFSA-N Trp-Leu-Tyr Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)CC(C)C)C(O)=O)C1=CC=C(O)C=C1 MEZCXKYMMQJRDE-PMVMPFDFSA-N 0.000 description 2
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 2
- JEYRCNVVYHTZMY-SZMVWBNQSA-N Trp-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JEYRCNVVYHTZMY-SZMVWBNQSA-N 0.000 description 2
- VCXWRWYFJLXITF-AUTRQRHGSA-N Tyr-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 VCXWRWYFJLXITF-AUTRQRHGSA-N 0.000 description 2
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 2
- XGEUYEOEZYFHRL-KKXDTOCCSA-N Tyr-Ala-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XGEUYEOEZYFHRL-KKXDTOCCSA-N 0.000 description 2
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 2
- QZOSVNLXLSNHQK-UWVGGRQHSA-N Tyr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QZOSVNLXLSNHQK-UWVGGRQHSA-N 0.000 description 2
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 2
- UMXSDHPSMROQRB-YJRXYDGGSA-N Tyr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UMXSDHPSMROQRB-YJRXYDGGSA-N 0.000 description 2
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 2
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 2
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 2
- LMKKMCGTDANZTR-BZSNNMDCSA-N Tyr-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 LMKKMCGTDANZTR-BZSNNMDCSA-N 0.000 description 2
- MNWINJDPGBNOED-ULQDDVLXSA-N Tyr-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 MNWINJDPGBNOED-ULQDDVLXSA-N 0.000 description 2
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 2
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 2
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 2
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 2
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 2
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 2
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 2
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 2
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 2
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 2
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 2
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 2
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 2
- YDVDTCJGBBJGRT-GUBZILKMSA-N Val-Met-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N YDVDTCJGBBJGRT-GUBZILKMSA-N 0.000 description 2
- YQMILNREHKTFBS-IHRRRGAJSA-N Val-Phe-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YQMILNREHKTFBS-IHRRRGAJSA-N 0.000 description 2
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 2
- LTTQCQRTSHJPPL-ZKWXMUAHSA-N Val-Ser-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LTTQCQRTSHJPPL-ZKWXMUAHSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000700647 Variola virus Species 0.000 description 2
- 208000002687 Venezuelan Equine Encephalomyelitis Diseases 0.000 description 2
- 201000009145 Venezuelan equine encephalitis Diseases 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- 108010005233 alanylglutamic acid Proteins 0.000 description 2
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 2
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 2
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 2
- 108010031045 aspartyl-glycyl-aspartyl-alanine Proteins 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 229920001400 block copolymer Polymers 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 229960005084 calcitriol Drugs 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 2
- 239000002158 endotoxin Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000003114 enzyme-linked immunosorbent spot assay Methods 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 230000028996 humoral immune response Effects 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 201000006747 infectious mononucleosis Diseases 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010000761 leucylarginine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 229920006008 lipopolysaccharide Polymers 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 2
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 229920001451 polypropylene glycol Polymers 0.000 description 2
- 229920000136 polysorbate Polymers 0.000 description 2
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 108700004121 sarkosyl Proteins 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000000405 serological effect Effects 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 229940031439 squalene Drugs 0.000 description 2
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 108010045269 tryptophyltryptophan Proteins 0.000 description 2
- 229940125575 vaccine candidate Drugs 0.000 description 2
- 108010003885 valyl-prolyl-glycyl-glycine Proteins 0.000 description 2
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 1
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- PSBDWGZCVUAZQS-UHFFFAOYSA-N (dimethylsulfonio)acetate Chemical compound C[S+](C)CC([O-])=O PSBDWGZCVUAZQS-UHFFFAOYSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- XKZQKPRCPNGNFR-UHFFFAOYSA-N 2-(3-hydroxyphenyl)phenol Chemical compound OC1=CC=CC(C=2C(=CC=CC=2)O)=C1 XKZQKPRCPNGNFR-UHFFFAOYSA-N 0.000 description 1
- ZFDBLGBZACCLMH-UHFFFAOYSA-N 2-[[2-[2-[2-[(2-aminoacetyl)amino]propanoylamino]propanoylamino]-4-methylpentanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(C)NC(=O)CN ZFDBLGBZACCLMH-UHFFFAOYSA-N 0.000 description 1
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 1
- 102100039358 3-hydroxyacyl-CoA dehydrogenase type-2 Human genes 0.000 description 1
- 108010042708 Acetylmuramyl-Alanyl-Isoglutamine Proteins 0.000 description 1
- 108010024878 Adenovirus E1A Proteins Proteins 0.000 description 1
- 108010087905 Adenovirus E1B Proteins Proteins 0.000 description 1
- 229910017119 AlPO Inorganic materials 0.000 description 1
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- SDMAQFGBPOJFOM-GUBZILKMSA-N Ala-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SDMAQFGBPOJFOM-GUBZILKMSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- CVHJIWVKTFNGHT-ACZMJKKPSA-N Ala-Gln-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N CVHJIWVKTFNGHT-ACZMJKKPSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- PAIHPOGPJVUFJY-WDSKDSINSA-N Ala-Glu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PAIHPOGPJVUFJY-WDSKDSINSA-N 0.000 description 1
- MPLOSMWGDNJSEV-WHFBIAKZSA-N Ala-Gly-Asp Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MPLOSMWGDNJSEV-WHFBIAKZSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- BLIMFWGRQKRCGT-YUMQZZPRSA-N Ala-Gly-Lys Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN BLIMFWGRQKRCGT-YUMQZZPRSA-N 0.000 description 1
- CWEAKSWWKHGTRJ-BQBZGAKWSA-N Ala-Gly-Met Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O CWEAKSWWKHGTRJ-BQBZGAKWSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 1
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 1
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- HQJKCXHQNUCKMY-GHCJXIJMSA-N Ala-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C)N HQJKCXHQNUCKMY-GHCJXIJMSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- QPBSRMDNJOTFAL-AICCOOGYSA-N Ala-Leu-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QPBSRMDNJOTFAL-AICCOOGYSA-N 0.000 description 1
- 108010068139 Ala-Leu-Pro-Met Proteins 0.000 description 1
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 1
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 1
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 1
- DGLQWAFPIXDKRL-UBHSHLNASA-N Ala-Met-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N DGLQWAFPIXDKRL-UBHSHLNASA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- MAZZQZWCCYJQGZ-GUBZILKMSA-N Ala-Pro-Arg Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MAZZQZWCCYJQGZ-GUBZILKMSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- VNFSAYFQLXPHPY-CIQUZCHMSA-N Ala-Thr-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNFSAYFQLXPHPY-CIQUZCHMSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- XMIAMUXIMWREBJ-HERUPUMHSA-N Ala-Trp-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XMIAMUXIMWREBJ-HERUPUMHSA-N 0.000 description 1
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- JNJHNBXBGNJESC-KKXDTOCCSA-N Ala-Tyr-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JNJHNBXBGNJESC-KKXDTOCCSA-N 0.000 description 1
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 241000712891 Arenavirus Species 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- HJAICMSAKODKRF-GUBZILKMSA-N Arg-Cys-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O HJAICMSAKODKRF-GUBZILKMSA-N 0.000 description 1
- DGFGDPVSDQPANQ-XGEHTFHBSA-N Arg-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCN=C(N)N)N)O DGFGDPVSDQPANQ-XGEHTFHBSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- MMGCRPZQZWTZTA-IHRRRGAJSA-N Arg-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N MMGCRPZQZWTZTA-IHRRRGAJSA-N 0.000 description 1
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 1
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 1
- FOQFHANLUJDQEE-GUBZILKMSA-N Arg-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CS)C(=O)O FOQFHANLUJDQEE-GUBZILKMSA-N 0.000 description 1
- 108010051330 Arg-Pro-Gly-Pro Proteins 0.000 description 1
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 1
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 1
- QUBKBPZGMZWOKQ-SZMVWBNQSA-N Arg-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QUBKBPZGMZWOKQ-SZMVWBNQSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- JWCCFNZJIRZUCL-AVGNSLFASA-N Arg-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JWCCFNZJIRZUCL-AVGNSLFASA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- RJUHZPRQRQLCFL-IMJSIDKUSA-N Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O RJUHZPRQRQLCFL-IMJSIDKUSA-N 0.000 description 1
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 1
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- WLVLIYYBPPONRJ-GCJQMDKQSA-N Asn-Thr-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O WLVLIYYBPPONRJ-GCJQMDKQSA-N 0.000 description 1
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- FLJVGAFLZVBBNG-BPUTZDHNSA-N Asn-Trp-Arg Chemical compound N[C@@H](CC(=O)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(=N)N)C(=O)O FLJVGAFLZVBBNG-BPUTZDHNSA-N 0.000 description 1
- IPAQILGYEQFCFO-NYVOZVTQSA-N Asn-Trp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)NC(=O)[C@H](CC(=O)N)N IPAQILGYEQFCFO-NYVOZVTQSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- DBWYWXNMZZYIRY-LPEHRKFASA-N Asp-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N)C(=O)O DBWYWXNMZZYIRY-LPEHRKFASA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- FANQWNCPNFEPGZ-WHFBIAKZSA-N Asp-Asp-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FANQWNCPNFEPGZ-WHFBIAKZSA-N 0.000 description 1
- LKIYSIYBKYLKPU-BIIVOSGPSA-N Asp-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O LKIYSIYBKYLKPU-BIIVOSGPSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 1
- RYKWOUUZJFSJOH-FXQIFTODSA-N Asp-Gln-Glu Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N RYKWOUUZJFSJOH-FXQIFTODSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- OGTCOKZFOJIZFG-CIUDSAMLSA-N Asp-His-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O OGTCOKZFOJIZFG-CIUDSAMLSA-N 0.000 description 1
- BSWHERGFUNMWGS-UHFFFAOYSA-N Asp-Ile Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 1
- DWOGMPWRQQWPPF-GUBZILKMSA-N Asp-Leu-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O DWOGMPWRQQWPPF-GUBZILKMSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- BWJZSLQJNBSUPM-FXQIFTODSA-N Asp-Pro-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O BWJZSLQJNBSUPM-FXQIFTODSA-N 0.000 description 1
- FOXXZZGDIAQPQI-XKNYDFJKSA-N Asp-Pro-Ser-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FOXXZZGDIAQPQI-XKNYDFJKSA-N 0.000 description 1
- GGRSYTUJHAZTFN-IHRRRGAJSA-N Asp-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O GGRSYTUJHAZTFN-IHRRRGAJSA-N 0.000 description 1
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- MJJIHRWNWSQTOI-VEVYYDQMSA-N Asp-Thr-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MJJIHRWNWSQTOI-VEVYYDQMSA-N 0.000 description 1
- MRYDJCIIVRXVGG-QEJZJMRPSA-N Asp-Trp-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O MRYDJCIIVRXVGG-QEJZJMRPSA-N 0.000 description 1
- FIRWLDUOFOULCA-XIRDDKMYSA-N Asp-Trp-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N FIRWLDUOFOULCA-XIRDDKMYSA-N 0.000 description 1
- WOKXEQLPBLLWHC-IHRRRGAJSA-N Asp-Tyr-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 WOKXEQLPBLLWHC-IHRRRGAJSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101150078891 BRLF1 gene Proteins 0.000 description 1
- 101150009389 BZLF1 gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 101150067964 BcRF1 gene Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000011691 Burkitt lymphomas Diseases 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 1
- 208000005623 Carcinogenesis Diseases 0.000 description 1
- LZZYPRNAOMGNLH-UHFFFAOYSA-M Cetrimonium bromide Chemical compound [Br-].CCCCCCCCCCCCCCCC[N+](C)(C)C LZZYPRNAOMGNLH-UHFFFAOYSA-M 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- SZQCDCKIGWQAQN-FXQIFTODSA-N Cys-Arg-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O SZQCDCKIGWQAQN-FXQIFTODSA-N 0.000 description 1
- XXDLUZLKHOVPNW-IHRRRGAJSA-N Cys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O XXDLUZLKHOVPNW-IHRRRGAJSA-N 0.000 description 1
- SBMGKDLRJLYZCU-BIIVOSGPSA-N Cys-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CS)N)C(=O)O SBMGKDLRJLYZCU-BIIVOSGPSA-N 0.000 description 1
- MGAWEOHYNIMOQJ-ACZMJKKPSA-N Cys-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N MGAWEOHYNIMOQJ-ACZMJKKPSA-N 0.000 description 1
- YUZPQIQWXLRFBW-ACZMJKKPSA-N Cys-Glu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O YUZPQIQWXLRFBW-ACZMJKKPSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- OWAFTBLVZNSIFO-SRVKXCTJSA-N Cys-His-His Chemical compound N[C@@H](CS)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OWAFTBLVZNSIFO-SRVKXCTJSA-N 0.000 description 1
- OXFOKRAFNYSREH-BJDJZHNGSA-N Cys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N OXFOKRAFNYSREH-BJDJZHNGSA-N 0.000 description 1
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 1
- UCSXXFRXHGUXCQ-SRVKXCTJSA-N Cys-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N UCSXXFRXHGUXCQ-SRVKXCTJSA-N 0.000 description 1
- XZKJEOMFLDVXJG-KATARQTJSA-N Cys-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)N)O XZKJEOMFLDVXJG-KATARQTJSA-N 0.000 description 1
- HSAWNMMTZCLTPY-DCAQKATOSA-N Cys-Met-Leu Chemical compound SC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HSAWNMMTZCLTPY-DCAQKATOSA-N 0.000 description 1
- NITLUESFANGEIW-BQBZGAKWSA-N Cys-Pro-Gly Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O NITLUESFANGEIW-BQBZGAKWSA-N 0.000 description 1
- TXGDWPBLUFQODU-XGEHTFHBSA-N Cys-Pro-Thr Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O TXGDWPBLUFQODU-XGEHTFHBSA-N 0.000 description 1
- XBELMDARIGXDKY-GUBZILKMSA-N Cys-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CS)N XBELMDARIGXDKY-GUBZILKMSA-N 0.000 description 1
- NAPULYCVEVVFRB-HEIBUPTGSA-N Cys-Thr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CS NAPULYCVEVVFRB-HEIBUPTGSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 1
- 108010069091 Dystrophin Proteins 0.000 description 1
- 102000001039 Dystrophin Human genes 0.000 description 1
- 101150066038 E4 gene Proteins 0.000 description 1
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101710121417 Envelope glycoprotein Proteins 0.000 description 1
- 101710181478 Envelope glycoprotein GP350 Proteins 0.000 description 1
- 206010066919 Epidemic polyarthritis Diseases 0.000 description 1
- 108010008655 Epstein-Barr Virus Nuclear Antigens Proteins 0.000 description 1
- 101710122227 Epstein-Barr nuclear antigen 1 Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010040721 Flagellin Proteins 0.000 description 1
- 108010072062 GEKG peptide Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- KZKBJEUWNMQTLV-XDTLVQLUSA-N Gln-Ala-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZKBJEUWNMQTLV-XDTLVQLUSA-N 0.000 description 1
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- CITDWMLWXNUQKD-FXQIFTODSA-N Gln-Gln-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CITDWMLWXNUQKD-FXQIFTODSA-N 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- NROSLUJMIQGFKS-IUCAKERBSA-N Gln-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N NROSLUJMIQGFKS-IUCAKERBSA-N 0.000 description 1
- KQOPMGBHNQBCEL-HVTMNAMFSA-N Gln-His-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KQOPMGBHNQBCEL-HVTMNAMFSA-N 0.000 description 1
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- LUGUNEGJNDEBLU-DCAQKATOSA-N Gln-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LUGUNEGJNDEBLU-DCAQKATOSA-N 0.000 description 1
- XGKNQFOKIBKFTR-CIUDSAMLSA-N Gln-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCC(N)=O XGKNQFOKIBKFTR-CIUDSAMLSA-N 0.000 description 1
- FTTHLXOMDMLKKW-FHWLQOOXSA-N Gln-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTTHLXOMDMLKKW-FHWLQOOXSA-N 0.000 description 1
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- OTQSTOXRUBVWAP-NRPADANISA-N Gln-Ser-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OTQSTOXRUBVWAP-NRPADANISA-N 0.000 description 1
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 1
- SYTFJIQPBRJSOK-NKIYYHGXSA-N Gln-Thr-His Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 SYTFJIQPBRJSOK-NKIYYHGXSA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- VLOLPWWCNKWRNB-LOKLDPHHSA-N Gln-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VLOLPWWCNKWRNB-LOKLDPHHSA-N 0.000 description 1
- IIMZHVKZBGSEKZ-SZMVWBNQSA-N Gln-Trp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(C)C)C(O)=O IIMZHVKZBGSEKZ-SZMVWBNQSA-N 0.000 description 1
- SAHTWBLTLJWAQA-XIRDDKMYSA-N Gln-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N SAHTWBLTLJWAQA-XIRDDKMYSA-N 0.000 description 1
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- AVZHGSCDKIQZPQ-CIUDSAMLSA-N Glu-Arg-Ala Chemical compound C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AVZHGSCDKIQZPQ-CIUDSAMLSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- ISXJHXGYMJKXOI-GUBZILKMSA-N Glu-Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O ISXJHXGYMJKXOI-GUBZILKMSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 1
- MIQCYAJSDGNCNK-BPUTZDHNSA-N Glu-Gln-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MIQCYAJSDGNCNK-BPUTZDHNSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- VXQOONWNIWFOCS-HGNGGELXSA-N Glu-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N VXQOONWNIWFOCS-HGNGGELXSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- ZPASCJBSSCRWMC-GVXVVHGQSA-N Glu-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N ZPASCJBSSCRWMC-GVXVVHGQSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- ZTVGZOIBLRPQNR-KKUMJFAQSA-N Glu-Met-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZTVGZOIBLRPQNR-KKUMJFAQSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- UDEPRBFQTWGLCW-CIUDSAMLSA-N Glu-Pro-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O UDEPRBFQTWGLCW-CIUDSAMLSA-N 0.000 description 1
- JYXKPJVDCAWMDG-ZPFDUUQYSA-N Glu-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N JYXKPJVDCAWMDG-ZPFDUUQYSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- CIMULJZTTOBOPN-WHFBIAKZSA-N Gly-Asn-Asn Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CIMULJZTTOBOPN-WHFBIAKZSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- BULIVUZUDBHKKZ-WDSKDSINSA-N Gly-Gln-Asn Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BULIVUZUDBHKKZ-WDSKDSINSA-N 0.000 description 1
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 1
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 1
- VOCMRCVMAPSSAL-IUCAKERBSA-N Gly-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN VOCMRCVMAPSSAL-IUCAKERBSA-N 0.000 description 1
- PABFFPWEJMEVEC-JGVFFNPUSA-N Gly-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)CN)C(=O)O PABFFPWEJMEVEC-JGVFFNPUSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- BEQGFMIBZFNROK-JGVFFNPUSA-N Gly-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)CN)C(=O)O BEQGFMIBZFNROK-JGVFFNPUSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 1
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 1
- YHYDTTUSJXGTQK-UWVGGRQHSA-N Gly-Met-Leu Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(C)C)C(O)=O YHYDTTUSJXGTQK-UWVGGRQHSA-N 0.000 description 1
- ZZJVYSAQQMDIRD-UWVGGRQHSA-N Gly-Pro-His Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ZZJVYSAQQMDIRD-UWVGGRQHSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- IROABALAWGJQGM-OALUTQOASA-N Gly-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)CN IROABALAWGJQGM-OALUTQOASA-N 0.000 description 1
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000282575 Gorilla Species 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 102100030595 HLA class II histocompatibility antigen gamma chain Human genes 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- DZMVESFTHXSSPZ-XVYDVKMFSA-N His-Ala-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DZMVESFTHXSSPZ-XVYDVKMFSA-N 0.000 description 1
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 1
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 1
- HRGGKHFHRSFSDE-CIUDSAMLSA-N His-Asn-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N HRGGKHFHRSFSDE-CIUDSAMLSA-N 0.000 description 1
- LSQHWKPPOFDHHZ-YUMQZZPRSA-N His-Asp-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N LSQHWKPPOFDHHZ-YUMQZZPRSA-N 0.000 description 1
- OSZUPUINVNPCOE-SDDRHHMPSA-N His-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OSZUPUINVNPCOE-SDDRHHMPSA-N 0.000 description 1
- KNNSUUOHFVVJOP-GUBZILKMSA-N His-Glu-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N KNNSUUOHFVVJOP-GUBZILKMSA-N 0.000 description 1
- RGPWUJOMKFYFSR-QWRGUYRKSA-N His-Gly-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O RGPWUJOMKFYFSR-QWRGUYRKSA-N 0.000 description 1
- ZUPVLBAXUUGKKN-VHSXEESVSA-N His-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CN=CN2)N)C(=O)O ZUPVLBAXUUGKKN-VHSXEESVSA-N 0.000 description 1
- XWUIHCZETFNRPA-IHPCNDPISA-N His-His-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 XWUIHCZETFNRPA-IHPCNDPISA-N 0.000 description 1
- WJGSTIMGSIWHJX-HVTMNAMFSA-N His-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WJGSTIMGSIWHJX-HVTMNAMFSA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 1
- YIGCZZKZFMNSIU-RWMBFGLXSA-N His-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N YIGCZZKZFMNSIU-RWMBFGLXSA-N 0.000 description 1
- AYUOWUNWZGTNKB-ULQDDVLXSA-N His-Phe-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AYUOWUNWZGTNKB-ULQDDVLXSA-N 0.000 description 1
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 1
- FLXCRBXJRJSDHX-AVGNSLFASA-N His-Pro-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O FLXCRBXJRJSDHX-AVGNSLFASA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- FRDFAWHTPDKRHG-ULQDDVLXSA-N His-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 FRDFAWHTPDKRHG-ULQDDVLXSA-N 0.000 description 1
- ISQOVWDWRUONJH-YESZJQIVSA-N His-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O ISQOVWDWRUONJH-YESZJQIVSA-N 0.000 description 1
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 1
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 1
- MCGOGXFMKHPMSQ-AVGNSLFASA-N His-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MCGOGXFMKHPMSQ-AVGNSLFASA-N 0.000 description 1
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 1
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101001035740 Homo sapiens 3-hydroxyacyl-CoA dehydrogenase type-2 Proteins 0.000 description 1
- 101001082627 Homo sapiens HLA class II histocompatibility antigen gamma chain Proteins 0.000 description 1
- 101000979333 Homo sapiens Neurofilament light polypeptide Proteins 0.000 description 1
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 1
- 101000831496 Homo sapiens Toll-like receptor 3 Proteins 0.000 description 1
- 101000669460 Homo sapiens Toll-like receptor 5 Proteins 0.000 description 1
- 101000669402 Homo sapiens Toll-like receptor 7 Proteins 0.000 description 1
- 101800000120 Host translation inhibitor nsp1 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- WUEIUSDAECDLQO-NAKRPEOUSA-N Ile-Ala-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)O)N WUEIUSDAECDLQO-NAKRPEOUSA-N 0.000 description 1
- HLYBGMZJVDHJEO-CYDGBPFRSA-N Ile-Arg-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HLYBGMZJVDHJEO-CYDGBPFRSA-N 0.000 description 1
- DXUJSRIVSWEOAG-NAKRPEOUSA-N Ile-Arg-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N DXUJSRIVSWEOAG-NAKRPEOUSA-N 0.000 description 1
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- LOXMWQOKYBGCHF-JBDRJPRFSA-N Ile-Cys-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O LOXMWQOKYBGCHF-JBDRJPRFSA-N 0.000 description 1
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- KEKTTYCXKGBAAL-VGDYDELISA-N Ile-His-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CO)C(=O)O)N KEKTTYCXKGBAAL-VGDYDELISA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- DMSVBUWGDLYNLC-IAVJCBSLSA-N Ile-Ile-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DMSVBUWGDLYNLC-IAVJCBSLSA-N 0.000 description 1
- UWLHDGMRWXHFFY-HPCHECBXSA-N Ile-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N1CCC[C@@H]1C(=O)O)N UWLHDGMRWXHFFY-HPCHECBXSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- DSDPLOODKXISDT-XUXIUFHCSA-N Ile-Leu-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O DSDPLOODKXISDT-XUXIUFHCSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- AYLAAGNJNVZDPY-CYDGBPFRSA-N Ile-Met-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)O)N AYLAAGNJNVZDPY-CYDGBPFRSA-N 0.000 description 1
- DNKDIDZHXZAGRY-HJWJTTGWSA-N Ile-Met-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N DNKDIDZHXZAGRY-HJWJTTGWSA-N 0.000 description 1
- UOPBQSJRBONRON-STECZYCISA-N Ile-Met-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOPBQSJRBONRON-STECZYCISA-N 0.000 description 1
- HQEPKOFULQTSFV-JURCDPSOSA-N Ile-Phe-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)O)N HQEPKOFULQTSFV-JURCDPSOSA-N 0.000 description 1
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- SVZFKLBRCYCIIY-CYDGBPFRSA-N Ile-Pro-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVZFKLBRCYCIIY-CYDGBPFRSA-N 0.000 description 1
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 1
- RWHRUZORDWZESH-ZQINRCPSSA-N Ile-Trp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RWHRUZORDWZESH-ZQINRCPSSA-N 0.000 description 1
- CRYJOCSSSACEAA-VKOGCVSHSA-N Ile-Trp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N CRYJOCSSSACEAA-VKOGCVSHSA-N 0.000 description 1
- RMJWFINHACYKJI-SIUGBPQLSA-N Ile-Tyr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RMJWFINHACYKJI-SIUGBPQLSA-N 0.000 description 1
- WRDTXMBPHMBGIB-STECZYCISA-N Ile-Tyr-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 WRDTXMBPHMBGIB-STECZYCISA-N 0.000 description 1
- AUIYHFRUOOKTGX-UKJIMTQDSA-N Ile-Val-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N AUIYHFRUOOKTGX-UKJIMTQDSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 1
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 1
- 102100034349 Integrase Human genes 0.000 description 1
- 102000016921 Integrin-Binding Sialoprotein Human genes 0.000 description 1
- 108010028750 Integrin-Binding Sialoprotein Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 229930182821 L-proline Natural products 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 208000032420 Latent Infection Diseases 0.000 description 1
- 101800000517 Leader protein Proteins 0.000 description 1
- 101000839464 Leishmania braziliensis Heat shock 70 kDa protein Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- DQPQTXMIRBUWKO-DCAQKATOSA-N Leu-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N DQPQTXMIRBUWKO-DCAQKATOSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- DUBAVOVZNZKEQQ-AVGNSLFASA-N Leu-Arg-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCN=C(N)N DUBAVOVZNZKEQQ-AVGNSLFASA-N 0.000 description 1
- VIWUBXKCYJGNCL-SRVKXCTJSA-N Leu-Asn-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 VIWUBXKCYJGNCL-SRVKXCTJSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- DKEZVKFLETVJFY-CIUDSAMLSA-N Leu-Cys-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DKEZVKFLETVJFY-CIUDSAMLSA-N 0.000 description 1
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 1
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 1
- PNUCWVAGVNLUMW-CIUDSAMLSA-N Leu-Cys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O PNUCWVAGVNLUMW-CIUDSAMLSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- IWTBYNQNAPECCS-AVGNSLFASA-N Leu-Glu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IWTBYNQNAPECCS-AVGNSLFASA-N 0.000 description 1
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- KXODZBLFVFSLAI-AVGNSLFASA-N Leu-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 KXODZBLFVFSLAI-AVGNSLFASA-N 0.000 description 1
- CFZZDVMBRYFFNU-QWRGUYRKSA-N Leu-His-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O CFZZDVMBRYFFNU-QWRGUYRKSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 1
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 1
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- UHNQRAFSEBGZFZ-YESZJQIVSA-N Leu-Phe-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N UHNQRAFSEBGZFZ-YESZJQIVSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- YWFZWQKWNDOWPA-XIRDDKMYSA-N Leu-Trp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O YWFZWQKWNDOWPA-XIRDDKMYSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- SUYRAPCRSCCPAK-VFAJRCTISA-N Leu-Trp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUYRAPCRSCCPAK-VFAJRCTISA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- ARNIBBOXIAWUOP-MGHWNKPDSA-N Leu-Tyr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ARNIBBOXIAWUOP-MGHWNKPDSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010028921 Lipopeptides Proteins 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- SVJRVFPSHPGWFF-DCAQKATOSA-N Lys-Cys-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SVJRVFPSHPGWFF-DCAQKATOSA-N 0.000 description 1
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- YPLVCBKEPJPBDQ-MELADBBJSA-N Lys-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N YPLVCBKEPJPBDQ-MELADBBJSA-N 0.000 description 1
- OIQSIMFSVLLWBX-VOAKCMCISA-N Lys-Leu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OIQSIMFSVLLWBX-VOAKCMCISA-N 0.000 description 1
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 1
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 1
- CRIODIGWCUPXKU-AVGNSLFASA-N Lys-Pro-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O CRIODIGWCUPXKU-AVGNSLFASA-N 0.000 description 1
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- UIJVKVHLCQSPOJ-XIRDDKMYSA-N Lys-Ser-Trp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O UIJVKVHLCQSPOJ-XIRDDKMYSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- AWMMBHDKERMOID-YTQUADARSA-N Lys-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CCCCN)N)C(=O)O AWMMBHDKERMOID-YTQUADARSA-N 0.000 description 1
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108010059343 MM Form Creatine Kinase Proteins 0.000 description 1
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 1
- WAEMQWOKJMHJLA-UHFFFAOYSA-N Manganese(2+) Chemical compound [Mn+2] WAEMQWOKJMHJLA-UHFFFAOYSA-N 0.000 description 1
- 241000712079 Measles morbillivirus Species 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 1
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 1
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- PTYVBBNIAQWUFV-DCAQKATOSA-N Met-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N PTYVBBNIAQWUFV-DCAQKATOSA-N 0.000 description 1
- WVTYEEPGEUSFGQ-LPEHRKFASA-N Met-Cys-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WVTYEEPGEUSFGQ-LPEHRKFASA-N 0.000 description 1
- PQPMMGQTRQFSDA-SRVKXCTJSA-N Met-Glu-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O PQPMMGQTRQFSDA-SRVKXCTJSA-N 0.000 description 1
- JPCHYAUKOUGOIB-HJGDQZAQSA-N Met-Glu-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPCHYAUKOUGOIB-HJGDQZAQSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- RBGLBUDVQVPTEG-DCAQKATOSA-N Met-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCSC)N RBGLBUDVQVPTEG-DCAQKATOSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- OCRSGGIJBDUXHU-WDSOQIARSA-N Met-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(O)=O)=CNC2=C1 OCRSGGIJBDUXHU-WDSOQIARSA-N 0.000 description 1
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 1
- JKXVPNCSAMWUEJ-GUBZILKMSA-N Met-Met-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O JKXVPNCSAMWUEJ-GUBZILKMSA-N 0.000 description 1
- KBTQZYASLSUFJR-KKUMJFAQSA-N Met-Phe-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KBTQZYASLSUFJR-KKUMJFAQSA-N 0.000 description 1
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 1
- NTYQUVLERIHPMU-HRCADAONSA-N Met-Phe-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N NTYQUVLERIHPMU-HRCADAONSA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 1
- SPSSJSICDYYTQN-HJGDQZAQSA-N Met-Thr-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O SPSSJSICDYYTQN-HJGDQZAQSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- 241001092142 Molina Species 0.000 description 1
- MSFSPUZXLOGKHJ-UHFFFAOYSA-N Muraminsaeure Natural products OC(=O)C(C)OC1C(N)C(O)OC(CO)C1O MSFSPUZXLOGKHJ-UHFFFAOYSA-N 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100348738 Mus musculus Noc3l gene Proteins 0.000 description 1
- 101710098224 Myosin regulatory light chain 2, atrial isoform Proteins 0.000 description 1
- 102100026057 Myosin regulatory light chain 2, atrial isoform Human genes 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- BACYUWVYYTXETD-UHFFFAOYSA-N N-Lauroylsarcosine Chemical compound CCCCCCCCCCCC(=O)N(C)CC(O)=O BACYUWVYYTXETD-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 101800000512 Non-structural protein 1 Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 101710087110 ORF6 protein Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102000004067 Osteocalcin Human genes 0.000 description 1
- 108090000573 Osteocalcin Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 229930012538 Paclitaxel Natural products 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 108010033276 Peptide Fragments Proteins 0.000 description 1
- 102000007079 Peptide Fragments Human genes 0.000 description 1
- 108010013639 Peptidoglycan Proteins 0.000 description 1
- QMMRHASQEVCJGR-UBHSHLNASA-N Phe-Ala-Pro Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=CC=C1 QMMRHASQEVCJGR-UBHSHLNASA-N 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- AYPMIIKUMNADSU-IHRRRGAJSA-N Phe-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AYPMIIKUMNADSU-IHRRRGAJSA-N 0.000 description 1
- PLNHHOXNVSYKOB-JYJNAYRXSA-N Phe-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N PLNHHOXNVSYKOB-JYJNAYRXSA-N 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- UEEVBGHEGJMDDV-AVGNSLFASA-N Phe-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEEVBGHEGJMDDV-AVGNSLFASA-N 0.000 description 1
- HQVPQHLNOVTLDD-IHRRRGAJSA-N Phe-Cys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N HQVPQHLNOVTLDD-IHRRRGAJSA-N 0.000 description 1
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 1
- APJPXSFJBMMOLW-KBPBESRZSA-N Phe-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 APJPXSFJBMMOLW-KBPBESRZSA-N 0.000 description 1
- HBGFEEQFVBWYJQ-KBPBESRZSA-N Phe-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HBGFEEQFVBWYJQ-KBPBESRZSA-N 0.000 description 1
- VJLLEKDQJSMHRU-STQMWFEESA-N Phe-Gly-Met Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O VJLLEKDQJSMHRU-STQMWFEESA-N 0.000 description 1
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- MJAYDXWQQUOURZ-JYJNAYRXSA-N Phe-Lys-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MJAYDXWQQUOURZ-JYJNAYRXSA-N 0.000 description 1
- RTUWVJVJSMOGPL-KKUMJFAQSA-N Phe-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RTUWVJVJSMOGPL-KKUMJFAQSA-N 0.000 description 1
- JKJSIYKSGIDHPM-WBAXXEDZSA-N Phe-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O JKJSIYKSGIDHPM-WBAXXEDZSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 1
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 108010076039 Polyproteins Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102000029797 Prion Human genes 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- XQLBWXHVZVBNJM-FXQIFTODSA-N Pro-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 XQLBWXHVZVBNJM-FXQIFTODSA-N 0.000 description 1
- HFZNNDWPHBRNPV-KZVJFYERSA-N Pro-Ala-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HFZNNDWPHBRNPV-KZVJFYERSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- WFLWKEUBTSOFMP-FXQIFTODSA-N Pro-Cys-Cys Chemical compound OC(=O)[C@H](CS)NC(=O)[C@H](CS)NC(=O)[C@@H]1CCCN1 WFLWKEUBTSOFMP-FXQIFTODSA-N 0.000 description 1
- GQLOZEMWEBDEAY-NAKRPEOUSA-N Pro-Cys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GQLOZEMWEBDEAY-NAKRPEOUSA-N 0.000 description 1
- TUYWCHPXKQTISF-LPEHRKFASA-N Pro-Cys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N2CCC[C@@H]2C(=O)O TUYWCHPXKQTISF-LPEHRKFASA-N 0.000 description 1
- OZAPWFHRPINHND-GUBZILKMSA-N Pro-Cys-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O OZAPWFHRPINHND-GUBZILKMSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- SNIPWBQKOPCJRG-CIUDSAMLSA-N Pro-Gln-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O SNIPWBQKOPCJRG-CIUDSAMLSA-N 0.000 description 1
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- XZONQWUEBAFQPO-HJGDQZAQSA-N Pro-Gln-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZONQWUEBAFQPO-HJGDQZAQSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- LCUOTSLIVGSGAU-AVGNSLFASA-N Pro-His-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LCUOTSLIVGSGAU-AVGNSLFASA-N 0.000 description 1
- JUJGNDZIKKQMDJ-IHRRRGAJSA-N Pro-His-His Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O JUJGNDZIKKQMDJ-IHRRRGAJSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- XZBYTHCRAVAXQQ-DCAQKATOSA-N Pro-Met-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O XZBYTHCRAVAXQQ-DCAQKATOSA-N 0.000 description 1
- AUYKOPJPKUCYHE-SRVKXCTJSA-N Pro-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 AUYKOPJPKUCYHE-SRVKXCTJSA-N 0.000 description 1
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 1
- NAIPAPCKKRCMBL-JYJNAYRXSA-N Pro-Pro-Phe Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CC=CC=C1 NAIPAPCKKRCMBL-JYJNAYRXSA-N 0.000 description 1
- RCYUBVHMVUHEBM-RCWTZXSCSA-N Pro-Pro-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RCYUBVHMVUHEBM-RCWTZXSCSA-N 0.000 description 1
- AFWBWPCXSWUCLB-WDSKDSINSA-N Pro-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 AFWBWPCXSWUCLB-WDSKDSINSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- GVUVRRPYYDHHGK-VQVTYTSYSA-N Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 GVUVRRPYYDHHGK-VQVTYTSYSA-N 0.000 description 1
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- MDAWMJUZHBQTBO-XGEHTFHBSA-N Pro-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1)O MDAWMJUZHBQTBO-XGEHTFHBSA-N 0.000 description 1
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 1
- HOJUNFDJDAPVBI-BZSNNMDCSA-N Pro-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 HOJUNFDJDAPVBI-BZSNNMDCSA-N 0.000 description 1
- BVRBCQBUNGAWFP-KKUMJFAQSA-N Pro-Tyr-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O BVRBCQBUNGAWFP-KKUMJFAQSA-N 0.000 description 1
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 1
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 1
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 241001454523 Quillaja saponaria Species 0.000 description 1
- 235000009001 Quillaja saponaria Nutrition 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 241000710942 Ross River virus Species 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- RFBKULCUBJAQFT-BIIVOSGPSA-N Ser-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CO)N)C(=O)O RFBKULCUBJAQFT-BIIVOSGPSA-N 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- IXUGADGDCQDLSA-FXQIFTODSA-N Ser-Gln-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CO)N IXUGADGDCQDLSA-FXQIFTODSA-N 0.000 description 1
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 1
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 1
- IOVBCLGAJJXOHK-SRVKXCTJSA-N Ser-His-His Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IOVBCLGAJJXOHK-SRVKXCTJSA-N 0.000 description 1
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 1
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 1
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 1
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 1
- AMRRYKHCILPAKD-FXQIFTODSA-N Ser-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CO)N AMRRYKHCILPAKD-FXQIFTODSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- NUEHQDHDLDXCRU-GUBZILKMSA-N Ser-Pro-Arg Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NUEHQDHDLDXCRU-GUBZILKMSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 1
- ZKOKTQPHFMRSJP-YJRXYDGGSA-N Ser-Thr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKOKTQPHFMRSJP-YJRXYDGGSA-N 0.000 description 1
- BCAVNDNYOGTQMQ-AAEUAGOBSA-N Ser-Trp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O BCAVNDNYOGTQMQ-AAEUAGOBSA-N 0.000 description 1
- OSFZCEQJLWCIBG-BZSNNMDCSA-N Ser-Tyr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSFZCEQJLWCIBG-BZSNNMDCSA-N 0.000 description 1
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000710960 Sindbis virus Species 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 1
- 108091008874 T cell receptors Proteins 0.000 description 1
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- JHBHMCMKSPXRHV-NUMRIWBASA-N Thr-Asn-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JHBHMCMKSPXRHV-NUMRIWBASA-N 0.000 description 1
- JBHMLZSKIXMVFS-XVSYOHENSA-N Thr-Asn-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JBHMLZSKIXMVFS-XVSYOHENSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- ONNSECRQFSTMCC-XKBZYTNZSA-N Thr-Glu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ONNSECRQFSTMCC-XKBZYTNZSA-N 0.000 description 1
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- JRAUIKJSEAKTGD-TUBUOCAGSA-N Thr-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N JRAUIKJSEAKTGD-TUBUOCAGSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- NCXVJIQMWSGRHY-KXNHARMFSA-N Thr-Leu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O NCXVJIQMWSGRHY-KXNHARMFSA-N 0.000 description 1
- ZXIHABSKUITPTN-IXOXFDKPSA-N Thr-Lys-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O ZXIHABSKUITPTN-IXOXFDKPSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- XNTVWRJTUIOGQO-RHYQMDGZSA-N Thr-Met-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XNTVWRJTUIOGQO-RHYQMDGZSA-N 0.000 description 1
- CGCMNOIQVAXYMA-UNQGMJICSA-N Thr-Met-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O CGCMNOIQVAXYMA-UNQGMJICSA-N 0.000 description 1
- GUHLYMZJVXUIPO-RCWTZXSCSA-N Thr-Met-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O GUHLYMZJVXUIPO-RCWTZXSCSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 1
- ZOCJFNXUVSGBQI-HSHDSVGOSA-N Thr-Trp-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O ZOCJFNXUVSGBQI-HSHDSVGOSA-N 0.000 description 1
- XEVHXNLPUBVQEX-DVJZZOLTSA-N Thr-Trp-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N)O XEVHXNLPUBVQEX-DVJZZOLTSA-N 0.000 description 1
- CKHWEVXPLJBEOZ-VQVTYTSYSA-N Thr-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O CKHWEVXPLJBEOZ-VQVTYTSYSA-N 0.000 description 1
- AXEJRUGTOJPZKG-XGEHTFHBSA-N Thr-Val-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O AXEJRUGTOJPZKG-XGEHTFHBSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108010060818 Toll-Like Receptor 9 Proteins 0.000 description 1
- 102100024324 Toll-like receptor 3 Human genes 0.000 description 1
- 229940123560 Toll-like receptor 4 agonist Drugs 0.000 description 1
- 102100039357 Toll-like receptor 5 Human genes 0.000 description 1
- 102100039390 Toll-like receptor 7 Human genes 0.000 description 1
- 102100033117 Toll-like receptor 9 Human genes 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- QNMIVTOQXUSGLN-SZMVWBNQSA-N Trp-Arg-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QNMIVTOQXUSGLN-SZMVWBNQSA-N 0.000 description 1
- PNKDNKGMEHJTJQ-BPUTZDHNSA-N Trp-Arg-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N PNKDNKGMEHJTJQ-BPUTZDHNSA-N 0.000 description 1
- RNFZZCMCRDFNAE-WFBYXXMGSA-N Trp-Asn-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O RNFZZCMCRDFNAE-WFBYXXMGSA-N 0.000 description 1
- ADBFWLXCCKIXBQ-XIRDDKMYSA-N Trp-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ADBFWLXCCKIXBQ-XIRDDKMYSA-N 0.000 description 1
- KDWZQYUTMJSYRJ-BHYGNILZSA-N Trp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O KDWZQYUTMJSYRJ-BHYGNILZSA-N 0.000 description 1
- FNOQJVHFVLVMOS-AAEUAGOBSA-N Trp-Gly-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N FNOQJVHFVLVMOS-AAEUAGOBSA-N 0.000 description 1
- KULBQAVOXHQLIY-HSCHXYMDSA-N Trp-Ile-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 KULBQAVOXHQLIY-HSCHXYMDSA-N 0.000 description 1
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 1
- CCZXBOFIBYQLEV-IHPCNDPISA-N Trp-Leu-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(O)=O CCZXBOFIBYQLEV-IHPCNDPISA-N 0.000 description 1
- RWAYYYOZMHMEGD-XIRDDKMYSA-N Trp-Leu-Ser Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 RWAYYYOZMHMEGD-XIRDDKMYSA-N 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- CSOBBJWWODOYGW-ILWGZMRPSA-N Trp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O CSOBBJWWODOYGW-ILWGZMRPSA-N 0.000 description 1
- GIAMKIPJSRZVJB-IHPCNDPISA-N Trp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GIAMKIPJSRZVJB-IHPCNDPISA-N 0.000 description 1
- XOSGQKFEIOCPIJ-SZMVWBNQSA-N Trp-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CNC3=CC=CC=C32)N XOSGQKFEIOCPIJ-SZMVWBNQSA-N 0.000 description 1
- SEXRBCGSZRCIPE-LYSGOOTNSA-N Trp-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O SEXRBCGSZRCIPE-LYSGOOTNSA-N 0.000 description 1
- GQYPNFIFJRNDPY-ONUFPDRFSA-N Trp-Trp-Thr Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC=3C4=CC=CC=C4NC=3)C(=O)N[C@@H]([C@H](O)C)C(O)=O)=CNC2=C1 GQYPNFIFJRNDPY-ONUFPDRFSA-N 0.000 description 1
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- CGDZGRLRXPNCOC-SRVKXCTJSA-N Tyr-Cys-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CGDZGRLRXPNCOC-SRVKXCTJSA-N 0.000 description 1
- CKHQKYHIZCRTAP-SOUVJXGZSA-N Tyr-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CKHQKYHIZCRTAP-SOUVJXGZSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- YYZPVPJCOGGQPC-JYJNAYRXSA-N Tyr-His-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYZPVPJCOGGQPC-JYJNAYRXSA-N 0.000 description 1
- GFJXBLSZOFWHAW-JYJNAYRXSA-N Tyr-His-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GFJXBLSZOFWHAW-JYJNAYRXSA-N 0.000 description 1
- MVYRJYISVJWKSX-KBPBESRZSA-N Tyr-His-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)NCC(=O)O)N)O MVYRJYISVJWKSX-KBPBESRZSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- RIFVTNDKUMSSMN-ULQDDVLXSA-N Tyr-His-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](Cc1c[nH]cn1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O RIFVTNDKUMSSMN-ULQDDVLXSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 1
- WPRVVBVWIUWLOH-UFYCRDLUSA-N Tyr-Phe-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CC2=CC=C(C=C2)O)N WPRVVBVWIUWLOH-UFYCRDLUSA-N 0.000 description 1
- SOEGLGLDSUHWTI-STECZYCISA-N Tyr-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=C(O)C=C1 SOEGLGLDSUHWTI-STECZYCISA-N 0.000 description 1
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 1
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- ANHVRCNNGJMJNG-BZSNNMDCSA-N Tyr-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CS)C(=O)O)N)O ANHVRCNNGJMJNG-BZSNNMDCSA-N 0.000 description 1
- KLOZTPOXVVRVAQ-DZKIICNBSA-N Tyr-Val-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 KLOZTPOXVVRVAQ-DZKIICNBSA-N 0.000 description 1
- 101710095001 Uncharacterized protein in nifU 5'region Proteins 0.000 description 1
- 101150004676 VGF gene Proteins 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- WOCYUGQDXPTQPY-FXQIFTODSA-N Val-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N WOCYUGQDXPTQPY-FXQIFTODSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- CFSSLXZJEMERJY-NRPADANISA-N Val-Gln-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CFSSLXZJEMERJY-NRPADANISA-N 0.000 description 1
- IWZYXFRGWKEKBJ-GVXVVHGQSA-N Val-Gln-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IWZYXFRGWKEKBJ-GVXVVHGQSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- QPPZEDOTPZOSEC-RCWTZXSCSA-N Val-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N)O QPPZEDOTPZOSEC-RCWTZXSCSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 1
- ZEBRMWPTJNHXAJ-JYJNAYRXSA-N Val-Phe-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)O)N ZEBRMWPTJNHXAJ-JYJNAYRXSA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- RYQUMYBMOJYYDK-NHCYSSNCSA-N Val-Pro-Glu Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RYQUMYBMOJYYDK-NHCYSSNCSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- WANVRBAZGSICCP-SRVKXCTJSA-N Val-Pro-Met Chemical compound CSCC[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C)C(O)=O WANVRBAZGSICCP-SRVKXCTJSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- GBIUHAYJGWVNLN-AEJSXWLSSA-N Val-Ser-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N GBIUHAYJGWVNLN-AEJSXWLSSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 1
- ZLMFVXMJFIWIRE-FHWLQOOXSA-N Val-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N ZLMFVXMJFIWIRE-FHWLQOOXSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- BGTDGENDNWGMDQ-KJEVXHAQSA-N Val-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N)O BGTDGENDNWGMDQ-KJEVXHAQSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- SSKKGOWRPNIVDW-AVGNSLFASA-N Val-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N SSKKGOWRPNIVDW-AVGNSLFASA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000711975 Vesicular stomatitis virus Species 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 1
- 229920000392 Zymosan Polymers 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 1
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000005875 antibody response Effects 0.000 description 1
- 230000007503 antigenic stimulation Effects 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- GMRQFYUYWCNGIN-NKMMMXOESA-N calcitriol Chemical compound C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@@H](CCCC(C)(C)O)C)=C\C=C1\C[C@@H](O)C[C@H](O)C1=C GMRQFYUYWCNGIN-NKMMMXOESA-N 0.000 description 1
- 235000020964 calcitriol Nutrition 0.000 description 1
- 239000011612 calcitriol Substances 0.000 description 1
- 229940023860 canarypox virus HIV vaccine Drugs 0.000 description 1
- 230000036952 cancer formation Effects 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- SQQXRXKYTKFFSM-UHFFFAOYSA-N chembl1992147 Chemical compound OC1=C(OC)C(OC)=CC=C1C1=C(C)C(C(O)=O)=NC(C=2N=C3C4=NC(C)(C)N=C4C(OC)=C(O)C3=CC=2)=C1N SQQXRXKYTKFFSM-UHFFFAOYSA-N 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 210000003837 chick embryo Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 229940097362 cyclodextrins Drugs 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 108010057085 cytokine receptors Proteins 0.000 description 1
- 102000003675 cytokine receptors Human genes 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 229960003964 deoxycholic acid Drugs 0.000 description 1
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 1
- 229960003957 dexamethasone Drugs 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 208000037771 disease arising from reactivation of latent virus Diseases 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000007496 glass forming Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 229960000789 guanidine hydrochloride Drugs 0.000 description 1
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 230000002949 hemolytic effect Effects 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000005745 host immune response Effects 0.000 description 1
- 102000045429 human PGK1 Human genes 0.000 description 1
- 229940124669 imidazoquinoline Drugs 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000010324 immunological assay Methods 0.000 description 1
- 229960001438 immunostimulant agent Drugs 0.000 description 1
- 239000003022 immunostimulating agent Substances 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- IZWSFJTYBVKZNK-UHFFFAOYSA-N lauryl sulfobetaine Chemical compound CCCCCCCCCCCC[N+](C)(C)CCCS([O-])(=O)=O IZWSFJTYBVKZNK-UHFFFAOYSA-N 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- GZQKNULLWNGMCW-PWQABINMSA-N lipid A (E. coli) Chemical compound O1[C@H](CO)[C@@H](OP(O)(O)=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP(O)(O)=O)O1 GZQKNULLWNGMCW-PWQABINMSA-N 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 210000003071 memory t lymphocyte Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- BSOQXXWZTUDTEL-ZUYCGGNHSA-N muramyl dipeptide Chemical compound OC(=O)CC[C@H](C(N)=O)NC(=O)[C@H](C)NC(=O)[C@@H](C)O[C@H]1[C@H](O)[C@@H](CO)O[C@@H](O)[C@@H]1NC(C)=O BSOQXXWZTUDTEL-ZUYCGGNHSA-N 0.000 description 1
- 125000001446 muramyl group Chemical group N[C@@H](C=O)[C@@H](O[C@@H](C(=O)*)C)[C@H](O)[C@H](O)CO 0.000 description 1
- AEMBWNDIEFEPTH-UHFFFAOYSA-N n-tert-butyl-n-ethylnitrous amide Chemical compound CCN(N=O)C(C)(C)C AEMBWNDIEFEPTH-UHFFFAOYSA-N 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 239000003002 pH adjusting agent Substances 0.000 description 1
- 229960001592 paclitaxel Drugs 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 229940068965 polysorbates Drugs 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 229960002429 proline Drugs 0.000 description 1
- 108010007513 prolyl-glycyl-prolyl-leucine Proteins 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 229940021993 prophylactic vaccine Drugs 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- FHHPUSMSKHSNKW-SMOYURAASA-M sodium deoxycholate Chemical compound [Na+].C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC([O-])=O)C)[C@@]2(C)[C@@H](O)C1 FHHPUSMSKHSNKW-SMOYURAASA-M 0.000 description 1
- KSAVQLQVUXSOCR-UHFFFAOYSA-M sodium lauroyl sarcosinate Chemical compound [Na+].CCCCCCCCCCCC(=O)N(C)CC([O-])=O KSAVQLQVUXSOCR-UHFFFAOYSA-M 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 229940117986 sulfobetaine Drugs 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- RCINICONZNJXQF-MZXODVADSA-N taxol Chemical compound O([C@@H]1[C@@]2(C[C@@H](C(C)=C(C2(C)C)[C@H](C([C@]2(C)[C@@H](O)C[C@H]3OC[C@]3([C@H]21)OC(C)=O)=O)OC(=O)C)OC(=O)[C@H](O)[C@@H](NC(=O)C=1C=CC=CC=1)C=1C=CC=CC=1)O)C(=O)C1=CC=CC=C1 RCINICONZNJXQF-MZXODVADSA-N 0.000 description 1
- 108700020534 tetracycline resistance-encoding transposon repressor Proteins 0.000 description 1
- 229960001295 tocopherol Drugs 0.000 description 1
- 229930003799 tocopherol Natural products 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 239000011732 tocopherol Substances 0.000 description 1
- 239000003970 toll like receptor agonist Substances 0.000 description 1
- 229940044655 toll-like receptor 9 agonist Drugs 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- UYPYRKYUKCHHIB-UHFFFAOYSA-N trimethylamine N-oxide Chemical compound C[N+](C)(C)[O-] UYPYRKYUKCHHIB-UHFFFAOYSA-N 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 1
- 102000042286 type I cytokine receptor family Human genes 0.000 description 1
- 108091052247 type I cytokine receptor family Proteins 0.000 description 1
- 102000042287 type II cytokine receptor family Human genes 0.000 description 1
- 108091052254 type II cytokine receptor family Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 229940045136 urea Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 230000007419 viral reactivation Effects 0.000 description 1
- 230000010464 virion assembly Effects 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 102000009310 vitamin D receptors Human genes 0.000 description 1
- 108050000156 vitamin D receptors Proteins 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/245—Herpetoviridae, e.g. herpes simplex virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/20—Antivirals for DNA viruses
- A61P31/22—Antivirals for DNA viruses for herpes viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5258—Virus-like particles
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/545—Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/57—Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/70—Multivalent vaccine
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16211—Lymphocryptovirus, e.g. human herpesvirus 4, Epstein-Barr Virus
- C12N2710/16222—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16211—Lymphocryptovirus, e.g. human herpesvirus 4, Epstein-Barr Virus
- C12N2710/16234—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16211—Lymphocryptovirus, e.g. human herpesvirus 4, Epstein-Barr Virus
- C12N2710/16271—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/24011—Poxviridae
- C12N2710/24111—Orthopoxvirus, e.g. vaccinia virus, variola
- C12N2710/24141—Use of virus, viral particle or viral elements as a vector
- C12N2710/24143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Virology (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Communicable Diseases (AREA)
- Oncology (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
Abstract
【課題】エプスタインバールウイルス感染を予防する際、並びにエプスタインバールウイルス関連悪性腫瘍及びエプスタインバールウイルス関連疾患、例えば、多発性硬化症を処置する際に使用するためのエプスタインバールウイルスワクチンを提供する。【解決手段】特定の配列を有するエプスタインバールウイルス抗原ポリヌクレオチド、ポリヌクレオチド及びベクター、並びにそれを含む免疫原性組成物を提供する。本発明は、エプスタインバールウイルス感染症及びエプスタインバールウイルス関連疾患、例えば、多発性硬化症、関節リウマチ及び全身性ループスエリテマトーデスを処置及び予防するためのワクチンを生成するためのエプスタインバールウイルス抗原構築物の使用を含む。【選択図】なし
Description
政府の利益についての記載
本発明は、保健福祉省(Department of Health and Human Services)の一機関である国立衛生研究所(National Institutes of Health)との共同研究開発協定の履行において創出された。アメリカ合衆国政府は本発明に一定の権利を有する。
本発明は、保健福祉省(Department of Health and Human Services)の一機関である国立衛生研究所(National Institutes of Health)との共同研究開発協定の履行において創出された。アメリカ合衆国政府は本発明に一定の権利を有する。
配列表
本出願は、ASCIIフォーマットで電子的に提出され、参照によりその全体が本明細書に組み込まれる配列表を含む。2018年12月5日に作成された前記ASCIIコピーは、VU66487_WO_SL.txtという名称であり、419,960バイトのサイズである。
本出願は、ASCIIフォーマットで電子的に提出され、参照によりその全体が本明細書に組み込まれる配列表を含む。2018年12月5日に作成された前記ASCIIコピーは、VU66487_WO_SL.txtという名称であり、419,960バイトのサイズである。
本発明の分野
本発明は、ウイルス感染症を処置及び予防する分野に属する。特に、本発明は、エプスタインバールウイルス抗原構築物に関する。本発明は、エプスタインバールウイルス感染症及びエプスタインバールウイルス関連疾患を処置及び予防するためのエプスタインバールウイルス抗原構築物の使用を含む。
本発明は、ウイルス感染症を処置及び予防する分野に属する。特に、本発明は、エプスタインバールウイルス抗原構築物に関する。本発明は、エプスタインバールウイルス感染症及びエプスタインバールウイルス関連疾患を処置及び予防するためのエプスタインバールウイルス抗原構築物の使用を含む。
ヒトヘルペスウイルス4(HHV-4)としても知られているエプスタインバールウイルス(EBV)は、ヒトにおいて最も一般的なウイルスの1つであり、少なくとも90%の成人に感染する。EBVは、ほとんどの感染した個体において無症状潜伏感染となるが、伝染性単核球症の主要な病原体としても知られている。
より重要なことに、EBV感染は、ある種の悪性腫瘍(例えば、胃癌、上咽頭癌、ホジキンリンパ腫、非ホジキンリンパ腫、バーキットリンパ腫)、並びに多発性硬化症(MS)、全身性ループスエリテマトーデス(SLE)、関節リウマチ(RA)及びシューグレン症候群のリスクの増加に関連する。
ヘルペスウイルスファミリーの他のメンバーと同様に、EBVは、約85個の遺伝子をコードする約192キロベースの二本鎖DNAゲノムを含有する。EBVゲノムは、ウイルスの外被によって囲まれたタンパク質ヌクレオカプシドに包まれている。外側のエンベロープ層は、脂質、並びにウイルスの、その主要な宿主細胞であるBリンパ球及び上皮細胞への標的化に関与すると考えられる表面糖タンパク質を含む。
EBVウイルスの複製サイクルは十分に特徴付けられている。宿主細胞の初期感染後に、EBVは、溶解性複製段階(又は溶解性段階)と呼ばれる、感染性ビリオンの活発な産生の段階に入る。溶解性段階の間に、EBVの遺伝子発現は、ZEBRA、BRLF1、BNLF2、BCRF1、及びウイルスカプシド抗原(VCA)、並びにエンベロープ糖タンパク質、例えば、gp350及びgp110を含む1つ以上の溶解性遺伝子産物の発現を特徴とする。
溶解性複製期間の後に、EBVは、潜伏(又は潜伏期)と呼ばれる、活発なウイルス産生のない持続性ウイルス感染の状態に入る。潜伏EBV感染は、1つ以上の潜伏遺伝子産物、例えば、EBNA1、EBNA2、EBNA3A、EBNA3B、EBNA3C、EBNAリーダータンパク質(EBNA-LP)、LMP1、及び/又はLMP2の発現を含む、特徴的な遺伝子発現プログラムを伴う。潜伏感染した細胞は、未だ理解されていないトリガーによって溶解性ウイルス産生へと再活性化され得る。
動物モデル及びヒト試験において、いくつかのEBVワクチン候補が評価された。ほとんどの予防的ワクチン候補は、免疫原として、主要なEBVエンベロープ糖タンパク質gp350に焦点を当ててきた。Guらは、EBVのgp350を発現する組換え生ワクシニアウイルスによって、小児において、EBV中和抗体と中程度の保護が誘発されたが、成人では誘発されなかったことを報告した。Guら、Dev. Biol. Stand. 1995;84:171~177頁。組換えgp350ワクチンは、EBV感染に対して保護しないことが判明したが、伝染性単核球症の発症を低減した。Sokalら、J. Infect. Dis. 2007;196(12):1749~1753頁。
治療用EBVワクチン候補は、EBV核抗原-1(EBNA1)及びLMP2のT細胞エピトープを主に標的としてきた。例えば、Taylorらは、全長LMP2タンパク質に融合したEBNA1のペプチド断片を発現する改変ワクシニアウイルスアンカラ(MVA)ベクターについて記載した。いわゆるMVA-ELワクチンは、初期臨床試験において、抗原特異的CD4+及びCD8+ T細胞応答を誘導することが報告された。Taylorら、J. Virol. Jan. 2004、768~778頁。同様に、全長LMP2タンパク質を発現する組換えヒトアデノウイルスベクターは、インビトロ及びマウスにおいて、抗原特異的T細胞応答を誘導することが報告された。Panら、Biochem Biophys Res Commun. 2006年9月1日;347(3):551~7頁。
当技術分野における明確なニーズにもかかわらず、ヒトにおいて使用するために認可されたEBVワクチンは未だにない。よって、EBV感染を予防する際、並びにEBV関連悪性腫瘍及びEBV関連疾患、例えば、多発性硬化症を処置する際に使用するためのEBVワクチンに対するニーズが依然として存在する。
本発明者らは、エプスタインバールウイルス(EBV)感染に対する、対象における免疫応答の誘導のための免疫原性組成物の構成成分として有用なEBV抗原ポリペプチド、ポリヌクレオチド及びベクター;EBV感染及びEBV関連疾患の防止及び処置においてそれらを使用するための方法;並びにそれらの製造のための方法を提供する。
(a)配列番号1のうちの少なくとも8アミノ酸の少なくとも1個の断片、
(b)配列番号6のうちの少なくとも8アミノ酸の少なくとも1個の断片、
(c)配列番号11のうちの少なくとも8アミノ酸の少なくとも1個の断片、及び
(d)配列番号13のうちの少なくとも8アミノ酸の少なくとも1個の断片
を含むEBV抗原ポリペプチドをコードするポリヌクレオチドであって、
宿主細胞における前記ポリペプチドの発現を指示する1つ以上の配列に作動可能に連結しているポリヌクレオチドが提供される。一部の実施形態では、ポリペプチドは、配列番号21のうちの少なくとも8アミノ酸の少なくとも1個の断片をさらに含む。
(b)配列番号6のうちの少なくとも8アミノ酸の少なくとも1個の断片、
(c)配列番号11のうちの少なくとも8アミノ酸の少なくとも1個の断片、及び
(d)配列番号13のうちの少なくとも8アミノ酸の少なくとも1個の断片
を含むEBV抗原ポリペプチドをコードするポリヌクレオチドであって、
宿主細胞における前記ポリペプチドの発現を指示する1つ以上の配列に作動可能に連結しているポリヌクレオチドが提供される。一部の実施形態では、ポリペプチドは、配列番号21のうちの少なくとも8アミノ酸の少なくとも1個の断片をさらに含む。
(a)互いに隣接していない、配列番号1のうちの少なくとも8アミノ酸の少なくとも2個のLMP1断片、
(b)互いに隣接していない、配列番号6のうちの少なくとも8アミノ酸の少なくとも2個のLMP2断片、
(c)互いに隣接していない、配列番号11のうちの少なくとも8アミノ酸の少なくとも2個のEBNA1断片、
(d)互いに隣接していない、配列番号13のうちの少なくとも8アミノ酸の少なくとも2個のEBNA3A断片、及び/又は
(e)互いに隣接していない、配列番号21のうちの少なくとも8アミノ酸の少なくとも2個のZEBRA断片
を含むEBV抗原ポリペプチドをコードするポリヌクレオチドであって、
宿主細胞における前記ポリペプチドの発現を指示する1つ以上の配列に作動可能に連結しているポリヌクレオチドも提供される。
(b)互いに隣接していない、配列番号6のうちの少なくとも8アミノ酸の少なくとも2個のLMP2断片、
(c)互いに隣接していない、配列番号11のうちの少なくとも8アミノ酸の少なくとも2個のEBNA1断片、
(d)互いに隣接していない、配列番号13のうちの少なくとも8アミノ酸の少なくとも2個のEBNA3A断片、及び/又は
(e)互いに隣接していない、配列番号21のうちの少なくとも8アミノ酸の少なくとも2個のZEBRA断片
を含むEBV抗原ポリペプチドをコードするポリヌクレオチドであって、
宿主細胞における前記ポリペプチドの発現を指示する1つ以上の配列に作動可能に連結しているポリヌクレオチドも提供される。
EBV抗原ポリペプチドが、
(a)配列番号2からなるLMP1の第1の断片、
(b)配列番号3からなるLMP1の第2の断片、
(c)配列番号4からなるLMP1の第3の断片、
(d)配列番号5からなるLMP1の第4の断片、
(e)配列番号7からなるLMP2の第1の断片、
(f)配列番号8からなるLMP2の第2の断片、
(g)配列番号9からなるLMP2の第3の断片、
(h)配列番号10からなるLMP2の第4の断片、
(i)配列番号12からなるEBNA1の第1の断片、
(j)配列番号14からなるEBNA3Aの第1の断片、
(k)配列番号15からなるEBNA3Aの第2の断片、
(l)配列番号16からなるEBNA3Aの第3の断片、
(m)配列番号17からなるEBNA3Aの第4の断片、
(n)配列番号18からなるEBNA3Aの第5の断片、
(o)配列番号19からなるEBNA3Aの第6の断片、及び
(p)配列番号20からなるEBNA3Aの第7の断片
を含み、
第1、第2、第3及び第4のLMP1断片が互いに隣接していない;第1、第2、第3及び第4のLMP2断片が互いに隣接していない;並びに第1、第2、第3、第4、第5、第6、及び第7のEBNA3A断片が互いに隣接していない、上記のポリヌクレオチドも提供される。場合により、ポリペプチドは、(a)配列番号22からなるZEBRAの第1の断片、及び(b)配列番号23からなるZEBRAの第2の断片をさらに含み、第1及び第2のZEBRA断片は互いに隣接していない。
(a)配列番号2からなるLMP1の第1の断片、
(b)配列番号3からなるLMP1の第2の断片、
(c)配列番号4からなるLMP1の第3の断片、
(d)配列番号5からなるLMP1の第4の断片、
(e)配列番号7からなるLMP2の第1の断片、
(f)配列番号8からなるLMP2の第2の断片、
(g)配列番号9からなるLMP2の第3の断片、
(h)配列番号10からなるLMP2の第4の断片、
(i)配列番号12からなるEBNA1の第1の断片、
(j)配列番号14からなるEBNA3Aの第1の断片、
(k)配列番号15からなるEBNA3Aの第2の断片、
(l)配列番号16からなるEBNA3Aの第3の断片、
(m)配列番号17からなるEBNA3Aの第4の断片、
(n)配列番号18からなるEBNA3Aの第5の断片、
(o)配列番号19からなるEBNA3Aの第6の断片、及び
(p)配列番号20からなるEBNA3Aの第7の断片
を含み、
第1、第2、第3及び第4のLMP1断片が互いに隣接していない;第1、第2、第3及び第4のLMP2断片が互いに隣接していない;並びに第1、第2、第3、第4、第5、第6、及び第7のEBNA3A断片が互いに隣接していない、上記のポリヌクレオチドも提供される。場合により、ポリペプチドは、(a)配列番号22からなるZEBRAの第1の断片、及び(b)配列番号23からなるZEBRAの第2の断片をさらに含み、第1及び第2のZEBRA断片は互いに隣接していない。
EBV抗原ポリペプチドが、配列番号24又は配列番号26に対して少なくとも80%同一である、上記のポリヌクレオチドも提供される。
例えば、アデノウイルスベクター(例えば、非ヒトサルアデノウイルスベクター)及びワクシニアウイルスベクター(例えば、改変ワクシニアアンカラ(MVA)ベクター)を含む、本明細書に記載されているポリヌクレオチドを含むベクターも提供される。
本明細書に記載されているポリヌクレオチド及びベクターによってコードされたEBV抗原ポリペプチド、例えば、配列番号24又は配列番号26に対して少なくとも80%同一であるポリペプチドも提供される。
本明細書に記載のポリヌクレオチド、ベクター及びポリペプチド、並びに薬学的に許容される賦形剤を含む組成物も提供される。このような組成物は、場合により1つ以上のアジュバントを含む。
エプスタインバールウイルス感染によって引き起こされる疾患の処置又は予防のための医薬の製造における、本明細書に記載されているポリヌクレオチド、ベクター、ポリペプチド及び組成物の使用も提供される。
対象における免疫応答を誘導する方法であって、本明細書に記載されているポリヌクレオチド、ベクター、ポリペプチド及び組成物を対象に投与するステップを含む方法も記載されている。
対象におけるEBV関連疾患を処置又は予防する方法であって、本明細書に記載されているポリヌクレオチド、ベクター、ポリペプチド及び組成物を対象に投与するステップを含む方法も提供される。EBV関連疾患としては、例えば、EBV関連疾患(例えば、多発性硬化症、関節リウマチ及び全身性ループスエリテマトーデス)が挙げられる。
エプスタインバールウイルス感染によって引き起こされる疾患の処置又は予防において使用するための、本明細書に記載されているポリヌクレオチド、ベクター、ポリペプチド及び組成物も提供される。
対象における免疫応答を誘導する方法であって、
(a)本明細書に記載されているEBV抗原ポリペプチドをコードするポリヌクレオチドを含むアデノウイルスを投与するステップ、及び
(b)本明細書に記載されているEBV抗原ポリペプチドをコードするポリヌクレオチドを含むワクシニアウイルスを投与するステップ
を含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法も提供される。
(a)本明細書に記載されているEBV抗原ポリペプチドをコードするポリヌクレオチドを含むアデノウイルスを投与するステップ、及び
(b)本明細書に記載されているEBV抗原ポリペプチドをコードするポリヌクレオチドを含むワクシニアウイルスを投与するステップ
を含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法も提供される。
対象におけるEBV関連疾患を処置又は予防する方法であって、
(a)本明細書に記載されているEBV抗原ポリペプチドをコードするポリヌクレオチドを含むアデノウイルスを投与するステップ、及び
(b)本明細書に記載されているEBV抗原ポリペプチドをコードするポリヌクレオチドを含むワクシニアウイルスを投与するステップ
を含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法も提供される。
本発明はまた、以下に関する。
[項目1]
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、及び
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片
を含むポリペプチドをコードするポリヌクレオチドであって、
宿主細胞において前記ポリペプチドの発現を指示する1つ以上の配列に作動可能に連結している、ポリヌクレオチド。
[項目2]
前記ポリペプチドが、配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片をさらに含む、項目1に記載のポリヌクレオチド。
[項目3]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片
を含む、項目1又は2に記載のポリヌクレオチド。
[項目4]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片
を含む、項目1~3のいずれか一項に記載のポリヌクレオチド。
[項目5]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片
を含む、項目1~4のいずれか一項に記載のポリヌクレオチド。
[項目6]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片
を含む、項目1~5のいずれか一項に記載のポリヌクレオチド。
[項目7]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片
を含む、項目1~6のいずれか一項に記載のポリヌクレオチド。
[項目8]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片
を含む、項目1~7のいずれか一項に記載のポリヌクレオチド。
[項目9]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片
を含む、項目1~8のいずれか一項に記載のポリヌクレオチド。
[項目10]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片
を含む、項目1~9のいずれか一項に記載のポリヌクレオチド。
[項目11]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片
を含む、項目1~10のいずれか一項に記載のポリヌクレオチド。
[項目12]
配列番号1の断片が互いに隣接していない、項目3から11のいずれか一項に記載のポリヌクレオチド。
[項目13]
配列番号6の断片が互いに隣接していない、項目3から12のいずれか一項に記載のポリヌクレオチド。
[項目14]
配列番号11の断片が互いに隣接していない、項目3から13のいずれか一項に記載のポリヌクレオチド。
[項目15]
配列番号13の断片が互いに隣接していない、項目3から14のいずれか一項に記載のポリヌクレオチド。
[項目16]
配列番号21の断片が互いに隣接していない、項目3から15のいずれか一項に記載のポリヌクレオチド。
[項目17]
前記ポリペプチドが、
(a)LMP1の第1及び第2の断片であって、前記LMP1の第1及び第2の断片は配列番号2~5からなる群から選択され、前記LMP1の第1及び第2の断片は前記ポリペプチドにおいて互いに隣接していない、前記LMP1の第1及び第2の断片、
(b)LMP2の第1及び第2の断片であって、前記LMP2の第1及び第2の断片は配列番号7~10からなる群から選択され、前記LMP2の第1及び第2の断片は前記ポリペプチドにおいて互いに隣接していない、前記LMP2の第1及び第2の断片、
(c)配列番号12からなるEBNA1の断片、並びに
(d)EBNA3Aの第1及び第2の断片であって、前記EBNA3Aの第1及び第2の断片は配列番号14~20からなる群から選択され、前記EBNA3Aの第1及び第2の断片は前記ポリペプチドにおいて互いに隣接していない、前記EBNA3Aの第1及び第2の断片
を含む、項目1から16のいずれか一項に記載のポリヌクレオチド。
[項目18]
前記ポリペプチドが、
(a)配列番号2からなるLMP1の第1の断片、
(b)配列番号3からなるLMP1の第2の断片、
(c)配列番号4からなるLMP1の第3の断片、
(d)配列番号5からなるLMP1の第4の断片、
(e)配列番号7からなるLMP2の第1の断片、
(f)配列番号8からなるLMP2の第2の断片、
(g)配列番号9からなるLMP2の第3の断片、
(h)配列番号10からなるLMP2の第4の断片、
(i)配列番号12からなるEBNA1の第1の断片、
(j)配列番号14からなるEBNA3Aの第1の断片、
(k)配列番号15からなるEBNA3Aの第2の断片、
(l)配列番号16からなるEBNA3Aの第3の断片、
(m)配列番号17からなるEBNA3Aの第4の断片、
(n)配列番号18からなるEBNA3Aの第5の断片、
(o)配列番号19からなるEBNA3Aの第6の断片、及び
(p)配列番号20からなるEBNA3Aの第7の断片
を含み、
第1、第2、第3及び第4のLMP1断片が互いに隣接していない、第1、第2、第3及び第4のLMP2断片が互いに隣接していない、並びに第1、第2、第3、第4、第5、第6、及び第7のEBNA3A断片が互いに隣接していない、
項目1から17のいずれか一項に記載のポリヌクレオチド。
[項目19]
前記ポリペプチドが、
(a)配列番号22からなるZEBRAの第1の断片、及び
(b)配列番号23からなるZEBRAの第2の断片
をさらに含み、
第1及び第2のZEBRA断片が互いに隣接していない、項目17又は18に記載のポリヌクレオチド。
[項目20]
前記ポリペプチドが、配列番号24又は配列番号26に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である、項目1~19のいずれか一項に記載のポリヌクレオチド。
[項目21]
断片が免疫原性断片である、項目1~20のいずれか一項に記載のポリヌクレオチド。
[項目22]
項目1~21のいずれか一項に記載のポリヌクレオチドを含むベクター。
[項目23]
アデノウイルスベクター又はワクシニアウイルスベクターである、項目22に記載のベクター。
[項目24]
非ヒトサルアデノウイルスベクターである、項目22又は23に記載のベクター。
[項目25]
非ヒトサルアデノウイルスベクターが、チンパンジーアデノウイルスベクターである、項目24に記載のベクター。
[項目26]
改変ワクシニアアンカラベクターである、項目22又は23に記載のベクター。
[項目27]
配列番号50に対して少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%同一である核酸配列を含むChAd155-EBV-L発現ベクターである、項目22から25のいずれか一項に記載のベクター。
[項目28]
配列番号51と少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%同一である核酸配列を含むChAd155-EBV-LLy発現ベクターである、項目22から25のいずれか一項に記載のベクター。
[項目29]
項目1から21のいずれか一項に記載のポリヌクレオチド又は項目22から28のいずれか一項に記載のベクターによってコードされたポリペプチド。
[項目30]
配列番号24又は配列番号26に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である、項目29に記載のポリペプチド。
[項目31]
項目1から21のいずれか一項に記載のポリヌクレオチド、項目22から28のいずれか一項に記載のベクター、又は項目29若しくは30に記載のポリペプチド、及び薬学的に許容される賦形剤を含む免疫原性組成物。
[項目32]
アジュバントをさらに含む、項目31に記載の免疫原性組成物。
[項目33]
エプスタインバールウイルス感染によって引き起こされる疾患の処置又は予防のための医薬の製造における、項目1から21のいずれか一項に記載のポリヌクレオチド、項目22から28のいずれか一項に記載のベクター、項目29若しくは30に記載のポリペプチド、又は項目31若しくは32に記載の免疫原性組成物の使用。
[項目34]
エプスタインバールウイルス感染によって引き起こされる疾患の処置又は予防において使用するための、項目1から21のいずれか一項に記載のポリヌクレオチド、項目22から28のいずれか一項に記載のベクター、項目29若しくは30に記載のポリペプチド、又は項目31若しくは32に記載の免疫原性組成物。
[項目35]
EBV抗原を発現することが可能である組換えウイルス粒子を生成する方法であって、宿主細胞において項目22から28のいずれか一項に記載のベクターを発現させることを含む方法。
[項目36]
対象における免疫応答を誘導する方法であって、項目1から21のいずれか一項に記載のポリヌクレオチド、項目22から28のいずれか一項に記載のベクター、項目29若しくは30に記載のポリペプチド、又は項目31若しくは32に記載の免疫原性組成物を対象に投与することを含む方法。
[項目37]
対象が、エプスタインバールウイルス血清陰性である、項目36に記載の方法。
[項目38]
対象が、エプスタインバールウイルス血清陽性である、項目36に記載の方法。
[項目39]
対象におけるEBV関連疾患を処置又は予防する方法であって、項目1から21のいずれか一項に記載のポリヌクレオチド、項目22から28のいずれか一項に記載のベクター、項目29若しくは30に記載のポリペプチド、又は項目31若しくは32に記載の免疫原性組成物を対象に投与することを含む方法。
[項目40]
EBV関連疾患が、EBV関連自己免疫疾患又はEBV関連悪性腫瘍である、項目39に記載の方法。
[項目41]
EBV関連疾患が、多発性硬化症、関節リウマチ及び全身性ループスエリテマトーデスからなる群から選択される、項目39に記載の方法。
[項目42]
対象における免疫応答を誘導する方法であって、
(a)項目1から21のいずれか一項に記載のポリヌクレオチドを含むアデノウイルスベクターを投 BR>^するステップ、及び
(b)項目1から21のいずれか一項に記載のポリヌクレオチドを含むワクシニアウイルスベクターを投与するステップ
を含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法。
[項目43]
対象におけるEBV関連疾患を処置又は予防する方法であって、
(a)項目1から21のいずれか一項に記載のポリヌクレオチドを含むアデノウイルスベクターを投与するステップ、及び
(b)項目1から21のいずれか一項に記載のポリヌクレオチドを含むワクシニアウイルスベクターを投与するステップ
を含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法。
[項目44]
ステップ(b)が、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12週後又はそれより長い週数後に行われる、項目42又は43に記載の方法。
(a)本明細書に記載されているEBV抗原ポリペプチドをコードするポリヌクレオチドを含むアデノウイルスを投与するステップ、及び
(b)本明細書に記載されているEBV抗原ポリペプチドをコードするポリヌクレオチドを含むワクシニアウイルスを投与するステップ
を含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法も提供される。
本発明はまた、以下に関する。
[項目1]
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、及び
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片
を含むポリペプチドをコードするポリヌクレオチドであって、
宿主細胞において前記ポリペプチドの発現を指示する1つ以上の配列に作動可能に連結している、ポリヌクレオチド。
[項目2]
前記ポリペプチドが、配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片をさらに含む、項目1に記載のポリヌクレオチド。
[項目3]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片
を含む、項目1又は2に記載のポリヌクレオチド。
[項目4]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片
を含む、項目1~3のいずれか一項に記載のポリヌクレオチド。
[項目5]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片
を含む、項目1~4のいずれか一項に記載のポリヌクレオチド。
[項目6]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片
を含む、項目1~5のいずれか一項に記載のポリヌクレオチド。
[項目7]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片
を含む、項目1~6のいずれか一項に記載のポリヌクレオチド。
[項目8]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片
を含む、項目1~7のいずれか一項に記載のポリヌクレオチド。
[項目9]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片
を含む、項目1~8のいずれか一項に記載のポリヌクレオチド。
[項目10]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片
を含む、項目1~9のいずれか一項に記載のポリヌクレオチド。
[項目11]
前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片
を含む、項目1~10のいずれか一項に記載のポリヌクレオチド。
[項目12]
配列番号1の断片が互いに隣接していない、項目3から11のいずれか一項に記載のポリヌクレオチド。
[項目13]
配列番号6の断片が互いに隣接していない、項目3から12のいずれか一項に記載のポリヌクレオチド。
[項目14]
配列番号11の断片が互いに隣接していない、項目3から13のいずれか一項に記載のポリヌクレオチド。
[項目15]
配列番号13の断片が互いに隣接していない、項目3から14のいずれか一項に記載のポリヌクレオチド。
[項目16]
配列番号21の断片が互いに隣接していない、項目3から15のいずれか一項に記載のポリヌクレオチド。
[項目17]
前記ポリペプチドが、
(a)LMP1の第1及び第2の断片であって、前記LMP1の第1及び第2の断片は配列番号2~5からなる群から選択され、前記LMP1の第1及び第2の断片は前記ポリペプチドにおいて互いに隣接していない、前記LMP1の第1及び第2の断片、
(b)LMP2の第1及び第2の断片であって、前記LMP2の第1及び第2の断片は配列番号7~10からなる群から選択され、前記LMP2の第1及び第2の断片は前記ポリペプチドにおいて互いに隣接していない、前記LMP2の第1及び第2の断片、
(c)配列番号12からなるEBNA1の断片、並びに
(d)EBNA3Aの第1及び第2の断片であって、前記EBNA3Aの第1及び第2の断片は配列番号14~20からなる群から選択され、前記EBNA3Aの第1及び第2の断片は前記ポリペプチドにおいて互いに隣接していない、前記EBNA3Aの第1及び第2の断片
を含む、項目1から16のいずれか一項に記載のポリヌクレオチド。
[項目18]
前記ポリペプチドが、
(a)配列番号2からなるLMP1の第1の断片、
(b)配列番号3からなるLMP1の第2の断片、
(c)配列番号4からなるLMP1の第3の断片、
(d)配列番号5からなるLMP1の第4の断片、
(e)配列番号7からなるLMP2の第1の断片、
(f)配列番号8からなるLMP2の第2の断片、
(g)配列番号9からなるLMP2の第3の断片、
(h)配列番号10からなるLMP2の第4の断片、
(i)配列番号12からなるEBNA1の第1の断片、
(j)配列番号14からなるEBNA3Aの第1の断片、
(k)配列番号15からなるEBNA3Aの第2の断片、
(l)配列番号16からなるEBNA3Aの第3の断片、
(m)配列番号17からなるEBNA3Aの第4の断片、
(n)配列番号18からなるEBNA3Aの第5の断片、
(o)配列番号19からなるEBNA3Aの第6の断片、及び
(p)配列番号20からなるEBNA3Aの第7の断片
を含み、
第1、第2、第3及び第4のLMP1断片が互いに隣接していない、第1、第2、第3及び第4のLMP2断片が互いに隣接していない、並びに第1、第2、第3、第4、第5、第6、及び第7のEBNA3A断片が互いに隣接していない、
項目1から17のいずれか一項に記載のポリヌクレオチド。
[項目19]
前記ポリペプチドが、
(a)配列番号22からなるZEBRAの第1の断片、及び
(b)配列番号23からなるZEBRAの第2の断片
をさらに含み、
第1及び第2のZEBRA断片が互いに隣接していない、項目17又は18に記載のポリヌクレオチド。
[項目20]
前記ポリペプチドが、配列番号24又は配列番号26に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である、項目1~19のいずれか一項に記載のポリヌクレオチド。
[項目21]
断片が免疫原性断片である、項目1~20のいずれか一項に記載のポリヌクレオチド。
[項目22]
項目1~21のいずれか一項に記載のポリヌクレオチドを含むベクター。
[項目23]
アデノウイルスベクター又はワクシニアウイルスベクターである、項目22に記載のベクター。
[項目24]
非ヒトサルアデノウイルスベクターである、項目22又は23に記載のベクター。
[項目25]
非ヒトサルアデノウイルスベクターが、チンパンジーアデノウイルスベクターである、項目24に記載のベクター。
[項目26]
改変ワクシニアアンカラベクターである、項目22又は23に記載のベクター。
[項目27]
配列番号50に対して少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%同一である核酸配列を含むChAd155-EBV-L発現ベクターである、項目22から25のいずれか一項に記載のベクター。
[項目28]
配列番号51と少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%同一である核酸配列を含むChAd155-EBV-LLy発現ベクターである、項目22から25のいずれか一項に記載のベクター。
[項目29]
項目1から21のいずれか一項に記載のポリヌクレオチド又は項目22から28のいずれか一項に記載のベクターによってコードされたポリペプチド。
[項目30]
配列番号24又は配列番号26に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である、項目29に記載のポリペプチド。
[項目31]
項目1から21のいずれか一項に記載のポリヌクレオチド、項目22から28のいずれか一項に記載のベクター、又は項目29若しくは30に記載のポリペプチド、及び薬学的に許容される賦形剤を含む免疫原性組成物。
[項目32]
アジュバントをさらに含む、項目31に記載の免疫原性組成物。
[項目33]
エプスタインバールウイルス感染によって引き起こされる疾患の処置又は予防のための医薬の製造における、項目1から21のいずれか一項に記載のポリヌクレオチド、項目22から28のいずれか一項に記載のベクター、項目29若しくは30に記載のポリペプチド、又は項目31若しくは32に記載の免疫原性組成物の使用。
[項目34]
エプスタインバールウイルス感染によって引き起こされる疾患の処置又は予防において使用するための、項目1から21のいずれか一項に記載のポリヌクレオチド、項目22から28のいずれか一項に記載のベクター、項目29若しくは30に記載のポリペプチド、又は項目31若しくは32に記載の免疫原性組成物。
[項目35]
EBV抗原を発現することが可能である組換えウイルス粒子を生成する方法であって、宿主細胞において項目22から28のいずれか一項に記載のベクターを発現させることを含む方法。
[項目36]
対象における免疫応答を誘導する方法であって、項目1から21のいずれか一項に記載のポリヌクレオチド、項目22から28のいずれか一項に記載のベクター、項目29若しくは30に記載のポリペプチド、又は項目31若しくは32に記載の免疫原性組成物を対象に投与することを含む方法。
[項目37]
対象が、エプスタインバールウイルス血清陰性である、項目36に記載の方法。
[項目38]
対象が、エプスタインバールウイルス血清陽性である、項目36に記載の方法。
[項目39]
対象におけるEBV関連疾患を処置又は予防する方法であって、項目1から21のいずれか一項に記載のポリヌクレオチド、項目22から28のいずれか一項に記載のベクター、項目29若しくは30に記載のポリペプチド、又は項目31若しくは32に記載の免疫原性組成物を対象に投与することを含む方法。
[項目40]
EBV関連疾患が、EBV関連自己免疫疾患又はEBV関連悪性腫瘍である、項目39に記載の方法。
[項目41]
EBV関連疾患が、多発性硬化症、関節リウマチ及び全身性ループスエリテマトーデスからなる群から選択される、項目39に記載の方法。
[項目42]
対象における免疫応答を誘導する方法であって、
(a)項目1から21のいずれか一項に記載のポリヌクレオチドを含むアデノウイルスベクターを投 BR>^するステップ、及び
(b)項目1から21のいずれか一項に記載のポリヌクレオチドを含むワクシニアウイルスベクターを投与するステップ
を含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法。
[項目43]
対象におけるEBV関連疾患を処置又は予防する方法であって、
(a)項目1から21のいずれか一項に記載のポリヌクレオチドを含むアデノウイルスベクターを投与するステップ、及び
(b)項目1から21のいずれか一項に記載のポリヌクレオチドを含むワクシニアウイルスベクターを投与するステップ
を含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法。
[項目44]
ステップ(b)が、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12週後又はそれより長い週数後に行われる、項目42又は43に記載の方法。
配列の説明
配列番号1 EBV LMP1タンパク質(Genbank番号P03230)
配列番号2 EBV LMP1タンパク質の免疫原性断片
配列番号3 EBV LMP1タンパク質の免疫原性断片
配列番号4 EBV LMP1タンパク質の免疫原性断片
配列番号5 EBV LMP1タンパク質の免疫原性断片
配列番号6 EBV LMP2タンパク質(Genbank番号P13285)
配列番号7 EBV LMP2タンパク質の免疫原性断片
配列番号8 EBV LMP2タンパク質の免疫原性断片
配列番号9 EBV LMP2タンパク質の免疫原性断片
配列番号10 EBV LMP2タンパク質の免疫原性断片
配列番号11 EBV EBNA1タンパク質(Genbank番号P03211)
配列番号12 EBV EBNA1タンパク質の免疫原性断片
配列番号13 EBV EBNA3Aタンパク質(Genbank番号YP401669)
配列番号14 EBV EBNA3Aタンパク質の免疫原性断片
配列番号15 EBV EBNA3Aタンパク質の免疫原性断片
配列番号16 EBV EBNA3Aタンパク質の免疫原性断片
配列番号17 EBV EBNA3Aタンパク質の免疫原性断片
配列番号18 EBV EBNA3Aタンパク質の免疫原性断片
配列番号19 EBV EBNA3Aタンパク質の免疫原性断片
配列番号20 EBV EBNA3Aタンパク質の免疫原性断片
配列番号21 EBV ZEBRAタンパク質(Genbank番号P03206)
配列番号22 EBV ZEBRAタンパク質の免疫原性断片
配列番号23 EBV ZEBRAタンパク質の免疫原性断片
配列番号24 EBV-L抗原ポリペプチド
配列番号25 EBV-L抗原ポリペプチドをコードするDNA
配列番号26 EBV-LLy抗原ポリペプチド
配列番号27 EBV-LLy抗原ポリペプチドをコードするDNA
配列番号28 CalHV3 C1タンパク質(Genbank番号NP_733852)
配列番号29 CalHV3 C1タンパク質の免疫原性断片
配列番号30 CalHV3 C1タンパク質の免疫原性断片
配列番号31 CalHV3 C1タンパク質の免疫原性断片
配列番号32 CalHV3 C7タンパク質(Genbank番号NP_733851)
配列番号33 CalHV3 C7タンパク質の免疫原性断片
配列番号34 CalHV3 C7タンパク質の免疫原性断片
配列番号35 CalHV3 C7タンパク質の免疫原性断片
配列番号36 CalHV3 ORF39(Genbank番号NP_733892)
配列番号37 CalHV3 ORF39の免疫原性断片
配列番号38 CalHV3 ORF39の免疫原性断片
配列番号39 CalHV3 ORF39の免疫原性断片
配列番号40 CalHv3 ORF43タンパク質(Genbank番号NP_733896)
配列番号41 CalHv3 ORF43タンパク質の免疫原性断片
配列番号42 CalHv3 ORF43タンパク質の免疫原性断片
配列番号43 マーモセット不変鎖ポリペプチド
配列番号44 CalHv3_L抗原ポリペプチド
配列番号45 CalHV3_L抗原ポリペプチドをコードするDNA
配列番号46 CalHV3_LLy抗原ポリペプチド
配列番号47 CalHV3_LLy抗原ポリペプチドをコードするDNA
配列番号48 Ii_CalHV3_LLy抗原ポリペプチド
配列番号49 Ii_CalHV3_LLy抗原ポリペプチドをコードするDNA
配列番号50 pChAd155(ΔE1、ΔE4_Ad5E4 orf6) TetO hCMV-EBV-L発現ベクター
配列番号51 pChAd155(ΔE1、ΔE3、ΔE4_Ad5E4 orf6) TetO hCMV-EBV-LLy発現ベクター
配列番号52 pChAd155(ΔE1、ΔE4_Ad5E4 orf6) TetO hCMV-CalHV3-L発現ベクター
配列番号53 pChAd155(ΔE1、ΔE3、ΔE4_Ad5E4 orf6) TetO hCMV-CalHV3-LLy発現ベクター
配列番号54 pChAd155(ΔE1、ΔE3、ΔE4_Ad5E4 orf6) TetO hCMV-mli-CalHV3-LLy発現ベクター
配列番号1 EBV LMP1タンパク質(Genbank番号P03230)
配列番号2 EBV LMP1タンパク質の免疫原性断片
配列番号3 EBV LMP1タンパク質の免疫原性断片
配列番号4 EBV LMP1タンパク質の免疫原性断片
配列番号5 EBV LMP1タンパク質の免疫原性断片
配列番号6 EBV LMP2タンパク質(Genbank番号P13285)
配列番号7 EBV LMP2タンパク質の免疫原性断片
配列番号8 EBV LMP2タンパク質の免疫原性断片
配列番号9 EBV LMP2タンパク質の免疫原性断片
配列番号10 EBV LMP2タンパク質の免疫原性断片
配列番号11 EBV EBNA1タンパク質(Genbank番号P03211)
配列番号12 EBV EBNA1タンパク質の免疫原性断片
配列番号13 EBV EBNA3Aタンパク質(Genbank番号YP401669)
配列番号14 EBV EBNA3Aタンパク質の免疫原性断片
配列番号15 EBV EBNA3Aタンパク質の免疫原性断片
配列番号16 EBV EBNA3Aタンパク質の免疫原性断片
配列番号17 EBV EBNA3Aタンパク質の免疫原性断片
配列番号18 EBV EBNA3Aタンパク質の免疫原性断片
配列番号19 EBV EBNA3Aタンパク質の免疫原性断片
配列番号20 EBV EBNA3Aタンパク質の免疫原性断片
配列番号21 EBV ZEBRAタンパク質(Genbank番号P03206)
配列番号22 EBV ZEBRAタンパク質の免疫原性断片
配列番号23 EBV ZEBRAタンパク質の免疫原性断片
配列番号24 EBV-L抗原ポリペプチド
配列番号25 EBV-L抗原ポリペプチドをコードするDNA
配列番号26 EBV-LLy抗原ポリペプチド
配列番号27 EBV-LLy抗原ポリペプチドをコードするDNA
配列番号28 CalHV3 C1タンパク質(Genbank番号NP_733852)
配列番号29 CalHV3 C1タンパク質の免疫原性断片
配列番号30 CalHV3 C1タンパク質の免疫原性断片
配列番号31 CalHV3 C1タンパク質の免疫原性断片
配列番号32 CalHV3 C7タンパク質(Genbank番号NP_733851)
配列番号33 CalHV3 C7タンパク質の免疫原性断片
配列番号34 CalHV3 C7タンパク質の免疫原性断片
配列番号35 CalHV3 C7タンパク質の免疫原性断片
配列番号36 CalHV3 ORF39(Genbank番号NP_733892)
配列番号37 CalHV3 ORF39の免疫原性断片
配列番号38 CalHV3 ORF39の免疫原性断片
配列番号39 CalHV3 ORF39の免疫原性断片
配列番号40 CalHv3 ORF43タンパク質(Genbank番号NP_733896)
配列番号41 CalHv3 ORF43タンパク質の免疫原性断片
配列番号42 CalHv3 ORF43タンパク質の免疫原性断片
配列番号43 マーモセット不変鎖ポリペプチド
配列番号44 CalHv3_L抗原ポリペプチド
配列番号45 CalHV3_L抗原ポリペプチドをコードするDNA
配列番号46 CalHV3_LLy抗原ポリペプチド
配列番号47 CalHV3_LLy抗原ポリペプチドをコードするDNA
配列番号48 Ii_CalHV3_LLy抗原ポリペプチド
配列番号49 Ii_CalHV3_LLy抗原ポリペプチドをコードするDNA
配列番号50 pChAd155(ΔE1、ΔE4_Ad5E4 orf6) TetO hCMV-EBV-L発現ベクター
配列番号51 pChAd155(ΔE1、ΔE3、ΔE4_Ad5E4 orf6) TetO hCMV-EBV-LLy発現ベクター
配列番号52 pChAd155(ΔE1、ΔE4_Ad5E4 orf6) TetO hCMV-CalHV3-L発現ベクター
配列番号53 pChAd155(ΔE1、ΔE3、ΔE4_Ad5E4 orf6) TetO hCMV-CalHV3-LLy発現ベクター
配列番号54 pChAd155(ΔE1、ΔE3、ΔE4_Ad5E4 orf6) TetO hCMV-mli-CalHV3-LLy発現ベクター
発明の詳細な説明
エプスタインバールウイルス抗原ポリペプチド
本発明のEBV抗原ポリペプチドは、1個以上のEBV潜伏及び/又は溶解性タンパク質の免疫原性断片を含むポリペプチドを含む。EBV潜伏タンパク質としては、例えば、潜伏膜タンパク質(Latent Membrane Proteins) (LMP1及びLMP2);及びEBV核抗原(EBV Nuclear Antigens) (EBNA1、EBNA2、EBNA3A、EBNA3B及びEBNA3C)が挙げられる。EBV溶解性タンパク質としては、例えば、ZEBRA(BZLF1遺伝子によってコードされている)が挙げられる。
エプスタインバールウイルス抗原ポリペプチド
本発明のEBV抗原ポリペプチドは、1個以上のEBV潜伏及び/又は溶解性タンパク質の免疫原性断片を含むポリペプチドを含む。EBV潜伏タンパク質としては、例えば、潜伏膜タンパク質(Latent Membrane Proteins) (LMP1及びLMP2);及びEBV核抗原(EBV Nuclear Antigens) (EBNA1、EBNA2、EBNA3A、EBNA3B及びEBNA3C)が挙げられる。EBV溶解性タンパク質としては、例えば、ZEBRA(BZLF1遺伝子によってコードされている)が挙げられる。
EBVタンパク質の「免疫原性断片」は、本明細書で使用される場合、免疫応答、例えば、液性(例えば、抗体)及び/又は細胞媒介性(例えば、細胞傷害性T細胞)応答を誘導することが可能である、全長EBVタンパク質よりも小さな断片を意味する。免疫原性断片は、全長タンパク質のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90及び少なくとも100アミノ酸の断片を含む。一部の実施形態では、免疫原性断片は、全長タンパク質のうちの約8、約9、約10、約11、約12、約13、約14、約15、約20、約30、約40、約50、約60、約70、約80、約90及び約100アミノ酸からなる。本発明の一態様は、潜伏EBV感染を有するB細胞に対するT細胞応答を誘導することが可能なEBV抗原ポリペプチドを提供することである。よって、一部の実施形態では、EBVタンパク質の免疫原性断片は、抗原特異的T細胞応答を誘導することが可能な1つ以上のT細胞エピトープを含む。
免疫原性断片は、断片が由来する全長タンパク質に対して1つ以上の置換、欠失又は挿入を有してもよい。よって、免疫原性断片は、全長タンパク質の対応する領域に対して、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一実施形態では、本発明のEBV抗原ポリペプチドは、潜伏膜タンパク質1 (Latent Membrane Protein 1) (LMP1)抗原を含む。LMP1は、EBVのウイルス生活環の潜伏段階の間に発現される386アミノ酸タンパク質である。本発明のEBV抗原ポリペプチドにおいて使用するのに好適なLMP1の免疫原性断片は、配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90及び少なくとも100アミノ酸の断片を含む。一部の実施形態では、LMP1の免疫原性断片は、配列番号1のうちの約8、約9、約10、約11、約12、約13、約14、約15、約20、約30、約40、約50、約60、約70、約80、約90及び約100アミノ酸からなる。一部の実施形態では、LMP1の免疫原性断片は、配列番号1の対応する領域に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一部の実施形態では、LMP1の免疫原性断片は、1つ以上のT細胞エピトープを含む。好ましい実施形態では、LMP1の免疫原性エピトープは、これらに限定されないが、配列番号2~5及び配列番号2~5に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一部の実施形態では、本発明のEBV抗原ポリペプチドは、潜伏膜タンパク質2 (Latent Membrane Protein 2) (LMP2)抗原を含む。LMP2は、EBVのウイルス生活環の潜伏段階の間に発現される497アミノ酸タンパク質である。本発明のEBV抗原ポリペプチドにおいて使用するのに好適なLMP2の免疫原性断片は、配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90及び少なくとも100アミノ酸の断片を含む。一部の実施形態では、LMP2の免疫原性断片は、配列番号6のうちの約8、約9、約10、約11、約12、約13、約14、約15、約20、約30、約40、約50、約60、約70、約80、約90及び約100アミノ酸からなる。一部の実施形態では、LMP2の免疫原性断片は、配列番号6の対応する領域に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一部の実施形態では、LMP2の免疫原性断片は、1つ以上のT細胞エピトープを含む。好ましい実施形態では、LMP2の免疫原性エピトープは、これらに限定されないが、配列番号7~10、及び配列番号7~10に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一実施形態では、本発明のEBV抗原ポリペプチドは、Epstein-Barr Nuclear Antigen 1(EBNA1)抗原を含む。EBNA1は、EBVのウイルス生活環の潜伏段階の間に発現される641アミノ酸タンパク質である。本発明のEBV抗原ポリペプチドにおいて使用するのに好適なEBNA1の免疫原性断片は、配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90及び少なくとも100アミノ酸の断片を含む。一部の実施形態では、EBNA1の免疫原性断片は、配列番号11のうちの約8、約9、約10、約11、約12、約13、約14、約15、約20、約30、約40、約50、約60、約70、約80、約90及び約100アミノ酸からなる。一部の実施形態では、EBNA1の免疫原性断片は、配列番号11の対応する領域に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一部の実施形態では、EBNA1の免疫原性断片は、1つ以上のT細胞エピトープを含む。好ましい実施形態では、EBNA1の免疫原性エピトープは、これらに限定されないが、配列番号12、及び配列番号12に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一実施形態では、本発明のEBV抗原ポリペプチドは、エプスタインバール核抗原3A(Epstein-Barr Nuclear Antigen 3A) (EBNA3A)抗原を含む。EBNA3Aは、EBVのウイルス生活環の潜伏段階の間に発現される944アミノ酸タンパク質である。本発明のEBV抗原ポリペプチドにおいて使用するのに好適なEBNA3Aの免疫原性断片は、配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90及び少なくとも100アミノ酸の断片を含む。一部の実施形態では、EBNA3Aの免疫原性断片は、配列番号13のうちの約8、約9、約10、約11、約12、約13、約14、約15、約20、約30、約40、約50、約60、約70、約80、約90及び約100アミノ酸からなる。一部の実施形態では、EBNA3Aの免疫原性断片は、配列番号13の対応する領域に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一部の実施形態では、EBNA3Aの免疫原性断片は、1つ以上のT細胞エピトープを含む。好ましい実施形態では、EBNA3Aの免疫原性エピトープは、これらに限定されないが、配列番号14~20、及び配列番号14~20に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一実施形態では、本発明のEBV抗原ポリペプチドは、ZEBRA抗原を含む。ZEBRAは、EBVのウイルス生活環の溶解性段階の間に発現される245アミノ酸タンパク質である。本発明のEBV抗原ポリペプチドにおいて使用するのに好適なZEBRAの免疫原性断片は、配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90及び少なくとも100アミノ酸の断片を含む。一部の実施形態では、ZEBRAの免疫原性断片は、配列番号21のうちの約8、約9、約10、約11、約12、約13、約14、約15、約20、約30、約40、約50、約60、約70、約80、約90及び約100アミノ酸からなる。一部の実施形態では、ZEBRAの免疫原性断片は、配列番号21の対応する領域に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一部の実施形態では、ZEBRAの免疫原性断片は、1つ以上のT細胞エピトープを含む。好ましい実施形態では、ZEBRAの免疫原性エピトープは、これらに限定されないが、配列番号22~23、及び配列番号22~23に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である断片を含む。
一部の実施形態では、EBV抗原ポリペプチドは、多価EBV抗原ポリペプチドである。「多価」によって、2、3、4、5又はそれより多いEBVタンパク質の免疫原性断片を含むポリペプチドが意図される。「断片」によって、全長タンパク質のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の断片が意図される。
よって、一実施形態では、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、及び
(d)配列番号13の少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片
を含むポリペプチドが提供される。
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、及び
(d)配列番号13の少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片
を含むポリペプチドが提供される。
場合により、ポリペプチドは、配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片をさらに含む。
一部の実施形態では、多価EBV抗原ポリペプチドは、1つ以上のEBVタンパク質の少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、又は少なくとも10個の断片を含む。よって、一実施形態では、多価EBV抗原は、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片
を含むポリペプチドである。
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片
を含むポリペプチドである。
一実施形態では、多価EBV抗原は、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片
を含むポリペプチドである。
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片
を含むポリペプチドである。
一実施形態では、多価EBV抗原は、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片
を含むポリペプチドである。
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片
を含むポリペプチドである。
一実施形態では、多価EBV抗原は、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片
を含むポリペプチドである。
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片
を含むポリペプチドである。
一実施形態では、多価EBV抗原は、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片
を含むポリペプチドである。
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片
を含むポリペプチドである。
一実施形態では、多価EBV抗原は、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片
を含むポリペプチドである。
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片
を含むポリペプチドである。
一実施形態では、多価EBV抗原は、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片
を含むポリペプチドである。
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片
を含むポリペプチドである。
一実施形態では、多価EBV抗原は、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片
を含むポリペプチドである。
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片
を含むポリペプチドである。
一実施形態では、多価EBV抗原は、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片
を含むポリペプチドである。
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片
を含むポリペプチドである。
一部の実施形態では、多価EBV抗原ポリペプチドは、同じEBVタンパク質に由来する少なくとも2個の免疫原性断片を含み、少なくとも2個の免疫原性断片は、多価EBV抗原ポリペプチドにおいて互いに隣接していない。「隣接していない」によって、少なくとも2個の免疫原性断片が、EBV抗原ポリペプチドにおいて連続するアミノ酸配列を形成しないことを意味することが意図される。隣接していない免疫原性断片は、免疫原性断片と同じEBVタンパク質に由来しない、少なくとも1、2、3、4、5、10又はそれより多いアミノ酸によって互いに分離されている。
例えば、一実施形態では、多価EBV抗原ポリペプチドは、LMP1(配列番号1)の少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、又は少なくとも10個の断片を含み、LMP1の断片は互いに隣接していない。
別の実施形態では、多価EBV抗原ポリペプチドは、LMP2(配列番号6)の少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、又は少なくとも10個の断片を含み、LMP2の断片は互いに隣接していない。
別の実施形態では、多価EBV抗原ポリペプチドは、EBNA1(配列番号11)の少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、又は少なくとも10個の断片を含み、EBNA1の断片は互いに隣接していない。
別の実施形態では、多価EBV抗原ポリペプチドは、EBNA3A(配列番号13)の少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、又は少なくとも10個の断片を含み、EBNA3Aの断片は互いに隣接していない。
別の実施形態では、多価EBV抗原ポリペプチドは、ZEBRA(配列番号21)の少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、又は少なくとも10個の断片を含み、ZEBRAの断片は互いに隣接していない。
一実施形態では、多価EBV抗原ポリペプチドは、
(a)LMP1の第1及び第2の断片であって、該LMP1の第1及び第2の断片は配列番号2~5からなる群から選択され、かつ該LMP1の第1及び第2の断片はポリペプチドにおいて互いに隣接していない、該LMP1の第1及び第2の断片、
(b)LMP2の第1及び第2の断片であって、該LMP1の前記第1及び第2の断片が配列番号7~10からなる群から選択され、かつ該LMP2の第1及び第2の断片がポリペプチドにおいて互いに隣接していない、該LMP2の第1及び第2の断片、
(c)配列番号12からなるEBNA1の断片、並びに
(d)EBNA3Aの第1及び第2の断片であって、該EBNA3Aの第1及び第2の断片が配列番号14~20からなる群から選択され、かつ該EBNA3Aの第1及び第2の断片がポリペプチドにおいて互いに隣接していない、該EBNA3Aの第1及び第2の断片
を含む。
(a)LMP1の第1及び第2の断片であって、該LMP1の第1及び第2の断片は配列番号2~5からなる群から選択され、かつ該LMP1の第1及び第2の断片はポリペプチドにおいて互いに隣接していない、該LMP1の第1及び第2の断片、
(b)LMP2の第1及び第2の断片であって、該LMP1の前記第1及び第2の断片が配列番号7~10からなる群から選択され、かつ該LMP2の第1及び第2の断片がポリペプチドにおいて互いに隣接していない、該LMP2の第1及び第2の断片、
(c)配列番号12からなるEBNA1の断片、並びに
(d)EBNA3Aの第1及び第2の断片であって、該EBNA3Aの第1及び第2の断片が配列番号14~20からなる群から選択され、かつ該EBNA3Aの第1及び第2の断片がポリペプチドにおいて互いに隣接していない、該EBNA3Aの第1及び第2の断片
を含む。
場合により、多価EBV抗原は、
(a)配列番号22からなるZEBRAの第1の断片、及び
(b)配列番号23からなるZEBRAの第2の断片
をさらに含み、
第1及び第2のZEBRA断片は互いに隣接していない。
(a)配列番号22からなるZEBRAの第1の断片、及び
(b)配列番号23からなるZEBRAの第2の断片
をさらに含み、
第1及び第2のZEBRA断片は互いに隣接していない。
一実施形態では、多価EBV抗原ポリペプチドは、
(a)配列番号2からなるLMP1の第1の断片、
(b)配列番号3からなるLMP1の第2の断片、
(c)配列番号4からなるLMP1の第3の断片、
(d)配列番号5からなるLMP1の第4の断片、
(e)配列番号7からなるLMP2の第1の断片、
(f)配列番号8からなるLMP2の第2の断片、
(g)配列番号9からなるLMP2の第3の断片、
(h)配列番号10からなるLMP2の第4の断片、
(i)配列番号12からなるEBNA1の第1の断片、
(j)配列番号14からなるEBNA3Aの第1の断片、
(k)配列番号15からなるEBNA3Aの第2の断片、
(l)配列番号16からなるEBNA3Aの第3の断片、
(m)配列番号17からなるEBNA3Aの第4の断片、
(n)配列番号18からなるEBNA3Aの第5の断片、
(o)配列番号19からなるEBNA3Aの第6の断片、及び
(p)配列番号20からなるEBNA3Aの第7の断片
を含み、
第1、第2、第3及び第4のLMP1断片は互いに隣接していない、第1、第2、第3及び第4のLMP2断片は互いに隣接していない、並びに第1、第2、第3、第4、第5、第6、及び第7のEBNA3A断片は互いに隣接していない。場合により、多価EBV抗原は、
(a)配列番号22からなるZEBRAの第1の断片、及び
(b)配列番号23からなるZEBRAの第2の断片
をさらに含み、
第1及び第2のZEBRA断片は互いに隣接していない。
(a)配列番号2からなるLMP1の第1の断片、
(b)配列番号3からなるLMP1の第2の断片、
(c)配列番号4からなるLMP1の第3の断片、
(d)配列番号5からなるLMP1の第4の断片、
(e)配列番号7からなるLMP2の第1の断片、
(f)配列番号8からなるLMP2の第2の断片、
(g)配列番号9からなるLMP2の第3の断片、
(h)配列番号10からなるLMP2の第4の断片、
(i)配列番号12からなるEBNA1の第1の断片、
(j)配列番号14からなるEBNA3Aの第1の断片、
(k)配列番号15からなるEBNA3Aの第2の断片、
(l)配列番号16からなるEBNA3Aの第3の断片、
(m)配列番号17からなるEBNA3Aの第4の断片、
(n)配列番号18からなるEBNA3Aの第5の断片、
(o)配列番号19からなるEBNA3Aの第6の断片、及び
(p)配列番号20からなるEBNA3Aの第7の断片
を含み、
第1、第2、第3及び第4のLMP1断片は互いに隣接していない、第1、第2、第3及び第4のLMP2断片は互いに隣接していない、並びに第1、第2、第3、第4、第5、第6、及び第7のEBNA3A断片は互いに隣接していない。場合により、多価EBV抗原は、
(a)配列番号22からなるZEBRAの第1の断片、及び
(b)配列番号23からなるZEBRAの第2の断片
をさらに含み、
第1及び第2のZEBRA断片は互いに隣接していない。
本明細書に記載のポリペプチド及びポリヌクレオチドの明確な説明を容易にするために、特定の配列構成成分を「第1の」ポリペプチド又はポリヌクレオチド配列、「第2の」ポリペプチド又はポリヌクレオチド配列などと称する。第1、第2などの配列は任意の所望の順序又は方向で出現することができ、特定の順序又は方向が「第1の」、「第2の」などの語によって意図されていないことが理解されるべきである。
一部の実施形態では、多価EBV抗原は、ヒト(すなわち、自己)タンパク質にマッピングする接合部ネオエピトープを含有しない。免疫原性接合部ネオエピトープは、2つの異種タンパク質配列の接合部に対する免疫応答を誘発するエピトープであり、エピトープは、異種タンパク質配列自体のいずれにも存在しない。接合部ネオエピトープに対するT細胞応答は、当技術分野で公知の方法、例えば、実施例4に記載されているような、使用されるすべての接合部をカバーするペプチドプールを使用する免疫学アッセイを使用して特定することができる。
一実施形態では、多価EBV抗原は、図2Aにおいて示される「EBV-L」構築物である。別の実施形態では、多価EBV抗原ポリペプチドは、配列番号24に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一であるポリペプチドである。
別の実施形態では、多価EBV抗原は、図2Bにおいて示される「EBV-LLy」構築物である。別の実施形態では、多価EBV抗原ポリペプチドは、配列番号26に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一であるポリペプチドである。
好ましい実施形態では、本発明のEBV抗原ポリペプチドは、野生型EBVタンパク質と比較して、少なくとも1つのアミノ酸の挿入、欠失及び/又は置換を含有する。
別の実施形態では、EBV抗原ポリペプチドは、本明細書に記載のポリヌクレオチドによってコードされたポリペプチドである。
ポリヌクレオチド
本明細書に記載のEBV抗原ポリペプチドをコードするポリヌクレオチド及び発現カセットも提供される。「発現カセット」によって、選択された異種遺伝子(EBV抗原ポリペプチドをコードする「導入遺伝子」)と、宿主細胞において遺伝子産物の翻訳、転写及び/又は発現を駆動するのに必要な他の調節エレメントとの組合せが意味される。
本明細書に記載のEBV抗原ポリペプチドをコードするポリヌクレオチド及び発現カセットも提供される。「発現カセット」によって、選択された異種遺伝子(EBV抗原ポリペプチドをコードする「導入遺伝子」)と、宿主細胞において遺伝子産物の翻訳、転写及び/又は発現を駆動するのに必要な他の調節エレメントとの組合せが意味される。
本発明は、本発明のEBV抗原ポリペプチドをコードするポリヌクレオチドを提供する。
一実施形態では、配列番号24に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一であるポリペプチドをコードするポリヌクレオチドが提供される。一実施形態では、ポリヌクレオチドは、配列番号25に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である。
一実施形態では、配列番号26に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一であるポリペプチドをコードするポリヌクレオチドが提供される。一実施形態では、ポリヌクレオチドは、配列番号27に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である。
好適には、本発明のポリヌクレオチドは組換え体である。組換え体は、ポリヌクレオチドが、クローニング、制限(restriction)、組換え若しくはライゲーションステップ、又は天然に見られるポリヌクレオチドと異なるポリヌクレオチドをもたらす他の手順のうちの少なくとも1つの産物であることを意味する。組換えウイルスは、組換えポリヌクレオチドを含むウイルスである。組換えベクターは、組換えポリヌクレオチドを含むベクターである。組換えウイルスは、元の組換えウイルスの子孫を含む。「組換えベクター」は、元の組換えベクターの複製物を含む。「組換えポリヌクレオチド」は、元の組換えポリヌクレオチドの複製物を含む。本発明の組換えポリヌクレオチドは、野生型EBVゲノムと比較して、少なくとも1つの核酸の置換を含有する。
一部の実施形態では、本発明のEBV抗原をコードするポリヌクレオチドは、そのポリヌクレオチドをトランスフェクトしたか又はそれに感染した細胞において、その転写、翻訳及び/又は発現を可能にする様式で、1つ以上の制御エレメントに作動可能に連結している。本明細書で使用される場合、「作動可能に連結している」配列は、目的の遺伝子と連続している発現制御配列と目的の遺伝子を制御するためにtransで又は一定の距離で作用する発現制御配列との両方を含む。よって、一実施形態では、ポリヌクレオチドは、宿主細胞において前記ポリペプチドの発現を指示する1つ以上の配列に作動可能に連結している。一部の実施形態では、発現制御配列は、EBV抗原をコードするポリヌクレオチドに対して異種性である。
発現制御配列は、適当な転写開始、終結、プロモーター及びエンハンサー配列;効率的なRNAプロセシングシグナル、例えば、スプライシング及びウサギベータ-グロビンpolyAを含むポリアデニル化(poly A)シグナル;細胞質mRNAを安定化する配列;翻訳効率を増強する配列(例えば、コザックのコンセンサス配列);タンパク質の安定性を増強する配列;並びに所望の場合には、コードされた産物の分泌を増強する配列を含む。他の配列の中で、キメライントロンが使用されてもよい。
「プロモーター」は、RNAポリメラーゼの結合を可能にし、遺伝子の転写を指示するヌクレオチド配列である。典型的には、プロモーターは、遺伝子の転写開始部位に近接する、遺伝子の5'非コード領域に位置する。転写開始において機能するプロモーター内の配列エレメントは、コンセンサスヌクレオチド配列を特徴とすることが多い。プロモーターの例としては、これらに限定されないが、細菌、酵母、植物、ウイルス、及び哺乳動物(ヒトを含む)由来のプロモーターが挙げられる。内部プロモーター、異種プロモーター、天然のプロモーター、構成的プロモーター、誘導性及び/又は組織特異的プロモーターを含む非常に多くの発現制御配列が当技術分野において知られており、利用され得る。
一部の実施形態では、ポリヌクレオチドは、異種発現制御配列、例えば、プロモーターに作動可能に連結している。典型的には、「異種性」は、比較されている実体の残りの部分のものと遺伝子型が異なる実体に由来することを意味する。異種核酸配列は、アデノウイルスベクターの天然に存在する核酸配列から単離されたものではない、それに由来しない、又はそれをベースとしない任意の核酸配列を指す。
構成的プロモーターの例としては、限定されないが、TBGプロモーター、レトロウイルスのラウス肉腫ウイルスLTRプロモーター(場合により、エンハンサーを含む)、サイトメガロウイルス(CMV)プロモーター(場合により、CMVエンハンサーを含む、例えば、Boshartら、Cell、41:521~530頁(1985)を参照されたい)、CASIプロモーター(WO2012/115980)、SV40プロモーター、ジヒドロ葉酸還元酵素プロモーター、β-アクチンプロモーター、ホスホグリセロールキナーゼ(PGK)プロモーター、及びEF1aプロモーター(Invitrogen)が挙げられる。
誘導性プロモーターは、遺伝子発現の調節を可能にし、外から供給される化合物、環境因子、例えば、温度、又は特定の生理状態の存在(例えば、急性期、細胞の特定の分化状態、又は複製している細胞のみにおいて)によって調節され得る。誘導性プロモーター及び誘導系は、限定されないが、Invitrogen、Clontech及びAriadを含む、種々の商業的供給源から入手可能である。多くの他の系が記載されており、当業者によって容易に選択され得る。例えば、誘導性プロモーターとしては、亜鉛誘導性ヒツジメタロチオネイン(MT)プロモーター及びデキサメタゾン(Dex)誘導性マウス乳癌ウイルス(MMTV)プロモーターが挙げられる。他の誘導系としては、T7ポリメラーゼプロモーター系;エクジソン昆虫プロモーター、テトラサイクリン抑制系及びテトラサイクリン誘導系が挙げられる。他の系としては、FK506二量体、カストラジオールを使用するVP16又はp65、ジフェノールムリスレロン、RU486誘導系及びラパマイシン誘導系が挙げられる。いくつかの誘導性プロモーターの有効性は、経時的に増加する。このような場合には、複数のリプレッサーをタンデムに挿入すること(例えば、IRESによってTetRに連結されたTetR)によって、このような系の有効性を向上させることができる。
別の実施形態では、天然のEBVプロモーターを使用してもよい。導入遺伝子の発現が天然の発現を模倣することが望ましい場合、天然のプロモーターが好まれ得る。天然のプロモーターは、導入遺伝子の発現が時間的(一時的)に若しくは発達上(発生上)、又は組織特異的に、又は特定の転写刺激に応答して調節されなければならない場合に、使用され得る。さらなる実施形態では、他の天然の発現制御エレメント、例えば、エンハンサーエレメント、ポリアデニル化部位又はコザックコンセンサス配列もまた、天然の発現を模倣するために使用することができる。
導入遺伝子は、組織特異的プロモーターに作動可能に連結されていてもよい。例えば、骨格筋での発現が望ましい場合、筋肉で活性のあるプロモーターが使用されるべきである。これらは、骨格β-アクチン、ミオシン軽鎖2A、ジストロフィン、筋クレアチンキナーゼをコードする遺伝子由来のプロモーター、及び天然に存在するプロモーターより高い活性を有する合成(人工)筋肉プロモーターを含む。組織特異的であるプロモーターの例は、とりわけ、肝臓;B型肝炎ウイルスコア;アルファ-フェトプロテイン、骨オステオカルシン;骨シアロタンパク質、リンパ球、免疫グロブリン重鎖;T細胞受容体鎖)、ニューロンのプロモーター、例えば、ニューロン特異的エノラーゼ(NSE)プロモーター、ニューロフィラメント軽鎖遺伝子、及びニューロン特異的vgf遺伝子について知られている。
ベクター
本明細書に記載されているEBV抗原構築物をコードするポリヌクレオチドを含有するベクターも提供される。このようなベクターは、宿主細胞への送達及び宿主細胞における発現に関して好適となる。ベクターは、複製型ベクター又は複製欠損型ベクター、例えば、ウイルスベクターの形態であり得る。免疫原性核酸を対象へと導入するのに好適な数多くのウイルスベクターが当技術分野で公知であり、DNAウイルスとRNAウイルスの両方を含む。本明細書に記載のEBV抗原をコードするのに好適なベクターの例としては、以下が挙げられる:アデノウイルスベクター(複製型又は複製欠損型)、ポックスウイルスベクター(ワクシニアウイルスベクターを含み、例えば、改変ワクシニアアンカラウイルス(MVA)、NYVAC、アビポックスベクター、カナリアポックス(ALVAC)及び鶏痘ウイルス(FPV))、アルファウイルスベクター(例えば、シンドビスウイルス、セムリキ森林ウイルス(SFV)、ロスリバーウイルス、及びベネズエラウマ脳炎(VEE)ウイルス)並びにそれらのキメラ及びレプリコン、ヘルペスウイルスベクター(例えば、サイトメガロウイルス(CMV)由来ベクター)、アレナウイルスベクター、例えば、リンパ球性脈絡髄膜炎ウイルス(LCMV)ベクター、麻疹ウイルスベクター、水疱性口内炎ウイルスベクター、仮性狂犬病ウイルス、アデノ随伴ウイルス、レトロウイルス、レンチウイルス、ウイルス様粒子、及びその他多数。
本明細書に記載されているEBV抗原構築物をコードするポリヌクレオチドを含有するベクターも提供される。このようなベクターは、宿主細胞への送達及び宿主細胞における発現に関して好適となる。ベクターは、複製型ベクター又は複製欠損型ベクター、例えば、ウイルスベクターの形態であり得る。免疫原性核酸を対象へと導入するのに好適な数多くのウイルスベクターが当技術分野で公知であり、DNAウイルスとRNAウイルスの両方を含む。本明細書に記載のEBV抗原をコードするのに好適なベクターの例としては、以下が挙げられる:アデノウイルスベクター(複製型又は複製欠損型)、ポックスウイルスベクター(ワクシニアウイルスベクターを含み、例えば、改変ワクシニアアンカラウイルス(MVA)、NYVAC、アビポックスベクター、カナリアポックス(ALVAC)及び鶏痘ウイルス(FPV))、アルファウイルスベクター(例えば、シンドビスウイルス、セムリキ森林ウイルス(SFV)、ロスリバーウイルス、及びベネズエラウマ脳炎(VEE)ウイルス)並びにそれらのキメラ及びレプリコン、ヘルペスウイルスベクター(例えば、サイトメガロウイルス(CMV)由来ベクター)、アレナウイルスベクター、例えば、リンパ球性脈絡髄膜炎ウイルス(LCMV)ベクター、麻疹ウイルスベクター、水疱性口内炎ウイルスベクター、仮性狂犬病ウイルス、アデノ随伴ウイルス、レトロウイルス、レンチウイルス、ウイルス様粒子、及びその他多数。
一実施形態では、ベクターはアデノウイルスである。アデノウイルスベクターの生成及び使用は、当業者に周知である。本明細書に開示されている免疫原性組合せ物との関連において、ワクチン抗原を発現するアデノウイルスベクターの設計、生成及び使用の開示例は、例えば、米国特許出願公開第US2014/0141042号(WO2012/089833)、米国特許第8,216,834号(WO2005/071093)、米国特許出願公開第US2012/0027788号(WO2010/086189)、及び米国特許出願公開第US2005/0214323号に見出すことができる。
典型的には、アデノウイルスベクターは、発現カセットが、選択されたアデノウイルス遺伝子に対して天然の領域中に他のアデノウイルス配列を含有する核酸分子中に位置するように設計される。発現カセットは、所望の場合、既存の遺伝子領域中にその領域の機能を破壊するように挿入され得る。あるいは、発現カセットは、部分的又は完全に欠失したアデノウイルス遺伝子の部位中に挿入され得る。例えば、発現カセットは、E1A、E1B、E2A、E2B、E3及びE4からなる群から選択されるゲノム領域の少なくとも1種の遺伝子を非機能的にする突然変異、挿入又は欠失の部位に位置してもよい。「非機能的にする」という用語は、遺伝子領域の十分な量が除去されるか又はそうでなければ破壊され、その結果、遺伝子領域がもはや、遺伝子発現の機能的産物を生成できないことを意味する。所望の場合、全遺伝子領域が除去され得る(好適には、発現カセットと置き換えられる)。好適には、アデノウイルスのE1遺伝子が欠失し、選択されるプロモーター、目的の遺伝子のcDNA配列及びポリAシグナルからなる発現カセットと置き換えられ、複製欠損組換えウイルスをもたらす。
本発明において使用するアデノウイルスベクターは、ある範囲の哺乳動物宿主に由来していてもよい。種々の哺乳動物種に感染する、100を超える異なる血清型のアデノウイルスが単離され、そのうちの51種は、ヒト起源のものである。よって、アデノウイルスベクターのうちの1つ以上は、ヒトアデノウイルスに由来し得る。このようなヒト由来アデノウイルスの例は、Ad1、Ad2、Ad4、Ad5、Ad6、Ad11、Ad24、Ad26、Ad34、Ad35、Ad48、特に、Ad5、Ad11及びAd35である。ヒト及び非ヒトアデノウイルス血清型は、いくつかの生物学的、化学的、免疫学的及び構造的基準に基づいて、6つの亜族(A~F)に分類されている。
Ad5ベースのベクターがいくつかの遺伝子治療試験で広く使用されているが、一般集団には自然感染による免疫が既に存在しているため、Ad5及び他のヒトグループCアデノウイルスベクターの使用には制限がある場合がある。Ad5及び他のヒトグループCメンバーは、最優勢血清型(most seroprevalent serotypes)に含まれる傾向にある。存在するベクターに対する免疫は、治療中のベクターへの曝露の結果として発生し得る。優勢血清型ベクター(seroprevalent vectors)に対する、これらの種類の既存の又は発生した免疫は、遺伝子療法又はワクチン接種の努力の有効性を制限し得る。よって、代わりとなるアデノウイルス血清型が、宿主の免疫応答を回避することが可能な遺伝子送達システムの追求において極めて重要な標的を構成する。
このような代替血清型の1領域は、非ヒト霊長類に由来するもの、特に、チンパンジー、ボノボ及びゴリラから単離されるアデノウイルスである。2種類のチンパンジーアデノウイルスのゲノムについて記載している米国特許第6,083,716号を参照されたい。
非ヒトサルアデノウイルスベクターは、ヒトアデノウイルスベクターと同じくらい効率的に導入遺伝子産物に対する強い免疫応答を誘導することが示されている(Fitzgeraldら(2003) J. Immunol. 170:1416頁;Collocaら(2012) Science Translational Medicine 4:1~9頁;Royら(2004) Virology 324:361~372頁;Royら(2010) J. of Gene Medicine 13:17~25頁)。
非ヒトサルアデノウイルスは、動物の腸間膜リンパ節又は糞便から単離することができ、HEK 293細胞においてインビトロで複製することができる。これらの類似性にもかかわらず、非ヒトサルアデノウイルスは、より一般的なヒト血清型(Ad2及びAd5)とは系統発生学的及び免疫学的に異なる。
よって、一実施形態では、アデノウイルスベクターの1つ以上は、非ヒト霊長類アデノウイルス、例えば、チンパンジーアデノウイルス、例えば、血清型ChAd3、ChAd63、ChAd83、ChAd155、Pan5、Pan6、Pan7(C7とも称される)及びPan9から選択されるものに由来し得る。具体的には、ウイルスは、非ヒトアデノウイルス、例えば、サルアデノウイルス、特に、チンパンジーアデノウイルス、例えば、ChAd155、Pan 5、6、7又は9であり得る。このような系統の例は、US20040241181(WO03/000283)に記載されており、アメリカン・タイプ・カルチャー・コレクション(American Type Culture Collection、10801 University Boulevard、Manassas、Va. 20110~2209頁)、及び他の供給源から入手可能である。望ましいチンパンジーアデノウイルス系統としては、Pan 5 [ATCC VR-591]、Pan 6 [ATCC VR-592]、及びPan 7 [ATCC VR-593]が挙げられる。あるいは、アデノウイルスベクターは、非ヒトサルアデノウイルス由来、ボノボ由来、例えば、PanAd1、PanAd2又はPanAd3であってもよい。本明細書に記載のこのようなベクターの例は、例えば、US20110217332(WO2005/071093)、US2012/0027788(WO2010/086189)及びWO2016/198621に見出すことができる。
非ヒトサルアデノウイルスの使用は、標的集団におけるアデノウイルスに対する既存の免疫が低く低頻度であること、特に、交差中和抗体が欠如していることが理由で、ヒトアデノウイルス血清型の使用よりも有利であると考えられる。チンパンジーアデノウイルスと既存の中和抗体応答ととの交差反応は、特定の候補ヒトアデノウイルスベクターの場合の35%と比較して、標的集団の2%のみに存在する。Pan 6は、Pan 5、7及び9との関連性がより低い。
本発明のアデノウイルスは複製欠損型であり得る。これは、野生型ウイルスと比較して、非相補性細胞において複製する能力が低減していることを意味する。これは、ウイルスを変異させることによって、例えば、複製に関与する遺伝子を欠失させること、例えば、E1a、E1b、E3又はE4遺伝子の欠失によって、もたらされ得る。
本発明に従ったアデノウイルスベクターは、機能的E1欠失を含む複製欠損型アデノウイルスに由来し得る。よって、本発明によるアデノウイルスベクターは、アデノウイルスE1a及びE1bを発現する能力が存在しないため、すなわち、E1a及びE1bが機能的に欠失されているため、複製欠損型であり得る。組換えアデノウイルスはまた、他の遺伝子に機能的欠失を有してもよく[例えば、US20040241181(WO03/000283)を参照されたい]、例えば、E3又はE4遺伝子に欠失を有してもよい。アデノウイルス遅延型初期遺伝子E3は、組換えウイルスの一部を形成するアデノウイルス配列から排除され得る。E3の機能は、組換えアデノウイルス粒子の生成に必要ではない。よって、本発明において有用な組換えアデノウイルスをパッケージングするために、この遺伝子産物の機能を置き換える必要はない。特定の一実施形態では、組換えアデノウイルスは、E1及びE3遺伝子が機能的に欠失されている。このようなベクターの構築は、Royら、(2004) Human Gene Therapy 15:519~530頁に記載されている。
組換えアデノウイルスはまた、E4 ORF6機能を保持することが望ましい場合があるが、E4遺伝子の機能的欠失を有するように構築することができる。本発明によるアデノウイルスベクターはまた、遅延型初期遺伝子E2aに欠失を含有してもよい。欠失はまた、アデノウイルスゲノムの後期遺伝子L1~L5のいずれかにおいてなされ得る。同様に、中間遺伝子IX及びIVaにおける欠失も有用であり得る。
他の欠失が、アデノウイルスの他の構造遺伝子又は非構造遺伝子においてなされてもよい。上記の欠失は個々に使用することができ、すなわち、本発明において使用するためのアデノウイルス配列は、E1のみの欠失を含有してもよい。あるいは、生物学的活性を破壊するのに有効な遺伝子の全体又はその一部の欠失を任意の組み合わせで使用してもよい。例えば、1つの例示的なベクターにおいて、アデノウイルス配列は、E1遺伝子及びE4遺伝子の欠失、又はE1、E2a及びE3遺伝子の欠失、又はE1及びE3遺伝子の欠失(例えば、E1a及びE1bの機能的欠失、並びにE3の少なくとも一部の欠失)、又はE3の欠失を伴う若しくは伴わないE1、E2a及びE4遺伝子の欠失などを有してもよい。このような欠失は、これらの遺伝子の部分的又は完全な欠失であってもよく、所望の結果を達成するために、他の変異、例えば、温度感受性変異と組み合わせて使用してもよい。本発明において使用するアデノウイルスベクターとしては、PanAd3(WO2010/086189)及びChAd155(WO2016/198621)が挙げられる。
別の実施形態では、ウイルスベクターはポックスウイルスベクターである。具体的な実施形態では、ポックスウイルスベクターは、ワクシニアウイルスベクター、例えば、改変ワクシニアアンカラウイルス(MVA)ベクターである。(MVA)ベクターは、ヒト及び他の哺乳動物において複製欠損型である。これは、ニワトリ胚線維芽(CEF)細胞における570回を超えるワクシニアウイルスの継代によって、天然痘ワクチン接種の安全性を改善するために最初に開発され、複数の、完全に特徴付けられた欠失をもたらし、その後、ウイルスは、ヒト及び他の哺乳動物において非常に弱毒化され、複製欠損型であった。複製欠損は、ビリオンアセンブリーの後期で起こり、その結果、ウイルス及び組換え遺伝子の発現が損なわれず、MVAが、哺乳動物において感染を引き起こすことができない有効なシングルラウンド発現ベクターとなる。
その後、MVAは、動物モデルとヒトの両方において、導入遺伝子に対して抗原特異的免疫を誘導するウイルスベクターとして広く使用されている。MVAについての説明は、Mayr Aらの、「The smallpox vaccination strain MVA: marker, genetic structure, experience gained with the parenteral vaccination and behavior in organisms with a debilitated defense mechanism.「Abstammung, Eigenschaften und Verwendung des attenuierten Vaccinia-Stammes MVA.」Zentralbl Bakteriol B. 1978 Dec;167(5-6):375~90頁及びMayr, A.、Hochstein-Mintzel, V. & Stickl, H.(1975). Infection 3、6~14頁において見出すことができる。
一実施形態では、MVAは、CEF細胞でのワクシニアウイルスの571回目の継代から得られたウイルスシードバッチ460MGに由来する。さらなる実施形態では、MVAは、1978年12月31日より前に派生させるか又は生産したものであり、プリオンの夾雑を含まない。
MVAベクター及びこのようなベクターの生成方法は、例えば、米国特許第6,761,893号(WO02/042480);米国特許第7,964,395号;米国特許第7,964,396号;米国特許出願公開第US2013/0183335号(WO2012/048817);及び米国特許出願公開第2015/0209421号(WO2014/019718)に記載されている。前述のそれぞれは、好適なMVAベクター及び方法を教示するために、参照により本明細書に組み込まれる。
別の実施形態では、ウイルスベクターは、アルファウイルスベクター、例えば、アルファウイルスレプリコン又は他の自己複製RNAベクターである。本明細書に開示されている免疫原性組合せ物との関連において使用するのに好適な、例示的なアルファウイルスベクター及びそれらの生成及び送達方法は、例えば、US20090104226(WO2006078294);US20110300205(WO2011005799);US20130195968(WO2012/006376);US20130177639(WO2012006377);WO2013006838;及びWO2013006842に記載されており、これらの各々は、開示された免疫原性組合せ物との関連において好適な例示的な自己複製RNAベクターの開示のために、本明細書に組み込まれる。
本発明のEBV抗原を発現する組換えウイルス粒子を生成する方法であって、宿主細胞において本明細書に記載のベクターを発現させることを含む方法も提供される。ウイルス粒子は、ウイルスベクターが複製することが可能である任意の好適な細胞株において生成することができる。
アデノウイルスベクターは、ウイルスが複製することが可能である任意の好適な細胞株において生成することができる。特に、複製特性の欠損をもたらす、ウイルスベクターから失われている因子(例えば、E1及び/又はE4)を供給する相補性細胞株を使用することができる。限定されないが、このような細胞株は、とりわけ、HeLa[ATCCアクセッション番号CCL 2]、A549[ATCCアクセッション番号CCL 185]、HEK 293、KB[CCL 17]、Detroit[例えば、Detroit 510、CCL 72]及びWI-38[CCL 75]細胞であり得る。これらの細胞株は、すべてアメリカン・タイプ・カルチャー・コレクション、10801 University Boulevard、Manassas、Va. 20110~2209頁から入手可能である。他の好適な親細胞株は、他の供給源、例えば、応用微生物学研究センター(Centre for Applied Microbiology and Research(CAMR、UK))のヨーロッパ動物細胞培養物コレクション(European Collection of Animal Cell Cultures(ECACC))にECACC番号96022940で寄託された細胞によって代表されるPER.C6細胞、又はHer 96細胞(Crucell社)から得ることができる。
特に好適な相補性細胞株は、Procell92細胞株である。Procell92細胞株は、ヒトホスホグリセレートキナーゼ-1(PGK)プロモーターの制御下のTetリプレッサー、及びG418耐性遺伝子をトランスフェクトされた、アデノウイルスE1遺伝子を発現するHEK293細胞をベースとする(Vitelliら PLOS One(2013) 8(e55435):1~9頁)。Procell92.Sは、浮遊条件での増殖にも適応し、毒性タンパク質を発現するアデノウイルスベクターを生成するのにも有用である(www.okairos.com/e/inners.php?m=00084、最終アクセス日2015年4月13日)。
ワクシニアベクターは、当技術分野に記載の方法に従って生成することができる。例えば、MVAベクターの調製及び使用は、Ourmanovら、J. Virol.(2009) 83:5388~5400頁;及びMartinonら Vaccine(2008) 26:532~545頁に記載されている。
組成物
本明細書に記載のEBV抗原ポリペプチド、ポリヌクレオチド及びベクターは、免疫原性組成物において投与され得る。本明細書に記載されている免疫原性組成物は、哺乳動物、好適には、ヒトへの送達の後に、免疫応答、例えば、液性(例えば、抗体)及び/又は細胞媒介性(例えば、細胞傷害性T細胞)応答を誘導することが可能である1つ以上の組換えポリペプチド、ポリヌクレオチド及び/又はベクターを含む組成物である。
本明細書に記載のEBV抗原ポリペプチド、ポリヌクレオチド及びベクターは、免疫原性組成物において投与され得る。本明細書に記載されている免疫原性組成物は、哺乳動物、好適には、ヒトへの送達の後に、免疫応答、例えば、液性(例えば、抗体)及び/又は細胞媒介性(例えば、細胞傷害性T細胞)応答を誘導することが可能である1つ以上の組換えポリペプチド、ポリヌクレオチド及び/又はベクターを含む組成物である。
本明細書に開示されている免疫原性組成物は、典型的には、1つ以上の薬学的に許容される担体及び/又は賦形剤を含有する。薬学的に許容される担体及び賦形剤は周知であり、当業者によって選択され得る。形容詞「薬学的に許容される」は、指示対象が対象(例えば、ヒト又は動物対象)への投与に好適であることを示す。E. W. MartinによるRemington's Pharmaceutical Sciences、Mack Publishing Co.、Easton、Pa.、第15版(1975)は、免疫原性組成物を含む、治療用及び/又は予防用組成物の薬学的送達に好適な組成物及び製剤(希釈剤を含む)を記載している。
例えば、担体又は賦形剤は、好ましくは、緩衝剤を含むことができる。場合により、担体又は賦形剤はまた、溶解性及び/又は安定性を安定化させる少なくとも1つの構成成分を含有する。可溶化剤/安定化剤の例としては、界面活性剤、例えば、ラウロイルサルコシン及び/又はトゥイーンが挙げられる。代わりとなる可溶化剤/安定剤としては、アルギニン、及びガラス形成ポリオール(例えば、スクロース、トレハロースなど)が挙げられる。数多くの薬学的に許容される担体及び/又は薬学的に許容される賦形剤が当技術分野で公知であり、例えば、E. W. MartinによるRemington's Pharmaceutical Sciences、Mack Publishing Co.、Easton、Pa、第5版(1975)に記載されている。
したがって、好適な賦形剤及び担体は、選択された投与経路で対象に送達するのに好適な製剤を製造するために、当業者によって選択され得る。
好適な賦形剤としては、限定されないが、以下が挙げられる:グリセロール、ポリエチレングリコール(PEG)、ソルビトール、トレハロース、N-ラウロイルサルコシンナトリウム塩、L-プロリン、非界面活性剤スルホベタイン、塩酸グアニジン、尿素、トリメチルアミンオキシド、KCl、Ca2+、Mg2+、Mn2+、Zn2+及び他の二価カチオン関連塩、ジチオトレイトール、ジチオエリトロール(Dithioerytrol)、並びに13-メルカプトエタノール。他の賦形剤は、界面活性剤(Tween80、Tween20、Triton X-00、NP-40、Empigen BB、オクチルグルコシド、ラウロイルマルトシド、Zwittergent 3-08、Zwittergent 3-0、Zwittergent 3-2、Zwittergent 3-4、Zwittergent 3-6、CHAPS、デオキシコール酸ナトリウム、ドデシル硫酸ナトリウム、臭化セチルトリメチルアンモニウムを含む)であり得る。
場合により、本発明の免疫原性組成物は、例えば、アジュバント、安定化剤、pH調整剤、保存剤などを含む他の構成成分を含有するよう製剤化されてもよい。好適なアジュバントの例は、以下の「アジュバント」に提供される。
使用方法
本明細書に記載のEBV抗原ポリペプチド、ポリヌクレオチド、ベクターは、EBV感染及びEBV関連疾患の予防及び/又は処置において、例えば、免疫応答の誘導のためのワクチンとして使用することができる。本明細書で使用される場合、免疫応答の誘導とは、タンパク質の、T細胞及び/又は液性免疫応答をそのタンパク質に対して誘導する能力を指す。
本明細書に記載のEBV抗原ポリペプチド、ポリヌクレオチド、ベクターは、EBV感染及びEBV関連疾患の予防及び/又は処置において、例えば、免疫応答の誘導のためのワクチンとして使用することができる。本明細書で使用される場合、免疫応答の誘導とは、タンパク質の、T細胞及び/又は液性免疫応答をそのタンパク質に対して誘導する能力を指す。
本明細書で使用される場合、免疫応答の誘導とは、「抗原」又は「免疫原」としても公知のタンパク質の、T細胞及び/又は液性免疫応答をそのタンパク質に対して誘導する能力を指す。例えば、免疫原性組成物は、特に、組成物がEBV抗原ポリペプチドをコードする配列を含む核酸を含む実施形態において、組成物による免疫化後に、未処置対象と比較して、メモリーT細胞及び/又はB細胞集団を誘導することができる。一部の実施形態では、対象は、脊椎動物、例えば、哺乳動物、例えば、ヒト又は獣医学的哺乳動物である。
免疫応答は、目的の特定のリンパ球種、例えば、B細胞、T細胞、T細胞株、及びT細胞クローンの増殖又はエフェクター機能の誘導についてのアッセイを含む、当技術分野で公知の方法によって測定することができる。
よって、一実施形態では、対象における免疫応答を誘導する方法であって、本発明のポリヌクレオチド、ポリペプチド、ベクター又は免疫原性組成物を対象に投与するステップを含む方法が提供される。一実施形態では、対象は、エプスタインバールウイルス血清陰性である。対象は、過去又は現在にEBV感染の血清学的証拠を有さない場合、「血清陰性」である。別の実施形態では、対象は、エプスタインバールウイルス血清陽性である。対象は、過去又は現在にEBV感染の血清学的証拠を有する場合に、「血清陽性」である。
また、対象におけるEBV関連疾患を処置又は予防する方法であって、本発明のポリヌクレオチド、ポリペプチド、ベクター又は免疫原性組成物を対象に投与するステップを含む方法も提供される。一実施形態では、EBV関連疾患は、EBV関連悪性腫瘍又はEBV関連自己免疫疾患である。EBV関連疾患としては、例えば、多発性硬化症、関節リウマチ及び全身性ループスエリテマトーデスが挙げられる。
また、本発明のポリヌクレオチド、ポリペプチド、ベクター又は免疫原性組成物の免疫原性を最大化するために設計された投与レジメンも提供される。よって、一実施形態では、対象における免疫応答を誘導する方法であって、本発明のポリヌクレオチド、ポリペプチド、ベクター及び/又は免疫原性組成物の2又はそれより多い用量を対象に投与するステップを含む方法も提供される。ある特定の実施形態では、投与は、1、2、3、4、5、6、7、8、9、10、11、12週又はそれより長い週数で隔てられる。別の実施形態では、投与は、1、2、3、4、5、6、7、8、9、10、11、12カ月又はそれより長い月数で隔てられる。あるいは、投与は、1、2、3、4、5、6、7、8、9、10、11、12年又はそれより長い年数で隔てられ得る。
一実施形態では、対象における免疫応答を誘導する方法であって、
(a)本発明のポリヌクレオチドを含むアデノウイルスベクターを投与するステップ、及び
(b)本発明のポリヌクレオチドを含むワクシニアウイルスベクターを投与するステップを含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法が提供される。一実施形態では、アデノウイルスベクターはChAd155である。別の実施形態では、ワクシニアウイルスベクターはMVAである。一実施形態では、ステップ(b)は、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12週後又はそれより長い週数後に行われる。一実施形態では、ステップ(b)は、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12カ月後又はそれより長い月数後に行われる。
(a)本発明のポリヌクレオチドを含むアデノウイルスベクターを投与するステップ、及び
(b)本発明のポリヌクレオチドを含むワクシニアウイルスベクターを投与するステップを含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法が提供される。一実施形態では、アデノウイルスベクターはChAd155である。別の実施形態では、ワクシニアウイルスベクターはMVAである。一実施形態では、ステップ(b)は、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12週後又はそれより長い週数後に行われる。一実施形態では、ステップ(b)は、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12カ月後又はそれより長い月数後に行われる。
一実施形態では、対象におけるEBV関連疾患を処置又は予防する方法であって、
(a)本発明のポリヌクレオチドを含むアデノウイルスベクターを投与するステップ、及び
(b)本発明のポリヌクレオチドを含むワクシニアウイルスベクターを投与するステップを含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法が提供される。一実施形態では、アデノウイルスベクターはChAd155である。別の実施形態では、ワクシニアウイルスベクターはMVAである。一実施形態では、ステップ(b)は、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12週後又はそれより長い週数後に行われる。一実施形態では、ステップ(b)は、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12カ月後又はそれより長い月数後に行われる。
(a)本発明のポリヌクレオチドを含むアデノウイルスベクターを投与するステップ、及び
(b)本発明のポリヌクレオチドを含むワクシニアウイルスベクターを投与するステップを含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法が提供される。一実施形態では、アデノウイルスベクターはChAd155である。別の実施形態では、ワクシニアウイルスベクターはMVAである。一実施形態では、ステップ(b)は、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12週後又はそれより長い週数後に行われる。一実施形態では、ステップ(b)は、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12カ月後又はそれより長い月数後に行われる。
また、エプスタインバールウイルス感染によって引き起こされる疾患の処置又は予防のための医薬の製造における、本発明のポリヌクレオチド、ベクター、ポリペプチド、又は免疫原性組成物の使用も提供される。
アジュバント
「アジュバント」は、本明細書で使用される場合、免疫原への免疫応答を増強する組成物を指す。アジュバントを含む本発明による組成物は、例えばヒト対象に対して、ワクチンとして使用することができる。アジュバントは、抗原単独での投与と比較して、抗原/免疫原に対する免疫応答を加速し、延長し並びに/又はその質及び/若しくは強度を増強し、よって、任意の所与のワクチンに必要とされる抗原/免疫原の量、及び/又は目的の抗原/免疫原に対する適切な免疫応答を生じさせるために必要とされる注射の頻度を低減する。
「アジュバント」は、本明細書で使用される場合、免疫原への免疫応答を増強する組成物を指す。アジュバントを含む本発明による組成物は、例えばヒト対象に対して、ワクチンとして使用することができる。アジュバントは、抗原単独での投与と比較して、抗原/免疫原に対する免疫応答を加速し、延長し並びに/又はその質及び/若しくは強度を増強し、よって、任意の所与のワクチンに必要とされる抗原/免疫原の量、及び/又は目的の抗原/免疫原に対する適切な免疫応答を生じさせるために必要とされる注射の頻度を低減する。
本発明の組成物との関連で使用され得るアジュバントの例としては、無機アジュバント(例えば、無機金属塩、例えば、リン酸アルミニウム又は水酸化アルミニウム)、水酸化アルミニウム(アラム(alum))のゲル状沈殿;AlPO4;アルハイドロゲル;グラム陰性細菌の外膜に由来する細菌産物、特に、モノホスホリルリピドA(MPLA)、リポ多糖類(LPS)、ムラミルジペプチド及びその誘導体;フロイント不完全アジュバント;リポソーム、特に、中性リポソーム、組成物及び場合によりサイトカインを含有するリポソーム;AS01B、AS01E、AS02;非イオン性ブロック共重合体;ISCOMATRIXアジュバント;CpGジヌクレオチド(CpGモチーフ)、特に、ホスホロチオエート(PTO)骨格(CpG PTO ODN)又はホスホジエステル(PO)骨格(CpG PO ODN)を有するCpG ODNを含む非メチル化DNA;合成リポペプチド誘導体、特に、Pam3Cys;リポアラビノマンナン;ペプチドグリカン;ザイモサン;熱ショックタンパク質(HSP)、特に、HSP 70;dsRNA及びその合成誘導体、特に、Poly I:poly C;ポリカチオン性ペプチド、特に、ポリ-L-アルギニン;タキソール;フィブロネクチン;フラジェリン;イミダゾキノリン;アジュバント活性を有するサイトカイン、特に、GM-CSF、インターロイキン-(IL-2、IL-6、IL-7、IL-18、I型及びII型インターフェロン、特に、インターフェロン-ガンマ、TNF-アルファ;25-ジヒドロキシビタミンD3(カルシトリオール);並びに合成オリゴペプチド、特に、MHCII提示ペプチドが挙げられる。ポリオキシエチレン(POE)及びポリオキシプロピレン(POP)を含有する非イオン性ブロック重合体、例えば、POE-POP-POEブロック共重合体を、アジュバントとして使用することができる。
アジュバントのさらなる例としては、無機アジュバント(例えば、無機金属塩、例えば、リン酸アルミニウム又は水酸化アルミニウム)、有機アジュバント(例えば、サポニン、例えば、QS21、又はスクアレン)、オイルベースのアジュバント(例えば、フロイント完全アジュバント及びフロイント不完全アジュバント)、サイトカイン(例えば、IL-1β、IL-2、IL-7、IL-12、IL-18、GM-CFS、及びINF-γ)粒子状アジュバント(例えば、免疫刺激複合体(ISCOMS)、リポソーム、生分解性マイクロスフェア)、ビロソーム、細菌性アジュバント(例えば、モノホスホリルリピドA、例えば、3-de-O-アシル化モノホスホリルリピドA(3D-MPL)、又はムラミルペプチド)、合成アジュバント(例えば、モノホスホリルリピドA(MPL)、特に、3-de-O-アシル化モノホスホリルリピドA(3D-MPL及びムラミルペプチド類似体、又は合成リピドA、及び合成ポリヌクレオチドアジュバント、例えば、ポリアルギニン又はポリリジンが挙げられる。
サポニンもまた好適なアジュバントであり、例えば、サポニンQuil A(南米の樹木シャボンノキ(Quillaja Saponaria Molina)の樹皮に由来する)、及びその画分がある。Quil Aの精製画分はまた、免疫刺激剤、例えば、スクアレン、QS21、QS17及びQS7(Quil-Aの非溶血性画分)としても知られている。QS21及びポリソルベート又はシクロデキストリンの組合せもまた好適である。
アジュバントの別の例は、DNA中に存在する非メチル化シトシン-グアノシンジヌクレオチドモチーフを含有する免疫刺激性オリゴヌクレオチド(「CpG」)である。CpGは、全身経路と粘膜経路のいずれでも投与される場合にアジュバントとして知られている。CpGは、ワクチン中に製剤化される場合、遊離抗原と一緒に自由溶液中で投与されてもよく、抗原に共有結合的にコンジュゲートされてもよく、又は担体、例えば、水酸化アルミニウムとともに製剤化されてもよい。
特異的受容体の活性化は、免疫応答を刺激することができる。このような受容体は、当業者に公知であり、例えば、サイトカイン受容体、特に、I型サイトカイン受容体、II型サイトカイン受容体、TNF受容体;並びに転写因子として作用するビタミンD受容体;並びにToll様受容体1(TLR1)、TLR-2、TLR3、TLR4、TLR5、TLR-6、TLR7、及びTLR9を含む。このような受容体に対するアゴニストは、アジュバント活性を有する、すなわち、免疫刺激性である。他の好適なアジュバントとしては、アルキルグルコサミニドホスフェート(AGP)又はAGPの薬学的に許容される塩が挙げられる。いくつかのAGPはTLR4アゴニストであり、いくつかはTLR4アンタゴニストである。本発明の組成物のアジュバントは、1つ以上のToll様受容体アゴニストであってもよい。より好ましい実施形態では、アジュバントは、Toll様受容体4アゴニストである。特に好ましい実施形態では、アジュバントは、Toll様受容体9アゴニストである。
アジュバント、例えば、上記のものは、担体、例えば、リポソーム、水中油エマルション、及び/又は金属塩(アルミニウム塩、例えば、水酸化アルミニウムを含む)と一緒に製剤化されてもよい。例えば、3D-MPLは、水酸化アルミニウム又は水中油エマルションとともに製剤化されてもよく、QS21は、コレステロール含有リポソーム、水中油エマルション又はアラム(alum)とともに製剤化されてもよく、CpGは、アラム(alum)とともに又は他のカチオン性担体とともに製剤化されてもよい。
アジュバントの組合せ、特に、モノホスホリルリピドAとサポニン誘導体の組合せ、より特別には、QS21と3D-MPLの組合せ又はQS21がコレステロール含有リポソーム中でクエンチされる組成物(DQ)は、本発明において利用することができる。あるいは、サポニン、例えば、QS21を加えたCpGの組合せは、水中油エマルション中にQS21、3D-MPL及びトコフェロールを含む強力なアジュバント製剤と同様に、本発明における使用に好適なアジュバントである。サポニンアジュバントは、リポソーム中に製剤化され、免疫刺激性オリゴヌクレオチドと組み合わされてもよい。よって、好適なアジュバント系としては、例えば、モノホスホリルリピドA、好ましくは3D-MPLの、アルミニウム塩との組合せが挙げられる。さらなる例示的なアジュバントは、QS21及び/又はMPL及び/又はCpGを含む。QS21は、コレステロール含有リポソーム中でクエンチされ得る。
ワクチン接種のために使用される発現系に含まれる抗原へのMHCクラスII不変鎖(CD74としても知られている)の融合は、ウイルスベクター、例えば、アデノウイルスを用いて投与された場合に、前記抗原に対する免疫応答を増加させる。したがって、本発明の一実施形態では、免疫原性導入遺伝子は、組換えChAd155ウイルスベクターにおいて不変鎖と共発現され得る。
別の実施形態では、本発明は、対象にChAd155カプシドを送達することによって、免疫調節応答を誘導するための、又は別の活性剤に対する細胞傷害性T細胞応答を増強するか又はそれに対するアジュバントとなるためのChAd155のカプシドの使用を提供する(場合により、インタクトな若しくは組換えウイルス粒子又は空のカプシドが使用される)。ChAd155カプシドは、単独で又は活性剤との併用レジメンにおいて、それに対する免疫応答を増強するために送達され得る。有利には、宿主にアデノウイルスを感染させることなく、望ましい効果が達成され得る。
配列同一性
配列に関する同一性は、配列を整列させ、必要であれば、最大のパーセント配列同一性を達成するためにギャップを導入した後、いずれの保存的置換も配列同一性の一部として考慮せずに、参照アミノ酸配列と同一である候補配列におけるアミノ酸残基の百分率として、本明細書において定義される。
配列に関する同一性は、配列を整列させ、必要であれば、最大のパーセント配列同一性を達成するためにギャップを導入した後、いずれの保存的置換も配列同一性の一部として考慮せずに、参照アミノ酸配列と同一である候補配列におけるアミノ酸残基の百分率として、本明細書において定義される。
配列同一性は、2つのポリペプチドのアミノ酸の位置における類似性を比較するために一般的に使用される標準的な方法により決定することができる。コンピュータープログラム、例えば、BLAST又はFASTAを使用して、2つのポリペプチドを、それらのそれぞれのアミノ酸の最適なマッチングのために整列させる(一方若しくは両方の配列の全長に沿って又は一方若しくは両方の配列の所定の部分に沿って)。これらのプログラムは、デフォルトオープンペナルティ及びデフォルトギャップペナルティを提供し、スコアリングマトリックス、例えば、PAM250(標準的なスコアリングマトリックス)がそのコンピュータープログラムとともに使用され得る。例えば、パーセント同一性は、同一一致の総数に100を掛け、次いで、一致した範囲内のより長い配列の長さと2つの配列を整列させるためにより短い配列中に導入されたギャップの数との合計で割ったものとして計算することができる。
本開示が、UniProt又はGenbankアクセッションコードを参照して配列に言及する場合、言及された配列は、本出願の出願日の現行のバージョンである。
単一のアミノ酸又は少しのパーセンテージのアミノ酸を変更、追加又は欠失する、タンパク質に対する個別の置換、欠失又は付加は、その変更(複数可)が機能的に類似するアミノ酸によるアミノ酸の置換又は免疫原性機能に実質的に影響を与えない残基の置換/欠失/付加をもたらす場合、「免疫原性誘導体」であることを当業者は認識する。
機能的に類似するアミノ酸を提供する保存的置換表は、当技術分野で周知である。一般的に、このような保存的置換は、以下に指定したアミノ酸グループの一つに該当することになるが、状況によっては、他の置換が、抗原の免疫原特性に実質的に影響を及ぼすことなく可能である場合もある。以下の8つの群はそれぞれ、一般的に互いに保存的置換であるアミノ酸を含有する:
1)アラニン(A)、グリシン(G);
2)アスパラギン酸(D)、グルタミン酸(E);
3)アスパラギン(N)、グルタミン(Q);
4)アルギニン(R)、リシン(K);
5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、バリン(V);
6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W);
7)セリン(S)、トレオニン(T);及び
8)システイン(C)、メチオニン(M)。
1)アラニン(A)、グリシン(G);
2)アスパラギン酸(D)、グルタミン酸(E);
3)アスパラギン(N)、グルタミン(Q);
4)アルギニン(R)、リシン(K);
5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、バリン(V);
6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W);
7)セリン(S)、トレオニン(T);及び
8)システイン(C)、メチオニン(M)。
好適には、このような置換はエピトープ領域に起こらず、したがって、抗原の免疫原特性に大きな影響はない。
免疫原性誘導体は、参照配列と比較して追加のアミノ酸が挿入されているものも含み得る。好適には、このような挿入はエピトープ領域に起こらず、したがって、抗原の免疫原特性に大きな影響はない。挿入の一つの例には、問題の抗原の発現及び/又は精製を補助するヒスチジン残基の短いストレッチ(例えば、2~6残基)が含まれる。
免疫原性誘導体は、参照配列と比較してアミノ酸が欠失しているものを含む。好適には、このような欠失はエピトープ領域に起こらず、したがって、抗原の免疫原特性に大きな影響はない。
当業者は、特定の免疫原性誘導体が、置換、欠失及び付加(又はそれらの任意の組合せ)を含んでもよいことを認識することになる。
全般
別段に説明されなければ、本明細書で使用されるすべての技術及び化学用語は、本開示が属する技術分野の当業者によって通常理解されるのと同じ意味を有する。単数の用語「a」、「an」、及び「the」は、文脈が別段に明確に示していなければ、複数の対象を含む。同様に、「又は」という語は、文脈が別段に明確に示していなければ、「及び」を含むことが意図される。「複数」という用語は、2つ又はそれより多いことを指す。さらに、物質の濃度又はレベル、例えば、溶液構成成分の濃度又はその比率に関して与えられる数値限定、及び反応条件、例えば、温度、圧力及びサイクル数は、およそであることが意図される。本明細書で使用される「約」という用語は、量±10%を意味することが意図される。
別段に説明されなければ、本明細書で使用されるすべての技術及び化学用語は、本開示が属する技術分野の当業者によって通常理解されるのと同じ意味を有する。単数の用語「a」、「an」、及び「the」は、文脈が別段に明確に示していなければ、複数の対象を含む。同様に、「又は」という語は、文脈が別段に明確に示していなければ、「及び」を含むことが意図される。「複数」という用語は、2つ又はそれより多いことを指す。さらに、物質の濃度又はレベル、例えば、溶液構成成分の濃度又はその比率に関して与えられる数値限定、及び反応条件、例えば、温度、圧力及びサイクル数は、およそであることが意図される。本明細書で使用される「約」という用語は、量±10%を意味することが意図される。
「含む(comprises)」という用語は、「含む(includes)」を意味する。よって、文脈が別段に要求しなければ、「含む(comprises)」という語、及び変形、例えば、「含む(comprise)」及び「含む(comprising)」は、記載された化合物若しくは組成物(例えば、核酸、ポリペプチド、抗原)又はステップ、あるいは化合物又はステップの群を含むことを意味すると理解されることになるが、任意の他の化合物、組成物、ステップ、又はその群を排除するものではない。「例えば、(e.g.)」という略語は、ラテン語のexempli gratiaに由来し、非限定的な例を示すために、本明細書で使用される。よって、「例えば、(e.g.)」という略語は、「例えば、(for example)」という用語と同義である。
本発明は、以下の非限定的な実施例及び図面への参照によってさらに説明される。
[実施例1]
抗原の設計
a.EBV抗原の設計
多価エプスタインバールウイルス抗原構築物を、以下の設計目標を念頭において合理的に設計した:
1)設計において、複数の潜伏段階の抗原を含むこと、及び場合により溶解性段階の抗原を含むことによって、EBV関連多発性硬化症(EBV-MS)において発現されるEBV抗原を広く標的とすること、
2)問題のあることが知られている領域の排除、多価抗原構築物におけるEBVタンパク質抗原の断片化及びシャッフリングにより、発癌及び免疫干渉のリスクを低減すること、
3)多価抗原構築物にT細胞エピトープを含むことによって、誘導される免疫応答の焦点をEBV特異的T細胞活性化に合わせること、並びに
4)最終的な抗原配列において、望ましくない抗自己ネオエピトープの存在を排除すること。
抗原の設計
a.EBV抗原の設計
多価エプスタインバールウイルス抗原構築物を、以下の設計目標を念頭において合理的に設計した:
1)設計において、複数の潜伏段階の抗原を含むこと、及び場合により溶解性段階の抗原を含むことによって、EBV関連多発性硬化症(EBV-MS)において発現されるEBV抗原を広く標的とすること、
2)問題のあることが知られている領域の排除、多価抗原構築物におけるEBVタンパク質抗原の断片化及びシャッフリングにより、発癌及び免疫干渉のリスクを低減すること、
3)多価抗原構築物にT細胞エピトープを含むことによって、誘導される免疫応答の焦点をEBV特異的T細胞活性化に合わせること、並びに
4)最終的な抗原配列において、望ましくない抗自己ネオエピトープの存在を排除すること。
これらの基準に合致する2つの多価EBV抗原構築物を設計した。第1の多価抗原構築物(EBV-L;図2A)は、潜伏段階のEBVタンパク質LMP1、LMP2、EBNA1及びEBNA3Aの免疫原性断片を含む。第2の構築物(EBV-LLy;図2B)は、EBV-Lと同じ潜伏抗原断片を含有し、EBV溶解性タンパク質ZEBRAの免疫原性断片も含む。抗原構築物に含まれるために選択されたEBV潜伏タンパク質は、多発性硬化症患者の死後の脳組織におけるB細胞によって発現されることが報告されている(Serafiniら、J. Exp. Medicine(2007) 204(12):2899頁;Serafiniら、J. Neuropathol. Exp. Neurol.(2010) 69(7):677頁。潜伏期から溶解性期へのEBVの切り替えの重要な調節因子である溶解性抗原ZEBRAを含むことは、ウイルスの再活性化を制御すること並びにEBVのさらなる増幅及び広がりを制限することを目的とする。
全長EBVタンパク質は、免疫細胞を形質転換する能力を有する。したがって、抗原構築物の安全性を改善するために、問題のある領域を排除し、EBVタンパク質の残っている断片のみを構築物設計のために選択した。図1は、EBVタンパク質のそれぞれにおける選択された免疫原性断片の位置を示す。図2A~Bに示されているように、選択された断片は、シャッフリングされて、同じEBVタンパク質に由来する断片が互いに隣接しないようにアセンブルされた16(EBV-L)又は18(EBV-LLy)免疫原性断片を含むポリタンパク質を生じた。
最終的に、2個の免疫原性断片を一緒に接合することによって形成される望ましくない接合部エピトープのリスクを低減するために、バイオインフォマティクススクリーニングを行い、候補抗原構築物の接合部領域における潜在的な抗自己ネオエピトープを特定した。簡潔には、2個の連続する抗原断片の各対の間の境界(接合)領域をまたぐ16アミノ酸長のペプチドを、ワクチンポリペプチド配列から抽出した(各抗原断片から8アミノ酸)。接合領域の16アミノ酸長は、接合領域内の各9merの配列が両方の抗原に由来するアミノ酸を含有することを保証する。各16merの接合ペプチドについて、次いで、9merのペプチドすべてを、完全ヒトプロテオームを表す9merのペプチドのコレクション(NCBI RefSeqペプチドデータベースから得た)と比較した。いずれの場合も、ワクチンポリペプチド配列の接合領域由来の9merのペプチドは、ヒトタンパク質に存在することが見出されなかった。
b.CalHV3抗原の設計
CalHV3は、一般的なコモンマーモセット(Callithrix jacchus)から単離されたガンマヘルペスウイルスである。配列及び構造、ウイルス再生サイクル及び病原性の類似性に基づいて、CalHV3は、ヒトEBVのマーモセット等価物であると考えられる。例えば、Choら、PNAS 98(3):1224~1229頁(2001)を参照されたい。CalHV3は、一生のうちの早期に獲得され、自然の及び飼育されているマーモセットのコロニーにおいて高度に蔓延していることが報告されている。
CalHV3は、一般的なコモンマーモセット(Callithrix jacchus)から単離されたガンマヘルペスウイルスである。配列及び構造、ウイルス再生サイクル及び病原性の類似性に基づいて、CalHV3は、ヒトEBVのマーモセット等価物であると考えられる。例えば、Choら、PNAS 98(3):1224~1229頁(2001)を参照されたい。CalHV3は、一生のうちの早期に獲得され、自然の及び飼育されているマーモセットのコロニーにおいて高度に蔓延していることが報告されている。
マーモセットモデルのガンマ-ヘルペスウイルスに潜伏感染した個体における潜伏及び溶解性ウイルス抗原に対する機能的T細胞応答を再度拡大する、類似するワクチンの能力を評価するために、オルソロガスなCalHV3抗原構築物を開発した。簡潔には、CalHV3潜伏抗原構築物(CalHV3-L;図4Aに示される)を、それぞれ、EBV LMP1、LMP2及びEBNA1のCalHV3オルソログである、タンパク質C1(配列番号28)、C7(配列番号32)及びORF39(配列番号36)の免疫原性断片から構築した。EBV-L抗原構築物におけるように、CalHV3-L構築物に含まれる抗原領域を断片化し、同じCalHV3タンパク質由来の断片が互いに隣接しないようにシャッフリングした。最終的なCalHV3-L抗原構築物のアミノ酸配列を配列番号44に示す(配列番号45に示されるポリヌクレオチドによってコードされる)。
CalHV3潜伏/溶解性抗原構築物(CalHV3-LLy;図4Bに示される)も構築した。潜伏タンパク質C1、C7及びORF39の断片を含有することに加えて、CalHV3-LLyは、EBVのZEBRAタンパク質のCalHV3オルソログであるORF43の断片も含有する。最終的なCalHV3-LLy抗原構築物のアミノ酸配列を配列番号46に示す(配列番号47に示されるポリヌクレオチドによってコードされる)。
最終的に、マーモセットのMHCクラスII関連不変鎖ポリペプチド(配列番号43)をCalHV3-LLyのN末端に融合させることによって、遺伝的にアジュバント化された
CalHV3-LLy(li-CalHV3-LLy)のバージョンを構築した。最終的なli-CalHV3-LLy抗原構築物のアミノ酸配列を配列番号48に示す(配列番号49に示されるポリヌクレオチドによってコードされる)。
CalHV3-LLy(li-CalHV3-LLy)のバージョンを構築した。最終的なli-CalHV3-LLy抗原構築物のアミノ酸配列を配列番号48に示す(配列番号49に示されるポリヌクレオチドによってコードされる)。
[実施例2]
ベクターの構築
EBV-L(配列番号25)及びEBV-LLy(配列番号27)をコードするポリヌクレオチドを、WO2016/198621に記載された方法に従って、tetOhCMVプロモーター及びウシ成長ホルモンポリアデニル化シグナル(BGH pA)を含有する、プラスミドpvjTetOhCMV-bghpolyA中にクローニングした。次いで、EBV-L及びEBV-LLy発現カセットを、大腸菌(E. coli)のBJ5183コンピテント細胞における相同組換えによってChAd155ベクター骨格へと移入し、pChAd155(ΔE1、ΔE4_Ad5E4 orf6) TetO hCMV-EBV-L(及びEBV-LLy)ベクターを生成した。ベクターpChAd155(ΔE1、ΔE4_Ad5E4 orf6) TetO hCMV-EBV-Lの核酸配列を配列番号50に示す。抗原コード領域は、配列番号50のヌクレオチド1348~4806にある。ベクターpChAd155(ΔE1、ΔE3、ΔE4_Ad5E4 orf6) TetO hCMV-EBV-LLy発現ベクターの核酸配列を配列番号51に示す。抗原コード領域は、配列番号51のヌクレオチド1348~5157にある。ChAd155-EBVベクターの構築を、導入遺伝子のシーケンシング及び制限解析によって確認した。同じ方法を使用して、例えば、WO2016/198621に記載されているように、代替の改変ChAd155骨格に基づいてEBVアデノウイルスベクターを調製することができる。
ベクターの構築
EBV-L(配列番号25)及びEBV-LLy(配列番号27)をコードするポリヌクレオチドを、WO2016/198621に記載された方法に従って、tetOhCMVプロモーター及びウシ成長ホルモンポリアデニル化シグナル(BGH pA)を含有する、プラスミドpvjTetOhCMV-bghpolyA中にクローニングした。次いで、EBV-L及びEBV-LLy発現カセットを、大腸菌(E. coli)のBJ5183コンピテント細胞における相同組換えによってChAd155ベクター骨格へと移入し、pChAd155(ΔE1、ΔE4_Ad5E4 orf6) TetO hCMV-EBV-L(及びEBV-LLy)ベクターを生成した。ベクターpChAd155(ΔE1、ΔE4_Ad5E4 orf6) TetO hCMV-EBV-Lの核酸配列を配列番号50に示す。抗原コード領域は、配列番号50のヌクレオチド1348~4806にある。ベクターpChAd155(ΔE1、ΔE3、ΔE4_Ad5E4 orf6) TetO hCMV-EBV-LLy発現ベクターの核酸配列を配列番号51に示す。抗原コード領域は、配列番号51のヌクレオチド1348~5157にある。ChAd155-EBVベクターの構築を、導入遺伝子のシーケンシング及び制限解析によって確認した。同じ方法を使用して、例えば、WO2016/198621に記載されているように、代替の改変ChAd155骨格に基づいてEBVアデノウイルスベクターを調製することができる。
同じ方法を続けて、ベクターChAd155-CalHV3-L、ChAd155-CalHV3-LLy、及びChAd155-li-CalHV3-LLy(それぞれ、CalHV3抗原CalHV3-L、CalHV3-LLy、及びli-CalHV3-LLyをコードする)を調製した。ベクターpChAd155(ΔE1、ΔE4_Ad5E4 orf6) TetO hCMV-CalHV3-Lの核酸配列を配列番号52に示す(ヌクレオチド1348~4482の抗原コード領域)。ベクターpChAd155(ΔE1、ΔE3、ΔE4_Ad5E4 orf6) TetO hCMV-CalHV3-LLyの核酸配列を配列番号53に示す(ヌクレオチド1348~5238の抗原コード領域)。ベクターpChAd155(ΔE1、ΔE3、ΔE4_Ad5E4 orf6) TetO hCMV-li-CalHV3-LLyの核酸配列を配列番号54に示す(ヌクレオチド1348~5883の抗原コード領域)。
EBV-LLy及びCalHV3-LLy抗原構築物をコードするMVAベクターもまた、当技術分野で公知の方法に従って調製した。例えば、Ourmanovら、J. Virol.(2009) 83:5388~5400頁;及びMartinonら Vaccine(2008) 26:532~545頁を参照されたい。
[実施例3]
ウイルス粒子の生成
ChAd155_EBV-L及びChAD155_EBV-LLyベクターを、Vitelliら、PLOS One(2013) 8(e55435):1~9頁に記載されているように、制限エンドヌクレアーゼPmelで直鎖化し、HEK293由来細胞株(Procell92.S)にトランスフェクトした。これらの細胞を遺伝子改変し、ウイルス生成中の導入遺伝子発現を抑制するためにTetOリプレッサーを構成的に発現させる。ウイルス増幅は小規模(振盪フラスコ)で実施し、ChAd155-EBVウイルス粒子を、1リットル規模の懸濁培養物から2倍のCsCl勾配で精製した。ChAd155-EBVウイルス粒子の力価を、tetOhCMVプロモーターを標的とするQPCRによって決定した。同じ方法を続けて、ChAd155-CalHV3-L、ChAd155-CalHV3-LLy、及びChAd155-li-CalHV3-LLyからウイルス粒子を調製した。
ウイルス粒子の生成
ChAd155_EBV-L及びChAD155_EBV-LLyベクターを、Vitelliら、PLOS One(2013) 8(e55435):1~9頁に記載されているように、制限エンドヌクレアーゼPmelで直鎖化し、HEK293由来細胞株(Procell92.S)にトランスフェクトした。これらの細胞を遺伝子改変し、ウイルス生成中の導入遺伝子発現を抑制するためにTetOリプレッサーを構成的に発現させる。ウイルス増幅は小規模(振盪フラスコ)で実施し、ChAd155-EBVウイルス粒子を、1リットル規模の懸濁培養物から2倍のCsCl勾配で精製した。ChAd155-EBVウイルス粒子の力価を、tetOhCMVプロモーターを標的とするQPCRによって決定した。同じ方法を続けて、ChAd155-CalHV3-L、ChAd155-CalHV3-LLy、及びChAd155-li-CalHV3-LLyからウイルス粒子を調製した。
EBV-LLy及びCalHV3-LLy抗原構築物を発現する組換えMVAを、標準的方法を使用して得た。簡潔には、規定の細胞密度のニワトリ胚線維芽細胞(CEF)の一次細胞培養物を、規定された感染の多重度で、MVA-EBV及びMVA-CalHV3ウイルスシードで感染させた。MVA-EBV及びMVA-CalHV3ウイルスの収集物を分画勾配遠心分離によって精製した。
[実施例4]
マウスにおけるChAd155-EBV及びChAd155-CalHV3抗原の免疫原性
a.ChAd155-EBV
潜伏又は潜伏+溶解性抗原を発現するベクターから生成したChAd155-EBVウイルス粒子の免疫原性を、表1に示す実験設計を使用してマウスにおいて評価した。簡潔には、CB6F1マウス(1群当たり6匹)に、ベクターChAd155-EBV-L又はChAd155-EBV-LLyの単回用量(106、107又は108ウイルス粒子、筋肉内に)を投与した。
マウスにおけるChAd155-EBV及びChAd155-CalHV3抗原の免疫原性
a.ChAd155-EBV
潜伏又は潜伏+溶解性抗原を発現するベクターから生成したChAd155-EBVウイルス粒子の免疫原性を、表1に示す実験設計を使用してマウスにおいて評価した。簡潔には、CB6F1マウス(1群当たり6匹)に、ベクターChAd155-EBV-L又はChAd155-EBV-LLyの単回用量(106、107又は108ウイルス粒子、筋肉内に)を投与した。
免疫化の3週間後に、脾細胞を単離し、標準的IFNγ ELISpotアッセイに従ってEBV抗原に対するT細胞応答をアッセイした。簡潔には、免疫化した動物由来の脾細胞を、5つのプールに配列された重複する15merのペプチド(それぞれ、ワクチンに含まれるEBVタンパク質のそれぞれに由来する免疫原性断片をカバーする)で刺激した(LMP1、LMP2、EBNA1、EBNA3A、ZEBRA;n=19から84のシングルペプチド/プール)。断片間の各単一の接合部をカバーする16merのペプチドの6番目のプール(EJ、n=18ペプチド)、及びDMSO(ペプチド希釈剤)も、それぞれ、接合部エピトープに対する応答をモニターするための刺激物質として、及び陰性対照として使用した。T細胞活性化は、酵素連結イムノスポット(ELISPOT)によってIFNγ-分泌ワクチンに誘発されるT細胞を数えることによって検出した。
結果を図5Aに示す。ChAd155-EBV-LとChAd155-EBV-LLyの両方が、用量依存的様式で、ワクチン接種済マウスにおいて、T細胞のIFNγ分泌を誘発した。EBV-L及びEBV-LLy免疫化マウスのいずれにおいても、EBV潜伏抗原(LMP1、LMP2、EBNA1及びEBNA3A)のそれぞれに対して、T細胞応答を検出した。しかし、EBV溶解性タンパク質であるZEBRAに対するT細胞応答は、EBV-LLy免疫化マウスにおいてのみ検出された。EBV接合部ペプチド(Ej)に対する又はDMSO陰性対照に対する応答は検出されなかった。
結果は、ChAd155-EBV-L及びChAd155-EBV-LLyベクターから生成されたウイルス粒子が、抗原構築物内に含有される免疫原性断片に対する抗原特異的T細胞応答を誘発することが可能であることを示す。さらに、EBV-L及びEBV-LLy抗原構築物に対する一次免疫応答は、接合部エピトープを対象としない。
b.ChAd155-CalHV3
ChAd155-CalHV3ウイルス粒子の免疫原性を、ChAd155-EBVウイルス粒子に関して上記したのと同じ方法に従って評価した。ワクチン接種の3週間後の脾細胞の抗原刺激は、4つのプールに配列された重複する15merのペプチド(それぞれが、ワクチンに含まれる免疫原性断片をカバーする)で行った(C1、C7、ORF39、ORF43、n=58から96のシングルペプチド/プール)。断片間の各単一の接合部をカバーする16merのペプチドの5番目のプール(CJ、n=12ペプチド)、及びDMSO(ペプチド希釈剤)も、それぞれ、接合部エピトープに対する応答をモニターするための刺激物質として、及び陰性対照として使用した。実験設計を表2にまとめる。
ChAd155-CalHV3ウイルス粒子の免疫原性を、ChAd155-EBVウイルス粒子に関して上記したのと同じ方法に従って評価した。ワクチン接種の3週間後の脾細胞の抗原刺激は、4つのプールに配列された重複する15merのペプチド(それぞれが、ワクチンに含まれる免疫原性断片をカバーする)で行った(C1、C7、ORF39、ORF43、n=58から96のシングルペプチド/プール)。断片間の各単一の接合部をカバーする16merのペプチドの5番目のプール(CJ、n=12ペプチド)、及びDMSO(ペプチド希釈剤)も、それぞれ、接合部エピトープに対する応答をモニターするための刺激物質として、及び陰性対照として使用した。実験設計を表2にまとめる。
結果を図5Bに示す。ChAd155-CalHV3-LとChAd155-CalHV3-LLyの両方が、用量依存的様式で、ワクチン接種済マウスにおいて、T細胞のIFNγ分泌を誘発した。CalHV3-L及びCalHV3-LLy免疫化マウスのいずれにおいても、CalHV3潜伏抗原C1、C7及びORF39をカバーするペプチドプールに対するT細胞応答を検出した。しかし、CalHV3溶解性タンパク質であるORF43に対するT細胞応答は、CalHV3-LLy免疫化マウスにおいてのみ検出された。CalHV3接合部ペプチド(Cj)に対する又は陰性対照DMSOに対する応答は検出されなかった。
結果は、ChAd155-EBV-L及びChAd155-EBV-LLyベクターから生成されたウイルス粒子が、抗原構築物内に含有される免疫原性断片に対する抗原特異的T細胞応答を誘発することが可能であることを示す。さらに、CalHV3-L及びCalHV3-LLy抗原構築物に対する一次免疫応答は、接合部エピトープを対象としない。
[実施例5]
マウスにおけるプライム(初回免疫)-ブースト(追加免疫)の効果
a. EBV-LLyプライム-ブースト
EBV-LLy抗原の1回目の投与の免疫応答をブーストする、EBV-LLy抗原の2回目の投与の能力を、表3にまとめた実験設計を使用して評価した。簡潔には、CB6F1マウス(n=5/群)の群を、0日目に、Chad155-EBV-LLyの5×107ウイルス粒子で筋肉内に免疫化した。21日目(3週間目)に、群2は、MVA-EBV-LLyの107プラーク形成単位(PFU)で2回目の免疫化を受けた。対照マウスは、さらなる免疫化を受けなかったか(群3:「ブーストなし」)又はEBV非関連抗原をコードするMVAベクターによるブースト(追加免疫)を受けた(群1:MVA-非関連)。
マウスにおけるプライム(初回免疫)-ブースト(追加免疫)の効果
a. EBV-LLyプライム-ブースト
EBV-LLy抗原の1回目の投与の免疫応答をブーストする、EBV-LLy抗原の2回目の投与の能力を、表3にまとめた実験設計を使用して評価した。簡潔には、CB6F1マウス(n=5/群)の群を、0日目に、Chad155-EBV-LLyの5×107ウイルス粒子で筋肉内に免疫化した。21日目(3週間目)に、群2は、MVA-EBV-LLyの107プラーク形成単位(PFU)で2回目の免疫化を受けた。対照マウスは、さらなる免疫化を受けなかったか(群3:「ブーストなし」)又はEBV非関連抗原をコードするMVAベクターによるブースト(追加免疫)を受けた(群1:MVA-非関連)。
1回目の免疫化の4週間後に、脾細胞をマウスから単離し、実施例4に記載した方法を使用して、抗原特異的T細胞応答を評価した。
図6に示されているように、ChAd155-EBV-LLyによる免疫化に続く、MVA-EBV-LLyによるブースト免疫(追加免疫)によって、ブーストなしのマウス又は非関連抗原の「ブースト」注射を受けているマウスと比較して、EBV特異的インターフェロンガンマ放出が有意に増加した。図6Aは、すべての抗原(LMP1、LMP2、EBNA1、EBNA3A及びZEBRA)に対する累積T細胞応答を表し、図6Bは、個々の抗原に対する応答を示す。
b. CalHV3-LLyプライム-ブースト
CalHV3抗原に対する免疫応答をブーストする能力を、表4にまとめた実験設計を使用して評価した。簡潔には、CB6F1マウス(n=6/群)の群を、0日目に、Chad155-CalHV3-LLyの5×107ウイルス粒子で筋肉内に免疫化した。42日目(6週間目)に、群4は、同じChAd155-CalHV3-LLy抗原構築物で2回目の免疫化を受け、一方、群3は、MVA-CalHV3-LLyでブースト(追加免疫)を受けた。対照マウスは、ブーストなしか(群1)又はCalHV3非関連抗原をコードするMVAによるブーストを受けた(MVA-非関連)。
CalHV3抗原に対する免疫応答をブーストする能力を、表4にまとめた実験設計を使用して評価した。簡潔には、CB6F1マウス(n=6/群)の群を、0日目に、Chad155-CalHV3-LLyの5×107ウイルス粒子で筋肉内に免疫化した。42日目(6週間目)に、群4は、同じChAd155-CalHV3-LLy抗原構築物で2回目の免疫化を受け、一方、群3は、MVA-CalHV3-LLyでブースト(追加免疫)を受けた。対照マウスは、ブーストなしか(群1)又はCalHV3非関連抗原をコードするMVAによるブーストを受けた(MVA-非関連)。
1回目の免疫化の7週間後に、脾細胞をマウスから単離し、実施例4に記載した方法を使用して、抗原特異的T細胞応答を評価した。
図7に示されているように、ChAd155-CalHV3-LLyによる免疫化に続く、同じ抗原構築物(ChAd155-CalHV3)又はMVA-CalHV3-LLyによるブースト(追加免疫)によって、ブーストなしのマウス又は非関連抗原の「ブースト」注射を受けているマウスと比較して、7週目に、CalHV3特異的インターフェロンガンマ放出が有意に増加した。
これらの結果は、プライム-ブーストレジメンを使用して、EBV及びCalHV3抗原構築物に対する免疫応答を増強する能力を実証する。
[実施例6]
不変鎖-CalHV3-LLy融合タンパク質
抗原を、主要組織適合性複合体(MHC)クラスII関連不変鎖(li)に融合させることにより、抗原特異的T細胞応答が増強されることが報告されている。例えば、Caponeら、Mol Ther. 2014年5月;22(5):1039~1047頁を参照されたい。したがって、CalHV3-LLy抗原ポリペプチドのN末端に融合したマーモセット不変鎖(li)を発現するウイルス粒子の免疫原性を、表5に説明する研究設計に従って、CB6F1マウスにおいて評価した。抗原特異的T細胞応答を、実施例4に記載したIFNγアッセイを使用して評価した。
不変鎖-CalHV3-LLy融合タンパク質
抗原を、主要組織適合性複合体(MHC)クラスII関連不変鎖(li)に融合させることにより、抗原特異的T細胞応答が増強されることが報告されている。例えば、Caponeら、Mol Ther. 2014年5月;22(5):1039~1047頁を参照されたい。したがって、CalHV3-LLy抗原ポリペプチドのN末端に融合したマーモセット不変鎖(li)を発現するウイルス粒子の免疫原性を、表5に説明する研究設計に従って、CB6F1マウスにおいて評価した。抗原特異的T細胞応答を、実施例4に記載したIFNγアッセイを使用して評価した。
図8は、免疫化の2週間後に観察された、すべてのCalHV3-LLy抗原(C1、C7、ORF39及びORF43)に対する累積T細胞応答をまとめる。より少ない用量の抗原(5×106ウイルス粒子)、ChAd155-li-CalHV3-LLyは、ChAd155-CalHV3-LLyよりも、免疫化マウスにおいて有意に大きなIFNγ放出を誘発した。試験したより多い用量の抗原(5×107ウイルス粒子)では、差は観察されなかった。
これらの結果は、CalHV3-LLy抗原ポリペプチドのMHCクラスII関連不変鎖ポリペプチドへの融合により、CalHV3潜伏及び溶解性抗原に対するT細胞免疫応答が増強されることを示す。
[実施例7]
非ヒト霊長類におけるCalHV3抗原の免疫原性
CalHV3抗原構築物の免疫原性を、CalHV3血清陽性マーモセット(コモンマーモセット(Callithrix jacchus))(新世界霊長類の属である)において評価した。CalHV3感染は、マーモセットにおいて蔓延していることが知られている。例えば、Choら、PNAS 98(3):1224~1229頁(2001)を参照されたい。CalHV3とEBVの間の構造的及び病理学的類似性に起因して、CalHV3陽性マーモセットは、ヒトEBV感染及び病理の貴重なモデルとしての役割を果たし得る。同上。
非ヒト霊長類におけるCalHV3抗原の免疫原性
CalHV3抗原構築物の免疫原性を、CalHV3血清陽性マーモセット(コモンマーモセット(Callithrix jacchus))(新世界霊長類の属である)において評価した。CalHV3感染は、マーモセットにおいて蔓延していることが知られている。例えば、Choら、PNAS 98(3):1224~1229頁(2001)を参照されたい。CalHV3とEBVの間の構造的及び病理学的類似性に起因して、CalHV3陽性マーモセットは、ヒトEBV感染及び病理の貴重なモデルとしての役割を果たし得る。同上。
ChAd155プライム/MVAブーストワクチン接種スケジュールを使用して、動物を免疫化した。簡潔には、4頭の成体動物(3頭の雄及び1頭の雌)から構成される群は、0日目に、ChAd155-CalHV3-LLy(5x1010vp)の初回免疫を、56日目(8週目)に、MVA-CalHV3-LLy(2x108)のブースト(追加免疫)を受けた。血液試料を、プライム注射の2週間前、プライム注射の3週間後、並びにブースト注射の1、4及び7週間後に採取した。末梢血単核球(PBMC)における抗原特異的T細胞応答を、実施例4に記載した方法を使用して評価した。
図9は、ベースライン(w0)、プライム後3週間(w3 pp)、及びブースト後1、4及び7週間(w1、w4、w7 pb)に観察された、すべてのCalHV3-LLy抗原(C1、C7、ORF39及びORF43)に対する、個々の動物における累積T細胞応答を示す。免疫化の前に、動物は、ベースラインCalHV3特異的T細胞応答を示し、これは、動物がウイルスキャリアであるという事実に一致した。ChAd155-CalHV3-LLy免疫化の3週間後に、動物は、既存のCalHV3特異的T細胞応答の有意な拡大を示した。T細胞応答は、MVA-CalHV3-LLyによるブースト後1週間でも上昇し続け、続く2カ月間で収束したが、ほとんどの動物においてベースラインレベルを超えたままであった。図10に示されているように、CalHV3-LLyに対するT細胞応答の増強は維持され、多特異的(すなわち、C1、C7、ORF39及びORF43に対して)であった。
これらの結果は、CalHV3-LLy抗原をコードするChAd155及びMVAベクターが、CalHV3陽性マーモセットにおける既存の抗原特異的T細胞応答を効率的に再拡大し、維持することができること、及びガンマヘルペスウイルスによって誘発される循環T細胞が機能を損なわれないか又は消耗されないことを示す。
[実施例8]
ChAd155及びMVA潜伏+溶解性EBVワクチンによってコードされたEBV断片のヒトPBMCによる認識
ワクチンに含まれるEBV潜伏(EBNA1、EBNA3A、LMP1及びLMP2)及び溶解性(ZEBRA)抗原性断片の選択について評価するために、対応するペプチドプールに対するT細胞応答を、その他の点では健康なヒトEBVキャリアにおいて測定した。
ChAd155及びMVA潜伏+溶解性EBVワクチンによってコードされたEBV断片のヒトPBMCによる認識
ワクチンに含まれるEBV潜伏(EBNA1、EBNA3A、LMP1及びLMP2)及び溶解性(ZEBRA)抗原性断片の選択について評価するために、対応するペプチドプールに対するT細胞応答を、その他の点では健康なヒトEBVキャリアにおいて測定した。
簡潔には、8名の健康なヒトドナー由来の凍結末梢血単核球(PBMC)を解凍し、標準的なIFNγ ELISpotアッセイに従って、EBV抗原に対するT細胞応答についてアッセイした。PBMCを、2×105細胞/ウェルで三連にてプレーティングし、5プールに配列された重なり合う15-merペプチド(それぞれ、ワクチンに含まれるEBVタンパク質のそれぞれに由来する免疫原性断片をカバーする)で、一晩刺激した(LMP1、LMP2、EBNA1、EBNA3A、ZEBRA;n=19から84のシングルペプチド/プール)。DMSO(ペプチド希釈剤)による刺激を陰性対照として使用した。T細胞活性化は、酵素連結イムノスポット(ELISPOT)によってIFNγ-分泌T細胞を数えることによって検出した。
図11に示されているように、結果は、EBV Lly抗原構築物内に含有された免疫原性断片に対する抗原特異的T細胞応答は、健康なEBVキャリアにおいて容易に検出することができ、EBNA3A及びZEBRAは最も高い頻度で認識され、最も高い応答を誘発することができることを示し、これは以前の報告と一致した(例えば、Taylorら Ann. Rev. Immunol. 33:787~821頁、2015)。
本開示は以下の配列情報を包含する。
SEQUENCE LISTING
<110> GLAXOSMITHKLINE BIOLOGICALS S.A.
<120> EPSTEIN-BARR VIRUS ANTIGEN CONSTRUCTS
<130> PA23-352
<140>
<141> 2018-12-14
<150> US 62/608,038
<151> 2017-12-20
<160> 54
<170> PatentIn version 3.5
<210> 1
<211> 386
<212> PRT
<213> Human herpesvirus 4
<400> 1
Met Glu His Asp Leu Glu Arg Gly Pro Pro Gly Pro Arg Arg Pro Pro
1 5 10 15
Arg Gly Pro Pro Leu Ser Ser Ser Leu Gly Leu Ala Leu Leu Leu Leu
20 25 30
Leu Leu Ala Leu Leu Phe Trp Leu Tyr Ile Val Met Ser Asp Trp Thr
35 40 45
Gly Gly Ala Leu Leu Val Leu Tyr Ser Phe Ala Leu Met Leu Ile Ile
50 55 60
Ile Ile Leu Ile Ile Phe Ile Phe Arg Arg Asp Leu Leu Cys Pro Leu
65 70 75 80
Gly Ala Leu Cys Ile Leu Leu Leu Met Ile Thr Leu Leu Leu Ile Ala
85 90 95
Leu Trp Asn Leu His Gly Gln Ala Leu Phe Leu Gly Ile Val Leu Phe
100 105 110
Ile Phe Gly Cys Leu Leu Val Leu Gly Ile Trp Ile Tyr Leu Leu Glu
115 120 125
Met Leu Trp Arg Leu Gly Ala Thr Ile Trp Gln Leu Leu Ala Phe Phe
130 135 140
Leu Ala Phe Phe Leu Asp Leu Ile Leu Leu Ile Ile Ala Leu Tyr Leu
145 150 155 160
Gln Gln Asn Trp Trp Thr Leu Leu Val Asp Leu Leu Trp Leu Leu Leu
165 170 175
Phe Leu Ala Ile Leu Ile Trp Met Tyr Tyr His Gly Gln Arg His Ser
180 185 190
Asp Glu His His His Asp Asp Ser Leu Pro His Pro Gln Gln Ala Thr
195 200 205
Asp Asp Ser Gly His Glu Ser Asp Ser Asn Ser Asn Glu Gly Arg His
210 215 220
His Leu Leu Val Ser Gly Ala Gly Asp Gly Pro Pro Leu Cys Ser Gln
225 230 235 240
Asn Leu Gly Ala Pro Gly Gly Gly Pro Asp Asn Gly Pro Gln Asp Pro
245 250 255
Asp Asn Thr Asp Asp Asn Gly Pro Gln Asp Pro Asp Asn Thr Asp Asp
260 265 270
Asn Gly Pro His Asp Pro Leu Pro Gln Asp Pro Asp Asn Thr Asp Asp
275 280 285
Asn Gly Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro His Asp
290 295 300
Pro Leu Pro His Ser Pro Ser Asp Ser Ala Gly Asn Asp Gly Gly Pro
305 310 315 320
Pro Gln Leu Thr Glu Glu Val Glu Asn Lys Gly Gly Asp Gln Gly Pro
325 330 335
Pro Leu Met Thr Asp Gly Gly Gly Gly His Ser His Asp Ser Gly His
340 345 350
Gly Gly Gly Asp Pro His Leu Pro Thr Leu Leu Leu Gly Ser Ser Gly
355 360 365
Ser Gly Gly Asp Asp Asp Asp Pro His Gly Pro Val Gln Leu Ser Tyr
370 375 380
Tyr Asp
385
<210> 2
<211> 62
<212> PRT
<213> Human herpesvirus 4
<400> 2
Met Ser Asp Trp Thr Gly Gly Ala Leu Leu Val Leu Tyr Ser Phe Ala
1 5 10 15
Leu Met Leu Ile Ile Ile Ile Leu Ile Ile Phe Ile Phe Arg Arg Asp
20 25 30
Leu Leu Cys Pro Leu Gly Ala Leu Cys Ile Leu Leu Leu Met Ile Thr
35 40 45
Leu Leu Leu Ile Ala Leu Trp Asn Leu His Gly Gln Ala Leu
50 55 60
<210> 3
<211> 85
<212> PRT
<213> Human herpesvirus 4
<400> 3
Phe Leu Gly Ile Val Leu Phe Ile Phe Gly Cys Leu Leu Val Leu Gly
1 5 10 15
Ile Trp Ile Tyr Leu Leu Glu Met Leu Trp Arg Leu Gly Ala Thr Ile
20 25 30
Trp Gln Leu Leu Ala Phe Phe Leu Ala Phe Phe Leu Asp Leu Ile Leu
35 40 45
Leu Ile Ile Ala Leu Tyr Leu Gln Gln Asn Trp Trp Thr Leu Leu Val
50 55 60
Asp Leu Leu Trp Leu Leu Leu Phe Leu Ala Ile Leu Ile Trp Met Tyr
65 70 75 80
Tyr His Gly Gln Arg
85
<210> 4
<211> 40
<212> PRT
<213> Human herpesvirus 4
<400> 4
His Ser Asp Glu His His His Asp Asp Ser Leu Pro His Pro Gln Gln
1 5 10 15
Ala Thr Asp Asp Ser Gly His Glu Ser Asp Ser Asn Ser Asn Glu Gly
20 25 30
Arg His His Leu Leu Val Ser Gly
35 40
<210> 5
<211> 114
<212> PRT
<213> Human herpesvirus 4
<400> 5
Asn Gly Pro His Asp Pro Leu Pro Gln Asp Pro Asp Asn Thr Asp Asp
1 5 10 15
Asn Gly Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro His Asp
20 25 30
Pro Leu Pro His Ser Pro Ser Asp Ser Ala Gly Asn Asp Gly Gly Pro
35 40 45
Pro Gln Leu Thr Glu Glu Val Glu Asn Lys Gly Gly Asp Gln Gly Pro
50 55 60
Pro Leu Met Thr Asp Gly Gly Gly Gly His Ser His Asp Ser Gly His
65 70 75 80
Gly Gly Gly Asp Pro His Leu Pro Thr Leu Leu Leu Gly Ser Ser Gly
85 90 95
Ser Gly Gly Asp Asp Asp Asp Pro His Gly Pro Val Gln Leu Ser Tyr
100 105 110
Tyr Asp
<210> 6
<211> 497
<212> PRT
<213> Human herpesvirus 4
<400> 6
Met Gly Ser Leu Glu Met Val Pro Met Gly Ala Gly Pro Pro Ser Pro
1 5 10 15
Gly Gly Asp Pro Asp Gly Tyr Asp Gly Gly Asn Asn Ser Gln Tyr Pro
20 25 30
Ser Ala Ser Gly Ser Ser Gly Asn Thr Pro Thr Pro Pro Asn Asp Glu
35 40 45
Glu Arg Glu Ser Asn Glu Glu Pro Pro Pro Pro Tyr Glu Asp Pro Tyr
50 55 60
Trp Gly Asn Gly Asp Arg His Ser Asp Tyr Gln Pro Leu Gly Thr Gln
65 70 75 80
Asp Gln Ser Leu Tyr Leu Gly Leu Gln His Asp Gly Asn Asp Gly Leu
85 90 95
Pro Pro Pro Pro Tyr Ser Pro Arg Asp Asp Ser Ser Gln His Ile Tyr
100 105 110
Glu Glu Ala Gly Arg Gly Ser Met Asn Pro Val Cys Leu Pro Val Ile
115 120 125
Val Ala Pro Tyr Leu Phe Trp Leu Ala Ala Ile Ala Ala Ser Cys Phe
130 135 140
Thr Ala Ser Val Ser Thr Val Val Thr Ala Thr Gly Leu Ala Leu Ser
145 150 155 160
Leu Leu Leu Leu Ala Ala Val Ala Ser Ser Tyr Ala Ala Ala Gln Arg
165 170 175
Lys Leu Leu Thr Pro Val Thr Val Leu Thr Ala Val Val Thr Phe Phe
180 185 190
Ala Ile Cys Leu Thr Trp Arg Ile Glu Asp Pro Pro Phe Asn Ser Leu
195 200 205
Leu Phe Ala Leu Leu Ala Ala Ala Gly Gly Leu Gln Gly Ile Tyr Val
210 215 220
Leu Val Met Leu Val Leu Leu Ile Leu Ala Tyr Arg Arg Arg Trp Arg
225 230 235 240
Arg Leu Thr Val Cys Gly Gly Ile Met Phe Leu Ala Cys Val Leu Val
245 250 255
Leu Ile Val Asp Ala Val Leu Gln Leu Ser Pro Leu Leu Gly Ala Val
260 265 270
Thr Val Val Ser Met Thr Leu Leu Leu Leu Ala Phe Val Leu Trp Leu
275 280 285
Ser Ser Pro Gly Gly Leu Gly Thr Leu Gly Ala Ala Leu Leu Thr Leu
290 295 300
Ala Ala Ala Leu Ala Leu Leu Ala Ser Leu Ile Leu Gly Thr Leu Asn
305 310 315 320
Leu Thr Thr Met Phe Leu Leu Met Leu Leu Trp Thr Leu Val Val Leu
325 330 335
Leu Ile Cys Ser Ser Cys Ser Ser Cys Pro Leu Ser Lys Ile Leu Leu
340 345 350
Ala Arg Leu Phe Leu Tyr Ala Leu Ala Leu Leu Leu Leu Ala Ser Ala
355 360 365
Leu Ile Ala Gly Gly Ser Ile Leu Gln Thr Asn Phe Lys Ser Leu Ser
370 375 380
Ser Thr Glu Phe Ile Pro Asn Leu Phe Cys Met Leu Leu Leu Ile Val
385 390 395 400
Ala Gly Ile Leu Phe Ile Leu Ala Ile Leu Thr Glu Trp Gly Ser Gly
405 410 415
Asn Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu Leu Thr
420 425 430
Met Val Ala Gly Ala Val Trp Leu Thr Val Met Ser Asn Thr Leu Leu
435 440 445
Ser Ala Trp Ile Leu Thr Ala Gly Phe Leu Ile Phe Leu Ile Gly Phe
450 455 460
Ala Leu Phe Gly Val Ile Arg Cys Cys Arg Tyr Cys Cys Tyr Tyr Cys
465 470 475 480
Leu Thr Leu Glu Ser Glu Glu Arg Pro Pro Thr Pro Tyr Arg Asn Thr
485 490 495
Val
<210> 7
<211> 71
<212> PRT
<213> Human herpesvirus 4
<400> 7
Met Asn Pro Val Cys Leu Pro Val Ile Val Ala Pro Tyr Leu Phe Trp
1 5 10 15
Leu Ala Ala Ile Ala Ala Ser Cys Phe Thr Ala Ser Val Ser Thr Val
20 25 30
Val Thr Ala Thr Gly Leu Ala Leu Ser Leu Leu Leu Leu Ala Ala Val
35 40 45
Ala Ser Ser Tyr Ala Ala Ala Gln Arg Lys Leu Leu Thr Pro Val Thr
50 55 60
Val Leu Thr Ala Val Val Thr
65 70
<210> 8
<211> 94
<212> PRT
<213> Human herpesvirus 4
<400> 8
Phe Phe Ala Ile Cys Leu Thr Trp Arg Ile Glu Asp Pro Pro Phe Asn
1 5 10 15
Ser Leu Leu Phe Ala Leu Leu Ala Ala Ala Gly Gly Leu Gln Gly Ile
20 25 30
Tyr Val Leu Val Met Leu Val Leu Leu Ile Leu Ala Tyr Arg Arg Arg
35 40 45
Trp Arg Arg Leu Thr Val Cys Gly Gly Ile Met Phe Leu Ala Cys Val
50 55 60
Leu Val Leu Ile Val Asp Ala Val Leu Gln Leu Ser Pro Leu Leu Gly
65 70 75 80
Ala Val Thr Val Val Ser Met Thr Leu Leu Leu Leu Ala Phe
85 90
<210> 9
<211> 115
<212> PRT
<213> Human herpesvirus 4
<400> 9
Val Leu Trp Leu Ser Ser Pro Gly Gly Leu Gly Thr Leu Gly Ala Ala
1 5 10 15
Leu Leu Thr Leu Ala Ala Ala Leu Ala Leu Leu Ala Ser Leu Ile Leu
20 25 30
Gly Thr Leu Asn Leu Thr Thr Met Phe Leu Leu Met Leu Leu Trp Thr
35 40 45
Leu Val Val Leu Leu Ile Cys Ser Ser Cys Ser Ser Cys Pro Leu Ser
50 55 60
Lys Ile Leu Leu Ala Arg Leu Phe Leu Tyr Ala Leu Ala Leu Leu Leu
65 70 75 80
Leu Ala Ser Ala Leu Ile Ala Gly Gly Ser Ile Leu Gln Thr Asn Phe
85 90 95
Lys Ser Leu Ser Ser Thr Glu Phe Ile Pro Asn Leu Phe Cys Met Leu
100 105 110
Leu Leu Ile
115
<210> 10
<211> 98
<212> PRT
<213> Human herpesvirus 4
<400> 10
Val Ala Gly Ile Leu Phe Ile Leu Ala Ile Leu Thr Glu Trp Gly Ser
1 5 10 15
Gly Asn Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu Leu
20 25 30
Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Met Ser Asn Thr Leu
35 40 45
Leu Ser Ala Trp Ile Leu Thr Ala Gly Phe Leu Ile Phe Leu Ile Gly
50 55 60
Phe Ala Leu Phe Gly Val Ile Arg Cys Cys Arg Tyr Cys Cys Tyr Tyr
65 70 75 80
Cys Leu Thr Leu Glu Ser Glu Glu Arg Pro Pro Thr Pro Tyr Arg Asn
85 90 95
Thr Val
<210> 11
<211> 641
<212> PRT
<213> Human herpesvirus 4
<400> 11
Met Ser Asp Glu Gly Pro Gly Thr Gly Pro Gly Asn Gly Leu Gly Glu
1 5 10 15
Lys Gly Asp Thr Ser Gly Pro Glu Gly Ser Gly Gly Ser Gly Pro Gln
20 25 30
Arg Arg Gly Gly Asp Asn His Gly Arg Gly Arg Gly Arg Gly Arg Gly
35 40 45
Arg Gly Gly Gly Arg Pro Gly Ala Pro Gly Gly Ser Gly Ser Gly Pro
50 55 60
Arg His Arg Asp Gly Val Arg Arg Pro Gln Lys Arg Pro Ser Cys Ile
65 70 75 80
Gly Cys Lys Gly Thr His Gly Gly Thr Gly Ala Gly Ala Gly Ala Gly
85 90 95
Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly
100 105 110
Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly
115 120 125
Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala
130 135 140
Gly Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly
145 150 155 160
Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly
165 170 175
Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly
180 185 190
Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly Gly Ala Gly
195 200 205
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala
210 215 220
Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala
225 230 235 240
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly
245 250 255
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly
260 265 270
Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly
275 280 285
Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly
290 295 300
Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly
305 310 315 320
Gly Ala Gly Ala Gly Gly Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly
325 330 335
Arg Gly Arg Gly Gly Ser Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly
340 345 350
Arg Arg Gly Arg Gly Arg Glu Arg Ala Arg Gly Gly Ser Arg Glu Arg
355 360 365
Ala Arg Gly Arg Gly Arg Gly Arg Gly Glu Lys Arg Pro Arg Ser Pro
370 375 380
Ser Ser Gln Ser Ser Ser Ser Gly Ser Pro Pro Arg Arg Pro Pro Pro
385 390 395 400
Gly Arg Arg Pro Phe Phe His Pro Val Gly Glu Ala Asp Tyr Phe Glu
405 410 415
Tyr His Gln Glu Gly Gly Pro Asp Gly Glu Pro Asp Val Pro Pro Gly
420 425 430
Ala Ile Glu Gln Gly Pro Ala Asp Asp Pro Gly Glu Gly Pro Ser Thr
435 440 445
Gly Pro Arg Gly Gln Gly Asp Gly Gly Arg Arg Lys Lys Gly Gly Trp
450 455 460
Phe Gly Lys His Arg Gly Gln Gly Gly Ser Asn Pro Lys Phe Glu Asn
465 470 475 480
Ile Ala Glu Gly Leu Arg Ala Leu Leu Ala Arg Ser His Val Glu Arg
485 490 495
Thr Thr Asp Glu Gly Thr Trp Val Ala Gly Val Phe Val Tyr Gly Gly
500 505 510
Ser Lys Thr Ser Leu Tyr Asn Leu Arg Arg Gly Thr Ala Leu Ala Ile
515 520 525
Pro Gln Cys Arg Leu Thr Pro Leu Ser Arg Leu Pro Phe Gly Met Ala
530 535 540
Pro Gly Pro Gly Pro Gln Pro Gly Pro Leu Arg Glu Ser Ile Val Cys
545 550 555 560
Tyr Phe Met Val Phe Leu Gln Thr His Ile Phe Ala Glu Val Leu Lys
565 570 575
Asp Ala Ile Lys Asp Leu Val Met Thr Lys Pro Ala Pro Thr Cys Asn
580 585 590
Ile Arg Val Thr Val Cys Ser Phe Asp Asp Gly Val Asp Leu Pro Pro
595 600 605
Trp Phe Pro Pro Met Val Glu Gly Ala Ala Ala Glu Gly Asp Asp Gly
610 615 620
Asp Asp Gly Asp Glu Gly Gly Asp Gly Asp Glu Gly Glu Glu Gly Gln
625 630 635 640
Glu
<210> 12
<211> 86
<212> PRT
<213> Human herpesvirus 4
<400> 12
Met Ser Asp Glu Gly Pro Gly Thr Gly Pro Gly Asn Gly Leu Gly Glu
1 5 10 15
Lys Gly Asp Thr Ser Gly Pro Glu Gly Ser Gly Gly Ser Gly Pro Gln
20 25 30
Arg Arg Gly Gly Asp Asn His Gly Arg Gly Arg Gly Arg Gly Arg Gly
35 40 45
Arg Gly Gly Gly Arg Pro Gly Ala Pro Gly Gly Ser Gly Ser Gly Pro
50 55 60
Arg His Arg Asp Gly Val Arg Arg Pro Gln Lys Arg Pro Ser Cys Ile
65 70 75 80
Gly Cys Lys Gly Thr His
85
<210> 13
<211> 944
<212> PRT
<213> Human herpesvirus 4
<400> 13
Met Asp Lys Asp Arg Pro Gly Pro Pro Ala Leu Asp Asp Asn Met Glu
1 5 10 15
Glu Glu Val Pro Ser Thr Ser Val Val Gln Glu Gln Val Ser Ala Gly
20 25 30
Asp Trp Glu Asn Val Leu Ile Glu Leu Ser Asp Ser Ser Ser Glu Lys
35 40 45
Glu Ala Glu Asp Ala His Leu Glu Pro Ala Gln Lys Gly Thr Lys Arg
50 55 60
Lys Arg Val Asp His Asp Ala Gly Gly Ser Ala Pro Ala Arg Pro Met
65 70 75 80
Leu Pro Pro Gln Pro Asp Leu Pro Gly Arg Glu Ala Ile Leu Arg Arg
85 90 95
Phe Pro Leu Asp Leu Arg Thr Leu Leu Gln Ala Ile Gly Ala Ala Ala
100 105 110
Thr Arg Ile Asp Thr Arg Ala Ile Asp Gln Phe Phe Gly Ser Gln Ile
115 120 125
Ser Asn Thr Glu Met Tyr Ile Met Tyr Ala Met Ala Ile Arg Gln Ala
130 135 140
Ile Arg Asp Arg Arg Arg Asn Pro Ala Ser Arg Arg Asp Gln Ala Lys
145 150 155 160
Trp Arg Leu Gln Thr Leu Ala Ala Gly Trp Pro Met Gly Tyr Gln Ala
165 170 175
Tyr Ser Ser Trp Met Tyr Ser Tyr Thr Asp His Gln Thr Thr Pro Thr
180 185 190
Phe Val His Leu Gln Ala Thr Leu Gly Cys Thr Gly Gly Arg Arg Cys
195 200 205
His Val Thr Phe Ser Ala Gly Thr Phe Lys Leu Pro Arg Cys Thr Pro
210 215 220
Gly Asp Arg Gln Trp Leu Tyr Val Gln Ser Ser Val Gly Asn Ile Val
225 230 235 240
Gln Ser Cys Asn Pro Arg Tyr Ser Ile Phe Phe Asp Tyr Met Ala Ile
245 250 255
His Arg Ser Leu Thr Lys Ile Trp Glu Glu Val Leu Thr Pro Asp Gln
260 265 270
Arg Val Ser Phe Met Glu Phe Leu Gly Phe Leu Gln Arg Thr Asp Leu
275 280 285
Ser Tyr Ile Lys Ser Phe Val Ser Asp Ala Leu Gly Thr Thr Ser Ile
290 295 300
Gln Thr Pro Trp Ile Asp Asp Asn Pro Ser Thr Glu Thr Ala Gln Ala
305 310 315 320
Trp Asn Ala Gly Phe Leu Arg Gly Arg Ala Tyr Gly Ile Asp Leu Leu
325 330 335
Arg Thr Glu Gly Glu His Val Glu Gly Ala Thr Gly Glu Thr Arg Glu
340 345 350
Glu Ser Glu Asp Thr Glu Ser Asp Gly Asp Asp Glu Asp Leu Pro Cys
355 360 365
Ile Val Ser Arg Gly Gly Pro Lys Val Lys Arg Pro Pro Ile Phe Ile
370 375 380
Arg Arg Leu His Arg Leu Leu Leu Met Arg Ala Gly Lys Arg Thr Glu
385 390 395 400
Gln Gly Lys Glu Val Leu Glu Lys Ala Arg Gly Ser Thr Tyr Gly Thr
405 410 415
Pro Arg Pro Pro Val Pro Lys Pro Arg Pro Glu Val Pro Gln Ser Asp
420 425 430
Glu Thr Ala Thr Ser His Gly Ser Ala Gln Val Pro Glu Pro Pro Thr
435 440 445
Ile His Leu Ala Ala Gln Gly Met Ala Tyr Pro Leu His Glu Gln His
450 455 460
Gly Met Ala Pro Cys Pro Val Ala Gln Ala Pro Pro Thr Pro Leu Pro
465 470 475 480
Pro Val Ser Pro Gly Asp Gln Leu Pro Gly Val Phe Ser Asp Gly Arg
485 490 495
Val Ala Cys Ala Pro Val Pro Ala Pro Ala Gly Pro Ile Val Arg Pro
500 505 510
Trp Glu Pro Ser Leu Thr Gln Ala Ala Gly Gln Ala Phe Ala Pro Val
515 520 525
Arg Pro Gln His Met Pro Val Glu Pro Val Pro Val Pro Thr Val Ala
530 535 540
Leu Glu Arg Pro Val Tyr Pro Lys Pro Val Arg Pro Ala Pro Pro Lys
545 550 555 560
Ile Ala Met Gln Gly Pro Gly Glu Thr Ser Gly Ile Arg Arg Ala Arg
565 570 575
Glu Arg Trp Arg Pro Ala Pro Trp Thr Pro Asn Pro Pro Arg Ser Pro
580 585 590
Ser Gln Met Ser Val Arg Asp Arg Leu Ala Arg Leu Arg Ala Glu Ala
595 600 605
Gln Val Lys Gln Ala Ser Val Glu Val Gln Pro Pro Gln Leu Thr Gln
610 615 620
Val Ser Pro Gln Gln Pro Met Glu Gly Pro Leu Val Pro Glu Gln Gln
625 630 635 640
Met Phe Pro Gly Ala Pro Phe Ser Gln Val Ala Asp Val Val Arg Ala
645 650 655
Pro Gly Val Pro Ala Met Gln Pro Gln Tyr Phe Asp Leu Pro Leu Ile
660 665 670
Gln Pro Ile Ser Gln Gly Ala Pro Val Ala Pro Leu Arg Ala Ser Met
675 680 685
Gly Pro Val Pro Pro Val Pro Ala Thr Gln Pro Gln Tyr Phe Asp Ile
690 695 700
Pro Leu Thr Glu Pro Ile Asn Gln Gly Ala Ser Ala Ala His Phe Leu
705 710 715 720
Pro Gln Gln Pro Met Glu Gly Pro Leu Val Pro Glu Gln Trp Met Phe
725 730 735
Pro Gly Ala Ala Leu Ser Gln Ser Val Arg Pro Gly Val Ala Gln Ser
740 745 750
Gln Tyr Phe Asp Leu Pro Leu Thr Gln Pro Ile Asn His Gly Ala Pro
755 760 765
Ala Ala His Phe Leu His Gln Pro Pro Met Glu Gly Pro Trp Val Pro
770 775 780
Glu Gln Trp Met Phe Gln Gly Ala Pro Pro Ser Gln Gly Thr Asp Val
785 790 795 800
Val Gln His Gln Leu Asp Ala Leu Gly Tyr Thr Leu His Gly Leu Asn
805 810 815
His Pro Gly Val Pro Val Ser Pro Ala Val Asn Gln Tyr His Leu Ser
820 825 830
Gln Ala Ala Phe Gly Leu Pro Ile Asp Glu Asp Glu Ser Gly Glu Gly
835 840 845
Ser Asp Thr Ser Glu Pro Cys Glu Ala Leu Asp Leu Ser Ile His Gly
850 855 860
Arg Pro Cys Pro Gln Ala Pro Glu Trp Pro Val Gln Glu Glu Gly Gly
865 870 875 880
Gln Asp Ala Thr Glu Val Leu Asp Leu Ser Ile His Gly Arg Pro Arg
885 890 895
Pro Arg Thr Pro Glu Trp Pro Val Gln Gly Glu Gly Gly Gln Asn Val
900 905 910
Thr Gly Pro Glu Thr Arg Arg Val Val Val Ser Ala Val Val His Met
915 920 925
Cys Gln Asp Asp Glu Phe Pro Asp Leu Gln Asp Pro Pro Asp Glu Ala
930 935 940
<210> 14
<211> 66
<212> PRT
<213> Human herpesvirus 4
<400> 14
Ile Arg Asp Arg Arg Arg Asn Pro Ala Ser Arg Arg Asp Gln Ala Lys
1 5 10 15
Trp Arg Leu Gln Thr Leu Ala Ala Gly Trp Pro Met Gly Tyr Gln Ala
20 25 30
Tyr Ser Ser Trp Met Tyr Ser Tyr Thr Asp His Gln Thr Thr Pro Thr
35 40 45
Phe Val His Leu Gln Ala Thr Leu Gly Cys Thr Gly Gly Arg Arg Cys
50 55 60
His Val
65
<210> 15
<211> 55
<212> PRT
<213> Human herpesvirus 4
<400> 15
Thr Phe Ser Ala Gly Thr Phe Lys Leu Pro Arg Cys Thr Pro Gly Asp
1 5 10 15
Arg Gln Trp Leu Tyr Val Gln Ser Ser Val Gly Asn Ile Val Gln Ser
20 25 30
Cys Asn Pro Arg Tyr Ser Ile Phe Phe Asp Tyr Met Ala Ile His Arg
35 40 45
Ser Leu Thr Lys Ile Trp Glu
50 55
<210> 16
<211> 88
<212> PRT
<213> Human herpesvirus 4
<400> 16
Trp Ile Asp Asp Asn Pro Ser Thr Glu Thr Ala Gln Ala Trp Asn Ala
1 5 10 15
Gly Phe Leu Arg Gly Arg Ala Tyr Gly Ile Asp Leu Leu Arg Thr Glu
20 25 30
Gly Glu His Val Glu Gly Ala Thr Gly Glu Thr Arg Glu Glu Ser Glu
35 40 45
Asp Thr Glu Ser Asp Gly Asp Asp Glu Asp Leu Pro Cys Ile Val Ser
50 55 60
Arg Gly Gly Pro Lys Val Lys Arg Pro Pro Ile Phe Ile Arg Arg Leu
65 70 75 80
His Arg Leu Leu Leu Met Arg Ala
85
<210> 17
<211> 25
<212> PRT
<213> Human herpesvirus 4
<400> 17
Gly Lys Arg Thr Glu Gln Gly Lys Glu Val Leu Glu Lys Ala Arg Gly
1 5 10 15
Ser Thr Tyr Gly Thr Pro Arg Pro Pro
20 25
<210> 18
<211> 40
<212> PRT
<213> Human herpesvirus 4
<400> 18
Ala Gln Val Pro Glu Pro Pro Thr Ile His Leu Ala Ala Gln Gly Met
1 5 10 15
Ala Tyr Pro Leu His Glu Gln His Gly Met Ala Pro Cys Pro Val Ala
20 25 30
Gln Ala Pro Pro Thr Pro Leu Pro
35 40
<210> 19
<211> 62
<212> PRT
<213> Human herpesvirus 4
<400> 19
Gly Arg Val Ala Cys Ala Pro Val Pro Ala Pro Ala Gly Pro Ile Val
1 5 10 15
Arg Pro Trp Glu Pro Ser Leu Thr Gln Ala Ala Gly Gln Ala Phe Ala
20 25 30
Pro Val Arg Pro Gln His Met Pro Val Glu Pro Val Pro Val Pro Thr
35 40 45
Val Ala Leu Glu Arg Pro Val Tyr Pro Lys Pro Val Arg Pro
50 55 60
<210> 20
<211> 51
<212> PRT
<213> Human herpesvirus 4
<400> 20
Arg Pro Ala Pro Trp Thr Pro Asn Pro Pro Arg Ser Pro Ser Gln Met
1 5 10 15
Ser Val Arg Asp Arg Leu Ala Arg Leu Arg Ala Glu Ala Gln Val Lys
20 25 30
Gln Ala Ser Val Glu Val Gln Pro Pro Gln Leu Thr Gln Val Ser Pro
35 40 45
Gln Gln Pro
50
<210> 21
<211> 245
<212> PRT
<213> Human herpesvirus 4
<400> 21
Met Met Asp Pro Asn Ser Thr Ser Glu Asp Val Lys Phe Thr Pro Asp
1 5 10 15
Pro Tyr Gln Val Pro Phe Val Gln Ala Phe Asp Gln Ala Thr Arg Val
20 25 30
Tyr Gln Asp Leu Gly Gly Pro Ser Gln Ala Pro Leu Pro Cys Val Leu
35 40 45
Trp Pro Val Leu Pro Glu Pro Leu Pro Gln Gly Gln Leu Thr Ala Tyr
50 55 60
His Val Ser Thr Ala Pro Thr Gly Ser Trp Phe Ser Ala Pro Gln Pro
65 70 75 80
Ala Pro Glu Asn Ala Tyr Gln Ala Tyr Ala Ala Pro Gln Leu Phe Pro
85 90 95
Val Ser Asp Ile Thr Gln Asn Gln Gln Thr Asn Gln Ala Gly Gly Glu
100 105 110
Ala Pro Gln Pro Gly Asp Asn Ser Thr Val Gln Thr Ala Ala Ala Val
115 120 125
Val Phe Ala Cys Pro Gly Ala Asn Gln Gly Gln Gln Leu Ala Asp Ile
130 135 140
Gly Val Pro Gln Pro Ala Pro Val Ala Ala Pro Ala Arg Arg Thr Arg
145 150 155 160
Lys Pro Gln Gln Pro Glu Ser Leu Glu Glu Cys Asp Ser Glu Leu Glu
165 170 175
Ile Lys Arg Tyr Lys Asn Arg Val Ala Ser Arg Lys Cys Arg Ala Lys
180 185 190
Phe Lys Gln Leu Leu Gln His Tyr Arg Glu Val Ala Ala Ala Lys Ser
195 200 205
Ser Glu Asn Asp Arg Leu Arg Leu Leu Leu Lys Gln Met Cys Pro Ser
210 215 220
Leu Asp Val Asp Ser Ile Ile Pro Arg Thr Pro Asp Val Leu His Glu
225 230 235 240
Asp Leu Leu Asn Phe
245
<210> 22
<211> 66
<212> PRT
<213> Human herpesvirus 4
<400> 22
Asp Leu Gly Gly Pro Ser Gln Ala Pro Leu Pro Cys Val Leu Trp Pro
1 5 10 15
Val Leu Pro Glu Pro Leu Pro Gln Gly Gln Leu Thr Ala Tyr His Val
20 25 30
Ser Thr Ala Pro Thr Gly Ser Trp Phe Ser Ala Pro Gln Pro Ala Pro
35 40 45
Glu Asn Ala Tyr Gln Ala Tyr Ala Ala Pro Gln Leu Phe Pro Val Ser
50 55 60
Asp Ile
65
<210> 23
<211> 51
<212> PRT
<213> Human herpesvirus 4
<400> 23
Arg Lys Pro Gln Gln Pro Glu Ser Leu Glu Glu Cys Asp Ser Glu Leu
1 5 10 15
Glu Ile Lys Arg Tyr Lys Asn Arg Val Ala Ser Arg Lys Cys Arg Ala
20 25 30
Lys Phe Lys Gln Leu Leu Gln His Tyr Arg Glu Val Ala Ala Ala Lys
35 40 45
Ser Ser Glu
50
<210> 24
<211> 1153
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 24
Met Arg Pro Ala Pro Trp Thr Pro Asn Pro Pro Arg Ser Pro Ser Gln
1 5 10 15
Met Ser Val Arg Asp Arg Leu Ala Arg Leu Arg Ala Glu Ala Gln Val
20 25 30
Lys Gln Ala Ser Val Glu Val Gln Pro Pro Gln Leu Thr Gln Val Ser
35 40 45
Pro Gln Gln Pro Val Ala Gly Ile Leu Phe Ile Leu Ala Ile Leu Thr
50 55 60
Glu Trp Gly Ser Gly Asn Arg Thr Tyr Gly Pro Val Phe Met Cys Leu
65 70 75 80
Gly Gly Leu Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Met
85 90 95
Ser Asn Thr Leu Leu Ser Ala Trp Ile Leu Thr Ala Gly Phe Leu Ile
100 105 110
Phe Leu Ile Gly Phe Ala Leu Phe Gly Val Ile Arg Cys Cys Arg Tyr
115 120 125
Cys Cys Tyr Tyr Cys Leu Thr Leu Glu Ser Glu Glu Arg Pro Pro Thr
130 135 140
Pro Tyr Arg Asn Thr Val Ile Arg Asp Arg Arg Arg Asn Pro Ala Ser
145 150 155 160
Arg Arg Asp Gln Ala Lys Trp Arg Leu Gln Thr Leu Ala Ala Gly Trp
165 170 175
Pro Met Gly Tyr Gln Ala Tyr Ser Ser Trp Met Tyr Ser Tyr Thr Asp
180 185 190
His Gln Thr Thr Pro Thr Phe Val His Leu Gln Ala Thr Leu Gly Cys
195 200 205
Thr Gly Gly Arg Arg Cys His Val Phe Leu Gly Ile Val Leu Phe Ile
210 215 220
Phe Gly Cys Leu Leu Val Leu Gly Ile Trp Ile Tyr Leu Leu Glu Met
225 230 235 240
Leu Trp Arg Leu Gly Ala Thr Ile Trp Gln Leu Leu Ala Phe Phe Leu
245 250 255
Ala Phe Phe Leu Asp Leu Ile Leu Leu Ile Ile Ala Leu Tyr Leu Gln
260 265 270
Gln Asn Trp Trp Thr Leu Leu Val Asp Leu Leu Trp Leu Leu Leu Phe
275 280 285
Leu Ala Ile Leu Ile Trp Met Tyr Tyr His Gly Gln Arg Gly Arg Val
290 295 300
Ala Cys Ala Pro Val Pro Ala Pro Ala Gly Pro Ile Val Arg Pro Trp
305 310 315 320
Glu Pro Ser Leu Thr Gln Ala Ala Gly Gln Ala Phe Ala Pro Val Arg
325 330 335
Pro Gln His Met Pro Val Glu Pro Val Pro Val Pro Thr Val Ala Leu
340 345 350
Glu Arg Pro Val Tyr Pro Lys Pro Val Arg Pro Val Leu Trp Leu Ser
355 360 365
Ser Pro Gly Gly Leu Gly Thr Leu Gly Ala Ala Leu Leu Thr Leu Ala
370 375 380
Ala Ala Leu Ala Leu Leu Ala Ser Leu Ile Leu Gly Thr Leu Asn Leu
385 390 395 400
Thr Thr Met Phe Leu Leu Met Leu Leu Trp Thr Leu Val Val Leu Leu
405 410 415
Ile Cys Ser Ser Cys Ser Ser Cys Pro Leu Ser Lys Ile Leu Leu Ala
420 425 430
Arg Leu Phe Leu Tyr Ala Leu Ala Leu Leu Leu Leu Ala Ser Ala Leu
435 440 445
Ile Ala Gly Gly Ser Ile Leu Gln Thr Asn Phe Lys Ser Leu Ser Ser
450 455 460
Thr Glu Phe Ile Pro Asn Leu Phe Cys Met Leu Leu Leu Ile His Ser
465 470 475 480
Asp Glu His His His Asp Asp Ser Leu Pro His Pro Gln Gln Ala Thr
485 490 495
Asp Asp Ser Gly His Glu Ser Asp Ser Asn Ser Asn Glu Gly Arg His
500 505 510
His Leu Leu Val Ser Gly Ala Gln Val Pro Glu Pro Pro Thr Ile His
515 520 525
Leu Ala Ala Gln Gly Met Ala Tyr Pro Leu His Glu Gln His Gly Met
530 535 540
Ala Pro Cys Pro Val Ala Gln Ala Pro Pro Thr Pro Leu Pro Phe Phe
545 550 555 560
Ala Ile Cys Leu Thr Trp Arg Ile Glu Asp Pro Pro Phe Asn Ser Leu
565 570 575
Leu Phe Ala Leu Leu Ala Ala Ala Gly Gly Leu Gln Gly Ile Tyr Val
580 585 590
Leu Val Met Leu Val Leu Leu Ile Leu Ala Tyr Arg Arg Arg Trp Arg
595 600 605
Arg Leu Thr Val Cys Gly Gly Ile Met Phe Leu Ala Cys Val Leu Val
610 615 620
Leu Ile Val Asp Ala Val Leu Gln Leu Ser Pro Leu Leu Gly Ala Val
625 630 635 640
Thr Val Val Ser Met Thr Leu Leu Leu Leu Ala Phe Asn Gly Pro His
645 650 655
Asp Pro Leu Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro Gln
660 665 670
Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro His Asp Pro Leu Pro His
675 680 685
Ser Pro Ser Asp Ser Ala Gly Asn Asp Gly Gly Pro Pro Gln Leu Thr
690 695 700
Glu Glu Val Glu Asn Lys Gly Gly Asp Gln Gly Pro Pro Leu Met Thr
705 710 715 720
Asp Gly Gly Gly Gly His Ser His Asp Ser Gly His Gly Gly Gly Asp
725 730 735
Pro His Leu Pro Thr Leu Leu Leu Gly Ser Ser Gly Ser Gly Gly Asp
740 745 750
Asp Asp Asp Pro His Gly Pro Val Gln Leu Ser Tyr Tyr Asp Gly Lys
755 760 765
Arg Thr Glu Gln Gly Lys Glu Val Leu Glu Lys Ala Arg Gly Ser Thr
770 775 780
Tyr Gly Thr Pro Arg Pro Pro Met Ser Asp Trp Thr Gly Gly Ala Leu
785 790 795 800
Leu Val Leu Tyr Ser Phe Ala Leu Met Leu Ile Ile Ile Ile Leu Ile
805 810 815
Ile Phe Ile Phe Arg Arg Asp Leu Leu Cys Pro Leu Gly Ala Leu Cys
820 825 830
Ile Leu Leu Leu Met Ile Thr Leu Leu Leu Ile Ala Leu Trp Asn Leu
835 840 845
His Gly Gln Ala Leu Met Ser Asp Glu Gly Pro Gly Thr Gly Pro Gly
850 855 860
Asn Gly Leu Gly Glu Lys Gly Asp Thr Ser Gly Pro Glu Gly Ser Gly
865 870 875 880
Gly Ser Gly Pro Gln Arg Arg Gly Gly Asp Asn His Gly Arg Gly Arg
885 890 895
Gly Arg Gly Arg Gly Arg Gly Gly Gly Arg Pro Gly Ala Pro Gly Gly
900 905 910
Ser Gly Ser Gly Pro Arg His Arg Asp Gly Val Arg Arg Pro Gln Lys
915 920 925
Arg Pro Ser Cys Ile Gly Cys Lys Gly Thr His Trp Ile Asp Asp Asn
930 935 940
Pro Ser Thr Glu Thr Ala Gln Ala Trp Asn Ala Gly Phe Leu Arg Gly
945 950 955 960
Arg Ala Tyr Gly Ile Asp Leu Leu Arg Thr Glu Gly Glu His Val Glu
965 970 975
Gly Ala Thr Gly Glu Thr Arg Glu Glu Ser Glu Asp Thr Glu Ser Asp
980 985 990
Gly Asp Asp Glu Asp Leu Pro Cys Ile Val Ser Arg Gly Gly Pro Lys
995 1000 1005
Val Lys Arg Pro Pro Ile Phe Ile Arg Arg Leu His Arg Leu Leu
1010 1015 1020
Leu Met Arg Ala Met Asn Pro Val Cys Leu Pro Val Ile Val Ala
1025 1030 1035
Pro Tyr Leu Phe Trp Leu Ala Ala Ile Ala Ala Ser Cys Phe Thr
1040 1045 1050
Ala Ser Val Ser Thr Val Val Thr Ala Thr Gly Leu Ala Leu Ser
1055 1060 1065
Leu Leu Leu Leu Ala Ala Val Ala Ser Ser Tyr Ala Ala Ala Gln
1070 1075 1080
Arg Lys Leu Leu Thr Pro Val Thr Val Leu Thr Ala Val Val Thr
1085 1090 1095
Thr Phe Ser Ala Gly Thr Phe Lys Leu Pro Arg Cys Thr Pro Gly
1100 1105 1110
Asp Arg Gln Trp Leu Tyr Val Gln Ser Ser Val Gly Asn Ile Val
1115 1120 1125
Gln Ser Cys Asn Pro Arg Tyr Ser Ile Phe Phe Asp Tyr Met Ala
1130 1135 1140
Ile His Arg Ser Leu Thr Lys Ile Trp Glu
1145 1150
<210> 25
<211> 3459
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 25
atgagacctg ctccctggac acctaatcct cccaggtccc ccagccagat gagcgtgaga 60
gacagactgg ctaggctgag agccgaggct caggtcaagc aggccagcgt cgaggtgcaa 120
ccccctcagc tcacccaggt gtccccccag cagcctgtgg ccggcattct gttcattctg 180
gccattctga ccgagtgggg aagcggcaac agaacctacg gccctgtctt catgtgcctc 240
ggaggactgc tgacaatggt ggctggcgcc gtgtggctca ccgtcatgtc caacaccctg 300
ctcagcgcct ggattctgac cgccggattc ctgatctttc tgatcggatt cgctctcttt 360
ggcgtcatca ggtgttgcag gtactgttgc tactactgcc tgaccctcga gagcgaggaa 420
agacccccca ccccctacag gaatacagtg attagggaca gaaggaggaa tcctgcctcc 480
aggagagacc aggccaaatg gagactccaa acactcgccg ctggatggcc catgggctac 540
caggcctata gctcctggat gtacagctac accgaccatc agacaacacc caccttcgtg 600
catctgcagg ctacactggg ctgcaccgga ggcagaaggt gtcacgtgtt tctgggaatc 660
gtgctgttca tctttggatg cctgctcgtg ctgggcatct ggatttatct cctggagatg 720
ctctggagac tcggcgctac aatttggcag ctgctcgcct tttttctggc cttctttctg 780
gacctgatcc tcctgatcat cgccctgtac ctccaacaga actggtggac cctcctggtg 840
gatctgctgt ggctcctcct cttcctggcc atcctgatct ggatgtacta ccatggccag 900
agaggaaggg tcgcttgcgc tcctgtccct gctcctgctg gccccatcgt gaggccttgg 960
gagccttccc tcacacaggc cgccggccag gcctttgctc ccgtgaggcc ccagcacatg 1020
cctgtggaac ccgtgcccgt ccccacagtg gctctggaaa ggcctgtgta ccccaagccc 1080
gtgagacctg tcctctggct cagcagccct ggaggactcg gaacactcgg agccgctctc 1140
ctgacactgg ccgctgctct ggctctgctg gctagcctga tcctgggaac cctcaacctc 1200
accaccatgt ttctcctcat gctcctgtgg accctcgtgg tgctgctcat ctgttccagc 1260
tgctccagct gccccctgag caagatcctg ctggccaggc tgttcctgta cgccctcgcc 1320
ctcctgctgc tggctagcgc cctgatcgct ggcggaagca tcctccagac caatttcaag 1380
agcctctcct ccaccgagtt catccccaac ctgttctgta tgttactgct gatccatagc 1440
gacgagcacc atcatgacga ctccctgccc catcctcagc aggccacaga cgactccggc 1500
cacgagagcg acagcaatag caatgagggc aggcaccatc tgctcgtgtc cggagctcaa 1560
gtccccgagc ctcccaccat ccatctcgcc gcccagggaa tggcttaccc cctccacgag 1620
cagcacggca tggccccttg tcccgtcgct caagcccccc ctacacctct gccctttttc 1680
gccatttgtc tgacctggag aatcgaggac ccccccttca acagcctgct gttcgccctg 1740
ctcgccgccg ctggcggcct ccagggcatt tacgtcctcg tgatgctggt gctgctgatc 1800
ctcgcttaca ggagaagatg gaggagactg acagtgtgcg gcggcatcat gtttctcgcc 1860
tgcgtcctgg tcctgatcgt ggacgccgtc ctgcaactca gccccctcct gggagctgtg 1920
acagtggtct ccatgaccct gctgctgctg gccttcaacg gaccccacga tcctctgccc 1980
caagatcctg acaataccga cgataacggc ccccaagacc ccgataacac cgacgacaat 2040
ggccctcacg accctctgcc ccatagccct tccgatagcg ctggcaacga tggcggccct 2100
cctcagctga cagaggaggt ggaaaataag ggcggcgatc agggaccccc cctgatgaca 2160
gatggcggag gaggacacag ccatgatagc ggacatggcg gaggcgatcc ccatctgcct 2220
accctcctcc tgggcagctc cggttctgga ggcgacgatg atgaccctca cggccctgtg 2280
cagctctcct actacgacgg caaaaggacc gaacaaggaa aagaggtcct ggagaaggcc 2340
aggggcagca catacggaac ccccaggcct cccatgtccg attggaccgg aggagccctg 2400
ctggtcctct acagcttcgc cctgatgctg atcattatca tcctgatcat ctttatcttc 2460
agaagggacc tgctgtgccc tctcggcgcc ctgtgcatcc tgctgctcat gatcacactc 2520
ctcctgatcg ccctctggaa cctgcacgga caagccctga tgtccgatga gggacctgga 2580
acaggacccg gaaacggact gggcgagaag ggagatacaa gcggccccga aggcagcggc 2640
ggaagcggac cccaaagaag gggcggcgac aaccacggaa gaggaagagg caggggcaga 2700
ggcagaggag gaggaagacc tggagcccct ggcggttctg gaagcggacc caggcacagg 2760
gacggagtga ggaggcctca aaaaagaccc agctgcatcg gctgcaaggg aacccactgg 2820
attgatgata acccctccac agagaccgct caggcctgga acgccggctt cctgagggga 2880
agagcctatg gcatcgatct gctgaggacc gagggcgaac acgtggaggg agccaccgga 2940
gagacaaggg aggaaagcga agacacagaa agcgatggcg acgacgaaga cctgccctgc 3000
attgtgtcca ggggcggacc caaggtgaag aggcccccta tctttatcag aaggctccat 3060
agactgctcc tgatgagggc catgaaccct gtgtgcctgc ccgtgatcgt ggccccctac 3120
ctcttttggc tggccgccat tgccgctagc tgcttcaccg cctccgtgtc cacagtggtg 3180
acagccaccg gcctcgccct gagcctgctg ctcctcgctg ccgtggcctc cagctacgcc 3240
gctgctcaaa gaaagctcct gacccctgtc accgtcctga cagccgtcgt gaccaccttt 3300
tccgctggca ccttcaagct gcctaggtgc acacctggcg acaggcagtg gctctacgtg 3360
cagagctccg tgggcaatat tgtgcagagc tgcaatccca ggtacagcat ttttttcgac 3420
tacatggcca tccataggtc cctcaccaag atctgggag 3459
<210> 26
<211> 1270
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 26
Met Arg Pro Ala Pro Trp Thr Pro Asn Pro Pro Arg Ser Pro Ser Gln
1 5 10 15
Met Ser Val Arg Asp Arg Leu Ala Arg Leu Arg Ala Glu Ala Gln Val
20 25 30
Lys Gln Ala Ser Val Glu Val Gln Pro Pro Gln Leu Thr Gln Val Ser
35 40 45
Pro Gln Gln Pro Val Ala Gly Ile Leu Phe Ile Leu Ala Ile Leu Thr
50 55 60
Glu Trp Gly Ser Gly Asn Arg Thr Tyr Gly Pro Val Phe Met Cys Leu
65 70 75 80
Gly Gly Leu Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Met
85 90 95
Ser Asn Thr Leu Leu Ser Ala Trp Ile Leu Thr Ala Gly Phe Leu Ile
100 105 110
Phe Leu Ile Gly Phe Ala Leu Phe Gly Val Ile Arg Cys Cys Arg Tyr
115 120 125
Cys Cys Tyr Tyr Cys Leu Thr Leu Glu Ser Glu Glu Arg Pro Pro Thr
130 135 140
Pro Tyr Arg Asn Thr Val Arg Lys Pro Gln Gln Pro Glu Ser Leu Glu
145 150 155 160
Glu Cys Asp Ser Glu Leu Glu Ile Lys Arg Tyr Lys Asn Arg Val Ala
165 170 175
Ser Arg Lys Cys Arg Ala Lys Phe Lys Gln Leu Leu Gln His Tyr Arg
180 185 190
Glu Val Ala Ala Ala Lys Ser Ser Glu Ile Arg Asp Arg Arg Arg Asn
195 200 205
Pro Ala Ser Arg Arg Asp Gln Ala Lys Trp Arg Leu Gln Thr Leu Ala
210 215 220
Ala Gly Trp Pro Met Gly Tyr Gln Ala Tyr Ser Ser Trp Met Tyr Ser
225 230 235 240
Tyr Thr Asp His Gln Thr Thr Pro Thr Phe Val His Leu Gln Ala Thr
245 250 255
Leu Gly Cys Thr Gly Gly Arg Arg Cys His Val Phe Leu Gly Ile Val
260 265 270
Leu Phe Ile Phe Gly Cys Leu Leu Val Leu Gly Ile Trp Ile Tyr Leu
275 280 285
Leu Glu Met Leu Trp Arg Leu Gly Ala Thr Ile Trp Gln Leu Leu Ala
290 295 300
Phe Phe Leu Ala Phe Phe Leu Asp Leu Ile Leu Leu Ile Ile Ala Leu
305 310 315 320
Tyr Leu Gln Gln Asn Trp Trp Thr Leu Leu Val Asp Leu Leu Trp Leu
325 330 335
Leu Leu Phe Leu Ala Ile Leu Ile Trp Met Tyr Tyr His Gly Gln Arg
340 345 350
Gly Arg Val Ala Cys Ala Pro Val Pro Ala Pro Ala Gly Pro Ile Val
355 360 365
Arg Pro Trp Glu Pro Ser Leu Thr Gln Ala Ala Gly Gln Ala Phe Ala
370 375 380
Pro Val Arg Pro Gln His Met Pro Val Glu Pro Val Pro Val Pro Thr
385 390 395 400
Val Ala Leu Glu Arg Pro Val Tyr Pro Lys Pro Val Arg Pro Val Leu
405 410 415
Trp Leu Ser Ser Pro Gly Gly Leu Gly Thr Leu Gly Ala Ala Leu Leu
420 425 430
Thr Leu Ala Ala Ala Leu Ala Leu Leu Ala Ser Leu Ile Leu Gly Thr
435 440 445
Leu Asn Leu Thr Thr Met Phe Leu Leu Met Leu Leu Trp Thr Leu Val
450 455 460
Val Leu Leu Ile Cys Ser Ser Cys Ser Ser Cys Pro Leu Ser Lys Ile
465 470 475 480
Leu Leu Ala Arg Leu Phe Leu Tyr Ala Leu Ala Leu Leu Leu Leu Ala
485 490 495
Ser Ala Leu Ile Ala Gly Gly Ser Ile Leu Gln Thr Asn Phe Lys Ser
500 505 510
Leu Ser Ser Thr Glu Phe Ile Pro Asn Leu Phe Cys Met Leu Leu Leu
515 520 525
Ile His Ser Asp Glu His His His Asp Asp Ser Leu Pro His Pro Gln
530 535 540
Gln Ala Thr Asp Asp Ser Gly His Glu Ser Asp Ser Asn Ser Asn Glu
545 550 555 560
Gly Arg His His Leu Leu Val Ser Gly Ala Gln Val Pro Glu Pro Pro
565 570 575
Thr Ile His Leu Ala Ala Gln Gly Met Ala Tyr Pro Leu His Glu Gln
580 585 590
His Gly Met Ala Pro Cys Pro Val Ala Gln Ala Pro Pro Thr Pro Leu
595 600 605
Pro Phe Phe Ala Ile Cys Leu Thr Trp Arg Ile Glu Asp Pro Pro Phe
610 615 620
Asn Ser Leu Leu Phe Ala Leu Leu Ala Ala Ala Gly Gly Leu Gln Gly
625 630 635 640
Ile Tyr Val Leu Val Met Leu Val Leu Leu Ile Leu Ala Tyr Arg Arg
645 650 655
Arg Trp Arg Arg Leu Thr Val Cys Gly Gly Ile Met Phe Leu Ala Cys
660 665 670
Val Leu Val Leu Ile Val Asp Ala Val Leu Gln Leu Ser Pro Leu Leu
675 680 685
Gly Ala Val Thr Val Val Ser Met Thr Leu Leu Leu Leu Ala Phe Asn
690 695 700
Gly Pro His Asp Pro Leu Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn
705 710 715 720
Gly Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro His Asp Pro
725 730 735
Leu Pro His Ser Pro Ser Asp Ser Ala Gly Asn Asp Gly Gly Pro Pro
740 745 750
Gln Leu Thr Glu Glu Val Glu Asn Lys Gly Gly Asp Gln Gly Pro Pro
755 760 765
Leu Met Thr Asp Gly Gly Gly Gly His Ser His Asp Ser Gly His Gly
770 775 780
Gly Gly Asp Pro His Leu Pro Thr Leu Leu Leu Gly Ser Ser Gly Ser
785 790 795 800
Gly Gly Asp Asp Asp Asp Pro His Gly Pro Val Gln Leu Ser Tyr Tyr
805 810 815
Asp Gly Lys Arg Thr Glu Gln Gly Lys Glu Val Leu Glu Lys Ala Arg
820 825 830
Gly Ser Thr Tyr Gly Thr Pro Arg Pro Pro Met Ser Asp Trp Thr Gly
835 840 845
Gly Ala Leu Leu Val Leu Tyr Ser Phe Ala Leu Met Leu Ile Ile Ile
850 855 860
Ile Leu Ile Ile Phe Ile Phe Arg Arg Asp Leu Leu Cys Pro Leu Gly
865 870 875 880
Ala Leu Cys Ile Leu Leu Leu Met Ile Thr Leu Leu Leu Ile Ala Leu
885 890 895
Trp Asn Leu His Gly Gln Ala Leu Met Ser Asp Glu Gly Pro Gly Thr
900 905 910
Gly Pro Gly Asn Gly Leu Gly Glu Lys Gly Asp Thr Ser Gly Pro Glu
915 920 925
Gly Ser Gly Gly Ser Gly Pro Gln Arg Arg Gly Gly Asp Asn His Gly
930 935 940
Arg Gly Arg Gly Arg Gly Arg Gly Arg Gly Gly Gly Arg Pro Gly Ala
945 950 955 960
Pro Gly Gly Ser Gly Ser Gly Pro Arg His Arg Asp Gly Val Arg Arg
965 970 975
Pro Gln Lys Arg Pro Ser Cys Ile Gly Cys Lys Gly Thr His Trp Ile
980 985 990
Asp Asp Asn Pro Ser Thr Glu Thr Ala Gln Ala Trp Asn Ala Gly Phe
995 1000 1005
Leu Arg Gly Arg Ala Tyr Gly Ile Asp Leu Leu Arg Thr Glu Gly
1010 1015 1020
Glu His Val Glu Gly Ala Thr Gly Glu Thr Arg Glu Glu Ser Glu
1025 1030 1035
Asp Thr Glu Ser Asp Gly Asp Asp Glu Asp Leu Pro Cys Ile Val
1040 1045 1050
Ser Arg Gly Gly Pro Lys Val Lys Arg Pro Pro Ile Phe Ile Arg
1055 1060 1065
Arg Leu His Arg Leu Leu Leu Met Arg Ala Met Asn Pro Val Cys
1070 1075 1080
Leu Pro Val Ile Val Ala Pro Tyr Leu Phe Trp Leu Ala Ala Ile
1085 1090 1095
Ala Ala Ser Cys Phe Thr Ala Ser Val Ser Thr Val Val Thr Ala
1100 1105 1110
Thr Gly Leu Ala Leu Ser Leu Leu Leu Leu Ala Ala Val Ala Ser
1115 1120 1125
Ser Tyr Ala Ala Ala Gln Arg Lys Leu Leu Thr Pro Val Thr Val
1130 1135 1140
Leu Thr Ala Val Val Thr Thr Phe Ser Ala Gly Thr Phe Lys Leu
1145 1150 1155
Pro Arg Cys Thr Pro Gly Asp Arg Gln Trp Leu Tyr Val Gln Ser
1160 1165 1170
Ser Val Gly Asn Ile Val Gln Ser Cys Asn Pro Arg Tyr Ser Ile
1175 1180 1185
Phe Phe Asp Tyr Met Ala Ile His Arg Ser Leu Thr Lys Ile Trp
1190 1195 1200
Glu Asp Leu Gly Gly Pro Ser Gln Ala Pro Leu Pro Cys Val Leu
1205 1210 1215
Trp Pro Val Leu Pro Glu Pro Leu Pro Gln Gly Gln Leu Thr Ala
1220 1225 1230
Tyr His Val Ser Thr Ala Pro Thr Gly Ser Trp Phe Ser Ala Pro
1235 1240 1245
Gln Pro Ala Pro Glu Asn Ala Tyr Gln Ala Tyr Ala Ala Pro Gln
1250 1255 1260
Leu Phe Pro Val Ser Asp Ile
1265 1270
<210> 27
<211> 3810
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 27
atgagacctg ctccctggac acctaatcct cccaggtccc ccagccagat gagcgtgaga 60
gacagactgg ctaggctgag agccgaggct caggtcaagc aggccagcgt cgaggtgcaa 120
ccccctcagc tcacccaggt gtccccccag cagcctgtgg ccggcattct gttcattctg 180
gccattctga ccgagtgggg aagcggcaac agaacctacg gccctgtctt catgtgcctc 240
ggaggactgc tgacaatggt ggctggcgcc gtgtggctca ccgtcatgtc caacaccctg 300
ctcagcgcct ggattctgac cgccggattc ctgatctttc tgatcggatt cgctctcttt 360
ggcgtcatca ggtgttgcag gtactgttgc tactactgcc tgaccctcga gagcgaggaa 420
agacccccca ccccctacag gaatacagtg aggaaacctc agcagcccga gagcctcgag 480
gagtgcgata gcgagctgga gattaaaagg tataagaata gggtggcctc caggaagtgt 540
agggctaaat tcaaacagct cctgcaacac tatagggaag tggccgccgc caagtccagc 600
gagattaggg acagaaggag gaatcctgcc tccaggagag accaggccaa atggagactc 660
caaacactcg ccgctggatg gcccatgggc taccaggcct atagctcctg gatgtacagc 720
tacaccgacc atcagacaac acccaccttc gtgcatctgc aggctacact gggctgcacc 780
ggaggcagaa ggtgtcacgt gtttctggga atcgtgctgt tcatctttgg atgcctgctc 840
gtgctgggca tctggattta tctcctggag atgctctgga gactcggcgc tacaatttgg 900
cagctgctcg ccttttttct ggccttcttt ctggacctga tcctcctgat catcgccctg 960
tacctccaac agaactggtg gaccctcctg gtggatctgc tgtggctcct cctcttcctg 1020
gccatcctga tctggatgta ctaccatggc cagagaggaa gggtcgcttg cgctcctgtc 1080
cctgctcctg ctggccccat cgtgaggcct tgggagcctt ccctcacaca ggccgccggc 1140
caggcctttg ctcccgtgag gccccagcac atgcctgtgg aacccgtgcc cgtccccaca 1200
gtggctctgg aaaggcctgt gtaccccaag cccgtgagac ctgtcctctg gctcagcagc 1260
cctggaggac tcggaacact cggagccgct ctcctgacac tggccgctgc tctggctctg 1320
ctggctagcc tgatcctggg aaccctcaac ctcaccacca tgtttctcct catgctcctg 1380
tggaccctcg tggtgctgct catctgttcc agctgctcca gctgccccct gagcaagatc 1440
ctgctggcca ggctgttcct gtacgccctc gccctcctgc tgctggctag cgccctgatc 1500
gctggcggaa gcatcctcca gaccaatttc aagagcctct cctccaccga gttcatcccc 1560
aacctgttct gtatgttact gctgatccat agcgacgagc accatcatga cgactccctg 1620
ccccatcctc agcaggccac agacgactcc ggccacgaga gcgacagcaa tagcaatgag 1680
ggcaggcacc atctgctcgt gtccggagct caagtccccg agcctcccac catccatctc 1740
gccgcccagg gaatggctta ccccctccac gagcagcacg gcatggcccc ttgtcccgtc 1800
gctcaagccc cccctacacc tctgcccttt ttcgccattt gtctgacctg gagaatcgag 1860
gaccccccct tcaacagcct gctgttcgcc ctgctcgccg ccgctggcgg cctccagggc 1920
atttacgtcc tcgtgatgct ggtgctgctg atcctcgctt acaggagaag atggaggaga 1980
ctgacagtgt gcggcggcat catgtttctc gcctgcgtcc tggtcctgat cgtggacgcc 2040
gtcctgcaac tcagccccct cctgggagct gtgacagtgg tctccatgac cctgctgctg 2100
ctggccttca acggacccca cgatcctctg ccccaagatc ctgacaatac cgacgataac 2160
ggcccccaag accccgataa caccgacgac aatggccctc acgaccctct gccccatagc 2220
ccttccgata gcgctggcaa cgatggcggc cctcctcagc tgacagagga ggtggaaaat 2280
aagggcggcg atcagggacc ccccctgatg acagatggcg gaggaggaca cagccatgat 2340
agcggacatg gcggaggcga tccccatctg cctaccctcc tcctgggcag ctccggttct 2400
ggaggcgacg atgatgaccc tcacggccct gtgcagctct cctactacga cggcaaaagg 2460
accgaacaag gaaaagaggt cctggagaag gccaggggca gcacatacgg aacccccagg 2520
cctcccatgt ccgattggac cggaggagcc ctgctggtcc tctacagctt cgccctgatg 2580
ctgatcatta tcatcctgat catctttatc ttcagaaggg acctgctgtg ccctctcggc 2640
gccctgtgca tcctgctgct catgatcaca ctcctcctga tcgccctctg gaacctgcac 2700
ggacaagccc tgatgtccga tgagggacct ggaacaggac ccggaaacgg actgggcgag 2760
aagggagata caagcggccc cgaaggcagc ggcggaagcg gaccccaaag aaggggcggc 2820
gacaaccacg gaagaggaag aggcaggggc agaggcagag gaggaggaag acctggagcc 2880
cctggcggtt ctggaagcgg acccaggcac agggacggag tgaggaggcc tcaaaaaaga 2940
cccagctgca tcggctgcaa gggaacccac tggattgatg ataacccctc cacagagacc 3000
gctcaggcct ggaacgccgg cttcctgagg ggaagagcct atggcatcga tctgctgagg 3060
accgagggcg aacacgtgga gggagccacc ggagagacaa gggaggaaag cgaagacaca 3120
gaaagcgatg gcgacgacga agacctgccc tgcattgtgt ccaggggcgg acccaaggtg 3180
aagaggcccc ctatctttat cagaaggctc catagactgc tcctgatgag ggccatgaac 3240
cctgtgtgcc tgcccgtgat cgtggccccc tacctctttt ggctggccgc cattgccgct 3300
agctgcttca ccgcctccgt gtccacagtg gtgacagcca ccggcctcgc cctgagcctg 3360
ctgctcctcg ctgccgtggc ctccagctac gccgctgctc aaagaaagct cctgacccct 3420
gtcaccgtcc tgacagccgt cgtgaccacc ttttccgctg gcaccttcaa gctgcctagg 3480
tgcacacctg gcgacaggca gtggctctac gtgcagagct ccgtgggcaa tattgtgcag 3540
agctgcaatc ccaggtacag catttttttc gactacatgg ccatccatag gtccctcacc 3600
aagatctggg aggatctggg aggcccttcc caggctcctc tgccctgcgt gctgtggcct 3660
gtgctgcctg agcctctgcc ccaaggccag ctgacagcct atcacgtgtc caccgctcct 3720
acaggttctt ggttcagcgc tccccagccc gctcccgaaa acgcttacca ggcttacgcc 3780
gccccccagc tgttccccgt ctccgacatc 3810
<210> 28
<211> 355
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 28
Met Ala Pro Arg Arg Arg Leu Ser Gly Pro Pro Trp Leu Thr Val Leu
1 5 10 15
Leu Leu Leu Ser Thr Leu Ser Val Ala Ala Leu Leu Ile Leu Phe Leu
20 25 30
Ile Phe Ser Ala Gly Ala Thr Ile Ser Thr Glu Ala Ser Leu Leu Val
35 40 45
Leu Leu Leu Leu Phe Val Thr Leu Leu Leu Pro Leu Leu Ser Ser Asn
50 55 60
Gly Leu Gln Leu Pro Ala Ala Leu Ile Leu Ile Gln Cys Phe Leu Leu
65 70 75 80
Ala Ala Asp Tyr Leu Ala Tyr Leu Ile Leu Pro Thr Ile Ser Glu Asp
85 90 95
Phe Leu Ile Leu Ile Ala Ile Leu Val Ile Val Ile Leu Val Gly Thr
100 105 110
Ile Thr Thr Leu Val Gly Ala Ile Gly Gly Ile Arg Ala Arg Arg Ser
115 120 125
Phe Leu Phe Ile Cys Ile Phe Phe Leu Phe Leu Ser Leu Phe Leu Thr
130 135 140
Ile Leu Ala Leu Leu Leu Gly Phe Ser Trp Leu Leu Leu Val Ala Ile
145 150 155 160
Leu Phe Trp Val Leu Trp Leu Val Ile Leu Ile Leu Leu Leu Leu Val
165 170 175
Tyr Pro Ile Pro His His Pro Leu Pro Thr Ser Leu Arg Phe Arg Met
180 185 190
Lys Gln Arg Val Ser Ser Asp Pro Thr Gly Ser Asp Arg Ser Pro Gln
195 200 205
Gly Ser His Asn Ser Leu Asn Ser Pro Asp Glu Glu Asp Pro Lys Asp
210 215 220
Asp Thr Lys Gln Pro Leu Cys Asn Met Thr Gln Gly Gly Pro Pro Val
225 230 235 240
Asn Gly Gln Leu Leu Gly Gln His Ala Gln Cys Pro Pro His Tyr Pro
245 250 255
Cys Cys His Ile Gln His Pro Asp Gly Glu Asp Ser Asp Gly Asp Asp
260 265 270
Gly Lys Ser Trp Gly Asp Ala Gly Glu Glu Asp Asn Gly Pro Asn Asp
275 280 285
Pro Asn Thr Asn Asn Gly Asn Glu Gly Gly Glu Gly Asp Asp Tyr Lys
290 295 300
Ser Trp Arg Lys Pro Glu Glu Glu Asp Asn Gly Pro Asn Asp Pro Asn
305 310 315 320
Thr Asn Asn Arg Ile Glu Asp Gly Asp Gly Asp Asp Gly Lys Ser Trp
325 330 335
Arg Asn Pro Glu Glu Glu Asp Asn Arg Lys Gln Asp Arg Leu Gly Thr
340 345 350
Lys Pro Phe
355
<210> 29
<211> 93
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 29
Met Ala Pro Arg Arg Arg Leu Ser Gly Pro Pro Trp Leu Thr Val Leu
1 5 10 15
Leu Leu Leu Ser Thr Leu Ser Val Ala Ala Leu Leu Ile Leu Phe Leu
20 25 30
Ile Phe Ser Ala Gly Ala Thr Ile Ser Thr Glu Ala Ser Leu Leu Val
35 40 45
Leu Leu Leu Leu Phe Val Thr Leu Leu Leu Pro Leu Leu Ser Ser Asn
50 55 60
Gly Leu Gln Leu Pro Ala Ala Leu Ile Leu Ile Gln Cys Phe Leu Leu
65 70 75 80
Ala Ala Asp Tyr Leu Ala Tyr Leu Ile Leu Pro Thr Ile
85 90
<210> 30
<211> 198
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 30
Ser Glu Asp Phe Leu Ile Leu Ile Ala Ile Leu Val Ile Val Ile Leu
1 5 10 15
Val Gly Thr Ile Thr Thr Leu Val Gly Ala Ile Gly Gly Ile Arg Ala
20 25 30
Arg Arg Ser Phe Leu Phe Ile Cys Ile Phe Phe Leu Phe Leu Ser Leu
35 40 45
Phe Leu Thr Ile Leu Ala Leu Leu Leu Gly Phe Ser Trp Leu Leu Leu
50 55 60
Val Ala Ile Leu Phe Trp Val Leu Trp Leu Val Ile Leu Ile Leu Leu
65 70 75 80
Leu Leu Val Tyr Pro Ile Pro His His Pro Leu Pro Thr Ser Leu Arg
85 90 95
Phe Arg Met Lys Gln Arg Val Ser Ser Asp Pro Thr Gly Ser Asp Arg
100 105 110
Ser Pro Gln Gly Ser His Asn Ser Leu Asn Ser Pro Asp Glu Glu Asp
115 120 125
Pro Lys Asp Asp Thr Lys Gln Pro Leu Cys Asn Met Thr Gln Gly Gly
130 135 140
Pro Pro Val Asn Gly Gln Leu Leu Gly Gln His Ala Gln Cys Pro Pro
145 150 155 160
His Tyr Pro Cys Cys His Ile Gln His Pro Asp Gly Glu Asp Ser Asp
165 170 175
Gly Asp Asp Gly Lys Ser Trp Gly Asp Ala Gly Glu Glu Asp Asn Gly
180 185 190
Pro Asn Asp Pro Asn Thr
195
<210> 31
<211> 64
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 31
Asn Asn Gly Asn Glu Gly Gly Glu Gly Asp Asp Tyr Lys Ser Trp Arg
1 5 10 15
Lys Pro Glu Glu Glu Asp Asn Gly Pro Asn Asp Pro Asn Thr Asn Asn
20 25 30
Arg Ile Glu Asp Gly Asp Gly Asp Asp Gly Lys Ser Trp Arg Asn Pro
35 40 45
Glu Glu Glu Asp Asn Arg Lys Gln Asp Arg Leu Gly Thr Lys Pro Phe
50 55 60
<210> 32
<211> 413
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 32
Met Ala Gly His Trp Tyr Glu Ser Val Ile Pro Gly Leu Phe Leu Cys
1 5 10 15
Pro Leu Ile Leu Pro Ser Leu Phe Trp Ile Cys Ser Leu Leu Thr Phe
20 25 30
Leu Val Gly His Gly Ala Asn Ile Val Ser Ala Val Leu Phe Leu Val
35 40 45
Leu Ala Trp Cys Leu Leu Ile Ala Asn Trp Asn Val Thr Arg Glu Asp
50 55 60
Phe Val Ser Gly Arg Arg Ser Ser Met Ser Ser Leu Ser Val Ala Ala
65 70 75 80
Ser Thr Ala Thr Ala Met Phe Ala Ser Phe Leu Thr Leu Ser Phe Asp
85 90 95
Gly Leu Gly Leu Leu Leu Phe Gly Thr Ala Leu Val Ile Gln Thr Ile
100 105 110
Tyr Val Leu Tyr Leu Val Val Met Glu Ile Thr Val Trp Ile Met Met
115 120 125
Phe Arg Tyr Leu His Phe Trp Ile Thr Leu Leu Phe Leu Leu Ser Pro
130 135 140
Ile Ile Leu Ser Val Ala Cys Leu Ile Ile Gln Ser Ser Ala Leu Leu
145 150 155 160
Ile Glu Ala Val Val Val Thr Thr Ile Thr Val Leu Ala Ile Phe Leu
165 170 175
Trp Leu Pro Pro Gln Gly Ala Glu Ala Asp Leu Gly Thr Ala Leu Leu
180 185 190
Ile Leu Asn Thr Ala Leu Cys Leu Val Val Leu Ile Leu Thr Ala Ile
195 200 205
Pro Thr Asp Ala Gln Ile Leu Thr Val Phe Cys Leu Phe Cys Gln Trp
210 215 220
Thr Leu Phe Ile Cys Leu Gly Ile Arg Met Ile Cys Asn Trp Arg Gly
225 230 235 240
Lys Leu Thr Arg Ile Ile Cys Leu Lys Phe Cys Leu Tyr Gly Leu Ile
245 250 255
Ser Ala Ser Leu Ser Phe Gly Trp Tyr Ala Phe Leu Lys Glu Val Thr
260 265 270
Leu Pro Thr Thr Ala Thr Val Asp Pro Arg Gln Leu Pro Leu Phe Leu
275 280 285
Phe Ile Leu Ser Ser Val Leu Val Ile Leu Ala Ile Met Met Glu Phe
290 295 300
Gln Thr Ser Ser Ser Leu Phe Ala Ala Leu Phe Val Ile Ile Ala Gly
305 310 315 320
Met Leu Cys Val Thr Val Gly Val Ile Phe Leu Leu Ala Gly Val Lys
325 330 335
Pro Leu Leu Ser Gly Met Ile Cys Ala Ser Gly Ile Thr Met Leu Val
340 345 350
Leu Gly Val Val Leu Leu Val Val Cys Thr Arg Ala Ser Thr Arg Glu
355 360 365
Ser Ile Tyr Glu Asp Leu Arg Tyr Pro Thr Arg Asp Ala Asn Gly Glu
370 375 380
Tyr Glu Asn Val Gly Tyr Pro Pro Arg Asp Gly Asp Ala Pro His Arg
385 390 395 400
Leu Gly Glu Pro Val Tyr Asp Asp Val Glu Gln Ala Thr
405 410
<210> 33
<211> 210
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 33
Met Ala Gly His Trp Tyr Glu Ser Val Ile Pro Gly Leu Phe Leu Cys
1 5 10 15
Pro Leu Ile Leu Pro Ser Leu Phe Trp Ile Cys Ser Leu Leu Thr Phe
20 25 30
Leu Val Gly His Gly Ala Asn Ile Val Ser Ala Val Leu Phe Leu Val
35 40 45
Leu Ala Trp Cys Leu Leu Ile Ala Asn Trp Asn Val Thr Arg Glu Asp
50 55 60
Phe Val Ser Gly Arg Arg Ser Ser Met Ser Ser Leu Ser Val Ala Ala
65 70 75 80
Ser Thr Ala Thr Ala Met Phe Ala Ser Phe Leu Thr Leu Ser Phe Asp
85 90 95
Gly Leu Gly Leu Leu Leu Phe Gly Thr Ala Leu Val Ile Gln Thr Ile
100 105 110
Tyr Val Leu Tyr Leu Val Val Met Glu Ile Thr Val Trp Ile Met Met
115 120 125
Phe Arg Tyr Leu His Phe Trp Ile Thr Leu Leu Phe Leu Leu Ser Pro
130 135 140
Ile Ile Leu Ser Val Ala Cys Leu Ile Ile Gln Ser Ser Ala Leu Leu
145 150 155 160
Ile Glu Ala Val Val Val Thr Thr Ile Thr Val Leu Ala Ile Phe Leu
165 170 175
Trp Leu Pro Pro Gln Gly Ala Glu Ala Asp Leu Gly Thr Ala Leu Leu
180 185 190
Ile Leu Asn Thr Ala Leu Cys Leu Val Val Leu Ile Leu Thr Ala Ile
195 200 205
Pro Thr
210
<210> 34
<211> 153
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 34
Asp Ala Gln Ile Leu Thr Val Phe Cys Leu Phe Cys Gln Trp Thr Leu
1 5 10 15
Phe Ile Cys Leu Gly Ile Arg Met Ile Cys Asn Trp Arg Gly Lys Leu
20 25 30
Thr Arg Ile Ile Cys Leu Lys Phe Cys Leu Tyr Gly Leu Ile Ser Ala
35 40 45
Ser Leu Ser Phe Gly Trp Tyr Ala Phe Leu Lys Glu Val Thr Leu Pro
50 55 60
Thr Thr Ala Thr Val Asp Pro Arg Gln Leu Pro Leu Phe Leu Phe Ile
65 70 75 80
Leu Ser Ser Val Leu Val Ile Leu Ala Ile Met Met Glu Phe Gln Thr
85 90 95
Ser Ser Ser Leu Phe Ala Ala Leu Phe Val Ile Ile Ala Gly Met Leu
100 105 110
Cys Val Thr Val Gly Val Ile Phe Leu Leu Ala Gly Val Lys Pro Leu
115 120 125
Leu Ser Gly Met Ile Cys Ala Ser Gly Ile Thr Met Leu Val Leu Gly
130 135 140
Val Val Leu Leu Val Val Cys Thr Arg
145 150
<210> 35
<211> 50
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 35
Ala Ser Thr Arg Glu Ser Ile Tyr Glu Asp Leu Arg Tyr Pro Thr Arg
1 5 10 15
Asp Ala Asn Gly Glu Tyr Glu Asn Val Gly Tyr Pro Pro Arg Asp Gly
20 25 30
Asp Ala Pro His Arg Leu Gly Glu Pro Val Tyr Asp Asp Val Glu Gln
35 40 45
Ala Thr
50
<210> 36
<211> 327
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 36
Met Pro Arg Gly Arg Ser Thr Gly Arg Lys Gly Arg Asp Thr Glu Lys
1 5 10 15
Glu Arg Ser Arg Ser Pro Leu Arg Ala Pro Gly Gly Ser Asp Gly Pro
20 25 30
Ser Thr Arg Ala Gly Cys Gly Ala Gly Pro Cys Gln Leu Ser Ser Pro
35 40 45
Ile Ala Gly Gly Ser Arg Gly Gly Arg Gly Gly Arg Gly Gly Arg Gly
50 55 60
Gly Ser Arg Gly Arg Gly Ala Ser Arg Gly Arg Gly Gly Arg Gly Gly
65 70 75 80
Arg Gly Gly Arg Gly Gly Arg Gly Gly Arg Gly Gly Arg Gly Gly Arg
85 90 95
Gly Ser Pro Gly Asp Asp Ser Pro Ser Pro Cys His His Arg Asp Glu
100 105 110
Pro Pro Ser Arg Ser Pro Ser Pro Gln Pro Thr Val Ser Glu Gln Ser
115 120 125
Gln Gln Ser Pro Arg Gln Gln Ser Pro Gln Gly Thr Ser Gln Gly Ser
130 135 140
Thr Arg Pro Gln Val Pro Gly Gly Ala Thr Thr Arg Lys Arg Gly Gly
145 150 155 160
Val Arg Gly Gln Pro Ala Lys Cys His Gly Lys Tyr Thr Thr Thr Ala
165 170 175
Glu Gly Leu Thr Ala Leu Leu Asn Arg Arg His Ser Pro Arg Thr Ser
180 185 190
Asn Glu Gly Arg Trp Met Asn Gly Val Met Ala Val Asn Leu Ser Lys
195 200 205
Trp Pro Leu Tyr Ser Leu Arg Arg Ala Leu Ala Leu Ala Ala Asn Glu
210 215 220
Val Arg Ile Ser Pro Leu Phe Arg Leu Pro Tyr Gly Ser Ala Phe Gly
225 230 235 240
Pro Gly Pro Gln Pro Gly Pro Ile Leu Glu Ser Ser Thr Trp Gly Phe
245 250 255
Leu Val Phe Thr Gln Thr Ser Leu Phe Ala Asp Asp Ile Ala Asp Ala
260 265 270
Ile Arg Asp Tyr Cys Thr Thr His Pro Gly Pro Thr Arg Asn Thr Gln
275 280 285
Val Val Leu Met Asn Phe Glu Gly Ser Gly Val Pro Leu Pro Met Phe
290 295 300
Phe Pro Pro Gly Glu Glu Thr Glu Glu Gln Arg Glu Gly Asp Arg Ala
305 310 315 320
Ser Asp Ser Asp Glu Ser Glu
325
<210> 37
<211> 51
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 37
Met Pro Arg Gly Arg Ser Thr Gly Arg Lys Gly Arg Asp Thr Glu Lys
1 5 10 15
Glu Arg Ser Arg Ser Pro Leu Arg Ala Pro Gly Gly Ser Asp Gly Pro
20 25 30
Ser Thr Arg Ala Gly Cys Gly Ala Gly Pro Cys Gln Leu Ser Ser Pro
35 40 45
Ile Ala Gly
50
<210> 38
<211> 119
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 38
Ser Pro Ser Pro Cys His His Arg Asp Glu Pro Pro Ser Arg Ser Pro
1 5 10 15
Ser Pro Gln Pro Thr Val Ser Glu Gln Ser Gln Gln Ser Pro Arg Gln
20 25 30
Gln Ser Pro Gln Gly Thr Ser Gln Gly Ser Thr Arg Pro Gln Val Pro
35 40 45
Gly Gly Ala Thr Thr Arg Lys Arg Gly Gly Val Arg Gly Gln Pro Ala
50 55 60
Lys Cys His Gly Lys Tyr Thr Thr Thr Ala Glu Gly Leu Thr Ala Leu
65 70 75 80
Leu Asn Arg Arg His Ser Pro Arg Thr Ser Asn Glu Gly Arg Trp Met
85 90 95
Asn Gly Val Met Ala Val Asn Leu Ser Lys Trp Pro Leu Tyr Ser Leu
100 105 110
Arg Arg Ala Leu Ala Leu Ala
115
<210> 39
<211> 106
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 39
Ala Asn Glu Val Arg Ile Ser Pro Leu Phe Arg Leu Pro Tyr Gly Ser
1 5 10 15
Ala Phe Gly Pro Gly Pro Gln Pro Gly Pro Ile Leu Glu Ser Ser Thr
20 25 30
Trp Gly Phe Leu Val Phe Thr Gln Thr Ser Leu Phe Ala Asp Asp Ile
35 40 45
Ala Asp Ala Ile Arg Asp Tyr Cys Thr Thr His Pro Gly Pro Thr Arg
50 55 60
Asn Thr Gln Val Val Leu Met Asn Phe Glu Gly Ser Gly Val Pro Leu
65 70 75 80
Pro Met Phe Phe Pro Pro Gly Glu Glu Thr Glu Glu Gln Arg Glu Gly
85 90 95
Asp Arg Ala Ser Asp Ser Asp Glu Ser Glu
100 105
<210> 40
<211> 252
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 40
Met Asp Leu Asp Gly Thr Gly Gly Gly Glu Gly Tyr Ser Gln Met Val
1 5 10 15
Pro Ile Ala Thr Ala Pro Gly Ser Gly His Ala Ala Thr Tyr Gln Asp
20 25 30
Leu Gln Ala Ala Pro Tyr Ile Ile Trp Pro Leu Gln Thr Asp Cys Gln
35 40 45
Pro Val Ala Thr Thr Phe Ala Ser Pro Gly Gln Ile Gln Trp Tyr Thr
50 55 60
Ser Ala Val Pro Gln Pro Thr Glu His Cys Ser Gln Phe Thr Asn Ala
65 70 75 80
Pro Thr Val Asn Gln Gln Gln Pro Ile Ser Gln Pro Gln Pro Glu Asn
85 90 95
Pro Pro Ala Phe Thr Phe Thr Gln Pro Ala Ser Ile Ile Pro Gly Val
100 105 110
Ile Ser Ala Ser Asn Leu Asn Val Ser Ala Ser Pro Ile Ile Pro Ser
115 120 125
Asp His Val Leu Pro Ile Ile Thr Ser Val Thr Ser Leu Ala Gln Pro
130 135 140
Asn Asn Asp Glu His Ala Ile Ser Ala Ser His His Ala Ser Asp Gly
145 150 155 160
Ser Val Asn Gln Gln Lys Glu Asn Gln Pro Gln Thr Leu Glu Glu Cys
165 170 175
Lys Thr Asp Gln Glu Arg Lys Arg Tyr Arg Asn Arg Leu Ala Ser Arg
180 185 190
Arg Cys Arg Ala Lys Phe Arg Asn Gln Leu Glu His Phe Arg Thr Val
195 200 205
Ala Ala Ala Lys Thr Glu Glu Asn Asn Arg Leu Arg Val Leu Ile Arg
210 215 220
Gln Met Cys Pro Thr Leu Asp Val Glu Ser Ile Val Pro Ser Thr Ser
225 230 235 240
Ala Gly Tyr His Glu Pro Leu Asn His Leu Thr His
245 250
<210> 41
<211> 146
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 41
Met Asp Leu Asp Gly Thr Gly Gly Gly Glu Gly Tyr Ser Gln Met Val
1 5 10 15
Pro Ile Ala Thr Ala Pro Gly Ser Gly His Ala Ala Thr Tyr Gln Asp
20 25 30
Leu Gln Ala Ala Pro Tyr Ile Ile Trp Pro Leu Gln Thr Asp Cys Gln
35 40 45
Pro Val Ala Thr Thr Phe Ala Ser Pro Gly Gln Ile Gln Trp Tyr Thr
50 55 60
Ser Ala Val Pro Gln Pro Thr Glu His Cys Ser Gln Phe Thr Asn Ala
65 70 75 80
Pro Thr Val Asn Gln Gln Gln Pro Ile Ser Gln Pro Gln Pro Glu Asn
85 90 95
Pro Pro Ala Phe Thr Phe Thr Gln Pro Ala Ser Ile Ile Pro Gly Val
100 105 110
Ile Ser Ala Ser Asn Leu Asn Val Ser Ala Ser Pro Ile Ile Pro Ser
115 120 125
Asp His Val Leu Pro Ile Ile Thr Ser Val Thr Ser Leu Ala Gln Pro
130 135 140
Asn Asn
145
<210> 42
<211> 106
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 42
Asp Glu His Ala Ile Ser Ala Ser His His Ala Ser Asp Gly Ser Val
1 5 10 15
Asn Gln Gln Lys Glu Asn Gln Pro Gln Thr Leu Glu Glu Cys Lys Thr
20 25 30
Asp Gln Glu Arg Lys Arg Tyr Arg Asn Arg Leu Ala Ser Arg Arg Cys
35 40 45
Arg Ala Lys Phe Arg Asn Gln Leu Glu His Phe Arg Thr Val Ala Ala
50 55 60
Ala Lys Thr Glu Glu Asn Asn Arg Leu Arg Val Leu Ile Arg Gln Met
65 70 75 80
Cys Pro Thr Leu Asp Val Glu Ser Ile Val Pro Ser Thr Ser Ala Gly
85 90 95
Tyr His Glu Pro Leu Asn His Leu Thr His
100 105
<210> 43
<211> 216
<212> PRT
<213> Callithrix jacchus
<400> 43
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
1 5 10 15
Leu Gly Gln Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
20 25 30
Val Tyr Thr Val Phe Ser Ile Leu Val Ala Leu Leu Leu Ala Gly Gln
35 40 45
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
50 55 60
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
65 70 75 80
Leu Pro Lys Pro Ala Lys Pro Leu Ser Gln Met Arg Met Ala Thr Pro
85 90 95
Leu Leu Met Gln Ala Leu Pro Met Ala Gly Leu Pro Gln Lys Pro Met
100 105 110
Gln Asn Ala Thr Lys His Gly Asn Met Thr Glu Asp His Val Met His
115 120 125
Leu Leu Leu Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
130 135 140
Ser Leu Ser Glu Asn Leu Lys His Leu Lys Asn Thr Met Glu Thr Met
145 150 155 160
Asp Trp Lys Val Phe Glu Ser Trp Leu His His Trp Leu Leu Phe Glu
165 170 175
Met Ser Lys His Ser Leu Glu Gln Lys Pro Thr Glu Ala Pro Pro Lys
180 185 190
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
195 200 205
Gln Asp Leu Gly Pro Val Ala Met
210 215
<210> 44
<211> 1045
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 44
Met Ser Glu Asp Phe Leu Ile Leu Ile Ala Ile Leu Val Ile Val Ile
1 5 10 15
Leu Val Gly Thr Ile Thr Thr Leu Val Gly Ala Ile Gly Gly Ile Arg
20 25 30
Ala Arg Arg Ser Phe Leu Phe Ile Cys Ile Phe Phe Leu Phe Leu Ser
35 40 45
Leu Phe Leu Thr Ile Leu Ala Leu Leu Leu Gly Phe Ser Trp Leu Leu
50 55 60
Leu Val Ala Ile Leu Phe Trp Val Leu Trp Leu Val Ile Leu Ile Leu
65 70 75 80
Leu Leu Leu Val Tyr Pro Ile Pro His His Pro Leu Pro Thr Ser Leu
85 90 95
Arg Phe Arg Met Lys Gln Arg Val Ser Ser Asp Pro Thr Gly Ser Asp
100 105 110
Arg Ser Pro Gln Gly Ser His Asn Ser Leu Asn Ser Pro Asp Glu Glu
115 120 125
Asp Pro Lys Asp Asp Thr Lys Gln Pro Leu Cys Asn Met Thr Gln Gly
130 135 140
Gly Pro Pro Val Asn Gly Gln Leu Leu Gly Gln His Ala Gln Cys Pro
145 150 155 160
Pro His Tyr Pro Cys Cys His Ile Gln His Pro Asp Gly Glu Asp Ser
165 170 175
Asp Gly Asp Asp Gly Lys Ser Trp Gly Asp Ala Gly Glu Glu Asp Asn
180 185 190
Gly Pro Asn Asp Pro Asn Thr Ala Ser Thr Arg Glu Ser Ile Tyr Glu
195 200 205
Asp Leu Arg Tyr Pro Thr Arg Asp Ala Asn Gly Glu Tyr Glu Asn Val
210 215 220
Gly Tyr Pro Pro Arg Asp Gly Asp Ala Pro His Arg Leu Gly Glu Pro
225 230 235 240
Val Tyr Asp Asp Val Glu Gln Ala Thr Ala Asn Glu Val Arg Ile Ser
245 250 255
Pro Leu Phe Arg Leu Pro Tyr Gly Ser Ala Phe Gly Pro Gly Pro Gln
260 265 270
Pro Gly Pro Ile Leu Glu Ser Ser Thr Trp Gly Phe Leu Val Phe Thr
275 280 285
Gln Thr Ser Leu Phe Ala Asp Asp Ile Ala Asp Ala Ile Arg Asp Tyr
290 295 300
Cys Thr Thr His Pro Gly Pro Thr Arg Asn Thr Gln Val Val Leu Met
305 310 315 320
Asn Phe Glu Gly Ser Gly Val Pro Leu Pro Met Phe Phe Pro Pro Gly
325 330 335
Glu Glu Thr Glu Glu Gln Arg Glu Gly Asp Arg Ala Ser Asp Ser Asp
340 345 350
Glu Ser Glu Asp Ala Gln Ile Leu Thr Val Phe Cys Leu Phe Cys Gln
355 360 365
Trp Thr Leu Phe Ile Cys Leu Gly Ile Arg Met Ile Cys Asn Trp Arg
370 375 380
Gly Lys Leu Thr Arg Ile Ile Cys Leu Lys Phe Cys Leu Tyr Gly Leu
385 390 395 400
Ile Ser Ala Ser Leu Ser Phe Gly Trp Tyr Ala Phe Leu Lys Glu Val
405 410 415
Thr Leu Pro Thr Thr Ala Thr Val Asp Pro Arg Gln Leu Pro Leu Phe
420 425 430
Leu Phe Ile Leu Ser Ser Val Leu Val Ile Leu Ala Ile Met Met Glu
435 440 445
Phe Gln Thr Ser Ser Ser Leu Phe Ala Ala Leu Phe Val Ile Ile Ala
450 455 460
Gly Met Leu Cys Val Thr Val Gly Val Ile Phe Leu Leu Ala Gly Val
465 470 475 480
Lys Pro Leu Leu Ser Gly Met Ile Cys Ala Ser Gly Ile Thr Met Leu
485 490 495
Val Leu Gly Val Val Leu Leu Val Val Cys Thr Arg Ser Pro Ser Pro
500 505 510
Cys His His Arg Asp Glu Pro Pro Ser Arg Ser Pro Ser Pro Gln Pro
515 520 525
Thr Val Ser Glu Gln Ser Gln Gln Ser Pro Arg Gln Gln Ser Pro Gln
530 535 540
Gly Thr Ser Gln Gly Ser Thr Arg Pro Gln Val Pro Gly Gly Ala Thr
545 550 555 560
Thr Arg Lys Arg Gly Gly Val Arg Gly Gln Pro Ala Lys Cys His Gly
565 570 575
Lys Tyr Thr Thr Thr Ala Glu Gly Leu Thr Ala Leu Leu Asn Arg Arg
580 585 590
His Ser Pro Arg Thr Ser Asn Glu Gly Arg Trp Met Asn Gly Val Met
595 600 605
Ala Val Asn Leu Ser Lys Trp Pro Leu Tyr Ser Leu Arg Arg Ala Leu
610 615 620
Ala Leu Ala Met Ala Pro Arg Arg Arg Leu Ser Gly Pro Pro Trp Leu
625 630 635 640
Thr Val Leu Leu Leu Leu Ser Thr Leu Ser Val Ala Ala Leu Leu Ile
645 650 655
Leu Phe Leu Ile Phe Ser Ala Gly Ala Thr Ile Ser Thr Glu Ala Ser
660 665 670
Leu Leu Val Leu Leu Leu Leu Phe Val Thr Leu Leu Leu Pro Leu Leu
675 680 685
Ser Ser Asn Gly Leu Gln Leu Pro Ala Ala Leu Ile Leu Ile Gln Cys
690 695 700
Phe Leu Leu Ala Ala Asp Tyr Leu Ala Tyr Leu Ile Leu Pro Thr Ile
705 710 715 720
Met Pro Arg Gly Arg Ser Thr Gly Arg Lys Gly Arg Asp Thr Glu Lys
725 730 735
Glu Arg Ser Arg Ser Pro Leu Arg Ala Pro Gly Gly Ser Asp Gly Pro
740 745 750
Ser Thr Arg Ala Gly Cys Gly Ala Gly Pro Cys Gln Leu Ser Ser Pro
755 760 765
Ile Ala Gly Asn Asn Gly Asn Glu Gly Gly Glu Gly Asp Asp Tyr Lys
770 775 780
Ser Trp Arg Lys Pro Glu Glu Glu Asp Asn Gly Pro Asn Asp Pro Asn
785 790 795 800
Thr Asn Asn Arg Ile Glu Asp Gly Asp Gly Asp Asp Gly Lys Ser Trp
805 810 815
Arg Asn Pro Glu Glu Glu Asp Asn Arg Lys Gln Asp Arg Leu Gly Thr
820 825 830
Lys Pro Phe Met Ala Gly His Trp Tyr Glu Ser Val Ile Pro Gly Leu
835 840 845
Phe Leu Cys Pro Leu Ile Leu Pro Ser Leu Phe Trp Ile Cys Ser Leu
850 855 860
Leu Thr Phe Leu Val Gly His Gly Ala Asn Ile Val Ser Ala Val Leu
865 870 875 880
Phe Leu Val Leu Ala Trp Cys Leu Leu Ile Ala Asn Trp Asn Val Thr
885 890 895
Arg Glu Asp Phe Val Ser Gly Arg Arg Ser Ser Met Ser Ser Leu Ser
900 905 910
Val Ala Ala Ser Thr Ala Thr Ala Met Phe Ala Ser Phe Leu Thr Leu
915 920 925
Ser Phe Asp Gly Leu Gly Leu Leu Leu Phe Gly Thr Ala Leu Val Ile
930 935 940
Gln Thr Ile Tyr Val Leu Tyr Leu Val Val Met Glu Ile Thr Val Trp
945 950 955 960
Ile Met Met Phe Arg Tyr Leu His Phe Trp Ile Thr Leu Leu Phe Leu
965 970 975
Leu Ser Pro Ile Ile Leu Ser Val Ala Cys Leu Ile Ile Gln Ser Ser
980 985 990
Ala Leu Leu Ile Glu Ala Val Val Val Thr Thr Ile Thr Val Leu Ala
995 1000 1005
Ile Phe Leu Trp Leu Pro Pro Gln Gly Ala Glu Ala Asp Leu Gly
1010 1015 1020
Thr Ala Leu Leu Ile Leu Asn Thr Ala Leu Cys Leu Val Val Leu
1025 1030 1035
Ile Leu Thr Ala Ile Pro Thr
1040 1045
<210> 45
<211> 3135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 45
atgtccgagg actttctgat tctgatcgcc atcctggtga tcgtgattct cgtgggcaca 60
atcacaaccc tggtgggcgc catcggcggc attagggcca ggaggagctt cctcttcatt 120
tgcatcttct tcctgttcct ctccctcttc ctgacaatcc tcgccctgct gctgggcttc 180
agctggctcc tgctggtggc catcctgttc tgggtgctct ggctggtcat cctcattctg 240
ctgctgctgg tgtaccctat tcctcaccac cccctgccca cctccctcag gtttagaatg 300
aagcagaggg tgagcagcga ccccacaggt tctgacagaa gccctcaggg cagccataat 360
agcctgaact cccccgatga ggaggacccc aaggatgaca ccaagcaacc tctgtgcaac 420
atgacccagg gcggacctcc cgtcaatgga cagctcctcg gacaacatgc tcaatgcccc 480
cctcactatc cctgctgcca tattcagcat cccgacggag aggattccga tggagacgat 540
ggcaagtcct ggggcgatgc cggagaggaa gacaatggcc ctaacgaccc taacaccgcc 600
agcaccagag agtccattta cgaggacctc agatacccca caagggacgc caatggcgag 660
tatgagaacg tgggataccc ccctagggac ggagatgccc ctcataggct cggagagcct 720
gtgtatgacg atgtggagca agccaccgct aacgaggtga gaatctcccc tctgttcaga 780
ctgccctacg gaagcgcttt cggacctggc ccccagcctg gacccattct ggagagctcc 840
acatggggct ttctggtctt cacacagacc tccctgttcg ccgacgacat tgccgacgct 900
attagggact actgcacaac ccaccctggc cccacaagga acacccaggt ggtcctcatg 960
aacttcgagg gcagcggagt gcccctgcct atgttttttc cccctggaga ggagacagaa 1020
gagcagagag agggcgatag agctagcgac tccgacgagt ccgaagacgc tcagatcctg 1080
accgtgttct gcctgttttg ccagtggaca ctctttatct gcctgggaat caggatgatc 1140
tgtaactgga ggggcaaact caccaggatc atctgcctga agttctgcct ctacggactg 1200
atttccgcct ccctgtcctt cggctggtac gcttttctga aggaagtgac cctccccacc 1260
acagccaccg ttgatcctag gcaactcccc ctgttcctct tcatcctgag ctccgtgctg 1320
gtgattctcg ccatcatgat ggagtttcaa acatcctcca gcctcttcgc tgctctgttc 1380
gtgattatcg ccggaatgct gtgcgtcaca gtgggcgtga tttttctgct ggctggcgtc 1440
aagcctctcc tgagcggcat gatctgcgcc tccggcatca caatgctcgt gctcggcgtc 1500
gtgctgctgg tggtgtgcac cagaagcccc agcccttgtc atcacaggga tgaacccccc 1560
tccagaagcc ccagccctca acccaccgtc tccgagcagt cccagcagtc ccccaggcag 1620
cagagccctc aaggcacatc ccagggttct acaagacctc aggtgcctgg aggcgccacc 1680
accagaaaaa gaggcggcgt gagaggccaa cctgccaagt gtcacggcaa gtacaccaca 1740
accgccgagg gactgaccgc tctcctgaat aggaggcaca gccccaggac atccaacgag 1800
ggcaggtgga tgaatggagt catggctgtg aacctctcca aatggcccct gtacagcctg 1860
aggagagccc tggccctcgc catggctcct agaaggaggc tctccggccc tccctggctg 1920
acagtgctgc tgctgctgtc cacactgagc gtggccgccc tgctgattct cttcctgatt 1980
ttcagcgccg gcgccaccat tagcacagaa gccagcctgc tggtcctgct cctgctgttt 2040
gtgaccctgc tgctgcctct cctgtcctcc aacggactcc agctccctgc cgccctgatt 2100
ctgatccagt gtttcctcct ggccgctgat tatctcgcct acctgattct gcctaccatt 2160
atgcccaggg gcagaagcac aggaaggaag ggcagggaca cagagaaaga gaggagcaga 2220
tcccctctca gagctcctgg cggttctgat ggacccagca caagggctgg ctgtggagcc 2280
ggaccctgtc agctgagcag ccccatcgcc ggaaacaacg gcaatgaagg cggcgagggc 2340
gacgactaca agagctggag gaagcccgag gaagaggaca acggccccaa tgaccccaat 2400
accaacaaca ggattgagga tggagacggc gacgacggaa aatcctggag gaatcctgag 2460
gaggaggata acagaaagca ggacaggctg ggcaccaagc ctttcatggc cggccactgg 2520
tatgagagcg tgattcccgg cctgttcctc tgccccctga tcctcccttc cctgttctgg 2580
atttgctccc tgctgacctt cctggtgggc cacggagcca atattgtgag cgccgtcctg 2640
ttcctcgtgc tggcttggtg tctcctcatt gccaactgga acgtgacaag agaggacttc 2700
gtgtccggca ggagaagctc catgagcagc ctgtccgtgg ccgcttccac cgccacagcc 2760
atgttcgcca gcttcctcac cctgagcttt gatggcctgg gcctgctgct gtttggcacc 2820
gccctggtga tccagacaat ttacgtgctg tatctggtgg tcatggagat caccgtgtgg 2880
atcatgatgt ttaggtatct ccacttttgg atcaccctgc tgttcctgct gagccccatt 2940
attctctccg tcgcctgtct catcatccaa tcctccgccc tgctgatcga ggctgtggtc 3000
gtcaccacca tcacagtcct ggccattttt ctgtggctcc ctcctcaagg cgctgaggcc 3060
gatctcggca ccgccctgct gattctgaat accgccctgt gcctggtcgt gctgatcctg 3120
accgctatcc ctaca 3135
<210> 46
<211> 1270
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 46
Met Arg Pro Ala Pro Trp Thr Pro Asn Pro Pro Arg Ser Pro Ser Gln
1 5 10 15
Met Ser Val Arg Asp Arg Leu Ala Arg Leu Arg Ala Glu Ala Gln Val
20 25 30
Lys Gln Ala Ser Val Glu Val Gln Pro Pro Gln Leu Thr Gln Val Ser
35 40 45
Pro Gln Gln Pro Val Ala Gly Ile Leu Phe Ile Leu Ala Ile Leu Thr
50 55 60
Glu Trp Gly Ser Gly Asn Arg Thr Tyr Gly Pro Val Phe Met Cys Leu
65 70 75 80
Gly Gly Leu Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Met
85 90 95
Ser Asn Thr Leu Leu Ser Ala Trp Ile Leu Thr Ala Gly Phe Leu Ile
100 105 110
Phe Leu Ile Gly Phe Ala Leu Phe Gly Val Ile Arg Cys Cys Arg Tyr
115 120 125
Cys Cys Tyr Tyr Cys Leu Thr Leu Glu Ser Glu Glu Arg Pro Pro Thr
130 135 140
Pro Tyr Arg Asn Thr Val Arg Lys Pro Gln Gln Pro Glu Ser Leu Glu
145 150 155 160
Glu Cys Asp Ser Glu Leu Glu Ile Lys Arg Tyr Lys Asn Arg Val Ala
165 170 175
Ser Arg Lys Cys Arg Ala Lys Phe Lys Gln Leu Leu Gln His Tyr Arg
180 185 190
Glu Val Ala Ala Ala Lys Ser Ser Glu Ile Arg Asp Arg Arg Arg Asn
195 200 205
Pro Ala Ser Arg Arg Asp Gln Ala Lys Trp Arg Leu Gln Thr Leu Ala
210 215 220
Ala Gly Trp Pro Met Gly Tyr Gln Ala Tyr Ser Ser Trp Met Tyr Ser
225 230 235 240
Tyr Thr Asp His Gln Thr Thr Pro Thr Phe Val His Leu Gln Ala Thr
245 250 255
Leu Gly Cys Thr Gly Gly Arg Arg Cys His Val Phe Leu Gly Ile Val
260 265 270
Leu Phe Ile Phe Gly Cys Leu Leu Val Leu Gly Ile Trp Ile Tyr Leu
275 280 285
Leu Glu Met Leu Trp Arg Leu Gly Ala Thr Ile Trp Gln Leu Leu Ala
290 295 300
Phe Phe Leu Ala Phe Phe Leu Asp Leu Ile Leu Leu Ile Ile Ala Leu
305 310 315 320
Tyr Leu Gln Gln Asn Trp Trp Thr Leu Leu Val Asp Leu Leu Trp Leu
325 330 335
Leu Leu Phe Leu Ala Ile Leu Ile Trp Met Tyr Tyr His Gly Gln Arg
340 345 350
Gly Arg Val Ala Cys Ala Pro Val Pro Ala Pro Ala Gly Pro Ile Val
355 360 365
Arg Pro Trp Glu Pro Ser Leu Thr Gln Ala Ala Gly Gln Ala Phe Ala
370 375 380
Pro Val Arg Pro Gln His Met Pro Val Glu Pro Val Pro Val Pro Thr
385 390 395 400
Val Ala Leu Glu Arg Pro Val Tyr Pro Lys Pro Val Arg Pro Val Leu
405 410 415
Trp Leu Ser Ser Pro Gly Gly Leu Gly Thr Leu Gly Ala Ala Leu Leu
420 425 430
Thr Leu Ala Ala Ala Leu Ala Leu Leu Ala Ser Leu Ile Leu Gly Thr
435 440 445
Leu Asn Leu Thr Thr Met Phe Leu Leu Met Leu Leu Trp Thr Leu Val
450 455 460
Val Leu Leu Ile Cys Ser Ser Cys Ser Ser Cys Pro Leu Ser Lys Ile
465 470 475 480
Leu Leu Ala Arg Leu Phe Leu Tyr Ala Leu Ala Leu Leu Leu Leu Ala
485 490 495
Ser Ala Leu Ile Ala Gly Gly Ser Ile Leu Gln Thr Asn Phe Lys Ser
500 505 510
Leu Ser Ser Thr Glu Phe Ile Pro Asn Leu Phe Cys Met Leu Leu Leu
515 520 525
Ile His Ser Asp Glu His His His Asp Asp Ser Leu Pro His Pro Gln
530 535 540
Gln Ala Thr Asp Asp Ser Gly His Glu Ser Asp Ser Asn Ser Asn Glu
545 550 555 560
Gly Arg His His Leu Leu Val Ser Gly Ala Gln Val Pro Glu Pro Pro
565 570 575
Thr Ile His Leu Ala Ala Gln Gly Met Ala Tyr Pro Leu His Glu Gln
580 585 590
His Gly Met Ala Pro Cys Pro Val Ala Gln Ala Pro Pro Thr Pro Leu
595 600 605
Pro Phe Phe Ala Ile Cys Leu Thr Trp Arg Ile Glu Asp Pro Pro Phe
610 615 620
Asn Ser Leu Leu Phe Ala Leu Leu Ala Ala Ala Gly Gly Leu Gln Gly
625 630 635 640
Ile Tyr Val Leu Val Met Leu Val Leu Leu Ile Leu Ala Tyr Arg Arg
645 650 655
Arg Trp Arg Arg Leu Thr Val Cys Gly Gly Ile Met Phe Leu Ala Cys
660 665 670
Val Leu Val Leu Ile Val Asp Ala Val Leu Gln Leu Ser Pro Leu Leu
675 680 685
Gly Ala Val Thr Val Val Ser Met Thr Leu Leu Leu Leu Ala Phe Asn
690 695 700
Gly Pro His Asp Pro Leu Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn
705 710 715 720
Gly Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro His Asp Pro
725 730 735
Leu Pro His Ser Pro Ser Asp Ser Ala Gly Asn Asp Gly Gly Pro Pro
740 745 750
Gln Leu Thr Glu Glu Val Glu Asn Lys Gly Gly Asp Gln Gly Pro Pro
755 760 765
Leu Met Thr Asp Gly Gly Gly Gly His Ser His Asp Ser Gly His Gly
770 775 780
Gly Gly Asp Pro His Leu Pro Thr Leu Leu Leu Gly Ser Ser Gly Ser
785 790 795 800
Gly Gly Asp Asp Asp Asp Pro His Gly Pro Val Gln Leu Ser Tyr Tyr
805 810 815
Asp Gly Lys Arg Thr Glu Gln Gly Lys Glu Val Leu Glu Lys Ala Arg
820 825 830
Gly Ser Thr Tyr Gly Thr Pro Arg Pro Pro Met Ser Asp Trp Thr Gly
835 840 845
Gly Ala Leu Leu Val Leu Tyr Ser Phe Ala Leu Met Leu Ile Ile Ile
850 855 860
Ile Leu Ile Ile Phe Ile Phe Arg Arg Asp Leu Leu Cys Pro Leu Gly
865 870 875 880
Ala Leu Cys Ile Leu Leu Leu Met Ile Thr Leu Leu Leu Ile Ala Leu
885 890 895
Trp Asn Leu His Gly Gln Ala Leu Met Ser Asp Glu Gly Pro Gly Thr
900 905 910
Gly Pro Gly Asn Gly Leu Gly Glu Lys Gly Asp Thr Ser Gly Pro Glu
915 920 925
Gly Ser Gly Gly Ser Gly Pro Gln Arg Arg Gly Gly Asp Asn His Gly
930 935 940
Arg Gly Arg Gly Arg Gly Arg Gly Arg Gly Gly Gly Arg Pro Gly Ala
945 950 955 960
Pro Gly Gly Ser Gly Ser Gly Pro Arg His Arg Asp Gly Val Arg Arg
965 970 975
Pro Gln Lys Arg Pro Ser Cys Ile Gly Cys Lys Gly Thr His Trp Ile
980 985 990
Asp Asp Asn Pro Ser Thr Glu Thr Ala Gln Ala Trp Asn Ala Gly Phe
995 1000 1005
Leu Arg Gly Arg Ala Tyr Gly Ile Asp Leu Leu Arg Thr Glu Gly
1010 1015 1020
Glu His Val Glu Gly Ala Thr Gly Glu Thr Arg Glu Glu Ser Glu
1025 1030 1035
Asp Thr Glu Ser Asp Gly Asp Asp Glu Asp Leu Pro Cys Ile Val
1040 1045 1050
Ser Arg Gly Gly Pro Lys Val Lys Arg Pro Pro Ile Phe Ile Arg
1055 1060 1065
Arg Leu His Arg Leu Leu Leu Met Arg Ala Met Asn Pro Val Cys
1070 1075 1080
Leu Pro Val Ile Val Ala Pro Tyr Leu Phe Trp Leu Ala Ala Ile
1085 1090 1095
Ala Ala Ser Cys Phe Thr Ala Ser Val Ser Thr Val Val Thr Ala
1100 1105 1110
Thr Gly Leu Ala Leu Ser Leu Leu Leu Leu Ala Ala Val Ala Ser
1115 1120 1125
Ser Tyr Ala Ala Ala Gln Arg Lys Leu Leu Thr Pro Val Thr Val
1130 1135 1140
Leu Thr Ala Val Val Thr Thr Phe Ser Ala Gly Thr Phe Lys Leu
1145 1150 1155
Pro Arg Cys Thr Pro Gly Asp Arg Gln Trp Leu Tyr Val Gln Ser
1160 1165 1170
Ser Val Gly Asn Ile Val Gln Ser Cys Asn Pro Arg Tyr Ser Ile
1175 1180 1185
Phe Phe Asp Tyr Met Ala Ile His Arg Ser Leu Thr Lys Ile Trp
1190 1195 1200
Glu Asp Leu Gly Gly Pro Ser Gln Ala Pro Leu Pro Cys Val Leu
1205 1210 1215
Trp Pro Val Leu Pro Glu Pro Leu Pro Gln Gly Gln Leu Thr Ala
1220 1225 1230
Tyr His Val Ser Thr Ala Pro Thr Gly Ser Trp Phe Ser Ala Pro
1235 1240 1245
Gln Pro Ala Pro Glu Asn Ala Tyr Gln Ala Tyr Ala Ala Pro Gln
1250 1255 1260
Leu Phe Pro Val Ser Asp Ile
1265 1270
<210> 47
<211> 3810
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 47
atgagacctg ctccctggac acctaatcct cccaggtccc ccagccagat gagcgtgaga 60
gacagactgg ctaggctgag agccgaggct caggtcaagc aggccagcgt cgaggtgcaa 120
ccccctcagc tcacccaggt gtccccccag cagcctgtgg ccggcattct gttcattctg 180
gccattctga ccgagtgggg aagcggcaac agaacctacg gccctgtctt catgtgcctc 240
ggaggactgc tgacaatggt ggctggcgcc gtgtggctca ccgtcatgtc caacaccctg 300
ctcagcgcct ggattctgac cgccggattc ctgatctttc tgatcggatt cgctctcttt 360
ggcgtcatca ggtgttgcag gtactgttgc tactactgcc tgaccctcga gagcgaggaa 420
agacccccca ccccctacag gaatacagtg aggaaacctc agcagcccga gagcctcgag 480
gagtgcgata gcgagctgga gattaaaagg tataagaata gggtggcctc caggaagtgt 540
agggctaaat tcaaacagct cctgcaacac tatagggaag tggccgccgc caagtccagc 600
gagattaggg acagaaggag gaatcctgcc tccaggagag accaggccaa atggagactc 660
caaacactcg ccgctggatg gcccatgggc taccaggcct atagctcctg gatgtacagc 720
tacaccgacc atcagacaac acccaccttc gtgcatctgc aggctacact gggctgcacc 780
ggaggcagaa ggtgtcacgt gtttctggga atcgtgctgt tcatctttgg atgcctgctc 840
gtgctgggca tctggattta tctcctggag atgctctgga gactcggcgc tacaatttgg 900
cagctgctcg ccttttttct ggccttcttt ctggacctga tcctcctgat catcgccctg 960
tacctccaac agaactggtg gaccctcctg gtggatctgc tgtggctcct cctcttcctg 1020
gccatcctga tctggatgta ctaccatggc cagagaggaa gggtcgcttg cgctcctgtc 1080
cctgctcctg ctggccccat cgtgaggcct tgggagcctt ccctcacaca ggccgccggc 1140
caggcctttg ctcccgtgag gccccagcac atgcctgtgg aacccgtgcc cgtccccaca 1200
gtggctctgg aaaggcctgt gtaccccaag cccgtgagac ctgtcctctg gctcagcagc 1260
cctggaggac tcggaacact cggagccgct ctcctgacac tggccgctgc tctggctctg 1320
ctggctagcc tgatcctggg aaccctcaac ctcaccacca tgtttctcct catgctcctg 1380
tggaccctcg tggtgctgct catctgttcc agctgctcca gctgccccct gagcaagatc 1440
ctgctggcca ggctgttcct gtacgccctc gccctcctgc tgctggctag cgccctgatc 1500
gctggcggaa gcatcctcca gaccaatttc aagagcctct cctccaccga gttcatcccc 1560
aacctgttct gtatgttact gctgatccat agcgacgagc accatcatga cgactccctg 1620
ccccatcctc agcaggccac agacgactcc ggccacgaga gcgacagcaa tagcaatgag 1680
ggcaggcacc atctgctcgt gtccggagct caagtccccg agcctcccac catccatctc 1740
gccgcccagg gaatggctta ccccctccac gagcagcacg gcatggcccc ttgtcccgtc 1800
gctcaagccc cccctacacc tctgcccttt ttcgccattt gtctgacctg gagaatcgag 1860
gaccccccct tcaacagcct gctgttcgcc ctgctcgccg ccgctggcgg cctccagggc 1920
atttacgtcc tcgtgatgct ggtgctgctg atcctcgctt acaggagaag atggaggaga 1980
ctgacagtgt gcggcggcat catgtttctc gcctgcgtcc tggtcctgat cgtggacgcc 2040
gtcctgcaac tcagccccct cctgggagct gtgacagtgg tctccatgac cctgctgctg 2100
ctggccttca acggacccca cgatcctctg ccccaagatc ctgacaatac cgacgataac 2160
ggcccccaag accccgataa caccgacgac aatggccctc acgaccctct gccccatagc 2220
ccttccgata gcgctggcaa cgatggcggc cctcctcagc tgacagagga ggtggaaaat 2280
aagggcggcg atcagggacc ccccctgatg acagatggcg gaggaggaca cagccatgat 2340
agcggacatg gcggaggcga tccccatctg cctaccctcc tcctgggcag ctccggttct 2400
ggaggcgacg atgatgaccc tcacggccct gtgcagctct cctactacga cggcaaaagg 2460
accgaacaag gaaaagaggt cctggagaag gccaggggca gcacatacgg aacccccagg 2520
cctcccatgt ccgattggac cggaggagcc ctgctggtcc tctacagctt cgccctgatg 2580
ctgatcatta tcatcctgat catctttatc ttcagaaggg acctgctgtg ccctctcggc 2640
gccctgtgca tcctgctgct catgatcaca ctcctcctga tcgccctctg gaacctgcac 2700
ggacaagccc tgatgtccga tgagggacct ggaacaggac ccggaaacgg actgggcgag 2760
aagggagata caagcggccc cgaaggcagc ggcggaagcg gaccccaaag aaggggcggc 2820
gacaaccacg gaagaggaag aggcaggggc agaggcagag gaggaggaag acctggagcc 2880
cctggcggtt ctggaagcgg acccaggcac agggacggag tgaggaggcc tcaaaaaaga 2940
cccagctgca tcggctgcaa gggaacccac tggattgatg ataacccctc cacagagacc 3000
gctcaggcct ggaacgccgg cttcctgagg ggaagagcct atggcatcga tctgctgagg 3060
accgagggcg aacacgtgga gggagccacc ggagagacaa gggaggaaag cgaagacaca 3120
gaaagcgatg gcgacgacga agacctgccc tgcattgtgt ccaggggcgg acccaaggtg 3180
aagaggcccc ctatctttat cagaaggctc catagactgc tcctgatgag ggccatgaac 3240
cctgtgtgcc tgcccgtgat cgtggccccc tacctctttt ggctggccgc cattgccgct 3300
agctgcttca ccgcctccgt gtccacagtg gtgacagcca ccggcctcgc cctgagcctg 3360
ctgctcctcg ctgccgtggc ctccagctac gccgctgctc aaagaaagct cctgacccct 3420
gtcaccgtcc tgacagccgt cgtgaccacc ttttccgctg gcaccttcaa gctgcctagg 3480
tgcacacctg gcgacaggca gtggctctac gtgcagagct ccgtgggcaa tattgtgcag 3540
agctgcaatc ccaggtacag catttttttc gactacatgg ccatccatag gtccctcacc 3600
aagatctggg aggatctggg aggcccttcc caggctcctc tgccctgcgt gctgtggcct 3660
gtgctgcctg agcctctgcc ccaaggccag ctgacagcct atcacgtgtc caccgctcct 3720
acaggttctt ggttcagcgc tccccagccc gctcccgaaa acgcttacca ggcttacgcc 3780
gccccccagc tgttccccgt ctccgacatc 3810
<210> 48
<211> 1512
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 48
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
1 5 10 15
Leu Gly Gln Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
20 25 30
Val Tyr Thr Val Phe Ser Ile Leu Val Ala Leu Leu Leu Ala Gly Gln
35 40 45
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
50 55 60
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
65 70 75 80
Leu Pro Lys Pro Ala Lys Pro Leu Ser Gln Met Arg Met Ala Thr Pro
85 90 95
Leu Leu Met Gln Ala Leu Pro Met Ala Gly Leu Pro Gln Lys Pro Met
100 105 110
Gln Asn Ala Thr Lys His Gly Asn Met Thr Glu Asp His Val Met His
115 120 125
Leu Leu Leu Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
130 135 140
Ser Leu Ser Glu Asn Leu Lys His Leu Lys Asn Thr Met Glu Thr Met
145 150 155 160
Asp Trp Lys Val Phe Glu Ser Trp Leu His His Trp Leu Leu Phe Glu
165 170 175
Met Ser Lys His Ser Leu Glu Gln Lys Pro Thr Glu Ala Pro Pro Lys
180 185 190
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
195 200 205
Gln Asp Leu Gly Pro Val Ala Met Ser Glu Asp Phe Leu Ile Leu Ile
210 215 220
Ala Ile Leu Val Ile Val Ile Leu Val Gly Thr Ile Thr Thr Leu Val
225 230 235 240
Gly Ala Ile Gly Gly Ile Arg Ala Arg Arg Ser Phe Leu Phe Ile Cys
245 250 255
Ile Phe Phe Leu Phe Leu Ser Leu Phe Leu Thr Ile Leu Ala Leu Leu
260 265 270
Leu Gly Phe Ser Trp Leu Leu Leu Val Ala Ile Leu Phe Trp Val Leu
275 280 285
Trp Leu Val Ile Leu Ile Leu Leu Leu Leu Val Tyr Pro Ile Pro His
290 295 300
His Pro Leu Pro Thr Ser Leu Arg Phe Arg Met Lys Gln Arg Val Ser
305 310 315 320
Ser Asp Pro Thr Gly Ser Asp Arg Ser Pro Gln Gly Ser His Asn Ser
325 330 335
Leu Asn Ser Pro Asp Glu Glu Asp Pro Lys Asp Asp Thr Lys Gln Pro
340 345 350
Leu Cys Asn Met Thr Gln Gly Gly Pro Pro Val Asn Gly Gln Leu Leu
355 360 365
Gly Gln His Ala Gln Cys Pro Pro His Tyr Pro Cys Cys His Ile Gln
370 375 380
His Pro Asp Gly Glu Asp Ser Asp Gly Asp Asp Gly Lys Ser Trp Gly
385 390 395 400
Asp Ala Gly Glu Glu Asp Asn Gly Pro Asn Asp Pro Asn Thr Ala Ser
405 410 415
Thr Arg Glu Ser Ile Tyr Glu Asp Leu Arg Tyr Pro Thr Arg Asp Ala
420 425 430
Asn Gly Glu Tyr Glu Asn Val Gly Tyr Pro Pro Arg Asp Gly Asp Ala
435 440 445
Pro His Arg Leu Gly Glu Pro Val Tyr Asp Asp Val Glu Gln Ala Thr
450 455 460
Ala Asn Glu Val Arg Ile Ser Pro Leu Phe Arg Leu Pro Tyr Gly Ser
465 470 475 480
Ala Phe Gly Pro Gly Pro Gln Pro Gly Pro Ile Leu Glu Ser Ser Thr
485 490 495
Trp Gly Phe Leu Val Phe Thr Gln Thr Ser Leu Phe Ala Asp Asp Ile
500 505 510
Ala Asp Ala Ile Arg Asp Tyr Cys Thr Thr His Pro Gly Pro Thr Arg
515 520 525
Asn Thr Gln Val Val Leu Met Asn Phe Glu Gly Ser Gly Val Pro Leu
530 535 540
Pro Met Phe Phe Pro Pro Gly Glu Glu Thr Glu Glu Gln Arg Glu Gly
545 550 555 560
Asp Arg Ala Ser Asp Ser Asp Glu Ser Glu Asp Ala Gln Ile Leu Thr
565 570 575
Val Phe Cys Leu Phe Cys Gln Trp Thr Leu Phe Ile Cys Leu Gly Ile
580 585 590
Arg Met Ile Cys Asn Trp Arg Gly Lys Leu Thr Arg Ile Ile Cys Leu
595 600 605
Lys Phe Cys Leu Tyr Gly Leu Ile Ser Ala Ser Leu Ser Phe Gly Trp
610 615 620
Tyr Ala Phe Leu Lys Glu Val Thr Leu Pro Thr Thr Ala Thr Val Asp
625 630 635 640
Pro Arg Gln Leu Pro Leu Phe Leu Phe Ile Leu Ser Ser Val Leu Val
645 650 655
Ile Leu Ala Ile Met Met Glu Phe Gln Thr Ser Ser Ser Leu Phe Ala
660 665 670
Ala Leu Phe Val Ile Ile Ala Gly Met Leu Cys Val Thr Val Gly Val
675 680 685
Ile Phe Leu Leu Ala Gly Val Lys Pro Leu Leu Ser Gly Met Ile Cys
690 695 700
Ala Ser Gly Ile Thr Met Leu Val Leu Gly Val Val Leu Leu Val Val
705 710 715 720
Cys Thr Arg Asp Glu His Ala Ile Ser Ala Ser His His Ala Ser Asp
725 730 735
Gly Ser Val Asn Gln Gln Lys Glu Asn Gln Pro Gln Thr Leu Glu Glu
740 745 750
Cys Lys Thr Asp Gln Glu Arg Lys Arg Tyr Arg Asn Arg Leu Ala Ser
755 760 765
Arg Arg Cys Arg Ala Lys Phe Arg Asn Gln Leu Glu His Phe Arg Thr
770 775 780
Val Ala Ala Ala Lys Thr Glu Glu Asn Asn Arg Leu Arg Val Leu Ile
785 790 795 800
Arg Gln Met Cys Pro Thr Leu Asp Val Glu Ser Ile Val Pro Ser Thr
805 810 815
Ser Ala Gly Tyr His Glu Pro Leu Asn His Leu Thr His Ser Pro Ser
820 825 830
Pro Cys His His Arg Asp Glu Pro Pro Ser Arg Ser Pro Ser Pro Gln
835 840 845
Pro Thr Val Ser Glu Gln Ser Gln Gln Ser Pro Arg Gln Gln Ser Pro
850 855 860
Gln Gly Thr Ser Gln Gly Ser Thr Arg Pro Gln Val Pro Gly Gly Ala
865 870 875 880
Thr Thr Arg Lys Arg Gly Gly Val Arg Gly Gln Pro Ala Lys Cys His
885 890 895
Gly Lys Tyr Thr Thr Thr Ala Glu Gly Leu Thr Ala Leu Leu Asn Arg
900 905 910
Arg His Ser Pro Arg Thr Ser Asn Glu Gly Arg Trp Met Asn Gly Val
915 920 925
Met Ala Val Asn Leu Ser Lys Trp Pro Leu Tyr Ser Leu Arg Arg Ala
930 935 940
Leu Ala Leu Ala Met Ala Pro Arg Arg Arg Leu Ser Gly Pro Pro Trp
945 950 955 960
Leu Thr Val Leu Leu Leu Leu Ser Thr Leu Ser Val Ala Ala Leu Leu
965 970 975
Ile Leu Phe Leu Ile Phe Ser Ala Gly Ala Thr Ile Ser Thr Glu Ala
980 985 990
Ser Leu Leu Val Leu Leu Leu Leu Phe Val Thr Leu Leu Leu Pro Leu
995 1000 1005
Leu Ser Ser Asn Gly Leu Gln Leu Pro Ala Ala Leu Ile Leu Ile
1010 1015 1020
Gln Cys Phe Leu Leu Ala Ala Asp Tyr Leu Ala Tyr Leu Ile Leu
1025 1030 1035
Pro Thr Ile Met Pro Arg Gly Arg Ser Thr Gly Arg Lys Gly Arg
1040 1045 1050
Asp Thr Glu Lys Glu Arg Ser Arg Ser Pro Leu Arg Ala Pro Gly
1055 1060 1065
Gly Ser Asp Gly Pro Ser Thr Arg Ala Gly Cys Gly Ala Gly Pro
1070 1075 1080
Cys Gln Leu Ser Ser Pro Ile Ala Gly Asn Asn Gly Asn Glu Gly
1085 1090 1095
Gly Glu Gly Asp Asp Tyr Lys Ser Trp Arg Lys Pro Glu Glu Glu
1100 1105 1110
Asp Asn Gly Pro Asn Asp Pro Asn Thr Asn Asn Arg Ile Glu Asp
1115 1120 1125
Gly Asp Gly Asp Asp Gly Lys Ser Trp Arg Asn Pro Glu Glu Glu
1130 1135 1140
Asp Asn Arg Lys Gln Asp Arg Leu Gly Thr Lys Pro Phe Met Asp
1145 1150 1155
Leu Asp Gly Thr Gly Gly Gly Glu Gly Tyr Ser Gln Met Val Pro
1160 1165 1170
Ile Ala Thr Ala Pro Gly Ser Gly His Ala Ala Thr Tyr Gln Asp
1175 1180 1185
Leu Gln Ala Ala Pro Tyr Ile Ile Trp Pro Leu Gln Thr Asp Cys
1190 1195 1200
Gln Pro Val Ala Thr Thr Phe Ala Ser Pro Gly Gln Ile Gln Trp
1205 1210 1215
Tyr Thr Ser Ala Val Pro Gln Pro Thr Glu His Cys Ser Gln Phe
1220 1225 1230
Thr Asn Ala Pro Thr Val Asn Gln Gln Gln Pro Ile Ser Gln Pro
1235 1240 1245
Gln Pro Glu Asn Pro Pro Ala Phe Thr Phe Thr Gln Pro Ala Ser
1250 1255 1260
Ile Ile Pro Gly Val Ile Ser Ala Ser Asn Leu Asn Val Ser Ala
1265 1270 1275
Ser Pro Ile Ile Pro Ser Asp His Val Leu Pro Ile Ile Thr Ser
1280 1285 1290
Val Thr Ser Leu Ala Gln Pro Asn Asn Met Ala Gly His Trp Tyr
1295 1300 1305
Glu Ser Val Ile Pro Gly Leu Phe Leu Cys Pro Leu Ile Leu Pro
1310 1315 1320
Ser Leu Phe Trp Ile Cys Ser Leu Leu Thr Phe Leu Val Gly His
1325 1330 1335
Gly Ala Asn Ile Val Ser Ala Val Leu Phe Leu Val Leu Ala Trp
1340 1345 1350
Cys Leu Leu Ile Ala Asn Trp Asn Val Thr Arg Glu Asp Phe Val
1355 1360 1365
Ser Gly Arg Arg Ser Ser Met Ser Ser Leu Ser Val Ala Ala Ser
1370 1375 1380
Thr Ala Thr Ala Met Phe Ala Ser Phe Leu Thr Leu Ser Phe Asp
1385 1390 1395
Gly Leu Gly Leu Leu Leu Phe Gly Thr Ala Leu Val Ile Gln Thr
1400 1405 1410
Ile Tyr Val Leu Tyr Leu Val Val Met Glu Ile Thr Val Trp Ile
1415 1420 1425
Met Met Phe Arg Tyr Leu His Phe Trp Ile Thr Leu Leu Phe Leu
1430 1435 1440
Leu Ser Pro Ile Ile Leu Ser Val Ala Cys Leu Ile Ile Gln Ser
1445 1450 1455
Ser Ala Leu Leu Ile Glu Ala Val Val Val Thr Thr Ile Thr Val
1460 1465 1470
Leu Ala Ile Phe Leu Trp Leu Pro Pro Gln Gly Ala Glu Ala Asp
1475 1480 1485
Leu Gly Thr Ala Leu Leu Ile Leu Asn Thr Ala Leu Cys Leu Val
1490 1495 1500
Val Leu Ile Leu Thr Ala Ile Pro Thr
1505 1510
<210> 49
<211> 4536
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 49
atggacgacc agcgggacct gatcagcaac aacgagcagc tgcccatgct gggccagagg 60
cctggcgccc ctgagagcaa gtgtagcaga ggcgccgtgt acaccgtgtt cagcatcctg 120
gtggccctgc tgctggccgg acaggccacc accgcctact ttctgtatca gcagcaggga 180
cggctggaca agctgaccgt gaccagccag aacctgcagc tggaaaacct gcggatgaag 240
ctgcccaagc ccgccaagcc cctgagccag atgagaatgg ccacccccct gctgatgcag 300
gccctgccta tggccggcct gccccagaaa cccatgcaga acgccaccaa gcacggcaac 360
atgaccgagg accacgtgat gcatctgctg ctgaacgccg accccctgaa ggtgtacccc 420
ccactgaagg gcagcctgag cgagaacctg aagcacctga agaacaccat ggaaaccatg 480
gactggaagg tgttcgagag ctggctgcac cactggctgc tgttcgagat gagcaagcac 540
agcctggaac agaagcccac cgaggcccct cccaaagaga gcctggaact ggaagatccc 600
agcagcggcc tgggcgtgac caagcaggat ctgggccccg tggctatgtc cgaggacttt 660
ctgattctga tcgccatcct ggtgatcgtg attctcgtgg gcacaatcac aaccctggtg 720
ggcgccatcg gcggcattag ggccaggagg agcttcctct tcatttgcat cttcttcctg 780
ttcctctccc tcttcctgac aatcctcgcc ctgctgctgg gcttcagctg gctcctgctg 840
gtggccatcc tgttctgggt gctctggctg gtcatcctca ttctgctgct gctggtgtac 900
cctattcctc accaccccct gcccacctcc ctcaggttta gaatgaagca gagggtgagc 960
agcgacccca caggttctga cagaagccct cagggcagcc ataatagcct gaactccccc 1020
gatgaggagg accccaagga tgacaccaag caacctctgt gcaacatgac ccagggcgga 1080
cctcccgtca atggacagct cctcggacaa catgctcaat gcccccctca ctatccctgc 1140
tgccatattc agcatcccga cggagaggat tccgatggag acgatggcaa gtcctggggc 1200
gatgccggag aggaagacaa tggccctaac gaccctaaca ccgccagcac cagagagtcc 1260
atttacgagg acctcagata ccccacaagg gacgccaatg gcgagtatga gaacgtggga 1320
taccccccta gggacggaga tgcccctcat aggctcggag agcctgtgta tgacgatgtg 1380
gagcaagcca ccgctaacga ggtgagaatc tcccctctgt tcagactgcc ctacggaagc 1440
gctttcggac ctggccccca gcctggaccc attctggaga gctccacatg gggctttctg 1500
gtcttcacac agacctccct gttcgccgac gacattgccg acgctattag ggactactgc 1560
acaacccacc ctggccccac aaggaacacc caggtggtcc tcatgaactt cgagggcagc 1620
ggagtgcccc tgcctatgtt ttttccccct ggagaggaga cagaagagca gagagagggc 1680
gatagagcta gcgactccga cgagtccgaa gacgctcaga tcctgaccgt gttctgcctg 1740
ttttgccagt ggacactctt tatctgcctg ggaatcagga tgatctgtaa ctggaggggc 1800
aaactcacca ggatcatctg cctgaagttc tgcctctacg gactgatttc cgcctccctg 1860
tccttcggct ggtacgcttt tctgaaggaa gtgaccctcc ccaccacagc caccgttgat 1920
cctaggcaac tccccctgtt cctcttcatc ctgagctccg tgctggtgat tctcgccatc 1980
atgatggagt ttcaaacatc ctccagcctc ttcgctgctc tgttcgtgat tatcgccgga 2040
atgctgtgcg tcacagtggg cgtgattttt ctgctggctg gcgtcaagcc tctcctgagc 2100
ggcatgatct gcgcctccgg catcacaatg ctcgtgctcg gcgtcgtgct gctggtggtg 2160
tgcaccagag atgagcacgc tatttccgcc agccaccatg ctagcgatgg ctccgtgaat 2220
cagcagaagg aaaatcagcc ccagaccctg gaggaatgca agacagatca ggagaggaag 2280
aggtacagga acaggctggc ctccaggagg tgtagagcta agttcaggaa ccagctggaa 2340
cattttagga cagtcgccgc tgctaagaca gaggagaaca acaggctcag ggtgctcatc 2400
aggcagatgt gtcctacact ggacgtggaa tccatcgtcc cctccacctc cgccggctac 2460
cacgagcctc tgaatcacct gacccacagc cccagccctt gtcatcacag ggatgaaccc 2520
ccctccagaa gccccagccc tcaacccacc gtctccgagc agtcccagca gtcccccagg 2580
cagcagagcc ctcaaggcac atcccagggt tctacaagac ctcaggtgcc tggaggcgcc 2640
accaccagaa aaagaggcgg cgtgagaggc caacctgcca agtgtcacgg caagtacacc 2700
acaaccgccg agggactgac cgctctcctg aataggaggc acagccccag gacatccaac 2760
gagggcaggt ggatgaatgg agtcatggct gtgaacctct ccaaatggcc cctgtacagc 2820
ctgaggagag ccctggccct cgccatggct cctagaagga ggctctccgg ccctccctgg 2880
ctgacagtgc tgctgctgct gtccacactg agcgtggccg ccctgctgat tctcttcctg 2940
attttcagcg ccggcgccac cattagcaca gaagccagcc tgctggtcct gctcctgctg 3000
tttgtgaccc tgctgctgcc tctcctgtcc tccaacggac tccagctccc tgccgccctg 3060
attctgatcc agtgtttcct cctggccgct gattatctcg cctacctgat tctgcctacc 3120
attatgccca ggggcagaag cacaggaagg aagggcaggg acacagagaa agagaggagc 3180
agatcccctc tcagagctcc tggcggttct gatggaccca gcacaagggc tggctgtgga 3240
gccggaccct gtcagctgag cagccccatc gccggaaaca acggcaatga aggcggcgag 3300
ggcgacgact acaagagctg gaggaagccc gaggaagagg acaacggccc caatgacccc 3360
aataccaaca acaggattga ggatggagac ggcgacgacg gaaaatcctg gaggaatcct 3420
gaggaggagg ataacagaaa gcaggacagg ctgggcacca agcctttcat ggacctcgac 3480
ggaaccggcg gaggcgaggg ctacagccag atggtcccta tcgccaccgc ccccggaagc 3540
ggccacgccg ctacctatca ggatctccag gccgcccctt acatcatctg gcctctccag 3600
accgattgcc agcctgtggc taccaccttc gcctcccccg gacagatcca gtggtataca 3660
agcgccgtcc cccagcccac agagcattgc tcccagttta caaacgctcc caccgtcaac 3720
cagcagcagc ctattagcca accccagccc gaaaatcccc ctgctttcac ctttacccag 3780
cccgcttcca tcattcccgg cgtcattagc gcctccaacc tgaacgtgag cgcttcccct 3840
atcatcccta gcgaccatgt cctccccatc attacctccg tgaccagcct cgcccaacct 3900
aataacatgg ccggccactg gtatgagagc gtgattcccg gcctgttcct ctgccccctg 3960
atcctccctt ccctgttctg gatttgctcc ctgctgacct tcctggtggg ccacggagcc 4020
aatattgtga gcgccgtcct gttcctcgtg ctggcttggt gtctcctcat tgccaactgg 4080
aacgtgacaa gagaggactt cgtgtccggc aggagaagct ccatgagcag cctgtccgtg 4140
gccgcttcca ccgccacagc catgttcgcc agcttcctca ccctgagctt tgatggcctg 4200
ggcctgctgc tgtttggcac cgccctggtg atccagacaa tttacgtgct gtatctggtg 4260
gtcatggaga tcaccgtgtg gatcatgatg tttaggtatc tccacttttg gatcaccctg 4320
ctgttcctgc tgagccccat tattctctcc gtcgcctgtc tcatcatcca atcctccgcc 4380
ctgctgatcg aggctgtggt cgtcaccacc atcacagtcc tggccatttt tctgtggctc 4440
cctcctcaag gcgctgaggc cgatctcggc accgccctgc tgattctgaa taccgccctg 4500
tgcctggtcg tgctgatcct gaccgctatc cctaca 4536
<210> 50
<211> 44035
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (15712)..(15712)
<223> a, c, t, g, unknown or other
<400> 50
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg agacctgctc cctggacacc taatcctccc 1380
aggtccccca gccagatgag cgtgagagac agactggcta ggctgagagc cgaggctcag 1440
gtcaagcagg ccagcgtcga ggtgcaaccc cctcagctca cccaggtgtc cccccagcag 1500
cctgtggccg gcattctgtt cattctggcc attctgaccg agtggggaag cggcaacaga 1560
acctacggcc ctgtcttcat gtgcctcgga ggactgctga caatggtggc tggcgccgtg 1620
tggctcaccg tcatgtccaa caccctgctc agcgcctgga ttctgaccgc cggattcctg 1680
atctttctga tcggattcgc tctctttggc gtcatcaggt gttgcaggta ctgttgctac 1740
tactgcctga ccctcgagag cgaggaaaga ccccccaccc cctacaggaa tacagtgatt 1800
agggacagaa ggaggaatcc tgcctccagg agagaccagg ccaaatggag actccaaaca 1860
ctcgccgctg gatggcccat gggctaccag gcctatagct cctggatgta cagctacacc 1920
gaccatcaga caacacccac cttcgtgcat ctgcaggcta cactgggctg caccggaggc 1980
agaaggtgtc acgtgtttct gggaatcgtg ctgttcatct ttggatgcct gctcgtgctg 2040
ggcatctgga tttatctcct ggagatgctc tggagactcg gcgctacaat ttggcagctg 2100
ctcgcctttt ttctggcctt ctttctggac ctgatcctcc tgatcatcgc cctgtacctc 2160
caacagaact ggtggaccct cctggtggat ctgctgtggc tcctcctctt cctggccatc 2220
ctgatctgga tgtactacca tggccagaga ggaagggtcg cttgcgctcc tgtccctgct 2280
cctgctggcc ccatcgtgag gccttgggag ccttccctca cacaggccgc cggccaggcc 2340
tttgctcccg tgaggcccca gcacatgcct gtggaacccg tgcccgtccc cacagtggct 2400
ctggaaaggc ctgtgtaccc caagcccgtg agacctgtcc tctggctcag cagccctgga 2460
ggactcggaa cactcggagc cgctctcctg acactggccg ctgctctggc tctgctggct 2520
agcctgatcc tgggaaccct caacctcacc accatgtttc tcctcatgct cctgtggacc 2580
ctcgtggtgc tgctcatctg ttccagctgc tccagctgcc ccctgagcaa gatcctgctg 2640
gccaggctgt tcctgtacgc cctcgccctc ctgctgctgg ctagcgccct gatcgctggc 2700
ggaagcatcc tccagaccaa tttcaagagc ctctcctcca ccgagttcat ccccaacctg 2760
ttctgtatgt tactgctgat ccatagcgac gagcaccatc atgacgactc cctgccccat 2820
cctcagcagg ccacagacga ctccggccac gagagcgaca gcaatagcaa tgagggcagg 2880
caccatctgc tcgtgtccgg agctcaagtc cccgagcctc ccaccatcca tctcgccgcc 2940
cagggaatgg cttaccccct ccacgagcag cacggcatgg ccccttgtcc cgtcgctcaa 3000
gcccccccta cacctctgcc ctttttcgcc atttgtctga cctggagaat cgaggacccc 3060
cccttcaaca gcctgctgtt cgccctgctc gccgccgctg gcggcctcca gggcatttac 3120
gtcctcgtga tgctggtgct gctgatcctc gcttacagga gaagatggag gagactgaca 3180
gtgtgcggcg gcatcatgtt tctcgcctgc gtcctggtcc tgatcgtgga cgccgtcctg 3240
caactcagcc ccctcctggg agctgtgaca gtggtctcca tgaccctgct gctgctggcc 3300
ttcaacggac cccacgatcc tctgccccaa gatcctgaca ataccgacga taacggcccc 3360
caagaccccg ataacaccga cgacaatggc cctcacgacc ctctgcccca tagcccttcc 3420
gatagcgctg gcaacgatgg cggccctcct cagctgacag aggaggtgga aaataagggc 3480
ggcgatcagg gaccccccct gatgacagat ggcggaggag gacacagcca tgatagcgga 3540
catggcggag gcgatcccca tctgcctacc ctcctcctgg gcagctccgg ttctggaggc 3600
gacgatgatg accctcacgg ccctgtgcag ctctcctact acgacggcaa aaggaccgaa 3660
caaggaaaag aggtcctgga gaaggccagg ggcagcacat acggaacccc caggcctccc 3720
atgtccgatt ggaccggagg agccctgctg gtcctctaca gcttcgccct gatgctgatc 3780
attatcatcc tgatcatctt tatcttcaga agggacctgc tgtgccctct cggcgccctg 3840
tgcatcctgc tgctcatgat cacactcctc ctgatcgccc tctggaacct gcacggacaa 3900
gccctgatgt ccgatgaggg acctggaaca ggacccggaa acggactggg cgagaaggga 3960
gatacaagcg gccccgaagg cagcggcgga agcggacccc aaagaagggg cggcgacaac 4020
cacggaagag gaagaggcag gggcagaggc agaggaggag gaagacctgg agcccctggc 4080
ggttctggaa gcggacccag gcacagggac ggagtgagga ggcctcaaaa aagacccagc 4140
tgcatcggct gcaagggaac ccactggatt gatgataacc cctccacaga gaccgctcag 4200
gcctggaacg ccggcttcct gaggggaaga gcctatggca tcgatctgct gaggaccgag 4260
ggcgaacacg tggagggagc caccggagag acaagggagg aaagcgaaga cacagaaagc 4320
gatggcgacg acgaagacct gccctgcatt gtgtccaggg gcggacccaa ggtgaagagg 4380
ccccctatct ttatcagaag gctccataga ctgctcctga tgagggccat gaaccctgtg 4440
tgcctgcccg tgatcgtggc cccctacctc ttttggctgg ccgccattgc cgctagctgc 4500
ttcaccgcct ccgtgtccac agtggtgaca gccaccggcc tcgccctgag cctgctgctc 4560
ctcgctgccg tggcctccag ctacgccgct gctcaaagaa agctcctgac ccctgtcacc 4620
gtcctgacag ccgtcgtgac caccttttcc gctggcacct tcaagctgcc taggtgcaca 4680
cctggcgaca ggcagtggct ctacgtgcag agctccgtgg gcaatattgt gcagagctgc 4740
aatcccaggt acagcatttt tttcgactac atggccatcc ataggtccct caccaagatc 4800
tgggagtgat gatgagcggc cgcgatctgc tgtgccttct agttgccagc catctgttgt 4860
ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 4920
ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 4980
ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc 5040
ggtgggctct atggccgatc agcgatcgct gaggtgggtg agtgggcgtg gcctggggtg 5100
gtcatgaaaa tatataagtt gggggtctta gggtctcttt atttgtgttg cagagaccgc 5160
cggagccatg agcgggagca gcagcagcag cagtagcagc agcgccttgg atggcagcat 5220
cgtgagccct tatttgacga cgcggatgcc ccactgggcc ggggtgcgtc agaatgtgat 5280
gggctccagc atcgacggcc gacccgtcct gcccgcaaat tccgccacgc tgacctatgc 5340
gaccgtcgcg gggacgccgt tggacgccac cgccgccgcc gccgccaccg cagccgcctc 5400
ggccgtgcgc agcctggcca cggactttgc attcctggga ccactggcga caggggctac 5460
ttctcgggcc gctgctgccg ccgttcgcga tgacaagctg accgccctgc tggcgcagtt 5520
ggatgcgctt actcgggaac tgggtgacct ttctcagcag gtcatggccc tgcgccagca 5580
ggtctcctcc ctgcaagctg gcgggaatgc ttctcccaca aatgccgttt aagataaata 5640
aaaccagact ctgtttggat taaagaaaag tagcaagtgc attgctctct ttatttcata 5700
attttccgcg cgcgataggc cctagaccag cgttctcggt cgttgagggt gcggtgtatc 5760
ttctccagga cgtggtagag gtggctctgg acgttgagat acatgggcat gagcccgtcc 5820
cgggggtgga ggtagcacca ctgcagagct tcatgctccg gggtggtgtt gtagatgatc 5880
cagtcgtagc aggagcgctg ggcatggtgc ctaaaaatgt ccttcagcag caggccgatg 5940
gccaggggga ggcccttggt gtaagtgttt acaaaacggt taagttggga agggtgcatt 6000
cggggagaga tgatgtgcat cttggactgt atttttagat tggcgatgtt tccgcccaga 6060
tcccttctgg gattcatgtt gtgcaggacc accagtacag tgtatccggt gcacttgggg 6120
aatttgtcat gcagcttaga gggaaaagcg tggaagaact tggagacgcc tttgtggcct 6180
cccagatttt ccatgcattc gtccatgatg atggcaatgg gcccgcggga ggcagcttgg 6240
gcaaagatat ttctggggtc gctgacgtcg tagttgtgtt ccagggtgag gtcgtcatag 6300
gccattttta caaagcgcgg gcggagggtg cccgactggg ggatgatggt cccctctggc 6360
cctggggcgt agttgccctc gcagatctgc atttcccagg ccttaatctc ggagggggga 6420
atcatatcca cctgcggggc gatgaagaaa acggtttccg gagccgggga gattaactgg 6480
gatgagagca ggtttctaag cagctgtgat tttccacaac cggtgggccc ataaataaca 6540
cctataaccg gttgcagctg gtagtttaga gagctgcagc tgccgtcgtc ccggaggagg 6600
ggggccacct cgttgagcat gtccctgacg cgcatgttct ccccgaccag atccgccaga 6660
aggcgctcgc cgcccaggga cagcagctct tgcaaggaag caaagttttt cagcggcttg 6720
aggccgtccg ccgtgggcat gtttttcagg gtctggctca gcagctccag gcggtcccag 6780
agctcggtga cgtgctctac ggcatctcta tccagcatat ctcctcgttt cgcgggttgg 6840
ggcgactttc gctgtagggc accaagcggt ggtcgtccag cggggccaga gtcatgtcct 6900
tccatgggcg cagggtcctc gtcagggtgg tctgggtcac ggtgaagggg tgcgctccgg 6960
gctgagcgct tgccaaggtg cgcttgaggc tggttctgct ggtgctgaag cgctgccggt 7020
cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt gtcatagtcc agcccctccg 7080
cggcgtgtcc cttggcgcgc agcttgccct tggaggtggc gccgcacgag gggcagagca 7140
ggctcttgag cgcgtagagc ttgggggcga ggaagaccga ttcgggggag taggcgtccg 7200
cgccgcagac cccgcacacg gtctcgcact ccaccagcca ggtgagctcg gggcgcgccg 7260
ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt cttacctcgg gtctccatga 7320
ggtggtgtcc ccgctcggtg acgaagaggc tgtccgtgtc tccgtagacc gacttgaggg 7380
gtcttttctc caggggggtc cctcggtctt cctcgtagag gaactcggac cactctgaga 7440
cgaaggcccg cgtccaggcc aggacgaagg aggctatgtg ggaggggtag cggtcgttgt 7500
ccactagggg gtccaccttc tccaaggtgt gaagacacat gtcgccttcc tcggcgtcca 7560
ggaaggtgat tggcttgtag gtgtaggcca cgtgaccggg ggttcctgac gggggggtat 7620
aaaagggggt gggggcgcgc tcgtcgtcac tctcttccgc atcgctgtct gcgagggcca 7680
gctgctgggg tgagtattcc ctctcgaagg cgggcatgac ctccgcgctg aggttgtcag 7740
tttccaaaaa cgaggaggat ttgatgttca cctgtcccga ggtgatacct ttgagggtac 7800
ccgcgtccat ctggtcagaa aacacgatct ttttattgtc cagcttggtg gcgaacgacc 7860
cgtagagggc gttggagagc agcttggcga tggagcgcag ggtctggttc ttgtccctgt 7920
cggcgcgctc cttggccgcg atgttgagct gcacgtactc gcgcgcgacg cagcgccact 7980
cggggaagac ggtggtgcgc tcgtcgggca ccaggcgcac gcgccagccg cggttgtgca 8040
gggtgaccag gtccacgctg gtggcgacct cgccgcgcag gcgctcgttg gtccagcaga 8100
gacggccgcc cttgcgcgag cagaaggggg gcagggggtc gagctgggtc tcgtccgggg 8160
ggtccgcgtc cacggtgaaa accccggggc gcaggcgcgc gtcgaagtag tctatcttgc 8220
aaccttgcat gtccagcgcc tgctgccagt cgcgggcggc gagcgcgcgc tcgtaggggt 8280
tgagcggcgg gccccagggc atggggtggg tgagtgcgga ggcgtacatg ccgcagatgt 8340
catagacgta gaggggctcc cgcaggaccc cgatgtaggt ggggtagcag cggccgccgc 8400
ggatgctggc gcgcacgtag tcatacagct cgtgcgaggg ggcgaggagg tcggggccca 8460
ggttggtgcg ggcggggcgc tccgcgcgga agacgatctg cctgaagatg gcatgcgagt 8520
tggaagagat ggtggggcgc tggaagacgt tgaagctggc gtcctgcagg ccgacggcgt 8580
cgcgcacgaa ggaggcgtag gagtcgcgca gcttgtgtac cagctcggcg gtgacctgca 8640
cgtcgagcgc gcagtagtcg agggtctcgc ggatgatgtc atatttagcc tgccccttct 8700
ttttccacag ctcgcggttg aggacaaact cttcgcggtc tttccagtac tcttggatcg 8760
ggaaaccgtc cggttccgaa cggtaagagc ctagcatgta gaactggttg acggcctggt 8820
aggcgcagca gcccttctcc acggggaggg cgtaggcctg cgcggccttg cggagcgagg 8880
tgtgggtcag ggcgaaggtg tccctgacca tgactttgag gtactggtgc ttgaagtcgg 8940
agtcgtcgca gccgccccgc tcccagagcg agaagtcggt gcgcttcttg gagcgggggt 9000
tgggcagagc gaaggtgaca tcgttgaaga ggattttgcc cgcgcggggc atgaagttgc 9060
gggtgatgcg gaagggcccc ggcacttcag agcggttgtt gatgacctgg gcggcgagca 9120
cgatctcgtc gaagccgttg atgttgtggc ccacgatgta gagttccagg aagcggggcc 9180
ggccctttac ggtgggcagc ttctttagct cttcgtaggt gagctcctcg ggcgaggcga 9240
ggccgtgctc ggccagggcc cagtccgcga ggtgcgggtt gtctctgagg aaggacttcc 9300
agaggtcgcg ggccaggagg gtctgcaggc ggtctctgaa ggtcctgaac tggcggccca 9360
cggccatttt ttcgggggtg atgcagtaga aggtgagggg gtcttgctgc cagcggtccc 9420
agtcgagctg cagggcgagg tcgcgcgcgg cggtgaccag gcgctcgtcg cccccgaatt 9480
tcatgaccag catgaagggc acgagctgct ttccgaaggc ccccatccaa gtgtaggtct 9540
ctacatcgta ggtgacaaag aggcgctccg tgcgaggatg cgagccgatc gggaagaact 9600
ggatctcccg ccaccagttg gaggagtggc tgttgatgtg gtggaagtag aagtcccgtc 9660
gccgggccga acactcgtgc tggcttttgt aaaagcgagc gcagtactgg cagcgctgca 9720
cgggctgtac ctcatgcacg agatgcacct ttcgcccgcg cacgaggaag ccgaggggaa 9780
atctgagccc cccgcctggc tcgcggcatg gctggttctc ttctactttg gatgcgtgtc 9840
cgtctccgtc tggctcctcg aggggtgtta cggtggagcg gaccaccacg ccgcgcgagc 9900
cgcaggtcca gatatcggcg cgcggcggtc ggagtttgat gacgacatcg cgcagctggg 9960
agctgtccat ggtctggagc tcccgcggcg gcggcaggtc agccgggagt tcttgcaggt 10020
tcacctcgca gagtcgggcc agggcgcggg gcaggtctag gtggtacctg atctctaggg 10080
gcgtgttggt ggcggcgtcg atggcttgca ggagcccgca gccccggggg gcgacgacgg 10140
tgccccgcgg ggtggtggtg gtggtggcgg tgcagctcag aagcggtgcc gcgggcgggc 10200
ccccggaggt agggggggct ccggtcccgc gggcaggggc ggcagcggca cgtcggcgtg 10260
gagcgcgggc aggagttggt gctgtgcccg gaggttgctg gcgaaggcga cgacgcggcg 10320
gttgatctcc tggatctggc gcctctgcgt gaagacgacg ggcccggtga gcttgaacct 10380
gaaagagagt tcgacagaat caatctcggt gtcattgacc gcggcctggc gcaggatctc 10440
ctgcacgtct cccgagttgt cttggtaggc gatctcggcc atgaactgct cgatctcttc 10500
ctcctggagg tctccgcgtc cggcgcgttc cacggtggcc gccaggtcgt tggagatgcg 10560
ccccatgagc tgcgagaagg cgttgagtcc gccctcgttc cagactcggc tgtagaccac 10620
gcccccctgg tcatcgcggg cgcgcatgac cacctgcgcg aggttgagct ccacgtgccg 10680
cgcgaagacg gcgtagttgc gcagacgctg gaagaggtag ttgagggtgg tggcggtgtg 10740
ctcggccacg aagaagttca tgacccagcg gcgcaacgtg gattcgttga tgtcccccaa 10800
ggcctccagc cgttccatgg cctcgtagaa gtccacggcg aagttgaaaa actgggagtt 10860
gcgcgccgac acggtcaact cctcctccag aagacggatg agctcggcga cggtgtcgcg 10920
cacctcgcgc tcgaaggcta tggggatctc ttcctccgct agcatcacca cctcctcctc 10980
ttcctcctct tctggcactt ccatgatggc ttcctcctct tcggggggtg gcggcggcgg 11040
cggtggggga gggggcgctc tgcgccggcg gcggcgcacc gggaggcggt ccacgaagcg 11100
cgcgatcatc tccccgcggc ggcggcgcat ggtctcggtg acggcgcggc cgttctcccg 11160
ggggcgcagt tggaagacgc cgccggacat ctggtgctgg ggcgggtggc cgtgaggcag 11220
cgagacggcg ctgacgatgc atctcaacaa ttgctgcgta ggtacgccgc cgagggacct 11280
gagggagtcc atatccaccg gatccgaaaa cctttcgagg aaggcgtcta accagtcgca 11340
gtcgcaaggt aggctgagca ccgtggcggg cggcgggggg tggggggagt gtctggcgga 11400
ggtgctgctg atgatgtaat tgaagtaggc ggacttgaca cggcggatgg tcgacaggag 11460
caccatgtcc ttgggtccgg cctgctggat gcggaggcgg tcggctatgc cccaggcttc 11520
gttctggcat cggcgcaggt ccttgtagta gtcttgcatg agcctttcca ccggcacctc 11580
ttctccttcc tcttctgctt cttccatgtc tgcttcggcc ctggggcggc gccgcgcccc 11640
cctgcccccc atgcgcgtga ccccgaaccc cctgagcggt tggagcaggg ccaggtcggc 11700
gacgacgcgc tcggccagga tggcctgctg cacctgcgtg agggtggttt ggaagtcatc 11760
caagtccacg aagcggtggt aggcgcccgt gttgatggtg taggtgcagt tggccatgac 11820
ggaccagttg acggtctggt ggcccggttg cgacatctcg gtgtacctga gtcgcgagta 11880
ggcgcgggag tcgaagacgt agtcgttgca agtccgcacc aggtactggt agcccaccag 11940
gaagtgcggc ggcggctggc ggtagagggg ccagcgcagg gtggcggggg ctccgggggc 12000
caggtcttcc agcatgaggc ggtggtaggc gtagatgtac ctggacatcc aggtgatacc 12060
cgcggcggtg gtggaggcgc gcgggaagtc gcgcacccgg ttccagatgt tgcgcagggg 12120
cagaaagtgc tccatggtag gcgtgctctg tccagtcaga cgcgcgcagt cgttgatact 12180
ctagaccagg gaaaacgaaa gccggtcagc gggcactctt ccgtggtctg gtgaatagat 12240
cgcaagggta tcatggcgga gggcctcggt tcgagccccg ggtccgggcc ggacggtccg 12300
ccatgatcca cgcggttacc gcccgcgtgt cgaacccagg tgtgcgacgt cagacaacgg 12360
tggagtgttc cttttggcgt ttttctggcc gggcgccggc gccgcgtaag agactaagcc 12420
gcgaaagcga aagcagtaag tggctcgctc cccgtagccg gagggatcct tgctaagggt 12480
tgcgttgcgg cgaaccccgg ttcgaatccc gtactcgggc cggccggacc cgcggctaag 12540
gtgttggatt ggcctccccc tcgtataaag accccgcttg cggattgact ccggacacgg 12600
ggacgagccc cttttatttt tgctttcccc agatgcatcc ggtgctgcgg cagatgcgcc 12660
ccccgcccca gcagcagcaa caacaccagc aagagcggca gcaacagcag cgggagtcat 12720
gcagggcccc ctcacccacc ctcggcgggc cggccacctc ggcgtccgcg gccgtgtctg 12780
gcgcctgcgg cggcggcggg gggccggctg acgaccccga ggagcccccg cggcgcaggg 12840
ccagacacta cctggacctg gaggagggcg agggcctggc gcggctgggg gcgccgtctc 12900
ccgagcgcca cccgcgggtg cagctgaagc gcgactcgcg cgaggcgtac gtgcctcggc 12960
agaacctgtt cagggaccgc gcgggcgagg agcccgagga gatgcgggac aggaggttca 13020
gcgcagggcg ggagctgcgg caggggctga accgcgagcg gctgctgcgc gaggaggact 13080
ttgagcccga cgcgcggacg gggatcagcc ccgcgcgcgc gcacgtggcg gccgccgacc 13140
tggtgacggc gtacgagcag acggtgaacc aggagatcaa cttccaaaag agtttcaaca 13200
accacgtgcg cacgctggtg gcgcgcgagg aggtgaccat cgggctgatg cacctgtggg 13260
actttgtaag cgcgctggtg cagaacccca acagcaagcc tctgacggcg cagctgttcc 13320
tgatagtgca gcacagcagg gacaacgagg cgtttaggga cgcgctgctg aacatcaccg 13380
agcccgaggg tcggtggctg ctggacctga ttaacatcct gcagagcata gtggtgcagg 13440
agcgcagcct gagcctggcc gacaaggtgg cggccatcaa ctactcgatg ctgagcctgg 13500
gcaagtttta cgcgcgcaag atctaccaga cgccgtacgt gcccatagac aaggaggtga 13560
agatcgacgg tttttacatg cgcatggcgc tgaaggtgct caccctgagc gacgacctgg 13620
gcgtgtaccg caacgagcgc atccacaagg ccgtgagcgt gagccggcgg cgcgagctga 13680
gcgaccgcga gctgatgcac agcctgcagc gggcgctggc gggcgccggc agcggcgaca 13740
gggaggcgga gtcctacttc gatgcggggg cggacctgcg ctgggcgccc agccggcggg 13800
ccctggaggc cgcgggggtc cgcgaggact atgacgagga cggcgaggag gatgaggagt 13860
acgagctaga ggagggcgag tacctggact aaaccgcggg tggtgtttcc ggtagatgca 13920
agacccgaac gtggtggacc cggcgctgcg ggcggctctg cagagccagc cgtccggcct 13980
taactcctca gacgactggc gacaggtcat ggaccgcatc atgtcgctga cggcgcgtaa 14040
cccggacgcg ttccggcagc agccgcaggc caacaggctc tccgccatcc tggaggcggt 14100
ggtgcctgcg cgctcgaacc ccacgcacga gaaggtgctg gccatagtga acgcgctggc 14160
cgagaacagg gccatccgcc cggacgaggc cgggctggtg tacgacgcgc tgctgcagcg 14220
cgtggcccgc tacaacagcg gcaacgtgca gaccaacctg gaccggctgg tgggggacgt 14280
gcgcgaggcg gtggcgcagc gcgagcgcgc ggatcggcag ggcaacctgg gctccatggt 14340
ggcgctgaat gccttcctga gcacgcagcc ggccaacgtg ccgcgggggc aggaagacta 14400
caccaacttt gtgagcgcgc tgcggctgat ggtgaccgag accccccaga gcgaggtgta 14460
ccagtcgggc ccggactact tcttccagac cagcagacag ggcctgcaga cggtgaacct 14520
gagccaggct ttcaagaacc tgcgggggct gtggggcgtg aaggcgccca ccggcgaccg 14580
ggcgacggtg tccagcctgc tgacgcccaa ctcgcgcctg ctgctgctgc tgatcgcgcc 14640
gttcacggac agcggcagcg tgtcccggga cacctacctg gggcacctgc tgaccctgta 14700
ccgcgaggcc atcgggcagg cgcaggtgga cgagcacacc ttccaggaga tcaccagcgt 14760
gagccgcgcg ctggggcagg aggacacgag cagcctggag gcgactctga actacctgct 14820
gaccaaccgg cggcagaaga ttccctcgct gcacagcctg acctccgagg aggagcgcat 14880
cttgcgctac gtgcagcaga gcgtgagcct gaacctgatg cgcgacgggg tgacgcccag 14940
cgtggcgctg gacatgaccg cgcgcaacat ggaaccgggc atgtacgccg cgcaccggcc 15000
ttacatcaac cgcctgatgg actacctgca tcgcgcggcg gccgtgaacc ccgagtactt 15060
taccaacgcc atcctgaacc cgcactggct cccgccgccc gggttctaca gcgggggctt 15120
cgaggtcccg gagaccaacg atggcttcct gtgggacgac atggacgaca gcgtgttctc 15180
cccgcggccg caggcgctgg cggaagcgtc cctgctgcgt cccaagaagg aggaggagga 15240
ggaggcgagt cgccgccgcg gcagcagcgg cgtggcttct ctgtccgagc tgggggcggc 15300
agccgccgcg cgccccgggt ccctgggcgg cagccccttt ccgagcctgg tggggtctct 15360
gcacagcgag cgcaccaccc gccctcggct gctgggcgag gacgagtacc tgaataactc 15420
cctgctgcag ccggtgcggg agaaaaacct gcctcccgcc ttccccaaca acgggataga 15480
gagcctggtg gacaagatga gcagatggaa gacctatgcg caggagcaca gggacgcgcc 15540
tgcgctccgg ccgcccacgc ggcgccagcg ccacgaccgg cagcgggggc tggtgtggga 15600
tgacgaggac tccgcggacg atagcagcgt gctggacctg ggagggagcg gcaacccgtt 15660
cgcgcacctg cgcccccgcc tggggaggat gttttaaaaa aaaaaaaaaa angcaagaag 15720
catgatgcaa aaattaaata aaactcacca aggccatggc gaccgagcgt tggtttcttg 15780
tgttcccttc agtatgcggc gcgcggcgat gtaccaggag ggacctcctc cctcttacga 15840
gagcgtggtg ggcgcggcgg cggcggcgcc ctcttctccc tttgcgtcgc agctgctgga 15900
gccgccgtac gtgcctccgc gctacctgcg gcctacgggg gggagaaaca gcatccgtta 15960
ctcggagctg gcgcccctgt tcgacaccac ccgggtgtac ctggtggaca acaagtcggc 16020
ggacgtggcc tccctgaact accagaacga ccacagcaat tttttgacca cggtcatcca 16080
gaacaatgac tacagcccga gcgaggccag cacccagacc atcaatctgg atgaccggtc 16140
gcactggggc ggcgacctga aaaccatcct gcacaccaac atgcccaacg tgaacgagtt 16200
catgttcacc aataagttca aggcgcgggt gatggtgtcg cgctcgcaca ccaaggaaga 16260
ccgggtggag ctgaagtacg agtgggtgga gttcgagctg ccagagggca actactccga 16320
gaccatgacc attgacctga tgaacaacgc gatcgtggag cactatctga aagtgggcag 16380
gcagaacggg gtcctggaga gcgacatcgg ggtcaagttc gacaccagga acttccgcct 16440
ggggctggac cccgtgaccg ggctggttat gcccggggtg tacaccaacg aggccttcca 16500
tcccgacatc atcctgctgc ccggctgcgg ggtggacttc acttacagcc gcctgagcaa 16560
cctcctgggc atccgcaagc ggcagccctt ccaggagggc ttcaggatca cctacgagga 16620
cctggagggg ggcaacatcc ccgcgctcct cgatgtggag gcctaccagg atagcttgaa 16680
ggaaaatgag gcgggacagg aggataccgc ccccgccgcc tccgccgccg ccgagcaggg 16740
cgaggatgct gctgacaccg cggccgcgga cggggcagag gccgaccccg ctatggtggt 16800
ggaggctccc gagcaggagg aggacatgaa tgacagtgcg gtgcgcggag acaccttcgt 16860
cacccggggg gaggaaaagc aagcggaggc cgaggccgcg gccgaggaaa agcaactggc 16920
ggcagcagcg gcggcggcgg cgttggccgc ggcggaggct gagtctgagg ggaccaagcc 16980
cgccaaggag cccgtgatta agcccctgac cgaagatagc aagaagcgca gttacaacct 17040
gctcaaggac agcaccaaca ccgcgtaccg cagctggtac ctggcctaca actacggcga 17100
cccgtcgacg ggggtgcgct cctggaccct gctgtgcacg ccggacgtga cctgcggctc 17160
ggagcaggtg tactggtcgc tgcccgacat gatgcaagac cccgtgacct tccgctccac 17220
gcggcaggtc agcaacttcc cggtggtggg cgccgagctg ctgcccgtgc actccaagag 17280
cttctacaac gaccaggccg tctactccca gctcatccgc cagttcacct ctctgaccca 17340
cgtgttcaat cgctttcctg agaaccagat tctggcgcgc ccgcccgccc ccaccatcac 17400
caccgtcagt gaaaacgttc ctgctctcac agatcacggg acgctaccgc tgcgcaacag 17460
catcggagga gtccagcgag tgaccgttac tgacgccaga cgccgcacct gcccctacgt 17520
ttacaaggcc ttgggcatag tctcgccgcg cgtcctttcc agccgcactt tttgagcaac 17580
accaccatca tgtccatcct gatctcaccc agcaataact ccggctgggg actgctgcgc 17640
gcgcccagca agatgttcgg aggggcgagg aagcgttccg agcagcaccc cgtgcgcgtg 17700
cgcgggcact tccgcgcccc ctggggagcg cacaaacgcg gccgcgcggg gcgcaccacc 17760
gtggacgacg ccatcgactc ggtggtggag caggcgcgca actacaggcc cgcggtctct 17820
accgtggacg cggccatcca gaccgtggtg cggggcgcgc ggcggtacgc caagctgaag 17880
agccgccgga agcgcgtggc ccgccgccac cgccgccgac ccggggccgc cgccaaacgc 17940
gccgccgcgg ccctgcttcg ccgggccaag cgcacgggcc gccgcgccgc catgagggcc 18000
gcgcgccgct tggccgccgg catcaccgcc gccaccatgg ccccccgtac ccgaagacgc 18060
gcggccgccg ccgccgccgc cgccatcagt gacatggcca gcaggcgccg gggcaacgtg 18120
tactgggtgc gcgactcggt gaccggcacg cgcgtgcccg tgcgcttccg ccccccgcgg 18180
acttgagatg atgtgaaaaa acaacactga gtctcctgct gttgtgtgta tcccagcggc 18240
ggcggcgcgc gcagcgtcat gtccaagcgc aaaatcaaag aagagatgct ccaggtcgtc 18300
gcgccggaga tctatgggcc cccgaagaag gaagagcagg attcgaagcc ccgcaagata 18360
aagcgggtca aaaagaaaaa gaaagatgat gacgatgccg atggggaggt ggagttcctg 18420
cgcgccacgg cgcccaggcg cccggtgcag tggaagggcc ggcgcgtaaa gcgcgtcctg 18480
cgccccggca ccgcggtggt cttcacgccc ggcgagcgct ccacccggac tttcaagcgc 18540
gtctatgacg aggtgtacgg cgacgaagac ctgctggagc aggccaacga gcgcttcgga 18600
gagtttgctt acgggaagcg tcagcgggcg ctggggaagg aggacctgct ggcgctgccg 18660
ctggaccagg gcaaccccac ccccagtctg aagcccgtga ccctgcagca ggtgctgccg 18720
agcagcgcac cctccgaggc gaagcggggt ctgaagcgcg agggcggcga cctggcgccc 18780
accgtgcagc tcatggtgcc caagcggcag aggctggagg atgtgctgga gaaaatgaaa 18840
gtagaccccg gtctgcagcc ggacatcagg gtccgcccca tcaagcaggt ggcgccgggc 18900
ctcggcgtgc agaccgtgga cgtggtcatc cccaccggca actcccccgc cgccgccacc 18960
actaccgctg cctccacgga catggagaca cagaccgatc ccgccgcagc cgcagccgca 19020
gccgccgccg cgacctcctc ggcggaggtg cagacggacc cctggctgcc gccggcgatg 19080
tcagctcccc gcgcgcgtcg cgggcgcagg aagtacggcg ccgccaacgc gctcctgccc 19140
gagtacgcct tgcatccttc catcgcgccc acccccggct accgaggcta tacctaccgc 19200
ccgcgaagag ccaagggttc cacccgccgt ccccgccgac gcgccgccgc caccacccgc 19260
cgccgccgcc gcagacgcca gcccgcactg gctccagtct ccgtgaggaa agtggcgcgc 19320
gacggacaca ccctggtgct gcccagggcg cgctaccacc ccagcatcgt ttaaaagcct 19380
gttgtggttc ttgcagatat ggccctcact tgccgcctcc gtttcccggt gccgggatac 19440
cgaggaggaa gatcgcgccg caggaggggt ctggccggcc gcggcctgag cggaggcagc 19500
cgccgcgcgc accggcggcg acgcgccacc agccgacgca tgcgcggcgg ggtgctgccc 19560
ctgttaatcc ccctgatcgc cgcggcgatc ggcgccgtgc ccgggatcgc ctccgtggcc 19620
ttgcaagcgt cccagaggca ttgacagact tgcaaacttg caaatatgga aaaaaaaacc 19680
ccaataaaaa agtctagact ctcacgctcg cttggtcctg tgactatttt gtagaatgga 19740
agacatcaac tttgcgtcgc tggccccgcg tcacggctcg cgcccgttcc tgggacactg 19800
gaacgatatc ggcaccagca acatgagcgg tggcgccttc agttggggct ctctgtggag 19860
cggcattaaa agtatcgggt ctgccgttaa aaattacggc tcccgggcct ggaacagcag 19920
cacgggccag atgttgagag acaagttgaa agagcagaac ttccagcaga aggtggtgga 19980
gggcctggcc tccggcatca acggggtggt ggacctggcc aaccaggccg tgcagaataa 20040
gatcaacagc agactggacc cccggccgcc ggtggaggag gtgccgccgg cgctggagac 20100
ggtgtccccc gatgggcgtg gcgagaagcg cccgcggccc gatagggaag agaccactct 20160
ggtcacgcag accgatgagc cgcccccgta tgaggaggcc ctgaagcaag gtctgcccac 20220
cacgcggccc atcgcgccca tggccaccgg ggtggtgggc cgccacaccc ccgccacgct 20280
ggacttgcct ccgcccgccg atgtgccgca gcagcagaag gcggcacagc cgggcccgcc 20340
cgcgaccgcc tcccgttcct ccgccggtcc tctgcgccgc gcggccagcg gcccccgcgg 20400
gggggtcgcg aggcacggca actggcagag cacgctgaac agcatcgtgg gtctgggggt 20460
gcggtccgtg aagcgccgcc gatgctactg aatagcttag ctaacgtgtt gtatgtgtgt 20520
atgcgcccta tgtcgccgcc agaggagctg ctgagtcgcc gccgttcgcg cgcccaccac 20580
caccgccact ccgcccctca agatggcgac cccatcgatg atgccgcagt ggtcgtacat 20640
gcacatctcg ggccaggacg cctcggagta cctgagcccc gggctggtgc agttcgcccg 20700
cgccaccgag agctacttca gcctgagtaa caagtttagg aaccccacgg tggcgcccac 20760
gcacgatgtg accaccgacc ggtctcagcg cctgacgctg cggttcattc ccgtggaccg 20820
cgaggacacc gcgtactcgt acaaggcgcg gttcaccctg gccgtgggcg acaaccgcgt 20880
gctggacatg gcctccacct actttgacat ccgcggggtg ctggaccggg gtcccacttt 20940
caagccctac tctggcaccg cctacaactc cctggccccc aagggcgctc ccaactcctg 21000
cgagtgggag caagaggaaa ctcaggcagt tgaagaagca gcagaagagg aagaagaaga 21060
tgctgacggt caagctgagg aagagcaagc agctaccaaa aagactcatg tatatgctca 21120
ggctcccctt tctggcgaaa aaattagtaa agatggtctg caaataggaa cggacgctac 21180
agctacagaa caaaaaccta tttatgcaga ccctacattc cagcccgaac cccaaatcgg 21240
ggagtcccag tggaatgagg cagatgctac agtcgccggc ggtagagtgc taaagaaatc 21300
tactcccatg aaaccatgct atggttccta tgcaagaccc acaaatgcta atggaggtca 21360
gggtgtacta acggcaaatg cccagggaca gctagaatct caggttgaaa tgcaattctt 21420
ttcaacttct gaaaacgccc gtaacgaggc taacaacatt cagcccaaat tggtgctgta 21480
tagtgaggat gtgcacatgg agaccccgga tacgcacctt tcttacaagc ccgcaaaaag 21540
cgatgacaat tcaaaaatca tgctgggtca gcagtccatg cccaacagac ctaattacat 21600
cggcttcaga gacaacttta tcggcctcat gtattacaat agcactggca acatgggagt 21660
gcttgcaggt caggcctctc agttgaatgc agtggtggac ttgcaagaca gaaacacaga 21720
actgtcctac cagctcttgc ttgattccat gggtgacaga accagatact tttccatgtg 21780
gaatcaggca gtggacagtt atgacccaga tgttagaatt attgaaaatc atggaactga 21840
agacgagctc cccaactatt gtttccctct gggtggcata ggggtaactg acacttacca 21900
ggctgttaaa accaacaatg gcaataacgg gggccaggtg acttggacaa aagatgaaac 21960
ttttgcagat cgcaatgaaa taggggtggg aaacaatttc gctatggaga tcaacctcag 22020
tgccaacctg tggagaaact tcctgtactc caacgtggcg ctgtacctac cagacaagct 22080
taagtacaac ccctccaatg tggacatctc tgacaacccc aacacctacg attacatgaa 22140
caagcgagtg gtggccccgg ggctggtgga ctgctacatc aacctgggcg cgcgctggtc 22200
gctggactac atggacaacg tcaacccctt caaccaccac cgcaatgcgg gcctgcgcta 22260
ccgctccatg ctcctgggca acgggcgcta cgtgcccttc cacatccagg tgccccagaa 22320
gttctttgcc atcaagaacc tcctcctcct gccgggctcc tacacctacg agtggaactt 22380
caggaaggat gtcaacatgg tcctccagag ctctctgggt aacgatctca gggtggacgg 22440
ggccagcatc aagttcgaga gcatctgcct ctacgccacc ttcttcccca tggcccacaa 22500
cacggcctcc acgctcgagg ccatgctcag gaacgacacc aacgaccagt ccttcaatga 22560
ctacctctcc gccgccaaca tgctctaccc catacccgcc aacgccacca acgtccccat 22620
ctccatcccc tcgcgcaact gggcggcctt ccgcggctgg gccttcaccc gcctcaagac 22680
caaggagacc ccctccctgg gctcgggatt cgacccctac tacacctact cgggctccat 22740
tccctacctg gacggcacct tctacctcaa ccacactttc aagaaggtct cggtcacctt 22800
cgactcctcg gtcagctggc cgggcaacga ccgtctgctc acccccaacg agttcgagat 22860
caagcgctcg gtcgacgggg agggctacaa cgtggcccag tgcaacatga ccaaggactg 22920
gttcctggtc cagatgctgg ccaactacaa catcggctac cagggcttct acatcccaga 22980
gagctacaag gacaggatgt actccttctt caggaacttc cagcccatga gccggcaggt 23040
ggtggaccag accaagtaca aggactacca ggaggtgggc atcatccacc agcacaacaa 23100
ctcgggcttc gtgggctacc tcgcccccac catgcgcgag ggacaggcct accccgccaa 23160
cttcccctat ccgctcatag gcaagaccgc ggtcgacagc atcacccaga aaaagttcct 23220
ctgcgaccgc accctctggc gcatcccctt ctccagcaac ttcatgtcca tgggtgcgct 23280
ctcggacctg ggccagaact tgctctacgc caactccgcc cacgccctcg acatgacctt 23340
cgaggtcgac cccatggacg agcccaccct tctctatgtt ctgttcgaag tctttgacgt 23400
ggtccgggtc caccagccgc accgcggcgt catcgagacc gtgtacctgc gtacgccctt 23460
ctcggccggc aacgccacca cctaaagaag caagccgcag tcatcgccgc ctgcatgccg 23520
tcgggttcca ccgagcaaga gctcagggcc atcgtcagag acctgggatg cgggccctat 23580
tttttgggca ccttcgacaa gcgcttccct ggctttgtct ccccacacaa gctggcctgc 23640
gccatcgtca acacggccgg ccgcgagacc gggggcgtgc actggctggc cttcgcctgg 23700
aacccgcgct ccaaaacatg cttcctcttt gaccccttcg gcttttcgga ccagcggctc 23760
aagcaaatct acgagttcga gtacgagggc ttgctgcgtc gcagcgccat cgcctcctcg 23820
cccgaccgct gcgtcaccct cgaaaagtcc acccagaccg tgcaggggcc cgactcggcc 23880
gcctgcggtc tcttctgctg catgtttctg cacgcctttg tgcactggcc tcagagtccc 23940
atggaccgca accccaccat gaacttgctg acgggggtgc ccaactccat gctccagagc 24000
ccccaggtcg agcccaccct gcgccgcaac caggagcagc tctacagctt cctggagcgc 24060
cactcgcctt acttccgccg ccacagcgca cagatcagga gggccacctc cttctgccac 24120
ttgcaagaga tgcaagaagg gtaataacga tgtacacact ttttttctca ataaatggca 24180
tctttttatt tatacaagct ctctggggta ttcatttccc accaccaccc gccgttgtcg 24240
ccatctggct ctatttagaa atcgaaaggg ttctgccggg agtcgccgtg cgccacgggc 24300
agggacacgt tgcgatactg gtagcgggtg ccccacttga actcgggcac caccaggcga 24360
ggcagctcgg ggaagttttc gctccacagg ctgcgggtca gcaccagcgc gttcatcagg 24420
tcgggcgccg agatcttgaa gtcgcagttg gggccgccgc cctgcgcgcg cgagttgcgg 24480
tacaccgggt tgcagcactg gaacaccaac agcgccgggt gcttcacgct ggccagcacg 24540
ctgcggtcgg agatcagctc ggcgtccagg tcctccgcgt tgctcagcgc gaacggggtc 24600
atcttgggca cttgccgccc caggaagggc gcgtgccccg gtttcgagtt gcagtcgcag 24660
cgcagcggga tcagcaggtg cccgtgcccg gactcggcgt tggggtacag cgcgcgcatg 24720
aaggcctgca tctggcggaa ggccatctgg gccttggcgc cctccgagaa gaacatgccg 24780
caggacttgc ccgagaactg gtttgcgggg cagctggcgt cgtgcaggca gcagcgcgcg 24840
tcggtgttgg cgatctgcac cacgttgcgc ccccaccggt tcttcacgat cttggccttg 24900
gacgattgct ccttcagcgc gcgctgcccg ttctcgctgg tcacatccat ctcgatcaca 24960
tgttccttgt tcaccatgct gctgccgtgc agacacttca gctcgccctc cgtctcggtg 25020
cagcggtgct gccacagcgc gcagcccgtg ggctcgaaag acttgtaggt cacctccgcg 25080
aaggactgca ggtacccctg caaaaagcgg cccatcatgg tcacgaaggt cttgttgctg 25140
ctgaaggtca gctgcagccc gcggtgctcc tcgttcagcc aggtcttgca cacggccgcc 25200
agcgcctcca cctggtcggg cagcatcttg aagttcacct tcagctcatt ctccacgtgg 25260
tacttgtcca tcagcgtgcg cgccgcctcc atgcccttct cccaggccga caccagcggc 25320
aggctcacgg ggttcttcac catcaccgtg gccgccgcct ccgccgcgct ttcgctttcc 25380
gccccgctgt tctcttcctc ttcctcctct tcctcgccgc cgcccactcg cagcccccgc 25440
accacggggt cgtcttcctg caggcgctgc accttgcgct tgccgttgcg cccctgcttg 25500
atgcgcacgg gcgggttgct gaagcccacc atcaccagcg cggcctcttc ttgctcgtcc 25560
tcgctgtcca gaatgacctc cggggagggg gggttggtca tcctcagtac cgaggcacgc 25620
ttctttttct tcctgggggc gttcgccagc tccgcggctg cggccgctgc cgaggtcgaa 25680
ggccgagggc tgggcgtgcg cggcaccagc gcgtcctgcg agccgtcctc gtcctcctcg 25740
gactcgagac ggaggcgggc ccgcttcttc gggggcgcgc ggggcggcgg aggcggcggc 25800
ggcgacggag acggggacga gacatcgtcc agggtgggtg gacggcgggc cgcgccgcgt 25860
ccgcgctcgg gggtggtctc gcgctggtcc tcttcccgac tggccatctc ccactgctcc 25920
ttctcctata ggcagaaaga gatcatggag tctctcatgc gagtcgagaa ggaggaggac 25980
agcctaaccg ccccctctga gccctccacc accgccgcca ccaccgccaa tgccgccgcg 26040
gacgacgcgc ccaccgagac caccgccagt accaccctcc ccagcgacgc acccccgctc 26100
gagaatgaag tgctgatcga gcaggacccg ggttttgtga gcggagagga ggatgaggtg 26160
gatgagaagg agaaggagga ggtcgccgcc tcagtgccaa aagaggataa aaagcaagac 26220
caggacgacg cagataagga tgagacagca gtcgggcggg ggaacggaag ccatgatgct 26280
gatgacggct acctagacgt gggagacgac gtgctgctta agcacctgca ccgccagtgc 26340
gtcatcgtct gcgacgcgct gcaggagcgc tgcgaagtgc ccctggacgt ggcggaggtc 26400
agccgcgcct acgagcggca cctcttcgcg ccgcacgtgc cccccaagcg ccgggagaac 26460
ggcacctgcg agcccaaccc gcgtctcaac ttctacccgg tcttcgcggt acccgaggtg 26520
ctggccacct accacatctt tttccaaaac tgcaagatcc ccctctcctg ccgcgccaac 26580
cgcacccgcg ccgacaaaac cctgaccctg cggcagggcg cccacatacc tgatatcgcc 26640
tctctggagg aagtgcccaa gatcttcgag ggtctcggtc gcgacgagaa acgggcggcg 26700
aacgctctgc acggagacag cgaaaacgag agtcactcgg gggtgctggt ggagctcgag 26760
ggcgacaacg cgcgcctggc cgtactcaag cgcagcatag aggtcaccca ctttgcctac 26820
ccggcgctca acctgccccc caaggtcatg agtgtggtca tgggcgagct catcatgcgc 26880
cgcgcccagc ccctggccgc ggatgcaaac ttgcaagagt cctccgagga aggcctgccc 26940
gcggtcagcg acgagcagct ggcgcgctgg ctggagaccc gcgaccccgc gcagctggag 27000
gagcggcgca agctcatgat ggccgcggtg ctggtcaccg tggagctcga gtgtctgcag 27060
cgcttcttcg cggaccccga gatgcagcgc aagctcgagg agaccctgca ctacaccttc 27120
cgccagggct acgtgcgcca ggcctgcaag atctccaacg tggagctctg caacctggtc 27180
tcctacctgg gcatcctgca cgagaaccgc ctcgggcaga acgtcctgca ctccaccctc 27240
aaaggggagg cgcgccgcga ctacatccgc gactgcgcct acctcttcct ctgctacacc 27300
tggcagacgg ccatgggggt ctggcagcag tgcctggagg agcgcaacct caaggagctg 27360
gaaaagctcc tcaagcgcac cctcagggac ctctggacgg gcttcaacga gcgctcggtg 27420
gccgccgcgc tggcggacat catctttccc gagcgcctgc tcaagaccct gcagcagggc 27480
ctgcccgact tcaccagcca gagcatgctg cagaacttca ggactttcat cctggagcgc 27540
tcgggcatcc tgccggccac ttgctgcgcg ctgcccagcg acttcgtgcc catcaagtac 27600
agggagtgcc cgccgccgct ctggggccac tgctacctct tccagctggc caactacctc 27660
gcctaccact cggacctcat ggaagacgtg agcggcgagg gcctgctcga gtgccactgc 27720
cgctgcaacc tctgcacgcc ccaccgctct ctagtctgca acccgcagct gctcagcgag 27780
agtcagatta tcggtacctt cgagctgcag ggtccctcgc ctgacgagaa gtccgcggct 27840
ccagggctga aactcactcc ggggctgtgg acttccgcct acctacgcaa atttgtacct 27900
gaggactacc acgcccacga gatcaggttc tacgaagacc aatcccgccc gcccaaggcg 27960
gagctcaccg cctgcgtcat cacccagggg cacatcctgg gccaattgca agccatcaac 28020
aaagcccgcc gagagttctt gctgaaaaag ggtcgggggg tgtacctgga cccccagtcc 28080
ggcgaggagc taaacccgct acccccgccg ccgccccagc agcgggacct tgcttcccag 28140
gatggcaccc agaaagaagc agcagccgcc gccgccgccg cagccataca tgcttctgga 28200
ggaagaggag gaggactggg acagtcaggc agaggaggtt tcggacgagg agcaggagga 28260
gatgatggaa gactgggagg aggacagcag cctagacgag gaagcttcag aggccgaaga 28320
ggtggcagac gcaacaccat cgccctcggt cgcagccccc tcgccggggc ccctgaaatc 28380
ctccgaaccc agcaccagcg ctataacctc cgctcctccg gcgccggcgc cacccgcccg 28440
cagacccaac cgtagatggg acaccacagg aaccggggtc ggtaagtcca agtgcccgcc 28500
gccgccaccg cagcagcagc agcagcagcg ccagggctac cgctcgtggc gcgggcacaa 28560
gaacgccata gtcgcctgct tgcaagactg cgggggcaac atctctttcg cccgccgctt 28620
cctgctattc caccacgggg tcgcctttcc ccgcaatgtc ctgcattact accgtcatct 28680
ctacagcccc tactgcagcg gcgacccaga ggcggcagcg gcagccacag cggcgaccac 28740
cacctaggaa gatatcctcc gcgggcaaga cagcggcagc agcggccagg agacccgcgg 28800
cagcagcggc gggagcggtg ggcgcactgc gcctctcgcc caacgaaccc ctctcgaccc 28860
gggagctcag acacaggatc ttccccactt tgtatgccat cttccaacag agcagaggcc 28920
aggagcagga gctgaaaata aaaaacagat ctctgcgctc cctcacccgc agctgtctgt 28980
atcacaaaag cgaagatcag cttcggcgca cgctggagga cgcggaggca ctcttcagca 29040
aatactgcgc gctcactctt aaagactagc tccgcgccct tctcgaattt aggcgggaga 29100
aaactacgtc atcgccggcc gccgcccagc ccgcccagcc gagatgagca aagagattcc 29160
cacgccatac atgtggagct accagccgca gatgggactc gcggcgggag cggcccagga 29220
ctactccacc cgcatgaact acatgagcgc gggaccccac atgatctcac aggtcaacgg 29280
gatccgcgcc cagcgaaacc aaatactgct ggaacaggcg gccatcaccg ccacgccccg 29340
ccataatctc aacccccgaa attggcccgc cgccctcgtg taccaggaaa ccccctccgc 29400
caccaccgta ctacttccgc gtgacgccca ggccgaagtc cagatgacta actcaggggc 29460
gcagctcgcg ggcggctttc gtcacggggc gcggccgctc cgaccaggta taagacacct 29520
gatgatcaga ggccgaggta tccagctcaa cgacgagtcg gtgagctctt cgctcggtct 29580
ccgtccggac ggaactttcc agctcgccgg atccggccgc tcttcgttca cgccccgcca 29640
ggcgtacctg actctgcaga cctcgtcctc ggagccccgc tccggcggca tcggaaccct 29700
ccagttcgtg gaggagttcg tgccctcggt ctacttcaac cccttctcgg gacctcccgg 29760
acgctacccc gaccagttca ttccgaactt tgacgcggtg aaggactcgg cggacggcta 29820
cgactgaatg tcaggtgtcg aggcagagca gcttcgcctg agacacctcg agcactgccg 29880
ccgccacaag tgcttcgccc gcggttctgg tgagttctgc tactttcagc tacccgagga 29940
gcataccgag gggccggcgc acggcgtccg cctgaccacc cagggcgagg ttacctgttc 30000
cctcatccgg gagtttaccc tccgtcccct gctagtggag cgggagcggg gtccctgtgt 30060
cctaactatc gcctgcaact gccctaaccc tggattacat caagatcttt gctgtcatct 30120
ctgtgctgag tttaataaac gctgagatca gaatctactg gggctcctgt cgccatcctg 30180
tgaacgccac cgtcttcacc caccccgacc aggcccaggc gaacctcacc tgcggtctgc 30240
atcggagggc caagaagtac ctcacctggt acttcaacgg cacccccttt gtggtttaca 30300
acagcttcga cggggacgga gtctccctga aagaccagct ctccggtctc agctactcca 30360
tccacaagaa caccaccctc caactcttcc ctccctacct gccgggaacc tacgagtgcg 30420
tcaccggccg ctgcacccac ctcacccgcc tgatcgtaaa ccagagcttt ccgggaacag 30480
ataactccct cttccccaga acaggaggtg agctcaggaa actccccggg gaccagggcg 30540
gagacgtacc ttcgaccctt gtggggttag gattttttat taccgggttg ctggctcttt 30600
taatcaaagt ttccttgaga tttgttcttt ccttctacgt gtatgaacac ctcaacctcc 30660
aataactcta ccctttcttc ggaatcaggt gacttctctg aaatcgggct tggtgtgctg 30720
cttactctgt tgattttttt ccttatcata ctcagccttc tgtgcctcag gctcgccgcc 30780
tgctgcgcac acatctatat ctactgctgg ttgctcaagt gcaggggtcg ccacccaaga 30840
tgaacaggta catggtccta tcgatcctag gcctgctggc cctggcggcc tgcagcgccg 30900
ccaaaaaaga gattaccttt gaggagcccg cttgcaatgt aactttcaag cccgagggtg 30960
accaatgcac caccctcgtc aaatgcgtta ccaatcatga gaggctgcgc atcgactaca 31020
aaaacaaaac tggccagttt gcggtctata gtgtgtttac gcccggagac ccctctaact 31080
actctgtcac cgtcttccag ggcggacagt ctaagatatt caattacact ttcccttttt 31140
atgagttatg cgatgcggtc atgtacatgt caaaacagta caacctgtgg cctccctctc 31200
cccaggcgtg tgtggaaaat actgggtctt actgctgtat ggctttcgca atcactacgc 31260
tcgctctaat ctgcacggtg ctatacataa aattcaggca gaggcgaatc tttatcgatg 31320
aaaagaaaat gccttgatcg ctaacaccgg ctttctatct gcagaatgaa tgcaatcacc 31380
tccctactaa tcaccaccac cctccttgcg attgcccatg ggttgacacg aatcgaagtg 31440
ccagtggggt ccaatgtcac catggtgggc cccgccggca attccaccct catgtgggaa 31500
aaatttgtcc gcaatcaatg ggttcatttc tgctctaacc gaatcagtat caagcccaga 31560
gccatctgcg atgggcaaaa tctaactctg atcaatgtgc aaatgatgga tgctgggtac 31620
tattacgggc agcggggaga aatcattaat tactggcgac cccacaagga ctacatgctg 31680
catgtagtcg aggcacttcc cactaccacc cccactacca cctctcccac caccaccacc 31740
actactacta ctactactac tactactact actaccacta ccgctgcccg ccatacccgc 31800
aaaagcacca tgattagcac aaagccccct cgtgctcact cccacgccgg cgggcccatc 31860
ggtgcgacct cagaaaccac cgagctttgc ttctgccaat gcactaacgc cagcgctcat 31920
gaactgttcg acctggagaa tgaggatgtc cagcagagct ccgcttgcct gacccaggag 31980
gctgtggagc ccgttgccct gaagcagatc ggtgattcaa taattgactc ttcttctttt 32040
gccactcccg aataccctcc cgattctact ttccacatca cgggtaccaa agaccctaac 32100
ctctctttct acctgatgct gctgctctgt atctctgtgg tctcttccgc gctgatgtta 32160
ctggggatgt tctgctgcct gatctgccgc agaaagagaa aagctcgctc tcagggccaa 32220
ccactgatgc ccttccccta ccccccggat tttgcagata acaagatatg agctcgctgc 32280
tgacactaac cgctttacta gcctgcgctc taacccttgt cgcttgcgac tcgagattcc 32340
acaatgtcac agctgtggca ggagaaaatg ttactttcaa ctccacggcc gatacccagt 32400
ggtcgtggag tggctcaggt agctacttaa ctatctgcaa tagctccact tcccccggca 32460
tatccccaac caagtaccaa tgcaatgcca gcctgttcac cctcatcaac gcttccaccc 32520
tggacaatgg actctatgta ggctatgtac cctttggtgg gcaaggaaag acccacgctt 32580
acaacctgga agttcgccag cccagaacca ctacccaagc ttctcccacc accaccacca 32640
ccaccaccat caccagcagc agcagcagca gcagccacag cagcagcagc agattattga 32700
ctttggtttt ggccagctca tctgccgcta cccaggccat ctacagctct gtgcccgaaa 32760
ccactcagat ccaccgccca gaaacgacca ccgccaccac cctacacacc tccagcgatc 32820
agatgccgac caacatcacc cccttggctc ttcaaatggg acttacaagc cccactccaa 32880
aaccagtgga tgcggccgag gtctccgccc tcgtcaatga ctgggcgggg ctgggaatgt 32940
ggtggttcgc cataggcatg atggcgctct gcctgcttct gctctggctc atctgctgcc 33000
tccaccgcag gcgagccaga ccccccatct atagacccat cattgtcctg aaccccgata 33060
atgatgggat ccatagattg gatggcctga aaaacctact tttttctttt acagtatgat 33120
aaattgagac atgcctcgca ttttcttgta catgttcctt ctcccacctt ttctggggtg 33180
ttctacgctg gccgctgtgt ctcacctgga ggtagactgc ctctcaccct tcactgtcta 33240
cctgctttac ggattggtca ccctcactct catctgcagc ctaatcacag taatcatcgc 33300
cttcatccag tgcattgatt acatctgtgt gcgcctcgca tacttcagac accacccgca 33360
gtaccgagac aggaacattg cccaacttct aagactgctc taatcatgca taagactgtg 33420
atctgccttc tgatcctctg catcctgccc accctcacct cctgccagta caccacaaaa 33480
tctccgcgca aaagacatgc ctcctgccgc ttcacccaac tgtggaatat acccaaatgc 33540
tacaacgaaa agagcgagct ctccgaagct tggctgtatg gggtcatctg tgtcttagtt 33600
ttctgcagca ctgtctttgc cctcataatc tacccctact ttgatttggg atggaacgcg 33660
atcgatgcca tgaattaccc cacctttccc gcacccgaga taattccact gcgacaagtt 33720
gtacccgttg tcgttaatca acgcccccca tcccctacgc ccactgaaat cagctacttt 33780
aacctaacag gcggagatga ctgacgccct agatctagaa atggacggca tcagtaccga 33840
gcagcgtctc ctagagaggc gcaggcaggc ggctgagcaa gagcgcctca atcaggagct 33900
ccgagatctc gttaacctgc accagtgcaa aagaggcatc ttttgtctgg taaagcaggc 33960
caaagtcacc tacgagaaga ccggcaacag ccaccgcctc agttacaaat tgcccaccca 34020
gcgccagaag ctggtgctca tggtgggtga gaatcccatc accgtcaccc agcactcggt 34080
agagaccgag gggtgtctgc actccccctg tcggggtcca gaagacctct gcaccctggt 34140
aaagaccctg tgcggtctca gagatttagt cccctttaac taatcaaaca ctggaatcaa 34200
taaaaagaat cacttactta aaatcagaca gcaggtctct gtccagttta ttcagcagca 34260
cctccttccc ctcctcccaa ctctggtact ccaaacgcct tctggcggca aacttcctcc 34320
acaccctgaa gggaatgtca gattcttgct cctgtccctc cgcacccact atcttcatgt 34380
tgttgcagat gaagcgcacc aaaacgtctg acgagagctt caaccccgtg tacccctatg 34440
acacggaaag cggccctccc tccgtccctt tcctcacccc tcccttcgtg tctcccgatg 34500
gattccaaga aagtcccccc ggggtcctgt ctctgaacct ggccgagccc ctggtcactt 34560
cccacggcat gctcgccctg aaaatgggaa gtggcctctc cctggacgac gctggcaacc 34620
tcacctctca agatatcacc accgctagcc ctcccctcaa aaaaaccaag accaacctca 34680
gcctagaaac ctcatccccc ctaactgtga gcacctcagg cgccctcacc gtagcagccg 34740
ccgctcccct ggcggtggcc ggcacctccc tcaccatgca atcagaggcc cccctgacag 34800
tacaggatgc aaaactcacc ctggccacca aaggccccct gaccgtgtct gaaggcaaac 34860
tggccttgca aacatcggcc ccgctgacgg ccgctgacag cagcaccctc acagtcagtg 34920
ccacaccacc ccttagcaca agcaatggca gcttgggtat tgacatgcaa gcccccattt 34980
acaccaccaa tggaaaacta ggacttaact ttggcgctcc cctgcatgtg gtagacagcc 35040
taaatgcact gactgtagtt actggccaag gtcttacgat aaacggaaca gccctacaaa 35100
ctagagtctc aggtgccctc aactatgaca catcaggaaa cctagaattg agagctgcag 35160
ggggtatgcg agttgatgca aatggtcaac ttatccttga tgtagcttac ccatttgatg 35220
cacaaaacaa tctcagcctt aggcttggac agggacccct gtttgttaac tctgcccaca 35280
acttggatgt taactacaac agaggcctct acctgttcac atctggaaat accaaaaagc 35340
tagaagttaa tatcaaaaca gccaagggtc tcatttatga tgacactgct atagcaatca 35400
atgcgggtga tgggctacag tttgactcag gctcagatac aaatccatta aaaactaaac 35460
ttggattagg actggattat gactccagca gagccataat tgctaaactg ggaactggcc 35520
taagctttga caacacaggt gccatcacag taggcaacaa aaatgatgac aagcttacct 35580
tgtggaccac accagaccca tcccctaact gtagaatcta ttcagagaaa gatgctaaat 35640
tcacacttgt tttgactaaa tgcggcagtc aggtgttggc cagcgtttct gttttatctg 35700
taaaaggtag ccttgcgccc atcagtggca cagtaactag tgctcagatt gtcctcagat 35760
ttgatgaaaa tggagttcta ctaagcaatt cttcccttga ccctcaatac tggaactaca 35820
gaaaaggtga ccttacagag ggcactgcat ataccaacgc agtgggattt atgcccaacc 35880
tcacagcata cccaaaaaca cagagccaaa ctgctaaaag caacattgta agtcaggttt 35940
acttgaatgg ggacaaatcc aaacccatga ccctcaccat taccctcaat ggaactaatg 36000
aaacaggaga tgccacagta agcacttact ccatgtcatt ctcatggaac tggaatggaa 36060
gtaattacat taatgaaacg ttccaaacca actccttcac cttctcctac atcgcccaag 36120
aataaaaagc atgacgctgt tgatttgatt caatgtgttt ctgttttatt ttcaagcaca 36180
acaaaatcat tcaagtcatt cttccatctt agcttaatag acacagtagc ttaatagacc 36240
cagtagtgca aagccccatt ctagcttata actagtggag aagtactcgc ctacatgggg 36300
gtagagtcat aatcgtgcat caggataggg cggtggtgct gcagcagcgc gcgaataaac 36360
tgctgccgcc gccgctccgt cctgcaggaa tacaacatgg cagtggtctc ctcagcgatg 36420
attcgcaccg cccgcagcat aaggcgcctt gtcctccggg cacagcagcg caccctgatc 36480
tcacttaaat cagcacagta actgcagcac agcaccacaa tattgttcaa aatcccacag 36540
tgcaaggcgc tgtatccaaa gctcatggcg gggaccacag aacccacgtg gccatcatac 36600
cacaagcgca ggtagattaa gtggcgaccc ctcataaaca cgctggacat aaacattacc 36660
tcttttggca tgttgtaatt caccacctcc cggtaccata taaacctctg attaaacatg 36720
gcgccatcca ccaccatcct aaaccagctg gccaaaacct gcccgccggc tatacactgc 36780
agggaaccgg gactggaaca atgacagtgg agagcccagg actcgtaacc atggatcatc 36840
atgctcgtca tgatatcaat gttggcacaa cacaggcaca cgtgcataca cttcctcagg 36900
attacaagct cctcccgcgt tagaaccata tcccagggaa caacccattc ctgaatcagc 36960
gtaaatccca cactgcaggg aagacctcgc acgtaactca cgttgtgcat tgtcaaagtg 37020
ttacattcgg gcagcagcgg atgatcctcc agtatggtag cgcgggtttc tgtctcaaaa 37080
ggaggtagac gatccctact gtacggagtg cgccgagaca accgagatcg tgttggtcgt 37140
agtgtcatgc caaatggaac gccggacgta gtcatatttc ctgaagtctt agatctctca 37200
acgcagcacc agcaccaaca cttcgcagtg taaaaggcca agtgccgaga gagtatatat 37260
aggaataaaa agtgacgtaa acgggcaaag tccaaaaaac gcccagaaaa accgcacgcg 37320
aacctacgcc ccgaaacgaa agccaaaaaa cactagacac tcccttccgg cgtcaacttc 37380
cgctttccca cgctacgtca cttgccccag tcaaacaaac tacatatccc gaacttccaa 37440
gtcgccacgc ccaaaacacc gcctacacct ccccgcccgc cggcccgccc ccaaacccgc 37500
ctcccgcccc gcgccccgcc ccgcgccgcc catctcatta tcatattggc ttcaatccaa 37560
aataaggtat attattgatg atggtttaaa cggatcctct agagtcgacc tgcaggcatg 37620
caagcttgag tataaccccc ttgcggccgc ccgggccgtc gaccaattct catgtttgac 37680
agcttatcat cgaatttctg ccattcatcc gcttattatc acttattcag gcgtagcaac 37740
caggcgttta agggcaccaa taactgcctt aaaaaaatta cgccccgccc tgccactcat 37800
cgcagtactg ttgtaattca ttaagcattc tgccgacatg gaagccatca caaacggcat 37860
gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca 37920
tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca aaactggtga 37980
aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct ttagggaaat 38040
aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga aactgccgga 38100
aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca tggaaaacgg 38160
tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt gccatacgga 38220
attccggatg agcattcatc aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt 38280
gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg gtctggttat 38340
aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc cattgggata 38400
tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta gctcctgaaa 38460
atctcgataa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg tgaaagttgg 38520
aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag ggcttcccgg 38580
tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc acaggtattt 38640
attcgcgata agctcatgga gcggcgtaac cgtcgcacag gaaggacaga gaaagcgcgg 38700
atctgggaag tgacggacag aacggtcagg acctggattg gggaggcggt tgccgccgct 38760
gctgctgacg gtgtgacgtt ctctgttccg gtcacaccac atacgttccg ccattcctat 38820
gcgatgcaca tgctgtatgc cggtataccg ctgaaagttc tgcaaagcct gatgggacat 38880
aagtccatca gttcaacgga agtctacacg aaggtttttg cgctggatgt ggctgcccgg 38940
caccgggtgc agtttgcgat gccggagtct gatgcggttg cgatgctgaa acaattatcc 39000
tgagaataaa tgccttggcc tttatatgga aatgtggaac tgagtggata tgctgttttt 39060
gtctgttaaa cagagaagct ggctgttatc cactgagaag cgaacgaaac agtcgggaaa 39120
atctcccatt atcgtagaga tccgcattat taatctcagg agcctgtgta gcgtttatag 39180
gaagtagtgt tctgtcatga tgcctgcaag cggtaacgaa aacgatttga atatgccttc 39240
aggaacaata gaaatcttcg tgcggtgtta cgttgaagtg gagcggatta tgtcagcaat 39300
ggacagaaca acctaatgaa cacagaacca tgatgtggtc tgtcctttta cagccagtag 39360
tgctcgccgc agtcgagcga cagggcgaag ccctcgagtg agcgaggaag caccagggaa 39420
cagcacttat atattctgct tacacacgat gcctgaaaaa acttcccttg gggttatcca 39480
cttatccacg gggatatttt tataattatt ttttttatag tttttagatc ttctttttta 39540
gagcgccttg taggccttta tccatgctgg ttctagagaa ggtgttgtga caaattgccc 39600
tttcagtgtg acaaatcacc ctcaaatgac agtcctgtct gtgacaaatt gcccttaacc 39660
ctgtgacaaa ttgccctcag aagaagctgt tttttcacaa agttatccct gcttattgac 39720
tcttttttat ttagtgtgac aatctaaaaa cttgtcacac ttcacatgga tctgtcatgg 39780
cggaaacagc ggttatcaat cacaagaaac gtaaaaatag cccgcgaatc gtccagtcaa 39840
acgacctcac tgaggcggca tatagtctct cccgggatca aaaacgtatg ctgtatctgt 39900
tcgttgacca gatcagaaaa tctgatggca ccctacagga acatgacggt atctgcgaga 39960
tccatgttgc taaatatgct gaaatattcg gattgacctc tgcggaagcc agtaaggata 40020
tacggcaggc attgaagagt ttcgcgggga aggaagtggt tttttatcgc cctgaagagg 40080
atgccggcga tgaaaaaggc tatgaatctt ttccttggtt tatcaaacgt gcgcacagtc 40140
catccagagg gctttacagt gtacatatca acccatatct cattcccttc tttatcgggt 40200
tacagaaccg gtttacgcag tttcggctta gtgaaacaaa agaaatcacc aatccgtatg 40260
ccatgcgttt atacgaatcc ctgtgtcagt atcgtaagcc ggatggctca ggcatcgtct 40320
ctctgaaaat cgactggatc atagagcgtt accagctgcc tcaaagttac cagcgtatgc 40380
ctgacttccg ccgccgcttc ctgcaggtct gtgttaatga gatcaacagc agaactccaa 40440
tgcgcctctc atacattgag aaaaagaaag gccgccagac gactcatatc gtattttcct 40500
tccgcgatat cacttccatg acgacaggat agtctgaggg ttatctgtca cagatttgag 40560
ggtggttcgt cacatttgtt ctgacctact gagggtaatt tgtcacagtt ttgctgtttc 40620
cttcagcctg catggatttt ctcatacttt ttgaactgta atttttaagg aagccaaatt 40680
tgagggcagt ttgtcacagt tgatttcctt ctctttccct tcgtcatgtg acctgatatc 40740
gggggttagt tcgtcatcat tgatgagggt tgattatcac agtttattac tctgaattgg 40800
ctatccgcgt gtgtacctct acctggagtt tttcccacgg tggatatttc ttcttgcgct 40860
gagcgtaaga gctatctgac agaacagttc ttctttgctt cctcgccagt tcgctcgcta 40920
tgctcggtta cacggctgcg gcgagcgcta gtgataataa gtgactgagg tatgtgctct 40980
tcttatctcc ttttgtagtg ttgctcttat tttaaacaac tttgcggttt tttgatgact 41040
ttgcgatttt gttgttgctt tgcagtaaat tgcaagattt aataaaaaaa cgcaaagcaa 41100
tgattaaagg atgttcagaa tgaaactcat ggaaacactt aaccagtgca taaacgctgg 41160
tcatgaaatg acgaaggcta tcgccattgc acagtttaat gatgacagcc cggaagcgag 41220
gaaaataacc cggcgctgga gaataggtga agcagcggat ttagttgggg tttcttctca 41280
ggctatcaga gatgccgaga aagcagggcg actaccgcac ccggatatgg aaattcgagg 41340
acgggttgag caacgtgttg gttatacaat tgaacaaatt aatcatatgc gtgatgtgtt 41400
tggtacgcga ttgcgacgtg ctgaagacgt atttccaccg gtgatcgggg ttgctgccca 41460
taaaggtggc gtttacaaaa cctcagtttc tgttcatctt gctcaggatc tggctctgaa 41520
ggggctacgt gttttgctcg tggaaggtaa cgacccccag ggaacagcct caatgtatca 41580
cggatgggta ccagatcttc atattcatgc agaagacact ctcctgcctt tctatcttgg 41640
ggaaaaggac gatgtcactt atgcaataaa gcccacttgc tggccggggc ttgacattat 41700
tccttcctgt ctggctctgc accgtattga aactgagtta atgggcaaat ttgatgaagg 41760
taaactgccc accgatccac acctgatgct ccgactggcc attgaaactg ttgctcatga 41820
ctatgatgtc atagttattg acagcgcgcc taacctgggt atcggcacga ttaatgtcgt 41880
atgtgctgct gatgtgctga ttgttcccac gcctgctgag ttgtttgact acacctccgc 41940
actgcagttt ttcgatatgc ttcgtgatct gctcaagaac gttgatctta aagggttcga 42000
gcctgatgta cgtattttgc ttaccaaata cagcaatagt aatggctctc agtccccgtg 42060
gatggaggag caaattcggg atgcctgggg aagcatggtt ctaaaaaatg ttgtacgtga 42120
aacggatgaa gttggtaaag gtcagatccg gatgagaact gtttttgaac aggccattga 42180
tcaacgctct tcaactggtg cctggagaaa tgctctttct atttgggaac ctgtctgcaa 42240
tgaaattttc gatcgtctga ttaaaccacg ctgggagatt agataatgaa gcgtgcgcct 42300
gttattccaa aacatacgct caatactcaa ccggttgaag atacttcgtt atcgacacca 42360
gctgccccga tggtggattc gttaattgcg cgcgtaggag taatggctcg cggtaatgcc 42420
attactttgc ctgtatgtgg tcgggatgtg aagtttactc ttgaagtgct ccggggtgat 42480
agtgttgaga agacctctcg ggtatggtca ggtaatgaac gtgaccagga gctgcttact 42540
gaggacgcac tggatgatct catcccttct tttctactga ctggtcaaca gacaccggcg 42600
ttcggtcgaa gagtatctgg tgtcatagaa attgccgatg ggagtcgccg tcgtaaagct 42660
gctgcactta ccgaaagtga ttatcgtgtt ctggttggcg agctggatga tgagcagatg 42720
gctgcattat ccagattggg taacgattat cgcccaacaa gtgcttatga acgtggtcag 42780
cgttatgcaa gccgattgca gaatgaattt gctggaaata tttctgcgct ggctgatgcg 42840
gaaaatattt cacgtaagat tattacccgc tgtatcaaca ccgccaaatt gcctaaatca 42900
gttgttgctc ttttttctca ccccggtgaa ctatctgccc ggtcaggtga tgcacttcaa 42960
aaagccttta cagataaaga ggaattactt aagcagcagg catctaacct tcatgagcag 43020
aaaaaagctg gggtgatatt tgaagctgaa gaagttatca ctcttttaac ttctgtgctt 43080
aaaacgtcat ctgcatcaag aactagttta agctcacgac atcagtttgc tcctggagcg 43140
acagtattgt ataagggcga taaaatggtg cttaacctgg acaggtctcg tgttccaact 43200
gagtgtatag agaaaattga ggccattctt aaggaacttg aaaagccagc accctgatgc 43260
gaccacgttt tagtctacgt ttatctgtct ttacttaatg tcctttgtta caggccagaa 43320
agcataactg gcctgaatat tctctctggg cccactgttc cacttgtatc gtcggtctga 43380
taatcagact gggaccacgg tcccactcgt atcgtcggtc tgattattag tctgggacca 43440
cggtcccact cgtatcgtcg gtctgattat tagtctggga ccacggtccc actcgtatcg 43500
tcggtctgat aatcagactg ggaccacggt cccactcgta tcgtcggtct gattattagt 43560
ctgggaccat ggtcccactc gtatcgtcgg tctgattatt agtctgggac cacggtccca 43620
ctcgtatcgt cggtctgatt attagtctgg aaccacggtc ccactcgtat cgtcggtctg 43680
attattagtc tgggaccacg gtcccactcg tatcgtcggt ctgattatta gtctgggacc 43740
acgatcccac tcgtgttgtc ggtctgatta tcggtctggg accacggtcc cacttgtatt 43800
gtcgatcaga ctatcagcgt gagactacga ttccatcaat gcctgtcaag ggcaagtatt 43860
gacatgtcgt cgtaacctgt agaacggagt aacctcggtg tgcggttgta tgcctgctgt 43920
ggattgctgc tgtgtcctgc ttatccacaa cattttgcgc acggttatgt ggacaaaata 43980
cctggttacc caggccgtgc cggcacgctc ggtacccggg gatcctcgtt taaac 44035
<210> 51
<211> 41464
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (16063)..(16063)
<223> a, c, t, g, unknown or other
<400> 51
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg agacctgctc cctggacacc taatcctccc 1380
aggtccccca gccagatgag cgtgagagac agactggcta ggctgagagc cgaggctcag 1440
gtcaagcagg ccagcgtcga ggtgcaaccc cctcagctca cccaggtgtc cccccagcag 1500
cctgtggccg gcattctgtt cattctggcc attctgaccg agtggggaag cggcaacaga 1560
acctacggcc ctgtcttcat gtgcctcgga ggactgctga caatggtggc tggcgccgtg 1620
tggctcaccg tcatgtccaa caccctgctc agcgcctgga ttctgaccgc cggattcctg 1680
atctttctga tcggattcgc tctctttggc gtcatcaggt gttgcaggta ctgttgctac 1740
tactgcctga ccctcgagag cgaggaaaga ccccccaccc cctacaggaa tacagtgagg 1800
aaacctcagc agcccgagag cctcgaggag tgcgatagcg agctggagat taaaaggtat 1860
aagaataggg tggcctccag gaagtgtagg gctaaattca aacagctcct gcaacactat 1920
agggaagtgg ccgccgccaa gtccagcgag attagggaca gaaggaggaa tcctgcctcc 1980
aggagagacc aggccaaatg gagactccaa acactcgccg ctggatggcc catgggctac 2040
caggcctata gctcctggat gtacagctac accgaccatc agacaacacc caccttcgtg 2100
catctgcagg ctacactggg ctgcaccgga ggcagaaggt gtcacgtgtt tctgggaatc 2160
gtgctgttca tctttggatg cctgctcgtg ctgggcatct ggatttatct cctggagatg 2220
ctctggagac tcggcgctac aatttggcag ctgctcgcct tttttctggc cttctttctg 2280
gacctgatcc tcctgatcat cgccctgtac ctccaacaga actggtggac cctcctggtg 2340
gatctgctgt ggctcctcct cttcctggcc atcctgatct ggatgtacta ccatggccag 2400
agaggaaggg tcgcttgcgc tcctgtccct gctcctgctg gccccatcgt gaggccttgg 2460
gagccttccc tcacacaggc cgccggccag gcctttgctc ccgtgaggcc ccagcacatg 2520
cctgtggaac ccgtgcccgt ccccacagtg gctctggaaa ggcctgtgta ccccaagccc 2580
gtgagacctg tcctctggct cagcagccct ggaggactcg gaacactcgg agccgctctc 2640
ctgacactgg ccgctgctct ggctctgctg gctagcctga tcctgggaac cctcaacctc 2700
accaccatgt ttctcctcat gctcctgtgg accctcgtgg tgctgctcat ctgttccagc 2760
tgctccagct gccccctgag caagatcctg ctggccaggc tgttcctgta cgccctcgcc 2820
ctcctgctgc tggctagcgc cctgatcgct ggcggaagca tcctccagac caatttcaag 2880
agcctctcct ccaccgagtt catccccaac ctgttctgta tgttactgct gatccatagc 2940
gacgagcacc atcatgacga ctccctgccc catcctcagc aggccacaga cgactccggc 3000
cacgagagcg acagcaatag caatgagggc aggcaccatc tgctcgtgtc cggagctcaa 3060
gtccccgagc ctcccaccat ccatctcgcc gcccagggaa tggcttaccc cctccacgag 3120
cagcacggca tggccccttg tcccgtcgct caagcccccc ctacacctct gccctttttc 3180
gccatttgtc tgacctggag aatcgaggac ccccccttca acagcctgct gttcgccctg 3240
ctcgccgccg ctggcggcct ccagggcatt tacgtcctcg tgatgctggt gctgctgatc 3300
ctcgcttaca ggagaagatg gaggagactg acagtgtgcg gcggcatcat gtttctcgcc 3360
tgcgtcctgg tcctgatcgt ggacgccgtc ctgcaactca gccccctcct gggagctgtg 3420
acagtggtct ccatgaccct gctgctgctg gccttcaacg gaccccacga tcctctgccc 3480
caagatcctg acaataccga cgataacggc ccccaagacc ccgataacac cgacgacaat 3540
ggccctcacg accctctgcc ccatagccct tccgatagcg ctggcaacga tggcggccct 3600
cctcagctga cagaggaggt ggaaaataag ggcggcgatc agggaccccc cctgatgaca 3660
gatggcggag gaggacacag ccatgatagc ggacatggcg gaggcgatcc ccatctgcct 3720
accctcctcc tgggcagctc cggttctgga ggcgacgatg atgaccctca cggccctgtg 3780
cagctctcct actacgacgg caaaaggacc gaacaaggaa aagaggtcct ggagaaggcc 3840
aggggcagca catacggaac ccccaggcct cccatgtccg attggaccgg aggagccctg 3900
ctggtcctct acagcttcgc cctgatgctg atcattatca tcctgatcat ctttatcttc 3960
agaagggacc tgctgtgccc tctcggcgcc ctgtgcatcc tgctgctcat gatcacactc 4020
ctcctgatcg ccctctggaa cctgcacgga caagccctga tgtccgatga gggacctgga 4080
acaggacccg gaaacggact gggcgagaag ggagatacaa gcggccccga aggcagcggc 4140
ggaagcggac cccaaagaag gggcggcgac aaccacggaa gaggaagagg caggggcaga 4200
ggcagaggag gaggaagacc tggagcccct ggcggttctg gaagcggacc caggcacagg 4260
gacggagtga ggaggcctca aaaaagaccc agctgcatcg gctgcaaggg aacccactgg 4320
attgatgata acccctccac agagaccgct caggcctgga acgccggctt cctgagggga 4380
agagcctatg gcatcgatct gctgaggacc gagggcgaac acgtggaggg agccaccgga 4440
gagacaaggg aggaaagcga agacacagaa agcgatggcg acgacgaaga cctgccctgc 4500
attgtgtcca ggggcggacc caaggtgaag aggcccccta tctttatcag aaggctccat 4560
agactgctcc tgatgagggc catgaaccct gtgtgcctgc ccgtgatcgt ggccccctac 4620
ctcttttggc tggccgccat tgccgctagc tgcttcaccg cctccgtgtc cacagtggtg 4680
acagccaccg gcctcgccct gagcctgctg ctcctcgctg ccgtggcctc cagctacgcc 4740
gctgctcaaa gaaagctcct gacccctgtc accgtcctga cagccgtcgt gaccaccttt 4800
tccgctggca ccttcaagct gcctaggtgc acacctggcg acaggcagtg gctctacgtg 4860
cagagctccg tgggcaatat tgtgcagagc tgcaatccca ggtacagcat ttttttcgac 4920
tacatggcca tccataggtc cctcaccaag atctgggagg atctgggagg cccttcccag 4980
gctcctctgc cctgcgtgct gtggcctgtg ctgcctgagc ctctgcccca aggccagctg 5040
acagcctatc acgtgtccac cgctcctaca ggttcttggt tcagcgctcc ccagcccgct 5100
cccgaaaacg cttaccaggc ttacgccgcc ccccagctgt tccccgtctc cgacatctga 5160
tgatgagcgg ccgcgatctg ctgtgccttc tagttgccag ccatctgttg tttgcccctc 5220
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 5280
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 5340
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 5400
tatggccgat cagcgatcgc tgaggtgggt gagtgggcgt ggcctggggt ggtcatgaaa 5460
atatataagt tgggggtctt agggtctctt tatttgtgtt gcagagaccg ccggagccat 5520
gagcgggagc agcagcagca gcagtagcag cagcgccttg gatggcagca tcgtgagccc 5580
ttatttgacg acgcggatgc cccactgggc cggggtgcgt cagaatgtga tgggctccag 5640
catcgacggc cgacccgtcc tgcccgcaaa ttccgccacg ctgacctatg cgaccgtcgc 5700
ggggacgccg ttggacgcca ccgccgccgc cgccgccacc gcagccgcct cggccgtgcg 5760
cagcctggcc acggactttg cattcctggg accactggcg acaggggcta cttctcgggc 5820
cgctgctgcc gccgttcgcg atgacaagct gaccgccctg ctggcgcagt tggatgcgct 5880
tactcgggaa ctgggtgacc tttctcagca ggtcatggcc ctgcgccagc aggtctcctc 5940
cctgcaagct ggcgggaatg cttctcccac aaatgccgtt taagataaat aaaaccagac 6000
tctgtttgga ttaaagaaaa gtagcaagtg cattgctctc tttatttcat aattttccgc 6060
gcgcgatagg ccctagacca gcgttctcgg tcgttgaggg tgcggtgtat cttctccagg 6120
acgtggtaga ggtggctctg gacgttgaga tacatgggca tgagcccgtc ccgggggtgg 6180
aggtagcacc actgcagagc ttcatgctcc ggggtggtgt tgtagatgat ccagtcgtag 6240
caggagcgct gggcatggtg cctaaaaatg tccttcagca gcaggccgat ggccaggggg 6300
aggcccttgg tgtaagtgtt tacaaaacgg ttaagttggg aagggtgcat tcggggagag 6360
atgatgtgca tcttggactg tatttttaga ttggcgatgt ttccgcccag atcccttctg 6420
ggattcatgt tgtgcaggac caccagtaca gtgtatccgg tgcacttggg gaatttgtca 6480
tgcagcttag agggaaaagc gtggaagaac ttggagacgc ctttgtggcc tcccagattt 6540
tccatgcatt cgtccatgat gatggcaatg ggcccgcggg aggcagcttg ggcaaagata 6600
tttctggggt cgctgacgtc gtagttgtgt tccagggtga ggtcgtcata ggccattttt 6660
acaaagcgcg ggcggagggt gcccgactgg gggatgatgg tcccctctgg ccctggggcg 6720
tagttgccct cgcagatctg catttcccag gccttaatct cggagggggg aatcatatcc 6780
acctgcgggg cgatgaagaa aacggtttcc ggagccgggg agattaactg ggatgagagc 6840
aggtttctaa gcagctgtga ttttccacaa ccggtgggcc cataaataac acctataacc 6900
ggttgcagct ggtagtttag agagctgcag ctgccgtcgt cccggaggag gggggccacc 6960
tcgttgagca tgtccctgac gcgcatgttc tccccgacca gatccgccag aaggcgctcg 7020
ccgcccaggg acagcagctc ttgcaaggaa gcaaagtttt tcagcggctt gaggccgtcc 7080
gccgtgggca tgtttttcag ggtctggctc agcagctcca ggcggtccca gagctcggtg 7140
acgtgctcta cggcatctct atccagcata tctcctcgtt tcgcgggttg gggcgacttt 7200
cgctgtaggg caccaagcgg tggtcgtcca gcggggccag agtcatgtcc ttccatgggc 7260
gcagggtcct cgtcagggtg gtctgggtca cggtgaaggg gtgcgctccg ggctgagcgc 7320
ttgccaaggt gcgcttgagg ctggttctgc tggtgctgaa gcgctgccgg tcttcgccct 7380
gcgcgtcggc caggtagcat ttgaccatgg tgtcatagtc cagcccctcc gcggcgtgtc 7440
ccttggcgcg cagcttgccc ttggaggtgg cgccgcacga ggggcagagc aggctcttga 7500
gcgcgtagag cttgggggcg aggaagaccg attcggggga gtaggcgtcc gcgccgcaga 7560
ccccgcacac ggtctcgcac tccaccagcc aggtgagctc ggggcgcgcc gggtcaaaaa 7620
ccaggtttcc cccatgcttt ttgatgcgtt tcttacctcg ggtctccatg aggtggtgtc 7680
cccgctcggt gacgaagagg ctgtccgtgt ctccgtagac cgacttgagg ggtcttttct 7740
ccaggggggt ccctcggtct tcctcgtaga ggaactcgga ccactctgag acgaaggccc 7800
gcgtccaggc caggacgaag gaggctatgt gggaggggta gcggtcgttg tccactaggg 7860
ggtccacctt ctccaaggtg tgaagacaca tgtcgccttc ctcggcgtcc aggaaggtga 7920
ttggcttgta ggtgtaggcc acgtgaccgg gggttcctga cgggggggta taaaaggggg 7980
tgggggcgcg ctcgtcgtca ctctcttccg catcgctgtc tgcgagggcc agctgctggg 8040
gtgagtattc cctctcgaag gcgggcatga cctccgcgct gaggttgtca gtttccaaaa 8100
acgaggagga tttgatgttc acctgtcccg aggtgatacc tttgagggta cccgcgtcca 8160
tctggtcaga aaacacgatc tttttattgt ccagcttggt ggcgaacgac ccgtagaggg 8220
cgttggagag cagcttggcg atggagcgca gggtctggtt cttgtccctg tcggcgcgct 8280
ccttggccgc gatgttgagc tgcacgtact cgcgcgcgac gcagcgccac tcggggaaga 8340
cggtggtgcg ctcgtcgggc accaggcgca cgcgccagcc gcggttgtgc agggtgacca 8400
ggtccacgct ggtggcgacc tcgccgcgca ggcgctcgtt ggtccagcag agacggccgc 8460
ccttgcgcga gcagaagggg ggcagggggt cgagctgggt ctcgtccggg gggtccgcgt 8520
ccacggtgaa aaccccgggg cgcaggcgcg cgtcgaagta gtctatcttg caaccttgca 8580
tgtccagcgc ctgctgccag tcgcgggcgg cgagcgcgcg ctcgtagggg ttgagcggcg 8640
ggccccaggg catggggtgg gtgagtgcgg aggcgtacat gccgcagatg tcatagacgt 8700
agaggggctc ccgcaggacc ccgatgtagg tggggtagca gcggccgccg cggatgctgg 8760
cgcgcacgta gtcatacagc tcgtgcgagg gggcgaggag gtcggggccc aggttggtgc 8820
gggcggggcg ctccgcgcgg aagacgatct gcctgaagat ggcatgcgag ttggaagaga 8880
tggtggggcg ctggaagacg ttgaagctgg cgtcctgcag gccgacggcg tcgcgcacga 8940
aggaggcgta ggagtcgcgc agcttgtgta ccagctcggc ggtgacctgc acgtcgagcg 9000
cgcagtagtc gagggtctcg cggatgatgt catatttagc ctgccccttc tttttccaca 9060
gctcgcggtt gaggacaaac tcttcgcggt ctttccagta ctcttggatc gggaaaccgt 9120
ccggttccga acggtaagag cctagcatgt agaactggtt gacggcctgg taggcgcagc 9180
agcccttctc cacggggagg gcgtaggcct gcgcggcctt gcggagcgag gtgtgggtca 9240
gggcgaaggt gtccctgacc atgactttga ggtactggtg cttgaagtcg gagtcgtcgc 9300
agccgccccg ctcccagagc gagaagtcgg tgcgcttctt ggagcggggg ttgggcagag 9360
cgaaggtgac atcgttgaag aggattttgc ccgcgcgggg catgaagttg cgggtgatgc 9420
ggaagggccc cggcacttca gagcggttgt tgatgacctg ggcggcgagc acgatctcgt 9480
cgaagccgtt gatgttgtgg cccacgatgt agagttccag gaagcggggc cggcccttta 9540
cggtgggcag cttctttagc tcttcgtagg tgagctcctc gggcgaggcg aggccgtgct 9600
cggccagggc ccagtccgcg aggtgcgggt tgtctctgag gaaggacttc cagaggtcgc 9660
gggccaggag ggtctgcagg cggtctctga aggtcctgaa ctggcggccc acggccattt 9720
tttcgggggt gatgcagtag aaggtgaggg ggtcttgctg ccagcggtcc cagtcgagct 9780
gcagggcgag gtcgcgcgcg gcggtgacca ggcgctcgtc gcccccgaat ttcatgacca 9840
gcatgaaggg cacgagctgc tttccgaagg cccccatcca agtgtaggtc tctacatcgt 9900
aggtgacaaa gaggcgctcc gtgcgaggat gcgagccgat cgggaagaac tggatctccc 9960
gccaccagtt ggaggagtgg ctgttgatgt ggtggaagta gaagtcccgt cgccgggccg 10020
aacactcgtg ctggcttttg taaaagcgag cgcagtactg gcagcgctgc acgggctgta 10080
cctcatgcac gagatgcacc tttcgcccgc gcacgaggaa gccgagggga aatctgagcc 10140
ccccgcctgg ctcgcggcat ggctggttct cttctacttt ggatgcgtgt ccgtctccgt 10200
ctggctcctc gaggggtgtt acggtggagc ggaccaccac gccgcgcgag ccgcaggtcc 10260
agatatcggc gcgcggcggt cggagtttga tgacgacatc gcgcagctgg gagctgtcca 10320
tggtctggag ctcccgcggc ggcggcaggt cagccgggag ttcttgcagg ttcacctcgc 10380
agagtcgggc cagggcgcgg ggcaggtcta ggtggtacct gatctctagg ggcgtgttgg 10440
tggcggcgtc gatggcttgc aggagcccgc agccccgggg ggcgacgacg gtgccccgcg 10500
gggtggtggt ggtggtggcg gtgcagctca gaagcggtgc cgcgggcggg cccccggagg 10560
tagggggggc tccggtcccg cgggcagggg cggcagcggc acgtcggcgt ggagcgcggg 10620
caggagttgg tgctgtgccc ggaggttgct ggcgaaggcg acgacgcggc ggttgatctc 10680
ctggatctgg cgcctctgcg tgaagacgac gggcccggtg agcttgaacc tgaaagagag 10740
ttcgacagaa tcaatctcgg tgtcattgac cgcggcctgg cgcaggatct cctgcacgtc 10800
tcccgagttg tcttggtagg cgatctcggc catgaactgc tcgatctctt cctcctggag 10860
gtctccgcgt ccggcgcgtt ccacggtggc cgccaggtcg ttggagatgc gccccatgag 10920
ctgcgagaag gcgttgagtc cgccctcgtt ccagactcgg ctgtagacca cgcccccctg 10980
gtcatcgcgg gcgcgcatga ccacctgcgc gaggttgagc tccacgtgcc gcgcgaagac 11040
ggcgtagttg cgcagacgct ggaagaggta gttgagggtg gtggcggtgt gctcggccac 11100
gaagaagttc atgacccagc ggcgcaacgt ggattcgttg atgtccccca aggcctccag 11160
ccgttccatg gcctcgtaga agtccacggc gaagttgaaa aactgggagt tgcgcgccga 11220
cacggtcaac tcctcctcca gaagacggat gagctcggcg acggtgtcgc gcacctcgcg 11280
ctcgaaggct atggggatct cttcctccgc tagcatcacc acctcctcct cttcctcctc 11340
ttctggcact tccatgatgg cttcctcctc ttcggggggt ggcggcggcg gcggtggggg 11400
agggggcgct ctgcgccggc ggcggcgcac cgggaggcgg tccacgaagc gcgcgatcat 11460
ctccccgcgg cggcggcgca tggtctcggt gacggcgcgg ccgttctccc gggggcgcag 11520
ttggaagacg ccgccggaca tctggtgctg gggcgggtgg ccgtgaggca gcgagacggc 11580
gctgacgatg catctcaaca attgctgcgt aggtacgccg ccgagggacc tgagggagtc 11640
catatccacc ggatccgaaa acctttcgag gaaggcgtct aaccagtcgc agtcgcaagg 11700
taggctgagc accgtggcgg gcggcggggg gtggggggag tgtctggcgg aggtgctgct 11760
gatgatgtaa ttgaagtagg cggacttgac acggcggatg gtcgacagga gcaccatgtc 11820
cttgggtccg gcctgctgga tgcggaggcg gtcggctatg ccccaggctt cgttctggca 11880
tcggcgcagg tccttgtagt agtcttgcat gagcctttcc accggcacct cttctccttc 11940
ctcttctgct tcttccatgt ctgcttcggc cctggggcgg cgccgcgccc ccctgccccc 12000
catgcgcgtg accccgaacc ccctgagcgg ttggagcagg gccaggtcgg cgacgacgcg 12060
ctcggccagg atggcctgct gcacctgcgt gagggtggtt tggaagtcat ccaagtccac 12120
gaagcggtgg taggcgcccg tgttgatggt gtaggtgcag ttggccatga cggaccagtt 12180
gacggtctgg tggcccggtt gcgacatctc ggtgtacctg agtcgcgagt aggcgcggga 12240
gtcgaagacg tagtcgttgc aagtccgcac caggtactgg tagcccacca ggaagtgcgg 12300
cggcggctgg cggtagaggg gccagcgcag ggtggcgggg gctccggggg ccaggtcttc 12360
cagcatgagg cggtggtagg cgtagatgta cctggacatc caggtgatac ccgcggcggt 12420
ggtggaggcg cgcgggaagt cgcgcacccg gttccagatg ttgcgcaggg gcagaaagtg 12480
ctccatggta ggcgtgctct gtccagtcag acgcgcgcag tcgttgatac tctagaccag 12540
ggaaaacgaa agccggtcag cgggcactct tccgtggtct ggtgaataga tcgcaagggt 12600
atcatggcgg agggcctcgg ttcgagcccc gggtccgggc cggacggtcc gccatgatcc 12660
acgcggttac cgcccgcgtg tcgaacccag gtgtgcgacg tcagacaacg gtggagtgtt 12720
ccttttggcg tttttctggc cgggcgccgg cgccgcgtaa gagactaagc cgcgaaagcg 12780
aaagcagtaa gtggctcgct ccccgtagcc ggagggatcc ttgctaaggg ttgcgttgcg 12840
gcgaaccccg gttcgaatcc cgtactcggg ccggccggac ccgcggctaa ggtgttggat 12900
tggcctcccc ctcgtataaa gaccccgctt gcggattgac tccggacacg gggacgagcc 12960
ccttttattt ttgctttccc cagatgcatc cggtgctgcg gcagatgcgc cccccgcccc 13020
agcagcagca acaacaccag caagagcggc agcaacagca gcgggagtca tgcagggccc 13080
cctcacccac cctcggcggg ccggccacct cggcgtccgc ggccgtgtct ggcgcctgcg 13140
gcggcggcgg ggggccggct gacgaccccg aggagccccc gcggcgcagg gccagacact 13200
acctggacct ggaggagggc gagggcctgg cgcggctggg ggcgccgtct cccgagcgcc 13260
acccgcgggt gcagctgaag cgcgactcgc gcgaggcgta cgtgcctcgg cagaacctgt 13320
tcagggaccg cgcgggcgag gagcccgagg agatgcggga caggaggttc agcgcagggc 13380
gggagctgcg gcaggggctg aaccgcgagc ggctgctgcg cgaggaggac tttgagcccg 13440
acgcgcggac ggggatcagc cccgcgcgcg cgcacgtggc ggccgccgac ctggtgacgg 13500
cgtacgagca gacggtgaac caggagatca acttccaaaa gagtttcaac aaccacgtgc 13560
gcacgctggt ggcgcgcgag gaggtgacca tcgggctgat gcacctgtgg gactttgtaa 13620
gcgcgctggt gcagaacccc aacagcaagc ctctgacggc gcagctgttc ctgatagtgc 13680
agcacagcag ggacaacgag gcgtttaggg acgcgctgct gaacatcacc gagcccgagg 13740
gtcggtggct gctggacctg attaacatcc tgcagagcat agtggtgcag gagcgcagcc 13800
tgagcctggc cgacaaggtg gcggccatca actactcgat gctgagcctg ggcaagtttt 13860
acgcgcgcaa gatctaccag acgccgtacg tgcccataga caaggaggtg aagatcgacg 13920
gtttttacat gcgcatggcg ctgaaggtgc tcaccctgag cgacgacctg ggcgtgtacc 13980
gcaacgagcg catccacaag gccgtgagcg tgagccggcg gcgcgagctg agcgaccgcg 14040
agctgatgca cagcctgcag cgggcgctgg cgggcgccgg cagcggcgac agggaggcgg 14100
agtcctactt cgatgcgggg gcggacctgc gctgggcgcc cagccggcgg gccctggagg 14160
ccgcgggggt ccgcgaggac tatgacgagg acggcgagga ggatgaggag tacgagctag 14220
aggagggcga gtacctggac taaaccgcgg gtggtgtttc cggtagatgc aagacccgaa 14280
cgtggtggac ccggcgctgc gggcggctct gcagagccag ccgtccggcc ttaactcctc 14340
agacgactgg cgacaggtca tggaccgcat catgtcgctg acggcgcgta acccggacgc 14400
gttccggcag cagccgcagg ccaacaggct ctccgccatc ctggaggcgg tggtgcctgc 14460
gcgctcgaac cccacgcacg agaaggtgct ggccatagtg aacgcgctgg ccgagaacag 14520
ggccatccgc ccggacgagg ccgggctggt gtacgacgcg ctgctgcagc gcgtggcccg 14580
ctacaacagc ggcaacgtgc agaccaacct ggaccggctg gtgggggacg tgcgcgaggc 14640
ggtggcgcag cgcgagcgcg cggatcggca gggcaacctg ggctccatgg tggcgctgaa 14700
tgccttcctg agcacgcagc cggccaacgt gccgcggggg caggaagact acaccaactt 14760
tgtgagcgcg ctgcggctga tggtgaccga gaccccccag agcgaggtgt accagtcggg 14820
cccggactac ttcttccaga ccagcagaca gggcctgcag acggtgaacc tgagccaggc 14880
tttcaagaac ctgcgggggc tgtggggcgt gaaggcgccc accggcgacc gggcgacggt 14940
gtccagcctg ctgacgccca actcgcgcct gctgctgctg ctgatcgcgc cgttcacgga 15000
cagcggcagc gtgtcccggg acacctacct ggggcacctg ctgaccctgt accgcgaggc 15060
catcgggcag gcgcaggtgg acgagcacac cttccaggag atcaccagcg tgagccgcgc 15120
gctggggcag gaggacacga gcagcctgga ggcgactctg aactacctgc tgaccaaccg 15180
gcggcagaag attccctcgc tgcacagcct gacctccgag gaggagcgca tcttgcgcta 15240
cgtgcagcag agcgtgagcc tgaacctgat gcgcgacggg gtgacgccca gcgtggcgct 15300
ggacatgacc gcgcgcaaca tggaaccggg catgtacgcc gcgcaccggc cttacatcaa 15360
ccgcctgatg gactacctgc atcgcgcggc ggccgtgaac cccgagtact ttaccaacgc 15420
catcctgaac ccgcactggc tcccgccgcc cgggttctac agcgggggct tcgaggtccc 15480
ggagaccaac gatggcttcc tgtgggacga catggacgac agcgtgttct ccccgcggcc 15540
gcaggcgctg gcggaagcgt ccctgctgcg tcccaagaag gaggaggagg aggaggcgag 15600
tcgccgccgc ggcagcagcg gcgtggcttc tctgtccgag ctgggggcgg cagccgccgc 15660
gcgccccggg tccctgggcg gcagcccctt tccgagcctg gtggggtctc tgcacagcga 15720
gcgcaccacc cgccctcggc tgctgggcga ggacgagtac ctgaataact ccctgctgca 15780
gccggtgcgg gagaaaaacc tgcctcccgc cttccccaac aacgggatag agagcctggt 15840
ggacaagatg agcagatgga agacctatgc gcaggagcac agggacgcgc ctgcgctccg 15900
gccgcccacg cggcgccagc gccacgaccg gcagcggggg ctggtgtggg atgacgagga 15960
ctccgcggac gatagcagcg tgctggacct gggagggagc ggcaacccgt tcgcgcacct 16020
gcgcccccgc ctggggagga tgttttaaaa aaaaaaaaaa aangcaagaa gcatgatgca 16080
aaaattaaat aaaactcacc aaggccatgg cgaccgagcg ttggtttctt gtgttccctt 16140
cagtatgcgg cgcgcggcga tgtaccagga gggacctcct ccctcttacg agagcgtggt 16200
gggcgcggcg gcggcggcgc cctcttctcc ctttgcgtcg cagctgctgg agccgccgta 16260
cgtgcctccg cgctacctgc ggcctacggg ggggagaaac agcatccgtt actcggagct 16320
ggcgcccctg ttcgacacca cccgggtgta cctggtggac aacaagtcgg cggacgtggc 16380
ctccctgaac taccagaacg accacagcaa ttttttgacc acggtcatcc agaacaatga 16440
ctacagcccg agcgaggcca gcacccagac catcaatctg gatgaccggt cgcactgggg 16500
cggcgacctg aaaaccatcc tgcacaccaa catgcccaac gtgaacgagt tcatgttcac 16560
caataagttc aaggcgcggg tgatggtgtc gcgctcgcac accaaggaag accgggtgga 16620
gctgaagtac gagtgggtgg agttcgagct gccagagggc aactactccg agaccatgac 16680
cattgacctg atgaacaacg cgatcgtgga gcactatctg aaagtgggca ggcagaacgg 16740
ggtcctggag agcgacatcg gggtcaagtt cgacaccagg aacttccgcc tggggctgga 16800
ccccgtgacc gggctggtta tgcccggggt gtacaccaac gaggccttcc atcccgacat 16860
catcctgctg cccggctgcg gggtggactt cacttacagc cgcctgagca acctcctggg 16920
catccgcaag cggcagccct tccaggaggg cttcaggatc acctacgagg acctggaggg 16980
gggcaacatc cccgcgctcc tcgatgtgga ggcctaccag gatagcttga aggaaaatga 17040
ggcgggacag gaggataccg cccccgccgc ctccgccgcc gccgagcagg gcgaggatgc 17100
tgctgacacc gcggccgcgg acggggcaga ggccgacccc gctatggtgg tggaggctcc 17160
cgagcaggag gaggacatga atgacagtgc ggtgcgcgga gacaccttcg tcacccgggg 17220
ggaggaaaag caagcggagg ccgaggccgc ggccgaggaa aagcaactgg cggcagcagc 17280
ggcggcggcg gcgttggccg cggcggaggc tgagtctgag gggaccaagc ccgccaagga 17340
gcccgtgatt aagcccctga ccgaagatag caagaagcgc agttacaacc tgctcaagga 17400
cagcaccaac accgcgtacc gcagctggta cctggcctac aactacggcg acccgtcgac 17460
gggggtgcgc tcctggaccc tgctgtgcac gccggacgtg acctgcggct cggagcaggt 17520
gtactggtcg ctgcccgaca tgatgcaaga ccccgtgacc ttccgctcca cgcggcaggt 17580
cagcaacttc ccggtggtgg gcgccgagct gctgcccgtg cactccaaga gcttctacaa 17640
cgaccaggcc gtctactccc agctcatccg ccagttcacc tctctgaccc acgtgttcaa 17700
tcgctttcct gagaaccaga ttctggcgcg cccgcccgcc cccaccatca ccaccgtcag 17760
tgaaaacgtt cctgctctca cagatcacgg gacgctaccg ctgcgcaaca gcatcggagg 17820
agtccagcga gtgaccgtta ctgacgccag acgccgcacc tgcccctacg tttacaaggc 17880
cttgggcata gtctcgccgc gcgtcctttc cagccgcact ttttgagcaa caccaccatc 17940
atgtccatcc tgatctcacc cagcaataac tccggctggg gactgctgcg cgcgcccagc 18000
aagatgttcg gaggggcgag gaagcgttcc gagcagcacc ccgtgcgcgt gcgcgggcac 18060
ttccgcgccc cctggggagc gcacaaacgc ggccgcgcgg ggcgcaccac cgtggacgac 18120
gccatcgact cggtggtgga gcaggcgcgc aactacaggc ccgcggtctc taccgtggac 18180
gcggccatcc agaccgtggt gcggggcgcg cggcggtacg ccaagctgaa gagccgccgg 18240
aagcgcgtgg cccgccgcca ccgccgccga cccggggccg ccgccaaacg cgccgccgcg 18300
gccctgcttc gccgggccaa gcgcacgggc cgccgcgccg ccatgagggc cgcgcgccgc 18360
ttggccgccg gcatcaccgc cgccaccatg gccccccgta cccgaagacg cgcggccgcc 18420
gccgccgccg ccgccatcag tgacatggcc agcaggcgcc ggggcaacgt gtactgggtg 18480
cgcgactcgg tgaccggcac gcgcgtgccc gtgcgcttcc gccccccgcg gacttgagat 18540
gatgtgaaaa aacaacactg agtctcctgc tgttgtgtgt atcccagcgg cggcggcgcg 18600
cgcagcgtca tgtccaagcg caaaatcaaa gaagagatgc tccaggtcgt cgcgccggag 18660
atctatgggc ccccgaagaa ggaagagcag gattcgaagc cccgcaagat aaagcgggtc 18720
aaaaagaaaa agaaagatga tgacgatgcc gatggggagg tggagttcct gcgcgccacg 18780
gcgcccaggc gcccggtgca gtggaagggc cggcgcgtaa agcgcgtcct gcgccccggc 18840
accgcggtgg tcttcacgcc cggcgagcgc tccacccgga ctttcaagcg cgtctatgac 18900
gaggtgtacg gcgacgaaga cctgctggag caggccaacg agcgcttcgg agagtttgct 18960
tacgggaagc gtcagcgggc gctggggaag gaggacctgc tggcgctgcc gctggaccag 19020
ggcaacccca cccccagtct gaagcccgtg accctgcagc aggtgctgcc gagcagcgca 19080
ccctccgagg cgaagcgggg tctgaagcgc gagggcggcg acctggcgcc caccgtgcag 19140
ctcatggtgc ccaagcggca gaggctggag gatgtgctgg agaaaatgaa agtagacccc 19200
ggtctgcagc cggacatcag ggtccgcccc atcaagcagg tggcgccggg cctcggcgtg 19260
cagaccgtgg acgtggtcat ccccaccggc aactcccccg ccgccgccac cactaccgct 19320
gcctccacgg acatggagac acagaccgat cccgccgcag ccgcagccgc agccgccgcc 19380
gcgacctcct cggcggaggt gcagacggac ccctggctgc cgccggcgat gtcagctccc 19440
cgcgcgcgtc gcgggcgcag gaagtacggc gccgccaacg cgctcctgcc cgagtacgcc 19500
ttgcatcctt ccatcgcgcc cacccccggc taccgaggct atacctaccg cccgcgaaga 19560
gccaagggtt ccacccgccg tccccgccga cgcgccgccg ccaccacccg ccgccgccgc 19620
cgcagacgcc agcccgcact ggctccagtc tccgtgagga aagtggcgcg cgacggacac 19680
accctggtgc tgcccagggc gcgctaccac cccagcatcg tttaaaagcc tgttgtggtt 19740
cttgcagata tggccctcac ttgccgcctc cgtttcccgg tgccgggata ccgaggagga 19800
agatcgcgcc gcaggagggg tctggccggc cgcggcctga gcggaggcag ccgccgcgcg 19860
caccggcggc gacgcgccac cagccgacgc atgcgcggcg gggtgctgcc cctgttaatc 19920
cccctgatcg ccgcggcgat cggcgccgtg cccgggatcg cctccgtggc cttgcaagcg 19980
tcccagaggc attgacagac ttgcaaactt gcaaatatgg aaaaaaaaac cccaataaaa 20040
aagtctagac tctcacgctc gcttggtcct gtgactattt tgtagaatgg aagacatcaa 20100
ctttgcgtcg ctggccccgc gtcacggctc gcgcccgttc ctgggacact ggaacgatat 20160
cggcaccagc aacatgagcg gtggcgcctt cagttggggc tctctgtgga gcggcattaa 20220
aagtatcggg tctgccgtta aaaattacgg ctcccgggcc tggaacagca gcacgggcca 20280
gatgttgaga gacaagttga aagagcagaa cttccagcag aaggtggtgg agggcctggc 20340
ctccggcatc aacggggtgg tggacctggc caaccaggcc gtgcagaata agatcaacag 20400
cagactggac ccccggccgc cggtggagga ggtgccgccg gcgctggaga cggtgtcccc 20460
cgatgggcgt ggcgagaagc gcccgcggcc cgatagggaa gagaccactc tggtcacgca 20520
gaccgatgag ccgcccccgt atgaggaggc cctgaagcaa ggtctgccca ccacgcggcc 20580
catcgcgccc atggccaccg gggtggtggg ccgccacacc cccgccacgc tggacttgcc 20640
tccgcccgcc gatgtgccgc agcagcagaa ggcggcacag ccgggcccgc ccgcgaccgc 20700
ctcccgttcc tccgccggtc ctctgcgccg cgcggccagc ggcccccgcg ggggggtcgc 20760
gaggcacggc aactggcaga gcacgctgaa cagcatcgtg ggtctggggg tgcggtccgt 20820
gaagcgccgc cgatgctact gaatagctta gctaacgtgt tgtatgtgtg tatgcgccct 20880
atgtcgccgc cagaggagct gctgagtcgc cgccgttcgc gcgcccacca ccaccgccac 20940
tccgcccctc aagatggcga ccccatcgat gatgccgcag tggtcgtaca tgcacatctc 21000
gggccaggac gcctcggagt acctgagccc cgggctggtg cagttcgccc gcgccaccga 21060
gagctacttc agcctgagta acaagtttag gaaccccacg gtggcgccca cgcacgatgt 21120
gaccaccgac cggtctcagc gcctgacgct gcggttcatt cccgtggacc gcgaggacac 21180
cgcgtactcg tacaaggcgc ggttcaccct ggccgtgggc gacaaccgcg tgctggacat 21240
ggcctccacc tactttgaca tccgcggggt gctggaccgg ggtcccactt tcaagcccta 21300
ctctggcacc gcctacaact ccctggcccc caagggcgct cccaactcct gcgagtggga 21360
gcaagaggaa actcaggcag ttgaagaagc agcagaagag gaagaagaag atgctgacgg 21420
tcaagctgag gaagagcaag cagctaccaa aaagactcat gtatatgctc aggctcccct 21480
ttctggcgaa aaaattagta aagatggtct gcaaatagga acggacgcta cagctacaga 21540
acaaaaacct atttatgcag accctacatt ccagcccgaa ccccaaatcg gggagtccca 21600
gtggaatgag gcagatgcta cagtcgccgg cggtagagtg ctaaagaaat ctactcccat 21660
gaaaccatgc tatggttcct atgcaagacc cacaaatgct aatggaggtc agggtgtact 21720
aacggcaaat gcccagggac agctagaatc tcaggttgaa atgcaattct tttcaacttc 21780
tgaaaacgcc cgtaacgagg ctaacaacat tcagcccaaa ttggtgctgt atagtgagga 21840
tgtgcacatg gagaccccgg atacgcacct ttcttacaag cccgcaaaaa gcgatgacaa 21900
ttcaaaaatc atgctgggtc agcagtccat gcccaacaga cctaattaca tcggcttcag 21960
agacaacttt atcggcctca tgtattacaa tagcactggc aacatgggag tgcttgcagg 22020
tcaggcctct cagttgaatg cagtggtgga cttgcaagac agaaacacag aactgtccta 22080
ccagctcttg cttgattcca tgggtgacag aaccagatac ttttccatgt ggaatcaggc 22140
agtggacagt tatgacccag atgttagaat tattgaaaat catggaactg aagacgagct 22200
ccccaactat tgtttccctc tgggtggcat aggggtaact gacacttacc aggctgttaa 22260
aaccaacaat ggcaataacg ggggccaggt gacttggaca aaagatgaaa cttttgcaga 22320
tcgcaatgaa ataggggtgg gaaacaattt cgctatggag atcaacctca gtgccaacct 22380
gtggagaaac ttcctgtact ccaacgtggc gctgtaccta ccagacaagc ttaagtacaa 22440
cccctccaat gtggacatct ctgacaaccc caacacctac gattacatga acaagcgagt 22500
ggtggccccg gggctggtgg actgctacat caacctgggc gcgcgctggt cgctggacta 22560
catggacaac gtcaacccct tcaaccacca ccgcaatgcg ggcctgcgct accgctccat 22620
gctcctgggc aacgggcgct acgtgccctt ccacatccag gtgccccaga agttctttgc 22680
catcaagaac ctcctcctcc tgccgggctc ctacacctac gagtggaact tcaggaagga 22740
tgtcaacatg gtcctccaga gctctctggg taacgatctc agggtggacg gggccagcat 22800
caagttcgag agcatctgcc tctacgccac cttcttcccc atggcccaca acacggcctc 22860
cacgctcgag gccatgctca ggaacgacac caacgaccag tccttcaatg actacctctc 22920
cgccgccaac atgctctacc ccatacccgc caacgccacc aacgtcccca tctccatccc 22980
ctcgcgcaac tgggcggcct tccgcggctg ggccttcacc cgcctcaaga ccaaggagac 23040
cccctccctg ggctcgggat tcgaccccta ctacacctac tcgggctcca ttccctacct 23100
ggacggcacc ttctacctca accacacttt caagaaggtc tcggtcacct tcgactcctc 23160
ggtcagctgg ccgggcaacg accgtctgct cacccccaac gagttcgaga tcaagcgctc 23220
ggtcgacggg gagggctaca acgtggccca gtgcaacatg accaaggact ggttcctggt 23280
ccagatgctg gccaactaca acatcggcta ccagggcttc tacatcccag agagctacaa 23340
ggacaggatg tactccttct tcaggaactt ccagcccatg agccggcagg tggtggacca 23400
gaccaagtac aaggactacc aggaggtggg catcatccac cagcacaaca actcgggctt 23460
cgtgggctac ctcgccccca ccatgcgcga gggacaggcc taccccgcca acttccccta 23520
tccgctcata ggcaagaccg cggtcgacag catcacccag aaaaagttcc tctgcgaccg 23580
caccctctgg cgcatcccct tctccagcaa cttcatgtcc atgggtgcgc tctcggacct 23640
gggccagaac ttgctctacg ccaactccgc ccacgccctc gacatgacct tcgaggtcga 23700
ccccatggac gagcccaccc ttctctatgt tctgttcgaa gtctttgacg tggtccgggt 23760
ccaccagccg caccgcggcg tcatcgagac cgtgtacctg cgtacgccct tctcggccgg 23820
caacgccacc acctaaagaa gcaagccgca gtcatcgccg cctgcatgcc gtcgggttcc 23880
accgagcaag agctcagggc catcgtcaga gacctgggat gcgggcccta ttttttgggc 23940
accttcgaca agcgcttccc tggctttgtc tccccacaca agctggcctg cgccatcgtc 24000
aacacggccg gccgcgagac cgggggcgtg cactggctgg ccttcgcctg gaacccgcgc 24060
tccaaaacat gcttcctctt tgaccccttc ggcttttcgg accagcggct caagcaaatc 24120
tacgagttcg agtacgaggg cttgctgcgt cgcagcgcca tcgcctcctc gcccgaccgc 24180
tgcgtcaccc tcgaaaagtc cacccagacc gtgcaggggc ccgactcggc cgcctgcggt 24240
ctcttctgct gcatgtttct gcacgccttt gtgcactggc ctcagagtcc catggaccgc 24300
aaccccacca tgaacttgct gacgggggtg cccaactcca tgctccagag cccccaggtc 24360
gagcccaccc tgcgccgcaa ccaggagcag ctctacagct tcctggagcg ccactcgcct 24420
tacttccgcc gccacagcgc acagatcagg agggccacct ccttctgcca cttgcaagag 24480
atgcaagaag ggtaataacg atgtacacac tttttttctc aataaatggc atctttttat 24540
ttatacaagc tctctggggt attcatttcc caccaccacc cgccgttgtc gccatctggc 24600
tctatttaga aatcgaaagg gttctgccgg gagtcgccgt gcgccacggg cagggacacg 24660
ttgcgatact ggtagcgggt gccccacttg aactcgggca ccaccaggcg aggcagctcg 24720
gggaagtttt cgctccacag gctgcgggtc agcaccagcg cgttcatcag gtcgggcgcc 24780
gagatcttga agtcgcagtt ggggccgccg ccctgcgcgc gcgagttgcg gtacaccggg 24840
ttgcagcact ggaacaccaa cagcgccggg tgcttcacgc tggccagcac gctgcggtcg 24900
gagatcagct cggcgtccag gtcctccgcg ttgctcagcg cgaacggggt catcttgggc 24960
acttgccgcc ccaggaaggg cgcgtgcccc ggtttcgagt tgcagtcgca gcgcagcggg 25020
atcagcaggt gcccgtgccc ggactcggcg ttggggtaca gcgcgcgcat gaaggcctgc 25080
atctggcgga aggccatctg ggccttggcg ccctccgaga agaacatgcc gcaggacttg 25140
cccgagaact ggtttgcggg gcagctggcg tcgtgcaggc agcagcgcgc gtcggtgttg 25200
gcgatctgca ccacgttgcg cccccaccgg ttcttcacga tcttggcctt ggacgattgc 25260
tccttcagcg cgcgctgccc gttctcgctg gtcacatcca tctcgatcac atgttccttg 25320
ttcaccatgc tgctgccgtg cagacacttc agctcgccct ccgtctcggt gcagcggtgc 25380
tgccacagcg cgcagcccgt gggctcgaaa gacttgtagg tcacctccgc gaaggactgc 25440
aggtacccct gcaaaaagcg gcccatcatg gtcacgaagg tcttgttgct gctgaaggtc 25500
agctgcagcc cgcggtgctc ctcgttcagc caggtcttgc acacggccgc cagcgcctcc 25560
acctggtcgg gcagcatctt gaagttcacc ttcagctcat tctccacgtg gtacttgtcc 25620
atcagcgtgc gcgccgcctc catgcccttc tcccaggccg acaccagcgg caggctcacg 25680
gggttcttca ccatcaccgt ggccgccgcc tccgccgcgc tttcgctttc cgccccgctg 25740
ttctcttcct cttcctcctc ttcctcgccg ccgcccactc gcagcccccg caccacgggg 25800
tcgtcttcct gcaggcgctg caccttgcgc ttgccgttgc gcccctgctt gatgcgcacg 25860
ggcgggttgc tgaagcccac catcaccagc gcggcctctt cttgctcgtc ctcgctgtcc 25920
agaatgacct ccggggaggg ggggttggtc atcctcagta ccgaggcacg cttctttttc 25980
ttcctggggg cgttcgccag ctccgcggct gcggccgctg ccgaggtcga aggccgaggg 26040
ctgggcgtgc gcggcaccag cgcgtcctgc gagccgtcct cgtcctcctc ggactcgaga 26100
cggaggcggg cccgcttctt cgggggcgcg cggggcggcg gaggcggcgg cggcgacgga 26160
gacggggacg agacatcgtc cagggtgggt ggacggcggg ccgcgccgcg tccgcgctcg 26220
ggggtggtct cgcgctggtc ctcttcccga ctggccatct cccactgctc cttctcctat 26280
aggcagaaag agatcatgga gtctctcatg cgagtcgaga aggaggagga cagcctaacc 26340
gccccctctg agccctccac caccgccgcc accaccgcca atgccgccgc ggacgacgcg 26400
cccaccgaga ccaccgccag taccaccctc cccagcgacg cacccccgct cgagaatgaa 26460
gtgctgatcg agcaggaccc gggttttgtg agcggagagg aggatgaggt ggatgagaag 26520
gagaaggagg aggtcgccgc ctcagtgcca aaagaggata aaaagcaaga ccaggacgac 26580
gcagataagg atgagacagc agtcgggcgg gggaacggaa gccatgatgc tgatgacggc 26640
tacctagacg tgggagacga cgtgctgctt aagcacctgc accgccagtg cgtcatcgtc 26700
tgcgacgcgc tgcaggagcg ctgcgaagtg cccctggacg tggcggaggt cagccgcgcc 26760
tacgagcggc acctcttcgc gccgcacgtg ccccccaagc gccgggagaa cggcacctgc 26820
gagcccaacc cgcgtctcaa cttctacccg gtcttcgcgg tacccgaggt gctggccacc 26880
taccacatct ttttccaaaa ctgcaagatc cccctctcct gccgcgccaa ccgcacccgc 26940
gccgacaaaa ccctgaccct gcggcagggc gcccacatac ctgatatcgc ctctctggag 27000
gaagtgccca agatcttcga gggtctcggt cgcgacgaga aacgggcggc gaacgctctg 27060
cacggagaca gcgaaaacga gagtcactcg ggggtgctgg tggagctcga gggcgacaac 27120
gcgcgcctgg ccgtactcaa gcgcagcata gaggtcaccc actttgccta cccggcgctc 27180
aacctgcccc ccaaggtcat gagtgtggtc atgggcgagc tcatcatgcg ccgcgcccag 27240
cccctggccg cggatgcaaa cttgcaagag tcctccgagg aaggcctgcc cgcggtcagc 27300
gacgagcagc tggcgcgctg gctggagacc cgcgaccccg cgcagctgga ggagcggcgc 27360
aagctcatga tggccgcggt gctggtcacc gtggagctcg agtgtctgca gcgcttcttc 27420
gcggaccccg agatgcagcg caagctcgag gagaccctgc actacacctt ccgccagggc 27480
tacgtgcgcc aggcctgcaa gatctccaac gtggagctct gcaacctggt ctcctacctg 27540
ggcatcctgc acgagaaccg cctcgggcag aacgtcctgc actccaccct caaaggggag 27600
gcgcgccgcg actacatccg cgactgcgcc tacctcttcc tctgctacac ctggcagacg 27660
gccatggggg tctggcagca gtgcctggag gagcgcaacc tcaaggagct ggaaaagctc 27720
ctcaagcgca ccctcaggga cctctggacg ggcttcaacg agcgctcggt ggccgccgcg 27780
ctggcggaca tcatctttcc cgagcgcctg ctcaagaccc tgcagcaggg cctgcccgac 27840
ttcaccagcc agagcatgct gcagaacttc aggactttca tcctggagcg ctcgggcatc 27900
ctgccggcca cttgctgcgc gctgcccagc gacttcgtgc ccatcaagta cagggagtgc 27960
ccgccgccgc tctggggcca ctgctacctc ttccagctgg ccaactacct cgcctaccac 28020
tcggacctca tggaagacgt gagcggcgag ggcctgctcg agtgccactg ccgctgcaac 28080
ctctgcacgc cccaccgctc tctagtctgc aacccgcagc tgctcagcga gagtcagatt 28140
atcggtacct tcgagctgca gggtccctcg cctgacgaga agtccgcggc tccagggctg 28200
aaactcactc cggggctgtg gacttccgcc tacctacgca aatttgtacc tgaggactac 28260
cacgcccacg agatcaggtt ctacgaagac caatcccgcc cgcccaaggc ggagctcacc 28320
gcctgcgtca tcacccaggg gcacatcctg ggccaattgc aagccatcaa caaagcccgc 28380
cgagagttct tgctgaaaaa gggtcggggg gtgtacctgg acccccagtc cggcgaggag 28440
ctaaacccgc tacccccgcc gccgccccag cagcgggacc ttgcttccca ggatggcacc 28500
cagaaagaag cagcagccgc cgccgccgcc gcagccatac atgcttctgg aggaagagga 28560
ggaggactgg gacagtcagg cagaggaggt ttcggacgag gagcaggagg agatgatgga 28620
agactgggag gaggacagca gcctagacga ggaagcttca gaggccgaag aggtggcaga 28680
cgcaacacca tcgccctcgg tcgcagcccc ctcgccgggg cccctgaaat cctccgaacc 28740
cagcaccagc gctataacct ccgctcctcc ggcgccggcg ccacccgccc gcagacccaa 28800
ccgtagatgg gacaccacag gaaccggggt cggtaagtcc aagtgcccgc cgccgccacc 28860
gcagcagcag cagcagcagc gccagggcta ccgctcgtgg cgcgggcaca agaacgccat 28920
agtcgcctgc ttgcaagact gcgggggcaa catctctttc gcccgccgct tcctgctatt 28980
ccaccacggg gtcgcctttc cccgcaatgt cctgcattac taccgtcatc tctacagccc 29040
ctactgcagc ggcgacccag aggcggcagc ggcagccaca gcggcgacca ccacctagga 29100
agatatcctc cgcgggcaag acagcggcag cagcggccag gagacccgcg gcagcagcgg 29160
cgggagcggt gggcgcactg cgcctctcgc ccaacgaacc cctctcgacc cgggagctca 29220
gacacaggat cttccccact ttgtatgcca tcttccaaca gagcagaggc caggagcagg 29280
agctgaaaat aaaaaacaga tctctgcgct ccctcacccg cagctgtctg tatcacaaaa 29340
gcgaagatca gcttcggcgc acgctggagg acgcggaggc actcttcagc aaatactgcg 29400
cgctcactct taaagactag ctccgcgccc ttctcgaatt taggcgggag aaaactacgt 29460
catcgccggc cgccgcccag cccgcccagc cgagatgagc aaagagattc ccacgccata 29520
catgtggagc taccagccgc agatgggact cgcggcggga gcggcccagg actactccac 29580
ccgcatgaac tacatgagcg cgggacccca catgatctca caggtcaacg ggatccgcgc 29640
ccagcgaaac caaatactgc tggaacaggc ggccatcacc gccacgcccc gccataatct 29700
caacccccga aattggcccg ccgccctcgt gtaccaggaa accccctccg ccaccaccgt 29760
actacttccg cgtgacgccc aggccgaagt ccagatgact aactcagggg cgcagctcgc 29820
gggcggcttt cgtcacgggg cgcggccgct ccgaccaggt ataagacacc tgatgatcag 29880
aggccgaggt atccagctca acgacgagtc ggtgagctct tcgctcggtc tccgtccgga 29940
cggaactttc cagctcgccg gatccggccg ctcttcgttc acgccccgcc aggcgtacct 30000
gactctgcag acctcgtcct cggagccccg ctccggcggc atcggaaccc tccagttcgt 30060
ggaggagttc gtgccctcgg tctacttcaa ccccttctcg ggacctcccg gacgctaccc 30120
cgaccagttc attccgaact ttgacgcggt gaaggactcg gcggacggct acgactgaat 30180
gtcaggtgtc gaggcagagc agcttcgcct gagacacctc gagcactgcc gccgccacaa 30240
gtgcttcgcc cgcggttctg gtgagttctg ctactttcag ctacccgagg agcataccga 30300
ggggccggcg cacggcgtcc gcctgaccac ccagggcgag gttacctgtt ccctcatccg 30360
ggagtttacc ctccgtcccc tgctagtgga gcgggagcgg ggtccctgtg tcctaactat 30420
cgcctgcaac tgccctaacc ctggattaca tcaagatctt tgctgtcatc tctgtgctga 30480
gtttaataaa cgctgagatc agaatctact gggatttagt cccctttaac taatcaaaca 30540
ctggaatcaa taaaaagaat cacttactta aaatcagaca gcaggtctct gtccagttta 30600
ttcagcagca cctccttccc ctcctcccaa ctctggtact ccaaacgcct tctggcggca 30660
aacttcctcc acaccctgaa gggaatgtca gattcttgct cctgtccctc cgcacccact 30720
atcttcatgt tgttgcagat gaagcgcacc aaaacgtctg acgagagctt caaccccgtg 30780
tacccctatg acacggaaag cggccctccc tccgtccctt tcctcacccc tcccttcgtg 30840
tctcccgatg gattccaaga aagtcccccc ggggtcctgt ctctgaacct ggccgagccc 30900
ctggtcactt cccacggcat gctcgccctg aaaatgggaa gtggcctctc cctggacgac 30960
gctggcaacc tcacctctca agatatcacc accgctagcc ctcccctcaa aaaaaccaag 31020
accaacctca gcctagaaac ctcatccccc ctaactgtga gcacctcagg cgccctcacc 31080
gtagcagccg ccgctcccct ggcggtggcc ggcacctccc tcaccatgca atcagaggcc 31140
cccctgacag tacaggatgc aaaactcacc ctggccacca aaggccccct gaccgtgtct 31200
gaaggcaaac tggccttgca aacatcggcc ccgctgacgg ccgctgacag cagcaccctc 31260
acagtcagtg ccacaccacc ccttagcaca agcaatggca gcttgggtat tgacatgcaa 31320
gcccccattt acaccaccaa tggaaaacta ggacttaact ttggcgctcc cctgcatgtg 31380
gtagacagcc taaatgcact gactgtagtt actggccaag gtcttacgat aaacggaaca 31440
gccctacaaa ctagagtctc aggtgccctc aactatgaca catcaggaaa cctagaattg 31500
agagctgcag ggggtatgcg agttgatgca aatggtcaac ttatccttga tgtagcttac 31560
ccatttgatg cacaaaacaa tctcagcctt aggcttggac agggacccct gtttgttaac 31620
tctgcccaca acttggatgt taactacaac agaggcctct acctgttcac atctggaaat 31680
accaaaaagc tagaagttaa tatcaaaaca gccaagggtc tcatttatga tgacactgct 31740
atagcaatca atgcgggtga tgggctacag tttgactcag gctcagatac aaatccatta 31800
aaaactaaac ttggattagg actggattat gactccagca gagccataat tgctaaactg 31860
ggaactggcc taagctttga caacacaggt gccatcacag taggcaacaa aaatgatgac 31920
aagcttacct tgtggaccac accagaccca tcccctaact gtagaatcta ttcagagaaa 31980
gatgctaaat tcacacttgt tttgactaaa tgcggcagtc aggtgttggc cagcgtttct 32040
gttttatctg taaaaggtag ccttgcgccc atcagtggca cagtaactag tgctcagatt 32100
gtcctcagat ttgatgaaaa tggagttcta ctaagcaatt cttcccttga ccctcaatac 32160
tggaactaca gaaaaggtga ccttacagag ggcactgcat ataccaacgc agtgggattt 32220
atgcccaacc tcacagcata cccaaaaaca cagagccaaa ctgctaaaag caacattgta 32280
agtcaggttt acttgaatgg ggacaaatcc aaacccatga ccctcaccat taccctcaat 32340
ggaactaatg aaacaggaga tgccacagta agcacttact ccatgtcatt ctcatggaac 32400
tggaatggaa gtaattacat taatgaaacg ttccaaacca actccttcac cttctcctac 32460
atcgcccaag aataaaaagc atgacgctgt tgatttgatt caatgtgttt ctgttttatt 32520
ttcaagcaca acaaaatcat tcaagtcatt cttccatctt agcttaatag acacagtagc 32580
ttaatagacc cagtagtgca aagccccatt ctagcttata actagtggag aagtactcgc 32640
ctacatgggg gtagagtcat aatcgtgcat caggataggg cggtggtgct gcagcagcgc 32700
gcgaataaac tgctgccgcc gccgctccgt cctgcaggaa tacaacatgg cagtggtctc 32760
ctcagcgatg attcgcaccg cccgcagcat aaggcgcctt gtcctccggg cacagcagcg 32820
caccctgatc tcacttaaat cagcacagta actgcagcac agcaccacaa tattgttcaa 32880
aatcccacag tgcaaggcgc tgtatccaaa gctcatggcg gggaccacag aacccacgtg 32940
gccatcatac cacaagcgca ggtagattaa gtggcgaccc ctcataaaca cgctggacat 33000
aaacattacc tcttttggca tgttgtaatt caccacctcc cggtaccata taaacctctg 33060
attaaacatg gcgccatcca ccaccatcct aaaccagctg gccaaaacct gcccgccggc 33120
tatacactgc agggaaccgg gactggaaca atgacagtgg agagcccagg actcgtaacc 33180
atggatcatc atgctcgtca tgatatcaat gttggcacaa cacaggcaca cgtgcataca 33240
cttcctcagg attacaagct cctcccgcgt tagaaccata tcccagggaa caacccattc 33300
ctgaatcagc gtaaatccca cactgcaggg aagacctcgc acgtaactca cgttgtgcat 33360
tgtcaaagtg ttacattcgg gcagcagcgg atgatcctcc agtatggtag cgcgggtttc 33420
tgtctcaaaa ggaggtagac gatccctact gtacggagtg cgccgagaca accgagatcg 33480
tgttggtcgt agtgtcatgc caaatggaac gccggacgta gtcatatttc ctgaagtctt 33540
agatctctca acgcagcacc agcaccaaca cttcgcagtg taaaaggcca agtgccgaga 33600
gagtatatat aggaataaaa agtgacgtaa acgggcaaag tccaaaaaac gcccagaaaa 33660
accgcacgcg aacctacgcc ccgaaacgaa agccaaaaaa cactagacac tcccttccgg 33720
cgtcaacttc cgctttccca cgctacgtca cttgccccag tcaaacaaac tacatatccc 33780
gaacttccaa gtcgccacgc ccaaaacacc gcctacacct ccccgcccgc cggcccgccc 33840
ccaaacccgc ctcccgcccc gcgccccgcc ccgcgccgcc catctcatta tcatattggc 33900
ttcaatccaa aataaggtat attattgatg atggtttaaa cggatcctct agagtcgacc 33960
tgcaggcatg caagcttgag tattctatag tgtcacctaa atagcttggc gtaatcatgg 34020
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 34080
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 34140
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 34200
ggccaacgcg aaccccttgc ggccgcccgg gccgtcgacc aattctcatg tttgacagct 34260
tatcatcgaa tttctgccat tcatccgctt attatcactt attcaggcgt agcaaccagg 34320
cgtttaaggg caccaataac tgccttaaaa aaattacgcc ccgccctgcc actcatcgca 34380
gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaaa cggcatgatg 34440
aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt tgcccatggt 34500
gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac tggtgaaact 34560
cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag ggaaataggc 34620
caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact gccggaaatc 34680
gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta 34740
acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca tacggaattc 34800
cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa acttgtgctt 34860
atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct ggttataggt 34920
acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt gggatatatc 34980
aacggtggta tatccagtga tttttttctc cattttagct tccttagctc ctgaaaatct 35040
cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa agttggaacc 35100
tcttacgtgc cgatcaacgt ctcattttcg ccaaaagttg gcccagggct tcccggtatc 35160
aacagggaca ccaggattta tttattctgc gaagtgatct tccgtcacag gtatttattc 35220
gcgataagct catggagcgg cgtaaccgtc gcacaggaag gacagagaaa gcgcggatct 35280
gggaagtgac ggacagaacg gtcaggacct ggattgggga ggcggttgcc gccgctgctg 35340
ctgacggtgt gacgttctct gttccggtca caccacatac gttccgccat tcctatgcga 35400
tgcacatgct gtatgccggt ataccgctga aagttctgca aagcctgatg ggacataagt 35460
ccatcagttc aacggaagtc tacacgaagg tttttgcgct ggatgtggct gcccggcacc 35520
gggtgcagtt tgcgatgccg gagtctgatg cggttgcgat gctgaaacaa ttatcctgag 35580
aataaatgcc ttggccttta tatggaaatg tggaactgag tggatatgct gtttttgtct 35640
gttaaacaga gaagctggct gttatccact gagaagcgaa cgaaacagtc gggaaaatct 35700
cccattatcg tagagatccg cattattaat ctcaggagcc tgtgtagcgt ttataggaag 35760
tagtgttctg tcatgatgcc tgcaagcggt aacgaaaacg atttgaatat gccttcagga 35820
acaatagaaa tcttcgtgcg gtgttacgtt gaagtggagc ggattatgtc agcaatggac 35880
agaacaacct aatgaacaca gaaccatgat gtggtctgtc cttttacagc cagtagtgct 35940
cgccgcagtc gagcgacagg gcgaagccct cgagtgagcg aggaagcacc agggaacagc 36000
acttatatat tctgcttaca cacgatgcct gaaaaaactt cccttggggt tatccactta 36060
tccacgggga tatttttata attatttttt ttatagtttt tagatcttct tttttagagc 36120
gccttgtagg cctttatcca tgctggttct agagaaggtg ttgtgacaaa ttgccctttc 36180
agtgtgacaa atcaccctca aatgacagtc ctgtctgtga caaattgccc ttaaccctgt 36240
gacaaattgc cctcagaaga agctgttttt tcacaaagtt atccctgctt attgactctt 36300
ttttatttag tgtgacaatc taaaaacttg tcacacttca catggatctg tcatggcgga 36360
aacagcggtt atcaatcaca agaaacgtaa aaatagcccg cgaatcgtcc agtcaaacga 36420
cctcactgag gcggcatata gtctctcccg ggatcaaaaa cgtatgctgt atctgttcgt 36480
tgaccagatc agaaaatctg atggcaccct acaggaacat gacggtatct gcgagatcca 36540
tgttgctaaa tatgctgaaa tattcggatt gacctctgcg gaagccagta aggatatacg 36600
gcaggcattg aagagtttcg cggggaagga agtggttttt tatcgccctg aagaggatgc 36660
cggcgatgaa aaaggctatg aatcttttcc ttggtttatc aaacgtgcgc acagtccatc 36720
cagagggctt tacagtgtac atatcaaccc atatctcatt cccttcttta tcgggttaca 36780
gaaccggttt acgcagtttc ggcttagtga aacaaaagaa atcaccaatc cgtatgccat 36840
gcgtttatac gaatccctgt gtcagtatcg taagccggat ggctcaggca tcgtctctct 36900
gaaaatcgac tggatcatag agcgttacca gctgcctcaa agttaccagc gtatgcctga 36960
cttccgccgc cgcttcctgc aggtctgtgt taatgagatc aacagcagaa ctccaatgcg 37020
cctctcatac attgagaaaa agaaaggccg ccagacgact catatcgtat tttccttccg 37080
cgatatcact tccatgacga caggatagtc tgagggttat ctgtcacaga tttgagggtg 37140
gttcgtcaca tttgttctga cctactgagg gtaatttgtc acagttttgc tgtttccttc 37200
agcctgcatg gattttctca tactttttga actgtaattt ttaaggaagc caaatttgag 37260
ggcagtttgt cacagttgat ttccttctct ttcccttcgt catgtgacct gatatcgggg 37320
gttagttcgt catcattgat gagggttgat tatcacagtt tattactctg aattggctat 37380
ccgcgtgtgt acctctacct ggagtttttc ccacggtgga tatttcttct tgcgctgagc 37440
gtaagagcta tctgacagaa cagttcttct ttgcttcctc gccagttcgc tcgctatgct 37500
cggttacacg gctgcggcga gcgctagtga taataagtga ctgaggtatg tgctcttctt 37560
atctcctttt gtagtgttgc tcttatttta aacaactttg cggttttttg atgactttgc 37620
gattttgttg ttgctttgca gtaaattgca agatttaata aaaaaacgca aagcaatgat 37680
taaaggatgt tcagaatgaa actcatggaa acacttaacc agtgcataaa cgctggtcat 37740
gaaatgacga aggctatcgc cattgcacag tttaatgatg acagcccgga agcgaggaaa 37800
ataacccggc gctggagaat aggtgaagca gcggatttag ttggggtttc ttctcaggct 37860
atcagagatg ccgagaaagc agggcgacta ccgcacccgg atatggaaat tcgaggacgg 37920
gttgagcaac gtgttggtta tacaattgaa caaattaatc atatgcgtga tgtgtttggt 37980
acgcgattgc gacgtgctga agacgtattt ccaccggtga tcggggttgc tgcccataaa 38040
ggtggcgttt acaaaacctc agtttctgtt catcttgctc aggatctggc tctgaagggg 38100
ctacgtgttt tgctcgtgga aggtaacgac ccccagggaa cagcctcaat gtatcacgga 38160
tgggtaccag atcttcatat tcatgcagaa gacactctcc tgcctttcta tcttggggaa 38220
aaggacgatg tcacttatgc aataaagccc acttgctggc cggggcttga cattattcct 38280
tcctgtctgg ctctgcaccg tattgaaact gagttaatgg gcaaatttga tgaaggtaaa 38340
ctgcccaccg atccacacct gatgctccga ctggccattg aaactgttgc tcatgactat 38400
gatgtcatag ttattgacag cgcgcctaac ctgggtatcg gcacgattaa tgtcgtatgt 38460
gctgctgatg tgctgattgt tcccacgcct gctgagttgt ttgactacac ctccgcactg 38520
cagtttttcg atatgcttcg tgatctgctc aagaacgttg atcttaaagg gttcgagcct 38580
gatgtacgta ttttgcttac caaatacagc aatagtaatg gctctcagtc cccgtggatg 38640
gaggagcaaa ttcgggatgc ctggggaagc atggttctaa aaaatgttgt acgtgaaacg 38700
gatgaagttg gtaaaggtca gatccggatg agaactgttt ttgaacaggc cattgatcaa 38760
cgctcttcaa ctggtgcctg gagaaatgct ctttctattt gggaacctgt ctgcaatgaa 38820
attttcgatc gtctgattaa accacgctgg gagattagat aatgaagcgt gcgcctgtta 38880
ttccaaaaca tacgctcaat actcaaccgg ttgaagatac ttcgttatcg acaccagctg 38940
ccccgatggt ggattcgtta attgcgcgcg taggagtaat ggctcgcggt aatgccatta 39000
ctttgcctgt atgtggtcgg gatgtgaagt ttactcttga agtgctccgg ggtgatagtg 39060
ttgagaagac ctctcgggta tggtcaggta atgaacgtga ccaggagctg cttactgagg 39120
acgcactgga tgatctcatc ccttcttttc tactgactgg tcaacagaca ccggcgttcg 39180
gtcgaagagt atctggtgtc atagaaattg ccgatgggag tcgccgtcgt aaagctgctg 39240
cacttaccga aagtgattat cgtgttctgg ttggcgagct ggatgatgag cagatggctg 39300
cattatccag attgggtaac gattatcgcc caacaagtgc ttatgaacgt ggtcagcgtt 39360
atgcaagccg attgcagaat gaatttgctg gaaatatttc tgcgctggct gatgcggaaa 39420
atatttcacg taagattatt acccgctgta tcaacaccgc caaattgcct aaatcagttg 39480
ttgctctttt ttctcacccc ggtgaactat ctgcccggtc aggtgatgca cttcaaaaag 39540
cctttacaga taaagaggaa ttacttaagc agcaggcatc taaccttcat gagcagaaaa 39600
aagctggggt gatatttgaa gctgaagaag ttatcactct tttaacttct gtgcttaaaa 39660
cgtcatctgc atcaagaact agtttaagct cacgacatca gtttgctcct ggagcgacag 39720
tattgtataa gggcgataaa atggtgctta acctggacag gtctcgtgtt ccaactgagt 39780
gtatagagaa aattgaggcc attcttaagg aacttgaaaa gccagcaccc tgatgcgacc 39840
acgttttagt ctacgtttat ctgtctttac ttaatgtcct ttgttacagg ccagaaagca 39900
taactggcct gaatattctc tctgggccca ctgttccact tgtatcgtcg gtctgataat 39960
cagactggga ccacggtccc actcgtatcg tcggtctgat tattagtctg ggaccacggt 40020
cccactcgta tcgtcggtct gattattagt ctgggaccac ggtcccactc gtatcgtcgg 40080
tctgataatc agactgggac cacggtccca ctcgtatcgt cggtctgatt attagtctgg 40140
gaccatggtc ccactcgtat cgtcggtctg attattagtc tgggaccacg gtcccactcg 40200
tatcgtcggt ctgattatta gtctggaacc acggtcccac tcgtatcgtc ggtctgatta 40260
ttagtctggg accacggtcc cactcgtatc gtcggtctga ttattagtct gggaccacga 40320
tcccactcgt gttgtcggtc tgattatcgg tctgggacca cggtcccact tgtattgtcg 40380
atcagactat cagcgtgaga ctacgattcc atcaatgcct gtcaagggca agtattgaca 40440
tgtcgtcgta acctgtagaa cggagtaacc tcggtgtgcg gttgtatgcc tgctgtggat 40500
tgctgctgtg tcctgcttat ccacaacatt ttgcgcacgg ttatgtggac aaaatacctg 40560
gttacccagg ccgtgccggc acgttaaccg ggctgcatcc gatgcaagtg tgtcgctgtc 40620
gacgagctcg cgagctcgga catgaggttg ccccgtattc agtgtcgctg atttgtattg 40680
tctgaagttg tttttacgtt aagttgatgc agatcaatta atacgatacc tgcgtcataa 40740
ttgattattt gacgtggttt gatggcctcc acgcacgttg tgatatgtag atgataatca 40800
ttatcacttt acgggtcctt tccggtgatc cgacaggtta cggggcggcg acctcgcggg 40860
ttttcgctat ttatgaaaat tttccggttt aaggcgtttc cgttcttctt cgtcataact 40920
taatgttttt atttaaaata ccctctgaaa agaaaggaaa cgacaggtgc tgaaagcgag 40980
ctttttggcc tctgtcgttt cctttctctg tttttgtccg tggaatgaac aatggaagtc 41040
cgagctcatc gctaataact tcgtatagca tacattatac gaagttatat tcgatgcggc 41100
cgcaaggggt tcgcgtcagc gggtgttggc gggtgtcggg gctggcttaa ctatgcggca 41160
tcagagcaga ttgtactgag agtgcaccat atgcggtgtg aaataccgca cagatgcgta 41220
aggagaaaat accgcatcag gcgccattcg ccattcaggc tgcgcaactg ttgggaaggg 41280
cgatcggtgc gggcctcttc gctattacgc cagctggcga aagggggatg tgctgcaagg 41340
cgattaagtt gggtaacgcc agggttttcc cagtcacgac gttgtaaaac gacggccagt 41400
gaattgtaat acgactcact atagggcgaa ttcgagctcg gtacccgggg atcctcgttt 41460
aaac 41464
<210> 52
<211> 43711
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (15388)..(15388)
<223> a, c, t, g, unknown or other
<400> 52
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg tccgaggact ttctgattct gatcgccatc 1380
ctggtgatcg tgattctcgt gggcacaatc acaaccctgg tgggcgccat cggcggcatt 1440
agggccagga ggagcttcct cttcatttgc atcttcttcc tgttcctctc cctcttcctg 1500
acaatcctcg ccctgctgct gggcttcagc tggctcctgc tggtggccat cctgttctgg 1560
gtgctctggc tggtcatcct cattctgctg ctgctggtgt accctattcc tcaccacccc 1620
ctgcccacct ccctcaggtt tagaatgaag cagagggtga gcagcgaccc cacaggttct 1680
gacagaagcc ctcagggcag ccataatagc ctgaactccc ccgatgagga ggaccccaag 1740
gatgacacca agcaacctct gtgcaacatg acccagggcg gacctcccgt caatggacag 1800
ctcctcggac aacatgctca atgcccccct cactatccct gctgccatat tcagcatccc 1860
gacggagagg attccgatgg agacgatggc aagtcctggg gcgatgccgg agaggaagac 1920
aatggcccta acgaccctaa caccgccagc accagagagt ccatttacga ggacctcaga 1980
taccccacaa gggacgccaa tggcgagtat gagaacgtgg gatacccccc tagggacgga 2040
gatgcccctc ataggctcgg agagcctgtg tatgacgatg tggagcaagc caccgctaac 2100
gaggtgagaa tctcccctct gttcagactg ccctacggaa gcgctttcgg acctggcccc 2160
cagcctggac ccattctgga gagctccaca tggggctttc tggtcttcac acagacctcc 2220
ctgttcgccg acgacattgc cgacgctatt agggactact gcacaaccca ccctggcccc 2280
acaaggaaca cccaggtggt cctcatgaac ttcgagggca gcggagtgcc cctgcctatg 2340
ttttttcccc ctggagagga gacagaagag cagagagagg gcgatagagc tagcgactcc 2400
gacgagtccg aagacgctca gatcctgacc gtgttctgcc tgttttgcca gtggacactc 2460
tttatctgcc tgggaatcag gatgatctgt aactggaggg gcaaactcac caggatcatc 2520
tgcctgaagt tctgcctcta cggactgatt tccgcctccc tgtccttcgg ctggtacgct 2580
tttctgaagg aagtgaccct ccccaccaca gccaccgttg atcctaggca actccccctg 2640
ttcctcttca tcctgagctc cgtgctggtg attctcgcca tcatgatgga gtttcaaaca 2700
tcctccagcc tcttcgctgc tctgttcgtg attatcgccg gaatgctgtg cgtcacagtg 2760
ggcgtgattt ttctgctggc tggcgtcaag cctctcctga gcggcatgat ctgcgcctcc 2820
ggcatcacaa tgctcgtgct cggcgtcgtg ctgctggtgg tgtgcaccag aagccccagc 2880
ccttgtcatc acagggatga acccccctcc agaagcccca gccctcaacc caccgtctcc 2940
gagcagtccc agcagtcccc caggcagcag agccctcaag gcacatccca gggttctaca 3000
agacctcagg tgcctggagg cgccaccacc agaaaaagag gcggcgtgag aggccaacct 3060
gccaagtgtc acggcaagta caccacaacc gccgagggac tgaccgctct cctgaatagg 3120
aggcacagcc ccaggacatc caacgagggc aggtggatga atggagtcat ggctgtgaac 3180
ctctccaaat ggcccctgta cagcctgagg agagccctgg ccctcgccat ggctcctaga 3240
aggaggctct ccggccctcc ctggctgaca gtgctgctgc tgctgtccac actgagcgtg 3300
gccgccctgc tgattctctt cctgattttc agcgccggcg ccaccattag cacagaagcc 3360
agcctgctgg tcctgctcct gctgtttgtg accctgctgc tgcctctcct gtcctccaac 3420
ggactccagc tccctgccgc cctgattctg atccagtgtt tcctcctggc cgctgattat 3480
ctcgcctacc tgattctgcc taccattatg cccaggggca gaagcacagg aaggaagggc 3540
agggacacag agaaagagag gagcagatcc cctctcagag ctcctggcgg ttctgatgga 3600
cccagcacaa gggctggctg tggagccgga ccctgtcagc tgagcagccc catcgccgga 3660
aacaacggca atgaaggcgg cgagggcgac gactacaaga gctggaggaa gcccgaggaa 3720
gaggacaacg gccccaatga ccccaatacc aacaacagga ttgaggatgg agacggcgac 3780
gacggaaaat cctggaggaa tcctgaggag gaggataaca gaaagcagga caggctgggc 3840
accaagcctt tcatggccgg ccactggtat gagagcgtga ttcccggcct gttcctctgc 3900
cccctgatcc tcccttccct gttctggatt tgctccctgc tgaccttcct ggtgggccac 3960
ggagccaata ttgtgagcgc cgtcctgttc ctcgtgctgg cttggtgtct cctcattgcc 4020
aactggaacg tgacaagaga ggacttcgtg tccggcagga gaagctccat gagcagcctg 4080
tccgtggccg cttccaccgc cacagccatg ttcgccagct tcctcaccct gagctttgat 4140
ggcctgggcc tgctgctgtt tggcaccgcc ctggtgatcc agacaattta cgtgctgtat 4200
ctggtggtca tggagatcac cgtgtggatc atgatgttta ggtatctcca cttttggatc 4260
accctgctgt tcctgctgag ccccattatt ctctccgtcg cctgtctcat catccaatcc 4320
tccgccctgc tgatcgaggc tgtggtcgtc accaccatca cagtcctggc catttttctg 4380
tggctccctc ctcaaggcgc tgaggccgat ctcggcaccg ccctgctgat tctgaatacc 4440
gccctgtgcc tggtcgtgct gatcctgacc gctatcccta catgatgatg agcggccgcg 4500
atctgctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 4560
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 4620
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 4680
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ccgatcagcg 4740
atcgctgagg tgggtgagtg ggcgtggcct ggggtggtca tgaaaatata taagttgggg 4800
gtcttagggt ctctttattt gtgttgcaga gaccgccgga gccatgagcg ggagcagcag 4860
cagcagcagt agcagcagcg ccttggatgg cagcatcgtg agcccttatt tgacgacgcg 4920
gatgccccac tgggccgggg tgcgtcagaa tgtgatgggc tccagcatcg acggccgacc 4980
cgtcctgccc gcaaattccg ccacgctgac ctatgcgacc gtcgcgggga cgccgttgga 5040
cgccaccgcc gccgccgccg ccaccgcagc cgcctcggcc gtgcgcagcc tggccacgga 5100
ctttgcattc ctgggaccac tggcgacagg ggctacttct cgggccgctg ctgccgccgt 5160
tcgcgatgac aagctgaccg ccctgctggc gcagttggat gcgcttactc gggaactggg 5220
tgacctttct cagcaggtca tggccctgcg ccagcaggtc tcctccctgc aagctggcgg 5280
gaatgcttct cccacaaatg ccgtttaaga taaataaaac cagactctgt ttggattaaa 5340
gaaaagtagc aagtgcattg ctctctttat ttcataattt tccgcgcgcg ataggcccta 5400
gaccagcgtt ctcggtcgtt gagggtgcgg tgtatcttct ccaggacgtg gtagaggtgg 5460
ctctggacgt tgagatacat gggcatgagc ccgtcccggg ggtggaggta gcaccactgc 5520
agagcttcat gctccggggt ggtgttgtag atgatccagt cgtagcagga gcgctgggca 5580
tggtgcctaa aaatgtcctt cagcagcagg ccgatggcca gggggaggcc cttggtgtaa 5640
gtgtttacaa aacggttaag ttgggaaggg tgcattcggg gagagatgat gtgcatcttg 5700
gactgtattt ttagattggc gatgtttccg cccagatccc ttctgggatt catgttgtgc 5760
aggaccacca gtacagtgta tccggtgcac ttggggaatt tgtcatgcag cttagaggga 5820
aaagcgtgga agaacttgga gacgcctttg tggcctccca gattttccat gcattcgtcc 5880
atgatgatgg caatgggccc gcgggaggca gcttgggcaa agatatttct ggggtcgctg 5940
acgtcgtagt tgtgttccag ggtgaggtcg tcataggcca tttttacaaa gcgcgggcgg 6000
agggtgcccg actgggggat gatggtcccc tctggccctg gggcgtagtt gccctcgcag 6060
atctgcattt cccaggcctt aatctcggag gggggaatca tatccacctg cggggcgatg 6120
aagaaaacgg tttccggagc cggggagatt aactgggatg agagcaggtt tctaagcagc 6180
tgtgattttc cacaaccggt gggcccataa ataacaccta taaccggttg cagctggtag 6240
tttagagagc tgcagctgcc gtcgtcccgg aggagggggg ccacctcgtt gagcatgtcc 6300
ctgacgcgca tgttctcccc gaccagatcc gccagaaggc gctcgccgcc cagggacagc 6360
agctcttgca aggaagcaaa gtttttcagc ggcttgaggc cgtccgccgt gggcatgttt 6420
ttcagggtct ggctcagcag ctccaggcgg tcccagagct cggtgacgtg ctctacggca 6480
tctctatcca gcatatctcc tcgtttcgcg ggttggggcg actttcgctg tagggcacca 6540
agcggtggtc gtccagcggg gccagagtca tgtccttcca tgggcgcagg gtcctcgtca 6600
gggtggtctg ggtcacggtg aaggggtgcg ctccgggctg agcgcttgcc aaggtgcgct 6660
tgaggctggt tctgctggtg ctgaagcgct gccggtcttc gccctgcgcg tcggccaggt 6720
agcatttgac catggtgtca tagtccagcc cctccgcggc gtgtcccttg gcgcgcagct 6780
tgcccttgga ggtggcgccg cacgaggggc agagcaggct cttgagcgcg tagagcttgg 6840
gggcgaggaa gaccgattcg ggggagtagg cgtccgcgcc gcagaccccg cacacggtct 6900
cgcactccac cagccaggtg agctcggggc gcgccgggtc aaaaaccagg tttcccccat 6960
gctttttgat gcgtttctta cctcgggtct ccatgaggtg gtgtccccgc tcggtgacga 7020
agaggctgtc cgtgtctccg tagaccgact tgaggggtct tttctccagg ggggtccctc 7080
ggtcttcctc gtagaggaac tcggaccact ctgagacgaa ggcccgcgtc caggccagga 7140
cgaaggaggc tatgtgggag gggtagcggt cgttgtccac tagggggtcc accttctcca 7200
aggtgtgaag acacatgtcg ccttcctcgg cgtccaggaa ggtgattggc ttgtaggtgt 7260
aggccacgtg accgggggtt cctgacgggg gggtataaaa gggggtgggg gcgcgctcgt 7320
cgtcactctc ttccgcatcg ctgtctgcga gggccagctg ctggggtgag tattccctct 7380
cgaaggcggg catgacctcc gcgctgaggt tgtcagtttc caaaaacgag gaggatttga 7440
tgttcacctg tcccgaggtg atacctttga gggtacccgc gtccatctgg tcagaaaaca 7500
cgatcttttt attgtccagc ttggtggcga acgacccgta gagggcgttg gagagcagct 7560
tggcgatgga gcgcagggtc tggttcttgt ccctgtcggc gcgctccttg gccgcgatgt 7620
tgagctgcac gtactcgcgc gcgacgcagc gccactcggg gaagacggtg gtgcgctcgt 7680
cgggcaccag gcgcacgcgc cagccgcggt tgtgcagggt gaccaggtcc acgctggtgg 7740
cgacctcgcc gcgcaggcgc tcgttggtcc agcagagacg gccgcccttg cgcgagcaga 7800
aggggggcag ggggtcgagc tgggtctcgt ccggggggtc cgcgtccacg gtgaaaaccc 7860
cggggcgcag gcgcgcgtcg aagtagtcta tcttgcaacc ttgcatgtcc agcgcctgct 7920
gccagtcgcg ggcggcgagc gcgcgctcgt aggggttgag cggcgggccc cagggcatgg 7980
ggtgggtgag tgcggaggcg tacatgccgc agatgtcata gacgtagagg ggctcccgca 8040
ggaccccgat gtaggtgggg tagcagcggc cgccgcggat gctggcgcgc acgtagtcat 8100
acagctcgtg cgagggggcg aggaggtcgg ggcccaggtt ggtgcgggcg gggcgctccg 8160
cgcggaagac gatctgcctg aagatggcat gcgagttgga agagatggtg gggcgctgga 8220
agacgttgaa gctggcgtcc tgcaggccga cggcgtcgcg cacgaaggag gcgtaggagt 8280
cgcgcagctt gtgtaccagc tcggcggtga cctgcacgtc gagcgcgcag tagtcgaggg 8340
tctcgcggat gatgtcatat ttagcctgcc ccttcttttt ccacagctcg cggttgagga 8400
caaactcttc gcggtctttc cagtactctt ggatcgggaa accgtccggt tccgaacggt 8460
aagagcctag catgtagaac tggttgacgg cctggtaggc gcagcagccc ttctccacgg 8520
ggagggcgta ggcctgcgcg gccttgcgga gcgaggtgtg ggtcagggcg aaggtgtccc 8580
tgaccatgac tttgaggtac tggtgcttga agtcggagtc gtcgcagccg ccccgctccc 8640
agagcgagaa gtcggtgcgc ttcttggagc gggggttggg cagagcgaag gtgacatcgt 8700
tgaagaggat tttgcccgcg cggggcatga agttgcgggt gatgcggaag ggccccggca 8760
cttcagagcg gttgttgatg acctgggcgg cgagcacgat ctcgtcgaag ccgttgatgt 8820
tgtggcccac gatgtagagt tccaggaagc ggggccggcc ctttacggtg ggcagcttct 8880
ttagctcttc gtaggtgagc tcctcgggcg aggcgaggcc gtgctcggcc agggcccagt 8940
ccgcgaggtg cgggttgtct ctgaggaagg acttccagag gtcgcgggcc aggagggtct 9000
gcaggcggtc tctgaaggtc ctgaactggc ggcccacggc cattttttcg ggggtgatgc 9060
agtagaaggt gagggggtct tgctgccagc ggtcccagtc gagctgcagg gcgaggtcgc 9120
gcgcggcggt gaccaggcgc tcgtcgcccc cgaatttcat gaccagcatg aagggcacga 9180
gctgctttcc gaaggccccc atccaagtgt aggtctctac atcgtaggtg acaaagaggc 9240
gctccgtgcg aggatgcgag ccgatcggga agaactggat ctcccgccac cagttggagg 9300
agtggctgtt gatgtggtgg aagtagaagt cccgtcgccg ggccgaacac tcgtgctggc 9360
ttttgtaaaa gcgagcgcag tactggcagc gctgcacggg ctgtacctca tgcacgagat 9420
gcacctttcg cccgcgcacg aggaagccga ggggaaatct gagccccccg cctggctcgc 9480
ggcatggctg gttctcttct actttggatg cgtgtccgtc tccgtctggc tcctcgaggg 9540
gtgttacggt ggagcggacc accacgccgc gcgagccgca ggtccagata tcggcgcgcg 9600
gcggtcggag tttgatgacg acatcgcgca gctgggagct gtccatggtc tggagctccc 9660
gcggcggcgg caggtcagcc gggagttctt gcaggttcac ctcgcagagt cgggccaggg 9720
cgcggggcag gtctaggtgg tacctgatct ctaggggcgt gttggtggcg gcgtcgatgg 9780
cttgcaggag cccgcagccc cggggggcga cgacggtgcc ccgcggggtg gtggtggtgg 9840
tggcggtgca gctcagaagc ggtgccgcgg gcgggccccc ggaggtaggg ggggctccgg 9900
tcccgcgggc aggggcggca gcggcacgtc ggcgtggagc gcgggcagga gttggtgctg 9960
tgcccggagg ttgctggcga aggcgacgac gcggcggttg atctcctgga tctggcgcct 10020
ctgcgtgaag acgacgggcc cggtgagctt gaacctgaaa gagagttcga cagaatcaat 10080
ctcggtgtca ttgaccgcgg cctggcgcag gatctcctgc acgtctcccg agttgtcttg 10140
gtaggcgatc tcggccatga actgctcgat ctcttcctcc tggaggtctc cgcgtccggc 10200
gcgttccacg gtggccgcca ggtcgttgga gatgcgcccc atgagctgcg agaaggcgtt 10260
gagtccgccc tcgttccaga ctcggctgta gaccacgccc ccctggtcat cgcgggcgcg 10320
catgaccacc tgcgcgaggt tgagctccac gtgccgcgcg aagacggcgt agttgcgcag 10380
acgctggaag aggtagttga gggtggtggc ggtgtgctcg gccacgaaga agttcatgac 10440
ccagcggcgc aacgtggatt cgttgatgtc ccccaaggcc tccagccgtt ccatggcctc 10500
gtagaagtcc acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg tcaactcctc 10560
ctccagaaga cggatgagct cggcgacggt gtcgcgcacc tcgcgctcga aggctatggg 10620
gatctcttcc tccgctagca tcaccacctc ctcctcttcc tcctcttctg gcacttccat 10680
gatggcttcc tcctcttcgg ggggtggcgg cggcggcggt gggggagggg gcgctctgcg 10740
ccggcggcgg cgcaccggga ggcggtccac gaagcgcgcg atcatctccc cgcggcggcg 10800
gcgcatggtc tcggtgacgg cgcggccgtt ctcccggggg cgcagttgga agacgccgcc 10860
ggacatctgg tgctggggcg ggtggccgtg aggcagcgag acggcgctga cgatgcatct 10920
caacaattgc tgcgtaggta cgccgccgag ggacctgagg gagtccatat ccaccggatc 10980
cgaaaacctt tcgaggaagg cgtctaacca gtcgcagtcg caaggtaggc tgagcaccgt 11040
ggcgggcggc ggggggtggg gggagtgtct ggcggaggtg ctgctgatga tgtaattgaa 11100
gtaggcggac ttgacacggc ggatggtcga caggagcacc atgtccttgg gtccggcctg 11160
ctggatgcgg aggcggtcgg ctatgcccca ggcttcgttc tggcatcggc gcaggtcctt 11220
gtagtagtct tgcatgagcc tttccaccgg cacctcttct ccttcctctt ctgcttcttc 11280
catgtctgct tcggccctgg ggcggcgccg cgcccccctg ccccccatgc gcgtgacccc 11340
gaaccccctg agcggttgga gcagggccag gtcggcgacg acgcgctcgg ccaggatggc 11400
ctgctgcacc tgcgtgaggg tggtttggaa gtcatccaag tccacgaagc ggtggtaggc 11460
gcccgtgttg atggtgtagg tgcagttggc catgacggac cagttgacgg tctggtggcc 11520
cggttgcgac atctcggtgt acctgagtcg cgagtaggcg cgggagtcga agacgtagtc 11580
gttgcaagtc cgcaccaggt actggtagcc caccaggaag tgcggcggcg gctggcggta 11640
gaggggccag cgcagggtgg cgggggctcc gggggccagg tcttccagca tgaggcggtg 11700
gtaggcgtag atgtacctgg acatccaggt gatacccgcg gcggtggtgg aggcgcgcgg 11760
gaagtcgcgc acccggttcc agatgttgcg caggggcaga aagtgctcca tggtaggcgt 11820
gctctgtcca gtcagacgcg cgcagtcgtt gatactctag accagggaaa acgaaagccg 11880
gtcagcgggc actcttccgt ggtctggtga atagatcgca agggtatcat ggcggagggc 11940
ctcggttcga gccccgggtc cgggccggac ggtccgccat gatccacgcg gttaccgccc 12000
gcgtgtcgaa cccaggtgtg cgacgtcaga caacggtgga gtgttccttt tggcgttttt 12060
ctggccgggc gccggcgccg cgtaagagac taagccgcga aagcgaaagc agtaagtggc 12120
tcgctccccg tagccggagg gatccttgct aagggttgcg ttgcggcgaa ccccggttcg 12180
aatcccgtac tcgggccggc cggacccgcg gctaaggtgt tggattggcc tccccctcgt 12240
ataaagaccc cgcttgcgga ttgactccgg acacggggac gagccccttt tatttttgct 12300
ttccccagat gcatccggtg ctgcggcaga tgcgcccccc gccccagcag cagcaacaac 12360
accagcaaga gcggcagcaa cagcagcggg agtcatgcag ggccccctca cccaccctcg 12420
gcgggccggc cacctcggcg tccgcggccg tgtctggcgc ctgcggcggc ggcggggggc 12480
cggctgacga ccccgaggag cccccgcggc gcagggccag acactacctg gacctggagg 12540
agggcgaggg cctggcgcgg ctgggggcgc cgtctcccga gcgccacccg cgggtgcagc 12600
tgaagcgcga ctcgcgcgag gcgtacgtgc ctcggcagaa cctgttcagg gaccgcgcgg 12660
gcgaggagcc cgaggagatg cgggacagga ggttcagcgc agggcgggag ctgcggcagg 12720
ggctgaaccg cgagcggctg ctgcgcgagg aggactttga gcccgacgcg cggacgggga 12780
tcagccccgc gcgcgcgcac gtggcggccg ccgacctggt gacggcgtac gagcagacgg 12840
tgaaccagga gatcaacttc caaaagagtt tcaacaacca cgtgcgcacg ctggtggcgc 12900
gcgaggaggt gaccatcggg ctgatgcacc tgtgggactt tgtaagcgcg ctggtgcaga 12960
accccaacag caagcctctg acggcgcagc tgttcctgat agtgcagcac agcagggaca 13020
acgaggcgtt tagggacgcg ctgctgaaca tcaccgagcc cgagggtcgg tggctgctgg 13080
acctgattaa catcctgcag agcatagtgg tgcaggagcg cagcctgagc ctggccgaca 13140
aggtggcggc catcaactac tcgatgctga gcctgggcaa gttttacgcg cgcaagatct 13200
accagacgcc gtacgtgccc atagacaagg aggtgaagat cgacggtttt tacatgcgca 13260
tggcgctgaa ggtgctcacc ctgagcgacg acctgggcgt gtaccgcaac gagcgcatcc 13320
acaaggccgt gagcgtgagc cggcggcgcg agctgagcga ccgcgagctg atgcacagcc 13380
tgcagcgggc gctggcgggc gccggcagcg gcgacaggga ggcggagtcc tacttcgatg 13440
cgggggcgga cctgcgctgg gcgcccagcc ggcgggccct ggaggccgcg ggggtccgcg 13500
aggactatga cgaggacggc gaggaggatg aggagtacga gctagaggag ggcgagtacc 13560
tggactaaac cgcgggtggt gtttccggta gatgcaagac ccgaacgtgg tggacccggc 13620
gctgcgggcg gctctgcaga gccagccgtc cggccttaac tcctcagacg actggcgaca 13680
ggtcatggac cgcatcatgt cgctgacggc gcgtaacccg gacgcgttcc ggcagcagcc 13740
gcaggccaac aggctctccg ccatcctgga ggcggtggtg cctgcgcgct cgaaccccac 13800
gcacgagaag gtgctggcca tagtgaacgc gctggccgag aacagggcca tccgcccgga 13860
cgaggccggg ctggtgtacg acgcgctgct gcagcgcgtg gcccgctaca acagcggcaa 13920
cgtgcagacc aacctggacc ggctggtggg ggacgtgcgc gaggcggtgg cgcagcgcga 13980
gcgcgcggat cggcagggca acctgggctc catggtggcg ctgaatgcct tcctgagcac 14040
gcagccggcc aacgtgccgc gggggcagga agactacacc aactttgtga gcgcgctgcg 14100
gctgatggtg accgagaccc cccagagcga ggtgtaccag tcgggcccgg actacttctt 14160
ccagaccagc agacagggcc tgcagacggt gaacctgagc caggctttca agaacctgcg 14220
ggggctgtgg ggcgtgaagg cgcccaccgg cgaccgggcg acggtgtcca gcctgctgac 14280
gcccaactcg cgcctgctgc tgctgctgat cgcgccgttc acggacagcg gcagcgtgtc 14340
ccgggacacc tacctggggc acctgctgac cctgtaccgc gaggccatcg ggcaggcgca 14400
ggtggacgag cacaccttcc aggagatcac cagcgtgagc cgcgcgctgg ggcaggagga 14460
cacgagcagc ctggaggcga ctctgaacta cctgctgacc aaccggcggc agaagattcc 14520
ctcgctgcac agcctgacct ccgaggagga gcgcatcttg cgctacgtgc agcagagcgt 14580
gagcctgaac ctgatgcgcg acggggtgac gcccagcgtg gcgctggaca tgaccgcgcg 14640
caacatggaa ccgggcatgt acgccgcgca ccggccttac atcaaccgcc tgatggacta 14700
cctgcatcgc gcggcggccg tgaaccccga gtactttacc aacgccatcc tgaacccgca 14760
ctggctcccg ccgcccgggt tctacagcgg gggcttcgag gtcccggaga ccaacgatgg 14820
cttcctgtgg gacgacatgg acgacagcgt gttctccccg cggccgcagg cgctggcgga 14880
agcgtccctg ctgcgtccca agaaggagga ggaggaggag gcgagtcgcc gccgcggcag 14940
cagcggcgtg gcttctctgt ccgagctggg ggcggcagcc gccgcgcgcc ccgggtccct 15000
gggcggcagc ccctttccga gcctggtggg gtctctgcac agcgagcgca ccacccgccc 15060
tcggctgctg ggcgaggacg agtacctgaa taactccctg ctgcagccgg tgcgggagaa 15120
aaacctgcct cccgccttcc ccaacaacgg gatagagagc ctggtggaca agatgagcag 15180
atggaagacc tatgcgcagg agcacaggga cgcgcctgcg ctccggccgc ccacgcggcg 15240
ccagcgccac gaccggcagc gggggctggt gtgggatgac gaggactccg cggacgatag 15300
cagcgtgctg gacctgggag ggagcggcaa cccgttcgcg cacctgcgcc cccgcctggg 15360
gaggatgttt taaaaaaaaa aaaaaaangc aagaagcatg atgcaaaaat taaataaaac 15420
tcaccaaggc catggcgacc gagcgttggt ttcttgtgtt cccttcagta tgcggcgcgc 15480
ggcgatgtac caggagggac ctcctccctc ttacgagagc gtggtgggcg cggcggcggc 15540
ggcgccctct tctccctttg cgtcgcagct gctggagccg ccgtacgtgc ctccgcgcta 15600
cctgcggcct acggggggga gaaacagcat ccgttactcg gagctggcgc ccctgttcga 15660
caccacccgg gtgtacctgg tggacaacaa gtcggcggac gtggcctccc tgaactacca 15720
gaacgaccac agcaattttt tgaccacggt catccagaac aatgactaca gcccgagcga 15780
ggccagcacc cagaccatca atctggatga ccggtcgcac tggggcggcg acctgaaaac 15840
catcctgcac accaacatgc ccaacgtgaa cgagttcatg ttcaccaata agttcaaggc 15900
gcgggtgatg gtgtcgcgct cgcacaccaa ggaagaccgg gtggagctga agtacgagtg 15960
ggtggagttc gagctgccag agggcaacta ctccgagacc atgaccattg acctgatgaa 16020
caacgcgatc gtggagcact atctgaaagt gggcaggcag aacggggtcc tggagagcga 16080
catcggggtc aagttcgaca ccaggaactt ccgcctgggg ctggaccccg tgaccgggct 16140
ggttatgccc ggggtgtaca ccaacgaggc cttccatccc gacatcatcc tgctgcccgg 16200
ctgcggggtg gacttcactt acagccgcct gagcaacctc ctgggcatcc gcaagcggca 16260
gcccttccag gagggcttca ggatcaccta cgaggacctg gaggggggca acatccccgc 16320
gctcctcgat gtggaggcct accaggatag cttgaaggaa aatgaggcgg gacaggagga 16380
taccgccccc gccgcctccg ccgccgccga gcagggcgag gatgctgctg acaccgcggc 16440
cgcggacggg gcagaggccg accccgctat ggtggtggag gctcccgagc aggaggagga 16500
catgaatgac agtgcggtgc gcggagacac cttcgtcacc cggggggagg aaaagcaagc 16560
ggaggccgag gccgcggccg aggaaaagca actggcggca gcagcggcgg cggcggcgtt 16620
ggccgcggcg gaggctgagt ctgaggggac caagcccgcc aaggagcccg tgattaagcc 16680
cctgaccgaa gatagcaaga agcgcagtta caacctgctc aaggacagca ccaacaccgc 16740
gtaccgcagc tggtacctgg cctacaacta cggcgacccg tcgacggggg tgcgctcctg 16800
gaccctgctg tgcacgccgg acgtgacctg cggctcggag caggtgtact ggtcgctgcc 16860
cgacatgatg caagaccccg tgaccttccg ctccacgcgg caggtcagca acttcccggt 16920
ggtgggcgcc gagctgctgc ccgtgcactc caagagcttc tacaacgacc aggccgtcta 16980
ctcccagctc atccgccagt tcacctctct gacccacgtg ttcaatcgct ttcctgagaa 17040
ccagattctg gcgcgcccgc ccgcccccac catcaccacc gtcagtgaaa acgttcctgc 17100
tctcacagat cacgggacgc taccgctgcg caacagcatc ggaggagtcc agcgagtgac 17160
cgttactgac gccagacgcc gcacctgccc ctacgtttac aaggccttgg gcatagtctc 17220
gccgcgcgtc ctttccagcc gcactttttg agcaacacca ccatcatgtc catcctgatc 17280
tcacccagca ataactccgg ctggggactg ctgcgcgcgc ccagcaagat gttcggaggg 17340
gcgaggaagc gttccgagca gcaccccgtg cgcgtgcgcg ggcacttccg cgccccctgg 17400
ggagcgcaca aacgcggccg cgcggggcgc accaccgtgg acgacgccat cgactcggtg 17460
gtggagcagg cgcgcaacta caggcccgcg gtctctaccg tggacgcggc catccagacc 17520
gtggtgcggg gcgcgcggcg gtacgccaag ctgaagagcc gccggaagcg cgtggcccgc 17580
cgccaccgcc gccgacccgg ggccgccgcc aaacgcgccg ccgcggccct gcttcgccgg 17640
gccaagcgca cgggccgccg cgccgccatg agggccgcgc gccgcttggc cgccggcatc 17700
accgccgcca ccatggcccc ccgtacccga agacgcgcgg ccgccgccgc cgccgccgcc 17760
atcagtgaca tggccagcag gcgccggggc aacgtgtact gggtgcgcga ctcggtgacc 17820
ggcacgcgcg tgcccgtgcg cttccgcccc ccgcggactt gagatgatgt gaaaaaacaa 17880
cactgagtct cctgctgttg tgtgtatccc agcggcggcg gcgcgcgcag cgtcatgtcc 17940
aagcgcaaaa tcaaagaaga gatgctccag gtcgtcgcgc cggagatcta tgggcccccg 18000
aagaaggaag agcaggattc gaagccccgc aagataaagc gggtcaaaaa gaaaaagaaa 18060
gatgatgacg atgccgatgg ggaggtggag ttcctgcgcg ccacggcgcc caggcgcccg 18120
gtgcagtgga agggccggcg cgtaaagcgc gtcctgcgcc ccggcaccgc ggtggtcttc 18180
acgcccggcg agcgctccac ccggactttc aagcgcgtct atgacgaggt gtacggcgac 18240
gaagacctgc tggagcaggc caacgagcgc ttcggagagt ttgcttacgg gaagcgtcag 18300
cgggcgctgg ggaaggagga cctgctggcg ctgccgctgg accagggcaa ccccaccccc 18360
agtctgaagc ccgtgaccct gcagcaggtg ctgccgagca gcgcaccctc cgaggcgaag 18420
cggggtctga agcgcgaggg cggcgacctg gcgcccaccg tgcagctcat ggtgcccaag 18480
cggcagaggc tggaggatgt gctggagaaa atgaaagtag accccggtct gcagccggac 18540
atcagggtcc gccccatcaa gcaggtggcg ccgggcctcg gcgtgcagac cgtggacgtg 18600
gtcatcccca ccggcaactc ccccgccgcc gccaccacta ccgctgcctc cacggacatg 18660
gagacacaga ccgatcccgc cgcagccgca gccgcagccg ccgccgcgac ctcctcggcg 18720
gaggtgcaga cggacccctg gctgccgccg gcgatgtcag ctccccgcgc gcgtcgcggg 18780
cgcaggaagt acggcgccgc caacgcgctc ctgcccgagt acgccttgca tccttccatc 18840
gcgcccaccc ccggctaccg aggctatacc taccgcccgc gaagagccaa gggttccacc 18900
cgccgtcccc gccgacgcgc cgccgccacc acccgccgcc gccgccgcag acgccagccc 18960
gcactggctc cagtctccgt gaggaaagtg gcgcgcgacg gacacaccct ggtgctgccc 19020
agggcgcgct accaccccag catcgtttaa aagcctgttg tggttcttgc agatatggcc 19080
ctcacttgcc gcctccgttt cccggtgccg ggataccgag gaggaagatc gcgccgcagg 19140
aggggtctgg ccggccgcgg cctgagcgga ggcagccgcc gcgcgcaccg gcggcgacgc 19200
gccaccagcc gacgcatgcg cggcggggtg ctgcccctgt taatccccct gatcgccgcg 19260
gcgatcggcg ccgtgcccgg gatcgcctcc gtggccttgc aagcgtccca gaggcattga 19320
cagacttgca aacttgcaaa tatggaaaaa aaaaccccaa taaaaaagtc tagactctca 19380
cgctcgcttg gtcctgtgac tattttgtag aatggaagac atcaactttg cgtcgctggc 19440
cccgcgtcac ggctcgcgcc cgttcctggg acactggaac gatatcggca ccagcaacat 19500
gagcggtggc gccttcagtt ggggctctct gtggagcggc attaaaagta tcgggtctgc 19560
cgttaaaaat tacggctccc gggcctggaa cagcagcacg ggccagatgt tgagagacaa 19620
gttgaaagag cagaacttcc agcagaaggt ggtggagggc ctggcctccg gcatcaacgg 19680
ggtggtggac ctggccaacc aggccgtgca gaataagatc aacagcagac tggacccccg 19740
gccgccggtg gaggaggtgc cgccggcgct ggagacggtg tcccccgatg ggcgtggcga 19800
gaagcgcccg cggcccgata gggaagagac cactctggtc acgcagaccg atgagccgcc 19860
cccgtatgag gaggccctga agcaaggtct gcccaccacg cggcccatcg cgcccatggc 19920
caccggggtg gtgggccgcc acacccccgc cacgctggac ttgcctccgc ccgccgatgt 19980
gccgcagcag cagaaggcgg cacagccggg cccgcccgcg accgcctccc gttcctccgc 20040
cggtcctctg cgccgcgcgg ccagcggccc ccgcgggggg gtcgcgaggc acggcaactg 20100
gcagagcacg ctgaacagca tcgtgggtct gggggtgcgg tccgtgaagc gccgccgatg 20160
ctactgaata gcttagctaa cgtgttgtat gtgtgtatgc gccctatgtc gccgccagag 20220
gagctgctga gtcgccgccg ttcgcgcgcc caccaccacc gccactccgc ccctcaagat 20280
ggcgacccca tcgatgatgc cgcagtggtc gtacatgcac atctcgggcc aggacgcctc 20340
ggagtacctg agccccgggc tggtgcagtt cgcccgcgcc accgagagct acttcagcct 20400
gagtaacaag tttaggaacc ccacggtggc gcccacgcac gatgtgacca ccgaccggtc 20460
tcagcgcctg acgctgcggt tcattcccgt ggaccgcgag gacaccgcgt actcgtacaa 20520
ggcgcggttc accctggccg tgggcgacaa ccgcgtgctg gacatggcct ccacctactt 20580
tgacatccgc ggggtgctgg accggggtcc cactttcaag ccctactctg gcaccgccta 20640
caactccctg gcccccaagg gcgctcccaa ctcctgcgag tgggagcaag aggaaactca 20700
ggcagttgaa gaagcagcag aagaggaaga agaagatgct gacggtcaag ctgaggaaga 20760
gcaagcagct accaaaaaga ctcatgtata tgctcaggct cccctttctg gcgaaaaaat 20820
tagtaaagat ggtctgcaaa taggaacgga cgctacagct acagaacaaa aacctattta 20880
tgcagaccct acattccagc ccgaacccca aatcggggag tcccagtgga atgaggcaga 20940
tgctacagtc gccggcggta gagtgctaaa gaaatctact cccatgaaac catgctatgg 21000
ttcctatgca agacccacaa atgctaatgg aggtcagggt gtactaacgg caaatgccca 21060
gggacagcta gaatctcagg ttgaaatgca attcttttca acttctgaaa acgcccgtaa 21120
cgaggctaac aacattcagc ccaaattggt gctgtatagt gaggatgtgc acatggagac 21180
cccggatacg cacctttctt acaagcccgc aaaaagcgat gacaattcaa aaatcatgct 21240
gggtcagcag tccatgccca acagacctaa ttacatcggc ttcagagaca actttatcgg 21300
cctcatgtat tacaatagca ctggcaacat gggagtgctt gcaggtcagg cctctcagtt 21360
gaatgcagtg gtggacttgc aagacagaaa cacagaactg tcctaccagc tcttgcttga 21420
ttccatgggt gacagaacca gatacttttc catgtggaat caggcagtgg acagttatga 21480
cccagatgtt agaattattg aaaatcatgg aactgaagac gagctcccca actattgttt 21540
ccctctgggt ggcatagggg taactgacac ttaccaggct gttaaaacca acaatggcaa 21600
taacgggggc caggtgactt ggacaaaaga tgaaactttt gcagatcgca atgaaatagg 21660
ggtgggaaac aatttcgcta tggagatcaa cctcagtgcc aacctgtgga gaaacttcct 21720
gtactccaac gtggcgctgt acctaccaga caagcttaag tacaacccct ccaatgtgga 21780
catctctgac aaccccaaca cctacgatta catgaacaag cgagtggtgg ccccggggct 21840
ggtggactgc tacatcaacc tgggcgcgcg ctggtcgctg gactacatgg acaacgtcaa 21900
ccccttcaac caccaccgca atgcgggcct gcgctaccgc tccatgctcc tgggcaacgg 21960
gcgctacgtg cccttccaca tccaggtgcc ccagaagttc tttgccatca agaacctcct 22020
cctcctgccg ggctcctaca cctacgagtg gaacttcagg aaggatgtca acatggtcct 22080
ccagagctct ctgggtaacg atctcagggt ggacggggcc agcatcaagt tcgagagcat 22140
ctgcctctac gccaccttct tccccatggc ccacaacacg gcctccacgc tcgaggccat 22200
gctcaggaac gacaccaacg accagtcctt caatgactac ctctccgccg ccaacatgct 22260
ctaccccata cccgccaacg ccaccaacgt ccccatctcc atcccctcgc gcaactgggc 22320
ggccttccgc ggctgggcct tcacccgcct caagaccaag gagaccccct ccctgggctc 22380
gggattcgac ccctactaca cctactcggg ctccattccc tacctggacg gcaccttcta 22440
cctcaaccac actttcaaga aggtctcggt caccttcgac tcctcggtca gctggccggg 22500
caacgaccgt ctgctcaccc ccaacgagtt cgagatcaag cgctcggtcg acggggaggg 22560
ctacaacgtg gcccagtgca acatgaccaa ggactggttc ctggtccaga tgctggccaa 22620
ctacaacatc ggctaccagg gcttctacat cccagagagc tacaaggaca ggatgtactc 22680
cttcttcagg aacttccagc ccatgagccg gcaggtggtg gaccagacca agtacaagga 22740
ctaccaggag gtgggcatca tccaccagca caacaactcg ggcttcgtgg gctacctcgc 22800
ccccaccatg cgcgagggac aggcctaccc cgccaacttc ccctatccgc tcataggcaa 22860
gaccgcggtc gacagcatca cccagaaaaa gttcctctgc gaccgcaccc tctggcgcat 22920
ccccttctcc agcaacttca tgtccatggg tgcgctctcg gacctgggcc agaacttgct 22980
ctacgccaac tccgcccacg ccctcgacat gaccttcgag gtcgacccca tggacgagcc 23040
cacccttctc tatgttctgt tcgaagtctt tgacgtggtc cgggtccacc agccgcaccg 23100
cggcgtcatc gagaccgtgt acctgcgtac gcccttctcg gccggcaacg ccaccaccta 23160
aagaagcaag ccgcagtcat cgccgcctgc atgccgtcgg gttccaccga gcaagagctc 23220
agggccatcg tcagagacct gggatgcggg ccctattttt tgggcacctt cgacaagcgc 23280
ttccctggct ttgtctcccc acacaagctg gcctgcgcca tcgtcaacac ggccggccgc 23340
gagaccgggg gcgtgcactg gctggccttc gcctggaacc cgcgctccaa aacatgcttc 23400
ctctttgacc ccttcggctt ttcggaccag cggctcaagc aaatctacga gttcgagtac 23460
gagggcttgc tgcgtcgcag cgccatcgcc tcctcgcccg accgctgcgt caccctcgaa 23520
aagtccaccc agaccgtgca ggggcccgac tcggccgcct gcggtctctt ctgctgcatg 23580
tttctgcacg cctttgtgca ctggcctcag agtcccatgg accgcaaccc caccatgaac 23640
ttgctgacgg gggtgcccaa ctccatgctc cagagccccc aggtcgagcc caccctgcgc 23700
cgcaaccagg agcagctcta cagcttcctg gagcgccact cgccttactt ccgccgccac 23760
agcgcacaga tcaggagggc cacctccttc tgccacttgc aagagatgca agaagggtaa 23820
taacgatgta cacacttttt ttctcaataa atggcatctt tttatttata caagctctct 23880
ggggtattca tttcccacca ccacccgccg ttgtcgccat ctggctctat ttagaaatcg 23940
aaagggttct gccgggagtc gccgtgcgcc acgggcaggg acacgttgcg atactggtag 24000
cgggtgcccc acttgaactc gggcaccacc aggcgaggca gctcggggaa gttttcgctc 24060
cacaggctgc gggtcagcac cagcgcgttc atcaggtcgg gcgccgagat cttgaagtcg 24120
cagttggggc cgccgccctg cgcgcgcgag ttgcggtaca ccgggttgca gcactggaac 24180
accaacagcg ccgggtgctt cacgctggcc agcacgctgc ggtcggagat cagctcggcg 24240
tccaggtcct ccgcgttgct cagcgcgaac ggggtcatct tgggcacttg ccgccccagg 24300
aagggcgcgt gccccggttt cgagttgcag tcgcagcgca gcgggatcag caggtgcccg 24360
tgcccggact cggcgttggg gtacagcgcg cgcatgaagg cctgcatctg gcggaaggcc 24420
atctgggcct tggcgccctc cgagaagaac atgccgcagg acttgcccga gaactggttt 24480
gcggggcagc tggcgtcgtg caggcagcag cgcgcgtcgg tgttggcgat ctgcaccacg 24540
ttgcgccccc accggttctt cacgatcttg gccttggacg attgctcctt cagcgcgcgc 24600
tgcccgttct cgctggtcac atccatctcg atcacatgtt ccttgttcac catgctgctg 24660
ccgtgcagac acttcagctc gccctccgtc tcggtgcagc ggtgctgcca cagcgcgcag 24720
cccgtgggct cgaaagactt gtaggtcacc tccgcgaagg actgcaggta cccctgcaaa 24780
aagcggccca tcatggtcac gaaggtcttg ttgctgctga aggtcagctg cagcccgcgg 24840
tgctcctcgt tcagccaggt cttgcacacg gccgccagcg cctccacctg gtcgggcagc 24900
atcttgaagt tcaccttcag ctcattctcc acgtggtact tgtccatcag cgtgcgcgcc 24960
gcctccatgc ccttctccca ggccgacacc agcggcaggc tcacggggtt cttcaccatc 25020
accgtggccg ccgcctccgc cgcgctttcg ctttccgccc cgctgttctc ttcctcttcc 25080
tcctcttcct cgccgccgcc cactcgcagc ccccgcacca cggggtcgtc ttcctgcagg 25140
cgctgcacct tgcgcttgcc gttgcgcccc tgcttgatgc gcacgggcgg gttgctgaag 25200
cccaccatca ccagcgcggc ctcttcttgc tcgtcctcgc tgtccagaat gacctccggg 25260
gagggggggt tggtcatcct cagtaccgag gcacgcttct ttttcttcct gggggcgttc 25320
gccagctccg cggctgcggc cgctgccgag gtcgaaggcc gagggctggg cgtgcgcggc 25380
accagcgcgt cctgcgagcc gtcctcgtcc tcctcggact cgagacggag gcgggcccgc 25440
ttcttcgggg gcgcgcgggg cggcggaggc ggcggcggcg acggagacgg ggacgagaca 25500
tcgtccaggg tgggtggacg gcgggccgcg ccgcgtccgc gctcgggggt ggtctcgcgc 25560
tggtcctctt cccgactggc catctcccac tgctccttct cctataggca gaaagagatc 25620
atggagtctc tcatgcgagt cgagaaggag gaggacagcc taaccgcccc ctctgagccc 25680
tccaccaccg ccgccaccac cgccaatgcc gccgcggacg acgcgcccac cgagaccacc 25740
gccagtacca ccctccccag cgacgcaccc ccgctcgaga atgaagtgct gatcgagcag 25800
gacccgggtt ttgtgagcgg agaggaggat gaggtggatg agaaggagaa ggaggaggtc 25860
gccgcctcag tgccaaaaga ggataaaaag caagaccagg acgacgcaga taaggatgag 25920
acagcagtcg ggcgggggaa cggaagccat gatgctgatg acggctacct agacgtggga 25980
gacgacgtgc tgcttaagca cctgcaccgc cagtgcgtca tcgtctgcga cgcgctgcag 26040
gagcgctgcg aagtgcccct ggacgtggcg gaggtcagcc gcgcctacga gcggcacctc 26100
ttcgcgccgc acgtgccccc caagcgccgg gagaacggca cctgcgagcc caacccgcgt 26160
ctcaacttct acccggtctt cgcggtaccc gaggtgctgg ccacctacca catctttttc 26220
caaaactgca agatccccct ctcctgccgc gccaaccgca cccgcgccga caaaaccctg 26280
accctgcggc agggcgccca catacctgat atcgcctctc tggaggaagt gcccaagatc 26340
ttcgagggtc tcggtcgcga cgagaaacgg gcggcgaacg ctctgcacgg agacagcgaa 26400
aacgagagtc actcgggggt gctggtggag ctcgagggcg acaacgcgcg cctggccgta 26460
ctcaagcgca gcatagaggt cacccacttt gcctacccgg cgctcaacct gccccccaag 26520
gtcatgagtg tggtcatggg cgagctcatc atgcgccgcg cccagcccct ggccgcggat 26580
gcaaacttgc aagagtcctc cgaggaaggc ctgcccgcgg tcagcgacga gcagctggcg 26640
cgctggctgg agacccgcga ccccgcgcag ctggaggagc ggcgcaagct catgatggcc 26700
gcggtgctgg tcaccgtgga gctcgagtgt ctgcagcgct tcttcgcgga ccccgagatg 26760
cagcgcaagc tcgaggagac cctgcactac accttccgcc agggctacgt gcgccaggcc 26820
tgcaagatct ccaacgtgga gctctgcaac ctggtctcct acctgggcat cctgcacgag 26880
aaccgcctcg ggcagaacgt cctgcactcc accctcaaag gggaggcgcg ccgcgactac 26940
atccgcgact gcgcctacct cttcctctgc tacacctggc agacggccat gggggtctgg 27000
cagcagtgcc tggaggagcg caacctcaag gagctggaaa agctcctcaa gcgcaccctc 27060
agggacctct ggacgggctt caacgagcgc tcggtggccg ccgcgctggc ggacatcatc 27120
tttcccgagc gcctgctcaa gaccctgcag cagggcctgc ccgacttcac cagccagagc 27180
atgctgcaga acttcaggac tttcatcctg gagcgctcgg gcatcctgcc ggccacttgc 27240
tgcgcgctgc ccagcgactt cgtgcccatc aagtacaggg agtgcccgcc gccgctctgg 27300
ggccactgct acctcttcca gctggccaac tacctcgcct accactcgga cctcatggaa 27360
gacgtgagcg gcgagggcct gctcgagtgc cactgccgct gcaacctctg cacgccccac 27420
cgctctctag tctgcaaccc gcagctgctc agcgagagtc agattatcgg taccttcgag 27480
ctgcagggtc cctcgcctga cgagaagtcc gcggctccag ggctgaaact cactccgggg 27540
ctgtggactt ccgcctacct acgcaaattt gtacctgagg actaccacgc ccacgagatc 27600
aggttctacg aagaccaatc ccgcccgccc aaggcggagc tcaccgcctg cgtcatcacc 27660
caggggcaca tcctgggcca attgcaagcc atcaacaaag cccgccgaga gttcttgctg 27720
aaaaagggtc ggggggtgta cctggacccc cagtccggcg aggagctaaa cccgctaccc 27780
ccgccgccgc cccagcagcg ggaccttgct tcccaggatg gcacccagaa agaagcagca 27840
gccgccgccg ccgccgcagc catacatgct tctggaggaa gaggaggagg actgggacag 27900
tcaggcagag gaggtttcgg acgaggagca ggaggagatg atggaagact gggaggagga 27960
cagcagccta gacgaggaag cttcagaggc cgaagaggtg gcagacgcaa caccatcgcc 28020
ctcggtcgca gccccctcgc cggggcccct gaaatcctcc gaacccagca ccagcgctat 28080
aacctccgct cctccggcgc cggcgccacc cgcccgcaga cccaaccgta gatgggacac 28140
cacaggaacc ggggtcggta agtccaagtg cccgccgccg ccaccgcagc agcagcagca 28200
gcagcgccag ggctaccgct cgtggcgcgg gcacaagaac gccatagtcg cctgcttgca 28260
agactgcggg ggcaacatct ctttcgcccg ccgcttcctg ctattccacc acggggtcgc 28320
ctttccccgc aatgtcctgc attactaccg tcatctctac agcccctact gcagcggcga 28380
cccagaggcg gcagcggcag ccacagcggc gaccaccacc taggaagata tcctccgcgg 28440
gcaagacagc ggcagcagcg gccaggagac ccgcggcagc agcggcggga gcggtgggcg 28500
cactgcgcct ctcgcccaac gaacccctct cgacccggga gctcagacac aggatcttcc 28560
ccactttgta tgccatcttc caacagagca gaggccagga gcaggagctg aaaataaaaa 28620
acagatctct gcgctccctc acccgcagct gtctgtatca caaaagcgaa gatcagcttc 28680
ggcgcacgct ggaggacgcg gaggcactct tcagcaaata ctgcgcgctc actcttaaag 28740
actagctccg cgcccttctc gaatttaggc gggagaaaac tacgtcatcg ccggccgccg 28800
cccagcccgc ccagccgaga tgagcaaaga gattcccacg ccatacatgt ggagctacca 28860
gccgcagatg ggactcgcgg cgggagcggc ccaggactac tccacccgca tgaactacat 28920
gagcgcggga ccccacatga tctcacaggt caacgggatc cgcgcccagc gaaaccaaat 28980
actgctggaa caggcggcca tcaccgccac gccccgccat aatctcaacc cccgaaattg 29040
gcccgccgcc ctcgtgtacc aggaaacccc ctccgccacc accgtactac ttccgcgtga 29100
cgcccaggcc gaagtccaga tgactaactc aggggcgcag ctcgcgggcg gctttcgtca 29160
cggggcgcgg ccgctccgac caggtataag acacctgatg atcagaggcc gaggtatcca 29220
gctcaacgac gagtcggtga gctcttcgct cggtctccgt ccggacggaa ctttccagct 29280
cgccggatcc ggccgctctt cgttcacgcc ccgccaggcg tacctgactc tgcagacctc 29340
gtcctcggag ccccgctccg gcggcatcgg aaccctccag ttcgtggagg agttcgtgcc 29400
ctcggtctac ttcaacccct tctcgggacc tcccggacgc taccccgacc agttcattcc 29460
gaactttgac gcggtgaagg actcggcgga cggctacgac tgaatgtcag gtgtcgaggc 29520
agagcagctt cgcctgagac acctcgagca ctgccgccgc cacaagtgct tcgcccgcgg 29580
ttctggtgag ttctgctact ttcagctacc cgaggagcat accgaggggc cggcgcacgg 29640
cgtccgcctg accacccagg gcgaggttac ctgttccctc atccgggagt ttaccctccg 29700
tcccctgcta gtggagcggg agcggggtcc ctgtgtccta actatcgcct gcaactgccc 29760
taaccctgga ttacatcaag atctttgctg tcatctctgt gctgagttta ataaacgctg 29820
agatcagaat ctactggggc tcctgtcgcc atcctgtgaa cgccaccgtc ttcacccacc 29880
ccgaccaggc ccaggcgaac ctcacctgcg gtctgcatcg gagggccaag aagtacctca 29940
cctggtactt caacggcacc ccctttgtgg tttacaacag cttcgacggg gacggagtct 30000
ccctgaaaga ccagctctcc ggtctcagct actccatcca caagaacacc accctccaac 30060
tcttccctcc ctacctgccg ggaacctacg agtgcgtcac cggccgctgc acccacctca 30120
cccgcctgat cgtaaaccag agctttccgg gaacagataa ctccctcttc cccagaacag 30180
gaggtgagct caggaaactc cccggggacc agggcggaga cgtaccttcg acccttgtgg 30240
ggttaggatt ttttattacc gggttgctgg ctcttttaat caaagtttcc ttgagatttg 30300
ttctttcctt ctacgtgtat gaacacctca acctccaata actctaccct ttcttcggaa 30360
tcaggtgact tctctgaaat cgggcttggt gtgctgctta ctctgttgat ttttttcctt 30420
atcatactca gccttctgtg cctcaggctc gccgcctgct gcgcacacat ctatatctac 30480
tgctggttgc tcaagtgcag gggtcgccac ccaagatgaa caggtacatg gtcctatcga 30540
tcctaggcct gctggccctg gcggcctgca gcgccgccaa aaaagagatt acctttgagg 30600
agcccgcttg caatgtaact ttcaagcccg agggtgacca atgcaccacc ctcgtcaaat 30660
gcgttaccaa tcatgagagg ctgcgcatcg actacaaaaa caaaactggc cagtttgcgg 30720
tctatagtgt gtttacgccc ggagacccct ctaactactc tgtcaccgtc ttccagggcg 30780
gacagtctaa gatattcaat tacactttcc ctttttatga gttatgcgat gcggtcatgt 30840
acatgtcaaa acagtacaac ctgtggcctc cctctcccca ggcgtgtgtg gaaaatactg 30900
ggtcttactg ctgtatggct ttcgcaatca ctacgctcgc tctaatctgc acggtgctat 30960
acataaaatt caggcagagg cgaatcttta tcgatgaaaa gaaaatgcct tgatcgctaa 31020
caccggcttt ctatctgcag aatgaatgca atcacctccc tactaatcac caccaccctc 31080
cttgcgattg cccatgggtt gacacgaatc gaagtgccag tggggtccaa tgtcaccatg 31140
gtgggccccg ccggcaattc caccctcatg tgggaaaaat ttgtccgcaa tcaatgggtt 31200
catttctgct ctaaccgaat cagtatcaag cccagagcca tctgcgatgg gcaaaatcta 31260
actctgatca atgtgcaaat gatggatgct gggtactatt acgggcagcg gggagaaatc 31320
attaattact ggcgacccca caaggactac atgctgcatg tagtcgaggc acttcccact 31380
accaccccca ctaccacctc tcccaccacc accaccacta ctactactac tactactact 31440
actactacta ccactaccgc tgcccgccat acccgcaaaa gcaccatgat tagcacaaag 31500
ccccctcgtg ctcactccca cgccggcggg cccatcggtg cgacctcaga aaccaccgag 31560
ctttgcttct gccaatgcac taacgccagc gctcatgaac tgttcgacct ggagaatgag 31620
gatgtccagc agagctccgc ttgcctgacc caggaggctg tggagcccgt tgccctgaag 31680
cagatcggtg attcaataat tgactcttct tcttttgcca ctcccgaata ccctcccgat 31740
tctactttcc acatcacggg taccaaagac cctaacctct ctttctacct gatgctgctg 31800
ctctgtatct ctgtggtctc ttccgcgctg atgttactgg ggatgttctg ctgcctgatc 31860
tgccgcagaa agagaaaagc tcgctctcag ggccaaccac tgatgccctt cccctacccc 31920
ccggattttg cagataacaa gatatgagct cgctgctgac actaaccgct ttactagcct 31980
gcgctctaac ccttgtcgct tgcgactcga gattccacaa tgtcacagct gtggcaggag 32040
aaaatgttac tttcaactcc acggccgata cccagtggtc gtggagtggc tcaggtagct 32100
acttaactat ctgcaatagc tccacttccc ccggcatatc cccaaccaag taccaatgca 32160
atgccagcct gttcaccctc atcaacgctt ccaccctgga caatggactc tatgtaggct 32220
atgtaccctt tggtgggcaa ggaaagaccc acgcttacaa cctggaagtt cgccagccca 32280
gaaccactac ccaagcttct cccaccacca ccaccaccac caccatcacc agcagcagca 32340
gcagcagcag ccacagcagc agcagcagat tattgacttt ggttttggcc agctcatctg 32400
ccgctaccca ggccatctac agctctgtgc ccgaaaccac tcagatccac cgcccagaaa 32460
cgaccaccgc caccacccta cacacctcca gcgatcagat gccgaccaac atcaccccct 32520
tggctcttca aatgggactt acaagcccca ctccaaaacc agtggatgcg gccgaggtct 32580
ccgccctcgt caatgactgg gcggggctgg gaatgtggtg gttcgccata ggcatgatgg 32640
cgctctgcct gcttctgctc tggctcatct gctgcctcca ccgcaggcga gccagacccc 32700
ccatctatag acccatcatt gtcctgaacc ccgataatga tgggatccat agattggatg 32760
gcctgaaaaa cctacttttt tcttttacag tatgataaat tgagacatgc ctcgcatttt 32820
cttgtacatg ttccttctcc caccttttct ggggtgttct acgctggccg ctgtgtctca 32880
cctggaggta gactgcctct cacccttcac tgtctacctg ctttacggat tggtcaccct 32940
cactctcatc tgcagcctaa tcacagtaat catcgccttc atccagtgca ttgattacat 33000
ctgtgtgcgc ctcgcatact tcagacacca cccgcagtac cgagacagga acattgccca 33060
acttctaaga ctgctctaat catgcataag actgtgatct gccttctgat cctctgcatc 33120
ctgcccaccc tcacctcctg ccagtacacc acaaaatctc cgcgcaaaag acatgcctcc 33180
tgccgcttca cccaactgtg gaatataccc aaatgctaca acgaaaagag cgagctctcc 33240
gaagcttggc tgtatggggt catctgtgtc ttagttttct gcagcactgt ctttgccctc 33300
ataatctacc cctactttga tttgggatgg aacgcgatcg atgccatgaa ttaccccacc 33360
tttcccgcac ccgagataat tccactgcga caagttgtac ccgttgtcgt taatcaacgc 33420
cccccatccc ctacgcccac tgaaatcagc tactttaacc taacaggcgg agatgactga 33480
cgccctagat ctagaaatgg acggcatcag taccgagcag cgtctcctag agaggcgcag 33540
gcaggcggct gagcaagagc gcctcaatca ggagctccga gatctcgtta acctgcacca 33600
gtgcaaaaga ggcatctttt gtctggtaaa gcaggccaaa gtcacctacg agaagaccgg 33660
caacagccac cgcctcagtt acaaattgcc cacccagcgc cagaagctgg tgctcatggt 33720
gggtgagaat cccatcaccg tcacccagca ctcggtagag accgaggggt gtctgcactc 33780
cccctgtcgg ggtccagaag acctctgcac cctggtaaag accctgtgcg gtctcagaga 33840
tttagtcccc tttaactaat caaacactgg aatcaataaa aagaatcact tacttaaaat 33900
cagacagcag gtctctgtcc agtttattca gcagcacctc cttcccctcc tcccaactct 33960
ggtactccaa acgccttctg gcggcaaact tcctccacac cctgaaggga atgtcagatt 34020
cttgctcctg tccctccgca cccactatct tcatgttgtt gcagatgaag cgcaccaaaa 34080
cgtctgacga gagcttcaac cccgtgtacc cctatgacac ggaaagcggc cctccctccg 34140
tccctttcct cacccctccc ttcgtgtctc ccgatggatt ccaagaaagt ccccccgggg 34200
tcctgtctct gaacctggcc gagcccctgg tcacttccca cggcatgctc gccctgaaaa 34260
tgggaagtgg cctctccctg gacgacgctg gcaacctcac ctctcaagat atcaccaccg 34320
ctagccctcc cctcaaaaaa accaagacca acctcagcct agaaacctca tcccccctaa 34380
ctgtgagcac ctcaggcgcc ctcaccgtag cagccgccgc tcccctggcg gtggccggca 34440
cctccctcac catgcaatca gaggcccccc tgacagtaca ggatgcaaaa ctcaccctgg 34500
ccaccaaagg ccccctgacc gtgtctgaag gcaaactggc cttgcaaaca tcggccccgc 34560
tgacggccgc tgacagcagc accctcacag tcagtgccac accacccctt agcacaagca 34620
atggcagctt gggtattgac atgcaagccc ccatttacac caccaatgga aaactaggac 34680
ttaactttgg cgctcccctg catgtggtag acagcctaaa tgcactgact gtagttactg 34740
gccaaggtct tacgataaac ggaacagccc tacaaactag agtctcaggt gccctcaact 34800
atgacacatc aggaaaccta gaattgagag ctgcaggggg tatgcgagtt gatgcaaatg 34860
gtcaacttat ccttgatgta gcttacccat ttgatgcaca aaacaatctc agccttaggc 34920
ttggacaggg acccctgttt gttaactctg cccacaactt ggatgttaac tacaacagag 34980
gcctctacct gttcacatct ggaaatacca aaaagctaga agttaatatc aaaacagcca 35040
agggtctcat ttatgatgac actgctatag caatcaatgc gggtgatggg ctacagtttg 35100
actcaggctc agatacaaat ccattaaaaa ctaaacttgg attaggactg gattatgact 35160
ccagcagagc cataattgct aaactgggaa ctggcctaag ctttgacaac acaggtgcca 35220
tcacagtagg caacaaaaat gatgacaagc ttaccttgtg gaccacacca gacccatccc 35280
ctaactgtag aatctattca gagaaagatg ctaaattcac acttgttttg actaaatgcg 35340
gcagtcaggt gttggccagc gtttctgttt tatctgtaaa aggtagcctt gcgcccatca 35400
gtggcacagt aactagtgct cagattgtcc tcagatttga tgaaaatgga gttctactaa 35460
gcaattcttc ccttgaccct caatactgga actacagaaa aggtgacctt acagagggca 35520
ctgcatatac caacgcagtg ggatttatgc ccaacctcac agcataccca aaaacacaga 35580
gccaaactgc taaaagcaac attgtaagtc aggtttactt gaatggggac aaatccaaac 35640
ccatgaccct caccattacc ctcaatggaa ctaatgaaac aggagatgcc acagtaagca 35700
cttactccat gtcattctca tggaactgga atggaagtaa ttacattaat gaaacgttcc 35760
aaaccaactc cttcaccttc tcctacatcg cccaagaata aaaagcatga cgctgttgat 35820
ttgattcaat gtgtttctgt tttattttca agcacaacaa aatcattcaa gtcattcttc 35880
catcttagct taatagacac agtagcttaa tagacccagt agtgcaaagc cccattctag 35940
cttataacta gtggagaagt actcgcctac atgggggtag agtcataatc gtgcatcagg 36000
atagggcggt ggtgctgcag cagcgcgcga ataaactgct gccgccgccg ctccgtcctg 36060
caggaataca acatggcagt ggtctcctca gcgatgattc gcaccgcccg cagcataagg 36120
cgccttgtcc tccgggcaca gcagcgcacc ctgatctcac ttaaatcagc acagtaactg 36180
cagcacagca ccacaatatt gttcaaaatc ccacagtgca aggcgctgta tccaaagctc 36240
atggcgggga ccacagaacc cacgtggcca tcataccaca agcgcaggta gattaagtgg 36300
cgacccctca taaacacgct ggacataaac attacctctt ttggcatgtt gtaattcacc 36360
acctcccggt accatataaa cctctgatta aacatggcgc catccaccac catcctaaac 36420
cagctggcca aaacctgccc gccggctata cactgcaggg aaccgggact ggaacaatga 36480
cagtggagag cccaggactc gtaaccatgg atcatcatgc tcgtcatgat atcaatgttg 36540
gcacaacaca ggcacacgtg catacacttc ctcaggatta caagctcctc ccgcgttaga 36600
accatatccc agggaacaac ccattcctga atcagcgtaa atcccacact gcagggaaga 36660
cctcgcacgt aactcacgtt gtgcattgtc aaagtgttac attcgggcag cagcggatga 36720
tcctccagta tggtagcgcg ggtttctgtc tcaaaaggag gtagacgatc cctactgtac 36780
ggagtgcgcc gagacaaccg agatcgtgtt ggtcgtagtg tcatgccaaa tggaacgccg 36840
gacgtagtca tatttcctga agtcttagat ctctcaacgc agcaccagca ccaacacttc 36900
gcagtgtaaa aggccaagtg ccgagagagt atatatagga ataaaaagtg acgtaaacgg 36960
gcaaagtcca aaaaacgccc agaaaaaccg cacgcgaacc tacgccccga aacgaaagcc 37020
aaaaaacact agacactccc ttccggcgtc aacttccgct ttcccacgct acgtcacttg 37080
ccccagtcaa acaaactaca tatcccgaac ttccaagtcg ccacgcccaa aacaccgcct 37140
acacctcccc gcccgccggc ccgcccccaa acccgcctcc cgccccgcgc cccgccccgc 37200
gccgcccatc tcattatcat attggcttca atccaaaata aggtatatta ttgatgatgg 37260
tttaaacgga tcctctagag tcgacctgca ggcatgcaag cttgagtata acccccttgc 37320
ggccgcccgg gccgtcgacc aattctcatg tttgacagct tatcatcgaa tttctgccat 37380
tcatccgctt attatcactt attcaggcgt agcaaccagg cgtttaaggg caccaataac 37440
tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt aattcattaa 37500
gcattctgcc gacatggaag ccatcacaaa cggcatgatg aacctgaatc gccagcggca 37560
tcagcacctt gtcgccttgc gtataatatt tgcccatggt gaaaacgggg gcgaagaagt 37620
tgtccatatt ggccacgttt aaatcaaaac tggtgaaact cacccaggga ttggctgaga 37680
cgaaaaacat attctcaata aaccctttag ggaaataggc caggttttca ccgtaacacg 37740
ccacatcttg cgaatatatg tgtagaaact gccggaaatc gtcgtggtat tcactccaga 37800
gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta acaagggtga acactatccc 37860
atatcaccag ctcaccgtct ttcattgcca tacggaattc cggatgagca ttcatcaggc 37920
gggcaagaat gtgaataaag gccggataaa acttgtgctt atttttcttt acggtcttta 37980
aaaaggccgt aatatccagc tgaacggtct ggttataggt acattgagca actgactgaa 38040
atgcctcaaa atgttcttta cgatgccatt gggatatatc aacggtggta tatccagtga 38100
tttttttctc cattttagct tccttagctc ctgaaaatct cgataactca aaaaatacgc 38160
ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt 38220
ctcattttcg ccaaaagttg gcccagggct tcccggtatc aacagggaca ccaggattta 38280
tttattctgc gaagtgatct tccgtcacag gtatttattc gcgataagct catggagcgg 38340
cgtaaccgtc gcacaggaag gacagagaaa gcgcggatct gggaagtgac ggacagaacg 38400
gtcaggacct ggattgggga ggcggttgcc gccgctgctg ctgacggtgt gacgttctct 38460
gttccggtca caccacatac gttccgccat tcctatgcga tgcacatgct gtatgccggt 38520
ataccgctga aagttctgca aagcctgatg ggacataagt ccatcagttc aacggaagtc 38580
tacacgaagg tttttgcgct ggatgtggct gcccggcacc gggtgcagtt tgcgatgccg 38640
gagtctgatg cggttgcgat gctgaaacaa ttatcctgag aataaatgcc ttggccttta 38700
tatggaaatg tggaactgag tggatatgct gtttttgtct gttaaacaga gaagctggct 38760
gttatccact gagaagcgaa cgaaacagtc gggaaaatct cccattatcg tagagatccg 38820
cattattaat ctcaggagcc tgtgtagcgt ttataggaag tagtgttctg tcatgatgcc 38880
tgcaagcggt aacgaaaacg atttgaatat gccttcagga acaatagaaa tcttcgtgcg 38940
gtgttacgtt gaagtggagc ggattatgtc agcaatggac agaacaacct aatgaacaca 39000
gaaccatgat gtggtctgtc cttttacagc cagtagtgct cgccgcagtc gagcgacagg 39060
gcgaagccct cgagtgagcg aggaagcacc agggaacagc acttatatat tctgcttaca 39120
cacgatgcct gaaaaaactt cccttggggt tatccactta tccacgggga tatttttata 39180
attatttttt ttatagtttt tagatcttct tttttagagc gccttgtagg cctttatcca 39240
tgctggttct agagaaggtg ttgtgacaaa ttgccctttc agtgtgacaa atcaccctca 39300
aatgacagtc ctgtctgtga caaattgccc ttaaccctgt gacaaattgc cctcagaaga 39360
agctgttttt tcacaaagtt atccctgctt attgactctt ttttatttag tgtgacaatc 39420
taaaaacttg tcacacttca catggatctg tcatggcgga aacagcggtt atcaatcaca 39480
agaaacgtaa aaatagcccg cgaatcgtcc agtcaaacga cctcactgag gcggcatata 39540
gtctctcccg ggatcaaaaa cgtatgctgt atctgttcgt tgaccagatc agaaaatctg 39600
atggcaccct acaggaacat gacggtatct gcgagatcca tgttgctaaa tatgctgaaa 39660
tattcggatt gacctctgcg gaagccagta aggatatacg gcaggcattg aagagtttcg 39720
cggggaagga agtggttttt tatcgccctg aagaggatgc cggcgatgaa aaaggctatg 39780
aatcttttcc ttggtttatc aaacgtgcgc acagtccatc cagagggctt tacagtgtac 39840
atatcaaccc atatctcatt cccttcttta tcgggttaca gaaccggttt acgcagtttc 39900
ggcttagtga aacaaaagaa atcaccaatc cgtatgccat gcgtttatac gaatccctgt 39960
gtcagtatcg taagccggat ggctcaggca tcgtctctct gaaaatcgac tggatcatag 40020
agcgttacca gctgcctcaa agttaccagc gtatgcctga cttccgccgc cgcttcctgc 40080
aggtctgtgt taatgagatc aacagcagaa ctccaatgcg cctctcatac attgagaaaa 40140
agaaaggccg ccagacgact catatcgtat tttccttccg cgatatcact tccatgacga 40200
caggatagtc tgagggttat ctgtcacaga tttgagggtg gttcgtcaca tttgttctga 40260
cctactgagg gtaatttgtc acagttttgc tgtttccttc agcctgcatg gattttctca 40320
tactttttga actgtaattt ttaaggaagc caaatttgag ggcagtttgt cacagttgat 40380
ttccttctct ttcccttcgt catgtgacct gatatcgggg gttagttcgt catcattgat 40440
gagggttgat tatcacagtt tattactctg aattggctat ccgcgtgtgt acctctacct 40500
ggagtttttc ccacggtgga tatttcttct tgcgctgagc gtaagagcta tctgacagaa 40560
cagttcttct ttgcttcctc gccagttcgc tcgctatgct cggttacacg gctgcggcga 40620
gcgctagtga taataagtga ctgaggtatg tgctcttctt atctcctttt gtagtgttgc 40680
tcttatttta aacaactttg cggttttttg atgactttgc gattttgttg ttgctttgca 40740
gtaaattgca agatttaata aaaaaacgca aagcaatgat taaaggatgt tcagaatgaa 40800
actcatggaa acacttaacc agtgcataaa cgctggtcat gaaatgacga aggctatcgc 40860
cattgcacag tttaatgatg acagcccgga agcgaggaaa ataacccggc gctggagaat 40920
aggtgaagca gcggatttag ttggggtttc ttctcaggct atcagagatg ccgagaaagc 40980
agggcgacta ccgcacccgg atatggaaat tcgaggacgg gttgagcaac gtgttggtta 41040
tacaattgaa caaattaatc atatgcgtga tgtgtttggt acgcgattgc gacgtgctga 41100
agacgtattt ccaccggtga tcggggttgc tgcccataaa ggtggcgttt acaaaacctc 41160
agtttctgtt catcttgctc aggatctggc tctgaagggg ctacgtgttt tgctcgtgga 41220
aggtaacgac ccccagggaa cagcctcaat gtatcacgga tgggtaccag atcttcatat 41280
tcatgcagaa gacactctcc tgcctttcta tcttggggaa aaggacgatg tcacttatgc 41340
aataaagccc acttgctggc cggggcttga cattattcct tcctgtctgg ctctgcaccg 41400
tattgaaact gagttaatgg gcaaatttga tgaaggtaaa ctgcccaccg atccacacct 41460
gatgctccga ctggccattg aaactgttgc tcatgactat gatgtcatag ttattgacag 41520
cgcgcctaac ctgggtatcg gcacgattaa tgtcgtatgt gctgctgatg tgctgattgt 41580
tcccacgcct gctgagttgt ttgactacac ctccgcactg cagtttttcg atatgcttcg 41640
tgatctgctc aagaacgttg atcttaaagg gttcgagcct gatgtacgta ttttgcttac 41700
caaatacagc aatagtaatg gctctcagtc cccgtggatg gaggagcaaa ttcgggatgc 41760
ctggggaagc atggttctaa aaaatgttgt acgtgaaacg gatgaagttg gtaaaggtca 41820
gatccggatg agaactgttt ttgaacaggc cattgatcaa cgctcttcaa ctggtgcctg 41880
gagaaatgct ctttctattt gggaacctgt ctgcaatgaa attttcgatc gtctgattaa 41940
accacgctgg gagattagat aatgaagcgt gcgcctgtta ttccaaaaca tacgctcaat 42000
actcaaccgg ttgaagatac ttcgttatcg acaccagctg ccccgatggt ggattcgtta 42060
attgcgcgcg taggagtaat ggctcgcggt aatgccatta ctttgcctgt atgtggtcgg 42120
gatgtgaagt ttactcttga agtgctccgg ggtgatagtg ttgagaagac ctctcgggta 42180
tggtcaggta atgaacgtga ccaggagctg cttactgagg acgcactgga tgatctcatc 42240
ccttcttttc tactgactgg tcaacagaca ccggcgttcg gtcgaagagt atctggtgtc 42300
atagaaattg ccgatgggag tcgccgtcgt aaagctgctg cacttaccga aagtgattat 42360
cgtgttctgg ttggcgagct ggatgatgag cagatggctg cattatccag attgggtaac 42420
gattatcgcc caacaagtgc ttatgaacgt ggtcagcgtt atgcaagccg attgcagaat 42480
gaatttgctg gaaatatttc tgcgctggct gatgcggaaa atatttcacg taagattatt 42540
acccgctgta tcaacaccgc caaattgcct aaatcagttg ttgctctttt ttctcacccc 42600
ggtgaactat ctgcccggtc aggtgatgca cttcaaaaag cctttacaga taaagaggaa 42660
ttacttaagc agcaggcatc taaccttcat gagcagaaaa aagctggggt gatatttgaa 42720
gctgaagaag ttatcactct tttaacttct gtgcttaaaa cgtcatctgc atcaagaact 42780
agtttaagct cacgacatca gtttgctcct ggagcgacag tattgtataa gggcgataaa 42840
atggtgctta acctggacag gtctcgtgtt ccaactgagt gtatagagaa aattgaggcc 42900
attcttaagg aacttgaaaa gccagcaccc tgatgcgacc acgttttagt ctacgtttat 42960
ctgtctttac ttaatgtcct ttgttacagg ccagaaagca taactggcct gaatattctc 43020
tctgggccca ctgttccact tgtatcgtcg gtctgataat cagactggga ccacggtccc 43080
actcgtatcg tcggtctgat tattagtctg ggaccacggt cccactcgta tcgtcggtct 43140
gattattagt ctgggaccac ggtcccactc gtatcgtcgg tctgataatc agactgggac 43200
cacggtccca ctcgtatcgt cggtctgatt attagtctgg gaccatggtc ccactcgtat 43260
cgtcggtctg attattagtc tgggaccacg gtcccactcg tatcgtcggt ctgattatta 43320
gtctggaacc acggtcccac tcgtatcgtc ggtctgatta ttagtctggg accacggtcc 43380
cactcgtatc gtcggtctga ttattagtct gggaccacga tcccactcgt gttgtcggtc 43440
tgattatcgg tctgggacca cggtcccact tgtattgtcg atcagactat cagcgtgaga 43500
ctacgattcc atcaatgcct gtcaagggca agtattgaca tgtcgtcgta acctgtagaa 43560
cggagtaacc tcggtgtgcg gttgtatgcc tgctgtggat tgctgctgtg tcctgcttat 43620
ccacaacatt ttgcgcacgg ttatgtggac aaaatacctg gttacccagg ccgtgccggc 43680
acgctcggta cccggggatc ctcgtttaaa c 43711
<210> 53
<211> 41545
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (16144)..(16144)
<223> a, c, t, g, unknown or other
<400> 53
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg tccgaggact ttctgattct gatcgccatc 1380
ctggtgatcg tgattctcgt gggcacaatc acaaccctgg tgggcgccat cggcggcatt 1440
agggccagga ggagcttcct cttcatttgc atcttcttcc tgttcctctc cctcttcctg 1500
acaatcctcg ccctgctgct gggcttcagc tggctcctgc tggtggccat cctgttctgg 1560
gtgctctggc tggtcatcct cattctgctg ctgctggtgt accctattcc tcaccacccc 1620
ctgcccacct ccctcaggtt tagaatgaag cagagggtga gcagcgaccc cacaggttct 1680
gacagaagcc ctcagggcag ccataatagc ctgaactccc ccgatgagga ggaccccaag 1740
gatgacacca agcaacctct gtgcaacatg acccagggcg gacctcccgt caatggacag 1800
ctcctcggac aacatgctca atgcccccct cactatccct gctgccatat tcagcatccc 1860
gacggagagg attccgatgg agacgatggc aagtcctggg gcgatgccgg agaggaagac 1920
aatggcccta acgaccctaa caccgccagc accagagagt ccatttacga ggacctcaga 1980
taccccacaa gggacgccaa tggcgagtat gagaacgtgg gatacccccc tagggacgga 2040
gatgcccctc ataggctcgg agagcctgtg tatgacgatg tggagcaagc caccgctaac 2100
gaggtgagaa tctcccctct gttcagactg ccctacggaa gcgctttcgg acctggcccc 2160
cagcctggac ccattctgga gagctccaca tggggctttc tggtcttcac acagacctcc 2220
ctgttcgccg acgacattgc cgacgctatt agggactact gcacaaccca ccctggcccc 2280
acaaggaaca cccaggtggt cctcatgaac ttcgagggca gcggagtgcc cctgcctatg 2340
ttttttcccc ctggagagga gacagaagag cagagagagg gcgatagagc tagcgactcc 2400
gacgagtccg aagacgctca gatcctgacc gtgttctgcc tgttttgcca gtggacactc 2460
tttatctgcc tgggaatcag gatgatctgt aactggaggg gcaaactcac caggatcatc 2520
tgcctgaagt tctgcctcta cggactgatt tccgcctccc tgtccttcgg ctggtacgct 2580
tttctgaagg aagtgaccct ccccaccaca gccaccgttg atcctaggca actccccctg 2640
ttcctcttca tcctgagctc cgtgctggtg attctcgcca tcatgatgga gtttcaaaca 2700
tcctccagcc tcttcgctgc tctgttcgtg attatcgccg gaatgctgtg cgtcacagtg 2760
ggcgtgattt ttctgctggc tggcgtcaag cctctcctga gcggcatgat ctgcgcctcc 2820
ggcatcacaa tgctcgtgct cggcgtcgtg ctgctggtgg tgtgcaccag agatgagcac 2880
gctatttccg ccagccacca tgctagcgat ggctccgtga atcagcagaa ggaaaatcag 2940
ccccagaccc tggaggaatg caagacagat caggagagga agaggtacag gaacaggctg 3000
gcctccagga ggtgtagagc taagttcagg aaccagctgg aacattttag gacagtcgcc 3060
gctgctaaga cagaggagaa caacaggctc agggtgctca tcaggcagat gtgtcctaca 3120
ctggacgtgg aatccatcgt cccctccacc tccgccggct accacgagcc tctgaatcac 3180
ctgacccaca gccccagccc ttgtcatcac agggatgaac ccccctccag aagccccagc 3240
cctcaaccca ccgtctccga gcagtcccag cagtccccca ggcagcagag ccctcaaggc 3300
acatcccagg gttctacaag acctcaggtg cctggaggcg ccaccaccag aaaaagaggc 3360
ggcgtgagag gccaacctgc caagtgtcac ggcaagtaca ccacaaccgc cgagggactg 3420
accgctctcc tgaataggag gcacagcccc aggacatcca acgagggcag gtggatgaat 3480
ggagtcatgg ctgtgaacct ctccaaatgg cccctgtaca gcctgaggag agccctggcc 3540
ctcgccatgg ctcctagaag gaggctctcc ggccctccct ggctgacagt gctgctgctg 3600
ctgtccacac tgagcgtggc cgccctgctg attctcttcc tgattttcag cgccggcgcc 3660
accattagca cagaagccag cctgctggtc ctgctcctgc tgtttgtgac cctgctgctg 3720
cctctcctgt cctccaacgg actccagctc cctgccgccc tgattctgat ccagtgtttc 3780
ctcctggccg ctgattatct cgcctacctg attctgccta ccattatgcc caggggcaga 3840
agcacaggaa ggaagggcag ggacacagag aaagagagga gcagatcccc tctcagagct 3900
cctggcggtt ctgatggacc cagcacaagg gctggctgtg gagccggacc ctgtcagctg 3960
agcagcccca tcgccggaaa caacggcaat gaaggcggcg agggcgacga ctacaagagc 4020
tggaggaagc ccgaggaaga ggacaacggc cccaatgacc ccaataccaa caacaggatt 4080
gaggatggag acggcgacga cggaaaatcc tggaggaatc ctgaggagga ggataacaga 4140
aagcaggaca ggctgggcac caagcctttc atggacctcg acggaaccgg cggaggcgag 4200
ggctacagcc agatggtccc tatcgccacc gcccccggaa gcggccacgc cgctacctat 4260
caggatctcc aggccgcccc ttacatcatc tggcctctcc agaccgattg ccagcctgtg 4320
gctaccacct tcgcctcccc cggacagatc cagtggtata caagcgccgt cccccagccc 4380
acagagcatt gctcccagtt tacaaacgct cccaccgtca accagcagca gcctattagc 4440
caaccccagc ccgaaaatcc ccctgctttc acctttaccc agcccgcttc catcattccc 4500
ggcgtcatta gcgcctccaa cctgaacgtg agcgcttccc ctatcatccc tagcgaccat 4560
gtcctcccca tcattacctc cgtgaccagc ctcgcccaac ctaataacat ggccggccac 4620
tggtatgaga gcgtgattcc cggcctgttc ctctgccccc tgatcctccc ttccctgttc 4680
tggatttgct ccctgctgac cttcctggtg ggccacggag ccaatattgt gagcgccgtc 4740
ctgttcctcg tgctggcttg gtgtctcctc attgccaact ggaacgtgac aagagaggac 4800
ttcgtgtccg gcaggagaag ctccatgagc agcctgtccg tggccgcttc caccgccaca 4860
gccatgttcg ccagcttcct caccctgagc tttgatggcc tgggcctgct gctgtttggc 4920
accgccctgg tgatccagac aatttacgtg ctgtatctgg tggtcatgga gatcaccgtg 4980
tggatcatga tgtttaggta tctccacttt tggatcaccc tgctgttcct gctgagcccc 5040
attattctct ccgtcgcctg tctcatcatc caatcctccg ccctgctgat cgaggctgtg 5100
gtcgtcacca ccatcacagt cctggccatt tttctgtggc tccctcctca aggcgctgag 5160
gccgatctcg gcaccgccct gctgattctg aataccgccc tgtgcctggt cgtgctgatc 5220
ctgaccgcta tccctacatg atgatgagcg gccgcgatct gctgtgcctt ctagttgcca 5280
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 5340
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 5400
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 5460
tgctggggat gcggtgggct ctatggccga tcagcgatcg ctgaggtggg tgagtgggcg 5520
tggcctgggg tggtcatgaa aatatataag ttgggggtct tagggtctct ttatttgtgt 5580
tgcagagacc gccggagcca tgagcgggag cagcagcagc agcagtagca gcagcgcctt 5640
ggatggcagc atcgtgagcc cttatttgac gacgcggatg ccccactggg ccggggtgcg 5700
tcagaatgtg atgggctcca gcatcgacgg ccgacccgtc ctgcccgcaa attccgccac 5760
gctgacctat gcgaccgtcg cggggacgcc gttggacgcc accgccgccg ccgccgccac 5820
cgcagccgcc tcggccgtgc gcagcctggc cacggacttt gcattcctgg gaccactggc 5880
gacaggggct acttctcggg ccgctgctgc cgccgttcgc gatgacaagc tgaccgccct 5940
gctggcgcag ttggatgcgc ttactcggga actgggtgac ctttctcagc aggtcatggc 6000
cctgcgccag caggtctcct ccctgcaagc tggcgggaat gcttctccca caaatgccgt 6060
ttaagataaa taaaaccaga ctctgtttgg attaaagaaa agtagcaagt gcattgctct 6120
ctttatttca taattttccg cgcgcgatag gccctagacc agcgttctcg gtcgttgagg 6180
gtgcggtgta tcttctccag gacgtggtag aggtggctct ggacgttgag atacatgggc 6240
atgagcccgt cccgggggtg gaggtagcac cactgcagag cttcatgctc cggggtggtg 6300
ttgtagatga tccagtcgta gcaggagcgc tgggcatggt gcctaaaaat gtccttcagc 6360
agcaggccga tggccagggg gaggcccttg gtgtaagtgt ttacaaaacg gttaagttgg 6420
gaagggtgca ttcggggaga gatgatgtgc atcttggact gtatttttag attggcgatg 6480
tttccgccca gatcccttct gggattcatg ttgtgcagga ccaccagtac agtgtatccg 6540
gtgcacttgg ggaatttgtc atgcagctta gagggaaaag cgtggaagaa cttggagacg 6600
cctttgtggc ctcccagatt ttccatgcat tcgtccatga tgatggcaat gggcccgcgg 6660
gaggcagctt gggcaaagat atttctgggg tcgctgacgt cgtagttgtg ttccagggtg 6720
aggtcgtcat aggccatttt tacaaagcgc gggcggaggg tgcccgactg ggggatgatg 6780
gtcccctctg gccctggggc gtagttgccc tcgcagatct gcatttccca ggccttaatc 6840
tcggaggggg gaatcatatc cacctgcggg gcgatgaaga aaacggtttc cggagccggg 6900
gagattaact gggatgagag caggtttcta agcagctgtg attttccaca accggtgggc 6960
ccataaataa cacctataac cggttgcagc tggtagttta gagagctgca gctgccgtcg 7020
tcccggagga ggggggccac ctcgttgagc atgtccctga cgcgcatgtt ctccccgacc 7080
agatccgcca gaaggcgctc gccgcccagg gacagcagct cttgcaagga agcaaagttt 7140
ttcagcggct tgaggccgtc cgccgtgggc atgtttttca gggtctggct cagcagctcc 7200
aggcggtccc agagctcggt gacgtgctct acggcatctc tatccagcat atctcctcgt 7260
ttcgcgggtt ggggcgactt tcgctgtagg gcaccaagcg gtggtcgtcc agcggggcca 7320
gagtcatgtc cttccatggg cgcagggtcc tcgtcagggt ggtctgggtc acggtgaagg 7380
ggtgcgctcc gggctgagcg cttgccaagg tgcgcttgag gctggttctg ctggtgctga 7440
agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg gtgtcatagt 7500
ccagcccctc cgcggcgtgt cccttggcgc gcagcttgcc cttggaggtg gcgccgcacg 7560
aggggcagag caggctcttg agcgcgtaga gcttgggggc gaggaagacc gattcggggg 7620
agtaggcgtc cgcgccgcag accccgcaca cggtctcgca ctccaccagc caggtgagct 7680
cggggcgcgc cgggtcaaaa accaggtttc ccccatgctt tttgatgcgt ttcttacctc 7740
gggtctccat gaggtggtgt ccccgctcgg tgacgaagag gctgtccgtg tctccgtaga 7800
ccgacttgag gggtcttttc tccagggggg tccctcggtc ttcctcgtag aggaactcgg 7860
accactctga gacgaaggcc cgcgtccagg ccaggacgaa ggaggctatg tgggaggggt 7920
agcggtcgtt gtccactagg gggtccacct tctccaaggt gtgaagacac atgtcgcctt 7980
cctcggcgtc caggaaggtg attggcttgt aggtgtaggc cacgtgaccg ggggttcctg 8040
acgggggggt ataaaagggg gtgggggcgc gctcgtcgtc actctcttcc gcatcgctgt 8100
ctgcgagggc cagctgctgg ggtgagtatt ccctctcgaa ggcgggcatg acctccgcgc 8160
tgaggttgtc agtttccaaa aacgaggagg atttgatgtt cacctgtccc gaggtgatac 8220
ctttgagggt acccgcgtcc atctggtcag aaaacacgat ctttttattg tccagcttgg 8280
tggcgaacga cccgtagagg gcgttggaga gcagcttggc gatggagcgc agggtctggt 8340
tcttgtccct gtcggcgcgc tccttggccg cgatgttgag ctgcacgtac tcgcgcgcga 8400
cgcagcgcca ctcggggaag acggtggtgc gctcgtcggg caccaggcgc acgcgccagc 8460
cgcggttgtg cagggtgacc aggtccacgc tggtggcgac ctcgccgcgc aggcgctcgt 8520
tggtccagca gagacggccg cccttgcgcg agcagaaggg gggcaggggg tcgagctggg 8580
tctcgtccgg ggggtccgcg tccacggtga aaaccccggg gcgcaggcgc gcgtcgaagt 8640
agtctatctt gcaaccttgc atgtccagcg cctgctgcca gtcgcgggcg gcgagcgcgc 8700
gctcgtaggg gttgagcggc gggccccagg gcatggggtg ggtgagtgcg gaggcgtaca 8760
tgccgcagat gtcatagacg tagaggggct cccgcaggac cccgatgtag gtggggtagc 8820
agcggccgcc gcggatgctg gcgcgcacgt agtcatacag ctcgtgcgag ggggcgagga 8880
ggtcggggcc caggttggtg cgggcggggc gctccgcgcg gaagacgatc tgcctgaaga 8940
tggcatgcga gttggaagag atggtggggc gctggaagac gttgaagctg gcgtcctgca 9000
ggccgacggc gtcgcgcacg aaggaggcgt aggagtcgcg cagcttgtgt accagctcgg 9060
cggtgacctg cacgtcgagc gcgcagtagt cgagggtctc gcggatgatg tcatatttag 9120
cctgcccctt ctttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt 9180
actcttggat cgggaaaccg tccggttccg aacggtaaga gcctagcatg tagaactggt 9240
tgacggcctg gtaggcgcag cagcccttct ccacggggag ggcgtaggcc tgcgcggcct 9300
tgcggagcga ggtgtgggtc agggcgaagg tgtccctgac catgactttg aggtactggt 9360
gcttgaagtc ggagtcgtcg cagccgcccc gctcccagag cgagaagtcg gtgcgcttct 9420
tggagcgggg gttgggcaga gcgaaggtga catcgttgaa gaggattttg cccgcgcggg 9480
gcatgaagtt gcgggtgatg cggaagggcc ccggcacttc agagcggttg ttgatgacct 9540
gggcggcgag cacgatctcg tcgaagccgt tgatgttgtg gcccacgatg tagagttcca 9600
ggaagcgggg ccggcccttt acggtgggca gcttctttag ctcttcgtag gtgagctcct 9660
cgggcgaggc gaggccgtgc tcggccaggg cccagtccgc gaggtgcggg ttgtctctga 9720
ggaaggactt ccagaggtcg cgggccagga gggtctgcag gcggtctctg aaggtcctga 9780
actggcggcc cacggccatt ttttcggggg tgatgcagta gaaggtgagg gggtcttgct 9840
gccagcggtc ccagtcgagc tgcagggcga ggtcgcgcgc ggcggtgacc aggcgctcgt 9900
cgcccccgaa tttcatgacc agcatgaagg gcacgagctg ctttccgaag gcccccatcc 9960
aagtgtaggt ctctacatcg taggtgacaa agaggcgctc cgtgcgagga tgcgagccga 10020
tcgggaagaa ctggatctcc cgccaccagt tggaggagtg gctgttgatg tggtggaagt 10080
agaagtcccg tcgccgggcc gaacactcgt gctggctttt gtaaaagcga gcgcagtact 10140
ggcagcgctg cacgggctgt acctcatgca cgagatgcac ctttcgcccg cgcacgagga 10200
agccgagggg aaatctgagc cccccgcctg gctcgcggca tggctggttc tcttctactt 10260
tggatgcgtg tccgtctccg tctggctcct cgaggggtgt tacggtggag cggaccacca 10320
cgccgcgcga gccgcaggtc cagatatcgg cgcgcggcgg tcggagtttg atgacgacat 10380
cgcgcagctg ggagctgtcc atggtctgga gctcccgcgg cggcggcagg tcagccggga 10440
gttcttgcag gttcacctcg cagagtcggg ccagggcgcg gggcaggtct aggtggtacc 10500
tgatctctag gggcgtgttg gtggcggcgt cgatggcttg caggagcccg cagccccggg 10560
gggcgacgac ggtgccccgc ggggtggtgg tggtggtggc ggtgcagctc agaagcggtg 10620
ccgcgggcgg gcccccggag gtaggggggg ctccggtccc gcgggcaggg gcggcagcgg 10680
cacgtcggcg tggagcgcgg gcaggagttg gtgctgtgcc cggaggttgc tggcgaaggc 10740
gacgacgcgg cggttgatct cctggatctg gcgcctctgc gtgaagacga cgggcccggt 10800
gagcttgaac ctgaaagaga gttcgacaga atcaatctcg gtgtcattga ccgcggcctg 10860
gcgcaggatc tcctgcacgt ctcccgagtt gtcttggtag gcgatctcgg ccatgaactg 10920
ctcgatctct tcctcctgga ggtctccgcg tccggcgcgt tccacggtgg ccgccaggtc 10980
gttggagatg cgccccatga gctgcgagaa ggcgttgagt ccgccctcgt tccagactcg 11040
gctgtagacc acgcccccct ggtcatcgcg ggcgcgcatg accacctgcg cgaggttgag 11100
ctccacgtgc cgcgcgaaga cggcgtagtt gcgcagacgc tggaagaggt agttgagggt 11160
ggtggcggtg tgctcggcca cgaagaagtt catgacccag cggcgcaacg tggattcgtt 11220
gatgtccccc aaggcctcca gccgttccat ggcctcgtag aagtccacgg cgaagttgaa 11280
aaactgggag ttgcgcgccg acacggtcaa ctcctcctcc agaagacgga tgagctcggc 11340
gacggtgtcg cgcacctcgc gctcgaaggc tatggggatc tcttcctccg ctagcatcac 11400
cacctcctcc tcttcctcct cttctggcac ttccatgatg gcttcctcct cttcgggggg 11460
tggcggcggc ggcggtgggg gagggggcgc tctgcgccgg cggcggcgca ccgggaggcg 11520
gtccacgaag cgcgcgatca tctccccgcg gcggcggcgc atggtctcgg tgacggcgcg 11580
gccgttctcc cgggggcgca gttggaagac gccgccggac atctggtgct ggggcgggtg 11640
gccgtgaggc agcgagacgg cgctgacgat gcatctcaac aattgctgcg taggtacgcc 11700
gccgagggac ctgagggagt ccatatccac cggatccgaa aacctttcga ggaaggcgtc 11760
taaccagtcg cagtcgcaag gtaggctgag caccgtggcg ggcggcgggg ggtgggggga 11820
gtgtctggcg gaggtgctgc tgatgatgta attgaagtag gcggacttga cacggcggat 11880
ggtcgacagg agcaccatgt ccttgggtcc ggcctgctgg atgcggaggc ggtcggctat 11940
gccccaggct tcgttctggc atcggcgcag gtccttgtag tagtcttgca tgagcctttc 12000
caccggcacc tcttctcctt cctcttctgc ttcttccatg tctgcttcgg ccctggggcg 12060
gcgccgcgcc cccctgcccc ccatgcgcgt gaccccgaac cccctgagcg gttggagcag 12120
ggccaggtcg gcgacgacgc gctcggccag gatggcctgc tgcacctgcg tgagggtggt 12180
ttggaagtca tccaagtcca cgaagcggtg gtaggcgccc gtgttgatgg tgtaggtgca 12240
gttggccatg acggaccagt tgacggtctg gtggcccggt tgcgacatct cggtgtacct 12300
gagtcgcgag taggcgcggg agtcgaagac gtagtcgttg caagtccgca ccaggtactg 12360
gtagcccacc aggaagtgcg gcggcggctg gcggtagagg ggccagcgca gggtggcggg 12420
ggctccgggg gccaggtctt ccagcatgag gcggtggtag gcgtagatgt acctggacat 12480
ccaggtgata cccgcggcgg tggtggaggc gcgcgggaag tcgcgcaccc ggttccagat 12540
gttgcgcagg ggcagaaagt gctccatggt aggcgtgctc tgtccagtca gacgcgcgca 12600
gtcgttgata ctctagacca gggaaaacga aagccggtca gcgggcactc ttccgtggtc 12660
tggtgaatag atcgcaaggg tatcatggcg gagggcctcg gttcgagccc cgggtccggg 12720
ccggacggtc cgccatgatc cacgcggtta ccgcccgcgt gtcgaaccca ggtgtgcgac 12780
gtcagacaac ggtggagtgt tccttttggc gtttttctgg ccgggcgccg gcgccgcgta 12840
agagactaag ccgcgaaagc gaaagcagta agtggctcgc tccccgtagc cggagggatc 12900
cttgctaagg gttgcgttgc ggcgaacccc ggttcgaatc ccgtactcgg gccggccgga 12960
cccgcggcta aggtgttgga ttggcctccc cctcgtataa agaccccgct tgcggattga 13020
ctccggacac ggggacgagc cccttttatt tttgctttcc ccagatgcat ccggtgctgc 13080
ggcagatgcg ccccccgccc cagcagcagc aacaacacca gcaagagcgg cagcaacagc 13140
agcgggagtc atgcagggcc ccctcaccca ccctcggcgg gccggccacc tcggcgtccg 13200
cggccgtgtc tggcgcctgc ggcggcggcg gggggccggc tgacgacccc gaggagcccc 13260
cgcggcgcag ggccagacac tacctggacc tggaggaggg cgagggcctg gcgcggctgg 13320
gggcgccgtc tcccgagcgc cacccgcggg tgcagctgaa gcgcgactcg cgcgaggcgt 13380
acgtgcctcg gcagaacctg ttcagggacc gcgcgggcga ggagcccgag gagatgcggg 13440
acaggaggtt cagcgcaggg cgggagctgc ggcaggggct gaaccgcgag cggctgctgc 13500
gcgaggagga ctttgagccc gacgcgcgga cggggatcag ccccgcgcgc gcgcacgtgg 13560
cggccgccga cctggtgacg gcgtacgagc agacggtgaa ccaggagatc aacttccaaa 13620
agagtttcaa caaccacgtg cgcacgctgg tggcgcgcga ggaggtgacc atcgggctga 13680
tgcacctgtg ggactttgta agcgcgctgg tgcagaaccc caacagcaag cctctgacgg 13740
cgcagctgtt cctgatagtg cagcacagca gggacaacga ggcgtttagg gacgcgctgc 13800
tgaacatcac cgagcccgag ggtcggtggc tgctggacct gattaacatc ctgcagagca 13860
tagtggtgca ggagcgcagc ctgagcctgg ccgacaaggt ggcggccatc aactactcga 13920
tgctgagcct gggcaagttt tacgcgcgca agatctacca gacgccgtac gtgcccatag 13980
acaaggaggt gaagatcgac ggtttttaca tgcgcatggc gctgaaggtg ctcaccctga 14040
gcgacgacct gggcgtgtac cgcaacgagc gcatccacaa ggccgtgagc gtgagccggc 14100
ggcgcgagct gagcgaccgc gagctgatgc acagcctgca gcgggcgctg gcgggcgccg 14160
gcagcggcga cagggaggcg gagtcctact tcgatgcggg ggcggacctg cgctgggcgc 14220
ccagccggcg ggccctggag gccgcggggg tccgcgagga ctatgacgag gacggcgagg 14280
aggatgagga gtacgagcta gaggagggcg agtacctgga ctaaaccgcg ggtggtgttt 14340
ccggtagatg caagacccga acgtggtgga cccggcgctg cgggcggctc tgcagagcca 14400
gccgtccggc cttaactcct cagacgactg gcgacaggtc atggaccgca tcatgtcgct 14460
gacggcgcgt aacccggacg cgttccggca gcagccgcag gccaacaggc tctccgccat 14520
cctggaggcg gtggtgcctg cgcgctcgaa ccccacgcac gagaaggtgc tggccatagt 14580
gaacgcgctg gccgagaaca gggccatccg cccggacgag gccgggctgg tgtacgacgc 14640
gctgctgcag cgcgtggccc gctacaacag cggcaacgtg cagaccaacc tggaccggct 14700
ggtgggggac gtgcgcgagg cggtggcgca gcgcgagcgc gcggatcggc agggcaacct 14760
gggctccatg gtggcgctga atgccttcct gagcacgcag ccggccaacg tgccgcgggg 14820
gcaggaagac tacaccaact ttgtgagcgc gctgcggctg atggtgaccg agacccccca 14880
gagcgaggtg taccagtcgg gcccggacta cttcttccag accagcagac agggcctgca 14940
gacggtgaac ctgagccagg ctttcaagaa cctgcggggg ctgtggggcg tgaaggcgcc 15000
caccggcgac cgggcgacgg tgtccagcct gctgacgccc aactcgcgcc tgctgctgct 15060
gctgatcgcg ccgttcacgg acagcggcag cgtgtcccgg gacacctacc tggggcacct 15120
gctgaccctg taccgcgagg ccatcgggca ggcgcaggtg gacgagcaca ccttccagga 15180
gatcaccagc gtgagccgcg cgctggggca ggaggacacg agcagcctgg aggcgactct 15240
gaactacctg ctgaccaacc ggcggcagaa gattccctcg ctgcacagcc tgacctccga 15300
ggaggagcgc atcttgcgct acgtgcagca gagcgtgagc ctgaacctga tgcgcgacgg 15360
ggtgacgccc agcgtggcgc tggacatgac cgcgcgcaac atggaaccgg gcatgtacgc 15420
cgcgcaccgg ccttacatca accgcctgat ggactacctg catcgcgcgg cggccgtgaa 15480
ccccgagtac tttaccaacg ccatcctgaa cccgcactgg ctcccgccgc ccgggttcta 15540
cagcgggggc ttcgaggtcc cggagaccaa cgatggcttc ctgtgggacg acatggacga 15600
cagcgtgttc tccccgcggc cgcaggcgct ggcggaagcg tccctgctgc gtcccaagaa 15660
ggaggaggag gaggaggcga gtcgccgccg cggcagcagc ggcgtggctt ctctgtccga 15720
gctgggggcg gcagccgccg cgcgccccgg gtccctgggc ggcagcccct ttccgagcct 15780
ggtggggtct ctgcacagcg agcgcaccac ccgccctcgg ctgctgggcg aggacgagta 15840
cctgaataac tccctgctgc agccggtgcg ggagaaaaac ctgcctcccg ccttccccaa 15900
caacgggata gagagcctgg tggacaagat gagcagatgg aagacctatg cgcaggagca 15960
cagggacgcg cctgcgctcc ggccgcccac gcggcgccag cgccacgacc ggcagcgggg 16020
gctggtgtgg gatgacgagg actccgcgga cgatagcagc gtgctggacc tgggagggag 16080
cggcaacccg ttcgcgcacc tgcgcccccg cctggggagg atgttttaaa aaaaaaaaaa 16140
aaangcaaga agcatgatgc aaaaattaaa taaaactcac caaggccatg gcgaccgagc 16200
gttggtttct tgtgttccct tcagtatgcg gcgcgcggcg atgtaccagg agggacctcc 16260
tccctcttac gagagcgtgg tgggcgcggc ggcggcggcg ccctcttctc cctttgcgtc 16320
gcagctgctg gagccgccgt acgtgcctcc gcgctacctg cggcctacgg gggggagaaa 16380
cagcatccgt tactcggagc tggcgcccct gttcgacacc acccgggtgt acctggtgga 16440
caacaagtcg gcggacgtgg cctccctgaa ctaccagaac gaccacagca attttttgac 16500
cacggtcatc cagaacaatg actacagccc gagcgaggcc agcacccaga ccatcaatct 16560
ggatgaccgg tcgcactggg gcggcgacct gaaaaccatc ctgcacacca acatgcccaa 16620
cgtgaacgag ttcatgttca ccaataagtt caaggcgcgg gtgatggtgt cgcgctcgca 16680
caccaaggaa gaccgggtgg agctgaagta cgagtgggtg gagttcgagc tgccagaggg 16740
caactactcc gagaccatga ccattgacct gatgaacaac gcgatcgtgg agcactatct 16800
gaaagtgggc aggcagaacg gggtcctgga gagcgacatc ggggtcaagt tcgacaccag 16860
gaacttccgc ctggggctgg accccgtgac cgggctggtt atgcccgggg tgtacaccaa 16920
cgaggccttc catcccgaca tcatcctgct gcccggctgc ggggtggact tcacttacag 16980
ccgcctgagc aacctcctgg gcatccgcaa gcggcagccc ttccaggagg gcttcaggat 17040
cacctacgag gacctggagg ggggcaacat ccccgcgctc ctcgatgtgg aggcctacca 17100
ggatagcttg aaggaaaatg aggcgggaca ggaggatacc gcccccgccg cctccgccgc 17160
cgccgagcag ggcgaggatg ctgctgacac cgcggccgcg gacggggcag aggccgaccc 17220
cgctatggtg gtggaggctc ccgagcagga ggaggacatg aatgacagtg cggtgcgcgg 17280
agacaccttc gtcacccggg gggaggaaaa gcaagcggag gccgaggccg cggccgagga 17340
aaagcaactg gcggcagcag cggcggcggc ggcgttggcc gcggcggagg ctgagtctga 17400
ggggaccaag cccgccaagg agcccgtgat taagcccctg accgaagata gcaagaagcg 17460
cagttacaac ctgctcaagg acagcaccaa caccgcgtac cgcagctggt acctggccta 17520
caactacggc gacccgtcga cgggggtgcg ctcctggacc ctgctgtgca cgccggacgt 17580
gacctgcggc tcggagcagg tgtactggtc gctgcccgac atgatgcaag accccgtgac 17640
cttccgctcc acgcggcagg tcagcaactt cccggtggtg ggcgccgagc tgctgcccgt 17700
gcactccaag agcttctaca acgaccaggc cgtctactcc cagctcatcc gccagttcac 17760
ctctctgacc cacgtgttca atcgctttcc tgagaaccag attctggcgc gcccgcccgc 17820
ccccaccatc accaccgtca gtgaaaacgt tcctgctctc acagatcacg ggacgctacc 17880
gctgcgcaac agcatcggag gagtccagcg agtgaccgtt actgacgcca gacgccgcac 17940
ctgcccctac gtttacaagg ccttgggcat agtctcgccg cgcgtccttt ccagccgcac 18000
tttttgagca acaccaccat catgtccatc ctgatctcac ccagcaataa ctccggctgg 18060
ggactgctgc gcgcgcccag caagatgttc ggaggggcga ggaagcgttc cgagcagcac 18120
cccgtgcgcg tgcgcgggca cttccgcgcc ccctggggag cgcacaaacg cggccgcgcg 18180
gggcgcacca ccgtggacga cgccatcgac tcggtggtgg agcaggcgcg caactacagg 18240
cccgcggtct ctaccgtgga cgcggccatc cagaccgtgg tgcggggcgc gcggcggtac 18300
gccaagctga agagccgccg gaagcgcgtg gcccgccgcc accgccgccg acccggggcc 18360
gccgccaaac gcgccgccgc ggccctgctt cgccgggcca agcgcacggg ccgccgcgcc 18420
gccatgaggg ccgcgcgccg cttggccgcc ggcatcaccg ccgccaccat ggccccccgt 18480
acccgaagac gcgcggccgc cgccgccgcc gccgccatca gtgacatggc cagcaggcgc 18540
cggggcaacg tgtactgggt gcgcgactcg gtgaccggca cgcgcgtgcc cgtgcgcttc 18600
cgccccccgc ggacttgaga tgatgtgaaa aaacaacact gagtctcctg ctgttgtgtg 18660
tatcccagcg gcggcggcgc gcgcagcgtc atgtccaagc gcaaaatcaa agaagagatg 18720
ctccaggtcg tcgcgccgga gatctatggg cccccgaaga aggaagagca ggattcgaag 18780
ccccgcaaga taaagcgggt caaaaagaaa aagaaagatg atgacgatgc cgatggggag 18840
gtggagttcc tgcgcgccac ggcgcccagg cgcccggtgc agtggaaggg ccggcgcgta 18900
aagcgcgtcc tgcgccccgg caccgcggtg gtcttcacgc ccggcgagcg ctccacccgg 18960
actttcaagc gcgtctatga cgaggtgtac ggcgacgaag acctgctgga gcaggccaac 19020
gagcgcttcg gagagtttgc ttacgggaag cgtcagcggg cgctggggaa ggaggacctg 19080
ctggcgctgc cgctggacca gggcaacccc acccccagtc tgaagcccgt gaccctgcag 19140
caggtgctgc cgagcagcgc accctccgag gcgaagcggg gtctgaagcg cgagggcggc 19200
gacctggcgc ccaccgtgca gctcatggtg cccaagcggc agaggctgga ggatgtgctg 19260
gagaaaatga aagtagaccc cggtctgcag ccggacatca gggtccgccc catcaagcag 19320
gtggcgccgg gcctcggcgt gcagaccgtg gacgtggtca tccccaccgg caactccccc 19380
gccgccgcca ccactaccgc tgcctccacg gacatggaga cacagaccga tcccgccgca 19440
gccgcagccg cagccgccgc cgcgacctcc tcggcggagg tgcagacgga cccctggctg 19500
ccgccggcga tgtcagctcc ccgcgcgcgt cgcgggcgca ggaagtacgg cgccgccaac 19560
gcgctcctgc ccgagtacgc cttgcatcct tccatcgcgc ccacccccgg ctaccgaggc 19620
tatacctacc gcccgcgaag agccaagggt tccacccgcc gtccccgccg acgcgccgcc 19680
gccaccaccc gccgccgccg ccgcagacgc cagcccgcac tggctccagt ctccgtgagg 19740
aaagtggcgc gcgacggaca caccctggtg ctgcccaggg cgcgctacca ccccagcatc 19800
gtttaaaagc ctgttgtggt tcttgcagat atggccctca cttgccgcct ccgtttcccg 19860
gtgccgggat accgaggagg aagatcgcgc cgcaggaggg gtctggccgg ccgcggcctg 19920
agcggaggca gccgccgcgc gcaccggcgg cgacgcgcca ccagccgacg catgcgcggc 19980
ggggtgctgc ccctgttaat ccccctgatc gccgcggcga tcggcgccgt gcccgggatc 20040
gcctccgtgg ccttgcaagc gtcccagagg cattgacaga cttgcaaact tgcaaatatg 20100
gaaaaaaaaa ccccaataaa aaagtctaga ctctcacgct cgcttggtcc tgtgactatt 20160
ttgtagaatg gaagacatca actttgcgtc gctggccccg cgtcacggct cgcgcccgtt 20220
cctgggacac tggaacgata tcggcaccag caacatgagc ggtggcgcct tcagttgggg 20280
ctctctgtgg agcggcatta aaagtatcgg gtctgccgtt aaaaattacg gctcccgggc 20340
ctggaacagc agcacgggcc agatgttgag agacaagttg aaagagcaga acttccagca 20400
gaaggtggtg gagggcctgg cctccggcat caacggggtg gtggacctgg ccaaccaggc 20460
cgtgcagaat aagatcaaca gcagactgga cccccggccg ccggtggagg aggtgccgcc 20520
ggcgctggag acggtgtccc ccgatgggcg tggcgagaag cgcccgcggc ccgataggga 20580
agagaccact ctggtcacgc agaccgatga gccgcccccg tatgaggagg ccctgaagca 20640
aggtctgccc accacgcggc ccatcgcgcc catggccacc ggggtggtgg gccgccacac 20700
ccccgccacg ctggacttgc ctccgcccgc cgatgtgccg cagcagcaga aggcggcaca 20760
gccgggcccg cccgcgaccg cctcccgttc ctccgccggt cctctgcgcc gcgcggccag 20820
cggcccccgc gggggggtcg cgaggcacgg caactggcag agcacgctga acagcatcgt 20880
gggtctgggg gtgcggtccg tgaagcgccg ccgatgctac tgaatagctt agctaacgtg 20940
ttgtatgtgt gtatgcgccc tatgtcgccg ccagaggagc tgctgagtcg ccgccgttcg 21000
cgcgcccacc accaccgcca ctccgcccct caagatggcg accccatcga tgatgccgca 21060
gtggtcgtac atgcacatct cgggccagga cgcctcggag tacctgagcc ccgggctggt 21120
gcagttcgcc cgcgccaccg agagctactt cagcctgagt aacaagttta ggaaccccac 21180
ggtggcgccc acgcacgatg tgaccaccga ccggtctcag cgcctgacgc tgcggttcat 21240
tcccgtggac cgcgaggaca ccgcgtactc gtacaaggcg cggttcaccc tggccgtggg 21300
cgacaaccgc gtgctggaca tggcctccac ctactttgac atccgcgggg tgctggaccg 21360
gggtcccact ttcaagccct actctggcac cgcctacaac tccctggccc ccaagggcgc 21420
tcccaactcc tgcgagtggg agcaagagga aactcaggca gttgaagaag cagcagaaga 21480
ggaagaagaa gatgctgacg gtcaagctga ggaagagcaa gcagctacca aaaagactca 21540
tgtatatgct caggctcccc tttctggcga aaaaattagt aaagatggtc tgcaaatagg 21600
aacggacgct acagctacag aacaaaaacc tatttatgca gaccctacat tccagcccga 21660
accccaaatc ggggagtccc agtggaatga ggcagatgct acagtcgccg gcggtagagt 21720
gctaaagaaa tctactccca tgaaaccatg ctatggttcc tatgcaagac ccacaaatgc 21780
taatggaggt cagggtgtac taacggcaaa tgcccaggga cagctagaat ctcaggttga 21840
aatgcaattc ttttcaactt ctgaaaacgc ccgtaacgag gctaacaaca ttcagcccaa 21900
attggtgctg tatagtgagg atgtgcacat ggagaccccg gatacgcacc tttcttacaa 21960
gcccgcaaaa agcgatgaca attcaaaaat catgctgggt cagcagtcca tgcccaacag 22020
acctaattac atcggcttca gagacaactt tatcggcctc atgtattaca atagcactgg 22080
caacatggga gtgcttgcag gtcaggcctc tcagttgaat gcagtggtgg acttgcaaga 22140
cagaaacaca gaactgtcct accagctctt gcttgattcc atgggtgaca gaaccagata 22200
cttttccatg tggaatcagg cagtggacag ttatgaccca gatgttagaa ttattgaaaa 22260
tcatggaact gaagacgagc tccccaacta ttgtttccct ctgggtggca taggggtaac 22320
tgacacttac caggctgtta aaaccaacaa tggcaataac gggggccagg tgacttggac 22380
aaaagatgaa acttttgcag atcgcaatga aataggggtg ggaaacaatt tcgctatgga 22440
gatcaacctc agtgccaacc tgtggagaaa cttcctgtac tccaacgtgg cgctgtacct 22500
accagacaag cttaagtaca acccctccaa tgtggacatc tctgacaacc ccaacaccta 22560
cgattacatg aacaagcgag tggtggcccc ggggctggtg gactgctaca tcaacctggg 22620
cgcgcgctgg tcgctggact acatggacaa cgtcaacccc ttcaaccacc accgcaatgc 22680
gggcctgcgc taccgctcca tgctcctggg caacgggcgc tacgtgccct tccacatcca 22740
ggtgccccag aagttctttg ccatcaagaa cctcctcctc ctgccgggct cctacaccta 22800
cgagtggaac ttcaggaagg atgtcaacat ggtcctccag agctctctgg gtaacgatct 22860
cagggtggac ggggccagca tcaagttcga gagcatctgc ctctacgcca ccttcttccc 22920
catggcccac aacacggcct ccacgctcga ggccatgctc aggaacgaca ccaacgacca 22980
gtccttcaat gactacctct ccgccgccaa catgctctac cccatacccg ccaacgccac 23040
caacgtcccc atctccatcc cctcgcgcaa ctgggcggcc ttccgcggct gggccttcac 23100
ccgcctcaag accaaggaga ccccctccct gggctcggga ttcgacccct actacaccta 23160
ctcgggctcc attccctacc tggacggcac cttctacctc aaccacactt tcaagaaggt 23220
ctcggtcacc ttcgactcct cggtcagctg gccgggcaac gaccgtctgc tcacccccaa 23280
cgagttcgag atcaagcgct cggtcgacgg ggagggctac aacgtggccc agtgcaacat 23340
gaccaaggac tggttcctgg tccagatgct ggccaactac aacatcggct accagggctt 23400
ctacatccca gagagctaca aggacaggat gtactccttc ttcaggaact tccagcccat 23460
gagccggcag gtggtggacc agaccaagta caaggactac caggaggtgg gcatcatcca 23520
ccagcacaac aactcgggct tcgtgggcta cctcgccccc accatgcgcg agggacaggc 23580
ctaccccgcc aacttcccct atccgctcat aggcaagacc gcggtcgaca gcatcaccca 23640
gaaaaagttc ctctgcgacc gcaccctctg gcgcatcccc ttctccagca acttcatgtc 23700
catgggtgcg ctctcggacc tgggccagaa cttgctctac gccaactccg cccacgccct 23760
cgacatgacc ttcgaggtcg accccatgga cgagcccacc cttctctatg ttctgttcga 23820
agtctttgac gtggtccggg tccaccagcc gcaccgcggc gtcatcgaga ccgtgtacct 23880
gcgtacgccc ttctcggccg gcaacgccac cacctaaaga agcaagccgc agtcatcgcc 23940
gcctgcatgc cgtcgggttc caccgagcaa gagctcaggg ccatcgtcag agacctggga 24000
tgcgggccct attttttggg caccttcgac aagcgcttcc ctggctttgt ctccccacac 24060
aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcgt gcactggctg 24120
gccttcgcct ggaacccgcg ctccaaaaca tgcttcctct ttgacccctt cggcttttcg 24180
gaccagcggc tcaagcaaat ctacgagttc gagtacgagg gcttgctgcg tcgcagcgcc 24240
atcgcctcct cgcccgaccg ctgcgtcacc ctcgaaaagt ccacccagac cgtgcagggg 24300
cccgactcgg ccgcctgcgg tctcttctgc tgcatgtttc tgcacgcctt tgtgcactgg 24360
cctcagagtc ccatggaccg caaccccacc atgaacttgc tgacgggggt gcccaactcc 24420
atgctccaga gcccccaggt cgagcccacc ctgcgccgca accaggagca gctctacagc 24480
ttcctggagc gccactcgcc ttacttccgc cgccacagcg cacagatcag gagggccacc 24540
tccttctgcc acttgcaaga gatgcaagaa gggtaataac gatgtacaca ctttttttct 24600
caataaatgg catcttttta tttatacaag ctctctgggg tattcatttc ccaccaccac 24660
ccgccgttgt cgccatctgg ctctatttag aaatcgaaag ggttctgccg ggagtcgccg 24720
tgcgccacgg gcagggacac gttgcgatac tggtagcggg tgccccactt gaactcgggc 24780
accaccaggc gaggcagctc ggggaagttt tcgctccaca ggctgcgggt cagcaccagc 24840
gcgttcatca ggtcgggcgc cgagatcttg aagtcgcagt tggggccgcc gccctgcgcg 24900
cgcgagttgc ggtacaccgg gttgcagcac tggaacacca acagcgccgg gtgcttcacg 24960
ctggccagca cgctgcggtc ggagatcagc tcggcgtcca ggtcctccgc gttgctcagc 25020
gcgaacgggg tcatcttggg cacttgccgc cccaggaagg gcgcgtgccc cggtttcgag 25080
ttgcagtcgc agcgcagcgg gatcagcagg tgcccgtgcc cggactcggc gttggggtac 25140
agcgcgcgca tgaaggcctg catctggcgg aaggccatct gggccttggc gccctccgag 25200
aagaacatgc cgcaggactt gcccgagaac tggtttgcgg ggcagctggc gtcgtgcagg 25260
cagcagcgcg cgtcggtgtt ggcgatctgc accacgttgc gcccccaccg gttcttcacg 25320
atcttggcct tggacgattg ctccttcagc gcgcgctgcc cgttctcgct ggtcacatcc 25380
atctcgatca catgttcctt gttcaccatg ctgctgccgt gcagacactt cagctcgccc 25440
tccgtctcgg tgcagcggtg ctgccacagc gcgcagcccg tgggctcgaa agacttgtag 25500
gtcacctccg cgaaggactg caggtacccc tgcaaaaagc ggcccatcat ggtcacgaag 25560
gtcttgttgc tgctgaaggt cagctgcagc ccgcggtgct cctcgttcag ccaggtcttg 25620
cacacggccg ccagcgcctc cacctggtcg ggcagcatct tgaagttcac cttcagctca 25680
ttctccacgt ggtacttgtc catcagcgtg cgcgccgcct ccatgccctt ctcccaggcc 25740
gacaccagcg gcaggctcac ggggttcttc accatcaccg tggccgccgc ctccgccgcg 25800
ctttcgcttt ccgccccgct gttctcttcc tcttcctcct cttcctcgcc gccgcccact 25860
cgcagccccc gcaccacggg gtcgtcttcc tgcaggcgct gcaccttgcg cttgccgttg 25920
cgcccctgct tgatgcgcac gggcgggttg ctgaagccca ccatcaccag cgcggcctct 25980
tcttgctcgt cctcgctgtc cagaatgacc tccggggagg gggggttggt catcctcagt 26040
accgaggcac gcttcttttt cttcctgggg gcgttcgcca gctccgcggc tgcggccgct 26100
gccgaggtcg aaggccgagg gctgggcgtg cgcggcacca gcgcgtcctg cgagccgtcc 26160
tcgtcctcct cggactcgag acggaggcgg gcccgcttct tcgggggcgc gcggggcggc 26220
ggaggcggcg gcggcgacgg agacggggac gagacatcgt ccagggtggg tggacggcgg 26280
gccgcgccgc gtccgcgctc gggggtggtc tcgcgctggt cctcttcccg actggccatc 26340
tcccactgct ccttctccta taggcagaaa gagatcatgg agtctctcat gcgagtcgag 26400
aaggaggagg acagcctaac cgccccctct gagccctcca ccaccgccgc caccaccgcc 26460
aatgccgccg cggacgacgc gcccaccgag accaccgcca gtaccaccct ccccagcgac 26520
gcacccccgc tcgagaatga agtgctgatc gagcaggacc cgggttttgt gagcggagag 26580
gaggatgagg tggatgagaa ggagaaggag gaggtcgccg cctcagtgcc aaaagaggat 26640
aaaaagcaag accaggacga cgcagataag gatgagacag cagtcgggcg ggggaacgga 26700
agccatgatg ctgatgacgg ctacctagac gtgggagacg acgtgctgct taagcacctg 26760
caccgccagt gcgtcatcgt ctgcgacgcg ctgcaggagc gctgcgaagt gcccctggac 26820
gtggcggagg tcagccgcgc ctacgagcgg cacctcttcg cgccgcacgt gccccccaag 26880
cgccgggaga acggcacctg cgagcccaac ccgcgtctca acttctaccc ggtcttcgcg 26940
gtacccgagg tgctggccac ctaccacatc tttttccaaa actgcaagat ccccctctcc 27000
tgccgcgcca accgcacccg cgccgacaaa accctgaccc tgcggcaggg cgcccacata 27060
cctgatatcg cctctctgga ggaagtgccc aagatcttcg agggtctcgg tcgcgacgag 27120
aaacgggcgg cgaacgctct gcacggagac agcgaaaacg agagtcactc gggggtgctg 27180
gtggagctcg agggcgacaa cgcgcgcctg gccgtactca agcgcagcat agaggtcacc 27240
cactttgcct acccggcgct caacctgccc cccaaggtca tgagtgtggt catgggcgag 27300
ctcatcatgc gccgcgccca gcccctggcc gcggatgcaa acttgcaaga gtcctccgag 27360
gaaggcctgc ccgcggtcag cgacgagcag ctggcgcgct ggctggagac ccgcgacccc 27420
gcgcagctgg aggagcggcg caagctcatg atggccgcgg tgctggtcac cgtggagctc 27480
gagtgtctgc agcgcttctt cgcggacccc gagatgcagc gcaagctcga ggagaccctg 27540
cactacacct tccgccaggg ctacgtgcgc caggcctgca agatctccaa cgtggagctc 27600
tgcaacctgg tctcctacct gggcatcctg cacgagaacc gcctcgggca gaacgtcctg 27660
cactccaccc tcaaagggga ggcgcgccgc gactacatcc gcgactgcgc ctacctcttc 27720
ctctgctaca cctggcagac ggccatgggg gtctggcagc agtgcctgga ggagcgcaac 27780
ctcaaggagc tggaaaagct cctcaagcgc accctcaggg acctctggac gggcttcaac 27840
gagcgctcgg tggccgccgc gctggcggac atcatctttc ccgagcgcct gctcaagacc 27900
ctgcagcagg gcctgcccga cttcaccagc cagagcatgc tgcagaactt caggactttc 27960
atcctggagc gctcgggcat cctgccggcc acttgctgcg cgctgcccag cgacttcgtg 28020
cccatcaagt acagggagtg cccgccgccg ctctggggcc actgctacct cttccagctg 28080
gccaactacc tcgcctacca ctcggacctc atggaagacg tgagcggcga gggcctgctc 28140
gagtgccact gccgctgcaa cctctgcacg ccccaccgct ctctagtctg caacccgcag 28200
ctgctcagcg agagtcagat tatcggtacc ttcgagctgc agggtccctc gcctgacgag 28260
aagtccgcgg ctccagggct gaaactcact ccggggctgt ggacttccgc ctacctacgc 28320
aaatttgtac ctgaggacta ccacgcccac gagatcaggt tctacgaaga ccaatcccgc 28380
ccgcccaagg cggagctcac cgcctgcgtc atcacccagg ggcacatcct gggccaattg 28440
caagccatca acaaagcccg ccgagagttc ttgctgaaaa agggtcgggg ggtgtacctg 28500
gacccccagt ccggcgagga gctaaacccg ctacccccgc cgccgcccca gcagcgggac 28560
cttgcttccc aggatggcac ccagaaagaa gcagcagccg ccgccgccgc cgcagccata 28620
catgcttctg gaggaagagg aggaggactg ggacagtcag gcagaggagg tttcggacga 28680
ggagcaggag gagatgatgg aagactggga ggaggacagc agcctagacg aggaagcttc 28740
agaggccgaa gaggtggcag acgcaacacc atcgccctcg gtcgcagccc cctcgccggg 28800
gcccctgaaa tcctccgaac ccagcaccag cgctataacc tccgctcctc cggcgccggc 28860
gccacccgcc cgcagaccca accgtagatg ggacaccaca ggaaccgggg tcggtaagtc 28920
caagtgcccg ccgccgccac cgcagcagca gcagcagcag cgccagggct accgctcgtg 28980
gcgcgggcac aagaacgcca tagtcgcctg cttgcaagac tgcgggggca acatctcttt 29040
cgcccgccgc ttcctgctat tccaccacgg ggtcgccttt ccccgcaatg tcctgcatta 29100
ctaccgtcat ctctacagcc cctactgcag cggcgaccca gaggcggcag cggcagccac 29160
agcggcgacc accacctagg aagatatcct ccgcgggcaa gacagcggca gcagcggcca 29220
ggagacccgc ggcagcagcg gcgggagcgg tgggcgcact gcgcctctcg cccaacgaac 29280
ccctctcgac ccgggagctc agacacagga tcttccccac tttgtatgcc atcttccaac 29340
agagcagagg ccaggagcag gagctgaaaa taaaaaacag atctctgcgc tccctcaccc 29400
gcagctgtct gtatcacaaa agcgaagatc agcttcggcg cacgctggag gacgcggagg 29460
cactcttcag caaatactgc gcgctcactc ttaaagacta gctccgcgcc cttctcgaat 29520
ttaggcggga gaaaactacg tcatcgccgg ccgccgccca gcccgcccag ccgagatgag 29580
caaagagatt cccacgccat acatgtggag ctaccagccg cagatgggac tcgcggcggg 29640
agcggcccag gactactcca cccgcatgaa ctacatgagc gcgggacccc acatgatctc 29700
acaggtcaac gggatccgcg cccagcgaaa ccaaatactg ctggaacagg cggccatcac 29760
cgccacgccc cgccataatc tcaacccccg aaattggccc gccgccctcg tgtaccagga 29820
aaccccctcc gccaccaccg tactacttcc gcgtgacgcc caggccgaag tccagatgac 29880
taactcaggg gcgcagctcg cgggcggctt tcgtcacggg gcgcggccgc tccgaccagg 29940
tataagacac ctgatgatca gaggccgagg tatccagctc aacgacgagt cggtgagctc 30000
ttcgctcggt ctccgtccgg acggaacttt ccagctcgcc ggatccggcc gctcttcgtt 30060
cacgccccgc caggcgtacc tgactctgca gacctcgtcc tcggagcccc gctccggcgg 30120
catcggaacc ctccagttcg tggaggagtt cgtgccctcg gtctacttca accccttctc 30180
gggacctccc ggacgctacc ccgaccagtt cattccgaac tttgacgcgg tgaaggactc 30240
ggcggacggc tacgactgaa tgtcaggtgt cgaggcagag cagcttcgcc tgagacacct 30300
cgagcactgc cgccgccaca agtgcttcgc ccgcggttct ggtgagttct gctactttca 30360
gctacccgag gagcataccg aggggccggc gcacggcgtc cgcctgacca cccagggcga 30420
ggttacctgt tccctcatcc gggagtttac cctccgtccc ctgctagtgg agcgggagcg 30480
gggtccctgt gtcctaacta tcgcctgcaa ctgccctaac cctggattac atcaagatct 30540
ttgctgtcat ctctgtgctg agtttaataa acgctgagat cagaatctac tgggatttag 30600
tcccctttaa ctaatcaaac actggaatca ataaaaagaa tcacttactt aaaatcagac 30660
agcaggtctc tgtccagttt attcagcagc acctccttcc cctcctccca actctggtac 30720
tccaaacgcc ttctggcggc aaacttcctc cacaccctga agggaatgtc agattcttgc 30780
tcctgtccct ccgcacccac tatcttcatg ttgttgcaga tgaagcgcac caaaacgtct 30840
gacgagagct tcaaccccgt gtacccctat gacacggaaa gcggccctcc ctccgtccct 30900
ttcctcaccc ctcccttcgt gtctcccgat ggattccaag aaagtccccc cggggtcctg 30960
tctctgaacc tggccgagcc cctggtcact tcccacggca tgctcgccct gaaaatggga 31020
agtggcctct ccctggacga cgctggcaac ctcacctctc aagatatcac caccgctagc 31080
cctcccctca aaaaaaccaa gaccaacctc agcctagaaa cctcatcccc cctaactgtg 31140
agcacctcag gcgccctcac cgtagcagcc gccgctcccc tggcggtggc cggcacctcc 31200
ctcaccatgc aatcagaggc ccccctgaca gtacaggatg caaaactcac cctggccacc 31260
aaaggccccc tgaccgtgtc tgaaggcaaa ctggccttgc aaacatcggc cccgctgacg 31320
gccgctgaca gcagcaccct cacagtcagt gccacaccac cccttagcac aagcaatggc 31380
agcttgggta ttgacatgca agcccccatt tacaccacca atggaaaact aggacttaac 31440
tttggcgctc ccctgcatgt ggtagacagc ctaaatgcac tgactgtagt tactggccaa 31500
ggtcttacga taaacggaac agccctacaa actagagtct caggtgccct caactatgac 31560
acatcaggaa acctagaatt gagagctgca gggggtatgc gagttgatgc aaatggtcaa 31620
cttatccttg atgtagctta cccatttgat gcacaaaaca atctcagcct taggcttgga 31680
cagggacccc tgtttgttaa ctctgcccac aacttggatg ttaactacaa cagaggcctc 31740
tacctgttca catctggaaa taccaaaaag ctagaagtta atatcaaaac agccaagggt 31800
ctcatttatg atgacactgc tatagcaatc aatgcgggtg atgggctaca gtttgactca 31860
ggctcagata caaatccatt aaaaactaaa cttggattag gactggatta tgactccagc 31920
agagccataa ttgctaaact gggaactggc ctaagctttg acaacacagg tgccatcaca 31980
gtaggcaaca aaaatgatga caagcttacc ttgtggacca caccagaccc atcccctaac 32040
tgtagaatct attcagagaa agatgctaaa ttcacacttg ttttgactaa atgcggcagt 32100
caggtgttgg ccagcgtttc tgttttatct gtaaaaggta gccttgcgcc catcagtggc 32160
acagtaacta gtgctcagat tgtcctcaga tttgatgaaa atggagttct actaagcaat 32220
tcttcccttg accctcaata ctggaactac agaaaaggtg accttacaga gggcactgca 32280
tataccaacg cagtgggatt tatgcccaac ctcacagcat acccaaaaac acagagccaa 32340
actgctaaaa gcaacattgt aagtcaggtt tacttgaatg gggacaaatc caaacccatg 32400
accctcacca ttaccctcaa tggaactaat gaaacaggag atgccacagt aagcacttac 32460
tccatgtcat tctcatggaa ctggaatgga agtaattaca ttaatgaaac gttccaaacc 32520
aactccttca ccttctccta catcgcccaa gaataaaaag catgacgctg ttgatttgat 32580
tcaatgtgtt tctgttttat tttcaagcac aacaaaatca ttcaagtcat tcttccatct 32640
tagcttaata gacacagtag cttaatagac ccagtagtgc aaagccccat tctagcttat 32700
aactagtgga gaagtactcg cctacatggg ggtagagtca taatcgtgca tcaggatagg 32760
gcggtggtgc tgcagcagcg cgcgaataaa ctgctgccgc cgccgctccg tcctgcagga 32820
atacaacatg gcagtggtct cctcagcgat gattcgcacc gcccgcagca taaggcgcct 32880
tgtcctccgg gcacagcagc gcaccctgat ctcacttaaa tcagcacagt aactgcagca 32940
cagcaccaca atattgttca aaatcccaca gtgcaaggcg ctgtatccaa agctcatggc 33000
ggggaccaca gaacccacgt ggccatcata ccacaagcgc aggtagatta agtggcgacc 33060
cctcataaac acgctggaca taaacattac ctcttttggc atgttgtaat tcaccacctc 33120
ccggtaccat ataaacctct gattaaacat ggcgccatcc accaccatcc taaaccagct 33180
ggccaaaacc tgcccgccgg ctatacactg cagggaaccg ggactggaac aatgacagtg 33240
gagagcccag gactcgtaac catggatcat catgctcgtc atgatatcaa tgttggcaca 33300
acacaggcac acgtgcatac acttcctcag gattacaagc tcctcccgcg ttagaaccat 33360
atcccaggga acaacccatt cctgaatcag cgtaaatccc acactgcagg gaagacctcg 33420
cacgtaactc acgttgtgca ttgtcaaagt gttacattcg ggcagcagcg gatgatcctc 33480
cagtatggta gcgcgggttt ctgtctcaaa aggaggtaga cgatccctac tgtacggagt 33540
gcgccgagac aaccgagatc gtgttggtcg tagtgtcatg ccaaatggaa cgccggacgt 33600
agtcatattt cctgaagtct tagatctctc aacgcagcac cagcaccaac acttcgcagt 33660
gtaaaaggcc aagtgccgag agagtatata taggaataaa aagtgacgta aacgggcaaa 33720
gtccaaaaaa cgcccagaaa aaccgcacgc gaacctacgc cccgaaacga aagccaaaaa 33780
acactagaca ctcccttccg gcgtcaactt ccgctttccc acgctacgtc acttgcccca 33840
gtcaaacaaa ctacatatcc cgaacttcca agtcgccacg cccaaaacac cgcctacacc 33900
tccccgcccg ccggcccgcc cccaaacccg cctcccgccc cgcgccccgc cccgcgccgc 33960
ccatctcatt atcatattgg cttcaatcca aaataaggta tattattgat gatggtttaa 34020
acggatcctc tagagtcgac ctgcaggcat gcaagcttga gtattctata gtgtcaccta 34080
aatagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 34140
attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 34200
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 34260
tgccagctgc attaatgaat cggccaacgc gaaccccttg cggccgcccg ggccgtcgac 34320
caattctcat gtttgacagc ttatcatcga atttctgcca ttcatccgct tattatcact 34380
tattcaggcg tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc 34440
cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa 34500
gccatcacaa acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg 34560
cgtataatat ttgcccatgg tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt 34620
taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat 34680
aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat 34740
gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt 34800
ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc 34860
tttcattgcc atacggaatt ccggatgagc attcatcagg cgggcaagaa tgtgaataaa 34920
ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag 34980
ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt 35040
acgatgccat tgggatatat caacggtggt atatccagtg atttttttct ccattttagc 35100
ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg atcttatttc 35160
attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt 35220
ggcccagggc ttcccggtat caacagggac accaggattt atttattctg cgaagtgatc 35280
ttccgtcaca ggtatttatt cgcgataagc tcatggagcg gcgtaaccgt cgcacaggaa 35340
ggacagagaa agcgcggatc tgggaagtga cggacagaac ggtcaggacc tggattgggg 35400
aggcggttgc cgccgctgct gctgacggtg tgacgttctc tgttccggtc acaccacata 35460
cgttccgcca ttcctatgcg atgcacatgc tgtatgccgg tataccgctg aaagttctgc 35520
aaagcctgat gggacataag tccatcagtt caacggaagt ctacacgaag gtttttgcgc 35580
tggatgtggc tgcccggcac cgggtgcagt ttgcgatgcc ggagtctgat gcggttgcga 35640
tgctgaaaca attatcctga gaataaatgc cttggccttt atatggaaat gtggaactga 35700
gtggatatgc tgtttttgtc tgttaaacag agaagctggc tgttatccac tgagaagcga 35760
acgaaacagt cgggaaaatc tcccattatc gtagagatcc gcattattaa tctcaggagc 35820
ctgtgtagcg tttataggaa gtagtgttct gtcatgatgc ctgcaagcgg taacgaaaac 35880
gatttgaata tgccttcagg aacaatagaa atcttcgtgc ggtgttacgt tgaagtggag 35940
cggattatgt cagcaatgga cagaacaacc taatgaacac agaaccatga tgtggtctgt 36000
ccttttacag ccagtagtgc tcgccgcagt cgagcgacag ggcgaagccc tcgagtgagc 36060
gaggaagcac cagggaacag cacttatata ttctgcttac acacgatgcc tgaaaaaact 36120
tcccttgggg ttatccactt atccacgggg atatttttat aattattttt tttatagttt 36180
ttagatcttc ttttttagag cgccttgtag gcctttatcc atgctggttc tagagaaggt 36240
gttgtgacaa attgcccttt cagtgtgaca aatcaccctc aaatgacagt cctgtctgtg 36300
acaaattgcc cttaaccctg tgacaaattg ccctcagaag aagctgtttt ttcacaaagt 36360
tatccctgct tattgactct tttttattta gtgtgacaat ctaaaaactt gtcacacttc 36420
acatggatct gtcatggcgg aaacagcggt tatcaatcac aagaaacgta aaaatagccc 36480
gcgaatcgtc cagtcaaacg acctcactga ggcggcatat agtctctccc gggatcaaaa 36540
acgtatgctg tatctgttcg ttgaccagat cagaaaatct gatggcaccc tacaggaaca 36600
tgacggtatc tgcgagatcc atgttgctaa atatgctgaa atattcggat tgacctctgc 36660
ggaagccagt aaggatatac ggcaggcatt gaagagtttc gcggggaagg aagtggtttt 36720
ttatcgccct gaagaggatg ccggcgatga aaaaggctat gaatcttttc cttggtttat 36780
caaacgtgcg cacagtccat ccagagggct ttacagtgta catatcaacc catatctcat 36840
tcccttcttt atcgggttac agaaccggtt tacgcagttt cggcttagtg aaacaaaaga 36900
aatcaccaat ccgtatgcca tgcgtttata cgaatccctg tgtcagtatc gtaagccgga 36960
tggctcaggc atcgtctctc tgaaaatcga ctggatcata gagcgttacc agctgcctca 37020
aagttaccag cgtatgcctg acttccgccg ccgcttcctg caggtctgtg ttaatgagat 37080
caacagcaga actccaatgc gcctctcata cattgagaaa aagaaaggcc gccagacgac 37140
tcatatcgta ttttccttcc gcgatatcac ttccatgacg acaggatagt ctgagggtta 37200
tctgtcacag atttgagggt ggttcgtcac atttgttctg acctactgag ggtaatttgt 37260
cacagttttg ctgtttcctt cagcctgcat ggattttctc atactttttg aactgtaatt 37320
tttaaggaag ccaaatttga gggcagtttg tcacagttga tttccttctc tttcccttcg 37380
tcatgtgacc tgatatcggg ggttagttcg tcatcattga tgagggttga ttatcacagt 37440
ttattactct gaattggcta tccgcgtgtg tacctctacc tggagttttt cccacggtgg 37500
atatttcttc ttgcgctgag cgtaagagct atctgacaga acagttcttc tttgcttcct 37560
cgccagttcg ctcgctatgc tcggttacac ggctgcggcg agcgctagtg ataataagtg 37620
actgaggtat gtgctcttct tatctccttt tgtagtgttg ctcttatttt aaacaacttt 37680
gcggtttttt gatgactttg cgattttgtt gttgctttgc agtaaattgc aagatttaat 37740
aaaaaaacgc aaagcaatga ttaaaggatg ttcagaatga aactcatgga aacacttaac 37800
cagtgcataa acgctggtca tgaaatgacg aaggctatcg ccattgcaca gtttaatgat 37860
gacagcccgg aagcgaggaa aataacccgg cgctggagaa taggtgaagc agcggattta 37920
gttggggttt cttctcaggc tatcagagat gccgagaaag cagggcgact accgcacccg 37980
gatatggaaa ttcgaggacg ggttgagcaa cgtgttggtt atacaattga acaaattaat 38040
catatgcgtg atgtgtttgg tacgcgattg cgacgtgctg aagacgtatt tccaccggtg 38100
atcggggttg ctgcccataa aggtggcgtt tacaaaacct cagtttctgt tcatcttgct 38160
caggatctgg ctctgaaggg gctacgtgtt ttgctcgtgg aaggtaacga cccccaggga 38220
acagcctcaa tgtatcacgg atgggtacca gatcttcata ttcatgcaga agacactctc 38280
ctgcctttct atcttgggga aaaggacgat gtcacttatg caataaagcc cacttgctgg 38340
ccggggcttg acattattcc ttcctgtctg gctctgcacc gtattgaaac tgagttaatg 38400
ggcaaatttg atgaaggtaa actgcccacc gatccacacc tgatgctccg actggccatt 38460
gaaactgttg ctcatgacta tgatgtcata gttattgaca gcgcgcctaa cctgggtatc 38520
ggcacgatta atgtcgtatg tgctgctgat gtgctgattg ttcccacgcc tgctgagttg 38580
tttgactaca cctccgcact gcagtttttc gatatgcttc gtgatctgct caagaacgtt 38640
gatcttaaag ggttcgagcc tgatgtacgt attttgctta ccaaatacag caatagtaat 38700
ggctctcagt ccccgtggat ggaggagcaa attcgggatg cctggggaag catggttcta 38760
aaaaatgttg tacgtgaaac ggatgaagtt ggtaaaggtc agatccggat gagaactgtt 38820
tttgaacagg ccattgatca acgctcttca actggtgcct ggagaaatgc tctttctatt 38880
tgggaacctg tctgcaatga aattttcgat cgtctgatta aaccacgctg ggagattaga 38940
taatgaagcg tgcgcctgtt attccaaaac atacgctcaa tactcaaccg gttgaagata 39000
cttcgttatc gacaccagct gccccgatgg tggattcgtt aattgcgcgc gtaggagtaa 39060
tggctcgcgg taatgccatt actttgcctg tatgtggtcg ggatgtgaag tttactcttg 39120
aagtgctccg gggtgatagt gttgagaaga cctctcgggt atggtcaggt aatgaacgtg 39180
accaggagct gcttactgag gacgcactgg atgatctcat cccttctttt ctactgactg 39240
gtcaacagac accggcgttc ggtcgaagag tatctggtgt catagaaatt gccgatggga 39300
gtcgccgtcg taaagctgct gcacttaccg aaagtgatta tcgtgttctg gttggcgagc 39360
tggatgatga gcagatggct gcattatcca gattgggtaa cgattatcgc ccaacaagtg 39420
cttatgaacg tggtcagcgt tatgcaagcc gattgcagaa tgaatttgct ggaaatattt 39480
ctgcgctggc tgatgcggaa aatatttcac gtaagattat tacccgctgt atcaacaccg 39540
ccaaattgcc taaatcagtt gttgctcttt tttctcaccc cggtgaacta tctgcccggt 39600
caggtgatgc acttcaaaaa gcctttacag ataaagagga attacttaag cagcaggcat 39660
ctaaccttca tgagcagaaa aaagctgggg tgatatttga agctgaagaa gttatcactc 39720
ttttaacttc tgtgcttaaa acgtcatctg catcaagaac tagtttaagc tcacgacatc 39780
agtttgctcc tggagcgaca gtattgtata agggcgataa aatggtgctt aacctggaca 39840
ggtctcgtgt tccaactgag tgtatagaga aaattgaggc cattcttaag gaacttgaaa 39900
agccagcacc ctgatgcgac cacgttttag tctacgttta tctgtcttta cttaatgtcc 39960
tttgttacag gccagaaagc ataactggcc tgaatattct ctctgggccc actgttccac 40020
ttgtatcgtc ggtctgataa tcagactggg accacggtcc cactcgtatc gtcggtctga 40080
ttattagtct gggaccacgg tcccactcgt atcgtcggtc tgattattag tctgggacca 40140
cggtcccact cgtatcgtcg gtctgataat cagactggga ccacggtccc actcgtatcg 40200
tcggtctgat tattagtctg ggaccatggt cccactcgta tcgtcggtct gattattagt 40260
ctgggaccac ggtcccactc gtatcgtcgg tctgattatt agtctggaac cacggtccca 40320
ctcgtatcgt cggtctgatt attagtctgg gaccacggtc ccactcgtat cgtcggtctg 40380
attattagtc tgggaccacg atcccactcg tgttgtcggt ctgattatcg gtctgggacc 40440
acggtcccac ttgtattgtc gatcagacta tcagcgtgag actacgattc catcaatgcc 40500
tgtcaagggc aagtattgac atgtcgtcgt aacctgtaga acggagtaac ctcggtgtgc 40560
ggttgtatgc ctgctgtgga ttgctgctgt gtcctgctta tccacaacat tttgcgcacg 40620
gttatgtgga caaaatacct ggttacccag gccgtgccgg cacgttaacc gggctgcatc 40680
cgatgcaagt gtgtcgctgt cgacgagctc gcgagctcgg acatgaggtt gccccgtatt 40740
cagtgtcgct gatttgtatt gtctgaagtt gtttttacgt taagttgatg cagatcaatt 40800
aatacgatac ctgcgtcata attgattatt tgacgtggtt tgatggcctc cacgcacgtt 40860
gtgatatgta gatgataatc attatcactt tacgggtcct ttccggtgat ccgacaggtt 40920
acggggcggc gacctcgcgg gttttcgcta tttatgaaaa ttttccggtt taaggcgttt 40980
ccgttcttct tcgtcataac ttaatgtttt tatttaaaat accctctgaa aagaaaggaa 41040
acgacaggtg ctgaaagcga gctttttggc ctctgtcgtt tcctttctct gtttttgtcc 41100
gtggaatgaa caatggaagt ccgagctcat cgctaataac ttcgtatagc atacattata 41160
cgaagttata ttcgatgcgg ccgcaagggg ttcgcgtcag cgggtgttgg cgggtgtcgg 41220
ggctggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt 41280
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc gccattcagg 41340
ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg 41400
aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga 41460
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attcgagctc 41520
ggtacccggg gatcctcgtt taaac 41545
<210> 54
<211> 42220
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (16789)..(16789)
<223> a, c, t, g, unknown or other
<400> 54
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg gacgaccagc gggacctgat cagcaacaac 1380
gagcagctgc ccatgctggg ccagaggcct ggcgcccctg agagcaagtg tagcagaggc 1440
gccgtgtaca ccgtgttcag catcctggtg gccctgctgc tggccggaca ggccaccacc 1500
gcctactttc tgtatcagca gcagggacgg ctggacaagc tgaccgtgac cagccagaac 1560
ctgcagctgg aaaacctgcg gatgaagctg cccaagcccg ccaagcccct gagccagatg 1620
agaatggcca cccccctgct gatgcaggcc ctgcctatgg ccggcctgcc ccagaaaccc 1680
atgcagaacg ccaccaagca cggcaacatg accgaggacc acgtgatgca tctgctgctg 1740
aacgccgacc ccctgaaggt gtacccccca ctgaagggca gcctgagcga gaacctgaag 1800
cacctgaaga acaccatgga aaccatggac tggaaggtgt tcgagagctg gctgcaccac 1860
tggctgctgt tcgagatgag caagcacagc ctggaacaga agcccaccga ggcccctccc 1920
aaagagagcc tggaactgga agatcccagc agcggcctgg gcgtgaccaa gcaggatctg 1980
ggccccgtgg ctatgtccga ggactttctg attctgatcg ccatcctggt gatcgtgatt 2040
ctcgtgggca caatcacaac cctggtgggc gccatcggcg gcattagggc caggaggagc 2100
ttcctcttca tttgcatctt cttcctgttc ctctccctct tcctgacaat cctcgccctg 2160
ctgctgggct tcagctggct cctgctggtg gccatcctgt tctgggtgct ctggctggtc 2220
atcctcattc tgctgctgct ggtgtaccct attcctcacc accccctgcc cacctccctc 2280
aggtttagaa tgaagcagag ggtgagcagc gaccccacag gttctgacag aagccctcag 2340
ggcagccata atagcctgaa ctcccccgat gaggaggacc ccaaggatga caccaagcaa 2400
cctctgtgca acatgaccca gggcggacct cccgtcaatg gacagctcct cggacaacat 2460
gctcaatgcc cccctcacta tccctgctgc catattcagc atcccgacgg agaggattcc 2520
gatggagacg atggcaagtc ctggggcgat gccggagagg aagacaatgg ccctaacgac 2580
cctaacaccg ccagcaccag agagtccatt tacgaggacc tcagataccc cacaagggac 2640
gccaatggcg agtatgagaa cgtgggatac ccccctaggg acggagatgc ccctcatagg 2700
ctcggagagc ctgtgtatga cgatgtggag caagccaccg ctaacgaggt gagaatctcc 2760
cctctgttca gactgcccta cggaagcgct ttcggacctg gcccccagcc tggacccatt 2820
ctggagagct ccacatgggg ctttctggtc ttcacacaga cctccctgtt cgccgacgac 2880
attgccgacg ctattaggga ctactgcaca acccaccctg gccccacaag gaacacccag 2940
gtggtcctca tgaacttcga gggcagcgga gtgcccctgc ctatgttttt tccccctgga 3000
gaggagacag aagagcagag agagggcgat agagctagcg actccgacga gtccgaagac 3060
gctcagatcc tgaccgtgtt ctgcctgttt tgccagtgga cactctttat ctgcctggga 3120
atcaggatga tctgtaactg gaggggcaaa ctcaccagga tcatctgcct gaagttctgc 3180
ctctacggac tgatttccgc ctccctgtcc ttcggctggt acgcttttct gaaggaagtg 3240
accctcccca ccacagccac cgttgatcct aggcaactcc ccctgttcct cttcatcctg 3300
agctccgtgc tggtgattct cgccatcatg atggagtttc aaacatcctc cagcctcttc 3360
gctgctctgt tcgtgattat cgccggaatg ctgtgcgtca cagtgggcgt gatttttctg 3420
ctggctggcg tcaagcctct cctgagcggc atgatctgcg cctccggcat cacaatgctc 3480
gtgctcggcg tcgtgctgct ggtggtgtgc accagagatg agcacgctat ttccgccagc 3540
caccatgcta gcgatggctc cgtgaatcag cagaaggaaa atcagcccca gaccctggag 3600
gaatgcaaga cagatcagga gaggaagagg tacaggaaca ggctggcctc caggaggtgt 3660
agagctaagt tcaggaacca gctggaacat tttaggacag tcgccgctgc taagacagag 3720
gagaacaaca ggctcagggt gctcatcagg cagatgtgtc ctacactgga cgtggaatcc 3780
atcgtcccct ccacctccgc cggctaccac gagcctctga atcacctgac ccacagcccc 3840
agcccttgtc atcacaggga tgaacccccc tccagaagcc ccagccctca acccaccgtc 3900
tccgagcagt cccagcagtc ccccaggcag cagagccctc aaggcacatc ccagggttct 3960
acaagacctc aggtgcctgg aggcgccacc accagaaaaa gaggcggcgt gagaggccaa 4020
cctgccaagt gtcacggcaa gtacaccaca accgccgagg gactgaccgc tctcctgaat 4080
aggaggcaca gccccaggac atccaacgag ggcaggtgga tgaatggagt catggctgtg 4140
aacctctcca aatggcccct gtacagcctg aggagagccc tggccctcgc catggctcct 4200
agaaggaggc tctccggccc tccctggctg acagtgctgc tgctgctgtc cacactgagc 4260
gtggccgccc tgctgattct cttcctgatt ttcagcgccg gcgccaccat tagcacagaa 4320
gccagcctgc tggtcctgct cctgctgttt gtgaccctgc tgctgcctct cctgtcctcc 4380
aacggactcc agctccctgc cgccctgatt ctgatccagt gtttcctcct ggccgctgat 4440
tatctcgcct acctgattct gcctaccatt atgcccaggg gcagaagcac aggaaggaag 4500
ggcagggaca cagagaaaga gaggagcaga tcccctctca gagctcctgg cggttctgat 4560
ggacccagca caagggctgg ctgtggagcc ggaccctgtc agctgagcag ccccatcgcc 4620
ggaaacaacg gcaatgaagg cggcgagggc gacgactaca agagctggag gaagcccgag 4680
gaagaggaca acggccccaa tgaccccaat accaacaaca ggattgagga tggagacggc 4740
gacgacggaa aatcctggag gaatcctgag gaggaggata acagaaagca ggacaggctg 4800
ggcaccaagc ctttcatgga cctcgacgga accggcggag gcgagggcta cagccagatg 4860
gtccctatcg ccaccgcccc cggaagcggc cacgccgcta cctatcagga tctccaggcc 4920
gccccttaca tcatctggcc tctccagacc gattgccagc ctgtggctac caccttcgcc 4980
tcccccggac agatccagtg gtatacaagc gccgtccccc agcccacaga gcattgctcc 5040
cagtttacaa acgctcccac cgtcaaccag cagcagccta ttagccaacc ccagcccgaa 5100
aatccccctg ctttcacctt tacccagccc gcttccatca ttcccggcgt cattagcgcc 5160
tccaacctga acgtgagcgc ttcccctatc atccctagcg accatgtcct ccccatcatt 5220
acctccgtga ccagcctcgc ccaacctaat aacatggccg gccactggta tgagagcgtg 5280
attcccggcc tgttcctctg ccccctgatc ctcccttccc tgttctggat ttgctccctg 5340
ctgaccttcc tggtgggcca cggagccaat attgtgagcg ccgtcctgtt cctcgtgctg 5400
gcttggtgtc tcctcattgc caactggaac gtgacaagag aggacttcgt gtccggcagg 5460
agaagctcca tgagcagcct gtccgtggcc gcttccaccg ccacagccat gttcgccagc 5520
ttcctcaccc tgagctttga tggcctgggc ctgctgctgt ttggcaccgc cctggtgatc 5580
cagacaattt acgtgctgta tctggtggtc atggagatca ccgtgtggat catgatgttt 5640
aggtatctcc acttttggat caccctgctg ttcctgctga gccccattat tctctccgtc 5700
gcctgtctca tcatccaatc ctccgccctg ctgatcgagg ctgtggtcgt caccaccatc 5760
acagtcctgg ccatttttct gtggctccct cctcaaggcg ctgaggccga tctcggcacc 5820
gccctgctga ttctgaatac cgccctgtgc ctggtcgtgc tgatcctgac cgctatccct 5880
acatgatgat gagcggccgc gatctgctgt gccttctagt tgccagccat ctgttgtttg 5940
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 6000
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 6060
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 6120
gggctctatg gccgatcagc gatcgctgag gtgggtgagt gggcgtggcc tggggtggtc 6180
atgaaaatat ataagttggg ggtcttaggg tctctttatt tgtgttgcag agaccgccgg 6240
agccatgagc gggagcagca gcagcagcag tagcagcagc gccttggatg gcagcatcgt 6300
gagcccttat ttgacgacgc ggatgcccca ctgggccggg gtgcgtcaga atgtgatggg 6360
ctccagcatc gacggccgac ccgtcctgcc cgcaaattcc gccacgctga cctatgcgac 6420
cgtcgcgggg acgccgttgg acgccaccgc cgccgccgcc gccaccgcag ccgcctcggc 6480
cgtgcgcagc ctggccacgg actttgcatt cctgggacca ctggcgacag gggctacttc 6540
tcgggccgct gctgccgccg ttcgcgatga caagctgacc gccctgctgg cgcagttgga 6600
tgcgcttact cgggaactgg gtgacctttc tcagcaggtc atggccctgc gccagcaggt 6660
ctcctccctg caagctggcg ggaatgcttc tcccacaaat gccgtttaag ataaataaaa 6720
ccagactctg tttggattaa agaaaagtag caagtgcatt gctctcttta tttcataatt 6780
ttccgcgcgc gataggccct agaccagcgt tctcggtcgt tgagggtgcg gtgtatcttc 6840
tccaggacgt ggtagaggtg gctctggacg ttgagataca tgggcatgag cccgtcccgg 6900
gggtggaggt agcaccactg cagagcttca tgctccgggg tggtgttgta gatgatccag 6960
tcgtagcagg agcgctgggc atggtgccta aaaatgtcct tcagcagcag gccgatggcc 7020
agggggaggc ccttggtgta agtgtttaca aaacggttaa gttgggaagg gtgcattcgg 7080
ggagagatga tgtgcatctt ggactgtatt tttagattgg cgatgtttcc gcccagatcc 7140
cttctgggat tcatgttgtg caggaccacc agtacagtgt atccggtgca cttggggaat 7200
ttgtcatgca gcttagaggg aaaagcgtgg aagaacttgg agacgccttt gtggcctccc 7260
agattttcca tgcattcgtc catgatgatg gcaatgggcc cgcgggaggc agcttgggca 7320
aagatatttc tggggtcgct gacgtcgtag ttgtgttcca gggtgaggtc gtcataggcc 7380
atttttacaa agcgcgggcg gagggtgccc gactggggga tgatggtccc ctctggccct 7440
ggggcgtagt tgccctcgca gatctgcatt tcccaggcct taatctcgga ggggggaatc 7500
atatccacct gcggggcgat gaagaaaacg gtttccggag ccggggagat taactgggat 7560
gagagcaggt ttctaagcag ctgtgatttt ccacaaccgg tgggcccata aataacacct 7620
ataaccggtt gcagctggta gtttagagag ctgcagctgc cgtcgtcccg gaggaggggg 7680
gccacctcgt tgagcatgtc cctgacgcgc atgttctccc cgaccagatc cgccagaagg 7740
cgctcgccgc ccagggacag cagctcttgc aaggaagcaa agtttttcag cggcttgagg 7800
ccgtccgccg tgggcatgtt tttcagggtc tggctcagca gctccaggcg gtcccagagc 7860
tcggtgacgt gctctacggc atctctatcc agcatatctc ctcgtttcgc gggttggggc 7920
gactttcgct gtagggcacc aagcggtggt cgtccagcgg ggccagagtc atgtccttcc 7980
atgggcgcag ggtcctcgtc agggtggtct gggtcacggt gaaggggtgc gctccgggct 8040
gagcgcttgc caaggtgcgc ttgaggctgg ttctgctggt gctgaagcgc tgccggtctt 8100
cgccctgcgc gtcggccagg tagcatttga ccatggtgtc atagtccagc ccctccgcgg 8160
cgtgtccctt ggcgcgcagc ttgcccttgg aggtggcgcc gcacgagggg cagagcaggc 8220
tcttgagcgc gtagagcttg ggggcgagga agaccgattc gggggagtag gcgtccgcgc 8280
cgcagacccc gcacacggtc tcgcactcca ccagccaggt gagctcgggg cgcgccgggt 8340
caaaaaccag gtttccccca tgctttttga tgcgtttctt acctcgggtc tccatgaggt 8400
ggtgtccccg ctcggtgacg aagaggctgt ccgtgtctcc gtagaccgac ttgaggggtc 8460
ttttctccag gggggtccct cggtcttcct cgtagaggaa ctcggaccac tctgagacga 8520
aggcccgcgt ccaggccagg acgaaggagg ctatgtggga ggggtagcgg tcgttgtcca 8580
ctagggggtc caccttctcc aaggtgtgaa gacacatgtc gccttcctcg gcgtccagga 8640
aggtgattgg cttgtaggtg taggccacgt gaccgggggt tcctgacggg ggggtataaa 8700
agggggtggg ggcgcgctcg tcgtcactct cttccgcatc gctgtctgcg agggccagct 8760
gctggggtga gtattccctc tcgaaggcgg gcatgacctc cgcgctgagg ttgtcagttt 8820
ccaaaaacga ggaggatttg atgttcacct gtcccgaggt gatacctttg agggtacccg 8880
cgtccatctg gtcagaaaac acgatctttt tattgtccag cttggtggcg aacgacccgt 8940
agagggcgtt ggagagcagc ttggcgatgg agcgcagggt ctggttcttg tccctgtcgg 9000
cgcgctcctt ggccgcgatg ttgagctgca cgtactcgcg cgcgacgcag cgccactcgg 9060
ggaagacggt ggtgcgctcg tcgggcacca ggcgcacgcg ccagccgcgg ttgtgcaggg 9120
tgaccaggtc cacgctggtg gcgacctcgc cgcgcaggcg ctcgttggtc cagcagagac 9180
ggccgccctt gcgcgagcag aaggggggca gggggtcgag ctgggtctcg tccggggggt 9240
ccgcgtccac ggtgaaaacc ccggggcgca ggcgcgcgtc gaagtagtct atcttgcaac 9300
cttgcatgtc cagcgcctgc tgccagtcgc gggcggcgag cgcgcgctcg taggggttga 9360
gcggcgggcc ccagggcatg gggtgggtga gtgcggaggc gtacatgccg cagatgtcat 9420
agacgtagag gggctcccgc aggaccccga tgtaggtggg gtagcagcgg ccgccgcgga 9480
tgctggcgcg cacgtagtca tacagctcgt gcgagggggc gaggaggtcg gggcccaggt 9540
tggtgcgggc ggggcgctcc gcgcggaaga cgatctgcct gaagatggca tgcgagttgg 9600
aagagatggt ggggcgctgg aagacgttga agctggcgtc ctgcaggccg acggcgtcgc 9660
gcacgaagga ggcgtaggag tcgcgcagct tgtgtaccag ctcggcggtg acctgcacgt 9720
cgagcgcgca gtagtcgagg gtctcgcgga tgatgtcata tttagcctgc cccttctttt 9780
tccacagctc gcggttgagg acaaactctt cgcggtcttt ccagtactct tggatcggga 9840
aaccgtccgg ttccgaacgg taagagccta gcatgtagaa ctggttgacg gcctggtagg 9900
cgcagcagcc cttctccacg gggagggcgt aggcctgcgc ggccttgcgg agcgaggtgt 9960
gggtcagggc gaaggtgtcc ctgaccatga ctttgaggta ctggtgcttg aagtcggagt 10020
cgtcgcagcc gccccgctcc cagagcgaga agtcggtgcg cttcttggag cgggggttgg 10080
gcagagcgaa ggtgacatcg ttgaagagga ttttgcccgc gcggggcatg aagttgcggg 10140
tgatgcggaa gggccccggc acttcagagc ggttgttgat gacctgggcg gcgagcacga 10200
tctcgtcgaa gccgttgatg ttgtggccca cgatgtagag ttccaggaag cggggccggc 10260
cctttacggt gggcagcttc tttagctctt cgtaggtgag ctcctcgggc gaggcgaggc 10320
cgtgctcggc cagggcccag tccgcgaggt gcgggttgtc tctgaggaag gacttccaga 10380
ggtcgcgggc caggagggtc tgcaggcggt ctctgaaggt cctgaactgg cggcccacgg 10440
ccattttttc gggggtgatg cagtagaagg tgagggggtc ttgctgccag cggtcccagt 10500
cgagctgcag ggcgaggtcg cgcgcggcgg tgaccaggcg ctcgtcgccc ccgaatttca 10560
tgaccagcat gaagggcacg agctgctttc cgaaggcccc catccaagtg taggtctcta 10620
catcgtaggt gacaaagagg cgctccgtgc gaggatgcga gccgatcggg aagaactgga 10680
tctcccgcca ccagttggag gagtggctgt tgatgtggtg gaagtagaag tcccgtcgcc 10740
gggccgaaca ctcgtgctgg cttttgtaaa agcgagcgca gtactggcag cgctgcacgg 10800
gctgtacctc atgcacgaga tgcacctttc gcccgcgcac gaggaagccg aggggaaatc 10860
tgagcccccc gcctggctcg cggcatggct ggttctcttc tactttggat gcgtgtccgt 10920
ctccgtctgg ctcctcgagg ggtgttacgg tggagcggac caccacgccg cgcgagccgc 10980
aggtccagat atcggcgcgc ggcggtcgga gtttgatgac gacatcgcgc agctgggagc 11040
tgtccatggt ctggagctcc cgcggcggcg gcaggtcagc cgggagttct tgcaggttca 11100
cctcgcagag tcgggccagg gcgcggggca ggtctaggtg gtacctgatc tctaggggcg 11160
tgttggtggc ggcgtcgatg gcttgcagga gcccgcagcc ccggggggcg acgacggtgc 11220
cccgcggggt ggtggtggtg gtggcggtgc agctcagaag cggtgccgcg ggcgggcccc 11280
cggaggtagg gggggctccg gtcccgcggg caggggcggc agcggcacgt cggcgtggag 11340
cgcgggcagg agttggtgct gtgcccggag gttgctggcg aaggcgacga cgcggcggtt 11400
gatctcctgg atctggcgcc tctgcgtgaa gacgacgggc ccggtgagct tgaacctgaa 11460
agagagttcg acagaatcaa tctcggtgtc attgaccgcg gcctggcgca ggatctcctg 11520
cacgtctccc gagttgtctt ggtaggcgat ctcggccatg aactgctcga tctcttcctc 11580
ctggaggtct ccgcgtccgg cgcgttccac ggtggccgcc aggtcgttgg agatgcgccc 11640
catgagctgc gagaaggcgt tgagtccgcc ctcgttccag actcggctgt agaccacgcc 11700
cccctggtca tcgcgggcgc gcatgaccac ctgcgcgagg ttgagctcca cgtgccgcgc 11760
gaagacggcg tagttgcgca gacgctggaa gaggtagttg agggtggtgg cggtgtgctc 11820
ggccacgaag aagttcatga cccagcggcg caacgtggat tcgttgatgt cccccaaggc 11880
ctccagccgt tccatggcct cgtagaagtc cacggcgaag ttgaaaaact gggagttgcg 11940
cgccgacacg gtcaactcct cctccagaag acggatgagc tcggcgacgg tgtcgcgcac 12000
ctcgcgctcg aaggctatgg ggatctcttc ctccgctagc atcaccacct cctcctcttc 12060
ctcctcttct ggcacttcca tgatggcttc ctcctcttcg gggggtggcg gcggcggcgg 12120
tgggggaggg ggcgctctgc gccggcggcg gcgcaccggg aggcggtcca cgaagcgcgc 12180
gatcatctcc ccgcggcggc ggcgcatggt ctcggtgacg gcgcggccgt tctcccgggg 12240
gcgcagttgg aagacgccgc cggacatctg gtgctggggc gggtggccgt gaggcagcga 12300
gacggcgctg acgatgcatc tcaacaattg ctgcgtaggt acgccgccga gggacctgag 12360
ggagtccata tccaccggat ccgaaaacct ttcgaggaag gcgtctaacc agtcgcagtc 12420
gcaaggtagg ctgagcaccg tggcgggcgg cggggggtgg ggggagtgtc tggcggaggt 12480
gctgctgatg atgtaattga agtaggcgga cttgacacgg cggatggtcg acaggagcac 12540
catgtccttg ggtccggcct gctggatgcg gaggcggtcg gctatgcccc aggcttcgtt 12600
ctggcatcgg cgcaggtcct tgtagtagtc ttgcatgagc ctttccaccg gcacctcttc 12660
tccttcctct tctgcttctt ccatgtctgc ttcggccctg gggcggcgcc gcgcccccct 12720
gccccccatg cgcgtgaccc cgaaccccct gagcggttgg agcagggcca ggtcggcgac 12780
gacgcgctcg gccaggatgg cctgctgcac ctgcgtgagg gtggtttgga agtcatccaa 12840
gtccacgaag cggtggtagg cgcccgtgtt gatggtgtag gtgcagttgg ccatgacgga 12900
ccagttgacg gtctggtggc ccggttgcga catctcggtg tacctgagtc gcgagtaggc 12960
gcgggagtcg aagacgtagt cgttgcaagt ccgcaccagg tactggtagc ccaccaggaa 13020
gtgcggcggc ggctggcggt agaggggcca gcgcagggtg gcgggggctc cgggggccag 13080
gtcttccagc atgaggcggt ggtaggcgta gatgtacctg gacatccagg tgatacccgc 13140
ggcggtggtg gaggcgcgcg ggaagtcgcg cacccggttc cagatgttgc gcaggggcag 13200
aaagtgctcc atggtaggcg tgctctgtcc agtcagacgc gcgcagtcgt tgatactcta 13260
gaccagggaa aacgaaagcc ggtcagcggg cactcttccg tggtctggtg aatagatcgc 13320
aagggtatca tggcggaggg cctcggttcg agccccgggt ccgggccgga cggtccgcca 13380
tgatccacgc ggttaccgcc cgcgtgtcga acccaggtgt gcgacgtcag acaacggtgg 13440
agtgttcctt ttggcgtttt tctggccggg cgccggcgcc gcgtaagaga ctaagccgcg 13500
aaagcgaaag cagtaagtgg ctcgctcccc gtagccggag ggatccttgc taagggttgc 13560
gttgcggcga accccggttc gaatcccgta ctcgggccgg ccggacccgc ggctaaggtg 13620
ttggattggc ctccccctcg tataaagacc ccgcttgcgg attgactccg gacacgggga 13680
cgagcccctt ttatttttgc tttccccaga tgcatccggt gctgcggcag atgcgccccc 13740
cgccccagca gcagcaacaa caccagcaag agcggcagca acagcagcgg gagtcatgca 13800
gggccccctc acccaccctc ggcgggccgg ccacctcggc gtccgcggcc gtgtctggcg 13860
cctgcggcgg cggcgggggg ccggctgacg accccgagga gcccccgcgg cgcagggcca 13920
gacactacct ggacctggag gagggcgagg gcctggcgcg gctgggggcg ccgtctcccg 13980
agcgccaccc gcgggtgcag ctgaagcgcg actcgcgcga ggcgtacgtg cctcggcaga 14040
acctgttcag ggaccgcgcg ggcgaggagc ccgaggagat gcgggacagg aggttcagcg 14100
cagggcggga gctgcggcag gggctgaacc gcgagcggct gctgcgcgag gaggactttg 14160
agcccgacgc gcggacgggg atcagccccg cgcgcgcgca cgtggcggcc gccgacctgg 14220
tgacggcgta cgagcagacg gtgaaccagg agatcaactt ccaaaagagt ttcaacaacc 14280
acgtgcgcac gctggtggcg cgcgaggagg tgaccatcgg gctgatgcac ctgtgggact 14340
ttgtaagcgc gctggtgcag aaccccaaca gcaagcctct gacggcgcag ctgttcctga 14400
tagtgcagca cagcagggac aacgaggcgt ttagggacgc gctgctgaac atcaccgagc 14460
ccgagggtcg gtggctgctg gacctgatta acatcctgca gagcatagtg gtgcaggagc 14520
gcagcctgag cctggccgac aaggtggcgg ccatcaacta ctcgatgctg agcctgggca 14580
agttttacgc gcgcaagatc taccagacgc cgtacgtgcc catagacaag gaggtgaaga 14640
tcgacggttt ttacatgcgc atggcgctga aggtgctcac cctgagcgac gacctgggcg 14700
tgtaccgcaa cgagcgcatc cacaaggccg tgagcgtgag ccggcggcgc gagctgagcg 14760
accgcgagct gatgcacagc ctgcagcggg cgctggcggg cgccggcagc ggcgacaggg 14820
aggcggagtc ctacttcgat gcgggggcgg acctgcgctg ggcgcccagc cggcgggccc 14880
tggaggccgc gggggtccgc gaggactatg acgaggacgg cgaggaggat gaggagtacg 14940
agctagagga gggcgagtac ctggactaaa ccgcgggtgg tgtttccggt agatgcaaga 15000
cccgaacgtg gtggacccgg cgctgcgggc ggctctgcag agccagccgt ccggccttaa 15060
ctcctcagac gactggcgac aggtcatgga ccgcatcatg tcgctgacgg cgcgtaaccc 15120
ggacgcgttc cggcagcagc cgcaggccaa caggctctcc gccatcctgg aggcggtggt 15180
gcctgcgcgc tcgaacccca cgcacgagaa ggtgctggcc atagtgaacg cgctggccga 15240
gaacagggcc atccgcccgg acgaggccgg gctggtgtac gacgcgctgc tgcagcgcgt 15300
ggcccgctac aacagcggca acgtgcagac caacctggac cggctggtgg gggacgtgcg 15360
cgaggcggtg gcgcagcgcg agcgcgcgga tcggcagggc aacctgggct ccatggtggc 15420
gctgaatgcc ttcctgagca cgcagccggc caacgtgccg cgggggcagg aagactacac 15480
caactttgtg agcgcgctgc ggctgatggt gaccgagacc ccccagagcg aggtgtacca 15540
gtcgggcccg gactacttct tccagaccag cagacagggc ctgcagacgg tgaacctgag 15600
ccaggctttc aagaacctgc gggggctgtg gggcgtgaag gcgcccaccg gcgaccgggc 15660
gacggtgtcc agcctgctga cgcccaactc gcgcctgctg ctgctgctga tcgcgccgtt 15720
cacggacagc ggcagcgtgt cccgggacac ctacctgggg cacctgctga ccctgtaccg 15780
cgaggccatc gggcaggcgc aggtggacga gcacaccttc caggagatca ccagcgtgag 15840
ccgcgcgctg gggcaggagg acacgagcag cctggaggcg actctgaact acctgctgac 15900
caaccggcgg cagaagattc cctcgctgca cagcctgacc tccgaggagg agcgcatctt 15960
gcgctacgtg cagcagagcg tgagcctgaa cctgatgcgc gacggggtga cgcccagcgt 16020
ggcgctggac atgaccgcgc gcaacatgga accgggcatg tacgccgcgc accggcctta 16080
catcaaccgc ctgatggact acctgcatcg cgcggcggcc gtgaaccccg agtactttac 16140
caacgccatc ctgaacccgc actggctccc gccgcccggg ttctacagcg ggggcttcga 16200
ggtcccggag accaacgatg gcttcctgtg ggacgacatg gacgacagcg tgttctcccc 16260
gcggccgcag gcgctggcgg aagcgtccct gctgcgtccc aagaaggagg aggaggagga 16320
ggcgagtcgc cgccgcggca gcagcggcgt ggcttctctg tccgagctgg gggcggcagc 16380
cgccgcgcgc cccgggtccc tgggcggcag cccctttccg agcctggtgg ggtctctgca 16440
cagcgagcgc accacccgcc ctcggctgct gggcgaggac gagtacctga ataactccct 16500
gctgcagccg gtgcgggaga aaaacctgcc tcccgccttc cccaacaacg ggatagagag 16560
cctggtggac aagatgagca gatggaagac ctatgcgcag gagcacaggg acgcgcctgc 16620
gctccggccg cccacgcggc gccagcgcca cgaccggcag cgggggctgg tgtgggatga 16680
cgaggactcc gcggacgata gcagcgtgct ggacctggga gggagcggca acccgttcgc 16740
gcacctgcgc ccccgcctgg ggaggatgtt ttaaaaaaaa aaaaaaaang caagaagcat 16800
gatgcaaaaa ttaaataaaa ctcaccaagg ccatggcgac cgagcgttgg tttcttgtgt 16860
tcccttcagt atgcggcgcg cggcgatgta ccaggaggga cctcctccct cttacgagag 16920
cgtggtgggc gcggcggcgg cggcgccctc ttctcccttt gcgtcgcagc tgctggagcc 16980
gccgtacgtg cctccgcgct acctgcggcc tacggggggg agaaacagca tccgttactc 17040
ggagctggcg cccctgttcg acaccacccg ggtgtacctg gtggacaaca agtcggcgga 17100
cgtggcctcc ctgaactacc agaacgacca cagcaatttt ttgaccacgg tcatccagaa 17160
caatgactac agcccgagcg aggccagcac ccagaccatc aatctggatg accggtcgca 17220
ctggggcggc gacctgaaaa ccatcctgca caccaacatg cccaacgtga acgagttcat 17280
gttcaccaat aagttcaagg cgcgggtgat ggtgtcgcgc tcgcacacca aggaagaccg 17340
ggtggagctg aagtacgagt gggtggagtt cgagctgcca gagggcaact actccgagac 17400
catgaccatt gacctgatga acaacgcgat cgtggagcac tatctgaaag tgggcaggca 17460
gaacggggtc ctggagagcg acatcggggt caagttcgac accaggaact tccgcctggg 17520
gctggacccc gtgaccgggc tggttatgcc cggggtgtac accaacgagg ccttccatcc 17580
cgacatcatc ctgctgcccg gctgcggggt ggacttcact tacagccgcc tgagcaacct 17640
cctgggcatc cgcaagcggc agcccttcca ggagggcttc aggatcacct acgaggacct 17700
ggaggggggc aacatccccg cgctcctcga tgtggaggcc taccaggata gcttgaagga 17760
aaatgaggcg ggacaggagg ataccgcccc cgccgcctcc gccgccgccg agcagggcga 17820
ggatgctgct gacaccgcgg ccgcggacgg ggcagaggcc gaccccgcta tggtggtgga 17880
ggctcccgag caggaggagg acatgaatga cagtgcggtg cgcggagaca ccttcgtcac 17940
ccggggggag gaaaagcaag cggaggccga ggccgcggcc gaggaaaagc aactggcggc 18000
agcagcggcg gcggcggcgt tggccgcggc ggaggctgag tctgagggga ccaagcccgc 18060
caaggagccc gtgattaagc ccctgaccga agatagcaag aagcgcagtt acaacctgct 18120
caaggacagc accaacaccg cgtaccgcag ctggtacctg gcctacaact acggcgaccc 18180
gtcgacgggg gtgcgctcct ggaccctgct gtgcacgccg gacgtgacct gcggctcgga 18240
gcaggtgtac tggtcgctgc ccgacatgat gcaagacccc gtgaccttcc gctccacgcg 18300
gcaggtcagc aacttcccgg tggtgggcgc cgagctgctg cccgtgcact ccaagagctt 18360
ctacaacgac caggccgtct actcccagct catccgccag ttcacctctc tgacccacgt 18420
gttcaatcgc tttcctgaga accagattct ggcgcgcccg cccgccccca ccatcaccac 18480
cgtcagtgaa aacgttcctg ctctcacaga tcacgggacg ctaccgctgc gcaacagcat 18540
cggaggagtc cagcgagtga ccgttactga cgccagacgc cgcacctgcc cctacgttta 18600
caaggccttg ggcatagtct cgccgcgcgt cctttccagc cgcacttttt gagcaacacc 18660
accatcatgt ccatcctgat ctcacccagc aataactccg gctggggact gctgcgcgcg 18720
cccagcaaga tgttcggagg ggcgaggaag cgttccgagc agcaccccgt gcgcgtgcgc 18780
gggcacttcc gcgccccctg gggagcgcac aaacgcggcc gcgcggggcg caccaccgtg 18840
gacgacgcca tcgactcggt ggtggagcag gcgcgcaact acaggcccgc ggtctctacc 18900
gtggacgcgg ccatccagac cgtggtgcgg ggcgcgcggc ggtacgccaa gctgaagagc 18960
cgccggaagc gcgtggcccg ccgccaccgc cgccgacccg gggccgccgc caaacgcgcc 19020
gccgcggccc tgcttcgccg ggccaagcgc acgggccgcc gcgccgccat gagggccgcg 19080
cgccgcttgg ccgccggcat caccgccgcc accatggccc cccgtacccg aagacgcgcg 19140
gccgccgccg ccgccgccgc catcagtgac atggccagca ggcgccgggg caacgtgtac 19200
tgggtgcgcg actcggtgac cggcacgcgc gtgcccgtgc gcttccgccc cccgcggact 19260
tgagatgatg tgaaaaaaca acactgagtc tcctgctgtt gtgtgtatcc cagcggcggc 19320
ggcgcgcgca gcgtcatgtc caagcgcaaa atcaaagaag agatgctcca ggtcgtcgcg 19380
ccggagatct atgggccccc gaagaaggaa gagcaggatt cgaagccccg caagataaag 19440
cgggtcaaaa agaaaaagaa agatgatgac gatgccgatg gggaggtgga gttcctgcgc 19500
gccacggcgc ccaggcgccc ggtgcagtgg aagggccggc gcgtaaagcg cgtcctgcgc 19560
cccggcaccg cggtggtctt cacgcccggc gagcgctcca cccggacttt caagcgcgtc 19620
tatgacgagg tgtacggcga cgaagacctg ctggagcagg ccaacgagcg cttcggagag 19680
tttgcttacg ggaagcgtca gcgggcgctg gggaaggagg acctgctggc gctgccgctg 19740
gaccagggca accccacccc cagtctgaag cccgtgaccc tgcagcaggt gctgccgagc 19800
agcgcaccct ccgaggcgaa gcggggtctg aagcgcgagg gcggcgacct ggcgcccacc 19860
gtgcagctca tggtgcccaa gcggcagagg ctggaggatg tgctggagaa aatgaaagta 19920
gaccccggtc tgcagccgga catcagggtc cgccccatca agcaggtggc gccgggcctc 19980
ggcgtgcaga ccgtggacgt ggtcatcccc accggcaact cccccgccgc cgccaccact 20040
accgctgcct ccacggacat ggagacacag accgatcccg ccgcagccgc agccgcagcc 20100
gccgccgcga cctcctcggc ggaggtgcag acggacccct ggctgccgcc ggcgatgtca 20160
gctccccgcg cgcgtcgcgg gcgcaggaag tacggcgccg ccaacgcgct cctgcccgag 20220
tacgccttgc atccttccat cgcgcccacc cccggctacc gaggctatac ctaccgcccg 20280
cgaagagcca agggttccac ccgccgtccc cgccgacgcg ccgccgccac cacccgccgc 20340
cgccgccgca gacgccagcc cgcactggct ccagtctccg tgaggaaagt ggcgcgcgac 20400
ggacacaccc tggtgctgcc cagggcgcgc taccacccca gcatcgttta aaagcctgtt 20460
gtggttcttg cagatatggc cctcacttgc cgcctccgtt tcccggtgcc gggataccga 20520
ggaggaagat cgcgccgcag gaggggtctg gccggccgcg gcctgagcgg aggcagccgc 20580
cgcgcgcacc ggcggcgacg cgccaccagc cgacgcatgc gcggcggggt gctgcccctg 20640
ttaatccccc tgatcgccgc ggcgatcggc gccgtgcccg ggatcgcctc cgtggccttg 20700
caagcgtccc agaggcattg acagacttgc aaacttgcaa atatggaaaa aaaaacccca 20760
ataaaaaagt ctagactctc acgctcgctt ggtcctgtga ctattttgta gaatggaaga 20820
catcaacttt gcgtcgctgg ccccgcgtca cggctcgcgc ccgttcctgg gacactggaa 20880
cgatatcggc accagcaaca tgagcggtgg cgccttcagt tggggctctc tgtggagcgg 20940
cattaaaagt atcgggtctg ccgttaaaaa ttacggctcc cgggcctgga acagcagcac 21000
gggccagatg ttgagagaca agttgaaaga gcagaacttc cagcagaagg tggtggaggg 21060
cctggcctcc ggcatcaacg gggtggtgga cctggccaac caggccgtgc agaataagat 21120
caacagcaga ctggaccccc ggccgccggt ggaggaggtg ccgccggcgc tggagacggt 21180
gtcccccgat gggcgtggcg agaagcgccc gcggcccgat agggaagaga ccactctggt 21240
cacgcagacc gatgagccgc ccccgtatga ggaggccctg aagcaaggtc tgcccaccac 21300
gcggcccatc gcgcccatgg ccaccggggt ggtgggccgc cacacccccg ccacgctgga 21360
cttgcctccg cccgccgatg tgccgcagca gcagaaggcg gcacagccgg gcccgcccgc 21420
gaccgcctcc cgttcctccg ccggtcctct gcgccgcgcg gccagcggcc cccgcggggg 21480
ggtcgcgagg cacggcaact ggcagagcac gctgaacagc atcgtgggtc tgggggtgcg 21540
gtccgtgaag cgccgccgat gctactgaat agcttagcta acgtgttgta tgtgtgtatg 21600
cgccctatgt cgccgccaga ggagctgctg agtcgccgcc gttcgcgcgc ccaccaccac 21660
cgccactccg cccctcaaga tggcgacccc atcgatgatg ccgcagtggt cgtacatgca 21720
catctcgggc caggacgcct cggagtacct gagccccggg ctggtgcagt tcgcccgcgc 21780
caccgagagc tacttcagcc tgagtaacaa gtttaggaac cccacggtgg cgcccacgca 21840
cgatgtgacc accgaccggt ctcagcgcct gacgctgcgg ttcattcccg tggaccgcga 21900
ggacaccgcg tactcgtaca aggcgcggtt caccctggcc gtgggcgaca accgcgtgct 21960
ggacatggcc tccacctact ttgacatccg cggggtgctg gaccggggtc ccactttcaa 22020
gccctactct ggcaccgcct acaactccct ggcccccaag ggcgctccca actcctgcga 22080
gtgggagcaa gaggaaactc aggcagttga agaagcagca gaagaggaag aagaagatgc 22140
tgacggtcaa gctgaggaag agcaagcagc taccaaaaag actcatgtat atgctcaggc 22200
tcccctttct ggcgaaaaaa ttagtaaaga tggtctgcaa ataggaacgg acgctacagc 22260
tacagaacaa aaacctattt atgcagaccc tacattccag cccgaacccc aaatcgggga 22320
gtcccagtgg aatgaggcag atgctacagt cgccggcggt agagtgctaa agaaatctac 22380
tcccatgaaa ccatgctatg gttcctatgc aagacccaca aatgctaatg gaggtcaggg 22440
tgtactaacg gcaaatgccc agggacagct agaatctcag gttgaaatgc aattcttttc 22500
aacttctgaa aacgcccgta acgaggctaa caacattcag cccaaattgg tgctgtatag 22560
tgaggatgtg cacatggaga ccccggatac gcacctttct tacaagcccg caaaaagcga 22620
tgacaattca aaaatcatgc tgggtcagca gtccatgccc aacagaccta attacatcgg 22680
cttcagagac aactttatcg gcctcatgta ttacaatagc actggcaaca tgggagtgct 22740
tgcaggtcag gcctctcagt tgaatgcagt ggtggacttg caagacagaa acacagaact 22800
gtcctaccag ctcttgcttg attccatggg tgacagaacc agatactttt ccatgtggaa 22860
tcaggcagtg gacagttatg acccagatgt tagaattatt gaaaatcatg gaactgaaga 22920
cgagctcccc aactattgtt tccctctggg tggcataggg gtaactgaca cttaccaggc 22980
tgttaaaacc aacaatggca ataacggggg ccaggtgact tggacaaaag atgaaacttt 23040
tgcagatcgc aatgaaatag gggtgggaaa caatttcgct atggagatca acctcagtgc 23100
caacctgtgg agaaacttcc tgtactccaa cgtggcgctg tacctaccag acaagcttaa 23160
gtacaacccc tccaatgtgg acatctctga caaccccaac acctacgatt acatgaacaa 23220
gcgagtggtg gccccggggc tggtggactg ctacatcaac ctgggcgcgc gctggtcgct 23280
ggactacatg gacaacgtca accccttcaa ccaccaccgc aatgcgggcc tgcgctaccg 23340
ctccatgctc ctgggcaacg ggcgctacgt gcccttccac atccaggtgc cccagaagtt 23400
ctttgccatc aagaacctcc tcctcctgcc gggctcctac acctacgagt ggaacttcag 23460
gaaggatgtc aacatggtcc tccagagctc tctgggtaac gatctcaggg tggacggggc 23520
cagcatcaag ttcgagagca tctgcctcta cgccaccttc ttccccatgg cccacaacac 23580
ggcctccacg ctcgaggcca tgctcaggaa cgacaccaac gaccagtcct tcaatgacta 23640
cctctccgcc gccaacatgc tctaccccat acccgccaac gccaccaacg tccccatctc 23700
catcccctcg cgcaactggg cggccttccg cggctgggcc ttcacccgcc tcaagaccaa 23760
ggagaccccc tccctgggct cgggattcga cccctactac acctactcgg gctccattcc 23820
ctacctggac ggcaccttct acctcaacca cactttcaag aaggtctcgg tcaccttcga 23880
ctcctcggtc agctggccgg gcaacgaccg tctgctcacc cccaacgagt tcgagatcaa 23940
gcgctcggtc gacggggagg gctacaacgt ggcccagtgc aacatgacca aggactggtt 24000
cctggtccag atgctggcca actacaacat cggctaccag ggcttctaca tcccagagag 24060
ctacaaggac aggatgtact ccttcttcag gaacttccag cccatgagcc ggcaggtggt 24120
ggaccagacc aagtacaagg actaccagga ggtgggcatc atccaccagc acaacaactc 24180
gggcttcgtg ggctacctcg cccccaccat gcgcgaggga caggcctacc ccgccaactt 24240
cccctatccg ctcataggca agaccgcggt cgacagcatc acccagaaaa agttcctctg 24300
cgaccgcacc ctctggcgca tccccttctc cagcaacttc atgtccatgg gtgcgctctc 24360
ggacctgggc cagaacttgc tctacgccaa ctccgcccac gccctcgaca tgaccttcga 24420
ggtcgacccc atggacgagc ccacccttct ctatgttctg ttcgaagtct ttgacgtggt 24480
ccgggtccac cagccgcacc gcggcgtcat cgagaccgtg tacctgcgta cgcccttctc 24540
ggccggcaac gccaccacct aaagaagcaa gccgcagtca tcgccgcctg catgccgtcg 24600
ggttccaccg agcaagagct cagggccatc gtcagagacc tgggatgcgg gccctatttt 24660
ttgggcacct tcgacaagcg cttccctggc tttgtctccc cacacaagct ggcctgcgcc 24720
atcgtcaaca cggccggccg cgagaccggg ggcgtgcact ggctggcctt cgcctggaac 24780
ccgcgctcca aaacatgctt cctctttgac cccttcggct tttcggacca gcggctcaag 24840
caaatctacg agttcgagta cgagggcttg ctgcgtcgca gcgccatcgc ctcctcgccc 24900
gaccgctgcg tcaccctcga aaagtccacc cagaccgtgc aggggcccga ctcggccgcc 24960
tgcggtctct tctgctgcat gtttctgcac gcctttgtgc actggcctca gagtcccatg 25020
gaccgcaacc ccaccatgaa cttgctgacg ggggtgccca actccatgct ccagagcccc 25080
caggtcgagc ccaccctgcg ccgcaaccag gagcagctct acagcttcct ggagcgccac 25140
tcgccttact tccgccgcca cagcgcacag atcaggaggg ccacctcctt ctgccacttg 25200
caagagatgc aagaagggta ataacgatgt acacactttt tttctcaata aatggcatct 25260
ttttatttat acaagctctc tggggtattc atttcccacc accacccgcc gttgtcgcca 25320
tctggctcta tttagaaatc gaaagggttc tgccgggagt cgccgtgcgc cacgggcagg 25380
gacacgttgc gatactggta gcgggtgccc cacttgaact cgggcaccac caggcgaggc 25440
agctcgggga agttttcgct ccacaggctg cgggtcagca ccagcgcgtt catcaggtcg 25500
ggcgccgaga tcttgaagtc gcagttgggg ccgccgccct gcgcgcgcga gttgcggtac 25560
accgggttgc agcactggaa caccaacagc gccgggtgct tcacgctggc cagcacgctg 25620
cggtcggaga tcagctcggc gtccaggtcc tccgcgttgc tcagcgcgaa cggggtcatc 25680
ttgggcactt gccgccccag gaagggcgcg tgccccggtt tcgagttgca gtcgcagcgc 25740
agcgggatca gcaggtgccc gtgcccggac tcggcgttgg ggtacagcgc gcgcatgaag 25800
gcctgcatct ggcggaaggc catctgggcc ttggcgccct ccgagaagaa catgccgcag 25860
gacttgcccg agaactggtt tgcggggcag ctggcgtcgt gcaggcagca gcgcgcgtcg 25920
gtgttggcga tctgcaccac gttgcgcccc caccggttct tcacgatctt ggccttggac 25980
gattgctcct tcagcgcgcg ctgcccgttc tcgctggtca catccatctc gatcacatgt 26040
tccttgttca ccatgctgct gccgtgcaga cacttcagct cgccctccgt ctcggtgcag 26100
cggtgctgcc acagcgcgca gcccgtgggc tcgaaagact tgtaggtcac ctccgcgaag 26160
gactgcaggt acccctgcaa aaagcggccc atcatggtca cgaaggtctt gttgctgctg 26220
aaggtcagct gcagcccgcg gtgctcctcg ttcagccagg tcttgcacac ggccgccagc 26280
gcctccacct ggtcgggcag catcttgaag ttcaccttca gctcattctc cacgtggtac 26340
ttgtccatca gcgtgcgcgc cgcctccatg cccttctccc aggccgacac cagcggcagg 26400
ctcacggggt tcttcaccat caccgtggcc gccgcctccg ccgcgctttc gctttccgcc 26460
ccgctgttct cttcctcttc ctcctcttcc tcgccgccgc ccactcgcag cccccgcacc 26520
acggggtcgt cttcctgcag gcgctgcacc ttgcgcttgc cgttgcgccc ctgcttgatg 26580
cgcacgggcg ggttgctgaa gcccaccatc accagcgcgg cctcttcttg ctcgtcctcg 26640
ctgtccagaa tgacctccgg ggaggggggg ttggtcatcc tcagtaccga ggcacgcttc 26700
tttttcttcc tgggggcgtt cgccagctcc gcggctgcgg ccgctgccga ggtcgaaggc 26760
cgagggctgg gcgtgcgcgg caccagcgcg tcctgcgagc cgtcctcgtc ctcctcggac 26820
tcgagacgga ggcgggcccg cttcttcggg ggcgcgcggg gcggcggagg cggcggcggc 26880
gacggagacg gggacgagac atcgtccagg gtgggtggac ggcgggccgc gccgcgtccg 26940
cgctcggggg tggtctcgcg ctggtcctct tcccgactgg ccatctccca ctgctccttc 27000
tcctataggc agaaagagat catggagtct ctcatgcgag tcgagaagga ggaggacagc 27060
ctaaccgccc cctctgagcc ctccaccacc gccgccacca ccgccaatgc cgccgcggac 27120
gacgcgccca ccgagaccac cgccagtacc accctcccca gcgacgcacc cccgctcgag 27180
aatgaagtgc tgatcgagca ggacccgggt tttgtgagcg gagaggagga tgaggtggat 27240
gagaaggaga aggaggaggt cgccgcctca gtgccaaaag aggataaaaa gcaagaccag 27300
gacgacgcag ataaggatga gacagcagtc gggcggggga acggaagcca tgatgctgat 27360
gacggctacc tagacgtggg agacgacgtg ctgcttaagc acctgcaccg ccagtgcgtc 27420
atcgtctgcg acgcgctgca ggagcgctgc gaagtgcccc tggacgtggc ggaggtcagc 27480
cgcgcctacg agcggcacct cttcgcgccg cacgtgcccc ccaagcgccg ggagaacggc 27540
acctgcgagc ccaacccgcg tctcaacttc tacccggtct tcgcggtacc cgaggtgctg 27600
gccacctacc acatcttttt ccaaaactgc aagatccccc tctcctgccg cgccaaccgc 27660
acccgcgccg acaaaaccct gaccctgcgg cagggcgccc acatacctga tatcgcctct 27720
ctggaggaag tgcccaagat cttcgagggt ctcggtcgcg acgagaaacg ggcggcgaac 27780
gctctgcacg gagacagcga aaacgagagt cactcggggg tgctggtgga gctcgagggc 27840
gacaacgcgc gcctggccgt actcaagcgc agcatagagg tcacccactt tgcctacccg 27900
gcgctcaacc tgccccccaa ggtcatgagt gtggtcatgg gcgagctcat catgcgccgc 27960
gcccagcccc tggccgcgga tgcaaacttg caagagtcct ccgaggaagg cctgcccgcg 28020
gtcagcgacg agcagctggc gcgctggctg gagacccgcg accccgcgca gctggaggag 28080
cggcgcaagc tcatgatggc cgcggtgctg gtcaccgtgg agctcgagtg tctgcagcgc 28140
ttcttcgcgg accccgagat gcagcgcaag ctcgaggaga ccctgcacta caccttccgc 28200
cagggctacg tgcgccaggc ctgcaagatc tccaacgtgg agctctgcaa cctggtctcc 28260
tacctgggca tcctgcacga gaaccgcctc gggcagaacg tcctgcactc caccctcaaa 28320
ggggaggcgc gccgcgacta catccgcgac tgcgcctacc tcttcctctg ctacacctgg 28380
cagacggcca tgggggtctg gcagcagtgc ctggaggagc gcaacctcaa ggagctggaa 28440
aagctcctca agcgcaccct cagggacctc tggacgggct tcaacgagcg ctcggtggcc 28500
gccgcgctgg cggacatcat ctttcccgag cgcctgctca agaccctgca gcagggcctg 28560
cccgacttca ccagccagag catgctgcag aacttcagga ctttcatcct ggagcgctcg 28620
ggcatcctgc cggccacttg ctgcgcgctg cccagcgact tcgtgcccat caagtacagg 28680
gagtgcccgc cgccgctctg gggccactgc tacctcttcc agctggccaa ctacctcgcc 28740
taccactcgg acctcatgga agacgtgagc ggcgagggcc tgctcgagtg ccactgccgc 28800
tgcaacctct gcacgcccca ccgctctcta gtctgcaacc cgcagctgct cagcgagagt 28860
cagattatcg gtaccttcga gctgcagggt ccctcgcctg acgagaagtc cgcggctcca 28920
gggctgaaac tcactccggg gctgtggact tccgcctacc tacgcaaatt tgtacctgag 28980
gactaccacg cccacgagat caggttctac gaagaccaat cccgcccgcc caaggcggag 29040
ctcaccgcct gcgtcatcac ccaggggcac atcctgggcc aattgcaagc catcaacaaa 29100
gcccgccgag agttcttgct gaaaaagggt cggggggtgt acctggaccc ccagtccggc 29160
gaggagctaa acccgctacc cccgccgccg ccccagcagc gggaccttgc ttcccaggat 29220
ggcacccaga aagaagcagc agccgccgcc gccgccgcag ccatacatgc ttctggagga 29280
agaggaggag gactgggaca gtcaggcaga ggaggtttcg gacgaggagc aggaggagat 29340
gatggaagac tgggaggagg acagcagcct agacgaggaa gcttcagagg ccgaagaggt 29400
ggcagacgca acaccatcgc cctcggtcgc agccccctcg ccggggcccc tgaaatcctc 29460
cgaacccagc accagcgcta taacctccgc tcctccggcg ccggcgccac ccgcccgcag 29520
acccaaccgt agatgggaca ccacaggaac cggggtcggt aagtccaagt gcccgccgcc 29580
gccaccgcag cagcagcagc agcagcgcca gggctaccgc tcgtggcgcg ggcacaagaa 29640
cgccatagtc gcctgcttgc aagactgcgg gggcaacatc tctttcgccc gccgcttcct 29700
gctattccac cacggggtcg cctttccccg caatgtcctg cattactacc gtcatctcta 29760
cagcccctac tgcagcggcg acccagaggc ggcagcggca gccacagcgg cgaccaccac 29820
ctaggaagat atcctccgcg ggcaagacag cggcagcagc ggccaggaga cccgcggcag 29880
cagcggcggg agcggtgggc gcactgcgcc tctcgcccaa cgaacccctc tcgacccggg 29940
agctcagaca caggatcttc cccactttgt atgccatctt ccaacagagc agaggccagg 30000
agcaggagct gaaaataaaa aacagatctc tgcgctccct cacccgcagc tgtctgtatc 30060
acaaaagcga agatcagctt cggcgcacgc tggaggacgc ggaggcactc ttcagcaaat 30120
actgcgcgct cactcttaaa gactagctcc gcgcccttct cgaatttagg cgggagaaaa 30180
ctacgtcatc gccggccgcc gcccagcccg cccagccgag atgagcaaag agattcccac 30240
gccatacatg tggagctacc agccgcagat gggactcgcg gcgggagcgg cccaggacta 30300
ctccacccgc atgaactaca tgagcgcggg accccacatg atctcacagg tcaacgggat 30360
ccgcgcccag cgaaaccaaa tactgctgga acaggcggcc atcaccgcca cgccccgcca 30420
taatctcaac ccccgaaatt ggcccgccgc cctcgtgtac caggaaaccc cctccgccac 30480
caccgtacta cttccgcgtg acgcccaggc cgaagtccag atgactaact caggggcgca 30540
gctcgcgggc ggctttcgtc acggggcgcg gccgctccga ccaggtataa gacacctgat 30600
gatcagaggc cgaggtatcc agctcaacga cgagtcggtg agctcttcgc tcggtctccg 30660
tccggacgga actttccagc tcgccggatc cggccgctct tcgttcacgc cccgccaggc 30720
gtacctgact ctgcagacct cgtcctcgga gccccgctcc ggcggcatcg gaaccctcca 30780
gttcgtggag gagttcgtgc cctcggtcta cttcaacccc ttctcgggac ctcccggacg 30840
ctaccccgac cagttcattc cgaactttga cgcggtgaag gactcggcgg acggctacga 30900
ctgaatgtca ggtgtcgagg cagagcagct tcgcctgaga cacctcgagc actgccgccg 30960
ccacaagtgc ttcgcccgcg gttctggtga gttctgctac tttcagctac ccgaggagca 31020
taccgagggg ccggcgcacg gcgtccgcct gaccacccag ggcgaggtta cctgttccct 31080
catccgggag tttaccctcc gtcccctgct agtggagcgg gagcggggtc cctgtgtcct 31140
aactatcgcc tgcaactgcc ctaaccctgg attacatcaa gatctttgct gtcatctctg 31200
tgctgagttt aataaacgct gagatcagaa tctactggga tttagtcccc tttaactaat 31260
caaacactgg aatcaataaa aagaatcact tacttaaaat cagacagcag gtctctgtcc 31320
agtttattca gcagcacctc cttcccctcc tcccaactct ggtactccaa acgccttctg 31380
gcggcaaact tcctccacac cctgaaggga atgtcagatt cttgctcctg tccctccgca 31440
cccactatct tcatgttgtt gcagatgaag cgcaccaaaa cgtctgacga gagcttcaac 31500
cccgtgtacc cctatgacac ggaaagcggc cctccctccg tccctttcct cacccctccc 31560
ttcgtgtctc ccgatggatt ccaagaaagt ccccccgggg tcctgtctct gaacctggcc 31620
gagcccctgg tcacttccca cggcatgctc gccctgaaaa tgggaagtgg cctctccctg 31680
gacgacgctg gcaacctcac ctctcaagat atcaccaccg ctagccctcc cctcaaaaaa 31740
accaagacca acctcagcct agaaacctca tcccccctaa ctgtgagcac ctcaggcgcc 31800
ctcaccgtag cagccgccgc tcccctggcg gtggccggca cctccctcac catgcaatca 31860
gaggcccccc tgacagtaca ggatgcaaaa ctcaccctgg ccaccaaagg ccccctgacc 31920
gtgtctgaag gcaaactggc cttgcaaaca tcggccccgc tgacggccgc tgacagcagc 31980
accctcacag tcagtgccac accacccctt agcacaagca atggcagctt gggtattgac 32040
atgcaagccc ccatttacac caccaatgga aaactaggac ttaactttgg cgctcccctg 32100
catgtggtag acagcctaaa tgcactgact gtagttactg gccaaggtct tacgataaac 32160
ggaacagccc tacaaactag agtctcaggt gccctcaact atgacacatc aggaaaccta 32220
gaattgagag ctgcaggggg tatgcgagtt gatgcaaatg gtcaacttat ccttgatgta 32280
gcttacccat ttgatgcaca aaacaatctc agccttaggc ttggacaggg acccctgttt 32340
gttaactctg cccacaactt ggatgttaac tacaacagag gcctctacct gttcacatct 32400
ggaaatacca aaaagctaga agttaatatc aaaacagcca agggtctcat ttatgatgac 32460
actgctatag caatcaatgc gggtgatggg ctacagtttg actcaggctc agatacaaat 32520
ccattaaaaa ctaaacttgg attaggactg gattatgact ccagcagagc cataattgct 32580
aaactgggaa ctggcctaag ctttgacaac acaggtgcca tcacagtagg caacaaaaat 32640
gatgacaagc ttaccttgtg gaccacacca gacccatccc ctaactgtag aatctattca 32700
gagaaagatg ctaaattcac acttgttttg actaaatgcg gcagtcaggt gttggccagc 32760
gtttctgttt tatctgtaaa aggtagcctt gcgcccatca gtggcacagt aactagtgct 32820
cagattgtcc tcagatttga tgaaaatgga gttctactaa gcaattcttc ccttgaccct 32880
caatactgga actacagaaa aggtgacctt acagagggca ctgcatatac caacgcagtg 32940
ggatttatgc ccaacctcac agcataccca aaaacacaga gccaaactgc taaaagcaac 33000
attgtaagtc aggtttactt gaatggggac aaatccaaac ccatgaccct caccattacc 33060
ctcaatggaa ctaatgaaac aggagatgcc acagtaagca cttactccat gtcattctca 33120
tggaactgga atggaagtaa ttacattaat gaaacgttcc aaaccaactc cttcaccttc 33180
tcctacatcg cccaagaata aaaagcatga cgctgttgat ttgattcaat gtgtttctgt 33240
tttattttca agcacaacaa aatcattcaa gtcattcttc catcttagct taatagacac 33300
agtagcttaa tagacccagt agtgcaaagc cccattctag cttataacta gtggagaagt 33360
actcgcctac atgggggtag agtcataatc gtgcatcagg atagggcggt ggtgctgcag 33420
cagcgcgcga ataaactgct gccgccgccg ctccgtcctg caggaataca acatggcagt 33480
ggtctcctca gcgatgattc gcaccgcccg cagcataagg cgccttgtcc tccgggcaca 33540
gcagcgcacc ctgatctcac ttaaatcagc acagtaactg cagcacagca ccacaatatt 33600
gttcaaaatc ccacagtgca aggcgctgta tccaaagctc atggcgggga ccacagaacc 33660
cacgtggcca tcataccaca agcgcaggta gattaagtgg cgacccctca taaacacgct 33720
ggacataaac attacctctt ttggcatgtt gtaattcacc acctcccggt accatataaa 33780
cctctgatta aacatggcgc catccaccac catcctaaac cagctggcca aaacctgccc 33840
gccggctata cactgcaggg aaccgggact ggaacaatga cagtggagag cccaggactc 33900
gtaaccatgg atcatcatgc tcgtcatgat atcaatgttg gcacaacaca ggcacacgtg 33960
catacacttc ctcaggatta caagctcctc ccgcgttaga accatatccc agggaacaac 34020
ccattcctga atcagcgtaa atcccacact gcagggaaga cctcgcacgt aactcacgtt 34080
gtgcattgtc aaagtgttac attcgggcag cagcggatga tcctccagta tggtagcgcg 34140
ggtttctgtc tcaaaaggag gtagacgatc cctactgtac ggagtgcgcc gagacaaccg 34200
agatcgtgtt ggtcgtagtg tcatgccaaa tggaacgccg gacgtagtca tatttcctga 34260
agtcttagat ctctcaacgc agcaccagca ccaacacttc gcagtgtaaa aggccaagtg 34320
ccgagagagt atatatagga ataaaaagtg acgtaaacgg gcaaagtcca aaaaacgccc 34380
agaaaaaccg cacgcgaacc tacgccccga aacgaaagcc aaaaaacact agacactccc 34440
ttccggcgtc aacttccgct ttcccacgct acgtcacttg ccccagtcaa acaaactaca 34500
tatcccgaac ttccaagtcg ccacgcccaa aacaccgcct acacctcccc gcccgccggc 34560
ccgcccccaa acccgcctcc cgccccgcgc cccgccccgc gccgcccatc tcattatcat 34620
attggcttca atccaaaata aggtatatta ttgatgatgg tttaaacgga tcctctagag 34680
tcgacctgca ggcatgcaag cttgagtatt ctatagtgtc acctaaatag cttggcgtaa 34740
tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 34800
cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 34860
attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 34920
tgaatcggcc aacgcgaacc ccttgcggcc gcccgggccg tcgaccaatt ctcatgtttg 34980
acagcttatc atcgaatttc tgccattcat ccgcttatta tcacttattc agctcggtac 35040
ccggggatcc tcgtttaaac aggcgtagca accaggcgtt taagggcacc aataactgcc 35100
ttaaaaaaat tacgccccgc cctgccactc atcgcagtac tgttgtaatt cattaagcat 35160
tctgccgaca tggaagccat cacaaacggc atgatgaacc tgaatcgcca gcggcatcag 35220
caccttgtcg ccttgcgtat aatatttgcc catggtgaaa acgggggcga agaagttgtc 35280
catattggcc acgtttaaat caaaactggt gaaactcacc cagggattgg ctgagacgaa 35340
aaacatattc tcaataaacc ctttagggaa ataggccagg ttttcaccgt aacacgccac 35400
atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg tggtattcac tccagagcga 35460
tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa gggtgaacac tatcccatat 35520
caccagctca ccgtctttca ttgccatacg gaattccgga tgagcattca tcaggcgggc 35580
aagaatgtga ataaaggccg gataaaactt gtgcttattt ttctttacgg tctttaaaaa 35640
ggccgtaata tccagctgaa cggtctggtt ataggtacat tgagcaactg actgaaatgc 35700
ctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatc cagtgatttt 35760
tttctccatt ttagcttcct tagctcctga aaatctcgat aactcaaaaa atacgcccgg 35820
tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat caacgtctca 35880
ttttcgccaa aagttggccc agggcttccc ggtatcaaca gggacaccag gatttattta 35940
ttctgcgaag tgatcttccg tcacaggtat ttattcgcga taagctcatg gagcggcgta 36000
accgtcgcac aggaaggaca gagaaagcgc ggatctggga agtgacggac agaacggtca 36060
ggacctggat tggggaggcg gttgccgccg ctgctgctga cggtgtgacg ttctctgttc 36120
cggtcacacc acatacgttc cgccattcct atgcgatgca catgctgtat gccggtatac 36180
cgctgaaagt tctgcaaagc ctgatgggac ataagtccat cagttcaacg gaagtctaca 36240
cgaaggtttt tgcgctggat gtggctgccc ggcaccgggt gcagtttgcg atgccggagt 36300
ctgatgcggt tgcgatgctg aaacaattat cctgagaata aatgccttgg cctttatatg 36360
gaaatgtgga actgagtgga tatgctgttt ttgtctgtta aacagagaag ctggctgtta 36420
tccactgaga agcgaacgaa acagtcggga aaatctccca ttatcgtaga gatccgcatt 36480
attaatctca ggagcctgtg tagcgtttat aggaagtagt gttctgtcat gatgcctgca 36540
agcggtaacg aaaacgattt gaatatgcct tcaggaacaa tagaaatctt cgtgcggtgt 36600
tacgttgaag tggagcggat tatgtcagca atggacagaa caacctaatg aacacagaac 36660
catgatgtgg tctgtccttt tacagccagt agtgctcgcc gcagtcgagc gacagggcga 36720
agccctcgag tgagcgagga agcaccaggg aacagcactt atatattctg cttacacacg 36780
atgcctgaaa aaacttccct tggggttatc cacttatcca cggggatatt tttataatta 36840
ttttttttat agtttttaga tcttcttttt tagagcgcct tgtaggcctt tatccatgct 36900
ggttctagag aaggtgttgt gacaaattgc cctttcagtg tgacaaatca ccctcaaatg 36960
acagtcctgt ctgtgacaaa ttgcccttaa ccctgtgaca aattgccctc agaagaagct 37020
gttttttcac aaagttatcc ctgcttattg actctttttt atttagtgtg acaatctaaa 37080
aacttgtcac acttcacatg gatctgtcat ggcggaaaca gcggttatca atcacaagaa 37140
acgtaaaaat agcccgcgaa tcgtccagtc aaacgacctc actgaggcgg catatagtct 37200
ctcccgggat caaaaacgta tgctgtatct gttcgttgac cagatcagaa aatctgatgg 37260
caccctacag gaacatgacg gtatctgcga gatccatgtt gctaaatatg ctgaaatatt 37320
cggattgacc tctgcggaag ccagtaagga tatacggcag gcattgaaga gtttcgcggg 37380
gaaggaagtg gttttttatc gccctgaaga ggatgccggc gatgaaaaag gctatgaatc 37440
ttttccttgg tttatcaaac gtgcgcacag tccatccaga gggctttaca gtgtacatat 37500
caacccatat ctcattccct tctttatcgg gttacagaac cggtttacgc agtttcggct 37560
tagtgaaaca aaagaaatca ccaatccgta tgccatgcgt ttatacgaat ccctgtgtca 37620
gtatcgtaag ccggatggct caggcatcgt ctctctgaaa atcgactgga tcatagagcg 37680
ttaccagctg cctcaaagtt accagcgtat gcctgacttc cgccgccgct tcctgcaggt 37740
ctgtgttaat gagatcaaca gcagaactcc aatgcgcctc tcatacattg agaaaaagaa 37800
aggccgccag acgactcata tcgtattttc cttccgcgat atcacttcca tgacgacagg 37860
atagtctgag ggttatctgt cacagatttg agggtggttc gtcacatttg ttctgaccta 37920
ctgagggtaa tttgtcacag ttttgctgtt tccttcagcc tgcatggatt ttctcatact 37980
ttttgaactg taatttttaa ggaagccaaa tttgagggca gtttgtcaca gttgatttcc 38040
ttctctttcc cttcgtcatg tgacctgata tcgggggtta gttcgtcatc attgatgagg 38100
gttgattatc acagtttatt actctgaatt ggctatccgc gtgtgtacct ctacctggag 38160
tttttcccac ggtggatatt tcttcttgcg ctgagcgtaa gagctatctg acagaacagt 38220
tcttctttgc ttcctcgcca gttcgctcgc tatgctcggt tacacggctg cggcgagcgc 38280
tagtgataat aagtgactga ggtatgtgct cttcttatct ccttttgtag tgttgctctt 38340
attttaaaca actttgcggt tttttgatga ctttgcgatt ttgttgttgc tttgcagtaa 38400
attgcaagat ttaataaaaa aacgcaaagc aatgattaaa ggatgttcag aatgaaactc 38460
atggaaacac ttaaccagtg cataaacgct ggtcatgaaa tgacgaaggc tatcgccatt 38520
gcacagttta atgatgacag cccggaagcg aggaaaataa cccggcgctg gagaataggt 38580
gaagcagcgg atttagttgg ggtttcttct caggctatca gagatgccga gaaagcaggg 38640
cgactaccgc acccggatat ggaaattcga ggacgggttg agcaacgtgt tggttataca 38700
attgaacaaa ttaatcatat gcgtgatgtg tttggtacgc gattgcgacg tgctgaagac 38760
gtatttccac cggtgatcgg ggttgctgcc cataaaggtg gcgtttacaa aacctcagtt 38820
tctgttcatc ttgctcagga tctggctctg aaggggctac gtgttttgct cgtggaaggt 38880
aacgaccccc agggaacagc ctcaatgtat cacggatggg taccagatct tcatattcat 38940
gcagaagaca ctctcctgcc tttctatctt ggggaaaagg acgatgtcac ttatgcaata 39000
aagcccactt gctggccggg gcttgacatt attccttcct gtctggctct gcaccgtatt 39060
gaaactgagt taatgggcaa atttgatgaa ggtaaactgc ccaccgatcc acacctgatg 39120
ctccgactgg ccattgaaac tgttgctcat gactatgatg tcatagttat tgacagcgcg 39180
cctaacctgg gtatcggcac gattaatgtc gtatgtgctg ctgatgtgct gattgttccc 39240
acgcctgctg agttgtttga ctacacctcc gcactgcagt ttttcgatat gcttcgtgat 39300
ctgctcaaga acgttgatct taaagggttc gagcctgatg tacgtatttt gcttaccaaa 39360
tacagcaata gtaatggctc tcagtccccg tggatggagg agcaaattcg ggatgcctgg 39420
ggaagcatgg ttctaaaaaa tgttgtacgt gaaacggatg aagttggtaa aggtcagatc 39480
cggatgagaa ctgtttttga acaggccatt gatcaacgct cttcaactgg tgcctggaga 39540
aatgctcttt ctatttggga acctgtctgc aatgaaattt tcgatcgtct gattaaacca 39600
cgctgggaga ttagataatg aagcgtgcgc ctgttattcc aaaacatacg ctcaatactc 39660
aaccggttga agatacttcg ttatcgacac cagctgcccc gatggtggat tcgttaattg 39720
cgcgcgtagg agtaatggct cgcggtaatg ccattacttt gcctgtatgt ggtcgggatg 39780
tgaagtttac tcttgaagtg ctccggggtg atagtgttga gaagacctct cgggtatggt 39840
caggtaatga acgtgaccag gagctgctta ctgaggacgc actggatgat ctcatccctt 39900
cttttctact gactggtcaa cagacaccgg cgttcggtcg aagagtatct ggtgtcatag 39960
aaattgccga tgggagtcgc cgtcgtaaag ctgctgcact taccgaaagt gattatcgtg 40020
ttctggttgg cgagctggat gatgagcaga tggctgcatt atccagattg ggtaacgatt 40080
atcgcccaac aagtgcttat gaacgtggtc agcgttatgc aagccgattg cagaatgaat 40140
ttgctggaaa tatttctgcg ctggctgatg cggaaaatat ttcacgtaag attattaccc 40200
gctgtatcaa caccgccaaa ttgcctaaat cagttgttgc tcttttttct caccccggtg 40260
aactatctgc ccggtcaggt gatgcacttc aaaaagcctt tacagataaa gaggaattac 40320
ttaagcagca ggcatctaac cttcatgagc agaaaaaagc tggggtgata tttgaagctg 40380
aagaagttat cactctttta acttctgtgc ttaaaacgtc atctgcatca agaactagtt 40440
taagctcacg acatcagttt gctcctggag cgacagtatt gtataagggc gataaaatgg 40500
tgcttaacct ggacaggtct cgtgttccaa ctgagtgtat agagaaaatt gaggccattc 40560
ttaaggaact tgaaaagcca gcaccctgat gcgaccacgt tttagtctac gtttatctgt 40620
ctttacttaa tgtcctttgt tacaggccag aaagcataac tggcctgaat attctctctg 40680
ggcccactgt tccacttgta tcgtcggtct gataatcaga ctgggaccac ggtcccactc 40740
gtatcgtcgg tctgattatt agtctgggac cacggtccca ctcgtatcgt cggtctgatt 40800
attagtctgg gaccacggtc ccactcgtat cgtcggtctg ataatcagac tgggaccacg 40860
gtcccactcg tatcgtcggt ctgattatta gtctgggacc atggtcccac tcgtatcgtc 40920
ggtctgatta ttagtctggg accacggtcc cactcgtatc gtcggtctga ttattagtct 40980
ggaaccacgg tcccactcgt atcgtcggtc tgattattag tctgggacca cggtcccact 41040
cgtatcgtcg gtctgattat tagtctggga ccacgatccc actcgtgttg tcggtctgat 41100
tatcggtctg ggaccacggt cccacttgta ttgtcgatca gactatcagc gtgagactac 41160
gattccatca atgcctgtca agggcaagta ttgacatgtc gtcgtaacct gtagaacgga 41220
gtaacctcgg tgtgcggttg tatgcctgct gtggattgct gctgtgtcct gcttatccac 41280
aacattttgc gcacggttat gtggacaaaa tacctggtta cccaggccgt gccggcacgt 41340
taaccgggct gcatccgatg caagtgtgtc gctgtcgacg agctcgcgag ctcggacatg 41400
aggttgcccc gtattcagtg tcgctgattt gtattgtctg aagttgtttt tacgttaagt 41460
tgatgcagat caattaatac gatacctgcg tcataattga ttatttgacg tggtttgatg 41520
gcctccacgc acgttgtgat atgtagatga taatcattat cactttacgg gtcctttccg 41580
gtgatccgac aggttacggg gcggcgacct cgcgggtttt cgctatttat gaaaattttc 41640
cggtttaagg cgtttccgtt cttcttcgtc ataacttaat gtttttattt aaaataccct 41700
ctgaaaagaa aggaaacgac aggtgctgaa agcgagcttt ttggcctctg tcgtttcctt 41760
tctctgtttt tgtccgtgga atgaacaatg gaagtccgag ctcatcgcta ataacttcgt 41820
atagcataca ttatacgaag ttatattcga tgcggccgca aggggttcgc gtcagcgggt 41880
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 41940
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 42000
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 42060
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 42120
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tgtaatacga ctcactatag 42180
ggcgaattcg agctcggtac ccggggatcc tcgtttaaac 42220
SEQUENCE LISTING
<110> GLAXOSMITHKLINE BIOLOGICALS S.A.
<120> EPSTEIN-BARR VIRUS ANTIGEN CONSTRUCTS
<130> PA23-352
<140>
<141> 2018-12-14
<150> US 62/608,038
<151> 2017-12-20
<160> 54
<170> PatentIn version 3.5
<210> 1
<211> 386
<212> PRT
<213> Human herpesvirus 4
<400> 1
Met Glu His Asp Leu Glu Arg Gly Pro Pro Gly Pro Arg Arg Pro Pro
1 5 10 15
Arg Gly Pro Pro Leu Ser Ser Ser Leu Gly Leu Ala Leu Leu Leu Leu
20 25 30
Leu Leu Ala Leu Leu Phe Trp Leu Tyr Ile Val Met Ser Asp Trp Thr
35 40 45
Gly Gly Ala Leu Leu Val Leu Tyr Ser Phe Ala Leu Met Leu Ile Ile
50 55 60
Ile Ile Leu Ile Ile Phe Ile Phe Arg Arg Asp Leu Leu Cys Pro Leu
65 70 75 80
Gly Ala Leu Cys Ile Leu Leu Leu Met Ile Thr Leu Leu Leu Ile Ala
85 90 95
Leu Trp Asn Leu His Gly Gln Ala Leu Phe Leu Gly Ile Val Leu Phe
100 105 110
Ile Phe Gly Cys Leu Leu Val Leu Gly Ile Trp Ile Tyr Leu Leu Glu
115 120 125
Met Leu Trp Arg Leu Gly Ala Thr Ile Trp Gln Leu Leu Ala Phe Phe
130 135 140
Leu Ala Phe Phe Leu Asp Leu Ile Leu Leu Ile Ile Ala Leu Tyr Leu
145 150 155 160
Gln Gln Asn Trp Trp Thr Leu Leu Val Asp Leu Leu Trp Leu Leu Leu
165 170 175
Phe Leu Ala Ile Leu Ile Trp Met Tyr Tyr His Gly Gln Arg His Ser
180 185 190
Asp Glu His His His Asp Asp Ser Leu Pro His Pro Gln Gln Ala Thr
195 200 205
Asp Asp Ser Gly His Glu Ser Asp Ser Asn Ser Asn Glu Gly Arg His
210 215 220
His Leu Leu Val Ser Gly Ala Gly Asp Gly Pro Pro Leu Cys Ser Gln
225 230 235 240
Asn Leu Gly Ala Pro Gly Gly Gly Pro Asp Asn Gly Pro Gln Asp Pro
245 250 255
Asp Asn Thr Asp Asp Asn Gly Pro Gln Asp Pro Asp Asn Thr Asp Asp
260 265 270
Asn Gly Pro His Asp Pro Leu Pro Gln Asp Pro Asp Asn Thr Asp Asp
275 280 285
Asn Gly Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro His Asp
290 295 300
Pro Leu Pro His Ser Pro Ser Asp Ser Ala Gly Asn Asp Gly Gly Pro
305 310 315 320
Pro Gln Leu Thr Glu Glu Val Glu Asn Lys Gly Gly Asp Gln Gly Pro
325 330 335
Pro Leu Met Thr Asp Gly Gly Gly Gly His Ser His Asp Ser Gly His
340 345 350
Gly Gly Gly Asp Pro His Leu Pro Thr Leu Leu Leu Gly Ser Ser Gly
355 360 365
Ser Gly Gly Asp Asp Asp Asp Pro His Gly Pro Val Gln Leu Ser Tyr
370 375 380
Tyr Asp
385
<210> 2
<211> 62
<212> PRT
<213> Human herpesvirus 4
<400> 2
Met Ser Asp Trp Thr Gly Gly Ala Leu Leu Val Leu Tyr Ser Phe Ala
1 5 10 15
Leu Met Leu Ile Ile Ile Ile Leu Ile Ile Phe Ile Phe Arg Arg Asp
20 25 30
Leu Leu Cys Pro Leu Gly Ala Leu Cys Ile Leu Leu Leu Met Ile Thr
35 40 45
Leu Leu Leu Ile Ala Leu Trp Asn Leu His Gly Gln Ala Leu
50 55 60
<210> 3
<211> 85
<212> PRT
<213> Human herpesvirus 4
<400> 3
Phe Leu Gly Ile Val Leu Phe Ile Phe Gly Cys Leu Leu Val Leu Gly
1 5 10 15
Ile Trp Ile Tyr Leu Leu Glu Met Leu Trp Arg Leu Gly Ala Thr Ile
20 25 30
Trp Gln Leu Leu Ala Phe Phe Leu Ala Phe Phe Leu Asp Leu Ile Leu
35 40 45
Leu Ile Ile Ala Leu Tyr Leu Gln Gln Asn Trp Trp Thr Leu Leu Val
50 55 60
Asp Leu Leu Trp Leu Leu Leu Phe Leu Ala Ile Leu Ile Trp Met Tyr
65 70 75 80
Tyr His Gly Gln Arg
85
<210> 4
<211> 40
<212> PRT
<213> Human herpesvirus 4
<400> 4
His Ser Asp Glu His His His Asp Asp Ser Leu Pro His Pro Gln Gln
1 5 10 15
Ala Thr Asp Asp Ser Gly His Glu Ser Asp Ser Asn Ser Asn Glu Gly
20 25 30
Arg His His Leu Leu Val Ser Gly
35 40
<210> 5
<211> 114
<212> PRT
<213> Human herpesvirus 4
<400> 5
Asn Gly Pro His Asp Pro Leu Pro Gln Asp Pro Asp Asn Thr Asp Asp
1 5 10 15
Asn Gly Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro His Asp
20 25 30
Pro Leu Pro His Ser Pro Ser Asp Ser Ala Gly Asn Asp Gly Gly Pro
35 40 45
Pro Gln Leu Thr Glu Glu Val Glu Asn Lys Gly Gly Asp Gln Gly Pro
50 55 60
Pro Leu Met Thr Asp Gly Gly Gly Gly His Ser His Asp Ser Gly His
65 70 75 80
Gly Gly Gly Asp Pro His Leu Pro Thr Leu Leu Leu Gly Ser Ser Gly
85 90 95
Ser Gly Gly Asp Asp Asp Asp Pro His Gly Pro Val Gln Leu Ser Tyr
100 105 110
Tyr Asp
<210> 6
<211> 497
<212> PRT
<213> Human herpesvirus 4
<400> 6
Met Gly Ser Leu Glu Met Val Pro Met Gly Ala Gly Pro Pro Ser Pro
1 5 10 15
Gly Gly Asp Pro Asp Gly Tyr Asp Gly Gly Asn Asn Ser Gln Tyr Pro
20 25 30
Ser Ala Ser Gly Ser Ser Gly Asn Thr Pro Thr Pro Pro Asn Asp Glu
35 40 45
Glu Arg Glu Ser Asn Glu Glu Pro Pro Pro Pro Tyr Glu Asp Pro Tyr
50 55 60
Trp Gly Asn Gly Asp Arg His Ser Asp Tyr Gln Pro Leu Gly Thr Gln
65 70 75 80
Asp Gln Ser Leu Tyr Leu Gly Leu Gln His Asp Gly Asn Asp Gly Leu
85 90 95
Pro Pro Pro Pro Tyr Ser Pro Arg Asp Asp Ser Ser Gln His Ile Tyr
100 105 110
Glu Glu Ala Gly Arg Gly Ser Met Asn Pro Val Cys Leu Pro Val Ile
115 120 125
Val Ala Pro Tyr Leu Phe Trp Leu Ala Ala Ile Ala Ala Ser Cys Phe
130 135 140
Thr Ala Ser Val Ser Thr Val Val Thr Ala Thr Gly Leu Ala Leu Ser
145 150 155 160
Leu Leu Leu Leu Ala Ala Val Ala Ser Ser Tyr Ala Ala Ala Gln Arg
165 170 175
Lys Leu Leu Thr Pro Val Thr Val Leu Thr Ala Val Val Thr Phe Phe
180 185 190
Ala Ile Cys Leu Thr Trp Arg Ile Glu Asp Pro Pro Phe Asn Ser Leu
195 200 205
Leu Phe Ala Leu Leu Ala Ala Ala Gly Gly Leu Gln Gly Ile Tyr Val
210 215 220
Leu Val Met Leu Val Leu Leu Ile Leu Ala Tyr Arg Arg Arg Trp Arg
225 230 235 240
Arg Leu Thr Val Cys Gly Gly Ile Met Phe Leu Ala Cys Val Leu Val
245 250 255
Leu Ile Val Asp Ala Val Leu Gln Leu Ser Pro Leu Leu Gly Ala Val
260 265 270
Thr Val Val Ser Met Thr Leu Leu Leu Leu Ala Phe Val Leu Trp Leu
275 280 285
Ser Ser Pro Gly Gly Leu Gly Thr Leu Gly Ala Ala Leu Leu Thr Leu
290 295 300
Ala Ala Ala Leu Ala Leu Leu Ala Ser Leu Ile Leu Gly Thr Leu Asn
305 310 315 320
Leu Thr Thr Met Phe Leu Leu Met Leu Leu Trp Thr Leu Val Val Leu
325 330 335
Leu Ile Cys Ser Ser Cys Ser Ser Cys Pro Leu Ser Lys Ile Leu Leu
340 345 350
Ala Arg Leu Phe Leu Tyr Ala Leu Ala Leu Leu Leu Leu Ala Ser Ala
355 360 365
Leu Ile Ala Gly Gly Ser Ile Leu Gln Thr Asn Phe Lys Ser Leu Ser
370 375 380
Ser Thr Glu Phe Ile Pro Asn Leu Phe Cys Met Leu Leu Leu Ile Val
385 390 395 400
Ala Gly Ile Leu Phe Ile Leu Ala Ile Leu Thr Glu Trp Gly Ser Gly
405 410 415
Asn Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu Leu Thr
420 425 430
Met Val Ala Gly Ala Val Trp Leu Thr Val Met Ser Asn Thr Leu Leu
435 440 445
Ser Ala Trp Ile Leu Thr Ala Gly Phe Leu Ile Phe Leu Ile Gly Phe
450 455 460
Ala Leu Phe Gly Val Ile Arg Cys Cys Arg Tyr Cys Cys Tyr Tyr Cys
465 470 475 480
Leu Thr Leu Glu Ser Glu Glu Arg Pro Pro Thr Pro Tyr Arg Asn Thr
485 490 495
Val
<210> 7
<211> 71
<212> PRT
<213> Human herpesvirus 4
<400> 7
Met Asn Pro Val Cys Leu Pro Val Ile Val Ala Pro Tyr Leu Phe Trp
1 5 10 15
Leu Ala Ala Ile Ala Ala Ser Cys Phe Thr Ala Ser Val Ser Thr Val
20 25 30
Val Thr Ala Thr Gly Leu Ala Leu Ser Leu Leu Leu Leu Ala Ala Val
35 40 45
Ala Ser Ser Tyr Ala Ala Ala Gln Arg Lys Leu Leu Thr Pro Val Thr
50 55 60
Val Leu Thr Ala Val Val Thr
65 70
<210> 8
<211> 94
<212> PRT
<213> Human herpesvirus 4
<400> 8
Phe Phe Ala Ile Cys Leu Thr Trp Arg Ile Glu Asp Pro Pro Phe Asn
1 5 10 15
Ser Leu Leu Phe Ala Leu Leu Ala Ala Ala Gly Gly Leu Gln Gly Ile
20 25 30
Tyr Val Leu Val Met Leu Val Leu Leu Ile Leu Ala Tyr Arg Arg Arg
35 40 45
Trp Arg Arg Leu Thr Val Cys Gly Gly Ile Met Phe Leu Ala Cys Val
50 55 60
Leu Val Leu Ile Val Asp Ala Val Leu Gln Leu Ser Pro Leu Leu Gly
65 70 75 80
Ala Val Thr Val Val Ser Met Thr Leu Leu Leu Leu Ala Phe
85 90
<210> 9
<211> 115
<212> PRT
<213> Human herpesvirus 4
<400> 9
Val Leu Trp Leu Ser Ser Pro Gly Gly Leu Gly Thr Leu Gly Ala Ala
1 5 10 15
Leu Leu Thr Leu Ala Ala Ala Leu Ala Leu Leu Ala Ser Leu Ile Leu
20 25 30
Gly Thr Leu Asn Leu Thr Thr Met Phe Leu Leu Met Leu Leu Trp Thr
35 40 45
Leu Val Val Leu Leu Ile Cys Ser Ser Cys Ser Ser Cys Pro Leu Ser
50 55 60
Lys Ile Leu Leu Ala Arg Leu Phe Leu Tyr Ala Leu Ala Leu Leu Leu
65 70 75 80
Leu Ala Ser Ala Leu Ile Ala Gly Gly Ser Ile Leu Gln Thr Asn Phe
85 90 95
Lys Ser Leu Ser Ser Thr Glu Phe Ile Pro Asn Leu Phe Cys Met Leu
100 105 110
Leu Leu Ile
115
<210> 10
<211> 98
<212> PRT
<213> Human herpesvirus 4
<400> 10
Val Ala Gly Ile Leu Phe Ile Leu Ala Ile Leu Thr Glu Trp Gly Ser
1 5 10 15
Gly Asn Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu Leu
20 25 30
Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Met Ser Asn Thr Leu
35 40 45
Leu Ser Ala Trp Ile Leu Thr Ala Gly Phe Leu Ile Phe Leu Ile Gly
50 55 60
Phe Ala Leu Phe Gly Val Ile Arg Cys Cys Arg Tyr Cys Cys Tyr Tyr
65 70 75 80
Cys Leu Thr Leu Glu Ser Glu Glu Arg Pro Pro Thr Pro Tyr Arg Asn
85 90 95
Thr Val
<210> 11
<211> 641
<212> PRT
<213> Human herpesvirus 4
<400> 11
Met Ser Asp Glu Gly Pro Gly Thr Gly Pro Gly Asn Gly Leu Gly Glu
1 5 10 15
Lys Gly Asp Thr Ser Gly Pro Glu Gly Ser Gly Gly Ser Gly Pro Gln
20 25 30
Arg Arg Gly Gly Asp Asn His Gly Arg Gly Arg Gly Arg Gly Arg Gly
35 40 45
Arg Gly Gly Gly Arg Pro Gly Ala Pro Gly Gly Ser Gly Ser Gly Pro
50 55 60
Arg His Arg Asp Gly Val Arg Arg Pro Gln Lys Arg Pro Ser Cys Ile
65 70 75 80
Gly Cys Lys Gly Thr His Gly Gly Thr Gly Ala Gly Ala Gly Ala Gly
85 90 95
Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly
100 105 110
Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly
115 120 125
Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala
130 135 140
Gly Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly
145 150 155 160
Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly
165 170 175
Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly
180 185 190
Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly Gly Ala Gly
195 200 205
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala
210 215 220
Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala
225 230 235 240
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly
245 250 255
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly
260 265 270
Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly
275 280 285
Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly
290 295 300
Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly
305 310 315 320
Gly Ala Gly Ala Gly Gly Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly
325 330 335
Arg Gly Arg Gly Gly Ser Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly
340 345 350
Arg Arg Gly Arg Gly Arg Glu Arg Ala Arg Gly Gly Ser Arg Glu Arg
355 360 365
Ala Arg Gly Arg Gly Arg Gly Arg Gly Glu Lys Arg Pro Arg Ser Pro
370 375 380
Ser Ser Gln Ser Ser Ser Ser Gly Ser Pro Pro Arg Arg Pro Pro Pro
385 390 395 400
Gly Arg Arg Pro Phe Phe His Pro Val Gly Glu Ala Asp Tyr Phe Glu
405 410 415
Tyr His Gln Glu Gly Gly Pro Asp Gly Glu Pro Asp Val Pro Pro Gly
420 425 430
Ala Ile Glu Gln Gly Pro Ala Asp Asp Pro Gly Glu Gly Pro Ser Thr
435 440 445
Gly Pro Arg Gly Gln Gly Asp Gly Gly Arg Arg Lys Lys Gly Gly Trp
450 455 460
Phe Gly Lys His Arg Gly Gln Gly Gly Ser Asn Pro Lys Phe Glu Asn
465 470 475 480
Ile Ala Glu Gly Leu Arg Ala Leu Leu Ala Arg Ser His Val Glu Arg
485 490 495
Thr Thr Asp Glu Gly Thr Trp Val Ala Gly Val Phe Val Tyr Gly Gly
500 505 510
Ser Lys Thr Ser Leu Tyr Asn Leu Arg Arg Gly Thr Ala Leu Ala Ile
515 520 525
Pro Gln Cys Arg Leu Thr Pro Leu Ser Arg Leu Pro Phe Gly Met Ala
530 535 540
Pro Gly Pro Gly Pro Gln Pro Gly Pro Leu Arg Glu Ser Ile Val Cys
545 550 555 560
Tyr Phe Met Val Phe Leu Gln Thr His Ile Phe Ala Glu Val Leu Lys
565 570 575
Asp Ala Ile Lys Asp Leu Val Met Thr Lys Pro Ala Pro Thr Cys Asn
580 585 590
Ile Arg Val Thr Val Cys Ser Phe Asp Asp Gly Val Asp Leu Pro Pro
595 600 605
Trp Phe Pro Pro Met Val Glu Gly Ala Ala Ala Glu Gly Asp Asp Gly
610 615 620
Asp Asp Gly Asp Glu Gly Gly Asp Gly Asp Glu Gly Glu Glu Gly Gln
625 630 635 640
Glu
<210> 12
<211> 86
<212> PRT
<213> Human herpesvirus 4
<400> 12
Met Ser Asp Glu Gly Pro Gly Thr Gly Pro Gly Asn Gly Leu Gly Glu
1 5 10 15
Lys Gly Asp Thr Ser Gly Pro Glu Gly Ser Gly Gly Ser Gly Pro Gln
20 25 30
Arg Arg Gly Gly Asp Asn His Gly Arg Gly Arg Gly Arg Gly Arg Gly
35 40 45
Arg Gly Gly Gly Arg Pro Gly Ala Pro Gly Gly Ser Gly Ser Gly Pro
50 55 60
Arg His Arg Asp Gly Val Arg Arg Pro Gln Lys Arg Pro Ser Cys Ile
65 70 75 80
Gly Cys Lys Gly Thr His
85
<210> 13
<211> 944
<212> PRT
<213> Human herpesvirus 4
<400> 13
Met Asp Lys Asp Arg Pro Gly Pro Pro Ala Leu Asp Asp Asn Met Glu
1 5 10 15
Glu Glu Val Pro Ser Thr Ser Val Val Gln Glu Gln Val Ser Ala Gly
20 25 30
Asp Trp Glu Asn Val Leu Ile Glu Leu Ser Asp Ser Ser Ser Glu Lys
35 40 45
Glu Ala Glu Asp Ala His Leu Glu Pro Ala Gln Lys Gly Thr Lys Arg
50 55 60
Lys Arg Val Asp His Asp Ala Gly Gly Ser Ala Pro Ala Arg Pro Met
65 70 75 80
Leu Pro Pro Gln Pro Asp Leu Pro Gly Arg Glu Ala Ile Leu Arg Arg
85 90 95
Phe Pro Leu Asp Leu Arg Thr Leu Leu Gln Ala Ile Gly Ala Ala Ala
100 105 110
Thr Arg Ile Asp Thr Arg Ala Ile Asp Gln Phe Phe Gly Ser Gln Ile
115 120 125
Ser Asn Thr Glu Met Tyr Ile Met Tyr Ala Met Ala Ile Arg Gln Ala
130 135 140
Ile Arg Asp Arg Arg Arg Asn Pro Ala Ser Arg Arg Asp Gln Ala Lys
145 150 155 160
Trp Arg Leu Gln Thr Leu Ala Ala Gly Trp Pro Met Gly Tyr Gln Ala
165 170 175
Tyr Ser Ser Trp Met Tyr Ser Tyr Thr Asp His Gln Thr Thr Pro Thr
180 185 190
Phe Val His Leu Gln Ala Thr Leu Gly Cys Thr Gly Gly Arg Arg Cys
195 200 205
His Val Thr Phe Ser Ala Gly Thr Phe Lys Leu Pro Arg Cys Thr Pro
210 215 220
Gly Asp Arg Gln Trp Leu Tyr Val Gln Ser Ser Val Gly Asn Ile Val
225 230 235 240
Gln Ser Cys Asn Pro Arg Tyr Ser Ile Phe Phe Asp Tyr Met Ala Ile
245 250 255
His Arg Ser Leu Thr Lys Ile Trp Glu Glu Val Leu Thr Pro Asp Gln
260 265 270
Arg Val Ser Phe Met Glu Phe Leu Gly Phe Leu Gln Arg Thr Asp Leu
275 280 285
Ser Tyr Ile Lys Ser Phe Val Ser Asp Ala Leu Gly Thr Thr Ser Ile
290 295 300
Gln Thr Pro Trp Ile Asp Asp Asn Pro Ser Thr Glu Thr Ala Gln Ala
305 310 315 320
Trp Asn Ala Gly Phe Leu Arg Gly Arg Ala Tyr Gly Ile Asp Leu Leu
325 330 335
Arg Thr Glu Gly Glu His Val Glu Gly Ala Thr Gly Glu Thr Arg Glu
340 345 350
Glu Ser Glu Asp Thr Glu Ser Asp Gly Asp Asp Glu Asp Leu Pro Cys
355 360 365
Ile Val Ser Arg Gly Gly Pro Lys Val Lys Arg Pro Pro Ile Phe Ile
370 375 380
Arg Arg Leu His Arg Leu Leu Leu Met Arg Ala Gly Lys Arg Thr Glu
385 390 395 400
Gln Gly Lys Glu Val Leu Glu Lys Ala Arg Gly Ser Thr Tyr Gly Thr
405 410 415
Pro Arg Pro Pro Val Pro Lys Pro Arg Pro Glu Val Pro Gln Ser Asp
420 425 430
Glu Thr Ala Thr Ser His Gly Ser Ala Gln Val Pro Glu Pro Pro Thr
435 440 445
Ile His Leu Ala Ala Gln Gly Met Ala Tyr Pro Leu His Glu Gln His
450 455 460
Gly Met Ala Pro Cys Pro Val Ala Gln Ala Pro Pro Thr Pro Leu Pro
465 470 475 480
Pro Val Ser Pro Gly Asp Gln Leu Pro Gly Val Phe Ser Asp Gly Arg
485 490 495
Val Ala Cys Ala Pro Val Pro Ala Pro Ala Gly Pro Ile Val Arg Pro
500 505 510
Trp Glu Pro Ser Leu Thr Gln Ala Ala Gly Gln Ala Phe Ala Pro Val
515 520 525
Arg Pro Gln His Met Pro Val Glu Pro Val Pro Val Pro Thr Val Ala
530 535 540
Leu Glu Arg Pro Val Tyr Pro Lys Pro Val Arg Pro Ala Pro Pro Lys
545 550 555 560
Ile Ala Met Gln Gly Pro Gly Glu Thr Ser Gly Ile Arg Arg Ala Arg
565 570 575
Glu Arg Trp Arg Pro Ala Pro Trp Thr Pro Asn Pro Pro Arg Ser Pro
580 585 590
Ser Gln Met Ser Val Arg Asp Arg Leu Ala Arg Leu Arg Ala Glu Ala
595 600 605
Gln Val Lys Gln Ala Ser Val Glu Val Gln Pro Pro Gln Leu Thr Gln
610 615 620
Val Ser Pro Gln Gln Pro Met Glu Gly Pro Leu Val Pro Glu Gln Gln
625 630 635 640
Met Phe Pro Gly Ala Pro Phe Ser Gln Val Ala Asp Val Val Arg Ala
645 650 655
Pro Gly Val Pro Ala Met Gln Pro Gln Tyr Phe Asp Leu Pro Leu Ile
660 665 670
Gln Pro Ile Ser Gln Gly Ala Pro Val Ala Pro Leu Arg Ala Ser Met
675 680 685
Gly Pro Val Pro Pro Val Pro Ala Thr Gln Pro Gln Tyr Phe Asp Ile
690 695 700
Pro Leu Thr Glu Pro Ile Asn Gln Gly Ala Ser Ala Ala His Phe Leu
705 710 715 720
Pro Gln Gln Pro Met Glu Gly Pro Leu Val Pro Glu Gln Trp Met Phe
725 730 735
Pro Gly Ala Ala Leu Ser Gln Ser Val Arg Pro Gly Val Ala Gln Ser
740 745 750
Gln Tyr Phe Asp Leu Pro Leu Thr Gln Pro Ile Asn His Gly Ala Pro
755 760 765
Ala Ala His Phe Leu His Gln Pro Pro Met Glu Gly Pro Trp Val Pro
770 775 780
Glu Gln Trp Met Phe Gln Gly Ala Pro Pro Ser Gln Gly Thr Asp Val
785 790 795 800
Val Gln His Gln Leu Asp Ala Leu Gly Tyr Thr Leu His Gly Leu Asn
805 810 815
His Pro Gly Val Pro Val Ser Pro Ala Val Asn Gln Tyr His Leu Ser
820 825 830
Gln Ala Ala Phe Gly Leu Pro Ile Asp Glu Asp Glu Ser Gly Glu Gly
835 840 845
Ser Asp Thr Ser Glu Pro Cys Glu Ala Leu Asp Leu Ser Ile His Gly
850 855 860
Arg Pro Cys Pro Gln Ala Pro Glu Trp Pro Val Gln Glu Glu Gly Gly
865 870 875 880
Gln Asp Ala Thr Glu Val Leu Asp Leu Ser Ile His Gly Arg Pro Arg
885 890 895
Pro Arg Thr Pro Glu Trp Pro Val Gln Gly Glu Gly Gly Gln Asn Val
900 905 910
Thr Gly Pro Glu Thr Arg Arg Val Val Val Ser Ala Val Val His Met
915 920 925
Cys Gln Asp Asp Glu Phe Pro Asp Leu Gln Asp Pro Pro Asp Glu Ala
930 935 940
<210> 14
<211> 66
<212> PRT
<213> Human herpesvirus 4
<400> 14
Ile Arg Asp Arg Arg Arg Asn Pro Ala Ser Arg Arg Asp Gln Ala Lys
1 5 10 15
Trp Arg Leu Gln Thr Leu Ala Ala Gly Trp Pro Met Gly Tyr Gln Ala
20 25 30
Tyr Ser Ser Trp Met Tyr Ser Tyr Thr Asp His Gln Thr Thr Pro Thr
35 40 45
Phe Val His Leu Gln Ala Thr Leu Gly Cys Thr Gly Gly Arg Arg Cys
50 55 60
His Val
65
<210> 15
<211> 55
<212> PRT
<213> Human herpesvirus 4
<400> 15
Thr Phe Ser Ala Gly Thr Phe Lys Leu Pro Arg Cys Thr Pro Gly Asp
1 5 10 15
Arg Gln Trp Leu Tyr Val Gln Ser Ser Val Gly Asn Ile Val Gln Ser
20 25 30
Cys Asn Pro Arg Tyr Ser Ile Phe Phe Asp Tyr Met Ala Ile His Arg
35 40 45
Ser Leu Thr Lys Ile Trp Glu
50 55
<210> 16
<211> 88
<212> PRT
<213> Human herpesvirus 4
<400> 16
Trp Ile Asp Asp Asn Pro Ser Thr Glu Thr Ala Gln Ala Trp Asn Ala
1 5 10 15
Gly Phe Leu Arg Gly Arg Ala Tyr Gly Ile Asp Leu Leu Arg Thr Glu
20 25 30
Gly Glu His Val Glu Gly Ala Thr Gly Glu Thr Arg Glu Glu Ser Glu
35 40 45
Asp Thr Glu Ser Asp Gly Asp Asp Glu Asp Leu Pro Cys Ile Val Ser
50 55 60
Arg Gly Gly Pro Lys Val Lys Arg Pro Pro Ile Phe Ile Arg Arg Leu
65 70 75 80
His Arg Leu Leu Leu Met Arg Ala
85
<210> 17
<211> 25
<212> PRT
<213> Human herpesvirus 4
<400> 17
Gly Lys Arg Thr Glu Gln Gly Lys Glu Val Leu Glu Lys Ala Arg Gly
1 5 10 15
Ser Thr Tyr Gly Thr Pro Arg Pro Pro
20 25
<210> 18
<211> 40
<212> PRT
<213> Human herpesvirus 4
<400> 18
Ala Gln Val Pro Glu Pro Pro Thr Ile His Leu Ala Ala Gln Gly Met
1 5 10 15
Ala Tyr Pro Leu His Glu Gln His Gly Met Ala Pro Cys Pro Val Ala
20 25 30
Gln Ala Pro Pro Thr Pro Leu Pro
35 40
<210> 19
<211> 62
<212> PRT
<213> Human herpesvirus 4
<400> 19
Gly Arg Val Ala Cys Ala Pro Val Pro Ala Pro Ala Gly Pro Ile Val
1 5 10 15
Arg Pro Trp Glu Pro Ser Leu Thr Gln Ala Ala Gly Gln Ala Phe Ala
20 25 30
Pro Val Arg Pro Gln His Met Pro Val Glu Pro Val Pro Val Pro Thr
35 40 45
Val Ala Leu Glu Arg Pro Val Tyr Pro Lys Pro Val Arg Pro
50 55 60
<210> 20
<211> 51
<212> PRT
<213> Human herpesvirus 4
<400> 20
Arg Pro Ala Pro Trp Thr Pro Asn Pro Pro Arg Ser Pro Ser Gln Met
1 5 10 15
Ser Val Arg Asp Arg Leu Ala Arg Leu Arg Ala Glu Ala Gln Val Lys
20 25 30
Gln Ala Ser Val Glu Val Gln Pro Pro Gln Leu Thr Gln Val Ser Pro
35 40 45
Gln Gln Pro
50
<210> 21
<211> 245
<212> PRT
<213> Human herpesvirus 4
<400> 21
Met Met Asp Pro Asn Ser Thr Ser Glu Asp Val Lys Phe Thr Pro Asp
1 5 10 15
Pro Tyr Gln Val Pro Phe Val Gln Ala Phe Asp Gln Ala Thr Arg Val
20 25 30
Tyr Gln Asp Leu Gly Gly Pro Ser Gln Ala Pro Leu Pro Cys Val Leu
35 40 45
Trp Pro Val Leu Pro Glu Pro Leu Pro Gln Gly Gln Leu Thr Ala Tyr
50 55 60
His Val Ser Thr Ala Pro Thr Gly Ser Trp Phe Ser Ala Pro Gln Pro
65 70 75 80
Ala Pro Glu Asn Ala Tyr Gln Ala Tyr Ala Ala Pro Gln Leu Phe Pro
85 90 95
Val Ser Asp Ile Thr Gln Asn Gln Gln Thr Asn Gln Ala Gly Gly Glu
100 105 110
Ala Pro Gln Pro Gly Asp Asn Ser Thr Val Gln Thr Ala Ala Ala Val
115 120 125
Val Phe Ala Cys Pro Gly Ala Asn Gln Gly Gln Gln Leu Ala Asp Ile
130 135 140
Gly Val Pro Gln Pro Ala Pro Val Ala Ala Pro Ala Arg Arg Thr Arg
145 150 155 160
Lys Pro Gln Gln Pro Glu Ser Leu Glu Glu Cys Asp Ser Glu Leu Glu
165 170 175
Ile Lys Arg Tyr Lys Asn Arg Val Ala Ser Arg Lys Cys Arg Ala Lys
180 185 190
Phe Lys Gln Leu Leu Gln His Tyr Arg Glu Val Ala Ala Ala Lys Ser
195 200 205
Ser Glu Asn Asp Arg Leu Arg Leu Leu Leu Lys Gln Met Cys Pro Ser
210 215 220
Leu Asp Val Asp Ser Ile Ile Pro Arg Thr Pro Asp Val Leu His Glu
225 230 235 240
Asp Leu Leu Asn Phe
245
<210> 22
<211> 66
<212> PRT
<213> Human herpesvirus 4
<400> 22
Asp Leu Gly Gly Pro Ser Gln Ala Pro Leu Pro Cys Val Leu Trp Pro
1 5 10 15
Val Leu Pro Glu Pro Leu Pro Gln Gly Gln Leu Thr Ala Tyr His Val
20 25 30
Ser Thr Ala Pro Thr Gly Ser Trp Phe Ser Ala Pro Gln Pro Ala Pro
35 40 45
Glu Asn Ala Tyr Gln Ala Tyr Ala Ala Pro Gln Leu Phe Pro Val Ser
50 55 60
Asp Ile
65
<210> 23
<211> 51
<212> PRT
<213> Human herpesvirus 4
<400> 23
Arg Lys Pro Gln Gln Pro Glu Ser Leu Glu Glu Cys Asp Ser Glu Leu
1 5 10 15
Glu Ile Lys Arg Tyr Lys Asn Arg Val Ala Ser Arg Lys Cys Arg Ala
20 25 30
Lys Phe Lys Gln Leu Leu Gln His Tyr Arg Glu Val Ala Ala Ala Lys
35 40 45
Ser Ser Glu
50
<210> 24
<211> 1153
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 24
Met Arg Pro Ala Pro Trp Thr Pro Asn Pro Pro Arg Ser Pro Ser Gln
1 5 10 15
Met Ser Val Arg Asp Arg Leu Ala Arg Leu Arg Ala Glu Ala Gln Val
20 25 30
Lys Gln Ala Ser Val Glu Val Gln Pro Pro Gln Leu Thr Gln Val Ser
35 40 45
Pro Gln Gln Pro Val Ala Gly Ile Leu Phe Ile Leu Ala Ile Leu Thr
50 55 60
Glu Trp Gly Ser Gly Asn Arg Thr Tyr Gly Pro Val Phe Met Cys Leu
65 70 75 80
Gly Gly Leu Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Met
85 90 95
Ser Asn Thr Leu Leu Ser Ala Trp Ile Leu Thr Ala Gly Phe Leu Ile
100 105 110
Phe Leu Ile Gly Phe Ala Leu Phe Gly Val Ile Arg Cys Cys Arg Tyr
115 120 125
Cys Cys Tyr Tyr Cys Leu Thr Leu Glu Ser Glu Glu Arg Pro Pro Thr
130 135 140
Pro Tyr Arg Asn Thr Val Ile Arg Asp Arg Arg Arg Asn Pro Ala Ser
145 150 155 160
Arg Arg Asp Gln Ala Lys Trp Arg Leu Gln Thr Leu Ala Ala Gly Trp
165 170 175
Pro Met Gly Tyr Gln Ala Tyr Ser Ser Trp Met Tyr Ser Tyr Thr Asp
180 185 190
His Gln Thr Thr Pro Thr Phe Val His Leu Gln Ala Thr Leu Gly Cys
195 200 205
Thr Gly Gly Arg Arg Cys His Val Phe Leu Gly Ile Val Leu Phe Ile
210 215 220
Phe Gly Cys Leu Leu Val Leu Gly Ile Trp Ile Tyr Leu Leu Glu Met
225 230 235 240
Leu Trp Arg Leu Gly Ala Thr Ile Trp Gln Leu Leu Ala Phe Phe Leu
245 250 255
Ala Phe Phe Leu Asp Leu Ile Leu Leu Ile Ile Ala Leu Tyr Leu Gln
260 265 270
Gln Asn Trp Trp Thr Leu Leu Val Asp Leu Leu Trp Leu Leu Leu Phe
275 280 285
Leu Ala Ile Leu Ile Trp Met Tyr Tyr His Gly Gln Arg Gly Arg Val
290 295 300
Ala Cys Ala Pro Val Pro Ala Pro Ala Gly Pro Ile Val Arg Pro Trp
305 310 315 320
Glu Pro Ser Leu Thr Gln Ala Ala Gly Gln Ala Phe Ala Pro Val Arg
325 330 335
Pro Gln His Met Pro Val Glu Pro Val Pro Val Pro Thr Val Ala Leu
340 345 350
Glu Arg Pro Val Tyr Pro Lys Pro Val Arg Pro Val Leu Trp Leu Ser
355 360 365
Ser Pro Gly Gly Leu Gly Thr Leu Gly Ala Ala Leu Leu Thr Leu Ala
370 375 380
Ala Ala Leu Ala Leu Leu Ala Ser Leu Ile Leu Gly Thr Leu Asn Leu
385 390 395 400
Thr Thr Met Phe Leu Leu Met Leu Leu Trp Thr Leu Val Val Leu Leu
405 410 415
Ile Cys Ser Ser Cys Ser Ser Cys Pro Leu Ser Lys Ile Leu Leu Ala
420 425 430
Arg Leu Phe Leu Tyr Ala Leu Ala Leu Leu Leu Leu Ala Ser Ala Leu
435 440 445
Ile Ala Gly Gly Ser Ile Leu Gln Thr Asn Phe Lys Ser Leu Ser Ser
450 455 460
Thr Glu Phe Ile Pro Asn Leu Phe Cys Met Leu Leu Leu Ile His Ser
465 470 475 480
Asp Glu His His His Asp Asp Ser Leu Pro His Pro Gln Gln Ala Thr
485 490 495
Asp Asp Ser Gly His Glu Ser Asp Ser Asn Ser Asn Glu Gly Arg His
500 505 510
His Leu Leu Val Ser Gly Ala Gln Val Pro Glu Pro Pro Thr Ile His
515 520 525
Leu Ala Ala Gln Gly Met Ala Tyr Pro Leu His Glu Gln His Gly Met
530 535 540
Ala Pro Cys Pro Val Ala Gln Ala Pro Pro Thr Pro Leu Pro Phe Phe
545 550 555 560
Ala Ile Cys Leu Thr Trp Arg Ile Glu Asp Pro Pro Phe Asn Ser Leu
565 570 575
Leu Phe Ala Leu Leu Ala Ala Ala Gly Gly Leu Gln Gly Ile Tyr Val
580 585 590
Leu Val Met Leu Val Leu Leu Ile Leu Ala Tyr Arg Arg Arg Trp Arg
595 600 605
Arg Leu Thr Val Cys Gly Gly Ile Met Phe Leu Ala Cys Val Leu Val
610 615 620
Leu Ile Val Asp Ala Val Leu Gln Leu Ser Pro Leu Leu Gly Ala Val
625 630 635 640
Thr Val Val Ser Met Thr Leu Leu Leu Leu Ala Phe Asn Gly Pro His
645 650 655
Asp Pro Leu Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro Gln
660 665 670
Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro His Asp Pro Leu Pro His
675 680 685
Ser Pro Ser Asp Ser Ala Gly Asn Asp Gly Gly Pro Pro Gln Leu Thr
690 695 700
Glu Glu Val Glu Asn Lys Gly Gly Asp Gln Gly Pro Pro Leu Met Thr
705 710 715 720
Asp Gly Gly Gly Gly His Ser His Asp Ser Gly His Gly Gly Gly Asp
725 730 735
Pro His Leu Pro Thr Leu Leu Leu Gly Ser Ser Gly Ser Gly Gly Asp
740 745 750
Asp Asp Asp Pro His Gly Pro Val Gln Leu Ser Tyr Tyr Asp Gly Lys
755 760 765
Arg Thr Glu Gln Gly Lys Glu Val Leu Glu Lys Ala Arg Gly Ser Thr
770 775 780
Tyr Gly Thr Pro Arg Pro Pro Met Ser Asp Trp Thr Gly Gly Ala Leu
785 790 795 800
Leu Val Leu Tyr Ser Phe Ala Leu Met Leu Ile Ile Ile Ile Leu Ile
805 810 815
Ile Phe Ile Phe Arg Arg Asp Leu Leu Cys Pro Leu Gly Ala Leu Cys
820 825 830
Ile Leu Leu Leu Met Ile Thr Leu Leu Leu Ile Ala Leu Trp Asn Leu
835 840 845
His Gly Gln Ala Leu Met Ser Asp Glu Gly Pro Gly Thr Gly Pro Gly
850 855 860
Asn Gly Leu Gly Glu Lys Gly Asp Thr Ser Gly Pro Glu Gly Ser Gly
865 870 875 880
Gly Ser Gly Pro Gln Arg Arg Gly Gly Asp Asn His Gly Arg Gly Arg
885 890 895
Gly Arg Gly Arg Gly Arg Gly Gly Gly Arg Pro Gly Ala Pro Gly Gly
900 905 910
Ser Gly Ser Gly Pro Arg His Arg Asp Gly Val Arg Arg Pro Gln Lys
915 920 925
Arg Pro Ser Cys Ile Gly Cys Lys Gly Thr His Trp Ile Asp Asp Asn
930 935 940
Pro Ser Thr Glu Thr Ala Gln Ala Trp Asn Ala Gly Phe Leu Arg Gly
945 950 955 960
Arg Ala Tyr Gly Ile Asp Leu Leu Arg Thr Glu Gly Glu His Val Glu
965 970 975
Gly Ala Thr Gly Glu Thr Arg Glu Glu Ser Glu Asp Thr Glu Ser Asp
980 985 990
Gly Asp Asp Glu Asp Leu Pro Cys Ile Val Ser Arg Gly Gly Pro Lys
995 1000 1005
Val Lys Arg Pro Pro Ile Phe Ile Arg Arg Leu His Arg Leu Leu
1010 1015 1020
Leu Met Arg Ala Met Asn Pro Val Cys Leu Pro Val Ile Val Ala
1025 1030 1035
Pro Tyr Leu Phe Trp Leu Ala Ala Ile Ala Ala Ser Cys Phe Thr
1040 1045 1050
Ala Ser Val Ser Thr Val Val Thr Ala Thr Gly Leu Ala Leu Ser
1055 1060 1065
Leu Leu Leu Leu Ala Ala Val Ala Ser Ser Tyr Ala Ala Ala Gln
1070 1075 1080
Arg Lys Leu Leu Thr Pro Val Thr Val Leu Thr Ala Val Val Thr
1085 1090 1095
Thr Phe Ser Ala Gly Thr Phe Lys Leu Pro Arg Cys Thr Pro Gly
1100 1105 1110
Asp Arg Gln Trp Leu Tyr Val Gln Ser Ser Val Gly Asn Ile Val
1115 1120 1125
Gln Ser Cys Asn Pro Arg Tyr Ser Ile Phe Phe Asp Tyr Met Ala
1130 1135 1140
Ile His Arg Ser Leu Thr Lys Ile Trp Glu
1145 1150
<210> 25
<211> 3459
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 25
atgagacctg ctccctggac acctaatcct cccaggtccc ccagccagat gagcgtgaga 60
gacagactgg ctaggctgag agccgaggct caggtcaagc aggccagcgt cgaggtgcaa 120
ccccctcagc tcacccaggt gtccccccag cagcctgtgg ccggcattct gttcattctg 180
gccattctga ccgagtgggg aagcggcaac agaacctacg gccctgtctt catgtgcctc 240
ggaggactgc tgacaatggt ggctggcgcc gtgtggctca ccgtcatgtc caacaccctg 300
ctcagcgcct ggattctgac cgccggattc ctgatctttc tgatcggatt cgctctcttt 360
ggcgtcatca ggtgttgcag gtactgttgc tactactgcc tgaccctcga gagcgaggaa 420
agacccccca ccccctacag gaatacagtg attagggaca gaaggaggaa tcctgcctcc 480
aggagagacc aggccaaatg gagactccaa acactcgccg ctggatggcc catgggctac 540
caggcctata gctcctggat gtacagctac accgaccatc agacaacacc caccttcgtg 600
catctgcagg ctacactggg ctgcaccgga ggcagaaggt gtcacgtgtt tctgggaatc 660
gtgctgttca tctttggatg cctgctcgtg ctgggcatct ggatttatct cctggagatg 720
ctctggagac tcggcgctac aatttggcag ctgctcgcct tttttctggc cttctttctg 780
gacctgatcc tcctgatcat cgccctgtac ctccaacaga actggtggac cctcctggtg 840
gatctgctgt ggctcctcct cttcctggcc atcctgatct ggatgtacta ccatggccag 900
agaggaaggg tcgcttgcgc tcctgtccct gctcctgctg gccccatcgt gaggccttgg 960
gagccttccc tcacacaggc cgccggccag gcctttgctc ccgtgaggcc ccagcacatg 1020
cctgtggaac ccgtgcccgt ccccacagtg gctctggaaa ggcctgtgta ccccaagccc 1080
gtgagacctg tcctctggct cagcagccct ggaggactcg gaacactcgg agccgctctc 1140
ctgacactgg ccgctgctct ggctctgctg gctagcctga tcctgggaac cctcaacctc 1200
accaccatgt ttctcctcat gctcctgtgg accctcgtgg tgctgctcat ctgttccagc 1260
tgctccagct gccccctgag caagatcctg ctggccaggc tgttcctgta cgccctcgcc 1320
ctcctgctgc tggctagcgc cctgatcgct ggcggaagca tcctccagac caatttcaag 1380
agcctctcct ccaccgagtt catccccaac ctgttctgta tgttactgct gatccatagc 1440
gacgagcacc atcatgacga ctccctgccc catcctcagc aggccacaga cgactccggc 1500
cacgagagcg acagcaatag caatgagggc aggcaccatc tgctcgtgtc cggagctcaa 1560
gtccccgagc ctcccaccat ccatctcgcc gcccagggaa tggcttaccc cctccacgag 1620
cagcacggca tggccccttg tcccgtcgct caagcccccc ctacacctct gccctttttc 1680
gccatttgtc tgacctggag aatcgaggac ccccccttca acagcctgct gttcgccctg 1740
ctcgccgccg ctggcggcct ccagggcatt tacgtcctcg tgatgctggt gctgctgatc 1800
ctcgcttaca ggagaagatg gaggagactg acagtgtgcg gcggcatcat gtttctcgcc 1860
tgcgtcctgg tcctgatcgt ggacgccgtc ctgcaactca gccccctcct gggagctgtg 1920
acagtggtct ccatgaccct gctgctgctg gccttcaacg gaccccacga tcctctgccc 1980
caagatcctg acaataccga cgataacggc ccccaagacc ccgataacac cgacgacaat 2040
ggccctcacg accctctgcc ccatagccct tccgatagcg ctggcaacga tggcggccct 2100
cctcagctga cagaggaggt ggaaaataag ggcggcgatc agggaccccc cctgatgaca 2160
gatggcggag gaggacacag ccatgatagc ggacatggcg gaggcgatcc ccatctgcct 2220
accctcctcc tgggcagctc cggttctgga ggcgacgatg atgaccctca cggccctgtg 2280
cagctctcct actacgacgg caaaaggacc gaacaaggaa aagaggtcct ggagaaggcc 2340
aggggcagca catacggaac ccccaggcct cccatgtccg attggaccgg aggagccctg 2400
ctggtcctct acagcttcgc cctgatgctg atcattatca tcctgatcat ctttatcttc 2460
agaagggacc tgctgtgccc tctcggcgcc ctgtgcatcc tgctgctcat gatcacactc 2520
ctcctgatcg ccctctggaa cctgcacgga caagccctga tgtccgatga gggacctgga 2580
acaggacccg gaaacggact gggcgagaag ggagatacaa gcggccccga aggcagcggc 2640
ggaagcggac cccaaagaag gggcggcgac aaccacggaa gaggaagagg caggggcaga 2700
ggcagaggag gaggaagacc tggagcccct ggcggttctg gaagcggacc caggcacagg 2760
gacggagtga ggaggcctca aaaaagaccc agctgcatcg gctgcaaggg aacccactgg 2820
attgatgata acccctccac agagaccgct caggcctgga acgccggctt cctgagggga 2880
agagcctatg gcatcgatct gctgaggacc gagggcgaac acgtggaggg agccaccgga 2940
gagacaaggg aggaaagcga agacacagaa agcgatggcg acgacgaaga cctgccctgc 3000
attgtgtcca ggggcggacc caaggtgaag aggcccccta tctttatcag aaggctccat 3060
agactgctcc tgatgagggc catgaaccct gtgtgcctgc ccgtgatcgt ggccccctac 3120
ctcttttggc tggccgccat tgccgctagc tgcttcaccg cctccgtgtc cacagtggtg 3180
acagccaccg gcctcgccct gagcctgctg ctcctcgctg ccgtggcctc cagctacgcc 3240
gctgctcaaa gaaagctcct gacccctgtc accgtcctga cagccgtcgt gaccaccttt 3300
tccgctggca ccttcaagct gcctaggtgc acacctggcg acaggcagtg gctctacgtg 3360
cagagctccg tgggcaatat tgtgcagagc tgcaatccca ggtacagcat ttttttcgac 3420
tacatggcca tccataggtc cctcaccaag atctgggag 3459
<210> 26
<211> 1270
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 26
Met Arg Pro Ala Pro Trp Thr Pro Asn Pro Pro Arg Ser Pro Ser Gln
1 5 10 15
Met Ser Val Arg Asp Arg Leu Ala Arg Leu Arg Ala Glu Ala Gln Val
20 25 30
Lys Gln Ala Ser Val Glu Val Gln Pro Pro Gln Leu Thr Gln Val Ser
35 40 45
Pro Gln Gln Pro Val Ala Gly Ile Leu Phe Ile Leu Ala Ile Leu Thr
50 55 60
Glu Trp Gly Ser Gly Asn Arg Thr Tyr Gly Pro Val Phe Met Cys Leu
65 70 75 80
Gly Gly Leu Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Met
85 90 95
Ser Asn Thr Leu Leu Ser Ala Trp Ile Leu Thr Ala Gly Phe Leu Ile
100 105 110
Phe Leu Ile Gly Phe Ala Leu Phe Gly Val Ile Arg Cys Cys Arg Tyr
115 120 125
Cys Cys Tyr Tyr Cys Leu Thr Leu Glu Ser Glu Glu Arg Pro Pro Thr
130 135 140
Pro Tyr Arg Asn Thr Val Arg Lys Pro Gln Gln Pro Glu Ser Leu Glu
145 150 155 160
Glu Cys Asp Ser Glu Leu Glu Ile Lys Arg Tyr Lys Asn Arg Val Ala
165 170 175
Ser Arg Lys Cys Arg Ala Lys Phe Lys Gln Leu Leu Gln His Tyr Arg
180 185 190
Glu Val Ala Ala Ala Lys Ser Ser Glu Ile Arg Asp Arg Arg Arg Asn
195 200 205
Pro Ala Ser Arg Arg Asp Gln Ala Lys Trp Arg Leu Gln Thr Leu Ala
210 215 220
Ala Gly Trp Pro Met Gly Tyr Gln Ala Tyr Ser Ser Trp Met Tyr Ser
225 230 235 240
Tyr Thr Asp His Gln Thr Thr Pro Thr Phe Val His Leu Gln Ala Thr
245 250 255
Leu Gly Cys Thr Gly Gly Arg Arg Cys His Val Phe Leu Gly Ile Val
260 265 270
Leu Phe Ile Phe Gly Cys Leu Leu Val Leu Gly Ile Trp Ile Tyr Leu
275 280 285
Leu Glu Met Leu Trp Arg Leu Gly Ala Thr Ile Trp Gln Leu Leu Ala
290 295 300
Phe Phe Leu Ala Phe Phe Leu Asp Leu Ile Leu Leu Ile Ile Ala Leu
305 310 315 320
Tyr Leu Gln Gln Asn Trp Trp Thr Leu Leu Val Asp Leu Leu Trp Leu
325 330 335
Leu Leu Phe Leu Ala Ile Leu Ile Trp Met Tyr Tyr His Gly Gln Arg
340 345 350
Gly Arg Val Ala Cys Ala Pro Val Pro Ala Pro Ala Gly Pro Ile Val
355 360 365
Arg Pro Trp Glu Pro Ser Leu Thr Gln Ala Ala Gly Gln Ala Phe Ala
370 375 380
Pro Val Arg Pro Gln His Met Pro Val Glu Pro Val Pro Val Pro Thr
385 390 395 400
Val Ala Leu Glu Arg Pro Val Tyr Pro Lys Pro Val Arg Pro Val Leu
405 410 415
Trp Leu Ser Ser Pro Gly Gly Leu Gly Thr Leu Gly Ala Ala Leu Leu
420 425 430
Thr Leu Ala Ala Ala Leu Ala Leu Leu Ala Ser Leu Ile Leu Gly Thr
435 440 445
Leu Asn Leu Thr Thr Met Phe Leu Leu Met Leu Leu Trp Thr Leu Val
450 455 460
Val Leu Leu Ile Cys Ser Ser Cys Ser Ser Cys Pro Leu Ser Lys Ile
465 470 475 480
Leu Leu Ala Arg Leu Phe Leu Tyr Ala Leu Ala Leu Leu Leu Leu Ala
485 490 495
Ser Ala Leu Ile Ala Gly Gly Ser Ile Leu Gln Thr Asn Phe Lys Ser
500 505 510
Leu Ser Ser Thr Glu Phe Ile Pro Asn Leu Phe Cys Met Leu Leu Leu
515 520 525
Ile His Ser Asp Glu His His His Asp Asp Ser Leu Pro His Pro Gln
530 535 540
Gln Ala Thr Asp Asp Ser Gly His Glu Ser Asp Ser Asn Ser Asn Glu
545 550 555 560
Gly Arg His His Leu Leu Val Ser Gly Ala Gln Val Pro Glu Pro Pro
565 570 575
Thr Ile His Leu Ala Ala Gln Gly Met Ala Tyr Pro Leu His Glu Gln
580 585 590
His Gly Met Ala Pro Cys Pro Val Ala Gln Ala Pro Pro Thr Pro Leu
595 600 605
Pro Phe Phe Ala Ile Cys Leu Thr Trp Arg Ile Glu Asp Pro Pro Phe
610 615 620
Asn Ser Leu Leu Phe Ala Leu Leu Ala Ala Ala Gly Gly Leu Gln Gly
625 630 635 640
Ile Tyr Val Leu Val Met Leu Val Leu Leu Ile Leu Ala Tyr Arg Arg
645 650 655
Arg Trp Arg Arg Leu Thr Val Cys Gly Gly Ile Met Phe Leu Ala Cys
660 665 670
Val Leu Val Leu Ile Val Asp Ala Val Leu Gln Leu Ser Pro Leu Leu
675 680 685
Gly Ala Val Thr Val Val Ser Met Thr Leu Leu Leu Leu Ala Phe Asn
690 695 700
Gly Pro His Asp Pro Leu Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn
705 710 715 720
Gly Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro His Asp Pro
725 730 735
Leu Pro His Ser Pro Ser Asp Ser Ala Gly Asn Asp Gly Gly Pro Pro
740 745 750
Gln Leu Thr Glu Glu Val Glu Asn Lys Gly Gly Asp Gln Gly Pro Pro
755 760 765
Leu Met Thr Asp Gly Gly Gly Gly His Ser His Asp Ser Gly His Gly
770 775 780
Gly Gly Asp Pro His Leu Pro Thr Leu Leu Leu Gly Ser Ser Gly Ser
785 790 795 800
Gly Gly Asp Asp Asp Asp Pro His Gly Pro Val Gln Leu Ser Tyr Tyr
805 810 815
Asp Gly Lys Arg Thr Glu Gln Gly Lys Glu Val Leu Glu Lys Ala Arg
820 825 830
Gly Ser Thr Tyr Gly Thr Pro Arg Pro Pro Met Ser Asp Trp Thr Gly
835 840 845
Gly Ala Leu Leu Val Leu Tyr Ser Phe Ala Leu Met Leu Ile Ile Ile
850 855 860
Ile Leu Ile Ile Phe Ile Phe Arg Arg Asp Leu Leu Cys Pro Leu Gly
865 870 875 880
Ala Leu Cys Ile Leu Leu Leu Met Ile Thr Leu Leu Leu Ile Ala Leu
885 890 895
Trp Asn Leu His Gly Gln Ala Leu Met Ser Asp Glu Gly Pro Gly Thr
900 905 910
Gly Pro Gly Asn Gly Leu Gly Glu Lys Gly Asp Thr Ser Gly Pro Glu
915 920 925
Gly Ser Gly Gly Ser Gly Pro Gln Arg Arg Gly Gly Asp Asn His Gly
930 935 940
Arg Gly Arg Gly Arg Gly Arg Gly Arg Gly Gly Gly Arg Pro Gly Ala
945 950 955 960
Pro Gly Gly Ser Gly Ser Gly Pro Arg His Arg Asp Gly Val Arg Arg
965 970 975
Pro Gln Lys Arg Pro Ser Cys Ile Gly Cys Lys Gly Thr His Trp Ile
980 985 990
Asp Asp Asn Pro Ser Thr Glu Thr Ala Gln Ala Trp Asn Ala Gly Phe
995 1000 1005
Leu Arg Gly Arg Ala Tyr Gly Ile Asp Leu Leu Arg Thr Glu Gly
1010 1015 1020
Glu His Val Glu Gly Ala Thr Gly Glu Thr Arg Glu Glu Ser Glu
1025 1030 1035
Asp Thr Glu Ser Asp Gly Asp Asp Glu Asp Leu Pro Cys Ile Val
1040 1045 1050
Ser Arg Gly Gly Pro Lys Val Lys Arg Pro Pro Ile Phe Ile Arg
1055 1060 1065
Arg Leu His Arg Leu Leu Leu Met Arg Ala Met Asn Pro Val Cys
1070 1075 1080
Leu Pro Val Ile Val Ala Pro Tyr Leu Phe Trp Leu Ala Ala Ile
1085 1090 1095
Ala Ala Ser Cys Phe Thr Ala Ser Val Ser Thr Val Val Thr Ala
1100 1105 1110
Thr Gly Leu Ala Leu Ser Leu Leu Leu Leu Ala Ala Val Ala Ser
1115 1120 1125
Ser Tyr Ala Ala Ala Gln Arg Lys Leu Leu Thr Pro Val Thr Val
1130 1135 1140
Leu Thr Ala Val Val Thr Thr Phe Ser Ala Gly Thr Phe Lys Leu
1145 1150 1155
Pro Arg Cys Thr Pro Gly Asp Arg Gln Trp Leu Tyr Val Gln Ser
1160 1165 1170
Ser Val Gly Asn Ile Val Gln Ser Cys Asn Pro Arg Tyr Ser Ile
1175 1180 1185
Phe Phe Asp Tyr Met Ala Ile His Arg Ser Leu Thr Lys Ile Trp
1190 1195 1200
Glu Asp Leu Gly Gly Pro Ser Gln Ala Pro Leu Pro Cys Val Leu
1205 1210 1215
Trp Pro Val Leu Pro Glu Pro Leu Pro Gln Gly Gln Leu Thr Ala
1220 1225 1230
Tyr His Val Ser Thr Ala Pro Thr Gly Ser Trp Phe Ser Ala Pro
1235 1240 1245
Gln Pro Ala Pro Glu Asn Ala Tyr Gln Ala Tyr Ala Ala Pro Gln
1250 1255 1260
Leu Phe Pro Val Ser Asp Ile
1265 1270
<210> 27
<211> 3810
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 27
atgagacctg ctccctggac acctaatcct cccaggtccc ccagccagat gagcgtgaga 60
gacagactgg ctaggctgag agccgaggct caggtcaagc aggccagcgt cgaggtgcaa 120
ccccctcagc tcacccaggt gtccccccag cagcctgtgg ccggcattct gttcattctg 180
gccattctga ccgagtgggg aagcggcaac agaacctacg gccctgtctt catgtgcctc 240
ggaggactgc tgacaatggt ggctggcgcc gtgtggctca ccgtcatgtc caacaccctg 300
ctcagcgcct ggattctgac cgccggattc ctgatctttc tgatcggatt cgctctcttt 360
ggcgtcatca ggtgttgcag gtactgttgc tactactgcc tgaccctcga gagcgaggaa 420
agacccccca ccccctacag gaatacagtg aggaaacctc agcagcccga gagcctcgag 480
gagtgcgata gcgagctgga gattaaaagg tataagaata gggtggcctc caggaagtgt 540
agggctaaat tcaaacagct cctgcaacac tatagggaag tggccgccgc caagtccagc 600
gagattaggg acagaaggag gaatcctgcc tccaggagag accaggccaa atggagactc 660
caaacactcg ccgctggatg gcccatgggc taccaggcct atagctcctg gatgtacagc 720
tacaccgacc atcagacaac acccaccttc gtgcatctgc aggctacact gggctgcacc 780
ggaggcagaa ggtgtcacgt gtttctggga atcgtgctgt tcatctttgg atgcctgctc 840
gtgctgggca tctggattta tctcctggag atgctctgga gactcggcgc tacaatttgg 900
cagctgctcg ccttttttct ggccttcttt ctggacctga tcctcctgat catcgccctg 960
tacctccaac agaactggtg gaccctcctg gtggatctgc tgtggctcct cctcttcctg 1020
gccatcctga tctggatgta ctaccatggc cagagaggaa gggtcgcttg cgctcctgtc 1080
cctgctcctg ctggccccat cgtgaggcct tgggagcctt ccctcacaca ggccgccggc 1140
caggcctttg ctcccgtgag gccccagcac atgcctgtgg aacccgtgcc cgtccccaca 1200
gtggctctgg aaaggcctgt gtaccccaag cccgtgagac ctgtcctctg gctcagcagc 1260
cctggaggac tcggaacact cggagccgct ctcctgacac tggccgctgc tctggctctg 1320
ctggctagcc tgatcctggg aaccctcaac ctcaccacca tgtttctcct catgctcctg 1380
tggaccctcg tggtgctgct catctgttcc agctgctcca gctgccccct gagcaagatc 1440
ctgctggcca ggctgttcct gtacgccctc gccctcctgc tgctggctag cgccctgatc 1500
gctggcggaa gcatcctcca gaccaatttc aagagcctct cctccaccga gttcatcccc 1560
aacctgttct gtatgttact gctgatccat agcgacgagc accatcatga cgactccctg 1620
ccccatcctc agcaggccac agacgactcc ggccacgaga gcgacagcaa tagcaatgag 1680
ggcaggcacc atctgctcgt gtccggagct caagtccccg agcctcccac catccatctc 1740
gccgcccagg gaatggctta ccccctccac gagcagcacg gcatggcccc ttgtcccgtc 1800
gctcaagccc cccctacacc tctgcccttt ttcgccattt gtctgacctg gagaatcgag 1860
gaccccccct tcaacagcct gctgttcgcc ctgctcgccg ccgctggcgg cctccagggc 1920
atttacgtcc tcgtgatgct ggtgctgctg atcctcgctt acaggagaag atggaggaga 1980
ctgacagtgt gcggcggcat catgtttctc gcctgcgtcc tggtcctgat cgtggacgcc 2040
gtcctgcaac tcagccccct cctgggagct gtgacagtgg tctccatgac cctgctgctg 2100
ctggccttca acggacccca cgatcctctg ccccaagatc ctgacaatac cgacgataac 2160
ggcccccaag accccgataa caccgacgac aatggccctc acgaccctct gccccatagc 2220
ccttccgata gcgctggcaa cgatggcggc cctcctcagc tgacagagga ggtggaaaat 2280
aagggcggcg atcagggacc ccccctgatg acagatggcg gaggaggaca cagccatgat 2340
agcggacatg gcggaggcga tccccatctg cctaccctcc tcctgggcag ctccggttct 2400
ggaggcgacg atgatgaccc tcacggccct gtgcagctct cctactacga cggcaaaagg 2460
accgaacaag gaaaagaggt cctggagaag gccaggggca gcacatacgg aacccccagg 2520
cctcccatgt ccgattggac cggaggagcc ctgctggtcc tctacagctt cgccctgatg 2580
ctgatcatta tcatcctgat catctttatc ttcagaaggg acctgctgtg ccctctcggc 2640
gccctgtgca tcctgctgct catgatcaca ctcctcctga tcgccctctg gaacctgcac 2700
ggacaagccc tgatgtccga tgagggacct ggaacaggac ccggaaacgg actgggcgag 2760
aagggagata caagcggccc cgaaggcagc ggcggaagcg gaccccaaag aaggggcggc 2820
gacaaccacg gaagaggaag aggcaggggc agaggcagag gaggaggaag acctggagcc 2880
cctggcggtt ctggaagcgg acccaggcac agggacggag tgaggaggcc tcaaaaaaga 2940
cccagctgca tcggctgcaa gggaacccac tggattgatg ataacccctc cacagagacc 3000
gctcaggcct ggaacgccgg cttcctgagg ggaagagcct atggcatcga tctgctgagg 3060
accgagggcg aacacgtgga gggagccacc ggagagacaa gggaggaaag cgaagacaca 3120
gaaagcgatg gcgacgacga agacctgccc tgcattgtgt ccaggggcgg acccaaggtg 3180
aagaggcccc ctatctttat cagaaggctc catagactgc tcctgatgag ggccatgaac 3240
cctgtgtgcc tgcccgtgat cgtggccccc tacctctttt ggctggccgc cattgccgct 3300
agctgcttca ccgcctccgt gtccacagtg gtgacagcca ccggcctcgc cctgagcctg 3360
ctgctcctcg ctgccgtggc ctccagctac gccgctgctc aaagaaagct cctgacccct 3420
gtcaccgtcc tgacagccgt cgtgaccacc ttttccgctg gcaccttcaa gctgcctagg 3480
tgcacacctg gcgacaggca gtggctctac gtgcagagct ccgtgggcaa tattgtgcag 3540
agctgcaatc ccaggtacag catttttttc gactacatgg ccatccatag gtccctcacc 3600
aagatctggg aggatctggg aggcccttcc caggctcctc tgccctgcgt gctgtggcct 3660
gtgctgcctg agcctctgcc ccaaggccag ctgacagcct atcacgtgtc caccgctcct 3720
acaggttctt ggttcagcgc tccccagccc gctcccgaaa acgcttacca ggcttacgcc 3780
gccccccagc tgttccccgt ctccgacatc 3810
<210> 28
<211> 355
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 28
Met Ala Pro Arg Arg Arg Leu Ser Gly Pro Pro Trp Leu Thr Val Leu
1 5 10 15
Leu Leu Leu Ser Thr Leu Ser Val Ala Ala Leu Leu Ile Leu Phe Leu
20 25 30
Ile Phe Ser Ala Gly Ala Thr Ile Ser Thr Glu Ala Ser Leu Leu Val
35 40 45
Leu Leu Leu Leu Phe Val Thr Leu Leu Leu Pro Leu Leu Ser Ser Asn
50 55 60
Gly Leu Gln Leu Pro Ala Ala Leu Ile Leu Ile Gln Cys Phe Leu Leu
65 70 75 80
Ala Ala Asp Tyr Leu Ala Tyr Leu Ile Leu Pro Thr Ile Ser Glu Asp
85 90 95
Phe Leu Ile Leu Ile Ala Ile Leu Val Ile Val Ile Leu Val Gly Thr
100 105 110
Ile Thr Thr Leu Val Gly Ala Ile Gly Gly Ile Arg Ala Arg Arg Ser
115 120 125
Phe Leu Phe Ile Cys Ile Phe Phe Leu Phe Leu Ser Leu Phe Leu Thr
130 135 140
Ile Leu Ala Leu Leu Leu Gly Phe Ser Trp Leu Leu Leu Val Ala Ile
145 150 155 160
Leu Phe Trp Val Leu Trp Leu Val Ile Leu Ile Leu Leu Leu Leu Val
165 170 175
Tyr Pro Ile Pro His His Pro Leu Pro Thr Ser Leu Arg Phe Arg Met
180 185 190
Lys Gln Arg Val Ser Ser Asp Pro Thr Gly Ser Asp Arg Ser Pro Gln
195 200 205
Gly Ser His Asn Ser Leu Asn Ser Pro Asp Glu Glu Asp Pro Lys Asp
210 215 220
Asp Thr Lys Gln Pro Leu Cys Asn Met Thr Gln Gly Gly Pro Pro Val
225 230 235 240
Asn Gly Gln Leu Leu Gly Gln His Ala Gln Cys Pro Pro His Tyr Pro
245 250 255
Cys Cys His Ile Gln His Pro Asp Gly Glu Asp Ser Asp Gly Asp Asp
260 265 270
Gly Lys Ser Trp Gly Asp Ala Gly Glu Glu Asp Asn Gly Pro Asn Asp
275 280 285
Pro Asn Thr Asn Asn Gly Asn Glu Gly Gly Glu Gly Asp Asp Tyr Lys
290 295 300
Ser Trp Arg Lys Pro Glu Glu Glu Asp Asn Gly Pro Asn Asp Pro Asn
305 310 315 320
Thr Asn Asn Arg Ile Glu Asp Gly Asp Gly Asp Asp Gly Lys Ser Trp
325 330 335
Arg Asn Pro Glu Glu Glu Asp Asn Arg Lys Gln Asp Arg Leu Gly Thr
340 345 350
Lys Pro Phe
355
<210> 29
<211> 93
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 29
Met Ala Pro Arg Arg Arg Leu Ser Gly Pro Pro Trp Leu Thr Val Leu
1 5 10 15
Leu Leu Leu Ser Thr Leu Ser Val Ala Ala Leu Leu Ile Leu Phe Leu
20 25 30
Ile Phe Ser Ala Gly Ala Thr Ile Ser Thr Glu Ala Ser Leu Leu Val
35 40 45
Leu Leu Leu Leu Phe Val Thr Leu Leu Leu Pro Leu Leu Ser Ser Asn
50 55 60
Gly Leu Gln Leu Pro Ala Ala Leu Ile Leu Ile Gln Cys Phe Leu Leu
65 70 75 80
Ala Ala Asp Tyr Leu Ala Tyr Leu Ile Leu Pro Thr Ile
85 90
<210> 30
<211> 198
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 30
Ser Glu Asp Phe Leu Ile Leu Ile Ala Ile Leu Val Ile Val Ile Leu
1 5 10 15
Val Gly Thr Ile Thr Thr Leu Val Gly Ala Ile Gly Gly Ile Arg Ala
20 25 30
Arg Arg Ser Phe Leu Phe Ile Cys Ile Phe Phe Leu Phe Leu Ser Leu
35 40 45
Phe Leu Thr Ile Leu Ala Leu Leu Leu Gly Phe Ser Trp Leu Leu Leu
50 55 60
Val Ala Ile Leu Phe Trp Val Leu Trp Leu Val Ile Leu Ile Leu Leu
65 70 75 80
Leu Leu Val Tyr Pro Ile Pro His His Pro Leu Pro Thr Ser Leu Arg
85 90 95
Phe Arg Met Lys Gln Arg Val Ser Ser Asp Pro Thr Gly Ser Asp Arg
100 105 110
Ser Pro Gln Gly Ser His Asn Ser Leu Asn Ser Pro Asp Glu Glu Asp
115 120 125
Pro Lys Asp Asp Thr Lys Gln Pro Leu Cys Asn Met Thr Gln Gly Gly
130 135 140
Pro Pro Val Asn Gly Gln Leu Leu Gly Gln His Ala Gln Cys Pro Pro
145 150 155 160
His Tyr Pro Cys Cys His Ile Gln His Pro Asp Gly Glu Asp Ser Asp
165 170 175
Gly Asp Asp Gly Lys Ser Trp Gly Asp Ala Gly Glu Glu Asp Asn Gly
180 185 190
Pro Asn Asp Pro Asn Thr
195
<210> 31
<211> 64
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 31
Asn Asn Gly Asn Glu Gly Gly Glu Gly Asp Asp Tyr Lys Ser Trp Arg
1 5 10 15
Lys Pro Glu Glu Glu Asp Asn Gly Pro Asn Asp Pro Asn Thr Asn Asn
20 25 30
Arg Ile Glu Asp Gly Asp Gly Asp Asp Gly Lys Ser Trp Arg Asn Pro
35 40 45
Glu Glu Glu Asp Asn Arg Lys Gln Asp Arg Leu Gly Thr Lys Pro Phe
50 55 60
<210> 32
<211> 413
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 32
Met Ala Gly His Trp Tyr Glu Ser Val Ile Pro Gly Leu Phe Leu Cys
1 5 10 15
Pro Leu Ile Leu Pro Ser Leu Phe Trp Ile Cys Ser Leu Leu Thr Phe
20 25 30
Leu Val Gly His Gly Ala Asn Ile Val Ser Ala Val Leu Phe Leu Val
35 40 45
Leu Ala Trp Cys Leu Leu Ile Ala Asn Trp Asn Val Thr Arg Glu Asp
50 55 60
Phe Val Ser Gly Arg Arg Ser Ser Met Ser Ser Leu Ser Val Ala Ala
65 70 75 80
Ser Thr Ala Thr Ala Met Phe Ala Ser Phe Leu Thr Leu Ser Phe Asp
85 90 95
Gly Leu Gly Leu Leu Leu Phe Gly Thr Ala Leu Val Ile Gln Thr Ile
100 105 110
Tyr Val Leu Tyr Leu Val Val Met Glu Ile Thr Val Trp Ile Met Met
115 120 125
Phe Arg Tyr Leu His Phe Trp Ile Thr Leu Leu Phe Leu Leu Ser Pro
130 135 140
Ile Ile Leu Ser Val Ala Cys Leu Ile Ile Gln Ser Ser Ala Leu Leu
145 150 155 160
Ile Glu Ala Val Val Val Thr Thr Ile Thr Val Leu Ala Ile Phe Leu
165 170 175
Trp Leu Pro Pro Gln Gly Ala Glu Ala Asp Leu Gly Thr Ala Leu Leu
180 185 190
Ile Leu Asn Thr Ala Leu Cys Leu Val Val Leu Ile Leu Thr Ala Ile
195 200 205
Pro Thr Asp Ala Gln Ile Leu Thr Val Phe Cys Leu Phe Cys Gln Trp
210 215 220
Thr Leu Phe Ile Cys Leu Gly Ile Arg Met Ile Cys Asn Trp Arg Gly
225 230 235 240
Lys Leu Thr Arg Ile Ile Cys Leu Lys Phe Cys Leu Tyr Gly Leu Ile
245 250 255
Ser Ala Ser Leu Ser Phe Gly Trp Tyr Ala Phe Leu Lys Glu Val Thr
260 265 270
Leu Pro Thr Thr Ala Thr Val Asp Pro Arg Gln Leu Pro Leu Phe Leu
275 280 285
Phe Ile Leu Ser Ser Val Leu Val Ile Leu Ala Ile Met Met Glu Phe
290 295 300
Gln Thr Ser Ser Ser Leu Phe Ala Ala Leu Phe Val Ile Ile Ala Gly
305 310 315 320
Met Leu Cys Val Thr Val Gly Val Ile Phe Leu Leu Ala Gly Val Lys
325 330 335
Pro Leu Leu Ser Gly Met Ile Cys Ala Ser Gly Ile Thr Met Leu Val
340 345 350
Leu Gly Val Val Leu Leu Val Val Cys Thr Arg Ala Ser Thr Arg Glu
355 360 365
Ser Ile Tyr Glu Asp Leu Arg Tyr Pro Thr Arg Asp Ala Asn Gly Glu
370 375 380
Tyr Glu Asn Val Gly Tyr Pro Pro Arg Asp Gly Asp Ala Pro His Arg
385 390 395 400
Leu Gly Glu Pro Val Tyr Asp Asp Val Glu Gln Ala Thr
405 410
<210> 33
<211> 210
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 33
Met Ala Gly His Trp Tyr Glu Ser Val Ile Pro Gly Leu Phe Leu Cys
1 5 10 15
Pro Leu Ile Leu Pro Ser Leu Phe Trp Ile Cys Ser Leu Leu Thr Phe
20 25 30
Leu Val Gly His Gly Ala Asn Ile Val Ser Ala Val Leu Phe Leu Val
35 40 45
Leu Ala Trp Cys Leu Leu Ile Ala Asn Trp Asn Val Thr Arg Glu Asp
50 55 60
Phe Val Ser Gly Arg Arg Ser Ser Met Ser Ser Leu Ser Val Ala Ala
65 70 75 80
Ser Thr Ala Thr Ala Met Phe Ala Ser Phe Leu Thr Leu Ser Phe Asp
85 90 95
Gly Leu Gly Leu Leu Leu Phe Gly Thr Ala Leu Val Ile Gln Thr Ile
100 105 110
Tyr Val Leu Tyr Leu Val Val Met Glu Ile Thr Val Trp Ile Met Met
115 120 125
Phe Arg Tyr Leu His Phe Trp Ile Thr Leu Leu Phe Leu Leu Ser Pro
130 135 140
Ile Ile Leu Ser Val Ala Cys Leu Ile Ile Gln Ser Ser Ala Leu Leu
145 150 155 160
Ile Glu Ala Val Val Val Thr Thr Ile Thr Val Leu Ala Ile Phe Leu
165 170 175
Trp Leu Pro Pro Gln Gly Ala Glu Ala Asp Leu Gly Thr Ala Leu Leu
180 185 190
Ile Leu Asn Thr Ala Leu Cys Leu Val Val Leu Ile Leu Thr Ala Ile
195 200 205
Pro Thr
210
<210> 34
<211> 153
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 34
Asp Ala Gln Ile Leu Thr Val Phe Cys Leu Phe Cys Gln Trp Thr Leu
1 5 10 15
Phe Ile Cys Leu Gly Ile Arg Met Ile Cys Asn Trp Arg Gly Lys Leu
20 25 30
Thr Arg Ile Ile Cys Leu Lys Phe Cys Leu Tyr Gly Leu Ile Ser Ala
35 40 45
Ser Leu Ser Phe Gly Trp Tyr Ala Phe Leu Lys Glu Val Thr Leu Pro
50 55 60
Thr Thr Ala Thr Val Asp Pro Arg Gln Leu Pro Leu Phe Leu Phe Ile
65 70 75 80
Leu Ser Ser Val Leu Val Ile Leu Ala Ile Met Met Glu Phe Gln Thr
85 90 95
Ser Ser Ser Leu Phe Ala Ala Leu Phe Val Ile Ile Ala Gly Met Leu
100 105 110
Cys Val Thr Val Gly Val Ile Phe Leu Leu Ala Gly Val Lys Pro Leu
115 120 125
Leu Ser Gly Met Ile Cys Ala Ser Gly Ile Thr Met Leu Val Leu Gly
130 135 140
Val Val Leu Leu Val Val Cys Thr Arg
145 150
<210> 35
<211> 50
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 35
Ala Ser Thr Arg Glu Ser Ile Tyr Glu Asp Leu Arg Tyr Pro Thr Arg
1 5 10 15
Asp Ala Asn Gly Glu Tyr Glu Asn Val Gly Tyr Pro Pro Arg Asp Gly
20 25 30
Asp Ala Pro His Arg Leu Gly Glu Pro Val Tyr Asp Asp Val Glu Gln
35 40 45
Ala Thr
50
<210> 36
<211> 327
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 36
Met Pro Arg Gly Arg Ser Thr Gly Arg Lys Gly Arg Asp Thr Glu Lys
1 5 10 15
Glu Arg Ser Arg Ser Pro Leu Arg Ala Pro Gly Gly Ser Asp Gly Pro
20 25 30
Ser Thr Arg Ala Gly Cys Gly Ala Gly Pro Cys Gln Leu Ser Ser Pro
35 40 45
Ile Ala Gly Gly Ser Arg Gly Gly Arg Gly Gly Arg Gly Gly Arg Gly
50 55 60
Gly Ser Arg Gly Arg Gly Ala Ser Arg Gly Arg Gly Gly Arg Gly Gly
65 70 75 80
Arg Gly Gly Arg Gly Gly Arg Gly Gly Arg Gly Gly Arg Gly Gly Arg
85 90 95
Gly Ser Pro Gly Asp Asp Ser Pro Ser Pro Cys His His Arg Asp Glu
100 105 110
Pro Pro Ser Arg Ser Pro Ser Pro Gln Pro Thr Val Ser Glu Gln Ser
115 120 125
Gln Gln Ser Pro Arg Gln Gln Ser Pro Gln Gly Thr Ser Gln Gly Ser
130 135 140
Thr Arg Pro Gln Val Pro Gly Gly Ala Thr Thr Arg Lys Arg Gly Gly
145 150 155 160
Val Arg Gly Gln Pro Ala Lys Cys His Gly Lys Tyr Thr Thr Thr Ala
165 170 175
Glu Gly Leu Thr Ala Leu Leu Asn Arg Arg His Ser Pro Arg Thr Ser
180 185 190
Asn Glu Gly Arg Trp Met Asn Gly Val Met Ala Val Asn Leu Ser Lys
195 200 205
Trp Pro Leu Tyr Ser Leu Arg Arg Ala Leu Ala Leu Ala Ala Asn Glu
210 215 220
Val Arg Ile Ser Pro Leu Phe Arg Leu Pro Tyr Gly Ser Ala Phe Gly
225 230 235 240
Pro Gly Pro Gln Pro Gly Pro Ile Leu Glu Ser Ser Thr Trp Gly Phe
245 250 255
Leu Val Phe Thr Gln Thr Ser Leu Phe Ala Asp Asp Ile Ala Asp Ala
260 265 270
Ile Arg Asp Tyr Cys Thr Thr His Pro Gly Pro Thr Arg Asn Thr Gln
275 280 285
Val Val Leu Met Asn Phe Glu Gly Ser Gly Val Pro Leu Pro Met Phe
290 295 300
Phe Pro Pro Gly Glu Glu Thr Glu Glu Gln Arg Glu Gly Asp Arg Ala
305 310 315 320
Ser Asp Ser Asp Glu Ser Glu
325
<210> 37
<211> 51
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 37
Met Pro Arg Gly Arg Ser Thr Gly Arg Lys Gly Arg Asp Thr Glu Lys
1 5 10 15
Glu Arg Ser Arg Ser Pro Leu Arg Ala Pro Gly Gly Ser Asp Gly Pro
20 25 30
Ser Thr Arg Ala Gly Cys Gly Ala Gly Pro Cys Gln Leu Ser Ser Pro
35 40 45
Ile Ala Gly
50
<210> 38
<211> 119
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 38
Ser Pro Ser Pro Cys His His Arg Asp Glu Pro Pro Ser Arg Ser Pro
1 5 10 15
Ser Pro Gln Pro Thr Val Ser Glu Gln Ser Gln Gln Ser Pro Arg Gln
20 25 30
Gln Ser Pro Gln Gly Thr Ser Gln Gly Ser Thr Arg Pro Gln Val Pro
35 40 45
Gly Gly Ala Thr Thr Arg Lys Arg Gly Gly Val Arg Gly Gln Pro Ala
50 55 60
Lys Cys His Gly Lys Tyr Thr Thr Thr Ala Glu Gly Leu Thr Ala Leu
65 70 75 80
Leu Asn Arg Arg His Ser Pro Arg Thr Ser Asn Glu Gly Arg Trp Met
85 90 95
Asn Gly Val Met Ala Val Asn Leu Ser Lys Trp Pro Leu Tyr Ser Leu
100 105 110
Arg Arg Ala Leu Ala Leu Ala
115
<210> 39
<211> 106
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 39
Ala Asn Glu Val Arg Ile Ser Pro Leu Phe Arg Leu Pro Tyr Gly Ser
1 5 10 15
Ala Phe Gly Pro Gly Pro Gln Pro Gly Pro Ile Leu Glu Ser Ser Thr
20 25 30
Trp Gly Phe Leu Val Phe Thr Gln Thr Ser Leu Phe Ala Asp Asp Ile
35 40 45
Ala Asp Ala Ile Arg Asp Tyr Cys Thr Thr His Pro Gly Pro Thr Arg
50 55 60
Asn Thr Gln Val Val Leu Met Asn Phe Glu Gly Ser Gly Val Pro Leu
65 70 75 80
Pro Met Phe Phe Pro Pro Gly Glu Glu Thr Glu Glu Gln Arg Glu Gly
85 90 95
Asp Arg Ala Ser Asp Ser Asp Glu Ser Glu
100 105
<210> 40
<211> 252
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 40
Met Asp Leu Asp Gly Thr Gly Gly Gly Glu Gly Tyr Ser Gln Met Val
1 5 10 15
Pro Ile Ala Thr Ala Pro Gly Ser Gly His Ala Ala Thr Tyr Gln Asp
20 25 30
Leu Gln Ala Ala Pro Tyr Ile Ile Trp Pro Leu Gln Thr Asp Cys Gln
35 40 45
Pro Val Ala Thr Thr Phe Ala Ser Pro Gly Gln Ile Gln Trp Tyr Thr
50 55 60
Ser Ala Val Pro Gln Pro Thr Glu His Cys Ser Gln Phe Thr Asn Ala
65 70 75 80
Pro Thr Val Asn Gln Gln Gln Pro Ile Ser Gln Pro Gln Pro Glu Asn
85 90 95
Pro Pro Ala Phe Thr Phe Thr Gln Pro Ala Ser Ile Ile Pro Gly Val
100 105 110
Ile Ser Ala Ser Asn Leu Asn Val Ser Ala Ser Pro Ile Ile Pro Ser
115 120 125
Asp His Val Leu Pro Ile Ile Thr Ser Val Thr Ser Leu Ala Gln Pro
130 135 140
Asn Asn Asp Glu His Ala Ile Ser Ala Ser His His Ala Ser Asp Gly
145 150 155 160
Ser Val Asn Gln Gln Lys Glu Asn Gln Pro Gln Thr Leu Glu Glu Cys
165 170 175
Lys Thr Asp Gln Glu Arg Lys Arg Tyr Arg Asn Arg Leu Ala Ser Arg
180 185 190
Arg Cys Arg Ala Lys Phe Arg Asn Gln Leu Glu His Phe Arg Thr Val
195 200 205
Ala Ala Ala Lys Thr Glu Glu Asn Asn Arg Leu Arg Val Leu Ile Arg
210 215 220
Gln Met Cys Pro Thr Leu Asp Val Glu Ser Ile Val Pro Ser Thr Ser
225 230 235 240
Ala Gly Tyr His Glu Pro Leu Asn His Leu Thr His
245 250
<210> 41
<211> 146
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 41
Met Asp Leu Asp Gly Thr Gly Gly Gly Glu Gly Tyr Ser Gln Met Val
1 5 10 15
Pro Ile Ala Thr Ala Pro Gly Ser Gly His Ala Ala Thr Tyr Gln Asp
20 25 30
Leu Gln Ala Ala Pro Tyr Ile Ile Trp Pro Leu Gln Thr Asp Cys Gln
35 40 45
Pro Val Ala Thr Thr Phe Ala Ser Pro Gly Gln Ile Gln Trp Tyr Thr
50 55 60
Ser Ala Val Pro Gln Pro Thr Glu His Cys Ser Gln Phe Thr Asn Ala
65 70 75 80
Pro Thr Val Asn Gln Gln Gln Pro Ile Ser Gln Pro Gln Pro Glu Asn
85 90 95
Pro Pro Ala Phe Thr Phe Thr Gln Pro Ala Ser Ile Ile Pro Gly Val
100 105 110
Ile Ser Ala Ser Asn Leu Asn Val Ser Ala Ser Pro Ile Ile Pro Ser
115 120 125
Asp His Val Leu Pro Ile Ile Thr Ser Val Thr Ser Leu Ala Gln Pro
130 135 140
Asn Asn
145
<210> 42
<211> 106
<212> PRT
<213> Callitrichine gammaherpesvirus 3
<400> 42
Asp Glu His Ala Ile Ser Ala Ser His His Ala Ser Asp Gly Ser Val
1 5 10 15
Asn Gln Gln Lys Glu Asn Gln Pro Gln Thr Leu Glu Glu Cys Lys Thr
20 25 30
Asp Gln Glu Arg Lys Arg Tyr Arg Asn Arg Leu Ala Ser Arg Arg Cys
35 40 45
Arg Ala Lys Phe Arg Asn Gln Leu Glu His Phe Arg Thr Val Ala Ala
50 55 60
Ala Lys Thr Glu Glu Asn Asn Arg Leu Arg Val Leu Ile Arg Gln Met
65 70 75 80
Cys Pro Thr Leu Asp Val Glu Ser Ile Val Pro Ser Thr Ser Ala Gly
85 90 95
Tyr His Glu Pro Leu Asn His Leu Thr His
100 105
<210> 43
<211> 216
<212> PRT
<213> Callithrix jacchus
<400> 43
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
1 5 10 15
Leu Gly Gln Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
20 25 30
Val Tyr Thr Val Phe Ser Ile Leu Val Ala Leu Leu Leu Ala Gly Gln
35 40 45
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
50 55 60
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
65 70 75 80
Leu Pro Lys Pro Ala Lys Pro Leu Ser Gln Met Arg Met Ala Thr Pro
85 90 95
Leu Leu Met Gln Ala Leu Pro Met Ala Gly Leu Pro Gln Lys Pro Met
100 105 110
Gln Asn Ala Thr Lys His Gly Asn Met Thr Glu Asp His Val Met His
115 120 125
Leu Leu Leu Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
130 135 140
Ser Leu Ser Glu Asn Leu Lys His Leu Lys Asn Thr Met Glu Thr Met
145 150 155 160
Asp Trp Lys Val Phe Glu Ser Trp Leu His His Trp Leu Leu Phe Glu
165 170 175
Met Ser Lys His Ser Leu Glu Gln Lys Pro Thr Glu Ala Pro Pro Lys
180 185 190
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
195 200 205
Gln Asp Leu Gly Pro Val Ala Met
210 215
<210> 44
<211> 1045
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 44
Met Ser Glu Asp Phe Leu Ile Leu Ile Ala Ile Leu Val Ile Val Ile
1 5 10 15
Leu Val Gly Thr Ile Thr Thr Leu Val Gly Ala Ile Gly Gly Ile Arg
20 25 30
Ala Arg Arg Ser Phe Leu Phe Ile Cys Ile Phe Phe Leu Phe Leu Ser
35 40 45
Leu Phe Leu Thr Ile Leu Ala Leu Leu Leu Gly Phe Ser Trp Leu Leu
50 55 60
Leu Val Ala Ile Leu Phe Trp Val Leu Trp Leu Val Ile Leu Ile Leu
65 70 75 80
Leu Leu Leu Val Tyr Pro Ile Pro His His Pro Leu Pro Thr Ser Leu
85 90 95
Arg Phe Arg Met Lys Gln Arg Val Ser Ser Asp Pro Thr Gly Ser Asp
100 105 110
Arg Ser Pro Gln Gly Ser His Asn Ser Leu Asn Ser Pro Asp Glu Glu
115 120 125
Asp Pro Lys Asp Asp Thr Lys Gln Pro Leu Cys Asn Met Thr Gln Gly
130 135 140
Gly Pro Pro Val Asn Gly Gln Leu Leu Gly Gln His Ala Gln Cys Pro
145 150 155 160
Pro His Tyr Pro Cys Cys His Ile Gln His Pro Asp Gly Glu Asp Ser
165 170 175
Asp Gly Asp Asp Gly Lys Ser Trp Gly Asp Ala Gly Glu Glu Asp Asn
180 185 190
Gly Pro Asn Asp Pro Asn Thr Ala Ser Thr Arg Glu Ser Ile Tyr Glu
195 200 205
Asp Leu Arg Tyr Pro Thr Arg Asp Ala Asn Gly Glu Tyr Glu Asn Val
210 215 220
Gly Tyr Pro Pro Arg Asp Gly Asp Ala Pro His Arg Leu Gly Glu Pro
225 230 235 240
Val Tyr Asp Asp Val Glu Gln Ala Thr Ala Asn Glu Val Arg Ile Ser
245 250 255
Pro Leu Phe Arg Leu Pro Tyr Gly Ser Ala Phe Gly Pro Gly Pro Gln
260 265 270
Pro Gly Pro Ile Leu Glu Ser Ser Thr Trp Gly Phe Leu Val Phe Thr
275 280 285
Gln Thr Ser Leu Phe Ala Asp Asp Ile Ala Asp Ala Ile Arg Asp Tyr
290 295 300
Cys Thr Thr His Pro Gly Pro Thr Arg Asn Thr Gln Val Val Leu Met
305 310 315 320
Asn Phe Glu Gly Ser Gly Val Pro Leu Pro Met Phe Phe Pro Pro Gly
325 330 335
Glu Glu Thr Glu Glu Gln Arg Glu Gly Asp Arg Ala Ser Asp Ser Asp
340 345 350
Glu Ser Glu Asp Ala Gln Ile Leu Thr Val Phe Cys Leu Phe Cys Gln
355 360 365
Trp Thr Leu Phe Ile Cys Leu Gly Ile Arg Met Ile Cys Asn Trp Arg
370 375 380
Gly Lys Leu Thr Arg Ile Ile Cys Leu Lys Phe Cys Leu Tyr Gly Leu
385 390 395 400
Ile Ser Ala Ser Leu Ser Phe Gly Trp Tyr Ala Phe Leu Lys Glu Val
405 410 415
Thr Leu Pro Thr Thr Ala Thr Val Asp Pro Arg Gln Leu Pro Leu Phe
420 425 430
Leu Phe Ile Leu Ser Ser Val Leu Val Ile Leu Ala Ile Met Met Glu
435 440 445
Phe Gln Thr Ser Ser Ser Leu Phe Ala Ala Leu Phe Val Ile Ile Ala
450 455 460
Gly Met Leu Cys Val Thr Val Gly Val Ile Phe Leu Leu Ala Gly Val
465 470 475 480
Lys Pro Leu Leu Ser Gly Met Ile Cys Ala Ser Gly Ile Thr Met Leu
485 490 495
Val Leu Gly Val Val Leu Leu Val Val Cys Thr Arg Ser Pro Ser Pro
500 505 510
Cys His His Arg Asp Glu Pro Pro Ser Arg Ser Pro Ser Pro Gln Pro
515 520 525
Thr Val Ser Glu Gln Ser Gln Gln Ser Pro Arg Gln Gln Ser Pro Gln
530 535 540
Gly Thr Ser Gln Gly Ser Thr Arg Pro Gln Val Pro Gly Gly Ala Thr
545 550 555 560
Thr Arg Lys Arg Gly Gly Val Arg Gly Gln Pro Ala Lys Cys His Gly
565 570 575
Lys Tyr Thr Thr Thr Ala Glu Gly Leu Thr Ala Leu Leu Asn Arg Arg
580 585 590
His Ser Pro Arg Thr Ser Asn Glu Gly Arg Trp Met Asn Gly Val Met
595 600 605
Ala Val Asn Leu Ser Lys Trp Pro Leu Tyr Ser Leu Arg Arg Ala Leu
610 615 620
Ala Leu Ala Met Ala Pro Arg Arg Arg Leu Ser Gly Pro Pro Trp Leu
625 630 635 640
Thr Val Leu Leu Leu Leu Ser Thr Leu Ser Val Ala Ala Leu Leu Ile
645 650 655
Leu Phe Leu Ile Phe Ser Ala Gly Ala Thr Ile Ser Thr Glu Ala Ser
660 665 670
Leu Leu Val Leu Leu Leu Leu Phe Val Thr Leu Leu Leu Pro Leu Leu
675 680 685
Ser Ser Asn Gly Leu Gln Leu Pro Ala Ala Leu Ile Leu Ile Gln Cys
690 695 700
Phe Leu Leu Ala Ala Asp Tyr Leu Ala Tyr Leu Ile Leu Pro Thr Ile
705 710 715 720
Met Pro Arg Gly Arg Ser Thr Gly Arg Lys Gly Arg Asp Thr Glu Lys
725 730 735
Glu Arg Ser Arg Ser Pro Leu Arg Ala Pro Gly Gly Ser Asp Gly Pro
740 745 750
Ser Thr Arg Ala Gly Cys Gly Ala Gly Pro Cys Gln Leu Ser Ser Pro
755 760 765
Ile Ala Gly Asn Asn Gly Asn Glu Gly Gly Glu Gly Asp Asp Tyr Lys
770 775 780
Ser Trp Arg Lys Pro Glu Glu Glu Asp Asn Gly Pro Asn Asp Pro Asn
785 790 795 800
Thr Asn Asn Arg Ile Glu Asp Gly Asp Gly Asp Asp Gly Lys Ser Trp
805 810 815
Arg Asn Pro Glu Glu Glu Asp Asn Arg Lys Gln Asp Arg Leu Gly Thr
820 825 830
Lys Pro Phe Met Ala Gly His Trp Tyr Glu Ser Val Ile Pro Gly Leu
835 840 845
Phe Leu Cys Pro Leu Ile Leu Pro Ser Leu Phe Trp Ile Cys Ser Leu
850 855 860
Leu Thr Phe Leu Val Gly His Gly Ala Asn Ile Val Ser Ala Val Leu
865 870 875 880
Phe Leu Val Leu Ala Trp Cys Leu Leu Ile Ala Asn Trp Asn Val Thr
885 890 895
Arg Glu Asp Phe Val Ser Gly Arg Arg Ser Ser Met Ser Ser Leu Ser
900 905 910
Val Ala Ala Ser Thr Ala Thr Ala Met Phe Ala Ser Phe Leu Thr Leu
915 920 925
Ser Phe Asp Gly Leu Gly Leu Leu Leu Phe Gly Thr Ala Leu Val Ile
930 935 940
Gln Thr Ile Tyr Val Leu Tyr Leu Val Val Met Glu Ile Thr Val Trp
945 950 955 960
Ile Met Met Phe Arg Tyr Leu His Phe Trp Ile Thr Leu Leu Phe Leu
965 970 975
Leu Ser Pro Ile Ile Leu Ser Val Ala Cys Leu Ile Ile Gln Ser Ser
980 985 990
Ala Leu Leu Ile Glu Ala Val Val Val Thr Thr Ile Thr Val Leu Ala
995 1000 1005
Ile Phe Leu Trp Leu Pro Pro Gln Gly Ala Glu Ala Asp Leu Gly
1010 1015 1020
Thr Ala Leu Leu Ile Leu Asn Thr Ala Leu Cys Leu Val Val Leu
1025 1030 1035
Ile Leu Thr Ala Ile Pro Thr
1040 1045
<210> 45
<211> 3135
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 45
atgtccgagg actttctgat tctgatcgcc atcctggtga tcgtgattct cgtgggcaca 60
atcacaaccc tggtgggcgc catcggcggc attagggcca ggaggagctt cctcttcatt 120
tgcatcttct tcctgttcct ctccctcttc ctgacaatcc tcgccctgct gctgggcttc 180
agctggctcc tgctggtggc catcctgttc tgggtgctct ggctggtcat cctcattctg 240
ctgctgctgg tgtaccctat tcctcaccac cccctgccca cctccctcag gtttagaatg 300
aagcagaggg tgagcagcga ccccacaggt tctgacagaa gccctcaggg cagccataat 360
agcctgaact cccccgatga ggaggacccc aaggatgaca ccaagcaacc tctgtgcaac 420
atgacccagg gcggacctcc cgtcaatgga cagctcctcg gacaacatgc tcaatgcccc 480
cctcactatc cctgctgcca tattcagcat cccgacggag aggattccga tggagacgat 540
ggcaagtcct ggggcgatgc cggagaggaa gacaatggcc ctaacgaccc taacaccgcc 600
agcaccagag agtccattta cgaggacctc agatacccca caagggacgc caatggcgag 660
tatgagaacg tgggataccc ccctagggac ggagatgccc ctcataggct cggagagcct 720
gtgtatgacg atgtggagca agccaccgct aacgaggtga gaatctcccc tctgttcaga 780
ctgccctacg gaagcgcttt cggacctggc ccccagcctg gacccattct ggagagctcc 840
acatggggct ttctggtctt cacacagacc tccctgttcg ccgacgacat tgccgacgct 900
attagggact actgcacaac ccaccctggc cccacaagga acacccaggt ggtcctcatg 960
aacttcgagg gcagcggagt gcccctgcct atgttttttc cccctggaga ggagacagaa 1020
gagcagagag agggcgatag agctagcgac tccgacgagt ccgaagacgc tcagatcctg 1080
accgtgttct gcctgttttg ccagtggaca ctctttatct gcctgggaat caggatgatc 1140
tgtaactgga ggggcaaact caccaggatc atctgcctga agttctgcct ctacggactg 1200
atttccgcct ccctgtcctt cggctggtac gcttttctga aggaagtgac cctccccacc 1260
acagccaccg ttgatcctag gcaactcccc ctgttcctct tcatcctgag ctccgtgctg 1320
gtgattctcg ccatcatgat ggagtttcaa acatcctcca gcctcttcgc tgctctgttc 1380
gtgattatcg ccggaatgct gtgcgtcaca gtgggcgtga tttttctgct ggctggcgtc 1440
aagcctctcc tgagcggcat gatctgcgcc tccggcatca caatgctcgt gctcggcgtc 1500
gtgctgctgg tggtgtgcac cagaagcccc agcccttgtc atcacaggga tgaacccccc 1560
tccagaagcc ccagccctca acccaccgtc tccgagcagt cccagcagtc ccccaggcag 1620
cagagccctc aaggcacatc ccagggttct acaagacctc aggtgcctgg aggcgccacc 1680
accagaaaaa gaggcggcgt gagaggccaa cctgccaagt gtcacggcaa gtacaccaca 1740
accgccgagg gactgaccgc tctcctgaat aggaggcaca gccccaggac atccaacgag 1800
ggcaggtgga tgaatggagt catggctgtg aacctctcca aatggcccct gtacagcctg 1860
aggagagccc tggccctcgc catggctcct agaaggaggc tctccggccc tccctggctg 1920
acagtgctgc tgctgctgtc cacactgagc gtggccgccc tgctgattct cttcctgatt 1980
ttcagcgccg gcgccaccat tagcacagaa gccagcctgc tggtcctgct cctgctgttt 2040
gtgaccctgc tgctgcctct cctgtcctcc aacggactcc agctccctgc cgccctgatt 2100
ctgatccagt gtttcctcct ggccgctgat tatctcgcct acctgattct gcctaccatt 2160
atgcccaggg gcagaagcac aggaaggaag ggcagggaca cagagaaaga gaggagcaga 2220
tcccctctca gagctcctgg cggttctgat ggacccagca caagggctgg ctgtggagcc 2280
ggaccctgtc agctgagcag ccccatcgcc ggaaacaacg gcaatgaagg cggcgagggc 2340
gacgactaca agagctggag gaagcccgag gaagaggaca acggccccaa tgaccccaat 2400
accaacaaca ggattgagga tggagacggc gacgacggaa aatcctggag gaatcctgag 2460
gaggaggata acagaaagca ggacaggctg ggcaccaagc ctttcatggc cggccactgg 2520
tatgagagcg tgattcccgg cctgttcctc tgccccctga tcctcccttc cctgttctgg 2580
atttgctccc tgctgacctt cctggtgggc cacggagcca atattgtgag cgccgtcctg 2640
ttcctcgtgc tggcttggtg tctcctcatt gccaactgga acgtgacaag agaggacttc 2700
gtgtccggca ggagaagctc catgagcagc ctgtccgtgg ccgcttccac cgccacagcc 2760
atgttcgcca gcttcctcac cctgagcttt gatggcctgg gcctgctgct gtttggcacc 2820
gccctggtga tccagacaat ttacgtgctg tatctggtgg tcatggagat caccgtgtgg 2880
atcatgatgt ttaggtatct ccacttttgg atcaccctgc tgttcctgct gagccccatt 2940
attctctccg tcgcctgtct catcatccaa tcctccgccc tgctgatcga ggctgtggtc 3000
gtcaccacca tcacagtcct ggccattttt ctgtggctcc ctcctcaagg cgctgaggcc 3060
gatctcggca ccgccctgct gattctgaat accgccctgt gcctggtcgt gctgatcctg 3120
accgctatcc ctaca 3135
<210> 46
<211> 1270
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 46
Met Arg Pro Ala Pro Trp Thr Pro Asn Pro Pro Arg Ser Pro Ser Gln
1 5 10 15
Met Ser Val Arg Asp Arg Leu Ala Arg Leu Arg Ala Glu Ala Gln Val
20 25 30
Lys Gln Ala Ser Val Glu Val Gln Pro Pro Gln Leu Thr Gln Val Ser
35 40 45
Pro Gln Gln Pro Val Ala Gly Ile Leu Phe Ile Leu Ala Ile Leu Thr
50 55 60
Glu Trp Gly Ser Gly Asn Arg Thr Tyr Gly Pro Val Phe Met Cys Leu
65 70 75 80
Gly Gly Leu Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Met
85 90 95
Ser Asn Thr Leu Leu Ser Ala Trp Ile Leu Thr Ala Gly Phe Leu Ile
100 105 110
Phe Leu Ile Gly Phe Ala Leu Phe Gly Val Ile Arg Cys Cys Arg Tyr
115 120 125
Cys Cys Tyr Tyr Cys Leu Thr Leu Glu Ser Glu Glu Arg Pro Pro Thr
130 135 140
Pro Tyr Arg Asn Thr Val Arg Lys Pro Gln Gln Pro Glu Ser Leu Glu
145 150 155 160
Glu Cys Asp Ser Glu Leu Glu Ile Lys Arg Tyr Lys Asn Arg Val Ala
165 170 175
Ser Arg Lys Cys Arg Ala Lys Phe Lys Gln Leu Leu Gln His Tyr Arg
180 185 190
Glu Val Ala Ala Ala Lys Ser Ser Glu Ile Arg Asp Arg Arg Arg Asn
195 200 205
Pro Ala Ser Arg Arg Asp Gln Ala Lys Trp Arg Leu Gln Thr Leu Ala
210 215 220
Ala Gly Trp Pro Met Gly Tyr Gln Ala Tyr Ser Ser Trp Met Tyr Ser
225 230 235 240
Tyr Thr Asp His Gln Thr Thr Pro Thr Phe Val His Leu Gln Ala Thr
245 250 255
Leu Gly Cys Thr Gly Gly Arg Arg Cys His Val Phe Leu Gly Ile Val
260 265 270
Leu Phe Ile Phe Gly Cys Leu Leu Val Leu Gly Ile Trp Ile Tyr Leu
275 280 285
Leu Glu Met Leu Trp Arg Leu Gly Ala Thr Ile Trp Gln Leu Leu Ala
290 295 300
Phe Phe Leu Ala Phe Phe Leu Asp Leu Ile Leu Leu Ile Ile Ala Leu
305 310 315 320
Tyr Leu Gln Gln Asn Trp Trp Thr Leu Leu Val Asp Leu Leu Trp Leu
325 330 335
Leu Leu Phe Leu Ala Ile Leu Ile Trp Met Tyr Tyr His Gly Gln Arg
340 345 350
Gly Arg Val Ala Cys Ala Pro Val Pro Ala Pro Ala Gly Pro Ile Val
355 360 365
Arg Pro Trp Glu Pro Ser Leu Thr Gln Ala Ala Gly Gln Ala Phe Ala
370 375 380
Pro Val Arg Pro Gln His Met Pro Val Glu Pro Val Pro Val Pro Thr
385 390 395 400
Val Ala Leu Glu Arg Pro Val Tyr Pro Lys Pro Val Arg Pro Val Leu
405 410 415
Trp Leu Ser Ser Pro Gly Gly Leu Gly Thr Leu Gly Ala Ala Leu Leu
420 425 430
Thr Leu Ala Ala Ala Leu Ala Leu Leu Ala Ser Leu Ile Leu Gly Thr
435 440 445
Leu Asn Leu Thr Thr Met Phe Leu Leu Met Leu Leu Trp Thr Leu Val
450 455 460
Val Leu Leu Ile Cys Ser Ser Cys Ser Ser Cys Pro Leu Ser Lys Ile
465 470 475 480
Leu Leu Ala Arg Leu Phe Leu Tyr Ala Leu Ala Leu Leu Leu Leu Ala
485 490 495
Ser Ala Leu Ile Ala Gly Gly Ser Ile Leu Gln Thr Asn Phe Lys Ser
500 505 510
Leu Ser Ser Thr Glu Phe Ile Pro Asn Leu Phe Cys Met Leu Leu Leu
515 520 525
Ile His Ser Asp Glu His His His Asp Asp Ser Leu Pro His Pro Gln
530 535 540
Gln Ala Thr Asp Asp Ser Gly His Glu Ser Asp Ser Asn Ser Asn Glu
545 550 555 560
Gly Arg His His Leu Leu Val Ser Gly Ala Gln Val Pro Glu Pro Pro
565 570 575
Thr Ile His Leu Ala Ala Gln Gly Met Ala Tyr Pro Leu His Glu Gln
580 585 590
His Gly Met Ala Pro Cys Pro Val Ala Gln Ala Pro Pro Thr Pro Leu
595 600 605
Pro Phe Phe Ala Ile Cys Leu Thr Trp Arg Ile Glu Asp Pro Pro Phe
610 615 620
Asn Ser Leu Leu Phe Ala Leu Leu Ala Ala Ala Gly Gly Leu Gln Gly
625 630 635 640
Ile Tyr Val Leu Val Met Leu Val Leu Leu Ile Leu Ala Tyr Arg Arg
645 650 655
Arg Trp Arg Arg Leu Thr Val Cys Gly Gly Ile Met Phe Leu Ala Cys
660 665 670
Val Leu Val Leu Ile Val Asp Ala Val Leu Gln Leu Ser Pro Leu Leu
675 680 685
Gly Ala Val Thr Val Val Ser Met Thr Leu Leu Leu Leu Ala Phe Asn
690 695 700
Gly Pro His Asp Pro Leu Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn
705 710 715 720
Gly Pro Gln Asp Pro Asp Asn Thr Asp Asp Asn Gly Pro His Asp Pro
725 730 735
Leu Pro His Ser Pro Ser Asp Ser Ala Gly Asn Asp Gly Gly Pro Pro
740 745 750
Gln Leu Thr Glu Glu Val Glu Asn Lys Gly Gly Asp Gln Gly Pro Pro
755 760 765
Leu Met Thr Asp Gly Gly Gly Gly His Ser His Asp Ser Gly His Gly
770 775 780
Gly Gly Asp Pro His Leu Pro Thr Leu Leu Leu Gly Ser Ser Gly Ser
785 790 795 800
Gly Gly Asp Asp Asp Asp Pro His Gly Pro Val Gln Leu Ser Tyr Tyr
805 810 815
Asp Gly Lys Arg Thr Glu Gln Gly Lys Glu Val Leu Glu Lys Ala Arg
820 825 830
Gly Ser Thr Tyr Gly Thr Pro Arg Pro Pro Met Ser Asp Trp Thr Gly
835 840 845
Gly Ala Leu Leu Val Leu Tyr Ser Phe Ala Leu Met Leu Ile Ile Ile
850 855 860
Ile Leu Ile Ile Phe Ile Phe Arg Arg Asp Leu Leu Cys Pro Leu Gly
865 870 875 880
Ala Leu Cys Ile Leu Leu Leu Met Ile Thr Leu Leu Leu Ile Ala Leu
885 890 895
Trp Asn Leu His Gly Gln Ala Leu Met Ser Asp Glu Gly Pro Gly Thr
900 905 910
Gly Pro Gly Asn Gly Leu Gly Glu Lys Gly Asp Thr Ser Gly Pro Glu
915 920 925
Gly Ser Gly Gly Ser Gly Pro Gln Arg Arg Gly Gly Asp Asn His Gly
930 935 940
Arg Gly Arg Gly Arg Gly Arg Gly Arg Gly Gly Gly Arg Pro Gly Ala
945 950 955 960
Pro Gly Gly Ser Gly Ser Gly Pro Arg His Arg Asp Gly Val Arg Arg
965 970 975
Pro Gln Lys Arg Pro Ser Cys Ile Gly Cys Lys Gly Thr His Trp Ile
980 985 990
Asp Asp Asn Pro Ser Thr Glu Thr Ala Gln Ala Trp Asn Ala Gly Phe
995 1000 1005
Leu Arg Gly Arg Ala Tyr Gly Ile Asp Leu Leu Arg Thr Glu Gly
1010 1015 1020
Glu His Val Glu Gly Ala Thr Gly Glu Thr Arg Glu Glu Ser Glu
1025 1030 1035
Asp Thr Glu Ser Asp Gly Asp Asp Glu Asp Leu Pro Cys Ile Val
1040 1045 1050
Ser Arg Gly Gly Pro Lys Val Lys Arg Pro Pro Ile Phe Ile Arg
1055 1060 1065
Arg Leu His Arg Leu Leu Leu Met Arg Ala Met Asn Pro Val Cys
1070 1075 1080
Leu Pro Val Ile Val Ala Pro Tyr Leu Phe Trp Leu Ala Ala Ile
1085 1090 1095
Ala Ala Ser Cys Phe Thr Ala Ser Val Ser Thr Val Val Thr Ala
1100 1105 1110
Thr Gly Leu Ala Leu Ser Leu Leu Leu Leu Ala Ala Val Ala Ser
1115 1120 1125
Ser Tyr Ala Ala Ala Gln Arg Lys Leu Leu Thr Pro Val Thr Val
1130 1135 1140
Leu Thr Ala Val Val Thr Thr Phe Ser Ala Gly Thr Phe Lys Leu
1145 1150 1155
Pro Arg Cys Thr Pro Gly Asp Arg Gln Trp Leu Tyr Val Gln Ser
1160 1165 1170
Ser Val Gly Asn Ile Val Gln Ser Cys Asn Pro Arg Tyr Ser Ile
1175 1180 1185
Phe Phe Asp Tyr Met Ala Ile His Arg Ser Leu Thr Lys Ile Trp
1190 1195 1200
Glu Asp Leu Gly Gly Pro Ser Gln Ala Pro Leu Pro Cys Val Leu
1205 1210 1215
Trp Pro Val Leu Pro Glu Pro Leu Pro Gln Gly Gln Leu Thr Ala
1220 1225 1230
Tyr His Val Ser Thr Ala Pro Thr Gly Ser Trp Phe Ser Ala Pro
1235 1240 1245
Gln Pro Ala Pro Glu Asn Ala Tyr Gln Ala Tyr Ala Ala Pro Gln
1250 1255 1260
Leu Phe Pro Val Ser Asp Ile
1265 1270
<210> 47
<211> 3810
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 47
atgagacctg ctccctggac acctaatcct cccaggtccc ccagccagat gagcgtgaga 60
gacagactgg ctaggctgag agccgaggct caggtcaagc aggccagcgt cgaggtgcaa 120
ccccctcagc tcacccaggt gtccccccag cagcctgtgg ccggcattct gttcattctg 180
gccattctga ccgagtgggg aagcggcaac agaacctacg gccctgtctt catgtgcctc 240
ggaggactgc tgacaatggt ggctggcgcc gtgtggctca ccgtcatgtc caacaccctg 300
ctcagcgcct ggattctgac cgccggattc ctgatctttc tgatcggatt cgctctcttt 360
ggcgtcatca ggtgttgcag gtactgttgc tactactgcc tgaccctcga gagcgaggaa 420
agacccccca ccccctacag gaatacagtg aggaaacctc agcagcccga gagcctcgag 480
gagtgcgata gcgagctgga gattaaaagg tataagaata gggtggcctc caggaagtgt 540
agggctaaat tcaaacagct cctgcaacac tatagggaag tggccgccgc caagtccagc 600
gagattaggg acagaaggag gaatcctgcc tccaggagag accaggccaa atggagactc 660
caaacactcg ccgctggatg gcccatgggc taccaggcct atagctcctg gatgtacagc 720
tacaccgacc atcagacaac acccaccttc gtgcatctgc aggctacact gggctgcacc 780
ggaggcagaa ggtgtcacgt gtttctggga atcgtgctgt tcatctttgg atgcctgctc 840
gtgctgggca tctggattta tctcctggag atgctctgga gactcggcgc tacaatttgg 900
cagctgctcg ccttttttct ggccttcttt ctggacctga tcctcctgat catcgccctg 960
tacctccaac agaactggtg gaccctcctg gtggatctgc tgtggctcct cctcttcctg 1020
gccatcctga tctggatgta ctaccatggc cagagaggaa gggtcgcttg cgctcctgtc 1080
cctgctcctg ctggccccat cgtgaggcct tgggagcctt ccctcacaca ggccgccggc 1140
caggcctttg ctcccgtgag gccccagcac atgcctgtgg aacccgtgcc cgtccccaca 1200
gtggctctgg aaaggcctgt gtaccccaag cccgtgagac ctgtcctctg gctcagcagc 1260
cctggaggac tcggaacact cggagccgct ctcctgacac tggccgctgc tctggctctg 1320
ctggctagcc tgatcctggg aaccctcaac ctcaccacca tgtttctcct catgctcctg 1380
tggaccctcg tggtgctgct catctgttcc agctgctcca gctgccccct gagcaagatc 1440
ctgctggcca ggctgttcct gtacgccctc gccctcctgc tgctggctag cgccctgatc 1500
gctggcggaa gcatcctcca gaccaatttc aagagcctct cctccaccga gttcatcccc 1560
aacctgttct gtatgttact gctgatccat agcgacgagc accatcatga cgactccctg 1620
ccccatcctc agcaggccac agacgactcc ggccacgaga gcgacagcaa tagcaatgag 1680
ggcaggcacc atctgctcgt gtccggagct caagtccccg agcctcccac catccatctc 1740
gccgcccagg gaatggctta ccccctccac gagcagcacg gcatggcccc ttgtcccgtc 1800
gctcaagccc cccctacacc tctgcccttt ttcgccattt gtctgacctg gagaatcgag 1860
gaccccccct tcaacagcct gctgttcgcc ctgctcgccg ccgctggcgg cctccagggc 1920
atttacgtcc tcgtgatgct ggtgctgctg atcctcgctt acaggagaag atggaggaga 1980
ctgacagtgt gcggcggcat catgtttctc gcctgcgtcc tggtcctgat cgtggacgcc 2040
gtcctgcaac tcagccccct cctgggagct gtgacagtgg tctccatgac cctgctgctg 2100
ctggccttca acggacccca cgatcctctg ccccaagatc ctgacaatac cgacgataac 2160
ggcccccaag accccgataa caccgacgac aatggccctc acgaccctct gccccatagc 2220
ccttccgata gcgctggcaa cgatggcggc cctcctcagc tgacagagga ggtggaaaat 2280
aagggcggcg atcagggacc ccccctgatg acagatggcg gaggaggaca cagccatgat 2340
agcggacatg gcggaggcga tccccatctg cctaccctcc tcctgggcag ctccggttct 2400
ggaggcgacg atgatgaccc tcacggccct gtgcagctct cctactacga cggcaaaagg 2460
accgaacaag gaaaagaggt cctggagaag gccaggggca gcacatacgg aacccccagg 2520
cctcccatgt ccgattggac cggaggagcc ctgctggtcc tctacagctt cgccctgatg 2580
ctgatcatta tcatcctgat catctttatc ttcagaaggg acctgctgtg ccctctcggc 2640
gccctgtgca tcctgctgct catgatcaca ctcctcctga tcgccctctg gaacctgcac 2700
ggacaagccc tgatgtccga tgagggacct ggaacaggac ccggaaacgg actgggcgag 2760
aagggagata caagcggccc cgaaggcagc ggcggaagcg gaccccaaag aaggggcggc 2820
gacaaccacg gaagaggaag aggcaggggc agaggcagag gaggaggaag acctggagcc 2880
cctggcggtt ctggaagcgg acccaggcac agggacggag tgaggaggcc tcaaaaaaga 2940
cccagctgca tcggctgcaa gggaacccac tggattgatg ataacccctc cacagagacc 3000
gctcaggcct ggaacgccgg cttcctgagg ggaagagcct atggcatcga tctgctgagg 3060
accgagggcg aacacgtgga gggagccacc ggagagacaa gggaggaaag cgaagacaca 3120
gaaagcgatg gcgacgacga agacctgccc tgcattgtgt ccaggggcgg acccaaggtg 3180
aagaggcccc ctatctttat cagaaggctc catagactgc tcctgatgag ggccatgaac 3240
cctgtgtgcc tgcccgtgat cgtggccccc tacctctttt ggctggccgc cattgccgct 3300
agctgcttca ccgcctccgt gtccacagtg gtgacagcca ccggcctcgc cctgagcctg 3360
ctgctcctcg ctgccgtggc ctccagctac gccgctgctc aaagaaagct cctgacccct 3420
gtcaccgtcc tgacagccgt cgtgaccacc ttttccgctg gcaccttcaa gctgcctagg 3480
tgcacacctg gcgacaggca gtggctctac gtgcagagct ccgtgggcaa tattgtgcag 3540
agctgcaatc ccaggtacag catttttttc gactacatgg ccatccatag gtccctcacc 3600
aagatctggg aggatctggg aggcccttcc caggctcctc tgccctgcgt gctgtggcct 3660
gtgctgcctg agcctctgcc ccaaggccag ctgacagcct atcacgtgtc caccgctcct 3720
acaggttctt ggttcagcgc tccccagccc gctcccgaaa acgcttacca ggcttacgcc 3780
gccccccagc tgttccccgt ctccgacatc 3810
<210> 48
<211> 1512
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 48
Met Asp Asp Gln Arg Asp Leu Ile Ser Asn Asn Glu Gln Leu Pro Met
1 5 10 15
Leu Gly Gln Arg Pro Gly Ala Pro Glu Ser Lys Cys Ser Arg Gly Ala
20 25 30
Val Tyr Thr Val Phe Ser Ile Leu Val Ala Leu Leu Leu Ala Gly Gln
35 40 45
Ala Thr Thr Ala Tyr Phe Leu Tyr Gln Gln Gln Gly Arg Leu Asp Lys
50 55 60
Leu Thr Val Thr Ser Gln Asn Leu Gln Leu Glu Asn Leu Arg Met Lys
65 70 75 80
Leu Pro Lys Pro Ala Lys Pro Leu Ser Gln Met Arg Met Ala Thr Pro
85 90 95
Leu Leu Met Gln Ala Leu Pro Met Ala Gly Leu Pro Gln Lys Pro Met
100 105 110
Gln Asn Ala Thr Lys His Gly Asn Met Thr Glu Asp His Val Met His
115 120 125
Leu Leu Leu Asn Ala Asp Pro Leu Lys Val Tyr Pro Pro Leu Lys Gly
130 135 140
Ser Leu Ser Glu Asn Leu Lys His Leu Lys Asn Thr Met Glu Thr Met
145 150 155 160
Asp Trp Lys Val Phe Glu Ser Trp Leu His His Trp Leu Leu Phe Glu
165 170 175
Met Ser Lys His Ser Leu Glu Gln Lys Pro Thr Glu Ala Pro Pro Lys
180 185 190
Glu Ser Leu Glu Leu Glu Asp Pro Ser Ser Gly Leu Gly Val Thr Lys
195 200 205
Gln Asp Leu Gly Pro Val Ala Met Ser Glu Asp Phe Leu Ile Leu Ile
210 215 220
Ala Ile Leu Val Ile Val Ile Leu Val Gly Thr Ile Thr Thr Leu Val
225 230 235 240
Gly Ala Ile Gly Gly Ile Arg Ala Arg Arg Ser Phe Leu Phe Ile Cys
245 250 255
Ile Phe Phe Leu Phe Leu Ser Leu Phe Leu Thr Ile Leu Ala Leu Leu
260 265 270
Leu Gly Phe Ser Trp Leu Leu Leu Val Ala Ile Leu Phe Trp Val Leu
275 280 285
Trp Leu Val Ile Leu Ile Leu Leu Leu Leu Val Tyr Pro Ile Pro His
290 295 300
His Pro Leu Pro Thr Ser Leu Arg Phe Arg Met Lys Gln Arg Val Ser
305 310 315 320
Ser Asp Pro Thr Gly Ser Asp Arg Ser Pro Gln Gly Ser His Asn Ser
325 330 335
Leu Asn Ser Pro Asp Glu Glu Asp Pro Lys Asp Asp Thr Lys Gln Pro
340 345 350
Leu Cys Asn Met Thr Gln Gly Gly Pro Pro Val Asn Gly Gln Leu Leu
355 360 365
Gly Gln His Ala Gln Cys Pro Pro His Tyr Pro Cys Cys His Ile Gln
370 375 380
His Pro Asp Gly Glu Asp Ser Asp Gly Asp Asp Gly Lys Ser Trp Gly
385 390 395 400
Asp Ala Gly Glu Glu Asp Asn Gly Pro Asn Asp Pro Asn Thr Ala Ser
405 410 415
Thr Arg Glu Ser Ile Tyr Glu Asp Leu Arg Tyr Pro Thr Arg Asp Ala
420 425 430
Asn Gly Glu Tyr Glu Asn Val Gly Tyr Pro Pro Arg Asp Gly Asp Ala
435 440 445
Pro His Arg Leu Gly Glu Pro Val Tyr Asp Asp Val Glu Gln Ala Thr
450 455 460
Ala Asn Glu Val Arg Ile Ser Pro Leu Phe Arg Leu Pro Tyr Gly Ser
465 470 475 480
Ala Phe Gly Pro Gly Pro Gln Pro Gly Pro Ile Leu Glu Ser Ser Thr
485 490 495
Trp Gly Phe Leu Val Phe Thr Gln Thr Ser Leu Phe Ala Asp Asp Ile
500 505 510
Ala Asp Ala Ile Arg Asp Tyr Cys Thr Thr His Pro Gly Pro Thr Arg
515 520 525
Asn Thr Gln Val Val Leu Met Asn Phe Glu Gly Ser Gly Val Pro Leu
530 535 540
Pro Met Phe Phe Pro Pro Gly Glu Glu Thr Glu Glu Gln Arg Glu Gly
545 550 555 560
Asp Arg Ala Ser Asp Ser Asp Glu Ser Glu Asp Ala Gln Ile Leu Thr
565 570 575
Val Phe Cys Leu Phe Cys Gln Trp Thr Leu Phe Ile Cys Leu Gly Ile
580 585 590
Arg Met Ile Cys Asn Trp Arg Gly Lys Leu Thr Arg Ile Ile Cys Leu
595 600 605
Lys Phe Cys Leu Tyr Gly Leu Ile Ser Ala Ser Leu Ser Phe Gly Trp
610 615 620
Tyr Ala Phe Leu Lys Glu Val Thr Leu Pro Thr Thr Ala Thr Val Asp
625 630 635 640
Pro Arg Gln Leu Pro Leu Phe Leu Phe Ile Leu Ser Ser Val Leu Val
645 650 655
Ile Leu Ala Ile Met Met Glu Phe Gln Thr Ser Ser Ser Leu Phe Ala
660 665 670
Ala Leu Phe Val Ile Ile Ala Gly Met Leu Cys Val Thr Val Gly Val
675 680 685
Ile Phe Leu Leu Ala Gly Val Lys Pro Leu Leu Ser Gly Met Ile Cys
690 695 700
Ala Ser Gly Ile Thr Met Leu Val Leu Gly Val Val Leu Leu Val Val
705 710 715 720
Cys Thr Arg Asp Glu His Ala Ile Ser Ala Ser His His Ala Ser Asp
725 730 735
Gly Ser Val Asn Gln Gln Lys Glu Asn Gln Pro Gln Thr Leu Glu Glu
740 745 750
Cys Lys Thr Asp Gln Glu Arg Lys Arg Tyr Arg Asn Arg Leu Ala Ser
755 760 765
Arg Arg Cys Arg Ala Lys Phe Arg Asn Gln Leu Glu His Phe Arg Thr
770 775 780
Val Ala Ala Ala Lys Thr Glu Glu Asn Asn Arg Leu Arg Val Leu Ile
785 790 795 800
Arg Gln Met Cys Pro Thr Leu Asp Val Glu Ser Ile Val Pro Ser Thr
805 810 815
Ser Ala Gly Tyr His Glu Pro Leu Asn His Leu Thr His Ser Pro Ser
820 825 830
Pro Cys His His Arg Asp Glu Pro Pro Ser Arg Ser Pro Ser Pro Gln
835 840 845
Pro Thr Val Ser Glu Gln Ser Gln Gln Ser Pro Arg Gln Gln Ser Pro
850 855 860
Gln Gly Thr Ser Gln Gly Ser Thr Arg Pro Gln Val Pro Gly Gly Ala
865 870 875 880
Thr Thr Arg Lys Arg Gly Gly Val Arg Gly Gln Pro Ala Lys Cys His
885 890 895
Gly Lys Tyr Thr Thr Thr Ala Glu Gly Leu Thr Ala Leu Leu Asn Arg
900 905 910
Arg His Ser Pro Arg Thr Ser Asn Glu Gly Arg Trp Met Asn Gly Val
915 920 925
Met Ala Val Asn Leu Ser Lys Trp Pro Leu Tyr Ser Leu Arg Arg Ala
930 935 940
Leu Ala Leu Ala Met Ala Pro Arg Arg Arg Leu Ser Gly Pro Pro Trp
945 950 955 960
Leu Thr Val Leu Leu Leu Leu Ser Thr Leu Ser Val Ala Ala Leu Leu
965 970 975
Ile Leu Phe Leu Ile Phe Ser Ala Gly Ala Thr Ile Ser Thr Glu Ala
980 985 990
Ser Leu Leu Val Leu Leu Leu Leu Phe Val Thr Leu Leu Leu Pro Leu
995 1000 1005
Leu Ser Ser Asn Gly Leu Gln Leu Pro Ala Ala Leu Ile Leu Ile
1010 1015 1020
Gln Cys Phe Leu Leu Ala Ala Asp Tyr Leu Ala Tyr Leu Ile Leu
1025 1030 1035
Pro Thr Ile Met Pro Arg Gly Arg Ser Thr Gly Arg Lys Gly Arg
1040 1045 1050
Asp Thr Glu Lys Glu Arg Ser Arg Ser Pro Leu Arg Ala Pro Gly
1055 1060 1065
Gly Ser Asp Gly Pro Ser Thr Arg Ala Gly Cys Gly Ala Gly Pro
1070 1075 1080
Cys Gln Leu Ser Ser Pro Ile Ala Gly Asn Asn Gly Asn Glu Gly
1085 1090 1095
Gly Glu Gly Asp Asp Tyr Lys Ser Trp Arg Lys Pro Glu Glu Glu
1100 1105 1110
Asp Asn Gly Pro Asn Asp Pro Asn Thr Asn Asn Arg Ile Glu Asp
1115 1120 1125
Gly Asp Gly Asp Asp Gly Lys Ser Trp Arg Asn Pro Glu Glu Glu
1130 1135 1140
Asp Asn Arg Lys Gln Asp Arg Leu Gly Thr Lys Pro Phe Met Asp
1145 1150 1155
Leu Asp Gly Thr Gly Gly Gly Glu Gly Tyr Ser Gln Met Val Pro
1160 1165 1170
Ile Ala Thr Ala Pro Gly Ser Gly His Ala Ala Thr Tyr Gln Asp
1175 1180 1185
Leu Gln Ala Ala Pro Tyr Ile Ile Trp Pro Leu Gln Thr Asp Cys
1190 1195 1200
Gln Pro Val Ala Thr Thr Phe Ala Ser Pro Gly Gln Ile Gln Trp
1205 1210 1215
Tyr Thr Ser Ala Val Pro Gln Pro Thr Glu His Cys Ser Gln Phe
1220 1225 1230
Thr Asn Ala Pro Thr Val Asn Gln Gln Gln Pro Ile Ser Gln Pro
1235 1240 1245
Gln Pro Glu Asn Pro Pro Ala Phe Thr Phe Thr Gln Pro Ala Ser
1250 1255 1260
Ile Ile Pro Gly Val Ile Ser Ala Ser Asn Leu Asn Val Ser Ala
1265 1270 1275
Ser Pro Ile Ile Pro Ser Asp His Val Leu Pro Ile Ile Thr Ser
1280 1285 1290
Val Thr Ser Leu Ala Gln Pro Asn Asn Met Ala Gly His Trp Tyr
1295 1300 1305
Glu Ser Val Ile Pro Gly Leu Phe Leu Cys Pro Leu Ile Leu Pro
1310 1315 1320
Ser Leu Phe Trp Ile Cys Ser Leu Leu Thr Phe Leu Val Gly His
1325 1330 1335
Gly Ala Asn Ile Val Ser Ala Val Leu Phe Leu Val Leu Ala Trp
1340 1345 1350
Cys Leu Leu Ile Ala Asn Trp Asn Val Thr Arg Glu Asp Phe Val
1355 1360 1365
Ser Gly Arg Arg Ser Ser Met Ser Ser Leu Ser Val Ala Ala Ser
1370 1375 1380
Thr Ala Thr Ala Met Phe Ala Ser Phe Leu Thr Leu Ser Phe Asp
1385 1390 1395
Gly Leu Gly Leu Leu Leu Phe Gly Thr Ala Leu Val Ile Gln Thr
1400 1405 1410
Ile Tyr Val Leu Tyr Leu Val Val Met Glu Ile Thr Val Trp Ile
1415 1420 1425
Met Met Phe Arg Tyr Leu His Phe Trp Ile Thr Leu Leu Phe Leu
1430 1435 1440
Leu Ser Pro Ile Ile Leu Ser Val Ala Cys Leu Ile Ile Gln Ser
1445 1450 1455
Ser Ala Leu Leu Ile Glu Ala Val Val Val Thr Thr Ile Thr Val
1460 1465 1470
Leu Ala Ile Phe Leu Trp Leu Pro Pro Gln Gly Ala Glu Ala Asp
1475 1480 1485
Leu Gly Thr Ala Leu Leu Ile Leu Asn Thr Ala Leu Cys Leu Val
1490 1495 1500
Val Leu Ile Leu Thr Ala Ile Pro Thr
1505 1510
<210> 49
<211> 4536
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<400> 49
atggacgacc agcgggacct gatcagcaac aacgagcagc tgcccatgct gggccagagg 60
cctggcgccc ctgagagcaa gtgtagcaga ggcgccgtgt acaccgtgtt cagcatcctg 120
gtggccctgc tgctggccgg acaggccacc accgcctact ttctgtatca gcagcaggga 180
cggctggaca agctgaccgt gaccagccag aacctgcagc tggaaaacct gcggatgaag 240
ctgcccaagc ccgccaagcc cctgagccag atgagaatgg ccacccccct gctgatgcag 300
gccctgccta tggccggcct gccccagaaa cccatgcaga acgccaccaa gcacggcaac 360
atgaccgagg accacgtgat gcatctgctg ctgaacgccg accccctgaa ggtgtacccc 420
ccactgaagg gcagcctgag cgagaacctg aagcacctga agaacaccat ggaaaccatg 480
gactggaagg tgttcgagag ctggctgcac cactggctgc tgttcgagat gagcaagcac 540
agcctggaac agaagcccac cgaggcccct cccaaagaga gcctggaact ggaagatccc 600
agcagcggcc tgggcgtgac caagcaggat ctgggccccg tggctatgtc cgaggacttt 660
ctgattctga tcgccatcct ggtgatcgtg attctcgtgg gcacaatcac aaccctggtg 720
ggcgccatcg gcggcattag ggccaggagg agcttcctct tcatttgcat cttcttcctg 780
ttcctctccc tcttcctgac aatcctcgcc ctgctgctgg gcttcagctg gctcctgctg 840
gtggccatcc tgttctgggt gctctggctg gtcatcctca ttctgctgct gctggtgtac 900
cctattcctc accaccccct gcccacctcc ctcaggttta gaatgaagca gagggtgagc 960
agcgacccca caggttctga cagaagccct cagggcagcc ataatagcct gaactccccc 1020
gatgaggagg accccaagga tgacaccaag caacctctgt gcaacatgac ccagggcgga 1080
cctcccgtca atggacagct cctcggacaa catgctcaat gcccccctca ctatccctgc 1140
tgccatattc agcatcccga cggagaggat tccgatggag acgatggcaa gtcctggggc 1200
gatgccggag aggaagacaa tggccctaac gaccctaaca ccgccagcac cagagagtcc 1260
atttacgagg acctcagata ccccacaagg gacgccaatg gcgagtatga gaacgtggga 1320
taccccccta gggacggaga tgcccctcat aggctcggag agcctgtgta tgacgatgtg 1380
gagcaagcca ccgctaacga ggtgagaatc tcccctctgt tcagactgcc ctacggaagc 1440
gctttcggac ctggccccca gcctggaccc attctggaga gctccacatg gggctttctg 1500
gtcttcacac agacctccct gttcgccgac gacattgccg acgctattag ggactactgc 1560
acaacccacc ctggccccac aaggaacacc caggtggtcc tcatgaactt cgagggcagc 1620
ggagtgcccc tgcctatgtt ttttccccct ggagaggaga cagaagagca gagagagggc 1680
gatagagcta gcgactccga cgagtccgaa gacgctcaga tcctgaccgt gttctgcctg 1740
ttttgccagt ggacactctt tatctgcctg ggaatcagga tgatctgtaa ctggaggggc 1800
aaactcacca ggatcatctg cctgaagttc tgcctctacg gactgatttc cgcctccctg 1860
tccttcggct ggtacgcttt tctgaaggaa gtgaccctcc ccaccacagc caccgttgat 1920
cctaggcaac tccccctgtt cctcttcatc ctgagctccg tgctggtgat tctcgccatc 1980
atgatggagt ttcaaacatc ctccagcctc ttcgctgctc tgttcgtgat tatcgccgga 2040
atgctgtgcg tcacagtggg cgtgattttt ctgctggctg gcgtcaagcc tctcctgagc 2100
ggcatgatct gcgcctccgg catcacaatg ctcgtgctcg gcgtcgtgct gctggtggtg 2160
tgcaccagag atgagcacgc tatttccgcc agccaccatg ctagcgatgg ctccgtgaat 2220
cagcagaagg aaaatcagcc ccagaccctg gaggaatgca agacagatca ggagaggaag 2280
aggtacagga acaggctggc ctccaggagg tgtagagcta agttcaggaa ccagctggaa 2340
cattttagga cagtcgccgc tgctaagaca gaggagaaca acaggctcag ggtgctcatc 2400
aggcagatgt gtcctacact ggacgtggaa tccatcgtcc cctccacctc cgccggctac 2460
cacgagcctc tgaatcacct gacccacagc cccagccctt gtcatcacag ggatgaaccc 2520
ccctccagaa gccccagccc tcaacccacc gtctccgagc agtcccagca gtcccccagg 2580
cagcagagcc ctcaaggcac atcccagggt tctacaagac ctcaggtgcc tggaggcgcc 2640
accaccagaa aaagaggcgg cgtgagaggc caacctgcca agtgtcacgg caagtacacc 2700
acaaccgccg agggactgac cgctctcctg aataggaggc acagccccag gacatccaac 2760
gagggcaggt ggatgaatgg agtcatggct gtgaacctct ccaaatggcc cctgtacagc 2820
ctgaggagag ccctggccct cgccatggct cctagaagga ggctctccgg ccctccctgg 2880
ctgacagtgc tgctgctgct gtccacactg agcgtggccg ccctgctgat tctcttcctg 2940
attttcagcg ccggcgccac cattagcaca gaagccagcc tgctggtcct gctcctgctg 3000
tttgtgaccc tgctgctgcc tctcctgtcc tccaacggac tccagctccc tgccgccctg 3060
attctgatcc agtgtttcct cctggccgct gattatctcg cctacctgat tctgcctacc 3120
attatgccca ggggcagaag cacaggaagg aagggcaggg acacagagaa agagaggagc 3180
agatcccctc tcagagctcc tggcggttct gatggaccca gcacaagggc tggctgtgga 3240
gccggaccct gtcagctgag cagccccatc gccggaaaca acggcaatga aggcggcgag 3300
ggcgacgact acaagagctg gaggaagccc gaggaagagg acaacggccc caatgacccc 3360
aataccaaca acaggattga ggatggagac ggcgacgacg gaaaatcctg gaggaatcct 3420
gaggaggagg ataacagaaa gcaggacagg ctgggcacca agcctttcat ggacctcgac 3480
ggaaccggcg gaggcgaggg ctacagccag atggtcccta tcgccaccgc ccccggaagc 3540
ggccacgccg ctacctatca ggatctccag gccgcccctt acatcatctg gcctctccag 3600
accgattgcc agcctgtggc taccaccttc gcctcccccg gacagatcca gtggtataca 3660
agcgccgtcc cccagcccac agagcattgc tcccagttta caaacgctcc caccgtcaac 3720
cagcagcagc ctattagcca accccagccc gaaaatcccc ctgctttcac ctttacccag 3780
cccgcttcca tcattcccgg cgtcattagc gcctccaacc tgaacgtgag cgcttcccct 3840
atcatcccta gcgaccatgt cctccccatc attacctccg tgaccagcct cgcccaacct 3900
aataacatgg ccggccactg gtatgagagc gtgattcccg gcctgttcct ctgccccctg 3960
atcctccctt ccctgttctg gatttgctcc ctgctgacct tcctggtggg ccacggagcc 4020
aatattgtga gcgccgtcct gttcctcgtg ctggcttggt gtctcctcat tgccaactgg 4080
aacgtgacaa gagaggactt cgtgtccggc aggagaagct ccatgagcag cctgtccgtg 4140
gccgcttcca ccgccacagc catgttcgcc agcttcctca ccctgagctt tgatggcctg 4200
ggcctgctgc tgtttggcac cgccctggtg atccagacaa tttacgtgct gtatctggtg 4260
gtcatggaga tcaccgtgtg gatcatgatg tttaggtatc tccacttttg gatcaccctg 4320
ctgttcctgc tgagccccat tattctctcc gtcgcctgtc tcatcatcca atcctccgcc 4380
ctgctgatcg aggctgtggt cgtcaccacc atcacagtcc tggccatttt tctgtggctc 4440
cctcctcaag gcgctgaggc cgatctcggc accgccctgc tgattctgaa taccgccctg 4500
tgcctggtcg tgctgatcct gaccgctatc cctaca 4536
<210> 50
<211> 44035
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (15712)..(15712)
<223> a, c, t, g, unknown or other
<400> 50
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg agacctgctc cctggacacc taatcctccc 1380
aggtccccca gccagatgag cgtgagagac agactggcta ggctgagagc cgaggctcag 1440
gtcaagcagg ccagcgtcga ggtgcaaccc cctcagctca cccaggtgtc cccccagcag 1500
cctgtggccg gcattctgtt cattctggcc attctgaccg agtggggaag cggcaacaga 1560
acctacggcc ctgtcttcat gtgcctcgga ggactgctga caatggtggc tggcgccgtg 1620
tggctcaccg tcatgtccaa caccctgctc agcgcctgga ttctgaccgc cggattcctg 1680
atctttctga tcggattcgc tctctttggc gtcatcaggt gttgcaggta ctgttgctac 1740
tactgcctga ccctcgagag cgaggaaaga ccccccaccc cctacaggaa tacagtgatt 1800
agggacagaa ggaggaatcc tgcctccagg agagaccagg ccaaatggag actccaaaca 1860
ctcgccgctg gatggcccat gggctaccag gcctatagct cctggatgta cagctacacc 1920
gaccatcaga caacacccac cttcgtgcat ctgcaggcta cactgggctg caccggaggc 1980
agaaggtgtc acgtgtttct gggaatcgtg ctgttcatct ttggatgcct gctcgtgctg 2040
ggcatctgga tttatctcct ggagatgctc tggagactcg gcgctacaat ttggcagctg 2100
ctcgcctttt ttctggcctt ctttctggac ctgatcctcc tgatcatcgc cctgtacctc 2160
caacagaact ggtggaccct cctggtggat ctgctgtggc tcctcctctt cctggccatc 2220
ctgatctgga tgtactacca tggccagaga ggaagggtcg cttgcgctcc tgtccctgct 2280
cctgctggcc ccatcgtgag gccttgggag ccttccctca cacaggccgc cggccaggcc 2340
tttgctcccg tgaggcccca gcacatgcct gtggaacccg tgcccgtccc cacagtggct 2400
ctggaaaggc ctgtgtaccc caagcccgtg agacctgtcc tctggctcag cagccctgga 2460
ggactcggaa cactcggagc cgctctcctg acactggccg ctgctctggc tctgctggct 2520
agcctgatcc tgggaaccct caacctcacc accatgtttc tcctcatgct cctgtggacc 2580
ctcgtggtgc tgctcatctg ttccagctgc tccagctgcc ccctgagcaa gatcctgctg 2640
gccaggctgt tcctgtacgc cctcgccctc ctgctgctgg ctagcgccct gatcgctggc 2700
ggaagcatcc tccagaccaa tttcaagagc ctctcctcca ccgagttcat ccccaacctg 2760
ttctgtatgt tactgctgat ccatagcgac gagcaccatc atgacgactc cctgccccat 2820
cctcagcagg ccacagacga ctccggccac gagagcgaca gcaatagcaa tgagggcagg 2880
caccatctgc tcgtgtccgg agctcaagtc cccgagcctc ccaccatcca tctcgccgcc 2940
cagggaatgg cttaccccct ccacgagcag cacggcatgg ccccttgtcc cgtcgctcaa 3000
gcccccccta cacctctgcc ctttttcgcc atttgtctga cctggagaat cgaggacccc 3060
cccttcaaca gcctgctgtt cgccctgctc gccgccgctg gcggcctcca gggcatttac 3120
gtcctcgtga tgctggtgct gctgatcctc gcttacagga gaagatggag gagactgaca 3180
gtgtgcggcg gcatcatgtt tctcgcctgc gtcctggtcc tgatcgtgga cgccgtcctg 3240
caactcagcc ccctcctggg agctgtgaca gtggtctcca tgaccctgct gctgctggcc 3300
ttcaacggac cccacgatcc tctgccccaa gatcctgaca ataccgacga taacggcccc 3360
caagaccccg ataacaccga cgacaatggc cctcacgacc ctctgcccca tagcccttcc 3420
gatagcgctg gcaacgatgg cggccctcct cagctgacag aggaggtgga aaataagggc 3480
ggcgatcagg gaccccccct gatgacagat ggcggaggag gacacagcca tgatagcgga 3540
catggcggag gcgatcccca tctgcctacc ctcctcctgg gcagctccgg ttctggaggc 3600
gacgatgatg accctcacgg ccctgtgcag ctctcctact acgacggcaa aaggaccgaa 3660
caaggaaaag aggtcctgga gaaggccagg ggcagcacat acggaacccc caggcctccc 3720
atgtccgatt ggaccggagg agccctgctg gtcctctaca gcttcgccct gatgctgatc 3780
attatcatcc tgatcatctt tatcttcaga agggacctgc tgtgccctct cggcgccctg 3840
tgcatcctgc tgctcatgat cacactcctc ctgatcgccc tctggaacct gcacggacaa 3900
gccctgatgt ccgatgaggg acctggaaca ggacccggaa acggactggg cgagaaggga 3960
gatacaagcg gccccgaagg cagcggcgga agcggacccc aaagaagggg cggcgacaac 4020
cacggaagag gaagaggcag gggcagaggc agaggaggag gaagacctgg agcccctggc 4080
ggttctggaa gcggacccag gcacagggac ggagtgagga ggcctcaaaa aagacccagc 4140
tgcatcggct gcaagggaac ccactggatt gatgataacc cctccacaga gaccgctcag 4200
gcctggaacg ccggcttcct gaggggaaga gcctatggca tcgatctgct gaggaccgag 4260
ggcgaacacg tggagggagc caccggagag acaagggagg aaagcgaaga cacagaaagc 4320
gatggcgacg acgaagacct gccctgcatt gtgtccaggg gcggacccaa ggtgaagagg 4380
ccccctatct ttatcagaag gctccataga ctgctcctga tgagggccat gaaccctgtg 4440
tgcctgcccg tgatcgtggc cccctacctc ttttggctgg ccgccattgc cgctagctgc 4500
ttcaccgcct ccgtgtccac agtggtgaca gccaccggcc tcgccctgag cctgctgctc 4560
ctcgctgccg tggcctccag ctacgccgct gctcaaagaa agctcctgac ccctgtcacc 4620
gtcctgacag ccgtcgtgac caccttttcc gctggcacct tcaagctgcc taggtgcaca 4680
cctggcgaca ggcagtggct ctacgtgcag agctccgtgg gcaatattgt gcagagctgc 4740
aatcccaggt acagcatttt tttcgactac atggccatcc ataggtccct caccaagatc 4800
tgggagtgat gatgagcggc cgcgatctgc tgtgccttct agttgccagc catctgttgt 4860
ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta 4920
ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg 4980
ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc 5040
ggtgggctct atggccgatc agcgatcgct gaggtgggtg agtgggcgtg gcctggggtg 5100
gtcatgaaaa tatataagtt gggggtctta gggtctcttt atttgtgttg cagagaccgc 5160
cggagccatg agcgggagca gcagcagcag cagtagcagc agcgccttgg atggcagcat 5220
cgtgagccct tatttgacga cgcggatgcc ccactgggcc ggggtgcgtc agaatgtgat 5280
gggctccagc atcgacggcc gacccgtcct gcccgcaaat tccgccacgc tgacctatgc 5340
gaccgtcgcg gggacgccgt tggacgccac cgccgccgcc gccgccaccg cagccgcctc 5400
ggccgtgcgc agcctggcca cggactttgc attcctggga ccactggcga caggggctac 5460
ttctcgggcc gctgctgccg ccgttcgcga tgacaagctg accgccctgc tggcgcagtt 5520
ggatgcgctt actcgggaac tgggtgacct ttctcagcag gtcatggccc tgcgccagca 5580
ggtctcctcc ctgcaagctg gcgggaatgc ttctcccaca aatgccgttt aagataaata 5640
aaaccagact ctgtttggat taaagaaaag tagcaagtgc attgctctct ttatttcata 5700
attttccgcg cgcgataggc cctagaccag cgttctcggt cgttgagggt gcggtgtatc 5760
ttctccagga cgtggtagag gtggctctgg acgttgagat acatgggcat gagcccgtcc 5820
cgggggtgga ggtagcacca ctgcagagct tcatgctccg gggtggtgtt gtagatgatc 5880
cagtcgtagc aggagcgctg ggcatggtgc ctaaaaatgt ccttcagcag caggccgatg 5940
gccaggggga ggcccttggt gtaagtgttt acaaaacggt taagttggga agggtgcatt 6000
cggggagaga tgatgtgcat cttggactgt atttttagat tggcgatgtt tccgcccaga 6060
tcccttctgg gattcatgtt gtgcaggacc accagtacag tgtatccggt gcacttgggg 6120
aatttgtcat gcagcttaga gggaaaagcg tggaagaact tggagacgcc tttgtggcct 6180
cccagatttt ccatgcattc gtccatgatg atggcaatgg gcccgcggga ggcagcttgg 6240
gcaaagatat ttctggggtc gctgacgtcg tagttgtgtt ccagggtgag gtcgtcatag 6300
gccattttta caaagcgcgg gcggagggtg cccgactggg ggatgatggt cccctctggc 6360
cctggggcgt agttgccctc gcagatctgc atttcccagg ccttaatctc ggagggggga 6420
atcatatcca cctgcggggc gatgaagaaa acggtttccg gagccgggga gattaactgg 6480
gatgagagca ggtttctaag cagctgtgat tttccacaac cggtgggccc ataaataaca 6540
cctataaccg gttgcagctg gtagtttaga gagctgcagc tgccgtcgtc ccggaggagg 6600
ggggccacct cgttgagcat gtccctgacg cgcatgttct ccccgaccag atccgccaga 6660
aggcgctcgc cgcccaggga cagcagctct tgcaaggaag caaagttttt cagcggcttg 6720
aggccgtccg ccgtgggcat gtttttcagg gtctggctca gcagctccag gcggtcccag 6780
agctcggtga cgtgctctac ggcatctcta tccagcatat ctcctcgttt cgcgggttgg 6840
ggcgactttc gctgtagggc accaagcggt ggtcgtccag cggggccaga gtcatgtcct 6900
tccatgggcg cagggtcctc gtcagggtgg tctgggtcac ggtgaagggg tgcgctccgg 6960
gctgagcgct tgccaaggtg cgcttgaggc tggttctgct ggtgctgaag cgctgccggt 7020
cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt gtcatagtcc agcccctccg 7080
cggcgtgtcc cttggcgcgc agcttgccct tggaggtggc gccgcacgag gggcagagca 7140
ggctcttgag cgcgtagagc ttgggggcga ggaagaccga ttcgggggag taggcgtccg 7200
cgccgcagac cccgcacacg gtctcgcact ccaccagcca ggtgagctcg gggcgcgccg 7260
ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt cttacctcgg gtctccatga 7320
ggtggtgtcc ccgctcggtg acgaagaggc tgtccgtgtc tccgtagacc gacttgaggg 7380
gtcttttctc caggggggtc cctcggtctt cctcgtagag gaactcggac cactctgaga 7440
cgaaggcccg cgtccaggcc aggacgaagg aggctatgtg ggaggggtag cggtcgttgt 7500
ccactagggg gtccaccttc tccaaggtgt gaagacacat gtcgccttcc tcggcgtcca 7560
ggaaggtgat tggcttgtag gtgtaggcca cgtgaccggg ggttcctgac gggggggtat 7620
aaaagggggt gggggcgcgc tcgtcgtcac tctcttccgc atcgctgtct gcgagggcca 7680
gctgctgggg tgagtattcc ctctcgaagg cgggcatgac ctccgcgctg aggttgtcag 7740
tttccaaaaa cgaggaggat ttgatgttca cctgtcccga ggtgatacct ttgagggtac 7800
ccgcgtccat ctggtcagaa aacacgatct ttttattgtc cagcttggtg gcgaacgacc 7860
cgtagagggc gttggagagc agcttggcga tggagcgcag ggtctggttc ttgtccctgt 7920
cggcgcgctc cttggccgcg atgttgagct gcacgtactc gcgcgcgacg cagcgccact 7980
cggggaagac ggtggtgcgc tcgtcgggca ccaggcgcac gcgccagccg cggttgtgca 8040
gggtgaccag gtccacgctg gtggcgacct cgccgcgcag gcgctcgttg gtccagcaga 8100
gacggccgcc cttgcgcgag cagaaggggg gcagggggtc gagctgggtc tcgtccgggg 8160
ggtccgcgtc cacggtgaaa accccggggc gcaggcgcgc gtcgaagtag tctatcttgc 8220
aaccttgcat gtccagcgcc tgctgccagt cgcgggcggc gagcgcgcgc tcgtaggggt 8280
tgagcggcgg gccccagggc atggggtggg tgagtgcgga ggcgtacatg ccgcagatgt 8340
catagacgta gaggggctcc cgcaggaccc cgatgtaggt ggggtagcag cggccgccgc 8400
ggatgctggc gcgcacgtag tcatacagct cgtgcgaggg ggcgaggagg tcggggccca 8460
ggttggtgcg ggcggggcgc tccgcgcgga agacgatctg cctgaagatg gcatgcgagt 8520
tggaagagat ggtggggcgc tggaagacgt tgaagctggc gtcctgcagg ccgacggcgt 8580
cgcgcacgaa ggaggcgtag gagtcgcgca gcttgtgtac cagctcggcg gtgacctgca 8640
cgtcgagcgc gcagtagtcg agggtctcgc ggatgatgtc atatttagcc tgccccttct 8700
ttttccacag ctcgcggttg aggacaaact cttcgcggtc tttccagtac tcttggatcg 8760
ggaaaccgtc cggttccgaa cggtaagagc ctagcatgta gaactggttg acggcctggt 8820
aggcgcagca gcccttctcc acggggaggg cgtaggcctg cgcggccttg cggagcgagg 8880
tgtgggtcag ggcgaaggtg tccctgacca tgactttgag gtactggtgc ttgaagtcgg 8940
agtcgtcgca gccgccccgc tcccagagcg agaagtcggt gcgcttcttg gagcgggggt 9000
tgggcagagc gaaggtgaca tcgttgaaga ggattttgcc cgcgcggggc atgaagttgc 9060
gggtgatgcg gaagggcccc ggcacttcag agcggttgtt gatgacctgg gcggcgagca 9120
cgatctcgtc gaagccgttg atgttgtggc ccacgatgta gagttccagg aagcggggcc 9180
ggccctttac ggtgggcagc ttctttagct cttcgtaggt gagctcctcg ggcgaggcga 9240
ggccgtgctc ggccagggcc cagtccgcga ggtgcgggtt gtctctgagg aaggacttcc 9300
agaggtcgcg ggccaggagg gtctgcaggc ggtctctgaa ggtcctgaac tggcggccca 9360
cggccatttt ttcgggggtg atgcagtaga aggtgagggg gtcttgctgc cagcggtccc 9420
agtcgagctg cagggcgagg tcgcgcgcgg cggtgaccag gcgctcgtcg cccccgaatt 9480
tcatgaccag catgaagggc acgagctgct ttccgaaggc ccccatccaa gtgtaggtct 9540
ctacatcgta ggtgacaaag aggcgctccg tgcgaggatg cgagccgatc gggaagaact 9600
ggatctcccg ccaccagttg gaggagtggc tgttgatgtg gtggaagtag aagtcccgtc 9660
gccgggccga acactcgtgc tggcttttgt aaaagcgagc gcagtactgg cagcgctgca 9720
cgggctgtac ctcatgcacg agatgcacct ttcgcccgcg cacgaggaag ccgaggggaa 9780
atctgagccc cccgcctggc tcgcggcatg gctggttctc ttctactttg gatgcgtgtc 9840
cgtctccgtc tggctcctcg aggggtgtta cggtggagcg gaccaccacg ccgcgcgagc 9900
cgcaggtcca gatatcggcg cgcggcggtc ggagtttgat gacgacatcg cgcagctggg 9960
agctgtccat ggtctggagc tcccgcggcg gcggcaggtc agccgggagt tcttgcaggt 10020
tcacctcgca gagtcgggcc agggcgcggg gcaggtctag gtggtacctg atctctaggg 10080
gcgtgttggt ggcggcgtcg atggcttgca ggagcccgca gccccggggg gcgacgacgg 10140
tgccccgcgg ggtggtggtg gtggtggcgg tgcagctcag aagcggtgcc gcgggcgggc 10200
ccccggaggt agggggggct ccggtcccgc gggcaggggc ggcagcggca cgtcggcgtg 10260
gagcgcgggc aggagttggt gctgtgcccg gaggttgctg gcgaaggcga cgacgcggcg 10320
gttgatctcc tggatctggc gcctctgcgt gaagacgacg ggcccggtga gcttgaacct 10380
gaaagagagt tcgacagaat caatctcggt gtcattgacc gcggcctggc gcaggatctc 10440
ctgcacgtct cccgagttgt cttggtaggc gatctcggcc atgaactgct cgatctcttc 10500
ctcctggagg tctccgcgtc cggcgcgttc cacggtggcc gccaggtcgt tggagatgcg 10560
ccccatgagc tgcgagaagg cgttgagtcc gccctcgttc cagactcggc tgtagaccac 10620
gcccccctgg tcatcgcggg cgcgcatgac cacctgcgcg aggttgagct ccacgtgccg 10680
cgcgaagacg gcgtagttgc gcagacgctg gaagaggtag ttgagggtgg tggcggtgtg 10740
ctcggccacg aagaagttca tgacccagcg gcgcaacgtg gattcgttga tgtcccccaa 10800
ggcctccagc cgttccatgg cctcgtagaa gtccacggcg aagttgaaaa actgggagtt 10860
gcgcgccgac acggtcaact cctcctccag aagacggatg agctcggcga cggtgtcgcg 10920
cacctcgcgc tcgaaggcta tggggatctc ttcctccgct agcatcacca cctcctcctc 10980
ttcctcctct tctggcactt ccatgatggc ttcctcctct tcggggggtg gcggcggcgg 11040
cggtggggga gggggcgctc tgcgccggcg gcggcgcacc gggaggcggt ccacgaagcg 11100
cgcgatcatc tccccgcggc ggcggcgcat ggtctcggtg acggcgcggc cgttctcccg 11160
ggggcgcagt tggaagacgc cgccggacat ctggtgctgg ggcgggtggc cgtgaggcag 11220
cgagacggcg ctgacgatgc atctcaacaa ttgctgcgta ggtacgccgc cgagggacct 11280
gagggagtcc atatccaccg gatccgaaaa cctttcgagg aaggcgtcta accagtcgca 11340
gtcgcaaggt aggctgagca ccgtggcggg cggcgggggg tggggggagt gtctggcgga 11400
ggtgctgctg atgatgtaat tgaagtaggc ggacttgaca cggcggatgg tcgacaggag 11460
caccatgtcc ttgggtccgg cctgctggat gcggaggcgg tcggctatgc cccaggcttc 11520
gttctggcat cggcgcaggt ccttgtagta gtcttgcatg agcctttcca ccggcacctc 11580
ttctccttcc tcttctgctt cttccatgtc tgcttcggcc ctggggcggc gccgcgcccc 11640
cctgcccccc atgcgcgtga ccccgaaccc cctgagcggt tggagcaggg ccaggtcggc 11700
gacgacgcgc tcggccagga tggcctgctg cacctgcgtg agggtggttt ggaagtcatc 11760
caagtccacg aagcggtggt aggcgcccgt gttgatggtg taggtgcagt tggccatgac 11820
ggaccagttg acggtctggt ggcccggttg cgacatctcg gtgtacctga gtcgcgagta 11880
ggcgcgggag tcgaagacgt agtcgttgca agtccgcacc aggtactggt agcccaccag 11940
gaagtgcggc ggcggctggc ggtagagggg ccagcgcagg gtggcggggg ctccgggggc 12000
caggtcttcc agcatgaggc ggtggtaggc gtagatgtac ctggacatcc aggtgatacc 12060
cgcggcggtg gtggaggcgc gcgggaagtc gcgcacccgg ttccagatgt tgcgcagggg 12120
cagaaagtgc tccatggtag gcgtgctctg tccagtcaga cgcgcgcagt cgttgatact 12180
ctagaccagg gaaaacgaaa gccggtcagc gggcactctt ccgtggtctg gtgaatagat 12240
cgcaagggta tcatggcgga gggcctcggt tcgagccccg ggtccgggcc ggacggtccg 12300
ccatgatcca cgcggttacc gcccgcgtgt cgaacccagg tgtgcgacgt cagacaacgg 12360
tggagtgttc cttttggcgt ttttctggcc gggcgccggc gccgcgtaag agactaagcc 12420
gcgaaagcga aagcagtaag tggctcgctc cccgtagccg gagggatcct tgctaagggt 12480
tgcgttgcgg cgaaccccgg ttcgaatccc gtactcgggc cggccggacc cgcggctaag 12540
gtgttggatt ggcctccccc tcgtataaag accccgcttg cggattgact ccggacacgg 12600
ggacgagccc cttttatttt tgctttcccc agatgcatcc ggtgctgcgg cagatgcgcc 12660
ccccgcccca gcagcagcaa caacaccagc aagagcggca gcaacagcag cgggagtcat 12720
gcagggcccc ctcacccacc ctcggcgggc cggccacctc ggcgtccgcg gccgtgtctg 12780
gcgcctgcgg cggcggcggg gggccggctg acgaccccga ggagcccccg cggcgcaggg 12840
ccagacacta cctggacctg gaggagggcg agggcctggc gcggctgggg gcgccgtctc 12900
ccgagcgcca cccgcgggtg cagctgaagc gcgactcgcg cgaggcgtac gtgcctcggc 12960
agaacctgtt cagggaccgc gcgggcgagg agcccgagga gatgcgggac aggaggttca 13020
gcgcagggcg ggagctgcgg caggggctga accgcgagcg gctgctgcgc gaggaggact 13080
ttgagcccga cgcgcggacg gggatcagcc ccgcgcgcgc gcacgtggcg gccgccgacc 13140
tggtgacggc gtacgagcag acggtgaacc aggagatcaa cttccaaaag agtttcaaca 13200
accacgtgcg cacgctggtg gcgcgcgagg aggtgaccat cgggctgatg cacctgtggg 13260
actttgtaag cgcgctggtg cagaacccca acagcaagcc tctgacggcg cagctgttcc 13320
tgatagtgca gcacagcagg gacaacgagg cgtttaggga cgcgctgctg aacatcaccg 13380
agcccgaggg tcggtggctg ctggacctga ttaacatcct gcagagcata gtggtgcagg 13440
agcgcagcct gagcctggcc gacaaggtgg cggccatcaa ctactcgatg ctgagcctgg 13500
gcaagtttta cgcgcgcaag atctaccaga cgccgtacgt gcccatagac aaggaggtga 13560
agatcgacgg tttttacatg cgcatggcgc tgaaggtgct caccctgagc gacgacctgg 13620
gcgtgtaccg caacgagcgc atccacaagg ccgtgagcgt gagccggcgg cgcgagctga 13680
gcgaccgcga gctgatgcac agcctgcagc gggcgctggc gggcgccggc agcggcgaca 13740
gggaggcgga gtcctacttc gatgcggggg cggacctgcg ctgggcgccc agccggcggg 13800
ccctggaggc cgcgggggtc cgcgaggact atgacgagga cggcgaggag gatgaggagt 13860
acgagctaga ggagggcgag tacctggact aaaccgcggg tggtgtttcc ggtagatgca 13920
agacccgaac gtggtggacc cggcgctgcg ggcggctctg cagagccagc cgtccggcct 13980
taactcctca gacgactggc gacaggtcat ggaccgcatc atgtcgctga cggcgcgtaa 14040
cccggacgcg ttccggcagc agccgcaggc caacaggctc tccgccatcc tggaggcggt 14100
ggtgcctgcg cgctcgaacc ccacgcacga gaaggtgctg gccatagtga acgcgctggc 14160
cgagaacagg gccatccgcc cggacgaggc cgggctggtg tacgacgcgc tgctgcagcg 14220
cgtggcccgc tacaacagcg gcaacgtgca gaccaacctg gaccggctgg tgggggacgt 14280
gcgcgaggcg gtggcgcagc gcgagcgcgc ggatcggcag ggcaacctgg gctccatggt 14340
ggcgctgaat gccttcctga gcacgcagcc ggccaacgtg ccgcgggggc aggaagacta 14400
caccaacttt gtgagcgcgc tgcggctgat ggtgaccgag accccccaga gcgaggtgta 14460
ccagtcgggc ccggactact tcttccagac cagcagacag ggcctgcaga cggtgaacct 14520
gagccaggct ttcaagaacc tgcgggggct gtggggcgtg aaggcgccca ccggcgaccg 14580
ggcgacggtg tccagcctgc tgacgcccaa ctcgcgcctg ctgctgctgc tgatcgcgcc 14640
gttcacggac agcggcagcg tgtcccggga cacctacctg gggcacctgc tgaccctgta 14700
ccgcgaggcc atcgggcagg cgcaggtgga cgagcacacc ttccaggaga tcaccagcgt 14760
gagccgcgcg ctggggcagg aggacacgag cagcctggag gcgactctga actacctgct 14820
gaccaaccgg cggcagaaga ttccctcgct gcacagcctg acctccgagg aggagcgcat 14880
cttgcgctac gtgcagcaga gcgtgagcct gaacctgatg cgcgacgggg tgacgcccag 14940
cgtggcgctg gacatgaccg cgcgcaacat ggaaccgggc atgtacgccg cgcaccggcc 15000
ttacatcaac cgcctgatgg actacctgca tcgcgcggcg gccgtgaacc ccgagtactt 15060
taccaacgcc atcctgaacc cgcactggct cccgccgccc gggttctaca gcgggggctt 15120
cgaggtcccg gagaccaacg atggcttcct gtgggacgac atggacgaca gcgtgttctc 15180
cccgcggccg caggcgctgg cggaagcgtc cctgctgcgt cccaagaagg aggaggagga 15240
ggaggcgagt cgccgccgcg gcagcagcgg cgtggcttct ctgtccgagc tgggggcggc 15300
agccgccgcg cgccccgggt ccctgggcgg cagccccttt ccgagcctgg tggggtctct 15360
gcacagcgag cgcaccaccc gccctcggct gctgggcgag gacgagtacc tgaataactc 15420
cctgctgcag ccggtgcggg agaaaaacct gcctcccgcc ttccccaaca acgggataga 15480
gagcctggtg gacaagatga gcagatggaa gacctatgcg caggagcaca gggacgcgcc 15540
tgcgctccgg ccgcccacgc ggcgccagcg ccacgaccgg cagcgggggc tggtgtggga 15600
tgacgaggac tccgcggacg atagcagcgt gctggacctg ggagggagcg gcaacccgtt 15660
cgcgcacctg cgcccccgcc tggggaggat gttttaaaaa aaaaaaaaaa angcaagaag 15720
catgatgcaa aaattaaata aaactcacca aggccatggc gaccgagcgt tggtttcttg 15780
tgttcccttc agtatgcggc gcgcggcgat gtaccaggag ggacctcctc cctcttacga 15840
gagcgtggtg ggcgcggcgg cggcggcgcc ctcttctccc tttgcgtcgc agctgctgga 15900
gccgccgtac gtgcctccgc gctacctgcg gcctacgggg gggagaaaca gcatccgtta 15960
ctcggagctg gcgcccctgt tcgacaccac ccgggtgtac ctggtggaca acaagtcggc 16020
ggacgtggcc tccctgaact accagaacga ccacagcaat tttttgacca cggtcatcca 16080
gaacaatgac tacagcccga gcgaggccag cacccagacc atcaatctgg atgaccggtc 16140
gcactggggc ggcgacctga aaaccatcct gcacaccaac atgcccaacg tgaacgagtt 16200
catgttcacc aataagttca aggcgcgggt gatggtgtcg cgctcgcaca ccaaggaaga 16260
ccgggtggag ctgaagtacg agtgggtgga gttcgagctg ccagagggca actactccga 16320
gaccatgacc attgacctga tgaacaacgc gatcgtggag cactatctga aagtgggcag 16380
gcagaacggg gtcctggaga gcgacatcgg ggtcaagttc gacaccagga acttccgcct 16440
ggggctggac cccgtgaccg ggctggttat gcccggggtg tacaccaacg aggccttcca 16500
tcccgacatc atcctgctgc ccggctgcgg ggtggacttc acttacagcc gcctgagcaa 16560
cctcctgggc atccgcaagc ggcagccctt ccaggagggc ttcaggatca cctacgagga 16620
cctggagggg ggcaacatcc ccgcgctcct cgatgtggag gcctaccagg atagcttgaa 16680
ggaaaatgag gcgggacagg aggataccgc ccccgccgcc tccgccgccg ccgagcaggg 16740
cgaggatgct gctgacaccg cggccgcgga cggggcagag gccgaccccg ctatggtggt 16800
ggaggctccc gagcaggagg aggacatgaa tgacagtgcg gtgcgcggag acaccttcgt 16860
cacccggggg gaggaaaagc aagcggaggc cgaggccgcg gccgaggaaa agcaactggc 16920
ggcagcagcg gcggcggcgg cgttggccgc ggcggaggct gagtctgagg ggaccaagcc 16980
cgccaaggag cccgtgatta agcccctgac cgaagatagc aagaagcgca gttacaacct 17040
gctcaaggac agcaccaaca ccgcgtaccg cagctggtac ctggcctaca actacggcga 17100
cccgtcgacg ggggtgcgct cctggaccct gctgtgcacg ccggacgtga cctgcggctc 17160
ggagcaggtg tactggtcgc tgcccgacat gatgcaagac cccgtgacct tccgctccac 17220
gcggcaggtc agcaacttcc cggtggtggg cgccgagctg ctgcccgtgc actccaagag 17280
cttctacaac gaccaggccg tctactccca gctcatccgc cagttcacct ctctgaccca 17340
cgtgttcaat cgctttcctg agaaccagat tctggcgcgc ccgcccgccc ccaccatcac 17400
caccgtcagt gaaaacgttc ctgctctcac agatcacggg acgctaccgc tgcgcaacag 17460
catcggagga gtccagcgag tgaccgttac tgacgccaga cgccgcacct gcccctacgt 17520
ttacaaggcc ttgggcatag tctcgccgcg cgtcctttcc agccgcactt tttgagcaac 17580
accaccatca tgtccatcct gatctcaccc agcaataact ccggctgggg actgctgcgc 17640
gcgcccagca agatgttcgg aggggcgagg aagcgttccg agcagcaccc cgtgcgcgtg 17700
cgcgggcact tccgcgcccc ctggggagcg cacaaacgcg gccgcgcggg gcgcaccacc 17760
gtggacgacg ccatcgactc ggtggtggag caggcgcgca actacaggcc cgcggtctct 17820
accgtggacg cggccatcca gaccgtggtg cggggcgcgc ggcggtacgc caagctgaag 17880
agccgccgga agcgcgtggc ccgccgccac cgccgccgac ccggggccgc cgccaaacgc 17940
gccgccgcgg ccctgcttcg ccgggccaag cgcacgggcc gccgcgccgc catgagggcc 18000
gcgcgccgct tggccgccgg catcaccgcc gccaccatgg ccccccgtac ccgaagacgc 18060
gcggccgccg ccgccgccgc cgccatcagt gacatggcca gcaggcgccg gggcaacgtg 18120
tactgggtgc gcgactcggt gaccggcacg cgcgtgcccg tgcgcttccg ccccccgcgg 18180
acttgagatg atgtgaaaaa acaacactga gtctcctgct gttgtgtgta tcccagcggc 18240
ggcggcgcgc gcagcgtcat gtccaagcgc aaaatcaaag aagagatgct ccaggtcgtc 18300
gcgccggaga tctatgggcc cccgaagaag gaagagcagg attcgaagcc ccgcaagata 18360
aagcgggtca aaaagaaaaa gaaagatgat gacgatgccg atggggaggt ggagttcctg 18420
cgcgccacgg cgcccaggcg cccggtgcag tggaagggcc ggcgcgtaaa gcgcgtcctg 18480
cgccccggca ccgcggtggt cttcacgccc ggcgagcgct ccacccggac tttcaagcgc 18540
gtctatgacg aggtgtacgg cgacgaagac ctgctggagc aggccaacga gcgcttcgga 18600
gagtttgctt acgggaagcg tcagcgggcg ctggggaagg aggacctgct ggcgctgccg 18660
ctggaccagg gcaaccccac ccccagtctg aagcccgtga ccctgcagca ggtgctgccg 18720
agcagcgcac cctccgaggc gaagcggggt ctgaagcgcg agggcggcga cctggcgccc 18780
accgtgcagc tcatggtgcc caagcggcag aggctggagg atgtgctgga gaaaatgaaa 18840
gtagaccccg gtctgcagcc ggacatcagg gtccgcccca tcaagcaggt ggcgccgggc 18900
ctcggcgtgc agaccgtgga cgtggtcatc cccaccggca actcccccgc cgccgccacc 18960
actaccgctg cctccacgga catggagaca cagaccgatc ccgccgcagc cgcagccgca 19020
gccgccgccg cgacctcctc ggcggaggtg cagacggacc cctggctgcc gccggcgatg 19080
tcagctcccc gcgcgcgtcg cgggcgcagg aagtacggcg ccgccaacgc gctcctgccc 19140
gagtacgcct tgcatccttc catcgcgccc acccccggct accgaggcta tacctaccgc 19200
ccgcgaagag ccaagggttc cacccgccgt ccccgccgac gcgccgccgc caccacccgc 19260
cgccgccgcc gcagacgcca gcccgcactg gctccagtct ccgtgaggaa agtggcgcgc 19320
gacggacaca ccctggtgct gcccagggcg cgctaccacc ccagcatcgt ttaaaagcct 19380
gttgtggttc ttgcagatat ggccctcact tgccgcctcc gtttcccggt gccgggatac 19440
cgaggaggaa gatcgcgccg caggaggggt ctggccggcc gcggcctgag cggaggcagc 19500
cgccgcgcgc accggcggcg acgcgccacc agccgacgca tgcgcggcgg ggtgctgccc 19560
ctgttaatcc ccctgatcgc cgcggcgatc ggcgccgtgc ccgggatcgc ctccgtggcc 19620
ttgcaagcgt cccagaggca ttgacagact tgcaaacttg caaatatgga aaaaaaaacc 19680
ccaataaaaa agtctagact ctcacgctcg cttggtcctg tgactatttt gtagaatgga 19740
agacatcaac tttgcgtcgc tggccccgcg tcacggctcg cgcccgttcc tgggacactg 19800
gaacgatatc ggcaccagca acatgagcgg tggcgccttc agttggggct ctctgtggag 19860
cggcattaaa agtatcgggt ctgccgttaa aaattacggc tcccgggcct ggaacagcag 19920
cacgggccag atgttgagag acaagttgaa agagcagaac ttccagcaga aggtggtgga 19980
gggcctggcc tccggcatca acggggtggt ggacctggcc aaccaggccg tgcagaataa 20040
gatcaacagc agactggacc cccggccgcc ggtggaggag gtgccgccgg cgctggagac 20100
ggtgtccccc gatgggcgtg gcgagaagcg cccgcggccc gatagggaag agaccactct 20160
ggtcacgcag accgatgagc cgcccccgta tgaggaggcc ctgaagcaag gtctgcccac 20220
cacgcggccc atcgcgccca tggccaccgg ggtggtgggc cgccacaccc ccgccacgct 20280
ggacttgcct ccgcccgccg atgtgccgca gcagcagaag gcggcacagc cgggcccgcc 20340
cgcgaccgcc tcccgttcct ccgccggtcc tctgcgccgc gcggccagcg gcccccgcgg 20400
gggggtcgcg aggcacggca actggcagag cacgctgaac agcatcgtgg gtctgggggt 20460
gcggtccgtg aagcgccgcc gatgctactg aatagcttag ctaacgtgtt gtatgtgtgt 20520
atgcgcccta tgtcgccgcc agaggagctg ctgagtcgcc gccgttcgcg cgcccaccac 20580
caccgccact ccgcccctca agatggcgac cccatcgatg atgccgcagt ggtcgtacat 20640
gcacatctcg ggccaggacg cctcggagta cctgagcccc gggctggtgc agttcgcccg 20700
cgccaccgag agctacttca gcctgagtaa caagtttagg aaccccacgg tggcgcccac 20760
gcacgatgtg accaccgacc ggtctcagcg cctgacgctg cggttcattc ccgtggaccg 20820
cgaggacacc gcgtactcgt acaaggcgcg gttcaccctg gccgtgggcg acaaccgcgt 20880
gctggacatg gcctccacct actttgacat ccgcggggtg ctggaccggg gtcccacttt 20940
caagccctac tctggcaccg cctacaactc cctggccccc aagggcgctc ccaactcctg 21000
cgagtgggag caagaggaaa ctcaggcagt tgaagaagca gcagaagagg aagaagaaga 21060
tgctgacggt caagctgagg aagagcaagc agctaccaaa aagactcatg tatatgctca 21120
ggctcccctt tctggcgaaa aaattagtaa agatggtctg caaataggaa cggacgctac 21180
agctacagaa caaaaaccta tttatgcaga ccctacattc cagcccgaac cccaaatcgg 21240
ggagtcccag tggaatgagg cagatgctac agtcgccggc ggtagagtgc taaagaaatc 21300
tactcccatg aaaccatgct atggttccta tgcaagaccc acaaatgcta atggaggtca 21360
gggtgtacta acggcaaatg cccagggaca gctagaatct caggttgaaa tgcaattctt 21420
ttcaacttct gaaaacgccc gtaacgaggc taacaacatt cagcccaaat tggtgctgta 21480
tagtgaggat gtgcacatgg agaccccgga tacgcacctt tcttacaagc ccgcaaaaag 21540
cgatgacaat tcaaaaatca tgctgggtca gcagtccatg cccaacagac ctaattacat 21600
cggcttcaga gacaacttta tcggcctcat gtattacaat agcactggca acatgggagt 21660
gcttgcaggt caggcctctc agttgaatgc agtggtggac ttgcaagaca gaaacacaga 21720
actgtcctac cagctcttgc ttgattccat gggtgacaga accagatact tttccatgtg 21780
gaatcaggca gtggacagtt atgacccaga tgttagaatt attgaaaatc atggaactga 21840
agacgagctc cccaactatt gtttccctct gggtggcata ggggtaactg acacttacca 21900
ggctgttaaa accaacaatg gcaataacgg gggccaggtg acttggacaa aagatgaaac 21960
ttttgcagat cgcaatgaaa taggggtggg aaacaatttc gctatggaga tcaacctcag 22020
tgccaacctg tggagaaact tcctgtactc caacgtggcg ctgtacctac cagacaagct 22080
taagtacaac ccctccaatg tggacatctc tgacaacccc aacacctacg attacatgaa 22140
caagcgagtg gtggccccgg ggctggtgga ctgctacatc aacctgggcg cgcgctggtc 22200
gctggactac atggacaacg tcaacccctt caaccaccac cgcaatgcgg gcctgcgcta 22260
ccgctccatg ctcctgggca acgggcgcta cgtgcccttc cacatccagg tgccccagaa 22320
gttctttgcc atcaagaacc tcctcctcct gccgggctcc tacacctacg agtggaactt 22380
caggaaggat gtcaacatgg tcctccagag ctctctgggt aacgatctca gggtggacgg 22440
ggccagcatc aagttcgaga gcatctgcct ctacgccacc ttcttcccca tggcccacaa 22500
cacggcctcc acgctcgagg ccatgctcag gaacgacacc aacgaccagt ccttcaatga 22560
ctacctctcc gccgccaaca tgctctaccc catacccgcc aacgccacca acgtccccat 22620
ctccatcccc tcgcgcaact gggcggcctt ccgcggctgg gccttcaccc gcctcaagac 22680
caaggagacc ccctccctgg gctcgggatt cgacccctac tacacctact cgggctccat 22740
tccctacctg gacggcacct tctacctcaa ccacactttc aagaaggtct cggtcacctt 22800
cgactcctcg gtcagctggc cgggcaacga ccgtctgctc acccccaacg agttcgagat 22860
caagcgctcg gtcgacgggg agggctacaa cgtggcccag tgcaacatga ccaaggactg 22920
gttcctggtc cagatgctgg ccaactacaa catcggctac cagggcttct acatcccaga 22980
gagctacaag gacaggatgt actccttctt caggaacttc cagcccatga gccggcaggt 23040
ggtggaccag accaagtaca aggactacca ggaggtgggc atcatccacc agcacaacaa 23100
ctcgggcttc gtgggctacc tcgcccccac catgcgcgag ggacaggcct accccgccaa 23160
cttcccctat ccgctcatag gcaagaccgc ggtcgacagc atcacccaga aaaagttcct 23220
ctgcgaccgc accctctggc gcatcccctt ctccagcaac ttcatgtcca tgggtgcgct 23280
ctcggacctg ggccagaact tgctctacgc caactccgcc cacgccctcg acatgacctt 23340
cgaggtcgac cccatggacg agcccaccct tctctatgtt ctgttcgaag tctttgacgt 23400
ggtccgggtc caccagccgc accgcggcgt catcgagacc gtgtacctgc gtacgccctt 23460
ctcggccggc aacgccacca cctaaagaag caagccgcag tcatcgccgc ctgcatgccg 23520
tcgggttcca ccgagcaaga gctcagggcc atcgtcagag acctgggatg cgggccctat 23580
tttttgggca ccttcgacaa gcgcttccct ggctttgtct ccccacacaa gctggcctgc 23640
gccatcgtca acacggccgg ccgcgagacc gggggcgtgc actggctggc cttcgcctgg 23700
aacccgcgct ccaaaacatg cttcctcttt gaccccttcg gcttttcgga ccagcggctc 23760
aagcaaatct acgagttcga gtacgagggc ttgctgcgtc gcagcgccat cgcctcctcg 23820
cccgaccgct gcgtcaccct cgaaaagtcc acccagaccg tgcaggggcc cgactcggcc 23880
gcctgcggtc tcttctgctg catgtttctg cacgcctttg tgcactggcc tcagagtccc 23940
atggaccgca accccaccat gaacttgctg acgggggtgc ccaactccat gctccagagc 24000
ccccaggtcg agcccaccct gcgccgcaac caggagcagc tctacagctt cctggagcgc 24060
cactcgcctt acttccgccg ccacagcgca cagatcagga gggccacctc cttctgccac 24120
ttgcaagaga tgcaagaagg gtaataacga tgtacacact ttttttctca ataaatggca 24180
tctttttatt tatacaagct ctctggggta ttcatttccc accaccaccc gccgttgtcg 24240
ccatctggct ctatttagaa atcgaaaggg ttctgccggg agtcgccgtg cgccacgggc 24300
agggacacgt tgcgatactg gtagcgggtg ccccacttga actcgggcac caccaggcga 24360
ggcagctcgg ggaagttttc gctccacagg ctgcgggtca gcaccagcgc gttcatcagg 24420
tcgggcgccg agatcttgaa gtcgcagttg gggccgccgc cctgcgcgcg cgagttgcgg 24480
tacaccgggt tgcagcactg gaacaccaac agcgccgggt gcttcacgct ggccagcacg 24540
ctgcggtcgg agatcagctc ggcgtccagg tcctccgcgt tgctcagcgc gaacggggtc 24600
atcttgggca cttgccgccc caggaagggc gcgtgccccg gtttcgagtt gcagtcgcag 24660
cgcagcggga tcagcaggtg cccgtgcccg gactcggcgt tggggtacag cgcgcgcatg 24720
aaggcctgca tctggcggaa ggccatctgg gccttggcgc cctccgagaa gaacatgccg 24780
caggacttgc ccgagaactg gtttgcgggg cagctggcgt cgtgcaggca gcagcgcgcg 24840
tcggtgttgg cgatctgcac cacgttgcgc ccccaccggt tcttcacgat cttggccttg 24900
gacgattgct ccttcagcgc gcgctgcccg ttctcgctgg tcacatccat ctcgatcaca 24960
tgttccttgt tcaccatgct gctgccgtgc agacacttca gctcgccctc cgtctcggtg 25020
cagcggtgct gccacagcgc gcagcccgtg ggctcgaaag acttgtaggt cacctccgcg 25080
aaggactgca ggtacccctg caaaaagcgg cccatcatgg tcacgaaggt cttgttgctg 25140
ctgaaggtca gctgcagccc gcggtgctcc tcgttcagcc aggtcttgca cacggccgcc 25200
agcgcctcca cctggtcggg cagcatcttg aagttcacct tcagctcatt ctccacgtgg 25260
tacttgtcca tcagcgtgcg cgccgcctcc atgcccttct cccaggccga caccagcggc 25320
aggctcacgg ggttcttcac catcaccgtg gccgccgcct ccgccgcgct ttcgctttcc 25380
gccccgctgt tctcttcctc ttcctcctct tcctcgccgc cgcccactcg cagcccccgc 25440
accacggggt cgtcttcctg caggcgctgc accttgcgct tgccgttgcg cccctgcttg 25500
atgcgcacgg gcgggttgct gaagcccacc atcaccagcg cggcctcttc ttgctcgtcc 25560
tcgctgtcca gaatgacctc cggggagggg gggttggtca tcctcagtac cgaggcacgc 25620
ttctttttct tcctgggggc gttcgccagc tccgcggctg cggccgctgc cgaggtcgaa 25680
ggccgagggc tgggcgtgcg cggcaccagc gcgtcctgcg agccgtcctc gtcctcctcg 25740
gactcgagac ggaggcgggc ccgcttcttc gggggcgcgc ggggcggcgg aggcggcggc 25800
ggcgacggag acggggacga gacatcgtcc agggtgggtg gacggcgggc cgcgccgcgt 25860
ccgcgctcgg gggtggtctc gcgctggtcc tcttcccgac tggccatctc ccactgctcc 25920
ttctcctata ggcagaaaga gatcatggag tctctcatgc gagtcgagaa ggaggaggac 25980
agcctaaccg ccccctctga gccctccacc accgccgcca ccaccgccaa tgccgccgcg 26040
gacgacgcgc ccaccgagac caccgccagt accaccctcc ccagcgacgc acccccgctc 26100
gagaatgaag tgctgatcga gcaggacccg ggttttgtga gcggagagga ggatgaggtg 26160
gatgagaagg agaaggagga ggtcgccgcc tcagtgccaa aagaggataa aaagcaagac 26220
caggacgacg cagataagga tgagacagca gtcgggcggg ggaacggaag ccatgatgct 26280
gatgacggct acctagacgt gggagacgac gtgctgctta agcacctgca ccgccagtgc 26340
gtcatcgtct gcgacgcgct gcaggagcgc tgcgaagtgc ccctggacgt ggcggaggtc 26400
agccgcgcct acgagcggca cctcttcgcg ccgcacgtgc cccccaagcg ccgggagaac 26460
ggcacctgcg agcccaaccc gcgtctcaac ttctacccgg tcttcgcggt acccgaggtg 26520
ctggccacct accacatctt tttccaaaac tgcaagatcc ccctctcctg ccgcgccaac 26580
cgcacccgcg ccgacaaaac cctgaccctg cggcagggcg cccacatacc tgatatcgcc 26640
tctctggagg aagtgcccaa gatcttcgag ggtctcggtc gcgacgagaa acgggcggcg 26700
aacgctctgc acggagacag cgaaaacgag agtcactcgg gggtgctggt ggagctcgag 26760
ggcgacaacg cgcgcctggc cgtactcaag cgcagcatag aggtcaccca ctttgcctac 26820
ccggcgctca acctgccccc caaggtcatg agtgtggtca tgggcgagct catcatgcgc 26880
cgcgcccagc ccctggccgc ggatgcaaac ttgcaagagt cctccgagga aggcctgccc 26940
gcggtcagcg acgagcagct ggcgcgctgg ctggagaccc gcgaccccgc gcagctggag 27000
gagcggcgca agctcatgat ggccgcggtg ctggtcaccg tggagctcga gtgtctgcag 27060
cgcttcttcg cggaccccga gatgcagcgc aagctcgagg agaccctgca ctacaccttc 27120
cgccagggct acgtgcgcca ggcctgcaag atctccaacg tggagctctg caacctggtc 27180
tcctacctgg gcatcctgca cgagaaccgc ctcgggcaga acgtcctgca ctccaccctc 27240
aaaggggagg cgcgccgcga ctacatccgc gactgcgcct acctcttcct ctgctacacc 27300
tggcagacgg ccatgggggt ctggcagcag tgcctggagg agcgcaacct caaggagctg 27360
gaaaagctcc tcaagcgcac cctcagggac ctctggacgg gcttcaacga gcgctcggtg 27420
gccgccgcgc tggcggacat catctttccc gagcgcctgc tcaagaccct gcagcagggc 27480
ctgcccgact tcaccagcca gagcatgctg cagaacttca ggactttcat cctggagcgc 27540
tcgggcatcc tgccggccac ttgctgcgcg ctgcccagcg acttcgtgcc catcaagtac 27600
agggagtgcc cgccgccgct ctggggccac tgctacctct tccagctggc caactacctc 27660
gcctaccact cggacctcat ggaagacgtg agcggcgagg gcctgctcga gtgccactgc 27720
cgctgcaacc tctgcacgcc ccaccgctct ctagtctgca acccgcagct gctcagcgag 27780
agtcagatta tcggtacctt cgagctgcag ggtccctcgc ctgacgagaa gtccgcggct 27840
ccagggctga aactcactcc ggggctgtgg acttccgcct acctacgcaa atttgtacct 27900
gaggactacc acgcccacga gatcaggttc tacgaagacc aatcccgccc gcccaaggcg 27960
gagctcaccg cctgcgtcat cacccagggg cacatcctgg gccaattgca agccatcaac 28020
aaagcccgcc gagagttctt gctgaaaaag ggtcgggggg tgtacctgga cccccagtcc 28080
ggcgaggagc taaacccgct acccccgccg ccgccccagc agcgggacct tgcttcccag 28140
gatggcaccc agaaagaagc agcagccgcc gccgccgccg cagccataca tgcttctgga 28200
ggaagaggag gaggactggg acagtcaggc agaggaggtt tcggacgagg agcaggagga 28260
gatgatggaa gactgggagg aggacagcag cctagacgag gaagcttcag aggccgaaga 28320
ggtggcagac gcaacaccat cgccctcggt cgcagccccc tcgccggggc ccctgaaatc 28380
ctccgaaccc agcaccagcg ctataacctc cgctcctccg gcgccggcgc cacccgcccg 28440
cagacccaac cgtagatggg acaccacagg aaccggggtc ggtaagtcca agtgcccgcc 28500
gccgccaccg cagcagcagc agcagcagcg ccagggctac cgctcgtggc gcgggcacaa 28560
gaacgccata gtcgcctgct tgcaagactg cgggggcaac atctctttcg cccgccgctt 28620
cctgctattc caccacgggg tcgcctttcc ccgcaatgtc ctgcattact accgtcatct 28680
ctacagcccc tactgcagcg gcgacccaga ggcggcagcg gcagccacag cggcgaccac 28740
cacctaggaa gatatcctcc gcgggcaaga cagcggcagc agcggccagg agacccgcgg 28800
cagcagcggc gggagcggtg ggcgcactgc gcctctcgcc caacgaaccc ctctcgaccc 28860
gggagctcag acacaggatc ttccccactt tgtatgccat cttccaacag agcagaggcc 28920
aggagcagga gctgaaaata aaaaacagat ctctgcgctc cctcacccgc agctgtctgt 28980
atcacaaaag cgaagatcag cttcggcgca cgctggagga cgcggaggca ctcttcagca 29040
aatactgcgc gctcactctt aaagactagc tccgcgccct tctcgaattt aggcgggaga 29100
aaactacgtc atcgccggcc gccgcccagc ccgcccagcc gagatgagca aagagattcc 29160
cacgccatac atgtggagct accagccgca gatgggactc gcggcgggag cggcccagga 29220
ctactccacc cgcatgaact acatgagcgc gggaccccac atgatctcac aggtcaacgg 29280
gatccgcgcc cagcgaaacc aaatactgct ggaacaggcg gccatcaccg ccacgccccg 29340
ccataatctc aacccccgaa attggcccgc cgccctcgtg taccaggaaa ccccctccgc 29400
caccaccgta ctacttccgc gtgacgccca ggccgaagtc cagatgacta actcaggggc 29460
gcagctcgcg ggcggctttc gtcacggggc gcggccgctc cgaccaggta taagacacct 29520
gatgatcaga ggccgaggta tccagctcaa cgacgagtcg gtgagctctt cgctcggtct 29580
ccgtccggac ggaactttcc agctcgccgg atccggccgc tcttcgttca cgccccgcca 29640
ggcgtacctg actctgcaga cctcgtcctc ggagccccgc tccggcggca tcggaaccct 29700
ccagttcgtg gaggagttcg tgccctcggt ctacttcaac cccttctcgg gacctcccgg 29760
acgctacccc gaccagttca ttccgaactt tgacgcggtg aaggactcgg cggacggcta 29820
cgactgaatg tcaggtgtcg aggcagagca gcttcgcctg agacacctcg agcactgccg 29880
ccgccacaag tgcttcgccc gcggttctgg tgagttctgc tactttcagc tacccgagga 29940
gcataccgag gggccggcgc acggcgtccg cctgaccacc cagggcgagg ttacctgttc 30000
cctcatccgg gagtttaccc tccgtcccct gctagtggag cgggagcggg gtccctgtgt 30060
cctaactatc gcctgcaact gccctaaccc tggattacat caagatcttt gctgtcatct 30120
ctgtgctgag tttaataaac gctgagatca gaatctactg gggctcctgt cgccatcctg 30180
tgaacgccac cgtcttcacc caccccgacc aggcccaggc gaacctcacc tgcggtctgc 30240
atcggagggc caagaagtac ctcacctggt acttcaacgg cacccccttt gtggtttaca 30300
acagcttcga cggggacgga gtctccctga aagaccagct ctccggtctc agctactcca 30360
tccacaagaa caccaccctc caactcttcc ctccctacct gccgggaacc tacgagtgcg 30420
tcaccggccg ctgcacccac ctcacccgcc tgatcgtaaa ccagagcttt ccgggaacag 30480
ataactccct cttccccaga acaggaggtg agctcaggaa actccccggg gaccagggcg 30540
gagacgtacc ttcgaccctt gtggggttag gattttttat taccgggttg ctggctcttt 30600
taatcaaagt ttccttgaga tttgttcttt ccttctacgt gtatgaacac ctcaacctcc 30660
aataactcta ccctttcttc ggaatcaggt gacttctctg aaatcgggct tggtgtgctg 30720
cttactctgt tgattttttt ccttatcata ctcagccttc tgtgcctcag gctcgccgcc 30780
tgctgcgcac acatctatat ctactgctgg ttgctcaagt gcaggggtcg ccacccaaga 30840
tgaacaggta catggtccta tcgatcctag gcctgctggc cctggcggcc tgcagcgccg 30900
ccaaaaaaga gattaccttt gaggagcccg cttgcaatgt aactttcaag cccgagggtg 30960
accaatgcac caccctcgtc aaatgcgtta ccaatcatga gaggctgcgc atcgactaca 31020
aaaacaaaac tggccagttt gcggtctata gtgtgtttac gcccggagac ccctctaact 31080
actctgtcac cgtcttccag ggcggacagt ctaagatatt caattacact ttcccttttt 31140
atgagttatg cgatgcggtc atgtacatgt caaaacagta caacctgtgg cctccctctc 31200
cccaggcgtg tgtggaaaat actgggtctt actgctgtat ggctttcgca atcactacgc 31260
tcgctctaat ctgcacggtg ctatacataa aattcaggca gaggcgaatc tttatcgatg 31320
aaaagaaaat gccttgatcg ctaacaccgg ctttctatct gcagaatgaa tgcaatcacc 31380
tccctactaa tcaccaccac cctccttgcg attgcccatg ggttgacacg aatcgaagtg 31440
ccagtggggt ccaatgtcac catggtgggc cccgccggca attccaccct catgtgggaa 31500
aaatttgtcc gcaatcaatg ggttcatttc tgctctaacc gaatcagtat caagcccaga 31560
gccatctgcg atgggcaaaa tctaactctg atcaatgtgc aaatgatgga tgctgggtac 31620
tattacgggc agcggggaga aatcattaat tactggcgac cccacaagga ctacatgctg 31680
catgtagtcg aggcacttcc cactaccacc cccactacca cctctcccac caccaccacc 31740
actactacta ctactactac tactactact actaccacta ccgctgcccg ccatacccgc 31800
aaaagcacca tgattagcac aaagccccct cgtgctcact cccacgccgg cgggcccatc 31860
ggtgcgacct cagaaaccac cgagctttgc ttctgccaat gcactaacgc cagcgctcat 31920
gaactgttcg acctggagaa tgaggatgtc cagcagagct ccgcttgcct gacccaggag 31980
gctgtggagc ccgttgccct gaagcagatc ggtgattcaa taattgactc ttcttctttt 32040
gccactcccg aataccctcc cgattctact ttccacatca cgggtaccaa agaccctaac 32100
ctctctttct acctgatgct gctgctctgt atctctgtgg tctcttccgc gctgatgtta 32160
ctggggatgt tctgctgcct gatctgccgc agaaagagaa aagctcgctc tcagggccaa 32220
ccactgatgc ccttccccta ccccccggat tttgcagata acaagatatg agctcgctgc 32280
tgacactaac cgctttacta gcctgcgctc taacccttgt cgcttgcgac tcgagattcc 32340
acaatgtcac agctgtggca ggagaaaatg ttactttcaa ctccacggcc gatacccagt 32400
ggtcgtggag tggctcaggt agctacttaa ctatctgcaa tagctccact tcccccggca 32460
tatccccaac caagtaccaa tgcaatgcca gcctgttcac cctcatcaac gcttccaccc 32520
tggacaatgg actctatgta ggctatgtac cctttggtgg gcaaggaaag acccacgctt 32580
acaacctgga agttcgccag cccagaacca ctacccaagc ttctcccacc accaccacca 32640
ccaccaccat caccagcagc agcagcagca gcagccacag cagcagcagc agattattga 32700
ctttggtttt ggccagctca tctgccgcta cccaggccat ctacagctct gtgcccgaaa 32760
ccactcagat ccaccgccca gaaacgacca ccgccaccac cctacacacc tccagcgatc 32820
agatgccgac caacatcacc cccttggctc ttcaaatggg acttacaagc cccactccaa 32880
aaccagtgga tgcggccgag gtctccgccc tcgtcaatga ctgggcgggg ctgggaatgt 32940
ggtggttcgc cataggcatg atggcgctct gcctgcttct gctctggctc atctgctgcc 33000
tccaccgcag gcgagccaga ccccccatct atagacccat cattgtcctg aaccccgata 33060
atgatgggat ccatagattg gatggcctga aaaacctact tttttctttt acagtatgat 33120
aaattgagac atgcctcgca ttttcttgta catgttcctt ctcccacctt ttctggggtg 33180
ttctacgctg gccgctgtgt ctcacctgga ggtagactgc ctctcaccct tcactgtcta 33240
cctgctttac ggattggtca ccctcactct catctgcagc ctaatcacag taatcatcgc 33300
cttcatccag tgcattgatt acatctgtgt gcgcctcgca tacttcagac accacccgca 33360
gtaccgagac aggaacattg cccaacttct aagactgctc taatcatgca taagactgtg 33420
atctgccttc tgatcctctg catcctgccc accctcacct cctgccagta caccacaaaa 33480
tctccgcgca aaagacatgc ctcctgccgc ttcacccaac tgtggaatat acccaaatgc 33540
tacaacgaaa agagcgagct ctccgaagct tggctgtatg gggtcatctg tgtcttagtt 33600
ttctgcagca ctgtctttgc cctcataatc tacccctact ttgatttggg atggaacgcg 33660
atcgatgcca tgaattaccc cacctttccc gcacccgaga taattccact gcgacaagtt 33720
gtacccgttg tcgttaatca acgcccccca tcccctacgc ccactgaaat cagctacttt 33780
aacctaacag gcggagatga ctgacgccct agatctagaa atggacggca tcagtaccga 33840
gcagcgtctc ctagagaggc gcaggcaggc ggctgagcaa gagcgcctca atcaggagct 33900
ccgagatctc gttaacctgc accagtgcaa aagaggcatc ttttgtctgg taaagcaggc 33960
caaagtcacc tacgagaaga ccggcaacag ccaccgcctc agttacaaat tgcccaccca 34020
gcgccagaag ctggtgctca tggtgggtga gaatcccatc accgtcaccc agcactcggt 34080
agagaccgag gggtgtctgc actccccctg tcggggtcca gaagacctct gcaccctggt 34140
aaagaccctg tgcggtctca gagatttagt cccctttaac taatcaaaca ctggaatcaa 34200
taaaaagaat cacttactta aaatcagaca gcaggtctct gtccagttta ttcagcagca 34260
cctccttccc ctcctcccaa ctctggtact ccaaacgcct tctggcggca aacttcctcc 34320
acaccctgaa gggaatgtca gattcttgct cctgtccctc cgcacccact atcttcatgt 34380
tgttgcagat gaagcgcacc aaaacgtctg acgagagctt caaccccgtg tacccctatg 34440
acacggaaag cggccctccc tccgtccctt tcctcacccc tcccttcgtg tctcccgatg 34500
gattccaaga aagtcccccc ggggtcctgt ctctgaacct ggccgagccc ctggtcactt 34560
cccacggcat gctcgccctg aaaatgggaa gtggcctctc cctggacgac gctggcaacc 34620
tcacctctca agatatcacc accgctagcc ctcccctcaa aaaaaccaag accaacctca 34680
gcctagaaac ctcatccccc ctaactgtga gcacctcagg cgccctcacc gtagcagccg 34740
ccgctcccct ggcggtggcc ggcacctccc tcaccatgca atcagaggcc cccctgacag 34800
tacaggatgc aaaactcacc ctggccacca aaggccccct gaccgtgtct gaaggcaaac 34860
tggccttgca aacatcggcc ccgctgacgg ccgctgacag cagcaccctc acagtcagtg 34920
ccacaccacc ccttagcaca agcaatggca gcttgggtat tgacatgcaa gcccccattt 34980
acaccaccaa tggaaaacta ggacttaact ttggcgctcc cctgcatgtg gtagacagcc 35040
taaatgcact gactgtagtt actggccaag gtcttacgat aaacggaaca gccctacaaa 35100
ctagagtctc aggtgccctc aactatgaca catcaggaaa cctagaattg agagctgcag 35160
ggggtatgcg agttgatgca aatggtcaac ttatccttga tgtagcttac ccatttgatg 35220
cacaaaacaa tctcagcctt aggcttggac agggacccct gtttgttaac tctgcccaca 35280
acttggatgt taactacaac agaggcctct acctgttcac atctggaaat accaaaaagc 35340
tagaagttaa tatcaaaaca gccaagggtc tcatttatga tgacactgct atagcaatca 35400
atgcgggtga tgggctacag tttgactcag gctcagatac aaatccatta aaaactaaac 35460
ttggattagg actggattat gactccagca gagccataat tgctaaactg ggaactggcc 35520
taagctttga caacacaggt gccatcacag taggcaacaa aaatgatgac aagcttacct 35580
tgtggaccac accagaccca tcccctaact gtagaatcta ttcagagaaa gatgctaaat 35640
tcacacttgt tttgactaaa tgcggcagtc aggtgttggc cagcgtttct gttttatctg 35700
taaaaggtag ccttgcgccc atcagtggca cagtaactag tgctcagatt gtcctcagat 35760
ttgatgaaaa tggagttcta ctaagcaatt cttcccttga ccctcaatac tggaactaca 35820
gaaaaggtga ccttacagag ggcactgcat ataccaacgc agtgggattt atgcccaacc 35880
tcacagcata cccaaaaaca cagagccaaa ctgctaaaag caacattgta agtcaggttt 35940
acttgaatgg ggacaaatcc aaacccatga ccctcaccat taccctcaat ggaactaatg 36000
aaacaggaga tgccacagta agcacttact ccatgtcatt ctcatggaac tggaatggaa 36060
gtaattacat taatgaaacg ttccaaacca actccttcac cttctcctac atcgcccaag 36120
aataaaaagc atgacgctgt tgatttgatt caatgtgttt ctgttttatt ttcaagcaca 36180
acaaaatcat tcaagtcatt cttccatctt agcttaatag acacagtagc ttaatagacc 36240
cagtagtgca aagccccatt ctagcttata actagtggag aagtactcgc ctacatgggg 36300
gtagagtcat aatcgtgcat caggataggg cggtggtgct gcagcagcgc gcgaataaac 36360
tgctgccgcc gccgctccgt cctgcaggaa tacaacatgg cagtggtctc ctcagcgatg 36420
attcgcaccg cccgcagcat aaggcgcctt gtcctccggg cacagcagcg caccctgatc 36480
tcacttaaat cagcacagta actgcagcac agcaccacaa tattgttcaa aatcccacag 36540
tgcaaggcgc tgtatccaaa gctcatggcg gggaccacag aacccacgtg gccatcatac 36600
cacaagcgca ggtagattaa gtggcgaccc ctcataaaca cgctggacat aaacattacc 36660
tcttttggca tgttgtaatt caccacctcc cggtaccata taaacctctg attaaacatg 36720
gcgccatcca ccaccatcct aaaccagctg gccaaaacct gcccgccggc tatacactgc 36780
agggaaccgg gactggaaca atgacagtgg agagcccagg actcgtaacc atggatcatc 36840
atgctcgtca tgatatcaat gttggcacaa cacaggcaca cgtgcataca cttcctcagg 36900
attacaagct cctcccgcgt tagaaccata tcccagggaa caacccattc ctgaatcagc 36960
gtaaatccca cactgcaggg aagacctcgc acgtaactca cgttgtgcat tgtcaaagtg 37020
ttacattcgg gcagcagcgg atgatcctcc agtatggtag cgcgggtttc tgtctcaaaa 37080
ggaggtagac gatccctact gtacggagtg cgccgagaca accgagatcg tgttggtcgt 37140
agtgtcatgc caaatggaac gccggacgta gtcatatttc ctgaagtctt agatctctca 37200
acgcagcacc agcaccaaca cttcgcagtg taaaaggcca agtgccgaga gagtatatat 37260
aggaataaaa agtgacgtaa acgggcaaag tccaaaaaac gcccagaaaa accgcacgcg 37320
aacctacgcc ccgaaacgaa agccaaaaaa cactagacac tcccttccgg cgtcaacttc 37380
cgctttccca cgctacgtca cttgccccag tcaaacaaac tacatatccc gaacttccaa 37440
gtcgccacgc ccaaaacacc gcctacacct ccccgcccgc cggcccgccc ccaaacccgc 37500
ctcccgcccc gcgccccgcc ccgcgccgcc catctcatta tcatattggc ttcaatccaa 37560
aataaggtat attattgatg atggtttaaa cggatcctct agagtcgacc tgcaggcatg 37620
caagcttgag tataaccccc ttgcggccgc ccgggccgtc gaccaattct catgtttgac 37680
agcttatcat cgaatttctg ccattcatcc gcttattatc acttattcag gcgtagcaac 37740
caggcgttta agggcaccaa taactgcctt aaaaaaatta cgccccgccc tgccactcat 37800
cgcagtactg ttgtaattca ttaagcattc tgccgacatg gaagccatca caaacggcat 37860
gatgaacctg aatcgccagc ggcatcagca ccttgtcgcc ttgcgtataa tatttgccca 37920
tggtgaaaac gggggcgaag aagttgtcca tattggccac gtttaaatca aaactggtga 37980
aactcaccca gggattggct gagacgaaaa acatattctc aataaaccct ttagggaaat 38040
aggccaggtt ttcaccgtaa cacgccacat cttgcgaata tatgtgtaga aactgccgga 38100
aatcgtcgtg gtattcactc cagagcgatg aaaacgtttc agtttgctca tggaaaacgg 38160
tgtaacaagg gtgaacacta tcccatatca ccagctcacc gtctttcatt gccatacgga 38220
attccggatg agcattcatc aggcgggcaa gaatgtgaat aaaggccgga taaaacttgt 38280
gcttattttt ctttacggtc tttaaaaagg ccgtaatatc cagctgaacg gtctggttat 38340
aggtacattg agcaactgac tgaaatgcct caaaatgttc tttacgatgc cattgggata 38400
tatcaacggt ggtatatcca gtgatttttt tctccatttt agcttcctta gctcctgaaa 38460
atctcgataa ctcaaaaaat acgcccggta gtgatcttat ttcattatgg tgaaagttgg 38520
aacctcttac gtgccgatca acgtctcatt ttcgccaaaa gttggcccag ggcttcccgg 38580
tatcaacagg gacaccagga tttatttatt ctgcgaagtg atcttccgtc acaggtattt 38640
attcgcgata agctcatgga gcggcgtaac cgtcgcacag gaaggacaga gaaagcgcgg 38700
atctgggaag tgacggacag aacggtcagg acctggattg gggaggcggt tgccgccgct 38760
gctgctgacg gtgtgacgtt ctctgttccg gtcacaccac atacgttccg ccattcctat 38820
gcgatgcaca tgctgtatgc cggtataccg ctgaaagttc tgcaaagcct gatgggacat 38880
aagtccatca gttcaacgga agtctacacg aaggtttttg cgctggatgt ggctgcccgg 38940
caccgggtgc agtttgcgat gccggagtct gatgcggttg cgatgctgaa acaattatcc 39000
tgagaataaa tgccttggcc tttatatgga aatgtggaac tgagtggata tgctgttttt 39060
gtctgttaaa cagagaagct ggctgttatc cactgagaag cgaacgaaac agtcgggaaa 39120
atctcccatt atcgtagaga tccgcattat taatctcagg agcctgtgta gcgtttatag 39180
gaagtagtgt tctgtcatga tgcctgcaag cggtaacgaa aacgatttga atatgccttc 39240
aggaacaata gaaatcttcg tgcggtgtta cgttgaagtg gagcggatta tgtcagcaat 39300
ggacagaaca acctaatgaa cacagaacca tgatgtggtc tgtcctttta cagccagtag 39360
tgctcgccgc agtcgagcga cagggcgaag ccctcgagtg agcgaggaag caccagggaa 39420
cagcacttat atattctgct tacacacgat gcctgaaaaa acttcccttg gggttatcca 39480
cttatccacg gggatatttt tataattatt ttttttatag tttttagatc ttctttttta 39540
gagcgccttg taggccttta tccatgctgg ttctagagaa ggtgttgtga caaattgccc 39600
tttcagtgtg acaaatcacc ctcaaatgac agtcctgtct gtgacaaatt gcccttaacc 39660
ctgtgacaaa ttgccctcag aagaagctgt tttttcacaa agttatccct gcttattgac 39720
tcttttttat ttagtgtgac aatctaaaaa cttgtcacac ttcacatgga tctgtcatgg 39780
cggaaacagc ggttatcaat cacaagaaac gtaaaaatag cccgcgaatc gtccagtcaa 39840
acgacctcac tgaggcggca tatagtctct cccgggatca aaaacgtatg ctgtatctgt 39900
tcgttgacca gatcagaaaa tctgatggca ccctacagga acatgacggt atctgcgaga 39960
tccatgttgc taaatatgct gaaatattcg gattgacctc tgcggaagcc agtaaggata 40020
tacggcaggc attgaagagt ttcgcgggga aggaagtggt tttttatcgc cctgaagagg 40080
atgccggcga tgaaaaaggc tatgaatctt ttccttggtt tatcaaacgt gcgcacagtc 40140
catccagagg gctttacagt gtacatatca acccatatct cattcccttc tttatcgggt 40200
tacagaaccg gtttacgcag tttcggctta gtgaaacaaa agaaatcacc aatccgtatg 40260
ccatgcgttt atacgaatcc ctgtgtcagt atcgtaagcc ggatggctca ggcatcgtct 40320
ctctgaaaat cgactggatc atagagcgtt accagctgcc tcaaagttac cagcgtatgc 40380
ctgacttccg ccgccgcttc ctgcaggtct gtgttaatga gatcaacagc agaactccaa 40440
tgcgcctctc atacattgag aaaaagaaag gccgccagac gactcatatc gtattttcct 40500
tccgcgatat cacttccatg acgacaggat agtctgaggg ttatctgtca cagatttgag 40560
ggtggttcgt cacatttgtt ctgacctact gagggtaatt tgtcacagtt ttgctgtttc 40620
cttcagcctg catggatttt ctcatacttt ttgaactgta atttttaagg aagccaaatt 40680
tgagggcagt ttgtcacagt tgatttcctt ctctttccct tcgtcatgtg acctgatatc 40740
gggggttagt tcgtcatcat tgatgagggt tgattatcac agtttattac tctgaattgg 40800
ctatccgcgt gtgtacctct acctggagtt tttcccacgg tggatatttc ttcttgcgct 40860
gagcgtaaga gctatctgac agaacagttc ttctttgctt cctcgccagt tcgctcgcta 40920
tgctcggtta cacggctgcg gcgagcgcta gtgataataa gtgactgagg tatgtgctct 40980
tcttatctcc ttttgtagtg ttgctcttat tttaaacaac tttgcggttt tttgatgact 41040
ttgcgatttt gttgttgctt tgcagtaaat tgcaagattt aataaaaaaa cgcaaagcaa 41100
tgattaaagg atgttcagaa tgaaactcat ggaaacactt aaccagtgca taaacgctgg 41160
tcatgaaatg acgaaggcta tcgccattgc acagtttaat gatgacagcc cggaagcgag 41220
gaaaataacc cggcgctgga gaataggtga agcagcggat ttagttgggg tttcttctca 41280
ggctatcaga gatgccgaga aagcagggcg actaccgcac ccggatatgg aaattcgagg 41340
acgggttgag caacgtgttg gttatacaat tgaacaaatt aatcatatgc gtgatgtgtt 41400
tggtacgcga ttgcgacgtg ctgaagacgt atttccaccg gtgatcgggg ttgctgccca 41460
taaaggtggc gtttacaaaa cctcagtttc tgttcatctt gctcaggatc tggctctgaa 41520
ggggctacgt gttttgctcg tggaaggtaa cgacccccag ggaacagcct caatgtatca 41580
cggatgggta ccagatcttc atattcatgc agaagacact ctcctgcctt tctatcttgg 41640
ggaaaaggac gatgtcactt atgcaataaa gcccacttgc tggccggggc ttgacattat 41700
tccttcctgt ctggctctgc accgtattga aactgagtta atgggcaaat ttgatgaagg 41760
taaactgccc accgatccac acctgatgct ccgactggcc attgaaactg ttgctcatga 41820
ctatgatgtc atagttattg acagcgcgcc taacctgggt atcggcacga ttaatgtcgt 41880
atgtgctgct gatgtgctga ttgttcccac gcctgctgag ttgtttgact acacctccgc 41940
actgcagttt ttcgatatgc ttcgtgatct gctcaagaac gttgatctta aagggttcga 42000
gcctgatgta cgtattttgc ttaccaaata cagcaatagt aatggctctc agtccccgtg 42060
gatggaggag caaattcggg atgcctgggg aagcatggtt ctaaaaaatg ttgtacgtga 42120
aacggatgaa gttggtaaag gtcagatccg gatgagaact gtttttgaac aggccattga 42180
tcaacgctct tcaactggtg cctggagaaa tgctctttct atttgggaac ctgtctgcaa 42240
tgaaattttc gatcgtctga ttaaaccacg ctgggagatt agataatgaa gcgtgcgcct 42300
gttattccaa aacatacgct caatactcaa ccggttgaag atacttcgtt atcgacacca 42360
gctgccccga tggtggattc gttaattgcg cgcgtaggag taatggctcg cggtaatgcc 42420
attactttgc ctgtatgtgg tcgggatgtg aagtttactc ttgaagtgct ccggggtgat 42480
agtgttgaga agacctctcg ggtatggtca ggtaatgaac gtgaccagga gctgcttact 42540
gaggacgcac tggatgatct catcccttct tttctactga ctggtcaaca gacaccggcg 42600
ttcggtcgaa gagtatctgg tgtcatagaa attgccgatg ggagtcgccg tcgtaaagct 42660
gctgcactta ccgaaagtga ttatcgtgtt ctggttggcg agctggatga tgagcagatg 42720
gctgcattat ccagattggg taacgattat cgcccaacaa gtgcttatga acgtggtcag 42780
cgttatgcaa gccgattgca gaatgaattt gctggaaata tttctgcgct ggctgatgcg 42840
gaaaatattt cacgtaagat tattacccgc tgtatcaaca ccgccaaatt gcctaaatca 42900
gttgttgctc ttttttctca ccccggtgaa ctatctgccc ggtcaggtga tgcacttcaa 42960
aaagccttta cagataaaga ggaattactt aagcagcagg catctaacct tcatgagcag 43020
aaaaaagctg gggtgatatt tgaagctgaa gaagttatca ctcttttaac ttctgtgctt 43080
aaaacgtcat ctgcatcaag aactagttta agctcacgac atcagtttgc tcctggagcg 43140
acagtattgt ataagggcga taaaatggtg cttaacctgg acaggtctcg tgttccaact 43200
gagtgtatag agaaaattga ggccattctt aaggaacttg aaaagccagc accctgatgc 43260
gaccacgttt tagtctacgt ttatctgtct ttacttaatg tcctttgtta caggccagaa 43320
agcataactg gcctgaatat tctctctggg cccactgttc cacttgtatc gtcggtctga 43380
taatcagact gggaccacgg tcccactcgt atcgtcggtc tgattattag tctgggacca 43440
cggtcccact cgtatcgtcg gtctgattat tagtctggga ccacggtccc actcgtatcg 43500
tcggtctgat aatcagactg ggaccacggt cccactcgta tcgtcggtct gattattagt 43560
ctgggaccat ggtcccactc gtatcgtcgg tctgattatt agtctgggac cacggtccca 43620
ctcgtatcgt cggtctgatt attagtctgg aaccacggtc ccactcgtat cgtcggtctg 43680
attattagtc tgggaccacg gtcccactcg tatcgtcggt ctgattatta gtctgggacc 43740
acgatcccac tcgtgttgtc ggtctgatta tcggtctggg accacggtcc cacttgtatt 43800
gtcgatcaga ctatcagcgt gagactacga ttccatcaat gcctgtcaag ggcaagtatt 43860
gacatgtcgt cgtaacctgt agaacggagt aacctcggtg tgcggttgta tgcctgctgt 43920
ggattgctgc tgtgtcctgc ttatccacaa cattttgcgc acggttatgt ggacaaaata 43980
cctggttacc caggccgtgc cggcacgctc ggtacccggg gatcctcgtt taaac 44035
<210> 51
<211> 41464
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (16063)..(16063)
<223> a, c, t, g, unknown or other
<400> 51
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg agacctgctc cctggacacc taatcctccc 1380
aggtccccca gccagatgag cgtgagagac agactggcta ggctgagagc cgaggctcag 1440
gtcaagcagg ccagcgtcga ggtgcaaccc cctcagctca cccaggtgtc cccccagcag 1500
cctgtggccg gcattctgtt cattctggcc attctgaccg agtggggaag cggcaacaga 1560
acctacggcc ctgtcttcat gtgcctcgga ggactgctga caatggtggc tggcgccgtg 1620
tggctcaccg tcatgtccaa caccctgctc agcgcctgga ttctgaccgc cggattcctg 1680
atctttctga tcggattcgc tctctttggc gtcatcaggt gttgcaggta ctgttgctac 1740
tactgcctga ccctcgagag cgaggaaaga ccccccaccc cctacaggaa tacagtgagg 1800
aaacctcagc agcccgagag cctcgaggag tgcgatagcg agctggagat taaaaggtat 1860
aagaataggg tggcctccag gaagtgtagg gctaaattca aacagctcct gcaacactat 1920
agggaagtgg ccgccgccaa gtccagcgag attagggaca gaaggaggaa tcctgcctcc 1980
aggagagacc aggccaaatg gagactccaa acactcgccg ctggatggcc catgggctac 2040
caggcctata gctcctggat gtacagctac accgaccatc agacaacacc caccttcgtg 2100
catctgcagg ctacactggg ctgcaccgga ggcagaaggt gtcacgtgtt tctgggaatc 2160
gtgctgttca tctttggatg cctgctcgtg ctgggcatct ggatttatct cctggagatg 2220
ctctggagac tcggcgctac aatttggcag ctgctcgcct tttttctggc cttctttctg 2280
gacctgatcc tcctgatcat cgccctgtac ctccaacaga actggtggac cctcctggtg 2340
gatctgctgt ggctcctcct cttcctggcc atcctgatct ggatgtacta ccatggccag 2400
agaggaaggg tcgcttgcgc tcctgtccct gctcctgctg gccccatcgt gaggccttgg 2460
gagccttccc tcacacaggc cgccggccag gcctttgctc ccgtgaggcc ccagcacatg 2520
cctgtggaac ccgtgcccgt ccccacagtg gctctggaaa ggcctgtgta ccccaagccc 2580
gtgagacctg tcctctggct cagcagccct ggaggactcg gaacactcgg agccgctctc 2640
ctgacactgg ccgctgctct ggctctgctg gctagcctga tcctgggaac cctcaacctc 2700
accaccatgt ttctcctcat gctcctgtgg accctcgtgg tgctgctcat ctgttccagc 2760
tgctccagct gccccctgag caagatcctg ctggccaggc tgttcctgta cgccctcgcc 2820
ctcctgctgc tggctagcgc cctgatcgct ggcggaagca tcctccagac caatttcaag 2880
agcctctcct ccaccgagtt catccccaac ctgttctgta tgttactgct gatccatagc 2940
gacgagcacc atcatgacga ctccctgccc catcctcagc aggccacaga cgactccggc 3000
cacgagagcg acagcaatag caatgagggc aggcaccatc tgctcgtgtc cggagctcaa 3060
gtccccgagc ctcccaccat ccatctcgcc gcccagggaa tggcttaccc cctccacgag 3120
cagcacggca tggccccttg tcccgtcgct caagcccccc ctacacctct gccctttttc 3180
gccatttgtc tgacctggag aatcgaggac ccccccttca acagcctgct gttcgccctg 3240
ctcgccgccg ctggcggcct ccagggcatt tacgtcctcg tgatgctggt gctgctgatc 3300
ctcgcttaca ggagaagatg gaggagactg acagtgtgcg gcggcatcat gtttctcgcc 3360
tgcgtcctgg tcctgatcgt ggacgccgtc ctgcaactca gccccctcct gggagctgtg 3420
acagtggtct ccatgaccct gctgctgctg gccttcaacg gaccccacga tcctctgccc 3480
caagatcctg acaataccga cgataacggc ccccaagacc ccgataacac cgacgacaat 3540
ggccctcacg accctctgcc ccatagccct tccgatagcg ctggcaacga tggcggccct 3600
cctcagctga cagaggaggt ggaaaataag ggcggcgatc agggaccccc cctgatgaca 3660
gatggcggag gaggacacag ccatgatagc ggacatggcg gaggcgatcc ccatctgcct 3720
accctcctcc tgggcagctc cggttctgga ggcgacgatg atgaccctca cggccctgtg 3780
cagctctcct actacgacgg caaaaggacc gaacaaggaa aagaggtcct ggagaaggcc 3840
aggggcagca catacggaac ccccaggcct cccatgtccg attggaccgg aggagccctg 3900
ctggtcctct acagcttcgc cctgatgctg atcattatca tcctgatcat ctttatcttc 3960
agaagggacc tgctgtgccc tctcggcgcc ctgtgcatcc tgctgctcat gatcacactc 4020
ctcctgatcg ccctctggaa cctgcacgga caagccctga tgtccgatga gggacctgga 4080
acaggacccg gaaacggact gggcgagaag ggagatacaa gcggccccga aggcagcggc 4140
ggaagcggac cccaaagaag gggcggcgac aaccacggaa gaggaagagg caggggcaga 4200
ggcagaggag gaggaagacc tggagcccct ggcggttctg gaagcggacc caggcacagg 4260
gacggagtga ggaggcctca aaaaagaccc agctgcatcg gctgcaaggg aacccactgg 4320
attgatgata acccctccac agagaccgct caggcctgga acgccggctt cctgagggga 4380
agagcctatg gcatcgatct gctgaggacc gagggcgaac acgtggaggg agccaccgga 4440
gagacaaggg aggaaagcga agacacagaa agcgatggcg acgacgaaga cctgccctgc 4500
attgtgtcca ggggcggacc caaggtgaag aggcccccta tctttatcag aaggctccat 4560
agactgctcc tgatgagggc catgaaccct gtgtgcctgc ccgtgatcgt ggccccctac 4620
ctcttttggc tggccgccat tgccgctagc tgcttcaccg cctccgtgtc cacagtggtg 4680
acagccaccg gcctcgccct gagcctgctg ctcctcgctg ccgtggcctc cagctacgcc 4740
gctgctcaaa gaaagctcct gacccctgtc accgtcctga cagccgtcgt gaccaccttt 4800
tccgctggca ccttcaagct gcctaggtgc acacctggcg acaggcagtg gctctacgtg 4860
cagagctccg tgggcaatat tgtgcagagc tgcaatccca ggtacagcat ttttttcgac 4920
tacatggcca tccataggtc cctcaccaag atctgggagg atctgggagg cccttcccag 4980
gctcctctgc cctgcgtgct gtggcctgtg ctgcctgagc ctctgcccca aggccagctg 5040
acagcctatc acgtgtccac cgctcctaca ggttcttggt tcagcgctcc ccagcccgct 5100
cccgaaaacg cttaccaggc ttacgccgcc ccccagctgt tccccgtctc cgacatctga 5160
tgatgagcgg ccgcgatctg ctgtgccttc tagttgccag ccatctgttg tttgcccctc 5220
ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct aataaaatga 5280
ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg gggtggggca 5340
ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg cggtgggctc 5400
tatggccgat cagcgatcgc tgaggtgggt gagtgggcgt ggcctggggt ggtcatgaaa 5460
atatataagt tgggggtctt agggtctctt tatttgtgtt gcagagaccg ccggagccat 5520
gagcgggagc agcagcagca gcagtagcag cagcgccttg gatggcagca tcgtgagccc 5580
ttatttgacg acgcggatgc cccactgggc cggggtgcgt cagaatgtga tgggctccag 5640
catcgacggc cgacccgtcc tgcccgcaaa ttccgccacg ctgacctatg cgaccgtcgc 5700
ggggacgccg ttggacgcca ccgccgccgc cgccgccacc gcagccgcct cggccgtgcg 5760
cagcctggcc acggactttg cattcctggg accactggcg acaggggcta cttctcgggc 5820
cgctgctgcc gccgttcgcg atgacaagct gaccgccctg ctggcgcagt tggatgcgct 5880
tactcgggaa ctgggtgacc tttctcagca ggtcatggcc ctgcgccagc aggtctcctc 5940
cctgcaagct ggcgggaatg cttctcccac aaatgccgtt taagataaat aaaaccagac 6000
tctgtttgga ttaaagaaaa gtagcaagtg cattgctctc tttatttcat aattttccgc 6060
gcgcgatagg ccctagacca gcgttctcgg tcgttgaggg tgcggtgtat cttctccagg 6120
acgtggtaga ggtggctctg gacgttgaga tacatgggca tgagcccgtc ccgggggtgg 6180
aggtagcacc actgcagagc ttcatgctcc ggggtggtgt tgtagatgat ccagtcgtag 6240
caggagcgct gggcatggtg cctaaaaatg tccttcagca gcaggccgat ggccaggggg 6300
aggcccttgg tgtaagtgtt tacaaaacgg ttaagttggg aagggtgcat tcggggagag 6360
atgatgtgca tcttggactg tatttttaga ttggcgatgt ttccgcccag atcccttctg 6420
ggattcatgt tgtgcaggac caccagtaca gtgtatccgg tgcacttggg gaatttgtca 6480
tgcagcttag agggaaaagc gtggaagaac ttggagacgc ctttgtggcc tcccagattt 6540
tccatgcatt cgtccatgat gatggcaatg ggcccgcggg aggcagcttg ggcaaagata 6600
tttctggggt cgctgacgtc gtagttgtgt tccagggtga ggtcgtcata ggccattttt 6660
acaaagcgcg ggcggagggt gcccgactgg gggatgatgg tcccctctgg ccctggggcg 6720
tagttgccct cgcagatctg catttcccag gccttaatct cggagggggg aatcatatcc 6780
acctgcgggg cgatgaagaa aacggtttcc ggagccgggg agattaactg ggatgagagc 6840
aggtttctaa gcagctgtga ttttccacaa ccggtgggcc cataaataac acctataacc 6900
ggttgcagct ggtagtttag agagctgcag ctgccgtcgt cccggaggag gggggccacc 6960
tcgttgagca tgtccctgac gcgcatgttc tccccgacca gatccgccag aaggcgctcg 7020
ccgcccaggg acagcagctc ttgcaaggaa gcaaagtttt tcagcggctt gaggccgtcc 7080
gccgtgggca tgtttttcag ggtctggctc agcagctcca ggcggtccca gagctcggtg 7140
acgtgctcta cggcatctct atccagcata tctcctcgtt tcgcgggttg gggcgacttt 7200
cgctgtaggg caccaagcgg tggtcgtcca gcggggccag agtcatgtcc ttccatgggc 7260
gcagggtcct cgtcagggtg gtctgggtca cggtgaaggg gtgcgctccg ggctgagcgc 7320
ttgccaaggt gcgcttgagg ctggttctgc tggtgctgaa gcgctgccgg tcttcgccct 7380
gcgcgtcggc caggtagcat ttgaccatgg tgtcatagtc cagcccctcc gcggcgtgtc 7440
ccttggcgcg cagcttgccc ttggaggtgg cgccgcacga ggggcagagc aggctcttga 7500
gcgcgtagag cttgggggcg aggaagaccg attcggggga gtaggcgtcc gcgccgcaga 7560
ccccgcacac ggtctcgcac tccaccagcc aggtgagctc ggggcgcgcc gggtcaaaaa 7620
ccaggtttcc cccatgcttt ttgatgcgtt tcttacctcg ggtctccatg aggtggtgtc 7680
cccgctcggt gacgaagagg ctgtccgtgt ctccgtagac cgacttgagg ggtcttttct 7740
ccaggggggt ccctcggtct tcctcgtaga ggaactcgga ccactctgag acgaaggccc 7800
gcgtccaggc caggacgaag gaggctatgt gggaggggta gcggtcgttg tccactaggg 7860
ggtccacctt ctccaaggtg tgaagacaca tgtcgccttc ctcggcgtcc aggaaggtga 7920
ttggcttgta ggtgtaggcc acgtgaccgg gggttcctga cgggggggta taaaaggggg 7980
tgggggcgcg ctcgtcgtca ctctcttccg catcgctgtc tgcgagggcc agctgctggg 8040
gtgagtattc cctctcgaag gcgggcatga cctccgcgct gaggttgtca gtttccaaaa 8100
acgaggagga tttgatgttc acctgtcccg aggtgatacc tttgagggta cccgcgtcca 8160
tctggtcaga aaacacgatc tttttattgt ccagcttggt ggcgaacgac ccgtagaggg 8220
cgttggagag cagcttggcg atggagcgca gggtctggtt cttgtccctg tcggcgcgct 8280
ccttggccgc gatgttgagc tgcacgtact cgcgcgcgac gcagcgccac tcggggaaga 8340
cggtggtgcg ctcgtcgggc accaggcgca cgcgccagcc gcggttgtgc agggtgacca 8400
ggtccacgct ggtggcgacc tcgccgcgca ggcgctcgtt ggtccagcag agacggccgc 8460
ccttgcgcga gcagaagggg ggcagggggt cgagctgggt ctcgtccggg gggtccgcgt 8520
ccacggtgaa aaccccgggg cgcaggcgcg cgtcgaagta gtctatcttg caaccttgca 8580
tgtccagcgc ctgctgccag tcgcgggcgg cgagcgcgcg ctcgtagggg ttgagcggcg 8640
ggccccaggg catggggtgg gtgagtgcgg aggcgtacat gccgcagatg tcatagacgt 8700
agaggggctc ccgcaggacc ccgatgtagg tggggtagca gcggccgccg cggatgctgg 8760
cgcgcacgta gtcatacagc tcgtgcgagg gggcgaggag gtcggggccc aggttggtgc 8820
gggcggggcg ctccgcgcgg aagacgatct gcctgaagat ggcatgcgag ttggaagaga 8880
tggtggggcg ctggaagacg ttgaagctgg cgtcctgcag gccgacggcg tcgcgcacga 8940
aggaggcgta ggagtcgcgc agcttgtgta ccagctcggc ggtgacctgc acgtcgagcg 9000
cgcagtagtc gagggtctcg cggatgatgt catatttagc ctgccccttc tttttccaca 9060
gctcgcggtt gaggacaaac tcttcgcggt ctttccagta ctcttggatc gggaaaccgt 9120
ccggttccga acggtaagag cctagcatgt agaactggtt gacggcctgg taggcgcagc 9180
agcccttctc cacggggagg gcgtaggcct gcgcggcctt gcggagcgag gtgtgggtca 9240
gggcgaaggt gtccctgacc atgactttga ggtactggtg cttgaagtcg gagtcgtcgc 9300
agccgccccg ctcccagagc gagaagtcgg tgcgcttctt ggagcggggg ttgggcagag 9360
cgaaggtgac atcgttgaag aggattttgc ccgcgcgggg catgaagttg cgggtgatgc 9420
ggaagggccc cggcacttca gagcggttgt tgatgacctg ggcggcgagc acgatctcgt 9480
cgaagccgtt gatgttgtgg cccacgatgt agagttccag gaagcggggc cggcccttta 9540
cggtgggcag cttctttagc tcttcgtagg tgagctcctc gggcgaggcg aggccgtgct 9600
cggccagggc ccagtccgcg aggtgcgggt tgtctctgag gaaggacttc cagaggtcgc 9660
gggccaggag ggtctgcagg cggtctctga aggtcctgaa ctggcggccc acggccattt 9720
tttcgggggt gatgcagtag aaggtgaggg ggtcttgctg ccagcggtcc cagtcgagct 9780
gcagggcgag gtcgcgcgcg gcggtgacca ggcgctcgtc gcccccgaat ttcatgacca 9840
gcatgaaggg cacgagctgc tttccgaagg cccccatcca agtgtaggtc tctacatcgt 9900
aggtgacaaa gaggcgctcc gtgcgaggat gcgagccgat cgggaagaac tggatctccc 9960
gccaccagtt ggaggagtgg ctgttgatgt ggtggaagta gaagtcccgt cgccgggccg 10020
aacactcgtg ctggcttttg taaaagcgag cgcagtactg gcagcgctgc acgggctgta 10080
cctcatgcac gagatgcacc tttcgcccgc gcacgaggaa gccgagggga aatctgagcc 10140
ccccgcctgg ctcgcggcat ggctggttct cttctacttt ggatgcgtgt ccgtctccgt 10200
ctggctcctc gaggggtgtt acggtggagc ggaccaccac gccgcgcgag ccgcaggtcc 10260
agatatcggc gcgcggcggt cggagtttga tgacgacatc gcgcagctgg gagctgtcca 10320
tggtctggag ctcccgcggc ggcggcaggt cagccgggag ttcttgcagg ttcacctcgc 10380
agagtcgggc cagggcgcgg ggcaggtcta ggtggtacct gatctctagg ggcgtgttgg 10440
tggcggcgtc gatggcttgc aggagcccgc agccccgggg ggcgacgacg gtgccccgcg 10500
gggtggtggt ggtggtggcg gtgcagctca gaagcggtgc cgcgggcggg cccccggagg 10560
tagggggggc tccggtcccg cgggcagggg cggcagcggc acgtcggcgt ggagcgcggg 10620
caggagttgg tgctgtgccc ggaggttgct ggcgaaggcg acgacgcggc ggttgatctc 10680
ctggatctgg cgcctctgcg tgaagacgac gggcccggtg agcttgaacc tgaaagagag 10740
ttcgacagaa tcaatctcgg tgtcattgac cgcggcctgg cgcaggatct cctgcacgtc 10800
tcccgagttg tcttggtagg cgatctcggc catgaactgc tcgatctctt cctcctggag 10860
gtctccgcgt ccggcgcgtt ccacggtggc cgccaggtcg ttggagatgc gccccatgag 10920
ctgcgagaag gcgttgagtc cgccctcgtt ccagactcgg ctgtagacca cgcccccctg 10980
gtcatcgcgg gcgcgcatga ccacctgcgc gaggttgagc tccacgtgcc gcgcgaagac 11040
ggcgtagttg cgcagacgct ggaagaggta gttgagggtg gtggcggtgt gctcggccac 11100
gaagaagttc atgacccagc ggcgcaacgt ggattcgttg atgtccccca aggcctccag 11160
ccgttccatg gcctcgtaga agtccacggc gaagttgaaa aactgggagt tgcgcgccga 11220
cacggtcaac tcctcctcca gaagacggat gagctcggcg acggtgtcgc gcacctcgcg 11280
ctcgaaggct atggggatct cttcctccgc tagcatcacc acctcctcct cttcctcctc 11340
ttctggcact tccatgatgg cttcctcctc ttcggggggt ggcggcggcg gcggtggggg 11400
agggggcgct ctgcgccggc ggcggcgcac cgggaggcgg tccacgaagc gcgcgatcat 11460
ctccccgcgg cggcggcgca tggtctcggt gacggcgcgg ccgttctccc gggggcgcag 11520
ttggaagacg ccgccggaca tctggtgctg gggcgggtgg ccgtgaggca gcgagacggc 11580
gctgacgatg catctcaaca attgctgcgt aggtacgccg ccgagggacc tgagggagtc 11640
catatccacc ggatccgaaa acctttcgag gaaggcgtct aaccagtcgc agtcgcaagg 11700
taggctgagc accgtggcgg gcggcggggg gtggggggag tgtctggcgg aggtgctgct 11760
gatgatgtaa ttgaagtagg cggacttgac acggcggatg gtcgacagga gcaccatgtc 11820
cttgggtccg gcctgctgga tgcggaggcg gtcggctatg ccccaggctt cgttctggca 11880
tcggcgcagg tccttgtagt agtcttgcat gagcctttcc accggcacct cttctccttc 11940
ctcttctgct tcttccatgt ctgcttcggc cctggggcgg cgccgcgccc ccctgccccc 12000
catgcgcgtg accccgaacc ccctgagcgg ttggagcagg gccaggtcgg cgacgacgcg 12060
ctcggccagg atggcctgct gcacctgcgt gagggtggtt tggaagtcat ccaagtccac 12120
gaagcggtgg taggcgcccg tgttgatggt gtaggtgcag ttggccatga cggaccagtt 12180
gacggtctgg tggcccggtt gcgacatctc ggtgtacctg agtcgcgagt aggcgcggga 12240
gtcgaagacg tagtcgttgc aagtccgcac caggtactgg tagcccacca ggaagtgcgg 12300
cggcggctgg cggtagaggg gccagcgcag ggtggcgggg gctccggggg ccaggtcttc 12360
cagcatgagg cggtggtagg cgtagatgta cctggacatc caggtgatac ccgcggcggt 12420
ggtggaggcg cgcgggaagt cgcgcacccg gttccagatg ttgcgcaggg gcagaaagtg 12480
ctccatggta ggcgtgctct gtccagtcag acgcgcgcag tcgttgatac tctagaccag 12540
ggaaaacgaa agccggtcag cgggcactct tccgtggtct ggtgaataga tcgcaagggt 12600
atcatggcgg agggcctcgg ttcgagcccc gggtccgggc cggacggtcc gccatgatcc 12660
acgcggttac cgcccgcgtg tcgaacccag gtgtgcgacg tcagacaacg gtggagtgtt 12720
ccttttggcg tttttctggc cgggcgccgg cgccgcgtaa gagactaagc cgcgaaagcg 12780
aaagcagtaa gtggctcgct ccccgtagcc ggagggatcc ttgctaaggg ttgcgttgcg 12840
gcgaaccccg gttcgaatcc cgtactcggg ccggccggac ccgcggctaa ggtgttggat 12900
tggcctcccc ctcgtataaa gaccccgctt gcggattgac tccggacacg gggacgagcc 12960
ccttttattt ttgctttccc cagatgcatc cggtgctgcg gcagatgcgc cccccgcccc 13020
agcagcagca acaacaccag caagagcggc agcaacagca gcgggagtca tgcagggccc 13080
cctcacccac cctcggcggg ccggccacct cggcgtccgc ggccgtgtct ggcgcctgcg 13140
gcggcggcgg ggggccggct gacgaccccg aggagccccc gcggcgcagg gccagacact 13200
acctggacct ggaggagggc gagggcctgg cgcggctggg ggcgccgtct cccgagcgcc 13260
acccgcgggt gcagctgaag cgcgactcgc gcgaggcgta cgtgcctcgg cagaacctgt 13320
tcagggaccg cgcgggcgag gagcccgagg agatgcggga caggaggttc agcgcagggc 13380
gggagctgcg gcaggggctg aaccgcgagc ggctgctgcg cgaggaggac tttgagcccg 13440
acgcgcggac ggggatcagc cccgcgcgcg cgcacgtggc ggccgccgac ctggtgacgg 13500
cgtacgagca gacggtgaac caggagatca acttccaaaa gagtttcaac aaccacgtgc 13560
gcacgctggt ggcgcgcgag gaggtgacca tcgggctgat gcacctgtgg gactttgtaa 13620
gcgcgctggt gcagaacccc aacagcaagc ctctgacggc gcagctgttc ctgatagtgc 13680
agcacagcag ggacaacgag gcgtttaggg acgcgctgct gaacatcacc gagcccgagg 13740
gtcggtggct gctggacctg attaacatcc tgcagagcat agtggtgcag gagcgcagcc 13800
tgagcctggc cgacaaggtg gcggccatca actactcgat gctgagcctg ggcaagtttt 13860
acgcgcgcaa gatctaccag acgccgtacg tgcccataga caaggaggtg aagatcgacg 13920
gtttttacat gcgcatggcg ctgaaggtgc tcaccctgag cgacgacctg ggcgtgtacc 13980
gcaacgagcg catccacaag gccgtgagcg tgagccggcg gcgcgagctg agcgaccgcg 14040
agctgatgca cagcctgcag cgggcgctgg cgggcgccgg cagcggcgac agggaggcgg 14100
agtcctactt cgatgcgggg gcggacctgc gctgggcgcc cagccggcgg gccctggagg 14160
ccgcgggggt ccgcgaggac tatgacgagg acggcgagga ggatgaggag tacgagctag 14220
aggagggcga gtacctggac taaaccgcgg gtggtgtttc cggtagatgc aagacccgaa 14280
cgtggtggac ccggcgctgc gggcggctct gcagagccag ccgtccggcc ttaactcctc 14340
agacgactgg cgacaggtca tggaccgcat catgtcgctg acggcgcgta acccggacgc 14400
gttccggcag cagccgcagg ccaacaggct ctccgccatc ctggaggcgg tggtgcctgc 14460
gcgctcgaac cccacgcacg agaaggtgct ggccatagtg aacgcgctgg ccgagaacag 14520
ggccatccgc ccggacgagg ccgggctggt gtacgacgcg ctgctgcagc gcgtggcccg 14580
ctacaacagc ggcaacgtgc agaccaacct ggaccggctg gtgggggacg tgcgcgaggc 14640
ggtggcgcag cgcgagcgcg cggatcggca gggcaacctg ggctccatgg tggcgctgaa 14700
tgccttcctg agcacgcagc cggccaacgt gccgcggggg caggaagact acaccaactt 14760
tgtgagcgcg ctgcggctga tggtgaccga gaccccccag agcgaggtgt accagtcggg 14820
cccggactac ttcttccaga ccagcagaca gggcctgcag acggtgaacc tgagccaggc 14880
tttcaagaac ctgcgggggc tgtggggcgt gaaggcgccc accggcgacc gggcgacggt 14940
gtccagcctg ctgacgccca actcgcgcct gctgctgctg ctgatcgcgc cgttcacgga 15000
cagcggcagc gtgtcccggg acacctacct ggggcacctg ctgaccctgt accgcgaggc 15060
catcgggcag gcgcaggtgg acgagcacac cttccaggag atcaccagcg tgagccgcgc 15120
gctggggcag gaggacacga gcagcctgga ggcgactctg aactacctgc tgaccaaccg 15180
gcggcagaag attccctcgc tgcacagcct gacctccgag gaggagcgca tcttgcgcta 15240
cgtgcagcag agcgtgagcc tgaacctgat gcgcgacggg gtgacgccca gcgtggcgct 15300
ggacatgacc gcgcgcaaca tggaaccggg catgtacgcc gcgcaccggc cttacatcaa 15360
ccgcctgatg gactacctgc atcgcgcggc ggccgtgaac cccgagtact ttaccaacgc 15420
catcctgaac ccgcactggc tcccgccgcc cgggttctac agcgggggct tcgaggtccc 15480
ggagaccaac gatggcttcc tgtgggacga catggacgac agcgtgttct ccccgcggcc 15540
gcaggcgctg gcggaagcgt ccctgctgcg tcccaagaag gaggaggagg aggaggcgag 15600
tcgccgccgc ggcagcagcg gcgtggcttc tctgtccgag ctgggggcgg cagccgccgc 15660
gcgccccggg tccctgggcg gcagcccctt tccgagcctg gtggggtctc tgcacagcga 15720
gcgcaccacc cgccctcggc tgctgggcga ggacgagtac ctgaataact ccctgctgca 15780
gccggtgcgg gagaaaaacc tgcctcccgc cttccccaac aacgggatag agagcctggt 15840
ggacaagatg agcagatgga agacctatgc gcaggagcac agggacgcgc ctgcgctccg 15900
gccgcccacg cggcgccagc gccacgaccg gcagcggggg ctggtgtggg atgacgagga 15960
ctccgcggac gatagcagcg tgctggacct gggagggagc ggcaacccgt tcgcgcacct 16020
gcgcccccgc ctggggagga tgttttaaaa aaaaaaaaaa aangcaagaa gcatgatgca 16080
aaaattaaat aaaactcacc aaggccatgg cgaccgagcg ttggtttctt gtgttccctt 16140
cagtatgcgg cgcgcggcga tgtaccagga gggacctcct ccctcttacg agagcgtggt 16200
gggcgcggcg gcggcggcgc cctcttctcc ctttgcgtcg cagctgctgg agccgccgta 16260
cgtgcctccg cgctacctgc ggcctacggg ggggagaaac agcatccgtt actcggagct 16320
ggcgcccctg ttcgacacca cccgggtgta cctggtggac aacaagtcgg cggacgtggc 16380
ctccctgaac taccagaacg accacagcaa ttttttgacc acggtcatcc agaacaatga 16440
ctacagcccg agcgaggcca gcacccagac catcaatctg gatgaccggt cgcactgggg 16500
cggcgacctg aaaaccatcc tgcacaccaa catgcccaac gtgaacgagt tcatgttcac 16560
caataagttc aaggcgcggg tgatggtgtc gcgctcgcac accaaggaag accgggtgga 16620
gctgaagtac gagtgggtgg agttcgagct gccagagggc aactactccg agaccatgac 16680
cattgacctg atgaacaacg cgatcgtgga gcactatctg aaagtgggca ggcagaacgg 16740
ggtcctggag agcgacatcg gggtcaagtt cgacaccagg aacttccgcc tggggctgga 16800
ccccgtgacc gggctggtta tgcccggggt gtacaccaac gaggccttcc atcccgacat 16860
catcctgctg cccggctgcg gggtggactt cacttacagc cgcctgagca acctcctggg 16920
catccgcaag cggcagccct tccaggaggg cttcaggatc acctacgagg acctggaggg 16980
gggcaacatc cccgcgctcc tcgatgtgga ggcctaccag gatagcttga aggaaaatga 17040
ggcgggacag gaggataccg cccccgccgc ctccgccgcc gccgagcagg gcgaggatgc 17100
tgctgacacc gcggccgcgg acggggcaga ggccgacccc gctatggtgg tggaggctcc 17160
cgagcaggag gaggacatga atgacagtgc ggtgcgcgga gacaccttcg tcacccgggg 17220
ggaggaaaag caagcggagg ccgaggccgc ggccgaggaa aagcaactgg cggcagcagc 17280
ggcggcggcg gcgttggccg cggcggaggc tgagtctgag gggaccaagc ccgccaagga 17340
gcccgtgatt aagcccctga ccgaagatag caagaagcgc agttacaacc tgctcaagga 17400
cagcaccaac accgcgtacc gcagctggta cctggcctac aactacggcg acccgtcgac 17460
gggggtgcgc tcctggaccc tgctgtgcac gccggacgtg acctgcggct cggagcaggt 17520
gtactggtcg ctgcccgaca tgatgcaaga ccccgtgacc ttccgctcca cgcggcaggt 17580
cagcaacttc ccggtggtgg gcgccgagct gctgcccgtg cactccaaga gcttctacaa 17640
cgaccaggcc gtctactccc agctcatccg ccagttcacc tctctgaccc acgtgttcaa 17700
tcgctttcct gagaaccaga ttctggcgcg cccgcccgcc cccaccatca ccaccgtcag 17760
tgaaaacgtt cctgctctca cagatcacgg gacgctaccg ctgcgcaaca gcatcggagg 17820
agtccagcga gtgaccgtta ctgacgccag acgccgcacc tgcccctacg tttacaaggc 17880
cttgggcata gtctcgccgc gcgtcctttc cagccgcact ttttgagcaa caccaccatc 17940
atgtccatcc tgatctcacc cagcaataac tccggctggg gactgctgcg cgcgcccagc 18000
aagatgttcg gaggggcgag gaagcgttcc gagcagcacc ccgtgcgcgt gcgcgggcac 18060
ttccgcgccc cctggggagc gcacaaacgc ggccgcgcgg ggcgcaccac cgtggacgac 18120
gccatcgact cggtggtgga gcaggcgcgc aactacaggc ccgcggtctc taccgtggac 18180
gcggccatcc agaccgtggt gcggggcgcg cggcggtacg ccaagctgaa gagccgccgg 18240
aagcgcgtgg cccgccgcca ccgccgccga cccggggccg ccgccaaacg cgccgccgcg 18300
gccctgcttc gccgggccaa gcgcacgggc cgccgcgccg ccatgagggc cgcgcgccgc 18360
ttggccgccg gcatcaccgc cgccaccatg gccccccgta cccgaagacg cgcggccgcc 18420
gccgccgccg ccgccatcag tgacatggcc agcaggcgcc ggggcaacgt gtactgggtg 18480
cgcgactcgg tgaccggcac gcgcgtgccc gtgcgcttcc gccccccgcg gacttgagat 18540
gatgtgaaaa aacaacactg agtctcctgc tgttgtgtgt atcccagcgg cggcggcgcg 18600
cgcagcgtca tgtccaagcg caaaatcaaa gaagagatgc tccaggtcgt cgcgccggag 18660
atctatgggc ccccgaagaa ggaagagcag gattcgaagc cccgcaagat aaagcgggtc 18720
aaaaagaaaa agaaagatga tgacgatgcc gatggggagg tggagttcct gcgcgccacg 18780
gcgcccaggc gcccggtgca gtggaagggc cggcgcgtaa agcgcgtcct gcgccccggc 18840
accgcggtgg tcttcacgcc cggcgagcgc tccacccgga ctttcaagcg cgtctatgac 18900
gaggtgtacg gcgacgaaga cctgctggag caggccaacg agcgcttcgg agagtttgct 18960
tacgggaagc gtcagcgggc gctggggaag gaggacctgc tggcgctgcc gctggaccag 19020
ggcaacccca cccccagtct gaagcccgtg accctgcagc aggtgctgcc gagcagcgca 19080
ccctccgagg cgaagcgggg tctgaagcgc gagggcggcg acctggcgcc caccgtgcag 19140
ctcatggtgc ccaagcggca gaggctggag gatgtgctgg agaaaatgaa agtagacccc 19200
ggtctgcagc cggacatcag ggtccgcccc atcaagcagg tggcgccggg cctcggcgtg 19260
cagaccgtgg acgtggtcat ccccaccggc aactcccccg ccgccgccac cactaccgct 19320
gcctccacgg acatggagac acagaccgat cccgccgcag ccgcagccgc agccgccgcc 19380
gcgacctcct cggcggaggt gcagacggac ccctggctgc cgccggcgat gtcagctccc 19440
cgcgcgcgtc gcgggcgcag gaagtacggc gccgccaacg cgctcctgcc cgagtacgcc 19500
ttgcatcctt ccatcgcgcc cacccccggc taccgaggct atacctaccg cccgcgaaga 19560
gccaagggtt ccacccgccg tccccgccga cgcgccgccg ccaccacccg ccgccgccgc 19620
cgcagacgcc agcccgcact ggctccagtc tccgtgagga aagtggcgcg cgacggacac 19680
accctggtgc tgcccagggc gcgctaccac cccagcatcg tttaaaagcc tgttgtggtt 19740
cttgcagata tggccctcac ttgccgcctc cgtttcccgg tgccgggata ccgaggagga 19800
agatcgcgcc gcaggagggg tctggccggc cgcggcctga gcggaggcag ccgccgcgcg 19860
caccggcggc gacgcgccac cagccgacgc atgcgcggcg gggtgctgcc cctgttaatc 19920
cccctgatcg ccgcggcgat cggcgccgtg cccgggatcg cctccgtggc cttgcaagcg 19980
tcccagaggc attgacagac ttgcaaactt gcaaatatgg aaaaaaaaac cccaataaaa 20040
aagtctagac tctcacgctc gcttggtcct gtgactattt tgtagaatgg aagacatcaa 20100
ctttgcgtcg ctggccccgc gtcacggctc gcgcccgttc ctgggacact ggaacgatat 20160
cggcaccagc aacatgagcg gtggcgcctt cagttggggc tctctgtgga gcggcattaa 20220
aagtatcggg tctgccgtta aaaattacgg ctcccgggcc tggaacagca gcacgggcca 20280
gatgttgaga gacaagttga aagagcagaa cttccagcag aaggtggtgg agggcctggc 20340
ctccggcatc aacggggtgg tggacctggc caaccaggcc gtgcagaata agatcaacag 20400
cagactggac ccccggccgc cggtggagga ggtgccgccg gcgctggaga cggtgtcccc 20460
cgatgggcgt ggcgagaagc gcccgcggcc cgatagggaa gagaccactc tggtcacgca 20520
gaccgatgag ccgcccccgt atgaggaggc cctgaagcaa ggtctgccca ccacgcggcc 20580
catcgcgccc atggccaccg gggtggtggg ccgccacacc cccgccacgc tggacttgcc 20640
tccgcccgcc gatgtgccgc agcagcagaa ggcggcacag ccgggcccgc ccgcgaccgc 20700
ctcccgttcc tccgccggtc ctctgcgccg cgcggccagc ggcccccgcg ggggggtcgc 20760
gaggcacggc aactggcaga gcacgctgaa cagcatcgtg ggtctggggg tgcggtccgt 20820
gaagcgccgc cgatgctact gaatagctta gctaacgtgt tgtatgtgtg tatgcgccct 20880
atgtcgccgc cagaggagct gctgagtcgc cgccgttcgc gcgcccacca ccaccgccac 20940
tccgcccctc aagatggcga ccccatcgat gatgccgcag tggtcgtaca tgcacatctc 21000
gggccaggac gcctcggagt acctgagccc cgggctggtg cagttcgccc gcgccaccga 21060
gagctacttc agcctgagta acaagtttag gaaccccacg gtggcgccca cgcacgatgt 21120
gaccaccgac cggtctcagc gcctgacgct gcggttcatt cccgtggacc gcgaggacac 21180
cgcgtactcg tacaaggcgc ggttcaccct ggccgtgggc gacaaccgcg tgctggacat 21240
ggcctccacc tactttgaca tccgcggggt gctggaccgg ggtcccactt tcaagcccta 21300
ctctggcacc gcctacaact ccctggcccc caagggcgct cccaactcct gcgagtggga 21360
gcaagaggaa actcaggcag ttgaagaagc agcagaagag gaagaagaag atgctgacgg 21420
tcaagctgag gaagagcaag cagctaccaa aaagactcat gtatatgctc aggctcccct 21480
ttctggcgaa aaaattagta aagatggtct gcaaatagga acggacgcta cagctacaga 21540
acaaaaacct atttatgcag accctacatt ccagcccgaa ccccaaatcg gggagtccca 21600
gtggaatgag gcagatgcta cagtcgccgg cggtagagtg ctaaagaaat ctactcccat 21660
gaaaccatgc tatggttcct atgcaagacc cacaaatgct aatggaggtc agggtgtact 21720
aacggcaaat gcccagggac agctagaatc tcaggttgaa atgcaattct tttcaacttc 21780
tgaaaacgcc cgtaacgagg ctaacaacat tcagcccaaa ttggtgctgt atagtgagga 21840
tgtgcacatg gagaccccgg atacgcacct ttcttacaag cccgcaaaaa gcgatgacaa 21900
ttcaaaaatc atgctgggtc agcagtccat gcccaacaga cctaattaca tcggcttcag 21960
agacaacttt atcggcctca tgtattacaa tagcactggc aacatgggag tgcttgcagg 22020
tcaggcctct cagttgaatg cagtggtgga cttgcaagac agaaacacag aactgtccta 22080
ccagctcttg cttgattcca tgggtgacag aaccagatac ttttccatgt ggaatcaggc 22140
agtggacagt tatgacccag atgttagaat tattgaaaat catggaactg aagacgagct 22200
ccccaactat tgtttccctc tgggtggcat aggggtaact gacacttacc aggctgttaa 22260
aaccaacaat ggcaataacg ggggccaggt gacttggaca aaagatgaaa cttttgcaga 22320
tcgcaatgaa ataggggtgg gaaacaattt cgctatggag atcaacctca gtgccaacct 22380
gtggagaaac ttcctgtact ccaacgtggc gctgtaccta ccagacaagc ttaagtacaa 22440
cccctccaat gtggacatct ctgacaaccc caacacctac gattacatga acaagcgagt 22500
ggtggccccg gggctggtgg actgctacat caacctgggc gcgcgctggt cgctggacta 22560
catggacaac gtcaacccct tcaaccacca ccgcaatgcg ggcctgcgct accgctccat 22620
gctcctgggc aacgggcgct acgtgccctt ccacatccag gtgccccaga agttctttgc 22680
catcaagaac ctcctcctcc tgccgggctc ctacacctac gagtggaact tcaggaagga 22740
tgtcaacatg gtcctccaga gctctctggg taacgatctc agggtggacg gggccagcat 22800
caagttcgag agcatctgcc tctacgccac cttcttcccc atggcccaca acacggcctc 22860
cacgctcgag gccatgctca ggaacgacac caacgaccag tccttcaatg actacctctc 22920
cgccgccaac atgctctacc ccatacccgc caacgccacc aacgtcccca tctccatccc 22980
ctcgcgcaac tgggcggcct tccgcggctg ggccttcacc cgcctcaaga ccaaggagac 23040
cccctccctg ggctcgggat tcgaccccta ctacacctac tcgggctcca ttccctacct 23100
ggacggcacc ttctacctca accacacttt caagaaggtc tcggtcacct tcgactcctc 23160
ggtcagctgg ccgggcaacg accgtctgct cacccccaac gagttcgaga tcaagcgctc 23220
ggtcgacggg gagggctaca acgtggccca gtgcaacatg accaaggact ggttcctggt 23280
ccagatgctg gccaactaca acatcggcta ccagggcttc tacatcccag agagctacaa 23340
ggacaggatg tactccttct tcaggaactt ccagcccatg agccggcagg tggtggacca 23400
gaccaagtac aaggactacc aggaggtggg catcatccac cagcacaaca actcgggctt 23460
cgtgggctac ctcgccccca ccatgcgcga gggacaggcc taccccgcca acttccccta 23520
tccgctcata ggcaagaccg cggtcgacag catcacccag aaaaagttcc tctgcgaccg 23580
caccctctgg cgcatcccct tctccagcaa cttcatgtcc atgggtgcgc tctcggacct 23640
gggccagaac ttgctctacg ccaactccgc ccacgccctc gacatgacct tcgaggtcga 23700
ccccatggac gagcccaccc ttctctatgt tctgttcgaa gtctttgacg tggtccgggt 23760
ccaccagccg caccgcggcg tcatcgagac cgtgtacctg cgtacgccct tctcggccgg 23820
caacgccacc acctaaagaa gcaagccgca gtcatcgccg cctgcatgcc gtcgggttcc 23880
accgagcaag agctcagggc catcgtcaga gacctgggat gcgggcccta ttttttgggc 23940
accttcgaca agcgcttccc tggctttgtc tccccacaca agctggcctg cgccatcgtc 24000
aacacggccg gccgcgagac cgggggcgtg cactggctgg ccttcgcctg gaacccgcgc 24060
tccaaaacat gcttcctctt tgaccccttc ggcttttcgg accagcggct caagcaaatc 24120
tacgagttcg agtacgaggg cttgctgcgt cgcagcgcca tcgcctcctc gcccgaccgc 24180
tgcgtcaccc tcgaaaagtc cacccagacc gtgcaggggc ccgactcggc cgcctgcggt 24240
ctcttctgct gcatgtttct gcacgccttt gtgcactggc ctcagagtcc catggaccgc 24300
aaccccacca tgaacttgct gacgggggtg cccaactcca tgctccagag cccccaggtc 24360
gagcccaccc tgcgccgcaa ccaggagcag ctctacagct tcctggagcg ccactcgcct 24420
tacttccgcc gccacagcgc acagatcagg agggccacct ccttctgcca cttgcaagag 24480
atgcaagaag ggtaataacg atgtacacac tttttttctc aataaatggc atctttttat 24540
ttatacaagc tctctggggt attcatttcc caccaccacc cgccgttgtc gccatctggc 24600
tctatttaga aatcgaaagg gttctgccgg gagtcgccgt gcgccacggg cagggacacg 24660
ttgcgatact ggtagcgggt gccccacttg aactcgggca ccaccaggcg aggcagctcg 24720
gggaagtttt cgctccacag gctgcgggtc agcaccagcg cgttcatcag gtcgggcgcc 24780
gagatcttga agtcgcagtt ggggccgccg ccctgcgcgc gcgagttgcg gtacaccggg 24840
ttgcagcact ggaacaccaa cagcgccggg tgcttcacgc tggccagcac gctgcggtcg 24900
gagatcagct cggcgtccag gtcctccgcg ttgctcagcg cgaacggggt catcttgggc 24960
acttgccgcc ccaggaaggg cgcgtgcccc ggtttcgagt tgcagtcgca gcgcagcggg 25020
atcagcaggt gcccgtgccc ggactcggcg ttggggtaca gcgcgcgcat gaaggcctgc 25080
atctggcgga aggccatctg ggccttggcg ccctccgaga agaacatgcc gcaggacttg 25140
cccgagaact ggtttgcggg gcagctggcg tcgtgcaggc agcagcgcgc gtcggtgttg 25200
gcgatctgca ccacgttgcg cccccaccgg ttcttcacga tcttggcctt ggacgattgc 25260
tccttcagcg cgcgctgccc gttctcgctg gtcacatcca tctcgatcac atgttccttg 25320
ttcaccatgc tgctgccgtg cagacacttc agctcgccct ccgtctcggt gcagcggtgc 25380
tgccacagcg cgcagcccgt gggctcgaaa gacttgtagg tcacctccgc gaaggactgc 25440
aggtacccct gcaaaaagcg gcccatcatg gtcacgaagg tcttgttgct gctgaaggtc 25500
agctgcagcc cgcggtgctc ctcgttcagc caggtcttgc acacggccgc cagcgcctcc 25560
acctggtcgg gcagcatctt gaagttcacc ttcagctcat tctccacgtg gtacttgtcc 25620
atcagcgtgc gcgccgcctc catgcccttc tcccaggccg acaccagcgg caggctcacg 25680
gggttcttca ccatcaccgt ggccgccgcc tccgccgcgc tttcgctttc cgccccgctg 25740
ttctcttcct cttcctcctc ttcctcgccg ccgcccactc gcagcccccg caccacgggg 25800
tcgtcttcct gcaggcgctg caccttgcgc ttgccgttgc gcccctgctt gatgcgcacg 25860
ggcgggttgc tgaagcccac catcaccagc gcggcctctt cttgctcgtc ctcgctgtcc 25920
agaatgacct ccggggaggg ggggttggtc atcctcagta ccgaggcacg cttctttttc 25980
ttcctggggg cgttcgccag ctccgcggct gcggccgctg ccgaggtcga aggccgaggg 26040
ctgggcgtgc gcggcaccag cgcgtcctgc gagccgtcct cgtcctcctc ggactcgaga 26100
cggaggcggg cccgcttctt cgggggcgcg cggggcggcg gaggcggcgg cggcgacgga 26160
gacggggacg agacatcgtc cagggtgggt ggacggcggg ccgcgccgcg tccgcgctcg 26220
ggggtggtct cgcgctggtc ctcttcccga ctggccatct cccactgctc cttctcctat 26280
aggcagaaag agatcatgga gtctctcatg cgagtcgaga aggaggagga cagcctaacc 26340
gccccctctg agccctccac caccgccgcc accaccgcca atgccgccgc ggacgacgcg 26400
cccaccgaga ccaccgccag taccaccctc cccagcgacg cacccccgct cgagaatgaa 26460
gtgctgatcg agcaggaccc gggttttgtg agcggagagg aggatgaggt ggatgagaag 26520
gagaaggagg aggtcgccgc ctcagtgcca aaagaggata aaaagcaaga ccaggacgac 26580
gcagataagg atgagacagc agtcgggcgg gggaacggaa gccatgatgc tgatgacggc 26640
tacctagacg tgggagacga cgtgctgctt aagcacctgc accgccagtg cgtcatcgtc 26700
tgcgacgcgc tgcaggagcg ctgcgaagtg cccctggacg tggcggaggt cagccgcgcc 26760
tacgagcggc acctcttcgc gccgcacgtg ccccccaagc gccgggagaa cggcacctgc 26820
gagcccaacc cgcgtctcaa cttctacccg gtcttcgcgg tacccgaggt gctggccacc 26880
taccacatct ttttccaaaa ctgcaagatc cccctctcct gccgcgccaa ccgcacccgc 26940
gccgacaaaa ccctgaccct gcggcagggc gcccacatac ctgatatcgc ctctctggag 27000
gaagtgccca agatcttcga gggtctcggt cgcgacgaga aacgggcggc gaacgctctg 27060
cacggagaca gcgaaaacga gagtcactcg ggggtgctgg tggagctcga gggcgacaac 27120
gcgcgcctgg ccgtactcaa gcgcagcata gaggtcaccc actttgccta cccggcgctc 27180
aacctgcccc ccaaggtcat gagtgtggtc atgggcgagc tcatcatgcg ccgcgcccag 27240
cccctggccg cggatgcaaa cttgcaagag tcctccgagg aaggcctgcc cgcggtcagc 27300
gacgagcagc tggcgcgctg gctggagacc cgcgaccccg cgcagctgga ggagcggcgc 27360
aagctcatga tggccgcggt gctggtcacc gtggagctcg agtgtctgca gcgcttcttc 27420
gcggaccccg agatgcagcg caagctcgag gagaccctgc actacacctt ccgccagggc 27480
tacgtgcgcc aggcctgcaa gatctccaac gtggagctct gcaacctggt ctcctacctg 27540
ggcatcctgc acgagaaccg cctcgggcag aacgtcctgc actccaccct caaaggggag 27600
gcgcgccgcg actacatccg cgactgcgcc tacctcttcc tctgctacac ctggcagacg 27660
gccatggggg tctggcagca gtgcctggag gagcgcaacc tcaaggagct ggaaaagctc 27720
ctcaagcgca ccctcaggga cctctggacg ggcttcaacg agcgctcggt ggccgccgcg 27780
ctggcggaca tcatctttcc cgagcgcctg ctcaagaccc tgcagcaggg cctgcccgac 27840
ttcaccagcc agagcatgct gcagaacttc aggactttca tcctggagcg ctcgggcatc 27900
ctgccggcca cttgctgcgc gctgcccagc gacttcgtgc ccatcaagta cagggagtgc 27960
ccgccgccgc tctggggcca ctgctacctc ttccagctgg ccaactacct cgcctaccac 28020
tcggacctca tggaagacgt gagcggcgag ggcctgctcg agtgccactg ccgctgcaac 28080
ctctgcacgc cccaccgctc tctagtctgc aacccgcagc tgctcagcga gagtcagatt 28140
atcggtacct tcgagctgca gggtccctcg cctgacgaga agtccgcggc tccagggctg 28200
aaactcactc cggggctgtg gacttccgcc tacctacgca aatttgtacc tgaggactac 28260
cacgcccacg agatcaggtt ctacgaagac caatcccgcc cgcccaaggc ggagctcacc 28320
gcctgcgtca tcacccaggg gcacatcctg ggccaattgc aagccatcaa caaagcccgc 28380
cgagagttct tgctgaaaaa gggtcggggg gtgtacctgg acccccagtc cggcgaggag 28440
ctaaacccgc tacccccgcc gccgccccag cagcgggacc ttgcttccca ggatggcacc 28500
cagaaagaag cagcagccgc cgccgccgcc gcagccatac atgcttctgg aggaagagga 28560
ggaggactgg gacagtcagg cagaggaggt ttcggacgag gagcaggagg agatgatgga 28620
agactgggag gaggacagca gcctagacga ggaagcttca gaggccgaag aggtggcaga 28680
cgcaacacca tcgccctcgg tcgcagcccc ctcgccgggg cccctgaaat cctccgaacc 28740
cagcaccagc gctataacct ccgctcctcc ggcgccggcg ccacccgccc gcagacccaa 28800
ccgtagatgg gacaccacag gaaccggggt cggtaagtcc aagtgcccgc cgccgccacc 28860
gcagcagcag cagcagcagc gccagggcta ccgctcgtgg cgcgggcaca agaacgccat 28920
agtcgcctgc ttgcaagact gcgggggcaa catctctttc gcccgccgct tcctgctatt 28980
ccaccacggg gtcgcctttc cccgcaatgt cctgcattac taccgtcatc tctacagccc 29040
ctactgcagc ggcgacccag aggcggcagc ggcagccaca gcggcgacca ccacctagga 29100
agatatcctc cgcgggcaag acagcggcag cagcggccag gagacccgcg gcagcagcgg 29160
cgggagcggt gggcgcactg cgcctctcgc ccaacgaacc cctctcgacc cgggagctca 29220
gacacaggat cttccccact ttgtatgcca tcttccaaca gagcagaggc caggagcagg 29280
agctgaaaat aaaaaacaga tctctgcgct ccctcacccg cagctgtctg tatcacaaaa 29340
gcgaagatca gcttcggcgc acgctggagg acgcggaggc actcttcagc aaatactgcg 29400
cgctcactct taaagactag ctccgcgccc ttctcgaatt taggcgggag aaaactacgt 29460
catcgccggc cgccgcccag cccgcccagc cgagatgagc aaagagattc ccacgccata 29520
catgtggagc taccagccgc agatgggact cgcggcggga gcggcccagg actactccac 29580
ccgcatgaac tacatgagcg cgggacccca catgatctca caggtcaacg ggatccgcgc 29640
ccagcgaaac caaatactgc tggaacaggc ggccatcacc gccacgcccc gccataatct 29700
caacccccga aattggcccg ccgccctcgt gtaccaggaa accccctccg ccaccaccgt 29760
actacttccg cgtgacgccc aggccgaagt ccagatgact aactcagggg cgcagctcgc 29820
gggcggcttt cgtcacgggg cgcggccgct ccgaccaggt ataagacacc tgatgatcag 29880
aggccgaggt atccagctca acgacgagtc ggtgagctct tcgctcggtc tccgtccgga 29940
cggaactttc cagctcgccg gatccggccg ctcttcgttc acgccccgcc aggcgtacct 30000
gactctgcag acctcgtcct cggagccccg ctccggcggc atcggaaccc tccagttcgt 30060
ggaggagttc gtgccctcgg tctacttcaa ccccttctcg ggacctcccg gacgctaccc 30120
cgaccagttc attccgaact ttgacgcggt gaaggactcg gcggacggct acgactgaat 30180
gtcaggtgtc gaggcagagc agcttcgcct gagacacctc gagcactgcc gccgccacaa 30240
gtgcttcgcc cgcggttctg gtgagttctg ctactttcag ctacccgagg agcataccga 30300
ggggccggcg cacggcgtcc gcctgaccac ccagggcgag gttacctgtt ccctcatccg 30360
ggagtttacc ctccgtcccc tgctagtgga gcgggagcgg ggtccctgtg tcctaactat 30420
cgcctgcaac tgccctaacc ctggattaca tcaagatctt tgctgtcatc tctgtgctga 30480
gtttaataaa cgctgagatc agaatctact gggatttagt cccctttaac taatcaaaca 30540
ctggaatcaa taaaaagaat cacttactta aaatcagaca gcaggtctct gtccagttta 30600
ttcagcagca cctccttccc ctcctcccaa ctctggtact ccaaacgcct tctggcggca 30660
aacttcctcc acaccctgaa gggaatgtca gattcttgct cctgtccctc cgcacccact 30720
atcttcatgt tgttgcagat gaagcgcacc aaaacgtctg acgagagctt caaccccgtg 30780
tacccctatg acacggaaag cggccctccc tccgtccctt tcctcacccc tcccttcgtg 30840
tctcccgatg gattccaaga aagtcccccc ggggtcctgt ctctgaacct ggccgagccc 30900
ctggtcactt cccacggcat gctcgccctg aaaatgggaa gtggcctctc cctggacgac 30960
gctggcaacc tcacctctca agatatcacc accgctagcc ctcccctcaa aaaaaccaag 31020
accaacctca gcctagaaac ctcatccccc ctaactgtga gcacctcagg cgccctcacc 31080
gtagcagccg ccgctcccct ggcggtggcc ggcacctccc tcaccatgca atcagaggcc 31140
cccctgacag tacaggatgc aaaactcacc ctggccacca aaggccccct gaccgtgtct 31200
gaaggcaaac tggccttgca aacatcggcc ccgctgacgg ccgctgacag cagcaccctc 31260
acagtcagtg ccacaccacc ccttagcaca agcaatggca gcttgggtat tgacatgcaa 31320
gcccccattt acaccaccaa tggaaaacta ggacttaact ttggcgctcc cctgcatgtg 31380
gtagacagcc taaatgcact gactgtagtt actggccaag gtcttacgat aaacggaaca 31440
gccctacaaa ctagagtctc aggtgccctc aactatgaca catcaggaaa cctagaattg 31500
agagctgcag ggggtatgcg agttgatgca aatggtcaac ttatccttga tgtagcttac 31560
ccatttgatg cacaaaacaa tctcagcctt aggcttggac agggacccct gtttgttaac 31620
tctgcccaca acttggatgt taactacaac agaggcctct acctgttcac atctggaaat 31680
accaaaaagc tagaagttaa tatcaaaaca gccaagggtc tcatttatga tgacactgct 31740
atagcaatca atgcgggtga tgggctacag tttgactcag gctcagatac aaatccatta 31800
aaaactaaac ttggattagg actggattat gactccagca gagccataat tgctaaactg 31860
ggaactggcc taagctttga caacacaggt gccatcacag taggcaacaa aaatgatgac 31920
aagcttacct tgtggaccac accagaccca tcccctaact gtagaatcta ttcagagaaa 31980
gatgctaaat tcacacttgt tttgactaaa tgcggcagtc aggtgttggc cagcgtttct 32040
gttttatctg taaaaggtag ccttgcgccc atcagtggca cagtaactag tgctcagatt 32100
gtcctcagat ttgatgaaaa tggagttcta ctaagcaatt cttcccttga ccctcaatac 32160
tggaactaca gaaaaggtga ccttacagag ggcactgcat ataccaacgc agtgggattt 32220
atgcccaacc tcacagcata cccaaaaaca cagagccaaa ctgctaaaag caacattgta 32280
agtcaggttt acttgaatgg ggacaaatcc aaacccatga ccctcaccat taccctcaat 32340
ggaactaatg aaacaggaga tgccacagta agcacttact ccatgtcatt ctcatggaac 32400
tggaatggaa gtaattacat taatgaaacg ttccaaacca actccttcac cttctcctac 32460
atcgcccaag aataaaaagc atgacgctgt tgatttgatt caatgtgttt ctgttttatt 32520
ttcaagcaca acaaaatcat tcaagtcatt cttccatctt agcttaatag acacagtagc 32580
ttaatagacc cagtagtgca aagccccatt ctagcttata actagtggag aagtactcgc 32640
ctacatgggg gtagagtcat aatcgtgcat caggataggg cggtggtgct gcagcagcgc 32700
gcgaataaac tgctgccgcc gccgctccgt cctgcaggaa tacaacatgg cagtggtctc 32760
ctcagcgatg attcgcaccg cccgcagcat aaggcgcctt gtcctccggg cacagcagcg 32820
caccctgatc tcacttaaat cagcacagta actgcagcac agcaccacaa tattgttcaa 32880
aatcccacag tgcaaggcgc tgtatccaaa gctcatggcg gggaccacag aacccacgtg 32940
gccatcatac cacaagcgca ggtagattaa gtggcgaccc ctcataaaca cgctggacat 33000
aaacattacc tcttttggca tgttgtaatt caccacctcc cggtaccata taaacctctg 33060
attaaacatg gcgccatcca ccaccatcct aaaccagctg gccaaaacct gcccgccggc 33120
tatacactgc agggaaccgg gactggaaca atgacagtgg agagcccagg actcgtaacc 33180
atggatcatc atgctcgtca tgatatcaat gttggcacaa cacaggcaca cgtgcataca 33240
cttcctcagg attacaagct cctcccgcgt tagaaccata tcccagggaa caacccattc 33300
ctgaatcagc gtaaatccca cactgcaggg aagacctcgc acgtaactca cgttgtgcat 33360
tgtcaaagtg ttacattcgg gcagcagcgg atgatcctcc agtatggtag cgcgggtttc 33420
tgtctcaaaa ggaggtagac gatccctact gtacggagtg cgccgagaca accgagatcg 33480
tgttggtcgt agtgtcatgc caaatggaac gccggacgta gtcatatttc ctgaagtctt 33540
agatctctca acgcagcacc agcaccaaca cttcgcagtg taaaaggcca agtgccgaga 33600
gagtatatat aggaataaaa agtgacgtaa acgggcaaag tccaaaaaac gcccagaaaa 33660
accgcacgcg aacctacgcc ccgaaacgaa agccaaaaaa cactagacac tcccttccgg 33720
cgtcaacttc cgctttccca cgctacgtca cttgccccag tcaaacaaac tacatatccc 33780
gaacttccaa gtcgccacgc ccaaaacacc gcctacacct ccccgcccgc cggcccgccc 33840
ccaaacccgc ctcccgcccc gcgccccgcc ccgcgccgcc catctcatta tcatattggc 33900
ttcaatccaa aataaggtat attattgatg atggtttaaa cggatcctct agagtcgacc 33960
tgcaggcatg caagcttgag tattctatag tgtcacctaa atagcttggc gtaatcatgg 34020
tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa catacgagcc 34080
ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg 34140
ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc 34200
ggccaacgcg aaccccttgc ggccgcccgg gccgtcgacc aattctcatg tttgacagct 34260
tatcatcgaa tttctgccat tcatccgctt attatcactt attcaggcgt agcaaccagg 34320
cgtttaaggg caccaataac tgccttaaaa aaattacgcc ccgccctgcc actcatcgca 34380
gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaaa cggcatgatg 34440
aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt tgcccatggt 34500
gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac tggtgaaact 34560
cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag ggaaataggc 34620
caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact gccggaaatc 34680
gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta 34740
acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca tacggaattc 34800
cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa acttgtgctt 34860
atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct ggttataggt 34920
acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt gggatatatc 34980
aacggtggta tatccagtga tttttttctc cattttagct tccttagctc ctgaaaatct 35040
cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa agttggaacc 35100
tcttacgtgc cgatcaacgt ctcattttcg ccaaaagttg gcccagggct tcccggtatc 35160
aacagggaca ccaggattta tttattctgc gaagtgatct tccgtcacag gtatttattc 35220
gcgataagct catggagcgg cgtaaccgtc gcacaggaag gacagagaaa gcgcggatct 35280
gggaagtgac ggacagaacg gtcaggacct ggattgggga ggcggttgcc gccgctgctg 35340
ctgacggtgt gacgttctct gttccggtca caccacatac gttccgccat tcctatgcga 35400
tgcacatgct gtatgccggt ataccgctga aagttctgca aagcctgatg ggacataagt 35460
ccatcagttc aacggaagtc tacacgaagg tttttgcgct ggatgtggct gcccggcacc 35520
gggtgcagtt tgcgatgccg gagtctgatg cggttgcgat gctgaaacaa ttatcctgag 35580
aataaatgcc ttggccttta tatggaaatg tggaactgag tggatatgct gtttttgtct 35640
gttaaacaga gaagctggct gttatccact gagaagcgaa cgaaacagtc gggaaaatct 35700
cccattatcg tagagatccg cattattaat ctcaggagcc tgtgtagcgt ttataggaag 35760
tagtgttctg tcatgatgcc tgcaagcggt aacgaaaacg atttgaatat gccttcagga 35820
acaatagaaa tcttcgtgcg gtgttacgtt gaagtggagc ggattatgtc agcaatggac 35880
agaacaacct aatgaacaca gaaccatgat gtggtctgtc cttttacagc cagtagtgct 35940
cgccgcagtc gagcgacagg gcgaagccct cgagtgagcg aggaagcacc agggaacagc 36000
acttatatat tctgcttaca cacgatgcct gaaaaaactt cccttggggt tatccactta 36060
tccacgggga tatttttata attatttttt ttatagtttt tagatcttct tttttagagc 36120
gccttgtagg cctttatcca tgctggttct agagaaggtg ttgtgacaaa ttgccctttc 36180
agtgtgacaa atcaccctca aatgacagtc ctgtctgtga caaattgccc ttaaccctgt 36240
gacaaattgc cctcagaaga agctgttttt tcacaaagtt atccctgctt attgactctt 36300
ttttatttag tgtgacaatc taaaaacttg tcacacttca catggatctg tcatggcgga 36360
aacagcggtt atcaatcaca agaaacgtaa aaatagcccg cgaatcgtcc agtcaaacga 36420
cctcactgag gcggcatata gtctctcccg ggatcaaaaa cgtatgctgt atctgttcgt 36480
tgaccagatc agaaaatctg atggcaccct acaggaacat gacggtatct gcgagatcca 36540
tgttgctaaa tatgctgaaa tattcggatt gacctctgcg gaagccagta aggatatacg 36600
gcaggcattg aagagtttcg cggggaagga agtggttttt tatcgccctg aagaggatgc 36660
cggcgatgaa aaaggctatg aatcttttcc ttggtttatc aaacgtgcgc acagtccatc 36720
cagagggctt tacagtgtac atatcaaccc atatctcatt cccttcttta tcgggttaca 36780
gaaccggttt acgcagtttc ggcttagtga aacaaaagaa atcaccaatc cgtatgccat 36840
gcgtttatac gaatccctgt gtcagtatcg taagccggat ggctcaggca tcgtctctct 36900
gaaaatcgac tggatcatag agcgttacca gctgcctcaa agttaccagc gtatgcctga 36960
cttccgccgc cgcttcctgc aggtctgtgt taatgagatc aacagcagaa ctccaatgcg 37020
cctctcatac attgagaaaa agaaaggccg ccagacgact catatcgtat tttccttccg 37080
cgatatcact tccatgacga caggatagtc tgagggttat ctgtcacaga tttgagggtg 37140
gttcgtcaca tttgttctga cctactgagg gtaatttgtc acagttttgc tgtttccttc 37200
agcctgcatg gattttctca tactttttga actgtaattt ttaaggaagc caaatttgag 37260
ggcagtttgt cacagttgat ttccttctct ttcccttcgt catgtgacct gatatcgggg 37320
gttagttcgt catcattgat gagggttgat tatcacagtt tattactctg aattggctat 37380
ccgcgtgtgt acctctacct ggagtttttc ccacggtgga tatttcttct tgcgctgagc 37440
gtaagagcta tctgacagaa cagttcttct ttgcttcctc gccagttcgc tcgctatgct 37500
cggttacacg gctgcggcga gcgctagtga taataagtga ctgaggtatg tgctcttctt 37560
atctcctttt gtagtgttgc tcttatttta aacaactttg cggttttttg atgactttgc 37620
gattttgttg ttgctttgca gtaaattgca agatttaata aaaaaacgca aagcaatgat 37680
taaaggatgt tcagaatgaa actcatggaa acacttaacc agtgcataaa cgctggtcat 37740
gaaatgacga aggctatcgc cattgcacag tttaatgatg acagcccgga agcgaggaaa 37800
ataacccggc gctggagaat aggtgaagca gcggatttag ttggggtttc ttctcaggct 37860
atcagagatg ccgagaaagc agggcgacta ccgcacccgg atatggaaat tcgaggacgg 37920
gttgagcaac gtgttggtta tacaattgaa caaattaatc atatgcgtga tgtgtttggt 37980
acgcgattgc gacgtgctga agacgtattt ccaccggtga tcggggttgc tgcccataaa 38040
ggtggcgttt acaaaacctc agtttctgtt catcttgctc aggatctggc tctgaagggg 38100
ctacgtgttt tgctcgtgga aggtaacgac ccccagggaa cagcctcaat gtatcacgga 38160
tgggtaccag atcttcatat tcatgcagaa gacactctcc tgcctttcta tcttggggaa 38220
aaggacgatg tcacttatgc aataaagccc acttgctggc cggggcttga cattattcct 38280
tcctgtctgg ctctgcaccg tattgaaact gagttaatgg gcaaatttga tgaaggtaaa 38340
ctgcccaccg atccacacct gatgctccga ctggccattg aaactgttgc tcatgactat 38400
gatgtcatag ttattgacag cgcgcctaac ctgggtatcg gcacgattaa tgtcgtatgt 38460
gctgctgatg tgctgattgt tcccacgcct gctgagttgt ttgactacac ctccgcactg 38520
cagtttttcg atatgcttcg tgatctgctc aagaacgttg atcttaaagg gttcgagcct 38580
gatgtacgta ttttgcttac caaatacagc aatagtaatg gctctcagtc cccgtggatg 38640
gaggagcaaa ttcgggatgc ctggggaagc atggttctaa aaaatgttgt acgtgaaacg 38700
gatgaagttg gtaaaggtca gatccggatg agaactgttt ttgaacaggc cattgatcaa 38760
cgctcttcaa ctggtgcctg gagaaatgct ctttctattt gggaacctgt ctgcaatgaa 38820
attttcgatc gtctgattaa accacgctgg gagattagat aatgaagcgt gcgcctgtta 38880
ttccaaaaca tacgctcaat actcaaccgg ttgaagatac ttcgttatcg acaccagctg 38940
ccccgatggt ggattcgtta attgcgcgcg taggagtaat ggctcgcggt aatgccatta 39000
ctttgcctgt atgtggtcgg gatgtgaagt ttactcttga agtgctccgg ggtgatagtg 39060
ttgagaagac ctctcgggta tggtcaggta atgaacgtga ccaggagctg cttactgagg 39120
acgcactgga tgatctcatc ccttcttttc tactgactgg tcaacagaca ccggcgttcg 39180
gtcgaagagt atctggtgtc atagaaattg ccgatgggag tcgccgtcgt aaagctgctg 39240
cacttaccga aagtgattat cgtgttctgg ttggcgagct ggatgatgag cagatggctg 39300
cattatccag attgggtaac gattatcgcc caacaagtgc ttatgaacgt ggtcagcgtt 39360
atgcaagccg attgcagaat gaatttgctg gaaatatttc tgcgctggct gatgcggaaa 39420
atatttcacg taagattatt acccgctgta tcaacaccgc caaattgcct aaatcagttg 39480
ttgctctttt ttctcacccc ggtgaactat ctgcccggtc aggtgatgca cttcaaaaag 39540
cctttacaga taaagaggaa ttacttaagc agcaggcatc taaccttcat gagcagaaaa 39600
aagctggggt gatatttgaa gctgaagaag ttatcactct tttaacttct gtgcttaaaa 39660
cgtcatctgc atcaagaact agtttaagct cacgacatca gtttgctcct ggagcgacag 39720
tattgtataa gggcgataaa atggtgctta acctggacag gtctcgtgtt ccaactgagt 39780
gtatagagaa aattgaggcc attcttaagg aacttgaaaa gccagcaccc tgatgcgacc 39840
acgttttagt ctacgtttat ctgtctttac ttaatgtcct ttgttacagg ccagaaagca 39900
taactggcct gaatattctc tctgggccca ctgttccact tgtatcgtcg gtctgataat 39960
cagactggga ccacggtccc actcgtatcg tcggtctgat tattagtctg ggaccacggt 40020
cccactcgta tcgtcggtct gattattagt ctgggaccac ggtcccactc gtatcgtcgg 40080
tctgataatc agactgggac cacggtccca ctcgtatcgt cggtctgatt attagtctgg 40140
gaccatggtc ccactcgtat cgtcggtctg attattagtc tgggaccacg gtcccactcg 40200
tatcgtcggt ctgattatta gtctggaacc acggtcccac tcgtatcgtc ggtctgatta 40260
ttagtctggg accacggtcc cactcgtatc gtcggtctga ttattagtct gggaccacga 40320
tcccactcgt gttgtcggtc tgattatcgg tctgggacca cggtcccact tgtattgtcg 40380
atcagactat cagcgtgaga ctacgattcc atcaatgcct gtcaagggca agtattgaca 40440
tgtcgtcgta acctgtagaa cggagtaacc tcggtgtgcg gttgtatgcc tgctgtggat 40500
tgctgctgtg tcctgcttat ccacaacatt ttgcgcacgg ttatgtggac aaaatacctg 40560
gttacccagg ccgtgccggc acgttaaccg ggctgcatcc gatgcaagtg tgtcgctgtc 40620
gacgagctcg cgagctcgga catgaggttg ccccgtattc agtgtcgctg atttgtattg 40680
tctgaagttg tttttacgtt aagttgatgc agatcaatta atacgatacc tgcgtcataa 40740
ttgattattt gacgtggttt gatggcctcc acgcacgttg tgatatgtag atgataatca 40800
ttatcacttt acgggtcctt tccggtgatc cgacaggtta cggggcggcg acctcgcggg 40860
ttttcgctat ttatgaaaat tttccggttt aaggcgtttc cgttcttctt cgtcataact 40920
taatgttttt atttaaaata ccctctgaaa agaaaggaaa cgacaggtgc tgaaagcgag 40980
ctttttggcc tctgtcgttt cctttctctg tttttgtccg tggaatgaac aatggaagtc 41040
cgagctcatc gctaataact tcgtatagca tacattatac gaagttatat tcgatgcggc 41100
cgcaaggggt tcgcgtcagc gggtgttggc gggtgtcggg gctggcttaa ctatgcggca 41160
tcagagcaga ttgtactgag agtgcaccat atgcggtgtg aaataccgca cagatgcgta 41220
aggagaaaat accgcatcag gcgccattcg ccattcaggc tgcgcaactg ttgggaaggg 41280
cgatcggtgc gggcctcttc gctattacgc cagctggcga aagggggatg tgctgcaagg 41340
cgattaagtt gggtaacgcc agggttttcc cagtcacgac gttgtaaaac gacggccagt 41400
gaattgtaat acgactcact atagggcgaa ttcgagctcg gtacccgggg atcctcgttt 41460
aaac 41464
<210> 52
<211> 43711
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (15388)..(15388)
<223> a, c, t, g, unknown or other
<400> 52
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg tccgaggact ttctgattct gatcgccatc 1380
ctggtgatcg tgattctcgt gggcacaatc acaaccctgg tgggcgccat cggcggcatt 1440
agggccagga ggagcttcct cttcatttgc atcttcttcc tgttcctctc cctcttcctg 1500
acaatcctcg ccctgctgct gggcttcagc tggctcctgc tggtggccat cctgttctgg 1560
gtgctctggc tggtcatcct cattctgctg ctgctggtgt accctattcc tcaccacccc 1620
ctgcccacct ccctcaggtt tagaatgaag cagagggtga gcagcgaccc cacaggttct 1680
gacagaagcc ctcagggcag ccataatagc ctgaactccc ccgatgagga ggaccccaag 1740
gatgacacca agcaacctct gtgcaacatg acccagggcg gacctcccgt caatggacag 1800
ctcctcggac aacatgctca atgcccccct cactatccct gctgccatat tcagcatccc 1860
gacggagagg attccgatgg agacgatggc aagtcctggg gcgatgccgg agaggaagac 1920
aatggcccta acgaccctaa caccgccagc accagagagt ccatttacga ggacctcaga 1980
taccccacaa gggacgccaa tggcgagtat gagaacgtgg gatacccccc tagggacgga 2040
gatgcccctc ataggctcgg agagcctgtg tatgacgatg tggagcaagc caccgctaac 2100
gaggtgagaa tctcccctct gttcagactg ccctacggaa gcgctttcgg acctggcccc 2160
cagcctggac ccattctgga gagctccaca tggggctttc tggtcttcac acagacctcc 2220
ctgttcgccg acgacattgc cgacgctatt agggactact gcacaaccca ccctggcccc 2280
acaaggaaca cccaggtggt cctcatgaac ttcgagggca gcggagtgcc cctgcctatg 2340
ttttttcccc ctggagagga gacagaagag cagagagagg gcgatagagc tagcgactcc 2400
gacgagtccg aagacgctca gatcctgacc gtgttctgcc tgttttgcca gtggacactc 2460
tttatctgcc tgggaatcag gatgatctgt aactggaggg gcaaactcac caggatcatc 2520
tgcctgaagt tctgcctcta cggactgatt tccgcctccc tgtccttcgg ctggtacgct 2580
tttctgaagg aagtgaccct ccccaccaca gccaccgttg atcctaggca actccccctg 2640
ttcctcttca tcctgagctc cgtgctggtg attctcgcca tcatgatgga gtttcaaaca 2700
tcctccagcc tcttcgctgc tctgttcgtg attatcgccg gaatgctgtg cgtcacagtg 2760
ggcgtgattt ttctgctggc tggcgtcaag cctctcctga gcggcatgat ctgcgcctcc 2820
ggcatcacaa tgctcgtgct cggcgtcgtg ctgctggtgg tgtgcaccag aagccccagc 2880
ccttgtcatc acagggatga acccccctcc agaagcccca gccctcaacc caccgtctcc 2940
gagcagtccc agcagtcccc caggcagcag agccctcaag gcacatccca gggttctaca 3000
agacctcagg tgcctggagg cgccaccacc agaaaaagag gcggcgtgag aggccaacct 3060
gccaagtgtc acggcaagta caccacaacc gccgagggac tgaccgctct cctgaatagg 3120
aggcacagcc ccaggacatc caacgagggc aggtggatga atggagtcat ggctgtgaac 3180
ctctccaaat ggcccctgta cagcctgagg agagccctgg ccctcgccat ggctcctaga 3240
aggaggctct ccggccctcc ctggctgaca gtgctgctgc tgctgtccac actgagcgtg 3300
gccgccctgc tgattctctt cctgattttc agcgccggcg ccaccattag cacagaagcc 3360
agcctgctgg tcctgctcct gctgtttgtg accctgctgc tgcctctcct gtcctccaac 3420
ggactccagc tccctgccgc cctgattctg atccagtgtt tcctcctggc cgctgattat 3480
ctcgcctacc tgattctgcc taccattatg cccaggggca gaagcacagg aaggaagggc 3540
agggacacag agaaagagag gagcagatcc cctctcagag ctcctggcgg ttctgatgga 3600
cccagcacaa gggctggctg tggagccgga ccctgtcagc tgagcagccc catcgccgga 3660
aacaacggca atgaaggcgg cgagggcgac gactacaaga gctggaggaa gcccgaggaa 3720
gaggacaacg gccccaatga ccccaatacc aacaacagga ttgaggatgg agacggcgac 3780
gacggaaaat cctggaggaa tcctgaggag gaggataaca gaaagcagga caggctgggc 3840
accaagcctt tcatggccgg ccactggtat gagagcgtga ttcccggcct gttcctctgc 3900
cccctgatcc tcccttccct gttctggatt tgctccctgc tgaccttcct ggtgggccac 3960
ggagccaata ttgtgagcgc cgtcctgttc ctcgtgctgg cttggtgtct cctcattgcc 4020
aactggaacg tgacaagaga ggacttcgtg tccggcagga gaagctccat gagcagcctg 4080
tccgtggccg cttccaccgc cacagccatg ttcgccagct tcctcaccct gagctttgat 4140
ggcctgggcc tgctgctgtt tggcaccgcc ctggtgatcc agacaattta cgtgctgtat 4200
ctggtggtca tggagatcac cgtgtggatc atgatgttta ggtatctcca cttttggatc 4260
accctgctgt tcctgctgag ccccattatt ctctccgtcg cctgtctcat catccaatcc 4320
tccgccctgc tgatcgaggc tgtggtcgtc accaccatca cagtcctggc catttttctg 4380
tggctccctc ctcaaggcgc tgaggccgat ctcggcaccg ccctgctgat tctgaatacc 4440
gccctgtgcc tggtcgtgct gatcctgacc gctatcccta catgatgatg agcggccgcg 4500
atctgctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 4560
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 4620
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 4680
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ccgatcagcg 4740
atcgctgagg tgggtgagtg ggcgtggcct ggggtggtca tgaaaatata taagttgggg 4800
gtcttagggt ctctttattt gtgttgcaga gaccgccgga gccatgagcg ggagcagcag 4860
cagcagcagt agcagcagcg ccttggatgg cagcatcgtg agcccttatt tgacgacgcg 4920
gatgccccac tgggccgggg tgcgtcagaa tgtgatgggc tccagcatcg acggccgacc 4980
cgtcctgccc gcaaattccg ccacgctgac ctatgcgacc gtcgcgggga cgccgttgga 5040
cgccaccgcc gccgccgccg ccaccgcagc cgcctcggcc gtgcgcagcc tggccacgga 5100
ctttgcattc ctgggaccac tggcgacagg ggctacttct cgggccgctg ctgccgccgt 5160
tcgcgatgac aagctgaccg ccctgctggc gcagttggat gcgcttactc gggaactggg 5220
tgacctttct cagcaggtca tggccctgcg ccagcaggtc tcctccctgc aagctggcgg 5280
gaatgcttct cccacaaatg ccgtttaaga taaataaaac cagactctgt ttggattaaa 5340
gaaaagtagc aagtgcattg ctctctttat ttcataattt tccgcgcgcg ataggcccta 5400
gaccagcgtt ctcggtcgtt gagggtgcgg tgtatcttct ccaggacgtg gtagaggtgg 5460
ctctggacgt tgagatacat gggcatgagc ccgtcccggg ggtggaggta gcaccactgc 5520
agagcttcat gctccggggt ggtgttgtag atgatccagt cgtagcagga gcgctgggca 5580
tggtgcctaa aaatgtcctt cagcagcagg ccgatggcca gggggaggcc cttggtgtaa 5640
gtgtttacaa aacggttaag ttgggaaggg tgcattcggg gagagatgat gtgcatcttg 5700
gactgtattt ttagattggc gatgtttccg cccagatccc ttctgggatt catgttgtgc 5760
aggaccacca gtacagtgta tccggtgcac ttggggaatt tgtcatgcag cttagaggga 5820
aaagcgtgga agaacttgga gacgcctttg tggcctccca gattttccat gcattcgtcc 5880
atgatgatgg caatgggccc gcgggaggca gcttgggcaa agatatttct ggggtcgctg 5940
acgtcgtagt tgtgttccag ggtgaggtcg tcataggcca tttttacaaa gcgcgggcgg 6000
agggtgcccg actgggggat gatggtcccc tctggccctg gggcgtagtt gccctcgcag 6060
atctgcattt cccaggcctt aatctcggag gggggaatca tatccacctg cggggcgatg 6120
aagaaaacgg tttccggagc cggggagatt aactgggatg agagcaggtt tctaagcagc 6180
tgtgattttc cacaaccggt gggcccataa ataacaccta taaccggttg cagctggtag 6240
tttagagagc tgcagctgcc gtcgtcccgg aggagggggg ccacctcgtt gagcatgtcc 6300
ctgacgcgca tgttctcccc gaccagatcc gccagaaggc gctcgccgcc cagggacagc 6360
agctcttgca aggaagcaaa gtttttcagc ggcttgaggc cgtccgccgt gggcatgttt 6420
ttcagggtct ggctcagcag ctccaggcgg tcccagagct cggtgacgtg ctctacggca 6480
tctctatcca gcatatctcc tcgtttcgcg ggttggggcg actttcgctg tagggcacca 6540
agcggtggtc gtccagcggg gccagagtca tgtccttcca tgggcgcagg gtcctcgtca 6600
gggtggtctg ggtcacggtg aaggggtgcg ctccgggctg agcgcttgcc aaggtgcgct 6660
tgaggctggt tctgctggtg ctgaagcgct gccggtcttc gccctgcgcg tcggccaggt 6720
agcatttgac catggtgtca tagtccagcc cctccgcggc gtgtcccttg gcgcgcagct 6780
tgcccttgga ggtggcgccg cacgaggggc agagcaggct cttgagcgcg tagagcttgg 6840
gggcgaggaa gaccgattcg ggggagtagg cgtccgcgcc gcagaccccg cacacggtct 6900
cgcactccac cagccaggtg agctcggggc gcgccgggtc aaaaaccagg tttcccccat 6960
gctttttgat gcgtttctta cctcgggtct ccatgaggtg gtgtccccgc tcggtgacga 7020
agaggctgtc cgtgtctccg tagaccgact tgaggggtct tttctccagg ggggtccctc 7080
ggtcttcctc gtagaggaac tcggaccact ctgagacgaa ggcccgcgtc caggccagga 7140
cgaaggaggc tatgtgggag gggtagcggt cgttgtccac tagggggtcc accttctcca 7200
aggtgtgaag acacatgtcg ccttcctcgg cgtccaggaa ggtgattggc ttgtaggtgt 7260
aggccacgtg accgggggtt cctgacgggg gggtataaaa gggggtgggg gcgcgctcgt 7320
cgtcactctc ttccgcatcg ctgtctgcga gggccagctg ctggggtgag tattccctct 7380
cgaaggcggg catgacctcc gcgctgaggt tgtcagtttc caaaaacgag gaggatttga 7440
tgttcacctg tcccgaggtg atacctttga gggtacccgc gtccatctgg tcagaaaaca 7500
cgatcttttt attgtccagc ttggtggcga acgacccgta gagggcgttg gagagcagct 7560
tggcgatgga gcgcagggtc tggttcttgt ccctgtcggc gcgctccttg gccgcgatgt 7620
tgagctgcac gtactcgcgc gcgacgcagc gccactcggg gaagacggtg gtgcgctcgt 7680
cgggcaccag gcgcacgcgc cagccgcggt tgtgcagggt gaccaggtcc acgctggtgg 7740
cgacctcgcc gcgcaggcgc tcgttggtcc agcagagacg gccgcccttg cgcgagcaga 7800
aggggggcag ggggtcgagc tgggtctcgt ccggggggtc cgcgtccacg gtgaaaaccc 7860
cggggcgcag gcgcgcgtcg aagtagtcta tcttgcaacc ttgcatgtcc agcgcctgct 7920
gccagtcgcg ggcggcgagc gcgcgctcgt aggggttgag cggcgggccc cagggcatgg 7980
ggtgggtgag tgcggaggcg tacatgccgc agatgtcata gacgtagagg ggctcccgca 8040
ggaccccgat gtaggtgggg tagcagcggc cgccgcggat gctggcgcgc acgtagtcat 8100
acagctcgtg cgagggggcg aggaggtcgg ggcccaggtt ggtgcgggcg gggcgctccg 8160
cgcggaagac gatctgcctg aagatggcat gcgagttgga agagatggtg gggcgctgga 8220
agacgttgaa gctggcgtcc tgcaggccga cggcgtcgcg cacgaaggag gcgtaggagt 8280
cgcgcagctt gtgtaccagc tcggcggtga cctgcacgtc gagcgcgcag tagtcgaggg 8340
tctcgcggat gatgtcatat ttagcctgcc ccttcttttt ccacagctcg cggttgagga 8400
caaactcttc gcggtctttc cagtactctt ggatcgggaa accgtccggt tccgaacggt 8460
aagagcctag catgtagaac tggttgacgg cctggtaggc gcagcagccc ttctccacgg 8520
ggagggcgta ggcctgcgcg gccttgcgga gcgaggtgtg ggtcagggcg aaggtgtccc 8580
tgaccatgac tttgaggtac tggtgcttga agtcggagtc gtcgcagccg ccccgctccc 8640
agagcgagaa gtcggtgcgc ttcttggagc gggggttggg cagagcgaag gtgacatcgt 8700
tgaagaggat tttgcccgcg cggggcatga agttgcgggt gatgcggaag ggccccggca 8760
cttcagagcg gttgttgatg acctgggcgg cgagcacgat ctcgtcgaag ccgttgatgt 8820
tgtggcccac gatgtagagt tccaggaagc ggggccggcc ctttacggtg ggcagcttct 8880
ttagctcttc gtaggtgagc tcctcgggcg aggcgaggcc gtgctcggcc agggcccagt 8940
ccgcgaggtg cgggttgtct ctgaggaagg acttccagag gtcgcgggcc aggagggtct 9000
gcaggcggtc tctgaaggtc ctgaactggc ggcccacggc cattttttcg ggggtgatgc 9060
agtagaaggt gagggggtct tgctgccagc ggtcccagtc gagctgcagg gcgaggtcgc 9120
gcgcggcggt gaccaggcgc tcgtcgcccc cgaatttcat gaccagcatg aagggcacga 9180
gctgctttcc gaaggccccc atccaagtgt aggtctctac atcgtaggtg acaaagaggc 9240
gctccgtgcg aggatgcgag ccgatcggga agaactggat ctcccgccac cagttggagg 9300
agtggctgtt gatgtggtgg aagtagaagt cccgtcgccg ggccgaacac tcgtgctggc 9360
ttttgtaaaa gcgagcgcag tactggcagc gctgcacggg ctgtacctca tgcacgagat 9420
gcacctttcg cccgcgcacg aggaagccga ggggaaatct gagccccccg cctggctcgc 9480
ggcatggctg gttctcttct actttggatg cgtgtccgtc tccgtctggc tcctcgaggg 9540
gtgttacggt ggagcggacc accacgccgc gcgagccgca ggtccagata tcggcgcgcg 9600
gcggtcggag tttgatgacg acatcgcgca gctgggagct gtccatggtc tggagctccc 9660
gcggcggcgg caggtcagcc gggagttctt gcaggttcac ctcgcagagt cgggccaggg 9720
cgcggggcag gtctaggtgg tacctgatct ctaggggcgt gttggtggcg gcgtcgatgg 9780
cttgcaggag cccgcagccc cggggggcga cgacggtgcc ccgcggggtg gtggtggtgg 9840
tggcggtgca gctcagaagc ggtgccgcgg gcgggccccc ggaggtaggg ggggctccgg 9900
tcccgcgggc aggggcggca gcggcacgtc ggcgtggagc gcgggcagga gttggtgctg 9960
tgcccggagg ttgctggcga aggcgacgac gcggcggttg atctcctgga tctggcgcct 10020
ctgcgtgaag acgacgggcc cggtgagctt gaacctgaaa gagagttcga cagaatcaat 10080
ctcggtgtca ttgaccgcgg cctggcgcag gatctcctgc acgtctcccg agttgtcttg 10140
gtaggcgatc tcggccatga actgctcgat ctcttcctcc tggaggtctc cgcgtccggc 10200
gcgttccacg gtggccgcca ggtcgttgga gatgcgcccc atgagctgcg agaaggcgtt 10260
gagtccgccc tcgttccaga ctcggctgta gaccacgccc ccctggtcat cgcgggcgcg 10320
catgaccacc tgcgcgaggt tgagctccac gtgccgcgcg aagacggcgt agttgcgcag 10380
acgctggaag aggtagttga gggtggtggc ggtgtgctcg gccacgaaga agttcatgac 10440
ccagcggcgc aacgtggatt cgttgatgtc ccccaaggcc tccagccgtt ccatggcctc 10500
gtagaagtcc acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg tcaactcctc 10560
ctccagaaga cggatgagct cggcgacggt gtcgcgcacc tcgcgctcga aggctatggg 10620
gatctcttcc tccgctagca tcaccacctc ctcctcttcc tcctcttctg gcacttccat 10680
gatggcttcc tcctcttcgg ggggtggcgg cggcggcggt gggggagggg gcgctctgcg 10740
ccggcggcgg cgcaccggga ggcggtccac gaagcgcgcg atcatctccc cgcggcggcg 10800
gcgcatggtc tcggtgacgg cgcggccgtt ctcccggggg cgcagttgga agacgccgcc 10860
ggacatctgg tgctggggcg ggtggccgtg aggcagcgag acggcgctga cgatgcatct 10920
caacaattgc tgcgtaggta cgccgccgag ggacctgagg gagtccatat ccaccggatc 10980
cgaaaacctt tcgaggaagg cgtctaacca gtcgcagtcg caaggtaggc tgagcaccgt 11040
ggcgggcggc ggggggtggg gggagtgtct ggcggaggtg ctgctgatga tgtaattgaa 11100
gtaggcggac ttgacacggc ggatggtcga caggagcacc atgtccttgg gtccggcctg 11160
ctggatgcgg aggcggtcgg ctatgcccca ggcttcgttc tggcatcggc gcaggtcctt 11220
gtagtagtct tgcatgagcc tttccaccgg cacctcttct ccttcctctt ctgcttcttc 11280
catgtctgct tcggccctgg ggcggcgccg cgcccccctg ccccccatgc gcgtgacccc 11340
gaaccccctg agcggttgga gcagggccag gtcggcgacg acgcgctcgg ccaggatggc 11400
ctgctgcacc tgcgtgaggg tggtttggaa gtcatccaag tccacgaagc ggtggtaggc 11460
gcccgtgttg atggtgtagg tgcagttggc catgacggac cagttgacgg tctggtggcc 11520
cggttgcgac atctcggtgt acctgagtcg cgagtaggcg cgggagtcga agacgtagtc 11580
gttgcaagtc cgcaccaggt actggtagcc caccaggaag tgcggcggcg gctggcggta 11640
gaggggccag cgcagggtgg cgggggctcc gggggccagg tcttccagca tgaggcggtg 11700
gtaggcgtag atgtacctgg acatccaggt gatacccgcg gcggtggtgg aggcgcgcgg 11760
gaagtcgcgc acccggttcc agatgttgcg caggggcaga aagtgctcca tggtaggcgt 11820
gctctgtcca gtcagacgcg cgcagtcgtt gatactctag accagggaaa acgaaagccg 11880
gtcagcgggc actcttccgt ggtctggtga atagatcgca agggtatcat ggcggagggc 11940
ctcggttcga gccccgggtc cgggccggac ggtccgccat gatccacgcg gttaccgccc 12000
gcgtgtcgaa cccaggtgtg cgacgtcaga caacggtgga gtgttccttt tggcgttttt 12060
ctggccgggc gccggcgccg cgtaagagac taagccgcga aagcgaaagc agtaagtggc 12120
tcgctccccg tagccggagg gatccttgct aagggttgcg ttgcggcgaa ccccggttcg 12180
aatcccgtac tcgggccggc cggacccgcg gctaaggtgt tggattggcc tccccctcgt 12240
ataaagaccc cgcttgcgga ttgactccgg acacggggac gagccccttt tatttttgct 12300
ttccccagat gcatccggtg ctgcggcaga tgcgcccccc gccccagcag cagcaacaac 12360
accagcaaga gcggcagcaa cagcagcggg agtcatgcag ggccccctca cccaccctcg 12420
gcgggccggc cacctcggcg tccgcggccg tgtctggcgc ctgcggcggc ggcggggggc 12480
cggctgacga ccccgaggag cccccgcggc gcagggccag acactacctg gacctggagg 12540
agggcgaggg cctggcgcgg ctgggggcgc cgtctcccga gcgccacccg cgggtgcagc 12600
tgaagcgcga ctcgcgcgag gcgtacgtgc ctcggcagaa cctgttcagg gaccgcgcgg 12660
gcgaggagcc cgaggagatg cgggacagga ggttcagcgc agggcgggag ctgcggcagg 12720
ggctgaaccg cgagcggctg ctgcgcgagg aggactttga gcccgacgcg cggacgggga 12780
tcagccccgc gcgcgcgcac gtggcggccg ccgacctggt gacggcgtac gagcagacgg 12840
tgaaccagga gatcaacttc caaaagagtt tcaacaacca cgtgcgcacg ctggtggcgc 12900
gcgaggaggt gaccatcggg ctgatgcacc tgtgggactt tgtaagcgcg ctggtgcaga 12960
accccaacag caagcctctg acggcgcagc tgttcctgat agtgcagcac agcagggaca 13020
acgaggcgtt tagggacgcg ctgctgaaca tcaccgagcc cgagggtcgg tggctgctgg 13080
acctgattaa catcctgcag agcatagtgg tgcaggagcg cagcctgagc ctggccgaca 13140
aggtggcggc catcaactac tcgatgctga gcctgggcaa gttttacgcg cgcaagatct 13200
accagacgcc gtacgtgccc atagacaagg aggtgaagat cgacggtttt tacatgcgca 13260
tggcgctgaa ggtgctcacc ctgagcgacg acctgggcgt gtaccgcaac gagcgcatcc 13320
acaaggccgt gagcgtgagc cggcggcgcg agctgagcga ccgcgagctg atgcacagcc 13380
tgcagcgggc gctggcgggc gccggcagcg gcgacaggga ggcggagtcc tacttcgatg 13440
cgggggcgga cctgcgctgg gcgcccagcc ggcgggccct ggaggccgcg ggggtccgcg 13500
aggactatga cgaggacggc gaggaggatg aggagtacga gctagaggag ggcgagtacc 13560
tggactaaac cgcgggtggt gtttccggta gatgcaagac ccgaacgtgg tggacccggc 13620
gctgcgggcg gctctgcaga gccagccgtc cggccttaac tcctcagacg actggcgaca 13680
ggtcatggac cgcatcatgt cgctgacggc gcgtaacccg gacgcgttcc ggcagcagcc 13740
gcaggccaac aggctctccg ccatcctgga ggcggtggtg cctgcgcgct cgaaccccac 13800
gcacgagaag gtgctggcca tagtgaacgc gctggccgag aacagggcca tccgcccgga 13860
cgaggccggg ctggtgtacg acgcgctgct gcagcgcgtg gcccgctaca acagcggcaa 13920
cgtgcagacc aacctggacc ggctggtggg ggacgtgcgc gaggcggtgg cgcagcgcga 13980
gcgcgcggat cggcagggca acctgggctc catggtggcg ctgaatgcct tcctgagcac 14040
gcagccggcc aacgtgccgc gggggcagga agactacacc aactttgtga gcgcgctgcg 14100
gctgatggtg accgagaccc cccagagcga ggtgtaccag tcgggcccgg actacttctt 14160
ccagaccagc agacagggcc tgcagacggt gaacctgagc caggctttca agaacctgcg 14220
ggggctgtgg ggcgtgaagg cgcccaccgg cgaccgggcg acggtgtcca gcctgctgac 14280
gcccaactcg cgcctgctgc tgctgctgat cgcgccgttc acggacagcg gcagcgtgtc 14340
ccgggacacc tacctggggc acctgctgac cctgtaccgc gaggccatcg ggcaggcgca 14400
ggtggacgag cacaccttcc aggagatcac cagcgtgagc cgcgcgctgg ggcaggagga 14460
cacgagcagc ctggaggcga ctctgaacta cctgctgacc aaccggcggc agaagattcc 14520
ctcgctgcac agcctgacct ccgaggagga gcgcatcttg cgctacgtgc agcagagcgt 14580
gagcctgaac ctgatgcgcg acggggtgac gcccagcgtg gcgctggaca tgaccgcgcg 14640
caacatggaa ccgggcatgt acgccgcgca ccggccttac atcaaccgcc tgatggacta 14700
cctgcatcgc gcggcggccg tgaaccccga gtactttacc aacgccatcc tgaacccgca 14760
ctggctcccg ccgcccgggt tctacagcgg gggcttcgag gtcccggaga ccaacgatgg 14820
cttcctgtgg gacgacatgg acgacagcgt gttctccccg cggccgcagg cgctggcgga 14880
agcgtccctg ctgcgtccca agaaggagga ggaggaggag gcgagtcgcc gccgcggcag 14940
cagcggcgtg gcttctctgt ccgagctggg ggcggcagcc gccgcgcgcc ccgggtccct 15000
gggcggcagc ccctttccga gcctggtggg gtctctgcac agcgagcgca ccacccgccc 15060
tcggctgctg ggcgaggacg agtacctgaa taactccctg ctgcagccgg tgcgggagaa 15120
aaacctgcct cccgccttcc ccaacaacgg gatagagagc ctggtggaca agatgagcag 15180
atggaagacc tatgcgcagg agcacaggga cgcgcctgcg ctccggccgc ccacgcggcg 15240
ccagcgccac gaccggcagc gggggctggt gtgggatgac gaggactccg cggacgatag 15300
cagcgtgctg gacctgggag ggagcggcaa cccgttcgcg cacctgcgcc cccgcctggg 15360
gaggatgttt taaaaaaaaa aaaaaaangc aagaagcatg atgcaaaaat taaataaaac 15420
tcaccaaggc catggcgacc gagcgttggt ttcttgtgtt cccttcagta tgcggcgcgc 15480
ggcgatgtac caggagggac ctcctccctc ttacgagagc gtggtgggcg cggcggcggc 15540
ggcgccctct tctccctttg cgtcgcagct gctggagccg ccgtacgtgc ctccgcgcta 15600
cctgcggcct acggggggga gaaacagcat ccgttactcg gagctggcgc ccctgttcga 15660
caccacccgg gtgtacctgg tggacaacaa gtcggcggac gtggcctccc tgaactacca 15720
gaacgaccac agcaattttt tgaccacggt catccagaac aatgactaca gcccgagcga 15780
ggccagcacc cagaccatca atctggatga ccggtcgcac tggggcggcg acctgaaaac 15840
catcctgcac accaacatgc ccaacgtgaa cgagttcatg ttcaccaata agttcaaggc 15900
gcgggtgatg gtgtcgcgct cgcacaccaa ggaagaccgg gtggagctga agtacgagtg 15960
ggtggagttc gagctgccag agggcaacta ctccgagacc atgaccattg acctgatgaa 16020
caacgcgatc gtggagcact atctgaaagt gggcaggcag aacggggtcc tggagagcga 16080
catcggggtc aagttcgaca ccaggaactt ccgcctgggg ctggaccccg tgaccgggct 16140
ggttatgccc ggggtgtaca ccaacgaggc cttccatccc gacatcatcc tgctgcccgg 16200
ctgcggggtg gacttcactt acagccgcct gagcaacctc ctgggcatcc gcaagcggca 16260
gcccttccag gagggcttca ggatcaccta cgaggacctg gaggggggca acatccccgc 16320
gctcctcgat gtggaggcct accaggatag cttgaaggaa aatgaggcgg gacaggagga 16380
taccgccccc gccgcctccg ccgccgccga gcagggcgag gatgctgctg acaccgcggc 16440
cgcggacggg gcagaggccg accccgctat ggtggtggag gctcccgagc aggaggagga 16500
catgaatgac agtgcggtgc gcggagacac cttcgtcacc cggggggagg aaaagcaagc 16560
ggaggccgag gccgcggccg aggaaaagca actggcggca gcagcggcgg cggcggcgtt 16620
ggccgcggcg gaggctgagt ctgaggggac caagcccgcc aaggagcccg tgattaagcc 16680
cctgaccgaa gatagcaaga agcgcagtta caacctgctc aaggacagca ccaacaccgc 16740
gtaccgcagc tggtacctgg cctacaacta cggcgacccg tcgacggggg tgcgctcctg 16800
gaccctgctg tgcacgccgg acgtgacctg cggctcggag caggtgtact ggtcgctgcc 16860
cgacatgatg caagaccccg tgaccttccg ctccacgcgg caggtcagca acttcccggt 16920
ggtgggcgcc gagctgctgc ccgtgcactc caagagcttc tacaacgacc aggccgtcta 16980
ctcccagctc atccgccagt tcacctctct gacccacgtg ttcaatcgct ttcctgagaa 17040
ccagattctg gcgcgcccgc ccgcccccac catcaccacc gtcagtgaaa acgttcctgc 17100
tctcacagat cacgggacgc taccgctgcg caacagcatc ggaggagtcc agcgagtgac 17160
cgttactgac gccagacgcc gcacctgccc ctacgtttac aaggccttgg gcatagtctc 17220
gccgcgcgtc ctttccagcc gcactttttg agcaacacca ccatcatgtc catcctgatc 17280
tcacccagca ataactccgg ctggggactg ctgcgcgcgc ccagcaagat gttcggaggg 17340
gcgaggaagc gttccgagca gcaccccgtg cgcgtgcgcg ggcacttccg cgccccctgg 17400
ggagcgcaca aacgcggccg cgcggggcgc accaccgtgg acgacgccat cgactcggtg 17460
gtggagcagg cgcgcaacta caggcccgcg gtctctaccg tggacgcggc catccagacc 17520
gtggtgcggg gcgcgcggcg gtacgccaag ctgaagagcc gccggaagcg cgtggcccgc 17580
cgccaccgcc gccgacccgg ggccgccgcc aaacgcgccg ccgcggccct gcttcgccgg 17640
gccaagcgca cgggccgccg cgccgccatg agggccgcgc gccgcttggc cgccggcatc 17700
accgccgcca ccatggcccc ccgtacccga agacgcgcgg ccgccgccgc cgccgccgcc 17760
atcagtgaca tggccagcag gcgccggggc aacgtgtact gggtgcgcga ctcggtgacc 17820
ggcacgcgcg tgcccgtgcg cttccgcccc ccgcggactt gagatgatgt gaaaaaacaa 17880
cactgagtct cctgctgttg tgtgtatccc agcggcggcg gcgcgcgcag cgtcatgtcc 17940
aagcgcaaaa tcaaagaaga gatgctccag gtcgtcgcgc cggagatcta tgggcccccg 18000
aagaaggaag agcaggattc gaagccccgc aagataaagc gggtcaaaaa gaaaaagaaa 18060
gatgatgacg atgccgatgg ggaggtggag ttcctgcgcg ccacggcgcc caggcgcccg 18120
gtgcagtgga agggccggcg cgtaaagcgc gtcctgcgcc ccggcaccgc ggtggtcttc 18180
acgcccggcg agcgctccac ccggactttc aagcgcgtct atgacgaggt gtacggcgac 18240
gaagacctgc tggagcaggc caacgagcgc ttcggagagt ttgcttacgg gaagcgtcag 18300
cgggcgctgg ggaaggagga cctgctggcg ctgccgctgg accagggcaa ccccaccccc 18360
agtctgaagc ccgtgaccct gcagcaggtg ctgccgagca gcgcaccctc cgaggcgaag 18420
cggggtctga agcgcgaggg cggcgacctg gcgcccaccg tgcagctcat ggtgcccaag 18480
cggcagaggc tggaggatgt gctggagaaa atgaaagtag accccggtct gcagccggac 18540
atcagggtcc gccccatcaa gcaggtggcg ccgggcctcg gcgtgcagac cgtggacgtg 18600
gtcatcccca ccggcaactc ccccgccgcc gccaccacta ccgctgcctc cacggacatg 18660
gagacacaga ccgatcccgc cgcagccgca gccgcagccg ccgccgcgac ctcctcggcg 18720
gaggtgcaga cggacccctg gctgccgccg gcgatgtcag ctccccgcgc gcgtcgcggg 18780
cgcaggaagt acggcgccgc caacgcgctc ctgcccgagt acgccttgca tccttccatc 18840
gcgcccaccc ccggctaccg aggctatacc taccgcccgc gaagagccaa gggttccacc 18900
cgccgtcccc gccgacgcgc cgccgccacc acccgccgcc gccgccgcag acgccagccc 18960
gcactggctc cagtctccgt gaggaaagtg gcgcgcgacg gacacaccct ggtgctgccc 19020
agggcgcgct accaccccag catcgtttaa aagcctgttg tggttcttgc agatatggcc 19080
ctcacttgcc gcctccgttt cccggtgccg ggataccgag gaggaagatc gcgccgcagg 19140
aggggtctgg ccggccgcgg cctgagcgga ggcagccgcc gcgcgcaccg gcggcgacgc 19200
gccaccagcc gacgcatgcg cggcggggtg ctgcccctgt taatccccct gatcgccgcg 19260
gcgatcggcg ccgtgcccgg gatcgcctcc gtggccttgc aagcgtccca gaggcattga 19320
cagacttgca aacttgcaaa tatggaaaaa aaaaccccaa taaaaaagtc tagactctca 19380
cgctcgcttg gtcctgtgac tattttgtag aatggaagac atcaactttg cgtcgctggc 19440
cccgcgtcac ggctcgcgcc cgttcctggg acactggaac gatatcggca ccagcaacat 19500
gagcggtggc gccttcagtt ggggctctct gtggagcggc attaaaagta tcgggtctgc 19560
cgttaaaaat tacggctccc gggcctggaa cagcagcacg ggccagatgt tgagagacaa 19620
gttgaaagag cagaacttcc agcagaaggt ggtggagggc ctggcctccg gcatcaacgg 19680
ggtggtggac ctggccaacc aggccgtgca gaataagatc aacagcagac tggacccccg 19740
gccgccggtg gaggaggtgc cgccggcgct ggagacggtg tcccccgatg ggcgtggcga 19800
gaagcgcccg cggcccgata gggaagagac cactctggtc acgcagaccg atgagccgcc 19860
cccgtatgag gaggccctga agcaaggtct gcccaccacg cggcccatcg cgcccatggc 19920
caccggggtg gtgggccgcc acacccccgc cacgctggac ttgcctccgc ccgccgatgt 19980
gccgcagcag cagaaggcgg cacagccggg cccgcccgcg accgcctccc gttcctccgc 20040
cggtcctctg cgccgcgcgg ccagcggccc ccgcgggggg gtcgcgaggc acggcaactg 20100
gcagagcacg ctgaacagca tcgtgggtct gggggtgcgg tccgtgaagc gccgccgatg 20160
ctactgaata gcttagctaa cgtgttgtat gtgtgtatgc gccctatgtc gccgccagag 20220
gagctgctga gtcgccgccg ttcgcgcgcc caccaccacc gccactccgc ccctcaagat 20280
ggcgacccca tcgatgatgc cgcagtggtc gtacatgcac atctcgggcc aggacgcctc 20340
ggagtacctg agccccgggc tggtgcagtt cgcccgcgcc accgagagct acttcagcct 20400
gagtaacaag tttaggaacc ccacggtggc gcccacgcac gatgtgacca ccgaccggtc 20460
tcagcgcctg acgctgcggt tcattcccgt ggaccgcgag gacaccgcgt actcgtacaa 20520
ggcgcggttc accctggccg tgggcgacaa ccgcgtgctg gacatggcct ccacctactt 20580
tgacatccgc ggggtgctgg accggggtcc cactttcaag ccctactctg gcaccgccta 20640
caactccctg gcccccaagg gcgctcccaa ctcctgcgag tgggagcaag aggaaactca 20700
ggcagttgaa gaagcagcag aagaggaaga agaagatgct gacggtcaag ctgaggaaga 20760
gcaagcagct accaaaaaga ctcatgtata tgctcaggct cccctttctg gcgaaaaaat 20820
tagtaaagat ggtctgcaaa taggaacgga cgctacagct acagaacaaa aacctattta 20880
tgcagaccct acattccagc ccgaacccca aatcggggag tcccagtgga atgaggcaga 20940
tgctacagtc gccggcggta gagtgctaaa gaaatctact cccatgaaac catgctatgg 21000
ttcctatgca agacccacaa atgctaatgg aggtcagggt gtactaacgg caaatgccca 21060
gggacagcta gaatctcagg ttgaaatgca attcttttca acttctgaaa acgcccgtaa 21120
cgaggctaac aacattcagc ccaaattggt gctgtatagt gaggatgtgc acatggagac 21180
cccggatacg cacctttctt acaagcccgc aaaaagcgat gacaattcaa aaatcatgct 21240
gggtcagcag tccatgccca acagacctaa ttacatcggc ttcagagaca actttatcgg 21300
cctcatgtat tacaatagca ctggcaacat gggagtgctt gcaggtcagg cctctcagtt 21360
gaatgcagtg gtggacttgc aagacagaaa cacagaactg tcctaccagc tcttgcttga 21420
ttccatgggt gacagaacca gatacttttc catgtggaat caggcagtgg acagttatga 21480
cccagatgtt agaattattg aaaatcatgg aactgaagac gagctcccca actattgttt 21540
ccctctgggt ggcatagggg taactgacac ttaccaggct gttaaaacca acaatggcaa 21600
taacgggggc caggtgactt ggacaaaaga tgaaactttt gcagatcgca atgaaatagg 21660
ggtgggaaac aatttcgcta tggagatcaa cctcagtgcc aacctgtgga gaaacttcct 21720
gtactccaac gtggcgctgt acctaccaga caagcttaag tacaacccct ccaatgtgga 21780
catctctgac aaccccaaca cctacgatta catgaacaag cgagtggtgg ccccggggct 21840
ggtggactgc tacatcaacc tgggcgcgcg ctggtcgctg gactacatgg acaacgtcaa 21900
ccccttcaac caccaccgca atgcgggcct gcgctaccgc tccatgctcc tgggcaacgg 21960
gcgctacgtg cccttccaca tccaggtgcc ccagaagttc tttgccatca agaacctcct 22020
cctcctgccg ggctcctaca cctacgagtg gaacttcagg aaggatgtca acatggtcct 22080
ccagagctct ctgggtaacg atctcagggt ggacggggcc agcatcaagt tcgagagcat 22140
ctgcctctac gccaccttct tccccatggc ccacaacacg gcctccacgc tcgaggccat 22200
gctcaggaac gacaccaacg accagtcctt caatgactac ctctccgccg ccaacatgct 22260
ctaccccata cccgccaacg ccaccaacgt ccccatctcc atcccctcgc gcaactgggc 22320
ggccttccgc ggctgggcct tcacccgcct caagaccaag gagaccccct ccctgggctc 22380
gggattcgac ccctactaca cctactcggg ctccattccc tacctggacg gcaccttcta 22440
cctcaaccac actttcaaga aggtctcggt caccttcgac tcctcggtca gctggccggg 22500
caacgaccgt ctgctcaccc ccaacgagtt cgagatcaag cgctcggtcg acggggaggg 22560
ctacaacgtg gcccagtgca acatgaccaa ggactggttc ctggtccaga tgctggccaa 22620
ctacaacatc ggctaccagg gcttctacat cccagagagc tacaaggaca ggatgtactc 22680
cttcttcagg aacttccagc ccatgagccg gcaggtggtg gaccagacca agtacaagga 22740
ctaccaggag gtgggcatca tccaccagca caacaactcg ggcttcgtgg gctacctcgc 22800
ccccaccatg cgcgagggac aggcctaccc cgccaacttc ccctatccgc tcataggcaa 22860
gaccgcggtc gacagcatca cccagaaaaa gttcctctgc gaccgcaccc tctggcgcat 22920
ccccttctcc agcaacttca tgtccatggg tgcgctctcg gacctgggcc agaacttgct 22980
ctacgccaac tccgcccacg ccctcgacat gaccttcgag gtcgacccca tggacgagcc 23040
cacccttctc tatgttctgt tcgaagtctt tgacgtggtc cgggtccacc agccgcaccg 23100
cggcgtcatc gagaccgtgt acctgcgtac gcccttctcg gccggcaacg ccaccaccta 23160
aagaagcaag ccgcagtcat cgccgcctgc atgccgtcgg gttccaccga gcaagagctc 23220
agggccatcg tcagagacct gggatgcggg ccctattttt tgggcacctt cgacaagcgc 23280
ttccctggct ttgtctcccc acacaagctg gcctgcgcca tcgtcaacac ggccggccgc 23340
gagaccgggg gcgtgcactg gctggccttc gcctggaacc cgcgctccaa aacatgcttc 23400
ctctttgacc ccttcggctt ttcggaccag cggctcaagc aaatctacga gttcgagtac 23460
gagggcttgc tgcgtcgcag cgccatcgcc tcctcgcccg accgctgcgt caccctcgaa 23520
aagtccaccc agaccgtgca ggggcccgac tcggccgcct gcggtctctt ctgctgcatg 23580
tttctgcacg cctttgtgca ctggcctcag agtcccatgg accgcaaccc caccatgaac 23640
ttgctgacgg gggtgcccaa ctccatgctc cagagccccc aggtcgagcc caccctgcgc 23700
cgcaaccagg agcagctcta cagcttcctg gagcgccact cgccttactt ccgccgccac 23760
agcgcacaga tcaggagggc cacctccttc tgccacttgc aagagatgca agaagggtaa 23820
taacgatgta cacacttttt ttctcaataa atggcatctt tttatttata caagctctct 23880
ggggtattca tttcccacca ccacccgccg ttgtcgccat ctggctctat ttagaaatcg 23940
aaagggttct gccgggagtc gccgtgcgcc acgggcaggg acacgttgcg atactggtag 24000
cgggtgcccc acttgaactc gggcaccacc aggcgaggca gctcggggaa gttttcgctc 24060
cacaggctgc gggtcagcac cagcgcgttc atcaggtcgg gcgccgagat cttgaagtcg 24120
cagttggggc cgccgccctg cgcgcgcgag ttgcggtaca ccgggttgca gcactggaac 24180
accaacagcg ccgggtgctt cacgctggcc agcacgctgc ggtcggagat cagctcggcg 24240
tccaggtcct ccgcgttgct cagcgcgaac ggggtcatct tgggcacttg ccgccccagg 24300
aagggcgcgt gccccggttt cgagttgcag tcgcagcgca gcgggatcag caggtgcccg 24360
tgcccggact cggcgttggg gtacagcgcg cgcatgaagg cctgcatctg gcggaaggcc 24420
atctgggcct tggcgccctc cgagaagaac atgccgcagg acttgcccga gaactggttt 24480
gcggggcagc tggcgtcgtg caggcagcag cgcgcgtcgg tgttggcgat ctgcaccacg 24540
ttgcgccccc accggttctt cacgatcttg gccttggacg attgctcctt cagcgcgcgc 24600
tgcccgttct cgctggtcac atccatctcg atcacatgtt ccttgttcac catgctgctg 24660
ccgtgcagac acttcagctc gccctccgtc tcggtgcagc ggtgctgcca cagcgcgcag 24720
cccgtgggct cgaaagactt gtaggtcacc tccgcgaagg actgcaggta cccctgcaaa 24780
aagcggccca tcatggtcac gaaggtcttg ttgctgctga aggtcagctg cagcccgcgg 24840
tgctcctcgt tcagccaggt cttgcacacg gccgccagcg cctccacctg gtcgggcagc 24900
atcttgaagt tcaccttcag ctcattctcc acgtggtact tgtccatcag cgtgcgcgcc 24960
gcctccatgc ccttctccca ggccgacacc agcggcaggc tcacggggtt cttcaccatc 25020
accgtggccg ccgcctccgc cgcgctttcg ctttccgccc cgctgttctc ttcctcttcc 25080
tcctcttcct cgccgccgcc cactcgcagc ccccgcacca cggggtcgtc ttcctgcagg 25140
cgctgcacct tgcgcttgcc gttgcgcccc tgcttgatgc gcacgggcgg gttgctgaag 25200
cccaccatca ccagcgcggc ctcttcttgc tcgtcctcgc tgtccagaat gacctccggg 25260
gagggggggt tggtcatcct cagtaccgag gcacgcttct ttttcttcct gggggcgttc 25320
gccagctccg cggctgcggc cgctgccgag gtcgaaggcc gagggctggg cgtgcgcggc 25380
accagcgcgt cctgcgagcc gtcctcgtcc tcctcggact cgagacggag gcgggcccgc 25440
ttcttcgggg gcgcgcgggg cggcggaggc ggcggcggcg acggagacgg ggacgagaca 25500
tcgtccaggg tgggtggacg gcgggccgcg ccgcgtccgc gctcgggggt ggtctcgcgc 25560
tggtcctctt cccgactggc catctcccac tgctccttct cctataggca gaaagagatc 25620
atggagtctc tcatgcgagt cgagaaggag gaggacagcc taaccgcccc ctctgagccc 25680
tccaccaccg ccgccaccac cgccaatgcc gccgcggacg acgcgcccac cgagaccacc 25740
gccagtacca ccctccccag cgacgcaccc ccgctcgaga atgaagtgct gatcgagcag 25800
gacccgggtt ttgtgagcgg agaggaggat gaggtggatg agaaggagaa ggaggaggtc 25860
gccgcctcag tgccaaaaga ggataaaaag caagaccagg acgacgcaga taaggatgag 25920
acagcagtcg ggcgggggaa cggaagccat gatgctgatg acggctacct agacgtggga 25980
gacgacgtgc tgcttaagca cctgcaccgc cagtgcgtca tcgtctgcga cgcgctgcag 26040
gagcgctgcg aagtgcccct ggacgtggcg gaggtcagcc gcgcctacga gcggcacctc 26100
ttcgcgccgc acgtgccccc caagcgccgg gagaacggca cctgcgagcc caacccgcgt 26160
ctcaacttct acccggtctt cgcggtaccc gaggtgctgg ccacctacca catctttttc 26220
caaaactgca agatccccct ctcctgccgc gccaaccgca cccgcgccga caaaaccctg 26280
accctgcggc agggcgccca catacctgat atcgcctctc tggaggaagt gcccaagatc 26340
ttcgagggtc tcggtcgcga cgagaaacgg gcggcgaacg ctctgcacgg agacagcgaa 26400
aacgagagtc actcgggggt gctggtggag ctcgagggcg acaacgcgcg cctggccgta 26460
ctcaagcgca gcatagaggt cacccacttt gcctacccgg cgctcaacct gccccccaag 26520
gtcatgagtg tggtcatggg cgagctcatc atgcgccgcg cccagcccct ggccgcggat 26580
gcaaacttgc aagagtcctc cgaggaaggc ctgcccgcgg tcagcgacga gcagctggcg 26640
cgctggctgg agacccgcga ccccgcgcag ctggaggagc ggcgcaagct catgatggcc 26700
gcggtgctgg tcaccgtgga gctcgagtgt ctgcagcgct tcttcgcgga ccccgagatg 26760
cagcgcaagc tcgaggagac cctgcactac accttccgcc agggctacgt gcgccaggcc 26820
tgcaagatct ccaacgtgga gctctgcaac ctggtctcct acctgggcat cctgcacgag 26880
aaccgcctcg ggcagaacgt cctgcactcc accctcaaag gggaggcgcg ccgcgactac 26940
atccgcgact gcgcctacct cttcctctgc tacacctggc agacggccat gggggtctgg 27000
cagcagtgcc tggaggagcg caacctcaag gagctggaaa agctcctcaa gcgcaccctc 27060
agggacctct ggacgggctt caacgagcgc tcggtggccg ccgcgctggc ggacatcatc 27120
tttcccgagc gcctgctcaa gaccctgcag cagggcctgc ccgacttcac cagccagagc 27180
atgctgcaga acttcaggac tttcatcctg gagcgctcgg gcatcctgcc ggccacttgc 27240
tgcgcgctgc ccagcgactt cgtgcccatc aagtacaggg agtgcccgcc gccgctctgg 27300
ggccactgct acctcttcca gctggccaac tacctcgcct accactcgga cctcatggaa 27360
gacgtgagcg gcgagggcct gctcgagtgc cactgccgct gcaacctctg cacgccccac 27420
cgctctctag tctgcaaccc gcagctgctc agcgagagtc agattatcgg taccttcgag 27480
ctgcagggtc cctcgcctga cgagaagtcc gcggctccag ggctgaaact cactccgggg 27540
ctgtggactt ccgcctacct acgcaaattt gtacctgagg actaccacgc ccacgagatc 27600
aggttctacg aagaccaatc ccgcccgccc aaggcggagc tcaccgcctg cgtcatcacc 27660
caggggcaca tcctgggcca attgcaagcc atcaacaaag cccgccgaga gttcttgctg 27720
aaaaagggtc ggggggtgta cctggacccc cagtccggcg aggagctaaa cccgctaccc 27780
ccgccgccgc cccagcagcg ggaccttgct tcccaggatg gcacccagaa agaagcagca 27840
gccgccgccg ccgccgcagc catacatgct tctggaggaa gaggaggagg actgggacag 27900
tcaggcagag gaggtttcgg acgaggagca ggaggagatg atggaagact gggaggagga 27960
cagcagccta gacgaggaag cttcagaggc cgaagaggtg gcagacgcaa caccatcgcc 28020
ctcggtcgca gccccctcgc cggggcccct gaaatcctcc gaacccagca ccagcgctat 28080
aacctccgct cctccggcgc cggcgccacc cgcccgcaga cccaaccgta gatgggacac 28140
cacaggaacc ggggtcggta agtccaagtg cccgccgccg ccaccgcagc agcagcagca 28200
gcagcgccag ggctaccgct cgtggcgcgg gcacaagaac gccatagtcg cctgcttgca 28260
agactgcggg ggcaacatct ctttcgcccg ccgcttcctg ctattccacc acggggtcgc 28320
ctttccccgc aatgtcctgc attactaccg tcatctctac agcccctact gcagcggcga 28380
cccagaggcg gcagcggcag ccacagcggc gaccaccacc taggaagata tcctccgcgg 28440
gcaagacagc ggcagcagcg gccaggagac ccgcggcagc agcggcggga gcggtgggcg 28500
cactgcgcct ctcgcccaac gaacccctct cgacccggga gctcagacac aggatcttcc 28560
ccactttgta tgccatcttc caacagagca gaggccagga gcaggagctg aaaataaaaa 28620
acagatctct gcgctccctc acccgcagct gtctgtatca caaaagcgaa gatcagcttc 28680
ggcgcacgct ggaggacgcg gaggcactct tcagcaaata ctgcgcgctc actcttaaag 28740
actagctccg cgcccttctc gaatttaggc gggagaaaac tacgtcatcg ccggccgccg 28800
cccagcccgc ccagccgaga tgagcaaaga gattcccacg ccatacatgt ggagctacca 28860
gccgcagatg ggactcgcgg cgggagcggc ccaggactac tccacccgca tgaactacat 28920
gagcgcggga ccccacatga tctcacaggt caacgggatc cgcgcccagc gaaaccaaat 28980
actgctggaa caggcggcca tcaccgccac gccccgccat aatctcaacc cccgaaattg 29040
gcccgccgcc ctcgtgtacc aggaaacccc ctccgccacc accgtactac ttccgcgtga 29100
cgcccaggcc gaagtccaga tgactaactc aggggcgcag ctcgcgggcg gctttcgtca 29160
cggggcgcgg ccgctccgac caggtataag acacctgatg atcagaggcc gaggtatcca 29220
gctcaacgac gagtcggtga gctcttcgct cggtctccgt ccggacggaa ctttccagct 29280
cgccggatcc ggccgctctt cgttcacgcc ccgccaggcg tacctgactc tgcagacctc 29340
gtcctcggag ccccgctccg gcggcatcgg aaccctccag ttcgtggagg agttcgtgcc 29400
ctcggtctac ttcaacccct tctcgggacc tcccggacgc taccccgacc agttcattcc 29460
gaactttgac gcggtgaagg actcggcgga cggctacgac tgaatgtcag gtgtcgaggc 29520
agagcagctt cgcctgagac acctcgagca ctgccgccgc cacaagtgct tcgcccgcgg 29580
ttctggtgag ttctgctact ttcagctacc cgaggagcat accgaggggc cggcgcacgg 29640
cgtccgcctg accacccagg gcgaggttac ctgttccctc atccgggagt ttaccctccg 29700
tcccctgcta gtggagcggg agcggggtcc ctgtgtccta actatcgcct gcaactgccc 29760
taaccctgga ttacatcaag atctttgctg tcatctctgt gctgagttta ataaacgctg 29820
agatcagaat ctactggggc tcctgtcgcc atcctgtgaa cgccaccgtc ttcacccacc 29880
ccgaccaggc ccaggcgaac ctcacctgcg gtctgcatcg gagggccaag aagtacctca 29940
cctggtactt caacggcacc ccctttgtgg tttacaacag cttcgacggg gacggagtct 30000
ccctgaaaga ccagctctcc ggtctcagct actccatcca caagaacacc accctccaac 30060
tcttccctcc ctacctgccg ggaacctacg agtgcgtcac cggccgctgc acccacctca 30120
cccgcctgat cgtaaaccag agctttccgg gaacagataa ctccctcttc cccagaacag 30180
gaggtgagct caggaaactc cccggggacc agggcggaga cgtaccttcg acccttgtgg 30240
ggttaggatt ttttattacc gggttgctgg ctcttttaat caaagtttcc ttgagatttg 30300
ttctttcctt ctacgtgtat gaacacctca acctccaata actctaccct ttcttcggaa 30360
tcaggtgact tctctgaaat cgggcttggt gtgctgctta ctctgttgat ttttttcctt 30420
atcatactca gccttctgtg cctcaggctc gccgcctgct gcgcacacat ctatatctac 30480
tgctggttgc tcaagtgcag gggtcgccac ccaagatgaa caggtacatg gtcctatcga 30540
tcctaggcct gctggccctg gcggcctgca gcgccgccaa aaaagagatt acctttgagg 30600
agcccgcttg caatgtaact ttcaagcccg agggtgacca atgcaccacc ctcgtcaaat 30660
gcgttaccaa tcatgagagg ctgcgcatcg actacaaaaa caaaactggc cagtttgcgg 30720
tctatagtgt gtttacgccc ggagacccct ctaactactc tgtcaccgtc ttccagggcg 30780
gacagtctaa gatattcaat tacactttcc ctttttatga gttatgcgat gcggtcatgt 30840
acatgtcaaa acagtacaac ctgtggcctc cctctcccca ggcgtgtgtg gaaaatactg 30900
ggtcttactg ctgtatggct ttcgcaatca ctacgctcgc tctaatctgc acggtgctat 30960
acataaaatt caggcagagg cgaatcttta tcgatgaaaa gaaaatgcct tgatcgctaa 31020
caccggcttt ctatctgcag aatgaatgca atcacctccc tactaatcac caccaccctc 31080
cttgcgattg cccatgggtt gacacgaatc gaagtgccag tggggtccaa tgtcaccatg 31140
gtgggccccg ccggcaattc caccctcatg tgggaaaaat ttgtccgcaa tcaatgggtt 31200
catttctgct ctaaccgaat cagtatcaag cccagagcca tctgcgatgg gcaaaatcta 31260
actctgatca atgtgcaaat gatggatgct gggtactatt acgggcagcg gggagaaatc 31320
attaattact ggcgacccca caaggactac atgctgcatg tagtcgaggc acttcccact 31380
accaccccca ctaccacctc tcccaccacc accaccacta ctactactac tactactact 31440
actactacta ccactaccgc tgcccgccat acccgcaaaa gcaccatgat tagcacaaag 31500
ccccctcgtg ctcactccca cgccggcggg cccatcggtg cgacctcaga aaccaccgag 31560
ctttgcttct gccaatgcac taacgccagc gctcatgaac tgttcgacct ggagaatgag 31620
gatgtccagc agagctccgc ttgcctgacc caggaggctg tggagcccgt tgccctgaag 31680
cagatcggtg attcaataat tgactcttct tcttttgcca ctcccgaata ccctcccgat 31740
tctactttcc acatcacggg taccaaagac cctaacctct ctttctacct gatgctgctg 31800
ctctgtatct ctgtggtctc ttccgcgctg atgttactgg ggatgttctg ctgcctgatc 31860
tgccgcagaa agagaaaagc tcgctctcag ggccaaccac tgatgccctt cccctacccc 31920
ccggattttg cagataacaa gatatgagct cgctgctgac actaaccgct ttactagcct 31980
gcgctctaac ccttgtcgct tgcgactcga gattccacaa tgtcacagct gtggcaggag 32040
aaaatgttac tttcaactcc acggccgata cccagtggtc gtggagtggc tcaggtagct 32100
acttaactat ctgcaatagc tccacttccc ccggcatatc cccaaccaag taccaatgca 32160
atgccagcct gttcaccctc atcaacgctt ccaccctgga caatggactc tatgtaggct 32220
atgtaccctt tggtgggcaa ggaaagaccc acgcttacaa cctggaagtt cgccagccca 32280
gaaccactac ccaagcttct cccaccacca ccaccaccac caccatcacc agcagcagca 32340
gcagcagcag ccacagcagc agcagcagat tattgacttt ggttttggcc agctcatctg 32400
ccgctaccca ggccatctac agctctgtgc ccgaaaccac tcagatccac cgcccagaaa 32460
cgaccaccgc caccacccta cacacctcca gcgatcagat gccgaccaac atcaccccct 32520
tggctcttca aatgggactt acaagcccca ctccaaaacc agtggatgcg gccgaggtct 32580
ccgccctcgt caatgactgg gcggggctgg gaatgtggtg gttcgccata ggcatgatgg 32640
cgctctgcct gcttctgctc tggctcatct gctgcctcca ccgcaggcga gccagacccc 32700
ccatctatag acccatcatt gtcctgaacc ccgataatga tgggatccat agattggatg 32760
gcctgaaaaa cctacttttt tcttttacag tatgataaat tgagacatgc ctcgcatttt 32820
cttgtacatg ttccttctcc caccttttct ggggtgttct acgctggccg ctgtgtctca 32880
cctggaggta gactgcctct cacccttcac tgtctacctg ctttacggat tggtcaccct 32940
cactctcatc tgcagcctaa tcacagtaat catcgccttc atccagtgca ttgattacat 33000
ctgtgtgcgc ctcgcatact tcagacacca cccgcagtac cgagacagga acattgccca 33060
acttctaaga ctgctctaat catgcataag actgtgatct gccttctgat cctctgcatc 33120
ctgcccaccc tcacctcctg ccagtacacc acaaaatctc cgcgcaaaag acatgcctcc 33180
tgccgcttca cccaactgtg gaatataccc aaatgctaca acgaaaagag cgagctctcc 33240
gaagcttggc tgtatggggt catctgtgtc ttagttttct gcagcactgt ctttgccctc 33300
ataatctacc cctactttga tttgggatgg aacgcgatcg atgccatgaa ttaccccacc 33360
tttcccgcac ccgagataat tccactgcga caagttgtac ccgttgtcgt taatcaacgc 33420
cccccatccc ctacgcccac tgaaatcagc tactttaacc taacaggcgg agatgactga 33480
cgccctagat ctagaaatgg acggcatcag taccgagcag cgtctcctag agaggcgcag 33540
gcaggcggct gagcaagagc gcctcaatca ggagctccga gatctcgtta acctgcacca 33600
gtgcaaaaga ggcatctttt gtctggtaaa gcaggccaaa gtcacctacg agaagaccgg 33660
caacagccac cgcctcagtt acaaattgcc cacccagcgc cagaagctgg tgctcatggt 33720
gggtgagaat cccatcaccg tcacccagca ctcggtagag accgaggggt gtctgcactc 33780
cccctgtcgg ggtccagaag acctctgcac cctggtaaag accctgtgcg gtctcagaga 33840
tttagtcccc tttaactaat caaacactgg aatcaataaa aagaatcact tacttaaaat 33900
cagacagcag gtctctgtcc agtttattca gcagcacctc cttcccctcc tcccaactct 33960
ggtactccaa acgccttctg gcggcaaact tcctccacac cctgaaggga atgtcagatt 34020
cttgctcctg tccctccgca cccactatct tcatgttgtt gcagatgaag cgcaccaaaa 34080
cgtctgacga gagcttcaac cccgtgtacc cctatgacac ggaaagcggc cctccctccg 34140
tccctttcct cacccctccc ttcgtgtctc ccgatggatt ccaagaaagt ccccccgggg 34200
tcctgtctct gaacctggcc gagcccctgg tcacttccca cggcatgctc gccctgaaaa 34260
tgggaagtgg cctctccctg gacgacgctg gcaacctcac ctctcaagat atcaccaccg 34320
ctagccctcc cctcaaaaaa accaagacca acctcagcct agaaacctca tcccccctaa 34380
ctgtgagcac ctcaggcgcc ctcaccgtag cagccgccgc tcccctggcg gtggccggca 34440
cctccctcac catgcaatca gaggcccccc tgacagtaca ggatgcaaaa ctcaccctgg 34500
ccaccaaagg ccccctgacc gtgtctgaag gcaaactggc cttgcaaaca tcggccccgc 34560
tgacggccgc tgacagcagc accctcacag tcagtgccac accacccctt agcacaagca 34620
atggcagctt gggtattgac atgcaagccc ccatttacac caccaatgga aaactaggac 34680
ttaactttgg cgctcccctg catgtggtag acagcctaaa tgcactgact gtagttactg 34740
gccaaggtct tacgataaac ggaacagccc tacaaactag agtctcaggt gccctcaact 34800
atgacacatc aggaaaccta gaattgagag ctgcaggggg tatgcgagtt gatgcaaatg 34860
gtcaacttat ccttgatgta gcttacccat ttgatgcaca aaacaatctc agccttaggc 34920
ttggacaggg acccctgttt gttaactctg cccacaactt ggatgttaac tacaacagag 34980
gcctctacct gttcacatct ggaaatacca aaaagctaga agttaatatc aaaacagcca 35040
agggtctcat ttatgatgac actgctatag caatcaatgc gggtgatggg ctacagtttg 35100
actcaggctc agatacaaat ccattaaaaa ctaaacttgg attaggactg gattatgact 35160
ccagcagagc cataattgct aaactgggaa ctggcctaag ctttgacaac acaggtgcca 35220
tcacagtagg caacaaaaat gatgacaagc ttaccttgtg gaccacacca gacccatccc 35280
ctaactgtag aatctattca gagaaagatg ctaaattcac acttgttttg actaaatgcg 35340
gcagtcaggt gttggccagc gtttctgttt tatctgtaaa aggtagcctt gcgcccatca 35400
gtggcacagt aactagtgct cagattgtcc tcagatttga tgaaaatgga gttctactaa 35460
gcaattcttc ccttgaccct caatactgga actacagaaa aggtgacctt acagagggca 35520
ctgcatatac caacgcagtg ggatttatgc ccaacctcac agcataccca aaaacacaga 35580
gccaaactgc taaaagcaac attgtaagtc aggtttactt gaatggggac aaatccaaac 35640
ccatgaccct caccattacc ctcaatggaa ctaatgaaac aggagatgcc acagtaagca 35700
cttactccat gtcattctca tggaactgga atggaagtaa ttacattaat gaaacgttcc 35760
aaaccaactc cttcaccttc tcctacatcg cccaagaata aaaagcatga cgctgttgat 35820
ttgattcaat gtgtttctgt tttattttca agcacaacaa aatcattcaa gtcattcttc 35880
catcttagct taatagacac agtagcttaa tagacccagt agtgcaaagc cccattctag 35940
cttataacta gtggagaagt actcgcctac atgggggtag agtcataatc gtgcatcagg 36000
atagggcggt ggtgctgcag cagcgcgcga ataaactgct gccgccgccg ctccgtcctg 36060
caggaataca acatggcagt ggtctcctca gcgatgattc gcaccgcccg cagcataagg 36120
cgccttgtcc tccgggcaca gcagcgcacc ctgatctcac ttaaatcagc acagtaactg 36180
cagcacagca ccacaatatt gttcaaaatc ccacagtgca aggcgctgta tccaaagctc 36240
atggcgggga ccacagaacc cacgtggcca tcataccaca agcgcaggta gattaagtgg 36300
cgacccctca taaacacgct ggacataaac attacctctt ttggcatgtt gtaattcacc 36360
acctcccggt accatataaa cctctgatta aacatggcgc catccaccac catcctaaac 36420
cagctggcca aaacctgccc gccggctata cactgcaggg aaccgggact ggaacaatga 36480
cagtggagag cccaggactc gtaaccatgg atcatcatgc tcgtcatgat atcaatgttg 36540
gcacaacaca ggcacacgtg catacacttc ctcaggatta caagctcctc ccgcgttaga 36600
accatatccc agggaacaac ccattcctga atcagcgtaa atcccacact gcagggaaga 36660
cctcgcacgt aactcacgtt gtgcattgtc aaagtgttac attcgggcag cagcggatga 36720
tcctccagta tggtagcgcg ggtttctgtc tcaaaaggag gtagacgatc cctactgtac 36780
ggagtgcgcc gagacaaccg agatcgtgtt ggtcgtagtg tcatgccaaa tggaacgccg 36840
gacgtagtca tatttcctga agtcttagat ctctcaacgc agcaccagca ccaacacttc 36900
gcagtgtaaa aggccaagtg ccgagagagt atatatagga ataaaaagtg acgtaaacgg 36960
gcaaagtcca aaaaacgccc agaaaaaccg cacgcgaacc tacgccccga aacgaaagcc 37020
aaaaaacact agacactccc ttccggcgtc aacttccgct ttcccacgct acgtcacttg 37080
ccccagtcaa acaaactaca tatcccgaac ttccaagtcg ccacgcccaa aacaccgcct 37140
acacctcccc gcccgccggc ccgcccccaa acccgcctcc cgccccgcgc cccgccccgc 37200
gccgcccatc tcattatcat attggcttca atccaaaata aggtatatta ttgatgatgg 37260
tttaaacgga tcctctagag tcgacctgca ggcatgcaag cttgagtata acccccttgc 37320
ggccgcccgg gccgtcgacc aattctcatg tttgacagct tatcatcgaa tttctgccat 37380
tcatccgctt attatcactt attcaggcgt agcaaccagg cgtttaaggg caccaataac 37440
tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt aattcattaa 37500
gcattctgcc gacatggaag ccatcacaaa cggcatgatg aacctgaatc gccagcggca 37560
tcagcacctt gtcgccttgc gtataatatt tgcccatggt gaaaacgggg gcgaagaagt 37620
tgtccatatt ggccacgttt aaatcaaaac tggtgaaact cacccaggga ttggctgaga 37680
cgaaaaacat attctcaata aaccctttag ggaaataggc caggttttca ccgtaacacg 37740
ccacatcttg cgaatatatg tgtagaaact gccggaaatc gtcgtggtat tcactccaga 37800
gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta acaagggtga acactatccc 37860
atatcaccag ctcaccgtct ttcattgcca tacggaattc cggatgagca ttcatcaggc 37920
gggcaagaat gtgaataaag gccggataaa acttgtgctt atttttcttt acggtcttta 37980
aaaaggccgt aatatccagc tgaacggtct ggttataggt acattgagca actgactgaa 38040
atgcctcaaa atgttcttta cgatgccatt gggatatatc aacggtggta tatccagtga 38100
tttttttctc cattttagct tccttagctc ctgaaaatct cgataactca aaaaatacgc 38160
ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt 38220
ctcattttcg ccaaaagttg gcccagggct tcccggtatc aacagggaca ccaggattta 38280
tttattctgc gaagtgatct tccgtcacag gtatttattc gcgataagct catggagcgg 38340
cgtaaccgtc gcacaggaag gacagagaaa gcgcggatct gggaagtgac ggacagaacg 38400
gtcaggacct ggattgggga ggcggttgcc gccgctgctg ctgacggtgt gacgttctct 38460
gttccggtca caccacatac gttccgccat tcctatgcga tgcacatgct gtatgccggt 38520
ataccgctga aagttctgca aagcctgatg ggacataagt ccatcagttc aacggaagtc 38580
tacacgaagg tttttgcgct ggatgtggct gcccggcacc gggtgcagtt tgcgatgccg 38640
gagtctgatg cggttgcgat gctgaaacaa ttatcctgag aataaatgcc ttggccttta 38700
tatggaaatg tggaactgag tggatatgct gtttttgtct gttaaacaga gaagctggct 38760
gttatccact gagaagcgaa cgaaacagtc gggaaaatct cccattatcg tagagatccg 38820
cattattaat ctcaggagcc tgtgtagcgt ttataggaag tagtgttctg tcatgatgcc 38880
tgcaagcggt aacgaaaacg atttgaatat gccttcagga acaatagaaa tcttcgtgcg 38940
gtgttacgtt gaagtggagc ggattatgtc agcaatggac agaacaacct aatgaacaca 39000
gaaccatgat gtggtctgtc cttttacagc cagtagtgct cgccgcagtc gagcgacagg 39060
gcgaagccct cgagtgagcg aggaagcacc agggaacagc acttatatat tctgcttaca 39120
cacgatgcct gaaaaaactt cccttggggt tatccactta tccacgggga tatttttata 39180
attatttttt ttatagtttt tagatcttct tttttagagc gccttgtagg cctttatcca 39240
tgctggttct agagaaggtg ttgtgacaaa ttgccctttc agtgtgacaa atcaccctca 39300
aatgacagtc ctgtctgtga caaattgccc ttaaccctgt gacaaattgc cctcagaaga 39360
agctgttttt tcacaaagtt atccctgctt attgactctt ttttatttag tgtgacaatc 39420
taaaaacttg tcacacttca catggatctg tcatggcgga aacagcggtt atcaatcaca 39480
agaaacgtaa aaatagcccg cgaatcgtcc agtcaaacga cctcactgag gcggcatata 39540
gtctctcccg ggatcaaaaa cgtatgctgt atctgttcgt tgaccagatc agaaaatctg 39600
atggcaccct acaggaacat gacggtatct gcgagatcca tgttgctaaa tatgctgaaa 39660
tattcggatt gacctctgcg gaagccagta aggatatacg gcaggcattg aagagtttcg 39720
cggggaagga agtggttttt tatcgccctg aagaggatgc cggcgatgaa aaaggctatg 39780
aatcttttcc ttggtttatc aaacgtgcgc acagtccatc cagagggctt tacagtgtac 39840
atatcaaccc atatctcatt cccttcttta tcgggttaca gaaccggttt acgcagtttc 39900
ggcttagtga aacaaaagaa atcaccaatc cgtatgccat gcgtttatac gaatccctgt 39960
gtcagtatcg taagccggat ggctcaggca tcgtctctct gaaaatcgac tggatcatag 40020
agcgttacca gctgcctcaa agttaccagc gtatgcctga cttccgccgc cgcttcctgc 40080
aggtctgtgt taatgagatc aacagcagaa ctccaatgcg cctctcatac attgagaaaa 40140
agaaaggccg ccagacgact catatcgtat tttccttccg cgatatcact tccatgacga 40200
caggatagtc tgagggttat ctgtcacaga tttgagggtg gttcgtcaca tttgttctga 40260
cctactgagg gtaatttgtc acagttttgc tgtttccttc agcctgcatg gattttctca 40320
tactttttga actgtaattt ttaaggaagc caaatttgag ggcagtttgt cacagttgat 40380
ttccttctct ttcccttcgt catgtgacct gatatcgggg gttagttcgt catcattgat 40440
gagggttgat tatcacagtt tattactctg aattggctat ccgcgtgtgt acctctacct 40500
ggagtttttc ccacggtgga tatttcttct tgcgctgagc gtaagagcta tctgacagaa 40560
cagttcttct ttgcttcctc gccagttcgc tcgctatgct cggttacacg gctgcggcga 40620
gcgctagtga taataagtga ctgaggtatg tgctcttctt atctcctttt gtagtgttgc 40680
tcttatttta aacaactttg cggttttttg atgactttgc gattttgttg ttgctttgca 40740
gtaaattgca agatttaata aaaaaacgca aagcaatgat taaaggatgt tcagaatgaa 40800
actcatggaa acacttaacc agtgcataaa cgctggtcat gaaatgacga aggctatcgc 40860
cattgcacag tttaatgatg acagcccgga agcgaggaaa ataacccggc gctggagaat 40920
aggtgaagca gcggatttag ttggggtttc ttctcaggct atcagagatg ccgagaaagc 40980
agggcgacta ccgcacccgg atatggaaat tcgaggacgg gttgagcaac gtgttggtta 41040
tacaattgaa caaattaatc atatgcgtga tgtgtttggt acgcgattgc gacgtgctga 41100
agacgtattt ccaccggtga tcggggttgc tgcccataaa ggtggcgttt acaaaacctc 41160
agtttctgtt catcttgctc aggatctggc tctgaagggg ctacgtgttt tgctcgtgga 41220
aggtaacgac ccccagggaa cagcctcaat gtatcacgga tgggtaccag atcttcatat 41280
tcatgcagaa gacactctcc tgcctttcta tcttggggaa aaggacgatg tcacttatgc 41340
aataaagccc acttgctggc cggggcttga cattattcct tcctgtctgg ctctgcaccg 41400
tattgaaact gagttaatgg gcaaatttga tgaaggtaaa ctgcccaccg atccacacct 41460
gatgctccga ctggccattg aaactgttgc tcatgactat gatgtcatag ttattgacag 41520
cgcgcctaac ctgggtatcg gcacgattaa tgtcgtatgt gctgctgatg tgctgattgt 41580
tcccacgcct gctgagttgt ttgactacac ctccgcactg cagtttttcg atatgcttcg 41640
tgatctgctc aagaacgttg atcttaaagg gttcgagcct gatgtacgta ttttgcttac 41700
caaatacagc aatagtaatg gctctcagtc cccgtggatg gaggagcaaa ttcgggatgc 41760
ctggggaagc atggttctaa aaaatgttgt acgtgaaacg gatgaagttg gtaaaggtca 41820
gatccggatg agaactgttt ttgaacaggc cattgatcaa cgctcttcaa ctggtgcctg 41880
gagaaatgct ctttctattt gggaacctgt ctgcaatgaa attttcgatc gtctgattaa 41940
accacgctgg gagattagat aatgaagcgt gcgcctgtta ttccaaaaca tacgctcaat 42000
actcaaccgg ttgaagatac ttcgttatcg acaccagctg ccccgatggt ggattcgtta 42060
attgcgcgcg taggagtaat ggctcgcggt aatgccatta ctttgcctgt atgtggtcgg 42120
gatgtgaagt ttactcttga agtgctccgg ggtgatagtg ttgagaagac ctctcgggta 42180
tggtcaggta atgaacgtga ccaggagctg cttactgagg acgcactgga tgatctcatc 42240
ccttcttttc tactgactgg tcaacagaca ccggcgttcg gtcgaagagt atctggtgtc 42300
atagaaattg ccgatgggag tcgccgtcgt aaagctgctg cacttaccga aagtgattat 42360
cgtgttctgg ttggcgagct ggatgatgag cagatggctg cattatccag attgggtaac 42420
gattatcgcc caacaagtgc ttatgaacgt ggtcagcgtt atgcaagccg attgcagaat 42480
gaatttgctg gaaatatttc tgcgctggct gatgcggaaa atatttcacg taagattatt 42540
acccgctgta tcaacaccgc caaattgcct aaatcagttg ttgctctttt ttctcacccc 42600
ggtgaactat ctgcccggtc aggtgatgca cttcaaaaag cctttacaga taaagaggaa 42660
ttacttaagc agcaggcatc taaccttcat gagcagaaaa aagctggggt gatatttgaa 42720
gctgaagaag ttatcactct tttaacttct gtgcttaaaa cgtcatctgc atcaagaact 42780
agtttaagct cacgacatca gtttgctcct ggagcgacag tattgtataa gggcgataaa 42840
atggtgctta acctggacag gtctcgtgtt ccaactgagt gtatagagaa aattgaggcc 42900
attcttaagg aacttgaaaa gccagcaccc tgatgcgacc acgttttagt ctacgtttat 42960
ctgtctttac ttaatgtcct ttgttacagg ccagaaagca taactggcct gaatattctc 43020
tctgggccca ctgttccact tgtatcgtcg gtctgataat cagactggga ccacggtccc 43080
actcgtatcg tcggtctgat tattagtctg ggaccacggt cccactcgta tcgtcggtct 43140
gattattagt ctgggaccac ggtcccactc gtatcgtcgg tctgataatc agactgggac 43200
cacggtccca ctcgtatcgt cggtctgatt attagtctgg gaccatggtc ccactcgtat 43260
cgtcggtctg attattagtc tgggaccacg gtcccactcg tatcgtcggt ctgattatta 43320
gtctggaacc acggtcccac tcgtatcgtc ggtctgatta ttagtctggg accacggtcc 43380
cactcgtatc gtcggtctga ttattagtct gggaccacga tcccactcgt gttgtcggtc 43440
tgattatcgg tctgggacca cggtcccact tgtattgtcg atcagactat cagcgtgaga 43500
ctacgattcc atcaatgcct gtcaagggca agtattgaca tgtcgtcgta acctgtagaa 43560
cggagtaacc tcggtgtgcg gttgtatgcc tgctgtggat tgctgctgtg tcctgcttat 43620
ccacaacatt ttgcgcacgg ttatgtggac aaaatacctg gttacccagg ccgtgccggc 43680
acgctcggta cccggggatc ctcgtttaaa c 43711
<210> 53
<211> 41545
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (16144)..(16144)
<223> a, c, t, g, unknown or other
<400> 53
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg tccgaggact ttctgattct gatcgccatc 1380
ctggtgatcg tgattctcgt gggcacaatc acaaccctgg tgggcgccat cggcggcatt 1440
agggccagga ggagcttcct cttcatttgc atcttcttcc tgttcctctc cctcttcctg 1500
acaatcctcg ccctgctgct gggcttcagc tggctcctgc tggtggccat cctgttctgg 1560
gtgctctggc tggtcatcct cattctgctg ctgctggtgt accctattcc tcaccacccc 1620
ctgcccacct ccctcaggtt tagaatgaag cagagggtga gcagcgaccc cacaggttct 1680
gacagaagcc ctcagggcag ccataatagc ctgaactccc ccgatgagga ggaccccaag 1740
gatgacacca agcaacctct gtgcaacatg acccagggcg gacctcccgt caatggacag 1800
ctcctcggac aacatgctca atgcccccct cactatccct gctgccatat tcagcatccc 1860
gacggagagg attccgatgg agacgatggc aagtcctggg gcgatgccgg agaggaagac 1920
aatggcccta acgaccctaa caccgccagc accagagagt ccatttacga ggacctcaga 1980
taccccacaa gggacgccaa tggcgagtat gagaacgtgg gatacccccc tagggacgga 2040
gatgcccctc ataggctcgg agagcctgtg tatgacgatg tggagcaagc caccgctaac 2100
gaggtgagaa tctcccctct gttcagactg ccctacggaa gcgctttcgg acctggcccc 2160
cagcctggac ccattctgga gagctccaca tggggctttc tggtcttcac acagacctcc 2220
ctgttcgccg acgacattgc cgacgctatt agggactact gcacaaccca ccctggcccc 2280
acaaggaaca cccaggtggt cctcatgaac ttcgagggca gcggagtgcc cctgcctatg 2340
ttttttcccc ctggagagga gacagaagag cagagagagg gcgatagagc tagcgactcc 2400
gacgagtccg aagacgctca gatcctgacc gtgttctgcc tgttttgcca gtggacactc 2460
tttatctgcc tgggaatcag gatgatctgt aactggaggg gcaaactcac caggatcatc 2520
tgcctgaagt tctgcctcta cggactgatt tccgcctccc tgtccttcgg ctggtacgct 2580
tttctgaagg aagtgaccct ccccaccaca gccaccgttg atcctaggca actccccctg 2640
ttcctcttca tcctgagctc cgtgctggtg attctcgcca tcatgatgga gtttcaaaca 2700
tcctccagcc tcttcgctgc tctgttcgtg attatcgccg gaatgctgtg cgtcacagtg 2760
ggcgtgattt ttctgctggc tggcgtcaag cctctcctga gcggcatgat ctgcgcctcc 2820
ggcatcacaa tgctcgtgct cggcgtcgtg ctgctggtgg tgtgcaccag agatgagcac 2880
gctatttccg ccagccacca tgctagcgat ggctccgtga atcagcagaa ggaaaatcag 2940
ccccagaccc tggaggaatg caagacagat caggagagga agaggtacag gaacaggctg 3000
gcctccagga ggtgtagagc taagttcagg aaccagctgg aacattttag gacagtcgcc 3060
gctgctaaga cagaggagaa caacaggctc agggtgctca tcaggcagat gtgtcctaca 3120
ctggacgtgg aatccatcgt cccctccacc tccgccggct accacgagcc tctgaatcac 3180
ctgacccaca gccccagccc ttgtcatcac agggatgaac ccccctccag aagccccagc 3240
cctcaaccca ccgtctccga gcagtcccag cagtccccca ggcagcagag ccctcaaggc 3300
acatcccagg gttctacaag acctcaggtg cctggaggcg ccaccaccag aaaaagaggc 3360
ggcgtgagag gccaacctgc caagtgtcac ggcaagtaca ccacaaccgc cgagggactg 3420
accgctctcc tgaataggag gcacagcccc aggacatcca acgagggcag gtggatgaat 3480
ggagtcatgg ctgtgaacct ctccaaatgg cccctgtaca gcctgaggag agccctggcc 3540
ctcgccatgg ctcctagaag gaggctctcc ggccctccct ggctgacagt gctgctgctg 3600
ctgtccacac tgagcgtggc cgccctgctg attctcttcc tgattttcag cgccggcgcc 3660
accattagca cagaagccag cctgctggtc ctgctcctgc tgtttgtgac cctgctgctg 3720
cctctcctgt cctccaacgg actccagctc cctgccgccc tgattctgat ccagtgtttc 3780
ctcctggccg ctgattatct cgcctacctg attctgccta ccattatgcc caggggcaga 3840
agcacaggaa ggaagggcag ggacacagag aaagagagga gcagatcccc tctcagagct 3900
cctggcggtt ctgatggacc cagcacaagg gctggctgtg gagccggacc ctgtcagctg 3960
agcagcccca tcgccggaaa caacggcaat gaaggcggcg agggcgacga ctacaagagc 4020
tggaggaagc ccgaggaaga ggacaacggc cccaatgacc ccaataccaa caacaggatt 4080
gaggatggag acggcgacga cggaaaatcc tggaggaatc ctgaggagga ggataacaga 4140
aagcaggaca ggctgggcac caagcctttc atggacctcg acggaaccgg cggaggcgag 4200
ggctacagcc agatggtccc tatcgccacc gcccccggaa gcggccacgc cgctacctat 4260
caggatctcc aggccgcccc ttacatcatc tggcctctcc agaccgattg ccagcctgtg 4320
gctaccacct tcgcctcccc cggacagatc cagtggtata caagcgccgt cccccagccc 4380
acagagcatt gctcccagtt tacaaacgct cccaccgtca accagcagca gcctattagc 4440
caaccccagc ccgaaaatcc ccctgctttc acctttaccc agcccgcttc catcattccc 4500
ggcgtcatta gcgcctccaa cctgaacgtg agcgcttccc ctatcatccc tagcgaccat 4560
gtcctcccca tcattacctc cgtgaccagc ctcgcccaac ctaataacat ggccggccac 4620
tggtatgaga gcgtgattcc cggcctgttc ctctgccccc tgatcctccc ttccctgttc 4680
tggatttgct ccctgctgac cttcctggtg ggccacggag ccaatattgt gagcgccgtc 4740
ctgttcctcg tgctggcttg gtgtctcctc attgccaact ggaacgtgac aagagaggac 4800
ttcgtgtccg gcaggagaag ctccatgagc agcctgtccg tggccgcttc caccgccaca 4860
gccatgttcg ccagcttcct caccctgagc tttgatggcc tgggcctgct gctgtttggc 4920
accgccctgg tgatccagac aatttacgtg ctgtatctgg tggtcatgga gatcaccgtg 4980
tggatcatga tgtttaggta tctccacttt tggatcaccc tgctgttcct gctgagcccc 5040
attattctct ccgtcgcctg tctcatcatc caatcctccg ccctgctgat cgaggctgtg 5100
gtcgtcacca ccatcacagt cctggccatt tttctgtggc tccctcctca aggcgctgag 5160
gccgatctcg gcaccgccct gctgattctg aataccgccc tgtgcctggt cgtgctgatc 5220
ctgaccgcta tccctacatg atgatgagcg gccgcgatct gctgtgcctt ctagttgcca 5280
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 5340
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 5400
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 5460
tgctggggat gcggtgggct ctatggccga tcagcgatcg ctgaggtggg tgagtgggcg 5520
tggcctgggg tggtcatgaa aatatataag ttgggggtct tagggtctct ttatttgtgt 5580
tgcagagacc gccggagcca tgagcgggag cagcagcagc agcagtagca gcagcgcctt 5640
ggatggcagc atcgtgagcc cttatttgac gacgcggatg ccccactggg ccggggtgcg 5700
tcagaatgtg atgggctcca gcatcgacgg ccgacccgtc ctgcccgcaa attccgccac 5760
gctgacctat gcgaccgtcg cggggacgcc gttggacgcc accgccgccg ccgccgccac 5820
cgcagccgcc tcggccgtgc gcagcctggc cacggacttt gcattcctgg gaccactggc 5880
gacaggggct acttctcggg ccgctgctgc cgccgttcgc gatgacaagc tgaccgccct 5940
gctggcgcag ttggatgcgc ttactcggga actgggtgac ctttctcagc aggtcatggc 6000
cctgcgccag caggtctcct ccctgcaagc tggcgggaat gcttctccca caaatgccgt 6060
ttaagataaa taaaaccaga ctctgtttgg attaaagaaa agtagcaagt gcattgctct 6120
ctttatttca taattttccg cgcgcgatag gccctagacc agcgttctcg gtcgttgagg 6180
gtgcggtgta tcttctccag gacgtggtag aggtggctct ggacgttgag atacatgggc 6240
atgagcccgt cccgggggtg gaggtagcac cactgcagag cttcatgctc cggggtggtg 6300
ttgtagatga tccagtcgta gcaggagcgc tgggcatggt gcctaaaaat gtccttcagc 6360
agcaggccga tggccagggg gaggcccttg gtgtaagtgt ttacaaaacg gttaagttgg 6420
gaagggtgca ttcggggaga gatgatgtgc atcttggact gtatttttag attggcgatg 6480
tttccgccca gatcccttct gggattcatg ttgtgcagga ccaccagtac agtgtatccg 6540
gtgcacttgg ggaatttgtc atgcagctta gagggaaaag cgtggaagaa cttggagacg 6600
cctttgtggc ctcccagatt ttccatgcat tcgtccatga tgatggcaat gggcccgcgg 6660
gaggcagctt gggcaaagat atttctgggg tcgctgacgt cgtagttgtg ttccagggtg 6720
aggtcgtcat aggccatttt tacaaagcgc gggcggaggg tgcccgactg ggggatgatg 6780
gtcccctctg gccctggggc gtagttgccc tcgcagatct gcatttccca ggccttaatc 6840
tcggaggggg gaatcatatc cacctgcggg gcgatgaaga aaacggtttc cggagccggg 6900
gagattaact gggatgagag caggtttcta agcagctgtg attttccaca accggtgggc 6960
ccataaataa cacctataac cggttgcagc tggtagttta gagagctgca gctgccgtcg 7020
tcccggagga ggggggccac ctcgttgagc atgtccctga cgcgcatgtt ctccccgacc 7080
agatccgcca gaaggcgctc gccgcccagg gacagcagct cttgcaagga agcaaagttt 7140
ttcagcggct tgaggccgtc cgccgtgggc atgtttttca gggtctggct cagcagctcc 7200
aggcggtccc agagctcggt gacgtgctct acggcatctc tatccagcat atctcctcgt 7260
ttcgcgggtt ggggcgactt tcgctgtagg gcaccaagcg gtggtcgtcc agcggggcca 7320
gagtcatgtc cttccatggg cgcagggtcc tcgtcagggt ggtctgggtc acggtgaagg 7380
ggtgcgctcc gggctgagcg cttgccaagg tgcgcttgag gctggttctg ctggtgctga 7440
agcgctgccg gtcttcgccc tgcgcgtcgg ccaggtagca tttgaccatg gtgtcatagt 7500
ccagcccctc cgcggcgtgt cccttggcgc gcagcttgcc cttggaggtg gcgccgcacg 7560
aggggcagag caggctcttg agcgcgtaga gcttgggggc gaggaagacc gattcggggg 7620
agtaggcgtc cgcgccgcag accccgcaca cggtctcgca ctccaccagc caggtgagct 7680
cggggcgcgc cgggtcaaaa accaggtttc ccccatgctt tttgatgcgt ttcttacctc 7740
gggtctccat gaggtggtgt ccccgctcgg tgacgaagag gctgtccgtg tctccgtaga 7800
ccgacttgag gggtcttttc tccagggggg tccctcggtc ttcctcgtag aggaactcgg 7860
accactctga gacgaaggcc cgcgtccagg ccaggacgaa ggaggctatg tgggaggggt 7920
agcggtcgtt gtccactagg gggtccacct tctccaaggt gtgaagacac atgtcgcctt 7980
cctcggcgtc caggaaggtg attggcttgt aggtgtaggc cacgtgaccg ggggttcctg 8040
acgggggggt ataaaagggg gtgggggcgc gctcgtcgtc actctcttcc gcatcgctgt 8100
ctgcgagggc cagctgctgg ggtgagtatt ccctctcgaa ggcgggcatg acctccgcgc 8160
tgaggttgtc agtttccaaa aacgaggagg atttgatgtt cacctgtccc gaggtgatac 8220
ctttgagggt acccgcgtcc atctggtcag aaaacacgat ctttttattg tccagcttgg 8280
tggcgaacga cccgtagagg gcgttggaga gcagcttggc gatggagcgc agggtctggt 8340
tcttgtccct gtcggcgcgc tccttggccg cgatgttgag ctgcacgtac tcgcgcgcga 8400
cgcagcgcca ctcggggaag acggtggtgc gctcgtcggg caccaggcgc acgcgccagc 8460
cgcggttgtg cagggtgacc aggtccacgc tggtggcgac ctcgccgcgc aggcgctcgt 8520
tggtccagca gagacggccg cccttgcgcg agcagaaggg gggcaggggg tcgagctggg 8580
tctcgtccgg ggggtccgcg tccacggtga aaaccccggg gcgcaggcgc gcgtcgaagt 8640
agtctatctt gcaaccttgc atgtccagcg cctgctgcca gtcgcgggcg gcgagcgcgc 8700
gctcgtaggg gttgagcggc gggccccagg gcatggggtg ggtgagtgcg gaggcgtaca 8760
tgccgcagat gtcatagacg tagaggggct cccgcaggac cccgatgtag gtggggtagc 8820
agcggccgcc gcggatgctg gcgcgcacgt agtcatacag ctcgtgcgag ggggcgagga 8880
ggtcggggcc caggttggtg cgggcggggc gctccgcgcg gaagacgatc tgcctgaaga 8940
tggcatgcga gttggaagag atggtggggc gctggaagac gttgaagctg gcgtcctgca 9000
ggccgacggc gtcgcgcacg aaggaggcgt aggagtcgcg cagcttgtgt accagctcgg 9060
cggtgacctg cacgtcgagc gcgcagtagt cgagggtctc gcggatgatg tcatatttag 9120
cctgcccctt ctttttccac agctcgcggt tgaggacaaa ctcttcgcgg tctttccagt 9180
actcttggat cgggaaaccg tccggttccg aacggtaaga gcctagcatg tagaactggt 9240
tgacggcctg gtaggcgcag cagcccttct ccacggggag ggcgtaggcc tgcgcggcct 9300
tgcggagcga ggtgtgggtc agggcgaagg tgtccctgac catgactttg aggtactggt 9360
gcttgaagtc ggagtcgtcg cagccgcccc gctcccagag cgagaagtcg gtgcgcttct 9420
tggagcgggg gttgggcaga gcgaaggtga catcgttgaa gaggattttg cccgcgcggg 9480
gcatgaagtt gcgggtgatg cggaagggcc ccggcacttc agagcggttg ttgatgacct 9540
gggcggcgag cacgatctcg tcgaagccgt tgatgttgtg gcccacgatg tagagttcca 9600
ggaagcgggg ccggcccttt acggtgggca gcttctttag ctcttcgtag gtgagctcct 9660
cgggcgaggc gaggccgtgc tcggccaggg cccagtccgc gaggtgcggg ttgtctctga 9720
ggaaggactt ccagaggtcg cgggccagga gggtctgcag gcggtctctg aaggtcctga 9780
actggcggcc cacggccatt ttttcggggg tgatgcagta gaaggtgagg gggtcttgct 9840
gccagcggtc ccagtcgagc tgcagggcga ggtcgcgcgc ggcggtgacc aggcgctcgt 9900
cgcccccgaa tttcatgacc agcatgaagg gcacgagctg ctttccgaag gcccccatcc 9960
aagtgtaggt ctctacatcg taggtgacaa agaggcgctc cgtgcgagga tgcgagccga 10020
tcgggaagaa ctggatctcc cgccaccagt tggaggagtg gctgttgatg tggtggaagt 10080
agaagtcccg tcgccgggcc gaacactcgt gctggctttt gtaaaagcga gcgcagtact 10140
ggcagcgctg cacgggctgt acctcatgca cgagatgcac ctttcgcccg cgcacgagga 10200
agccgagggg aaatctgagc cccccgcctg gctcgcggca tggctggttc tcttctactt 10260
tggatgcgtg tccgtctccg tctggctcct cgaggggtgt tacggtggag cggaccacca 10320
cgccgcgcga gccgcaggtc cagatatcgg cgcgcggcgg tcggagtttg atgacgacat 10380
cgcgcagctg ggagctgtcc atggtctgga gctcccgcgg cggcggcagg tcagccggga 10440
gttcttgcag gttcacctcg cagagtcggg ccagggcgcg gggcaggtct aggtggtacc 10500
tgatctctag gggcgtgttg gtggcggcgt cgatggcttg caggagcccg cagccccggg 10560
gggcgacgac ggtgccccgc ggggtggtgg tggtggtggc ggtgcagctc agaagcggtg 10620
ccgcgggcgg gcccccggag gtaggggggg ctccggtccc gcgggcaggg gcggcagcgg 10680
cacgtcggcg tggagcgcgg gcaggagttg gtgctgtgcc cggaggttgc tggcgaaggc 10740
gacgacgcgg cggttgatct cctggatctg gcgcctctgc gtgaagacga cgggcccggt 10800
gagcttgaac ctgaaagaga gttcgacaga atcaatctcg gtgtcattga ccgcggcctg 10860
gcgcaggatc tcctgcacgt ctcccgagtt gtcttggtag gcgatctcgg ccatgaactg 10920
ctcgatctct tcctcctgga ggtctccgcg tccggcgcgt tccacggtgg ccgccaggtc 10980
gttggagatg cgccccatga gctgcgagaa ggcgttgagt ccgccctcgt tccagactcg 11040
gctgtagacc acgcccccct ggtcatcgcg ggcgcgcatg accacctgcg cgaggttgag 11100
ctccacgtgc cgcgcgaaga cggcgtagtt gcgcagacgc tggaagaggt agttgagggt 11160
ggtggcggtg tgctcggcca cgaagaagtt catgacccag cggcgcaacg tggattcgtt 11220
gatgtccccc aaggcctcca gccgttccat ggcctcgtag aagtccacgg cgaagttgaa 11280
aaactgggag ttgcgcgccg acacggtcaa ctcctcctcc agaagacgga tgagctcggc 11340
gacggtgtcg cgcacctcgc gctcgaaggc tatggggatc tcttcctccg ctagcatcac 11400
cacctcctcc tcttcctcct cttctggcac ttccatgatg gcttcctcct cttcgggggg 11460
tggcggcggc ggcggtgggg gagggggcgc tctgcgccgg cggcggcgca ccgggaggcg 11520
gtccacgaag cgcgcgatca tctccccgcg gcggcggcgc atggtctcgg tgacggcgcg 11580
gccgttctcc cgggggcgca gttggaagac gccgccggac atctggtgct ggggcgggtg 11640
gccgtgaggc agcgagacgg cgctgacgat gcatctcaac aattgctgcg taggtacgcc 11700
gccgagggac ctgagggagt ccatatccac cggatccgaa aacctttcga ggaaggcgtc 11760
taaccagtcg cagtcgcaag gtaggctgag caccgtggcg ggcggcgggg ggtgggggga 11820
gtgtctggcg gaggtgctgc tgatgatgta attgaagtag gcggacttga cacggcggat 11880
ggtcgacagg agcaccatgt ccttgggtcc ggcctgctgg atgcggaggc ggtcggctat 11940
gccccaggct tcgttctggc atcggcgcag gtccttgtag tagtcttgca tgagcctttc 12000
caccggcacc tcttctcctt cctcttctgc ttcttccatg tctgcttcgg ccctggggcg 12060
gcgccgcgcc cccctgcccc ccatgcgcgt gaccccgaac cccctgagcg gttggagcag 12120
ggccaggtcg gcgacgacgc gctcggccag gatggcctgc tgcacctgcg tgagggtggt 12180
ttggaagtca tccaagtcca cgaagcggtg gtaggcgccc gtgttgatgg tgtaggtgca 12240
gttggccatg acggaccagt tgacggtctg gtggcccggt tgcgacatct cggtgtacct 12300
gagtcgcgag taggcgcggg agtcgaagac gtagtcgttg caagtccgca ccaggtactg 12360
gtagcccacc aggaagtgcg gcggcggctg gcggtagagg ggccagcgca gggtggcggg 12420
ggctccgggg gccaggtctt ccagcatgag gcggtggtag gcgtagatgt acctggacat 12480
ccaggtgata cccgcggcgg tggtggaggc gcgcgggaag tcgcgcaccc ggttccagat 12540
gttgcgcagg ggcagaaagt gctccatggt aggcgtgctc tgtccagtca gacgcgcgca 12600
gtcgttgata ctctagacca gggaaaacga aagccggtca gcgggcactc ttccgtggtc 12660
tggtgaatag atcgcaaggg tatcatggcg gagggcctcg gttcgagccc cgggtccggg 12720
ccggacggtc cgccatgatc cacgcggtta ccgcccgcgt gtcgaaccca ggtgtgcgac 12780
gtcagacaac ggtggagtgt tccttttggc gtttttctgg ccgggcgccg gcgccgcgta 12840
agagactaag ccgcgaaagc gaaagcagta agtggctcgc tccccgtagc cggagggatc 12900
cttgctaagg gttgcgttgc ggcgaacccc ggttcgaatc ccgtactcgg gccggccgga 12960
cccgcggcta aggtgttgga ttggcctccc cctcgtataa agaccccgct tgcggattga 13020
ctccggacac ggggacgagc cccttttatt tttgctttcc ccagatgcat ccggtgctgc 13080
ggcagatgcg ccccccgccc cagcagcagc aacaacacca gcaagagcgg cagcaacagc 13140
agcgggagtc atgcagggcc ccctcaccca ccctcggcgg gccggccacc tcggcgtccg 13200
cggccgtgtc tggcgcctgc ggcggcggcg gggggccggc tgacgacccc gaggagcccc 13260
cgcggcgcag ggccagacac tacctggacc tggaggaggg cgagggcctg gcgcggctgg 13320
gggcgccgtc tcccgagcgc cacccgcggg tgcagctgaa gcgcgactcg cgcgaggcgt 13380
acgtgcctcg gcagaacctg ttcagggacc gcgcgggcga ggagcccgag gagatgcggg 13440
acaggaggtt cagcgcaggg cgggagctgc ggcaggggct gaaccgcgag cggctgctgc 13500
gcgaggagga ctttgagccc gacgcgcgga cggggatcag ccccgcgcgc gcgcacgtgg 13560
cggccgccga cctggtgacg gcgtacgagc agacggtgaa ccaggagatc aacttccaaa 13620
agagtttcaa caaccacgtg cgcacgctgg tggcgcgcga ggaggtgacc atcgggctga 13680
tgcacctgtg ggactttgta agcgcgctgg tgcagaaccc caacagcaag cctctgacgg 13740
cgcagctgtt cctgatagtg cagcacagca gggacaacga ggcgtttagg gacgcgctgc 13800
tgaacatcac cgagcccgag ggtcggtggc tgctggacct gattaacatc ctgcagagca 13860
tagtggtgca ggagcgcagc ctgagcctgg ccgacaaggt ggcggccatc aactactcga 13920
tgctgagcct gggcaagttt tacgcgcgca agatctacca gacgccgtac gtgcccatag 13980
acaaggaggt gaagatcgac ggtttttaca tgcgcatggc gctgaaggtg ctcaccctga 14040
gcgacgacct gggcgtgtac cgcaacgagc gcatccacaa ggccgtgagc gtgagccggc 14100
ggcgcgagct gagcgaccgc gagctgatgc acagcctgca gcgggcgctg gcgggcgccg 14160
gcagcggcga cagggaggcg gagtcctact tcgatgcggg ggcggacctg cgctgggcgc 14220
ccagccggcg ggccctggag gccgcggggg tccgcgagga ctatgacgag gacggcgagg 14280
aggatgagga gtacgagcta gaggagggcg agtacctgga ctaaaccgcg ggtggtgttt 14340
ccggtagatg caagacccga acgtggtgga cccggcgctg cgggcggctc tgcagagcca 14400
gccgtccggc cttaactcct cagacgactg gcgacaggtc atggaccgca tcatgtcgct 14460
gacggcgcgt aacccggacg cgttccggca gcagccgcag gccaacaggc tctccgccat 14520
cctggaggcg gtggtgcctg cgcgctcgaa ccccacgcac gagaaggtgc tggccatagt 14580
gaacgcgctg gccgagaaca gggccatccg cccggacgag gccgggctgg tgtacgacgc 14640
gctgctgcag cgcgtggccc gctacaacag cggcaacgtg cagaccaacc tggaccggct 14700
ggtgggggac gtgcgcgagg cggtggcgca gcgcgagcgc gcggatcggc agggcaacct 14760
gggctccatg gtggcgctga atgccttcct gagcacgcag ccggccaacg tgccgcgggg 14820
gcaggaagac tacaccaact ttgtgagcgc gctgcggctg atggtgaccg agacccccca 14880
gagcgaggtg taccagtcgg gcccggacta cttcttccag accagcagac agggcctgca 14940
gacggtgaac ctgagccagg ctttcaagaa cctgcggggg ctgtggggcg tgaaggcgcc 15000
caccggcgac cgggcgacgg tgtccagcct gctgacgccc aactcgcgcc tgctgctgct 15060
gctgatcgcg ccgttcacgg acagcggcag cgtgtcccgg gacacctacc tggggcacct 15120
gctgaccctg taccgcgagg ccatcgggca ggcgcaggtg gacgagcaca ccttccagga 15180
gatcaccagc gtgagccgcg cgctggggca ggaggacacg agcagcctgg aggcgactct 15240
gaactacctg ctgaccaacc ggcggcagaa gattccctcg ctgcacagcc tgacctccga 15300
ggaggagcgc atcttgcgct acgtgcagca gagcgtgagc ctgaacctga tgcgcgacgg 15360
ggtgacgccc agcgtggcgc tggacatgac cgcgcgcaac atggaaccgg gcatgtacgc 15420
cgcgcaccgg ccttacatca accgcctgat ggactacctg catcgcgcgg cggccgtgaa 15480
ccccgagtac tttaccaacg ccatcctgaa cccgcactgg ctcccgccgc ccgggttcta 15540
cagcgggggc ttcgaggtcc cggagaccaa cgatggcttc ctgtgggacg acatggacga 15600
cagcgtgttc tccccgcggc cgcaggcgct ggcggaagcg tccctgctgc gtcccaagaa 15660
ggaggaggag gaggaggcga gtcgccgccg cggcagcagc ggcgtggctt ctctgtccga 15720
gctgggggcg gcagccgccg cgcgccccgg gtccctgggc ggcagcccct ttccgagcct 15780
ggtggggtct ctgcacagcg agcgcaccac ccgccctcgg ctgctgggcg aggacgagta 15840
cctgaataac tccctgctgc agccggtgcg ggagaaaaac ctgcctcccg ccttccccaa 15900
caacgggata gagagcctgg tggacaagat gagcagatgg aagacctatg cgcaggagca 15960
cagggacgcg cctgcgctcc ggccgcccac gcggcgccag cgccacgacc ggcagcgggg 16020
gctggtgtgg gatgacgagg actccgcgga cgatagcagc gtgctggacc tgggagggag 16080
cggcaacccg ttcgcgcacc tgcgcccccg cctggggagg atgttttaaa aaaaaaaaaa 16140
aaangcaaga agcatgatgc aaaaattaaa taaaactcac caaggccatg gcgaccgagc 16200
gttggtttct tgtgttccct tcagtatgcg gcgcgcggcg atgtaccagg agggacctcc 16260
tccctcttac gagagcgtgg tgggcgcggc ggcggcggcg ccctcttctc cctttgcgtc 16320
gcagctgctg gagccgccgt acgtgcctcc gcgctacctg cggcctacgg gggggagaaa 16380
cagcatccgt tactcggagc tggcgcccct gttcgacacc acccgggtgt acctggtgga 16440
caacaagtcg gcggacgtgg cctccctgaa ctaccagaac gaccacagca attttttgac 16500
cacggtcatc cagaacaatg actacagccc gagcgaggcc agcacccaga ccatcaatct 16560
ggatgaccgg tcgcactggg gcggcgacct gaaaaccatc ctgcacacca acatgcccaa 16620
cgtgaacgag ttcatgttca ccaataagtt caaggcgcgg gtgatggtgt cgcgctcgca 16680
caccaaggaa gaccgggtgg agctgaagta cgagtgggtg gagttcgagc tgccagaggg 16740
caactactcc gagaccatga ccattgacct gatgaacaac gcgatcgtgg agcactatct 16800
gaaagtgggc aggcagaacg gggtcctgga gagcgacatc ggggtcaagt tcgacaccag 16860
gaacttccgc ctggggctgg accccgtgac cgggctggtt atgcccgggg tgtacaccaa 16920
cgaggccttc catcccgaca tcatcctgct gcccggctgc ggggtggact tcacttacag 16980
ccgcctgagc aacctcctgg gcatccgcaa gcggcagccc ttccaggagg gcttcaggat 17040
cacctacgag gacctggagg ggggcaacat ccccgcgctc ctcgatgtgg aggcctacca 17100
ggatagcttg aaggaaaatg aggcgggaca ggaggatacc gcccccgccg cctccgccgc 17160
cgccgagcag ggcgaggatg ctgctgacac cgcggccgcg gacggggcag aggccgaccc 17220
cgctatggtg gtggaggctc ccgagcagga ggaggacatg aatgacagtg cggtgcgcgg 17280
agacaccttc gtcacccggg gggaggaaaa gcaagcggag gccgaggccg cggccgagga 17340
aaagcaactg gcggcagcag cggcggcggc ggcgttggcc gcggcggagg ctgagtctga 17400
ggggaccaag cccgccaagg agcccgtgat taagcccctg accgaagata gcaagaagcg 17460
cagttacaac ctgctcaagg acagcaccaa caccgcgtac cgcagctggt acctggccta 17520
caactacggc gacccgtcga cgggggtgcg ctcctggacc ctgctgtgca cgccggacgt 17580
gacctgcggc tcggagcagg tgtactggtc gctgcccgac atgatgcaag accccgtgac 17640
cttccgctcc acgcggcagg tcagcaactt cccggtggtg ggcgccgagc tgctgcccgt 17700
gcactccaag agcttctaca acgaccaggc cgtctactcc cagctcatcc gccagttcac 17760
ctctctgacc cacgtgttca atcgctttcc tgagaaccag attctggcgc gcccgcccgc 17820
ccccaccatc accaccgtca gtgaaaacgt tcctgctctc acagatcacg ggacgctacc 17880
gctgcgcaac agcatcggag gagtccagcg agtgaccgtt actgacgcca gacgccgcac 17940
ctgcccctac gtttacaagg ccttgggcat agtctcgccg cgcgtccttt ccagccgcac 18000
tttttgagca acaccaccat catgtccatc ctgatctcac ccagcaataa ctccggctgg 18060
ggactgctgc gcgcgcccag caagatgttc ggaggggcga ggaagcgttc cgagcagcac 18120
cccgtgcgcg tgcgcgggca cttccgcgcc ccctggggag cgcacaaacg cggccgcgcg 18180
gggcgcacca ccgtggacga cgccatcgac tcggtggtgg agcaggcgcg caactacagg 18240
cccgcggtct ctaccgtgga cgcggccatc cagaccgtgg tgcggggcgc gcggcggtac 18300
gccaagctga agagccgccg gaagcgcgtg gcccgccgcc accgccgccg acccggggcc 18360
gccgccaaac gcgccgccgc ggccctgctt cgccgggcca agcgcacggg ccgccgcgcc 18420
gccatgaggg ccgcgcgccg cttggccgcc ggcatcaccg ccgccaccat ggccccccgt 18480
acccgaagac gcgcggccgc cgccgccgcc gccgccatca gtgacatggc cagcaggcgc 18540
cggggcaacg tgtactgggt gcgcgactcg gtgaccggca cgcgcgtgcc cgtgcgcttc 18600
cgccccccgc ggacttgaga tgatgtgaaa aaacaacact gagtctcctg ctgttgtgtg 18660
tatcccagcg gcggcggcgc gcgcagcgtc atgtccaagc gcaaaatcaa agaagagatg 18720
ctccaggtcg tcgcgccgga gatctatggg cccccgaaga aggaagagca ggattcgaag 18780
ccccgcaaga taaagcgggt caaaaagaaa aagaaagatg atgacgatgc cgatggggag 18840
gtggagttcc tgcgcgccac ggcgcccagg cgcccggtgc agtggaaggg ccggcgcgta 18900
aagcgcgtcc tgcgccccgg caccgcggtg gtcttcacgc ccggcgagcg ctccacccgg 18960
actttcaagc gcgtctatga cgaggtgtac ggcgacgaag acctgctgga gcaggccaac 19020
gagcgcttcg gagagtttgc ttacgggaag cgtcagcggg cgctggggaa ggaggacctg 19080
ctggcgctgc cgctggacca gggcaacccc acccccagtc tgaagcccgt gaccctgcag 19140
caggtgctgc cgagcagcgc accctccgag gcgaagcggg gtctgaagcg cgagggcggc 19200
gacctggcgc ccaccgtgca gctcatggtg cccaagcggc agaggctgga ggatgtgctg 19260
gagaaaatga aagtagaccc cggtctgcag ccggacatca gggtccgccc catcaagcag 19320
gtggcgccgg gcctcggcgt gcagaccgtg gacgtggtca tccccaccgg caactccccc 19380
gccgccgcca ccactaccgc tgcctccacg gacatggaga cacagaccga tcccgccgca 19440
gccgcagccg cagccgccgc cgcgacctcc tcggcggagg tgcagacgga cccctggctg 19500
ccgccggcga tgtcagctcc ccgcgcgcgt cgcgggcgca ggaagtacgg cgccgccaac 19560
gcgctcctgc ccgagtacgc cttgcatcct tccatcgcgc ccacccccgg ctaccgaggc 19620
tatacctacc gcccgcgaag agccaagggt tccacccgcc gtccccgccg acgcgccgcc 19680
gccaccaccc gccgccgccg ccgcagacgc cagcccgcac tggctccagt ctccgtgagg 19740
aaagtggcgc gcgacggaca caccctggtg ctgcccaggg cgcgctacca ccccagcatc 19800
gtttaaaagc ctgttgtggt tcttgcagat atggccctca cttgccgcct ccgtttcccg 19860
gtgccgggat accgaggagg aagatcgcgc cgcaggaggg gtctggccgg ccgcggcctg 19920
agcggaggca gccgccgcgc gcaccggcgg cgacgcgcca ccagccgacg catgcgcggc 19980
ggggtgctgc ccctgttaat ccccctgatc gccgcggcga tcggcgccgt gcccgggatc 20040
gcctccgtgg ccttgcaagc gtcccagagg cattgacaga cttgcaaact tgcaaatatg 20100
gaaaaaaaaa ccccaataaa aaagtctaga ctctcacgct cgcttggtcc tgtgactatt 20160
ttgtagaatg gaagacatca actttgcgtc gctggccccg cgtcacggct cgcgcccgtt 20220
cctgggacac tggaacgata tcggcaccag caacatgagc ggtggcgcct tcagttgggg 20280
ctctctgtgg agcggcatta aaagtatcgg gtctgccgtt aaaaattacg gctcccgggc 20340
ctggaacagc agcacgggcc agatgttgag agacaagttg aaagagcaga acttccagca 20400
gaaggtggtg gagggcctgg cctccggcat caacggggtg gtggacctgg ccaaccaggc 20460
cgtgcagaat aagatcaaca gcagactgga cccccggccg ccggtggagg aggtgccgcc 20520
ggcgctggag acggtgtccc ccgatgggcg tggcgagaag cgcccgcggc ccgataggga 20580
agagaccact ctggtcacgc agaccgatga gccgcccccg tatgaggagg ccctgaagca 20640
aggtctgccc accacgcggc ccatcgcgcc catggccacc ggggtggtgg gccgccacac 20700
ccccgccacg ctggacttgc ctccgcccgc cgatgtgccg cagcagcaga aggcggcaca 20760
gccgggcccg cccgcgaccg cctcccgttc ctccgccggt cctctgcgcc gcgcggccag 20820
cggcccccgc gggggggtcg cgaggcacgg caactggcag agcacgctga acagcatcgt 20880
gggtctgggg gtgcggtccg tgaagcgccg ccgatgctac tgaatagctt agctaacgtg 20940
ttgtatgtgt gtatgcgccc tatgtcgccg ccagaggagc tgctgagtcg ccgccgttcg 21000
cgcgcccacc accaccgcca ctccgcccct caagatggcg accccatcga tgatgccgca 21060
gtggtcgtac atgcacatct cgggccagga cgcctcggag tacctgagcc ccgggctggt 21120
gcagttcgcc cgcgccaccg agagctactt cagcctgagt aacaagttta ggaaccccac 21180
ggtggcgccc acgcacgatg tgaccaccga ccggtctcag cgcctgacgc tgcggttcat 21240
tcccgtggac cgcgaggaca ccgcgtactc gtacaaggcg cggttcaccc tggccgtggg 21300
cgacaaccgc gtgctggaca tggcctccac ctactttgac atccgcgggg tgctggaccg 21360
gggtcccact ttcaagccct actctggcac cgcctacaac tccctggccc ccaagggcgc 21420
tcccaactcc tgcgagtggg agcaagagga aactcaggca gttgaagaag cagcagaaga 21480
ggaagaagaa gatgctgacg gtcaagctga ggaagagcaa gcagctacca aaaagactca 21540
tgtatatgct caggctcccc tttctggcga aaaaattagt aaagatggtc tgcaaatagg 21600
aacggacgct acagctacag aacaaaaacc tatttatgca gaccctacat tccagcccga 21660
accccaaatc ggggagtccc agtggaatga ggcagatgct acagtcgccg gcggtagagt 21720
gctaaagaaa tctactccca tgaaaccatg ctatggttcc tatgcaagac ccacaaatgc 21780
taatggaggt cagggtgtac taacggcaaa tgcccaggga cagctagaat ctcaggttga 21840
aatgcaattc ttttcaactt ctgaaaacgc ccgtaacgag gctaacaaca ttcagcccaa 21900
attggtgctg tatagtgagg atgtgcacat ggagaccccg gatacgcacc tttcttacaa 21960
gcccgcaaaa agcgatgaca attcaaaaat catgctgggt cagcagtcca tgcccaacag 22020
acctaattac atcggcttca gagacaactt tatcggcctc atgtattaca atagcactgg 22080
caacatggga gtgcttgcag gtcaggcctc tcagttgaat gcagtggtgg acttgcaaga 22140
cagaaacaca gaactgtcct accagctctt gcttgattcc atgggtgaca gaaccagata 22200
cttttccatg tggaatcagg cagtggacag ttatgaccca gatgttagaa ttattgaaaa 22260
tcatggaact gaagacgagc tccccaacta ttgtttccct ctgggtggca taggggtaac 22320
tgacacttac caggctgtta aaaccaacaa tggcaataac gggggccagg tgacttggac 22380
aaaagatgaa acttttgcag atcgcaatga aataggggtg ggaaacaatt tcgctatgga 22440
gatcaacctc agtgccaacc tgtggagaaa cttcctgtac tccaacgtgg cgctgtacct 22500
accagacaag cttaagtaca acccctccaa tgtggacatc tctgacaacc ccaacaccta 22560
cgattacatg aacaagcgag tggtggcccc ggggctggtg gactgctaca tcaacctggg 22620
cgcgcgctgg tcgctggact acatggacaa cgtcaacccc ttcaaccacc accgcaatgc 22680
gggcctgcgc taccgctcca tgctcctggg caacgggcgc tacgtgccct tccacatcca 22740
ggtgccccag aagttctttg ccatcaagaa cctcctcctc ctgccgggct cctacaccta 22800
cgagtggaac ttcaggaagg atgtcaacat ggtcctccag agctctctgg gtaacgatct 22860
cagggtggac ggggccagca tcaagttcga gagcatctgc ctctacgcca ccttcttccc 22920
catggcccac aacacggcct ccacgctcga ggccatgctc aggaacgaca ccaacgacca 22980
gtccttcaat gactacctct ccgccgccaa catgctctac cccatacccg ccaacgccac 23040
caacgtcccc atctccatcc cctcgcgcaa ctgggcggcc ttccgcggct gggccttcac 23100
ccgcctcaag accaaggaga ccccctccct gggctcggga ttcgacccct actacaccta 23160
ctcgggctcc attccctacc tggacggcac cttctacctc aaccacactt tcaagaaggt 23220
ctcggtcacc ttcgactcct cggtcagctg gccgggcaac gaccgtctgc tcacccccaa 23280
cgagttcgag atcaagcgct cggtcgacgg ggagggctac aacgtggccc agtgcaacat 23340
gaccaaggac tggttcctgg tccagatgct ggccaactac aacatcggct accagggctt 23400
ctacatccca gagagctaca aggacaggat gtactccttc ttcaggaact tccagcccat 23460
gagccggcag gtggtggacc agaccaagta caaggactac caggaggtgg gcatcatcca 23520
ccagcacaac aactcgggct tcgtgggcta cctcgccccc accatgcgcg agggacaggc 23580
ctaccccgcc aacttcccct atccgctcat aggcaagacc gcggtcgaca gcatcaccca 23640
gaaaaagttc ctctgcgacc gcaccctctg gcgcatcccc ttctccagca acttcatgtc 23700
catgggtgcg ctctcggacc tgggccagaa cttgctctac gccaactccg cccacgccct 23760
cgacatgacc ttcgaggtcg accccatgga cgagcccacc cttctctatg ttctgttcga 23820
agtctttgac gtggtccggg tccaccagcc gcaccgcggc gtcatcgaga ccgtgtacct 23880
gcgtacgccc ttctcggccg gcaacgccac cacctaaaga agcaagccgc agtcatcgcc 23940
gcctgcatgc cgtcgggttc caccgagcaa gagctcaggg ccatcgtcag agacctggga 24000
tgcgggccct attttttggg caccttcgac aagcgcttcc ctggctttgt ctccccacac 24060
aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcgt gcactggctg 24120
gccttcgcct ggaacccgcg ctccaaaaca tgcttcctct ttgacccctt cggcttttcg 24180
gaccagcggc tcaagcaaat ctacgagttc gagtacgagg gcttgctgcg tcgcagcgcc 24240
atcgcctcct cgcccgaccg ctgcgtcacc ctcgaaaagt ccacccagac cgtgcagggg 24300
cccgactcgg ccgcctgcgg tctcttctgc tgcatgtttc tgcacgcctt tgtgcactgg 24360
cctcagagtc ccatggaccg caaccccacc atgaacttgc tgacgggggt gcccaactcc 24420
atgctccaga gcccccaggt cgagcccacc ctgcgccgca accaggagca gctctacagc 24480
ttcctggagc gccactcgcc ttacttccgc cgccacagcg cacagatcag gagggccacc 24540
tccttctgcc acttgcaaga gatgcaagaa gggtaataac gatgtacaca ctttttttct 24600
caataaatgg catcttttta tttatacaag ctctctgggg tattcatttc ccaccaccac 24660
ccgccgttgt cgccatctgg ctctatttag aaatcgaaag ggttctgccg ggagtcgccg 24720
tgcgccacgg gcagggacac gttgcgatac tggtagcggg tgccccactt gaactcgggc 24780
accaccaggc gaggcagctc ggggaagttt tcgctccaca ggctgcgggt cagcaccagc 24840
gcgttcatca ggtcgggcgc cgagatcttg aagtcgcagt tggggccgcc gccctgcgcg 24900
cgcgagttgc ggtacaccgg gttgcagcac tggaacacca acagcgccgg gtgcttcacg 24960
ctggccagca cgctgcggtc ggagatcagc tcggcgtcca ggtcctccgc gttgctcagc 25020
gcgaacgggg tcatcttggg cacttgccgc cccaggaagg gcgcgtgccc cggtttcgag 25080
ttgcagtcgc agcgcagcgg gatcagcagg tgcccgtgcc cggactcggc gttggggtac 25140
agcgcgcgca tgaaggcctg catctggcgg aaggccatct gggccttggc gccctccgag 25200
aagaacatgc cgcaggactt gcccgagaac tggtttgcgg ggcagctggc gtcgtgcagg 25260
cagcagcgcg cgtcggtgtt ggcgatctgc accacgttgc gcccccaccg gttcttcacg 25320
atcttggcct tggacgattg ctccttcagc gcgcgctgcc cgttctcgct ggtcacatcc 25380
atctcgatca catgttcctt gttcaccatg ctgctgccgt gcagacactt cagctcgccc 25440
tccgtctcgg tgcagcggtg ctgccacagc gcgcagcccg tgggctcgaa agacttgtag 25500
gtcacctccg cgaaggactg caggtacccc tgcaaaaagc ggcccatcat ggtcacgaag 25560
gtcttgttgc tgctgaaggt cagctgcagc ccgcggtgct cctcgttcag ccaggtcttg 25620
cacacggccg ccagcgcctc cacctggtcg ggcagcatct tgaagttcac cttcagctca 25680
ttctccacgt ggtacttgtc catcagcgtg cgcgccgcct ccatgccctt ctcccaggcc 25740
gacaccagcg gcaggctcac ggggttcttc accatcaccg tggccgccgc ctccgccgcg 25800
ctttcgcttt ccgccccgct gttctcttcc tcttcctcct cttcctcgcc gccgcccact 25860
cgcagccccc gcaccacggg gtcgtcttcc tgcaggcgct gcaccttgcg cttgccgttg 25920
cgcccctgct tgatgcgcac gggcgggttg ctgaagccca ccatcaccag cgcggcctct 25980
tcttgctcgt cctcgctgtc cagaatgacc tccggggagg gggggttggt catcctcagt 26040
accgaggcac gcttcttttt cttcctgggg gcgttcgcca gctccgcggc tgcggccgct 26100
gccgaggtcg aaggccgagg gctgggcgtg cgcggcacca gcgcgtcctg cgagccgtcc 26160
tcgtcctcct cggactcgag acggaggcgg gcccgcttct tcgggggcgc gcggggcggc 26220
ggaggcggcg gcggcgacgg agacggggac gagacatcgt ccagggtggg tggacggcgg 26280
gccgcgccgc gtccgcgctc gggggtggtc tcgcgctggt cctcttcccg actggccatc 26340
tcccactgct ccttctccta taggcagaaa gagatcatgg agtctctcat gcgagtcgag 26400
aaggaggagg acagcctaac cgccccctct gagccctcca ccaccgccgc caccaccgcc 26460
aatgccgccg cggacgacgc gcccaccgag accaccgcca gtaccaccct ccccagcgac 26520
gcacccccgc tcgagaatga agtgctgatc gagcaggacc cgggttttgt gagcggagag 26580
gaggatgagg tggatgagaa ggagaaggag gaggtcgccg cctcagtgcc aaaagaggat 26640
aaaaagcaag accaggacga cgcagataag gatgagacag cagtcgggcg ggggaacgga 26700
agccatgatg ctgatgacgg ctacctagac gtgggagacg acgtgctgct taagcacctg 26760
caccgccagt gcgtcatcgt ctgcgacgcg ctgcaggagc gctgcgaagt gcccctggac 26820
gtggcggagg tcagccgcgc ctacgagcgg cacctcttcg cgccgcacgt gccccccaag 26880
cgccgggaga acggcacctg cgagcccaac ccgcgtctca acttctaccc ggtcttcgcg 26940
gtacccgagg tgctggccac ctaccacatc tttttccaaa actgcaagat ccccctctcc 27000
tgccgcgcca accgcacccg cgccgacaaa accctgaccc tgcggcaggg cgcccacata 27060
cctgatatcg cctctctgga ggaagtgccc aagatcttcg agggtctcgg tcgcgacgag 27120
aaacgggcgg cgaacgctct gcacggagac agcgaaaacg agagtcactc gggggtgctg 27180
gtggagctcg agggcgacaa cgcgcgcctg gccgtactca agcgcagcat agaggtcacc 27240
cactttgcct acccggcgct caacctgccc cccaaggtca tgagtgtggt catgggcgag 27300
ctcatcatgc gccgcgccca gcccctggcc gcggatgcaa acttgcaaga gtcctccgag 27360
gaaggcctgc ccgcggtcag cgacgagcag ctggcgcgct ggctggagac ccgcgacccc 27420
gcgcagctgg aggagcggcg caagctcatg atggccgcgg tgctggtcac cgtggagctc 27480
gagtgtctgc agcgcttctt cgcggacccc gagatgcagc gcaagctcga ggagaccctg 27540
cactacacct tccgccaggg ctacgtgcgc caggcctgca agatctccaa cgtggagctc 27600
tgcaacctgg tctcctacct gggcatcctg cacgagaacc gcctcgggca gaacgtcctg 27660
cactccaccc tcaaagggga ggcgcgccgc gactacatcc gcgactgcgc ctacctcttc 27720
ctctgctaca cctggcagac ggccatgggg gtctggcagc agtgcctgga ggagcgcaac 27780
ctcaaggagc tggaaaagct cctcaagcgc accctcaggg acctctggac gggcttcaac 27840
gagcgctcgg tggccgccgc gctggcggac atcatctttc ccgagcgcct gctcaagacc 27900
ctgcagcagg gcctgcccga cttcaccagc cagagcatgc tgcagaactt caggactttc 27960
atcctggagc gctcgggcat cctgccggcc acttgctgcg cgctgcccag cgacttcgtg 28020
cccatcaagt acagggagtg cccgccgccg ctctggggcc actgctacct cttccagctg 28080
gccaactacc tcgcctacca ctcggacctc atggaagacg tgagcggcga gggcctgctc 28140
gagtgccact gccgctgcaa cctctgcacg ccccaccgct ctctagtctg caacccgcag 28200
ctgctcagcg agagtcagat tatcggtacc ttcgagctgc agggtccctc gcctgacgag 28260
aagtccgcgg ctccagggct gaaactcact ccggggctgt ggacttccgc ctacctacgc 28320
aaatttgtac ctgaggacta ccacgcccac gagatcaggt tctacgaaga ccaatcccgc 28380
ccgcccaagg cggagctcac cgcctgcgtc atcacccagg ggcacatcct gggccaattg 28440
caagccatca acaaagcccg ccgagagttc ttgctgaaaa agggtcgggg ggtgtacctg 28500
gacccccagt ccggcgagga gctaaacccg ctacccccgc cgccgcccca gcagcgggac 28560
cttgcttccc aggatggcac ccagaaagaa gcagcagccg ccgccgccgc cgcagccata 28620
catgcttctg gaggaagagg aggaggactg ggacagtcag gcagaggagg tttcggacga 28680
ggagcaggag gagatgatgg aagactggga ggaggacagc agcctagacg aggaagcttc 28740
agaggccgaa gaggtggcag acgcaacacc atcgccctcg gtcgcagccc cctcgccggg 28800
gcccctgaaa tcctccgaac ccagcaccag cgctataacc tccgctcctc cggcgccggc 28860
gccacccgcc cgcagaccca accgtagatg ggacaccaca ggaaccgggg tcggtaagtc 28920
caagtgcccg ccgccgccac cgcagcagca gcagcagcag cgccagggct accgctcgtg 28980
gcgcgggcac aagaacgcca tagtcgcctg cttgcaagac tgcgggggca acatctcttt 29040
cgcccgccgc ttcctgctat tccaccacgg ggtcgccttt ccccgcaatg tcctgcatta 29100
ctaccgtcat ctctacagcc cctactgcag cggcgaccca gaggcggcag cggcagccac 29160
agcggcgacc accacctagg aagatatcct ccgcgggcaa gacagcggca gcagcggcca 29220
ggagacccgc ggcagcagcg gcgggagcgg tgggcgcact gcgcctctcg cccaacgaac 29280
ccctctcgac ccgggagctc agacacagga tcttccccac tttgtatgcc atcttccaac 29340
agagcagagg ccaggagcag gagctgaaaa taaaaaacag atctctgcgc tccctcaccc 29400
gcagctgtct gtatcacaaa agcgaagatc agcttcggcg cacgctggag gacgcggagg 29460
cactcttcag caaatactgc gcgctcactc ttaaagacta gctccgcgcc cttctcgaat 29520
ttaggcggga gaaaactacg tcatcgccgg ccgccgccca gcccgcccag ccgagatgag 29580
caaagagatt cccacgccat acatgtggag ctaccagccg cagatgggac tcgcggcggg 29640
agcggcccag gactactcca cccgcatgaa ctacatgagc gcgggacccc acatgatctc 29700
acaggtcaac gggatccgcg cccagcgaaa ccaaatactg ctggaacagg cggccatcac 29760
cgccacgccc cgccataatc tcaacccccg aaattggccc gccgccctcg tgtaccagga 29820
aaccccctcc gccaccaccg tactacttcc gcgtgacgcc caggccgaag tccagatgac 29880
taactcaggg gcgcagctcg cgggcggctt tcgtcacggg gcgcggccgc tccgaccagg 29940
tataagacac ctgatgatca gaggccgagg tatccagctc aacgacgagt cggtgagctc 30000
ttcgctcggt ctccgtccgg acggaacttt ccagctcgcc ggatccggcc gctcttcgtt 30060
cacgccccgc caggcgtacc tgactctgca gacctcgtcc tcggagcccc gctccggcgg 30120
catcggaacc ctccagttcg tggaggagtt cgtgccctcg gtctacttca accccttctc 30180
gggacctccc ggacgctacc ccgaccagtt cattccgaac tttgacgcgg tgaaggactc 30240
ggcggacggc tacgactgaa tgtcaggtgt cgaggcagag cagcttcgcc tgagacacct 30300
cgagcactgc cgccgccaca agtgcttcgc ccgcggttct ggtgagttct gctactttca 30360
gctacccgag gagcataccg aggggccggc gcacggcgtc cgcctgacca cccagggcga 30420
ggttacctgt tccctcatcc gggagtttac cctccgtccc ctgctagtgg agcgggagcg 30480
gggtccctgt gtcctaacta tcgcctgcaa ctgccctaac cctggattac atcaagatct 30540
ttgctgtcat ctctgtgctg agtttaataa acgctgagat cagaatctac tgggatttag 30600
tcccctttaa ctaatcaaac actggaatca ataaaaagaa tcacttactt aaaatcagac 30660
agcaggtctc tgtccagttt attcagcagc acctccttcc cctcctccca actctggtac 30720
tccaaacgcc ttctggcggc aaacttcctc cacaccctga agggaatgtc agattcttgc 30780
tcctgtccct ccgcacccac tatcttcatg ttgttgcaga tgaagcgcac caaaacgtct 30840
gacgagagct tcaaccccgt gtacccctat gacacggaaa gcggccctcc ctccgtccct 30900
ttcctcaccc ctcccttcgt gtctcccgat ggattccaag aaagtccccc cggggtcctg 30960
tctctgaacc tggccgagcc cctggtcact tcccacggca tgctcgccct gaaaatggga 31020
agtggcctct ccctggacga cgctggcaac ctcacctctc aagatatcac caccgctagc 31080
cctcccctca aaaaaaccaa gaccaacctc agcctagaaa cctcatcccc cctaactgtg 31140
agcacctcag gcgccctcac cgtagcagcc gccgctcccc tggcggtggc cggcacctcc 31200
ctcaccatgc aatcagaggc ccccctgaca gtacaggatg caaaactcac cctggccacc 31260
aaaggccccc tgaccgtgtc tgaaggcaaa ctggccttgc aaacatcggc cccgctgacg 31320
gccgctgaca gcagcaccct cacagtcagt gccacaccac cccttagcac aagcaatggc 31380
agcttgggta ttgacatgca agcccccatt tacaccacca atggaaaact aggacttaac 31440
tttggcgctc ccctgcatgt ggtagacagc ctaaatgcac tgactgtagt tactggccaa 31500
ggtcttacga taaacggaac agccctacaa actagagtct caggtgccct caactatgac 31560
acatcaggaa acctagaatt gagagctgca gggggtatgc gagttgatgc aaatggtcaa 31620
cttatccttg atgtagctta cccatttgat gcacaaaaca atctcagcct taggcttgga 31680
cagggacccc tgtttgttaa ctctgcccac aacttggatg ttaactacaa cagaggcctc 31740
tacctgttca catctggaaa taccaaaaag ctagaagtta atatcaaaac agccaagggt 31800
ctcatttatg atgacactgc tatagcaatc aatgcgggtg atgggctaca gtttgactca 31860
ggctcagata caaatccatt aaaaactaaa cttggattag gactggatta tgactccagc 31920
agagccataa ttgctaaact gggaactggc ctaagctttg acaacacagg tgccatcaca 31980
gtaggcaaca aaaatgatga caagcttacc ttgtggacca caccagaccc atcccctaac 32040
tgtagaatct attcagagaa agatgctaaa ttcacacttg ttttgactaa atgcggcagt 32100
caggtgttgg ccagcgtttc tgttttatct gtaaaaggta gccttgcgcc catcagtggc 32160
acagtaacta gtgctcagat tgtcctcaga tttgatgaaa atggagttct actaagcaat 32220
tcttcccttg accctcaata ctggaactac agaaaaggtg accttacaga gggcactgca 32280
tataccaacg cagtgggatt tatgcccaac ctcacagcat acccaaaaac acagagccaa 32340
actgctaaaa gcaacattgt aagtcaggtt tacttgaatg gggacaaatc caaacccatg 32400
accctcacca ttaccctcaa tggaactaat gaaacaggag atgccacagt aagcacttac 32460
tccatgtcat tctcatggaa ctggaatgga agtaattaca ttaatgaaac gttccaaacc 32520
aactccttca ccttctccta catcgcccaa gaataaaaag catgacgctg ttgatttgat 32580
tcaatgtgtt tctgttttat tttcaagcac aacaaaatca ttcaagtcat tcttccatct 32640
tagcttaata gacacagtag cttaatagac ccagtagtgc aaagccccat tctagcttat 32700
aactagtgga gaagtactcg cctacatggg ggtagagtca taatcgtgca tcaggatagg 32760
gcggtggtgc tgcagcagcg cgcgaataaa ctgctgccgc cgccgctccg tcctgcagga 32820
atacaacatg gcagtggtct cctcagcgat gattcgcacc gcccgcagca taaggcgcct 32880
tgtcctccgg gcacagcagc gcaccctgat ctcacttaaa tcagcacagt aactgcagca 32940
cagcaccaca atattgttca aaatcccaca gtgcaaggcg ctgtatccaa agctcatggc 33000
ggggaccaca gaacccacgt ggccatcata ccacaagcgc aggtagatta agtggcgacc 33060
cctcataaac acgctggaca taaacattac ctcttttggc atgttgtaat tcaccacctc 33120
ccggtaccat ataaacctct gattaaacat ggcgccatcc accaccatcc taaaccagct 33180
ggccaaaacc tgcccgccgg ctatacactg cagggaaccg ggactggaac aatgacagtg 33240
gagagcccag gactcgtaac catggatcat catgctcgtc atgatatcaa tgttggcaca 33300
acacaggcac acgtgcatac acttcctcag gattacaagc tcctcccgcg ttagaaccat 33360
atcccaggga acaacccatt cctgaatcag cgtaaatccc acactgcagg gaagacctcg 33420
cacgtaactc acgttgtgca ttgtcaaagt gttacattcg ggcagcagcg gatgatcctc 33480
cagtatggta gcgcgggttt ctgtctcaaa aggaggtaga cgatccctac tgtacggagt 33540
gcgccgagac aaccgagatc gtgttggtcg tagtgtcatg ccaaatggaa cgccggacgt 33600
agtcatattt cctgaagtct tagatctctc aacgcagcac cagcaccaac acttcgcagt 33660
gtaaaaggcc aagtgccgag agagtatata taggaataaa aagtgacgta aacgggcaaa 33720
gtccaaaaaa cgcccagaaa aaccgcacgc gaacctacgc cccgaaacga aagccaaaaa 33780
acactagaca ctcccttccg gcgtcaactt ccgctttccc acgctacgtc acttgcccca 33840
gtcaaacaaa ctacatatcc cgaacttcca agtcgccacg cccaaaacac cgcctacacc 33900
tccccgcccg ccggcccgcc cccaaacccg cctcccgccc cgcgccccgc cccgcgccgc 33960
ccatctcatt atcatattgg cttcaatcca aaataaggta tattattgat gatggtttaa 34020
acggatcctc tagagtcgac ctgcaggcat gcaagcttga gtattctata gtgtcaccta 34080
aatagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 34140
attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 34200
agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 34260
tgccagctgc attaatgaat cggccaacgc gaaccccttg cggccgcccg ggccgtcgac 34320
caattctcat gtttgacagc ttatcatcga atttctgcca ttcatccgct tattatcact 34380
tattcaggcg tagcaaccag gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc 34440
cccgccctgc cactcatcgc agtactgttg taattcatta agcattctgc cgacatggaa 34500
gccatcacaa acggcatgat gaacctgaat cgccagcggc atcagcacct tgtcgccttg 34560
cgtataatat ttgcccatgg tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt 34620
taaatcaaaa ctggtgaaac tcacccaggg attggctgag acgaaaaaca tattctcaat 34680
aaacccttta gggaaatagg ccaggttttc accgtaacac gccacatctt gcgaatatat 34740
gtgtagaaac tgccggaaat cgtcgtggta ttcactccag agcgatgaaa acgtttcagt 34800
ttgctcatgg aaaacggtgt aacaagggtg aacactatcc catatcacca gctcaccgtc 34860
tttcattgcc atacggaatt ccggatgagc attcatcagg cgggcaagaa tgtgaataaa 34920
ggccggataa aacttgtgct tatttttctt tacggtcttt aaaaaggccg taatatccag 34980
ctgaacggtc tggttatagg tacattgagc aactgactga aatgcctcaa aatgttcttt 35040
acgatgccat tgggatatat caacggtggt atatccagtg atttttttct ccattttagc 35100
ttccttagct cctgaaaatc tcgataactc aaaaaatacg cccggtagtg atcttatttc 35160
attatggtga aagttggaac ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt 35220
ggcccagggc ttcccggtat caacagggac accaggattt atttattctg cgaagtgatc 35280
ttccgtcaca ggtatttatt cgcgataagc tcatggagcg gcgtaaccgt cgcacaggaa 35340
ggacagagaa agcgcggatc tgggaagtga cggacagaac ggtcaggacc tggattgggg 35400
aggcggttgc cgccgctgct gctgacggtg tgacgttctc tgttccggtc acaccacata 35460
cgttccgcca ttcctatgcg atgcacatgc tgtatgccgg tataccgctg aaagttctgc 35520
aaagcctgat gggacataag tccatcagtt caacggaagt ctacacgaag gtttttgcgc 35580
tggatgtggc tgcccggcac cgggtgcagt ttgcgatgcc ggagtctgat gcggttgcga 35640
tgctgaaaca attatcctga gaataaatgc cttggccttt atatggaaat gtggaactga 35700
gtggatatgc tgtttttgtc tgttaaacag agaagctggc tgttatccac tgagaagcga 35760
acgaaacagt cgggaaaatc tcccattatc gtagagatcc gcattattaa tctcaggagc 35820
ctgtgtagcg tttataggaa gtagtgttct gtcatgatgc ctgcaagcgg taacgaaaac 35880
gatttgaata tgccttcagg aacaatagaa atcttcgtgc ggtgttacgt tgaagtggag 35940
cggattatgt cagcaatgga cagaacaacc taatgaacac agaaccatga tgtggtctgt 36000
ccttttacag ccagtagtgc tcgccgcagt cgagcgacag ggcgaagccc tcgagtgagc 36060
gaggaagcac cagggaacag cacttatata ttctgcttac acacgatgcc tgaaaaaact 36120
tcccttgggg ttatccactt atccacgggg atatttttat aattattttt tttatagttt 36180
ttagatcttc ttttttagag cgccttgtag gcctttatcc atgctggttc tagagaaggt 36240
gttgtgacaa attgcccttt cagtgtgaca aatcaccctc aaatgacagt cctgtctgtg 36300
acaaattgcc cttaaccctg tgacaaattg ccctcagaag aagctgtttt ttcacaaagt 36360
tatccctgct tattgactct tttttattta gtgtgacaat ctaaaaactt gtcacacttc 36420
acatggatct gtcatggcgg aaacagcggt tatcaatcac aagaaacgta aaaatagccc 36480
gcgaatcgtc cagtcaaacg acctcactga ggcggcatat agtctctccc gggatcaaaa 36540
acgtatgctg tatctgttcg ttgaccagat cagaaaatct gatggcaccc tacaggaaca 36600
tgacggtatc tgcgagatcc atgttgctaa atatgctgaa atattcggat tgacctctgc 36660
ggaagccagt aaggatatac ggcaggcatt gaagagtttc gcggggaagg aagtggtttt 36720
ttatcgccct gaagaggatg ccggcgatga aaaaggctat gaatcttttc cttggtttat 36780
caaacgtgcg cacagtccat ccagagggct ttacagtgta catatcaacc catatctcat 36840
tcccttcttt atcgggttac agaaccggtt tacgcagttt cggcttagtg aaacaaaaga 36900
aatcaccaat ccgtatgcca tgcgtttata cgaatccctg tgtcagtatc gtaagccgga 36960
tggctcaggc atcgtctctc tgaaaatcga ctggatcata gagcgttacc agctgcctca 37020
aagttaccag cgtatgcctg acttccgccg ccgcttcctg caggtctgtg ttaatgagat 37080
caacagcaga actccaatgc gcctctcata cattgagaaa aagaaaggcc gccagacgac 37140
tcatatcgta ttttccttcc gcgatatcac ttccatgacg acaggatagt ctgagggtta 37200
tctgtcacag atttgagggt ggttcgtcac atttgttctg acctactgag ggtaatttgt 37260
cacagttttg ctgtttcctt cagcctgcat ggattttctc atactttttg aactgtaatt 37320
tttaaggaag ccaaatttga gggcagtttg tcacagttga tttccttctc tttcccttcg 37380
tcatgtgacc tgatatcggg ggttagttcg tcatcattga tgagggttga ttatcacagt 37440
ttattactct gaattggcta tccgcgtgtg tacctctacc tggagttttt cccacggtgg 37500
atatttcttc ttgcgctgag cgtaagagct atctgacaga acagttcttc tttgcttcct 37560
cgccagttcg ctcgctatgc tcggttacac ggctgcggcg agcgctagtg ataataagtg 37620
actgaggtat gtgctcttct tatctccttt tgtagtgttg ctcttatttt aaacaacttt 37680
gcggtttttt gatgactttg cgattttgtt gttgctttgc agtaaattgc aagatttaat 37740
aaaaaaacgc aaagcaatga ttaaaggatg ttcagaatga aactcatgga aacacttaac 37800
cagtgcataa acgctggtca tgaaatgacg aaggctatcg ccattgcaca gtttaatgat 37860
gacagcccgg aagcgaggaa aataacccgg cgctggagaa taggtgaagc agcggattta 37920
gttggggttt cttctcaggc tatcagagat gccgagaaag cagggcgact accgcacccg 37980
gatatggaaa ttcgaggacg ggttgagcaa cgtgttggtt atacaattga acaaattaat 38040
catatgcgtg atgtgtttgg tacgcgattg cgacgtgctg aagacgtatt tccaccggtg 38100
atcggggttg ctgcccataa aggtggcgtt tacaaaacct cagtttctgt tcatcttgct 38160
caggatctgg ctctgaaggg gctacgtgtt ttgctcgtgg aaggtaacga cccccaggga 38220
acagcctcaa tgtatcacgg atgggtacca gatcttcata ttcatgcaga agacactctc 38280
ctgcctttct atcttgggga aaaggacgat gtcacttatg caataaagcc cacttgctgg 38340
ccggggcttg acattattcc ttcctgtctg gctctgcacc gtattgaaac tgagttaatg 38400
ggcaaatttg atgaaggtaa actgcccacc gatccacacc tgatgctccg actggccatt 38460
gaaactgttg ctcatgacta tgatgtcata gttattgaca gcgcgcctaa cctgggtatc 38520
ggcacgatta atgtcgtatg tgctgctgat gtgctgattg ttcccacgcc tgctgagttg 38580
tttgactaca cctccgcact gcagtttttc gatatgcttc gtgatctgct caagaacgtt 38640
gatcttaaag ggttcgagcc tgatgtacgt attttgctta ccaaatacag caatagtaat 38700
ggctctcagt ccccgtggat ggaggagcaa attcgggatg cctggggaag catggttcta 38760
aaaaatgttg tacgtgaaac ggatgaagtt ggtaaaggtc agatccggat gagaactgtt 38820
tttgaacagg ccattgatca acgctcttca actggtgcct ggagaaatgc tctttctatt 38880
tgggaacctg tctgcaatga aattttcgat cgtctgatta aaccacgctg ggagattaga 38940
taatgaagcg tgcgcctgtt attccaaaac atacgctcaa tactcaaccg gttgaagata 39000
cttcgttatc gacaccagct gccccgatgg tggattcgtt aattgcgcgc gtaggagtaa 39060
tggctcgcgg taatgccatt actttgcctg tatgtggtcg ggatgtgaag tttactcttg 39120
aagtgctccg gggtgatagt gttgagaaga cctctcgggt atggtcaggt aatgaacgtg 39180
accaggagct gcttactgag gacgcactgg atgatctcat cccttctttt ctactgactg 39240
gtcaacagac accggcgttc ggtcgaagag tatctggtgt catagaaatt gccgatggga 39300
gtcgccgtcg taaagctgct gcacttaccg aaagtgatta tcgtgttctg gttggcgagc 39360
tggatgatga gcagatggct gcattatcca gattgggtaa cgattatcgc ccaacaagtg 39420
cttatgaacg tggtcagcgt tatgcaagcc gattgcagaa tgaatttgct ggaaatattt 39480
ctgcgctggc tgatgcggaa aatatttcac gtaagattat tacccgctgt atcaacaccg 39540
ccaaattgcc taaatcagtt gttgctcttt tttctcaccc cggtgaacta tctgcccggt 39600
caggtgatgc acttcaaaaa gcctttacag ataaagagga attacttaag cagcaggcat 39660
ctaaccttca tgagcagaaa aaagctgggg tgatatttga agctgaagaa gttatcactc 39720
ttttaacttc tgtgcttaaa acgtcatctg catcaagaac tagtttaagc tcacgacatc 39780
agtttgctcc tggagcgaca gtattgtata agggcgataa aatggtgctt aacctggaca 39840
ggtctcgtgt tccaactgag tgtatagaga aaattgaggc cattcttaag gaacttgaaa 39900
agccagcacc ctgatgcgac cacgttttag tctacgttta tctgtcttta cttaatgtcc 39960
tttgttacag gccagaaagc ataactggcc tgaatattct ctctgggccc actgttccac 40020
ttgtatcgtc ggtctgataa tcagactggg accacggtcc cactcgtatc gtcggtctga 40080
ttattagtct gggaccacgg tcccactcgt atcgtcggtc tgattattag tctgggacca 40140
cggtcccact cgtatcgtcg gtctgataat cagactggga ccacggtccc actcgtatcg 40200
tcggtctgat tattagtctg ggaccatggt cccactcgta tcgtcggtct gattattagt 40260
ctgggaccac ggtcccactc gtatcgtcgg tctgattatt agtctggaac cacggtccca 40320
ctcgtatcgt cggtctgatt attagtctgg gaccacggtc ccactcgtat cgtcggtctg 40380
attattagtc tgggaccacg atcccactcg tgttgtcggt ctgattatcg gtctgggacc 40440
acggtcccac ttgtattgtc gatcagacta tcagcgtgag actacgattc catcaatgcc 40500
tgtcaagggc aagtattgac atgtcgtcgt aacctgtaga acggagtaac ctcggtgtgc 40560
ggttgtatgc ctgctgtgga ttgctgctgt gtcctgctta tccacaacat tttgcgcacg 40620
gttatgtgga caaaatacct ggttacccag gccgtgccgg cacgttaacc gggctgcatc 40680
cgatgcaagt gtgtcgctgt cgacgagctc gcgagctcgg acatgaggtt gccccgtatt 40740
cagtgtcgct gatttgtatt gtctgaagtt gtttttacgt taagttgatg cagatcaatt 40800
aatacgatac ctgcgtcata attgattatt tgacgtggtt tgatggcctc cacgcacgtt 40860
gtgatatgta gatgataatc attatcactt tacgggtcct ttccggtgat ccgacaggtt 40920
acggggcggc gacctcgcgg gttttcgcta tttatgaaaa ttttccggtt taaggcgttt 40980
ccgttcttct tcgtcataac ttaatgtttt tatttaaaat accctctgaa aagaaaggaa 41040
acgacaggtg ctgaaagcga gctttttggc ctctgtcgtt tcctttctct gtttttgtcc 41100
gtggaatgaa caatggaagt ccgagctcat cgctaataac ttcgtatagc atacattata 41160
cgaagttata ttcgatgcgg ccgcaagggg ttcgcgtcag cgggtgttgg cgggtgtcgg 41220
ggctggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt 41280
gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc gccattcagg 41340
ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg 41400
aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga 41460
cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga attcgagctc 41520
ggtacccggg gatcctcgtt taaac 41545
<210> 54
<211> 42220
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"
<220>
<221> modified_base
<222> (16789)..(16789)
<223> a, c, t, g, unknown or other
<400> 54
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag atgggcggcg 60
cggggcgggg cgcggggcgg gaggcgggtt tgggggcggg ccggcgggcg gggcggtgtg 120
gcggaagtgg actttgtaag tgtggcggat gtgacttgct agtgccgggc gcggtaaaag 180
tgacgttttc cgtgcgcgac aacgcccccg ggaagtgaca tttttcccgc ggtttttacc 240
ggatgttgta gtgaatttgg gcgtaaccaa gtaagatttg gccattttcg cgggaaaact 300
gaaacgggga agtgaaatct gattaatttt gcgttagtca taccgcgtaa tatttgtcta 360
gggccgaggg actttggccg attacgtgga ggactcgccc aggtgttttt tgaggtgaat 420
ttccgcgttc cgggtcaaag tctgcgtttt attattatag gatatcccat tgcatacgtt 480
gtatccatat cataatatgt acatttatat tggctcatgt ccaacattac cgccatgttg 540
acattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc 600
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa 660
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac 720
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca 780
agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat ggcccgcctg 840
gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca tctacgtatt 900
agtcatcgct attaccatgg tgatgcggtt ttggcagtac atcaatgggc gtggatagcg 960
gtttgactca cggggatttc caagtctcca ccccattgac gtcaatggga gtttgttttg 1020
gcaccaaaat caacgggact ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat 1080
gggcggtagg cgtgtacggt gggaggtcta tataagcaga gctctcccta tcagtgatag 1140
agatctccct atcagtgata gagatcgtcg acgagctcgt ttagtgaacc gtcagatcgc 1200
ctggagacgc catccacgct gttttgacct ccatagaaga caccgggacc gatccagcct 1260
ccgcggccgg gaacggtgca ttggaacgcg gattccccgt gccaagagtg agatcttccg 1320
tttatctagg taccagatat cgccaccatg gacgaccagc gggacctgat cagcaacaac 1380
gagcagctgc ccatgctggg ccagaggcct ggcgcccctg agagcaagtg tagcagaggc 1440
gccgtgtaca ccgtgttcag catcctggtg gccctgctgc tggccggaca ggccaccacc 1500
gcctactttc tgtatcagca gcagggacgg ctggacaagc tgaccgtgac cagccagaac 1560
ctgcagctgg aaaacctgcg gatgaagctg cccaagcccg ccaagcccct gagccagatg 1620
agaatggcca cccccctgct gatgcaggcc ctgcctatgg ccggcctgcc ccagaaaccc 1680
atgcagaacg ccaccaagca cggcaacatg accgaggacc acgtgatgca tctgctgctg 1740
aacgccgacc ccctgaaggt gtacccccca ctgaagggca gcctgagcga gaacctgaag 1800
cacctgaaga acaccatgga aaccatggac tggaaggtgt tcgagagctg gctgcaccac 1860
tggctgctgt tcgagatgag caagcacagc ctggaacaga agcccaccga ggcccctccc 1920
aaagagagcc tggaactgga agatcccagc agcggcctgg gcgtgaccaa gcaggatctg 1980
ggccccgtgg ctatgtccga ggactttctg attctgatcg ccatcctggt gatcgtgatt 2040
ctcgtgggca caatcacaac cctggtgggc gccatcggcg gcattagggc caggaggagc 2100
ttcctcttca tttgcatctt cttcctgttc ctctccctct tcctgacaat cctcgccctg 2160
ctgctgggct tcagctggct cctgctggtg gccatcctgt tctgggtgct ctggctggtc 2220
atcctcattc tgctgctgct ggtgtaccct attcctcacc accccctgcc cacctccctc 2280
aggtttagaa tgaagcagag ggtgagcagc gaccccacag gttctgacag aagccctcag 2340
ggcagccata atagcctgaa ctcccccgat gaggaggacc ccaaggatga caccaagcaa 2400
cctctgtgca acatgaccca gggcggacct cccgtcaatg gacagctcct cggacaacat 2460
gctcaatgcc cccctcacta tccctgctgc catattcagc atcccgacgg agaggattcc 2520
gatggagacg atggcaagtc ctggggcgat gccggagagg aagacaatgg ccctaacgac 2580
cctaacaccg ccagcaccag agagtccatt tacgaggacc tcagataccc cacaagggac 2640
gccaatggcg agtatgagaa cgtgggatac ccccctaggg acggagatgc ccctcatagg 2700
ctcggagagc ctgtgtatga cgatgtggag caagccaccg ctaacgaggt gagaatctcc 2760
cctctgttca gactgcccta cggaagcgct ttcggacctg gcccccagcc tggacccatt 2820
ctggagagct ccacatgggg ctttctggtc ttcacacaga cctccctgtt cgccgacgac 2880
attgccgacg ctattaggga ctactgcaca acccaccctg gccccacaag gaacacccag 2940
gtggtcctca tgaacttcga gggcagcgga gtgcccctgc ctatgttttt tccccctgga 3000
gaggagacag aagagcagag agagggcgat agagctagcg actccgacga gtccgaagac 3060
gctcagatcc tgaccgtgtt ctgcctgttt tgccagtgga cactctttat ctgcctggga 3120
atcaggatga tctgtaactg gaggggcaaa ctcaccagga tcatctgcct gaagttctgc 3180
ctctacggac tgatttccgc ctccctgtcc ttcggctggt acgcttttct gaaggaagtg 3240
accctcccca ccacagccac cgttgatcct aggcaactcc ccctgttcct cttcatcctg 3300
agctccgtgc tggtgattct cgccatcatg atggagtttc aaacatcctc cagcctcttc 3360
gctgctctgt tcgtgattat cgccggaatg ctgtgcgtca cagtgggcgt gatttttctg 3420
ctggctggcg tcaagcctct cctgagcggc atgatctgcg cctccggcat cacaatgctc 3480
gtgctcggcg tcgtgctgct ggtggtgtgc accagagatg agcacgctat ttccgccagc 3540
caccatgcta gcgatggctc cgtgaatcag cagaaggaaa atcagcccca gaccctggag 3600
gaatgcaaga cagatcagga gaggaagagg tacaggaaca ggctggcctc caggaggtgt 3660
agagctaagt tcaggaacca gctggaacat tttaggacag tcgccgctgc taagacagag 3720
gagaacaaca ggctcagggt gctcatcagg cagatgtgtc ctacactgga cgtggaatcc 3780
atcgtcccct ccacctccgc cggctaccac gagcctctga atcacctgac ccacagcccc 3840
agcccttgtc atcacaggga tgaacccccc tccagaagcc ccagccctca acccaccgtc 3900
tccgagcagt cccagcagtc ccccaggcag cagagccctc aaggcacatc ccagggttct 3960
acaagacctc aggtgcctgg aggcgccacc accagaaaaa gaggcggcgt gagaggccaa 4020
cctgccaagt gtcacggcaa gtacaccaca accgccgagg gactgaccgc tctcctgaat 4080
aggaggcaca gccccaggac atccaacgag ggcaggtgga tgaatggagt catggctgtg 4140
aacctctcca aatggcccct gtacagcctg aggagagccc tggccctcgc catggctcct 4200
agaaggaggc tctccggccc tccctggctg acagtgctgc tgctgctgtc cacactgagc 4260
gtggccgccc tgctgattct cttcctgatt ttcagcgccg gcgccaccat tagcacagaa 4320
gccagcctgc tggtcctgct cctgctgttt gtgaccctgc tgctgcctct cctgtcctcc 4380
aacggactcc agctccctgc cgccctgatt ctgatccagt gtttcctcct ggccgctgat 4440
tatctcgcct acctgattct gcctaccatt atgcccaggg gcagaagcac aggaaggaag 4500
ggcagggaca cagagaaaga gaggagcaga tcccctctca gagctcctgg cggttctgat 4560
ggacccagca caagggctgg ctgtggagcc ggaccctgtc agctgagcag ccccatcgcc 4620
ggaaacaacg gcaatgaagg cggcgagggc gacgactaca agagctggag gaagcccgag 4680
gaagaggaca acggccccaa tgaccccaat accaacaaca ggattgagga tggagacggc 4740
gacgacggaa aatcctggag gaatcctgag gaggaggata acagaaagca ggacaggctg 4800
ggcaccaagc ctttcatgga cctcgacgga accggcggag gcgagggcta cagccagatg 4860
gtccctatcg ccaccgcccc cggaagcggc cacgccgcta cctatcagga tctccaggcc 4920
gccccttaca tcatctggcc tctccagacc gattgccagc ctgtggctac caccttcgcc 4980
tcccccggac agatccagtg gtatacaagc gccgtccccc agcccacaga gcattgctcc 5040
cagtttacaa acgctcccac cgtcaaccag cagcagccta ttagccaacc ccagcccgaa 5100
aatccccctg ctttcacctt tacccagccc gcttccatca ttcccggcgt cattagcgcc 5160
tccaacctga acgtgagcgc ttcccctatc atccctagcg accatgtcct ccccatcatt 5220
acctccgtga ccagcctcgc ccaacctaat aacatggccg gccactggta tgagagcgtg 5280
attcccggcc tgttcctctg ccccctgatc ctcccttccc tgttctggat ttgctccctg 5340
ctgaccttcc tggtgggcca cggagccaat attgtgagcg ccgtcctgtt cctcgtgctg 5400
gcttggtgtc tcctcattgc caactggaac gtgacaagag aggacttcgt gtccggcagg 5460
agaagctcca tgagcagcct gtccgtggcc gcttccaccg ccacagccat gttcgccagc 5520
ttcctcaccc tgagctttga tggcctgggc ctgctgctgt ttggcaccgc cctggtgatc 5580
cagacaattt acgtgctgta tctggtggtc atggagatca ccgtgtggat catgatgttt 5640
aggtatctcc acttttggat caccctgctg ttcctgctga gccccattat tctctccgtc 5700
gcctgtctca tcatccaatc ctccgccctg ctgatcgagg ctgtggtcgt caccaccatc 5760
acagtcctgg ccatttttct gtggctccct cctcaaggcg ctgaggccga tctcggcacc 5820
gccctgctga ttctgaatac cgccctgtgc ctggtcgtgc tgatcctgac cgctatccct 5880
acatgatgat gagcggccgc gatctgctgt gccttctagt tgccagccat ctgttgtttg 5940
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 6000
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 6060
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 6120
gggctctatg gccgatcagc gatcgctgag gtgggtgagt gggcgtggcc tggggtggtc 6180
atgaaaatat ataagttggg ggtcttaggg tctctttatt tgtgttgcag agaccgccgg 6240
agccatgagc gggagcagca gcagcagcag tagcagcagc gccttggatg gcagcatcgt 6300
gagcccttat ttgacgacgc ggatgcccca ctgggccggg gtgcgtcaga atgtgatggg 6360
ctccagcatc gacggccgac ccgtcctgcc cgcaaattcc gccacgctga cctatgcgac 6420
cgtcgcgggg acgccgttgg acgccaccgc cgccgccgcc gccaccgcag ccgcctcggc 6480
cgtgcgcagc ctggccacgg actttgcatt cctgggacca ctggcgacag gggctacttc 6540
tcgggccgct gctgccgccg ttcgcgatga caagctgacc gccctgctgg cgcagttgga 6600
tgcgcttact cgggaactgg gtgacctttc tcagcaggtc atggccctgc gccagcaggt 6660
ctcctccctg caagctggcg ggaatgcttc tcccacaaat gccgtttaag ataaataaaa 6720
ccagactctg tttggattaa agaaaagtag caagtgcatt gctctcttta tttcataatt 6780
ttccgcgcgc gataggccct agaccagcgt tctcggtcgt tgagggtgcg gtgtatcttc 6840
tccaggacgt ggtagaggtg gctctggacg ttgagataca tgggcatgag cccgtcccgg 6900
gggtggaggt agcaccactg cagagcttca tgctccgggg tggtgttgta gatgatccag 6960
tcgtagcagg agcgctgggc atggtgccta aaaatgtcct tcagcagcag gccgatggcc 7020
agggggaggc ccttggtgta agtgtttaca aaacggttaa gttgggaagg gtgcattcgg 7080
ggagagatga tgtgcatctt ggactgtatt tttagattgg cgatgtttcc gcccagatcc 7140
cttctgggat tcatgttgtg caggaccacc agtacagtgt atccggtgca cttggggaat 7200
ttgtcatgca gcttagaggg aaaagcgtgg aagaacttgg agacgccttt gtggcctccc 7260
agattttcca tgcattcgtc catgatgatg gcaatgggcc cgcgggaggc agcttgggca 7320
aagatatttc tggggtcgct gacgtcgtag ttgtgttcca gggtgaggtc gtcataggcc 7380
atttttacaa agcgcgggcg gagggtgccc gactggggga tgatggtccc ctctggccct 7440
ggggcgtagt tgccctcgca gatctgcatt tcccaggcct taatctcgga ggggggaatc 7500
atatccacct gcggggcgat gaagaaaacg gtttccggag ccggggagat taactgggat 7560
gagagcaggt ttctaagcag ctgtgatttt ccacaaccgg tgggcccata aataacacct 7620
ataaccggtt gcagctggta gtttagagag ctgcagctgc cgtcgtcccg gaggaggggg 7680
gccacctcgt tgagcatgtc cctgacgcgc atgttctccc cgaccagatc cgccagaagg 7740
cgctcgccgc ccagggacag cagctcttgc aaggaagcaa agtttttcag cggcttgagg 7800
ccgtccgccg tgggcatgtt tttcagggtc tggctcagca gctccaggcg gtcccagagc 7860
tcggtgacgt gctctacggc atctctatcc agcatatctc ctcgtttcgc gggttggggc 7920
gactttcgct gtagggcacc aagcggtggt cgtccagcgg ggccagagtc atgtccttcc 7980
atgggcgcag ggtcctcgtc agggtggtct gggtcacggt gaaggggtgc gctccgggct 8040
gagcgcttgc caaggtgcgc ttgaggctgg ttctgctggt gctgaagcgc tgccggtctt 8100
cgccctgcgc gtcggccagg tagcatttga ccatggtgtc atagtccagc ccctccgcgg 8160
cgtgtccctt ggcgcgcagc ttgcccttgg aggtggcgcc gcacgagggg cagagcaggc 8220
tcttgagcgc gtagagcttg ggggcgagga agaccgattc gggggagtag gcgtccgcgc 8280
cgcagacccc gcacacggtc tcgcactcca ccagccaggt gagctcgggg cgcgccgggt 8340
caaaaaccag gtttccccca tgctttttga tgcgtttctt acctcgggtc tccatgaggt 8400
ggtgtccccg ctcggtgacg aagaggctgt ccgtgtctcc gtagaccgac ttgaggggtc 8460
ttttctccag gggggtccct cggtcttcct cgtagaggaa ctcggaccac tctgagacga 8520
aggcccgcgt ccaggccagg acgaaggagg ctatgtggga ggggtagcgg tcgttgtcca 8580
ctagggggtc caccttctcc aaggtgtgaa gacacatgtc gccttcctcg gcgtccagga 8640
aggtgattgg cttgtaggtg taggccacgt gaccgggggt tcctgacggg ggggtataaa 8700
agggggtggg ggcgcgctcg tcgtcactct cttccgcatc gctgtctgcg agggccagct 8760
gctggggtga gtattccctc tcgaaggcgg gcatgacctc cgcgctgagg ttgtcagttt 8820
ccaaaaacga ggaggatttg atgttcacct gtcccgaggt gatacctttg agggtacccg 8880
cgtccatctg gtcagaaaac acgatctttt tattgtccag cttggtggcg aacgacccgt 8940
agagggcgtt ggagagcagc ttggcgatgg agcgcagggt ctggttcttg tccctgtcgg 9000
cgcgctcctt ggccgcgatg ttgagctgca cgtactcgcg cgcgacgcag cgccactcgg 9060
ggaagacggt ggtgcgctcg tcgggcacca ggcgcacgcg ccagccgcgg ttgtgcaggg 9120
tgaccaggtc cacgctggtg gcgacctcgc cgcgcaggcg ctcgttggtc cagcagagac 9180
ggccgccctt gcgcgagcag aaggggggca gggggtcgag ctgggtctcg tccggggggt 9240
ccgcgtccac ggtgaaaacc ccggggcgca ggcgcgcgtc gaagtagtct atcttgcaac 9300
cttgcatgtc cagcgcctgc tgccagtcgc gggcggcgag cgcgcgctcg taggggttga 9360
gcggcgggcc ccagggcatg gggtgggtga gtgcggaggc gtacatgccg cagatgtcat 9420
agacgtagag gggctcccgc aggaccccga tgtaggtggg gtagcagcgg ccgccgcgga 9480
tgctggcgcg cacgtagtca tacagctcgt gcgagggggc gaggaggtcg gggcccaggt 9540
tggtgcgggc ggggcgctcc gcgcggaaga cgatctgcct gaagatggca tgcgagttgg 9600
aagagatggt ggggcgctgg aagacgttga agctggcgtc ctgcaggccg acggcgtcgc 9660
gcacgaagga ggcgtaggag tcgcgcagct tgtgtaccag ctcggcggtg acctgcacgt 9720
cgagcgcgca gtagtcgagg gtctcgcgga tgatgtcata tttagcctgc cccttctttt 9780
tccacagctc gcggttgagg acaaactctt cgcggtcttt ccagtactct tggatcggga 9840
aaccgtccgg ttccgaacgg taagagccta gcatgtagaa ctggttgacg gcctggtagg 9900
cgcagcagcc cttctccacg gggagggcgt aggcctgcgc ggccttgcgg agcgaggtgt 9960
gggtcagggc gaaggtgtcc ctgaccatga ctttgaggta ctggtgcttg aagtcggagt 10020
cgtcgcagcc gccccgctcc cagagcgaga agtcggtgcg cttcttggag cgggggttgg 10080
gcagagcgaa ggtgacatcg ttgaagagga ttttgcccgc gcggggcatg aagttgcggg 10140
tgatgcggaa gggccccggc acttcagagc ggttgttgat gacctgggcg gcgagcacga 10200
tctcgtcgaa gccgttgatg ttgtggccca cgatgtagag ttccaggaag cggggccggc 10260
cctttacggt gggcagcttc tttagctctt cgtaggtgag ctcctcgggc gaggcgaggc 10320
cgtgctcggc cagggcccag tccgcgaggt gcgggttgtc tctgaggaag gacttccaga 10380
ggtcgcgggc caggagggtc tgcaggcggt ctctgaaggt cctgaactgg cggcccacgg 10440
ccattttttc gggggtgatg cagtagaagg tgagggggtc ttgctgccag cggtcccagt 10500
cgagctgcag ggcgaggtcg cgcgcggcgg tgaccaggcg ctcgtcgccc ccgaatttca 10560
tgaccagcat gaagggcacg agctgctttc cgaaggcccc catccaagtg taggtctcta 10620
catcgtaggt gacaaagagg cgctccgtgc gaggatgcga gccgatcggg aagaactgga 10680
tctcccgcca ccagttggag gagtggctgt tgatgtggtg gaagtagaag tcccgtcgcc 10740
gggccgaaca ctcgtgctgg cttttgtaaa agcgagcgca gtactggcag cgctgcacgg 10800
gctgtacctc atgcacgaga tgcacctttc gcccgcgcac gaggaagccg aggggaaatc 10860
tgagcccccc gcctggctcg cggcatggct ggttctcttc tactttggat gcgtgtccgt 10920
ctccgtctgg ctcctcgagg ggtgttacgg tggagcggac caccacgccg cgcgagccgc 10980
aggtccagat atcggcgcgc ggcggtcgga gtttgatgac gacatcgcgc agctgggagc 11040
tgtccatggt ctggagctcc cgcggcggcg gcaggtcagc cgggagttct tgcaggttca 11100
cctcgcagag tcgggccagg gcgcggggca ggtctaggtg gtacctgatc tctaggggcg 11160
tgttggtggc ggcgtcgatg gcttgcagga gcccgcagcc ccggggggcg acgacggtgc 11220
cccgcggggt ggtggtggtg gtggcggtgc agctcagaag cggtgccgcg ggcgggcccc 11280
cggaggtagg gggggctccg gtcccgcggg caggggcggc agcggcacgt cggcgtggag 11340
cgcgggcagg agttggtgct gtgcccggag gttgctggcg aaggcgacga cgcggcggtt 11400
gatctcctgg atctggcgcc tctgcgtgaa gacgacgggc ccggtgagct tgaacctgaa 11460
agagagttcg acagaatcaa tctcggtgtc attgaccgcg gcctggcgca ggatctcctg 11520
cacgtctccc gagttgtctt ggtaggcgat ctcggccatg aactgctcga tctcttcctc 11580
ctggaggtct ccgcgtccgg cgcgttccac ggtggccgcc aggtcgttgg agatgcgccc 11640
catgagctgc gagaaggcgt tgagtccgcc ctcgttccag actcggctgt agaccacgcc 11700
cccctggtca tcgcgggcgc gcatgaccac ctgcgcgagg ttgagctcca cgtgccgcgc 11760
gaagacggcg tagttgcgca gacgctggaa gaggtagttg agggtggtgg cggtgtgctc 11820
ggccacgaag aagttcatga cccagcggcg caacgtggat tcgttgatgt cccccaaggc 11880
ctccagccgt tccatggcct cgtagaagtc cacggcgaag ttgaaaaact gggagttgcg 11940
cgccgacacg gtcaactcct cctccagaag acggatgagc tcggcgacgg tgtcgcgcac 12000
ctcgcgctcg aaggctatgg ggatctcttc ctccgctagc atcaccacct cctcctcttc 12060
ctcctcttct ggcacttcca tgatggcttc ctcctcttcg gggggtggcg gcggcggcgg 12120
tgggggaggg ggcgctctgc gccggcggcg gcgcaccggg aggcggtcca cgaagcgcgc 12180
gatcatctcc ccgcggcggc ggcgcatggt ctcggtgacg gcgcggccgt tctcccgggg 12240
gcgcagttgg aagacgccgc cggacatctg gtgctggggc gggtggccgt gaggcagcga 12300
gacggcgctg acgatgcatc tcaacaattg ctgcgtaggt acgccgccga gggacctgag 12360
ggagtccata tccaccggat ccgaaaacct ttcgaggaag gcgtctaacc agtcgcagtc 12420
gcaaggtagg ctgagcaccg tggcgggcgg cggggggtgg ggggagtgtc tggcggaggt 12480
gctgctgatg atgtaattga agtaggcgga cttgacacgg cggatggtcg acaggagcac 12540
catgtccttg ggtccggcct gctggatgcg gaggcggtcg gctatgcccc aggcttcgtt 12600
ctggcatcgg cgcaggtcct tgtagtagtc ttgcatgagc ctttccaccg gcacctcttc 12660
tccttcctct tctgcttctt ccatgtctgc ttcggccctg gggcggcgcc gcgcccccct 12720
gccccccatg cgcgtgaccc cgaaccccct gagcggttgg agcagggcca ggtcggcgac 12780
gacgcgctcg gccaggatgg cctgctgcac ctgcgtgagg gtggtttgga agtcatccaa 12840
gtccacgaag cggtggtagg cgcccgtgtt gatggtgtag gtgcagttgg ccatgacgga 12900
ccagttgacg gtctggtggc ccggttgcga catctcggtg tacctgagtc gcgagtaggc 12960
gcgggagtcg aagacgtagt cgttgcaagt ccgcaccagg tactggtagc ccaccaggaa 13020
gtgcggcggc ggctggcggt agaggggcca gcgcagggtg gcgggggctc cgggggccag 13080
gtcttccagc atgaggcggt ggtaggcgta gatgtacctg gacatccagg tgatacccgc 13140
ggcggtggtg gaggcgcgcg ggaagtcgcg cacccggttc cagatgttgc gcaggggcag 13200
aaagtgctcc atggtaggcg tgctctgtcc agtcagacgc gcgcagtcgt tgatactcta 13260
gaccagggaa aacgaaagcc ggtcagcggg cactcttccg tggtctggtg aatagatcgc 13320
aagggtatca tggcggaggg cctcggttcg agccccgggt ccgggccgga cggtccgcca 13380
tgatccacgc ggttaccgcc cgcgtgtcga acccaggtgt gcgacgtcag acaacggtgg 13440
agtgttcctt ttggcgtttt tctggccggg cgccggcgcc gcgtaagaga ctaagccgcg 13500
aaagcgaaag cagtaagtgg ctcgctcccc gtagccggag ggatccttgc taagggttgc 13560
gttgcggcga accccggttc gaatcccgta ctcgggccgg ccggacccgc ggctaaggtg 13620
ttggattggc ctccccctcg tataaagacc ccgcttgcgg attgactccg gacacgggga 13680
cgagcccctt ttatttttgc tttccccaga tgcatccggt gctgcggcag atgcgccccc 13740
cgccccagca gcagcaacaa caccagcaag agcggcagca acagcagcgg gagtcatgca 13800
gggccccctc acccaccctc ggcgggccgg ccacctcggc gtccgcggcc gtgtctggcg 13860
cctgcggcgg cggcgggggg ccggctgacg accccgagga gcccccgcgg cgcagggcca 13920
gacactacct ggacctggag gagggcgagg gcctggcgcg gctgggggcg ccgtctcccg 13980
agcgccaccc gcgggtgcag ctgaagcgcg actcgcgcga ggcgtacgtg cctcggcaga 14040
acctgttcag ggaccgcgcg ggcgaggagc ccgaggagat gcgggacagg aggttcagcg 14100
cagggcggga gctgcggcag gggctgaacc gcgagcggct gctgcgcgag gaggactttg 14160
agcccgacgc gcggacgggg atcagccccg cgcgcgcgca cgtggcggcc gccgacctgg 14220
tgacggcgta cgagcagacg gtgaaccagg agatcaactt ccaaaagagt ttcaacaacc 14280
acgtgcgcac gctggtggcg cgcgaggagg tgaccatcgg gctgatgcac ctgtgggact 14340
ttgtaagcgc gctggtgcag aaccccaaca gcaagcctct gacggcgcag ctgttcctga 14400
tagtgcagca cagcagggac aacgaggcgt ttagggacgc gctgctgaac atcaccgagc 14460
ccgagggtcg gtggctgctg gacctgatta acatcctgca gagcatagtg gtgcaggagc 14520
gcagcctgag cctggccgac aaggtggcgg ccatcaacta ctcgatgctg agcctgggca 14580
agttttacgc gcgcaagatc taccagacgc cgtacgtgcc catagacaag gaggtgaaga 14640
tcgacggttt ttacatgcgc atggcgctga aggtgctcac cctgagcgac gacctgggcg 14700
tgtaccgcaa cgagcgcatc cacaaggccg tgagcgtgag ccggcggcgc gagctgagcg 14760
accgcgagct gatgcacagc ctgcagcggg cgctggcggg cgccggcagc ggcgacaggg 14820
aggcggagtc ctacttcgat gcgggggcgg acctgcgctg ggcgcccagc cggcgggccc 14880
tggaggccgc gggggtccgc gaggactatg acgaggacgg cgaggaggat gaggagtacg 14940
agctagagga gggcgagtac ctggactaaa ccgcgggtgg tgtttccggt agatgcaaga 15000
cccgaacgtg gtggacccgg cgctgcgggc ggctctgcag agccagccgt ccggccttaa 15060
ctcctcagac gactggcgac aggtcatgga ccgcatcatg tcgctgacgg cgcgtaaccc 15120
ggacgcgttc cggcagcagc cgcaggccaa caggctctcc gccatcctgg aggcggtggt 15180
gcctgcgcgc tcgaacccca cgcacgagaa ggtgctggcc atagtgaacg cgctggccga 15240
gaacagggcc atccgcccgg acgaggccgg gctggtgtac gacgcgctgc tgcagcgcgt 15300
ggcccgctac aacagcggca acgtgcagac caacctggac cggctggtgg gggacgtgcg 15360
cgaggcggtg gcgcagcgcg agcgcgcgga tcggcagggc aacctgggct ccatggtggc 15420
gctgaatgcc ttcctgagca cgcagccggc caacgtgccg cgggggcagg aagactacac 15480
caactttgtg agcgcgctgc ggctgatggt gaccgagacc ccccagagcg aggtgtacca 15540
gtcgggcccg gactacttct tccagaccag cagacagggc ctgcagacgg tgaacctgag 15600
ccaggctttc aagaacctgc gggggctgtg gggcgtgaag gcgcccaccg gcgaccgggc 15660
gacggtgtcc agcctgctga cgcccaactc gcgcctgctg ctgctgctga tcgcgccgtt 15720
cacggacagc ggcagcgtgt cccgggacac ctacctgggg cacctgctga ccctgtaccg 15780
cgaggccatc gggcaggcgc aggtggacga gcacaccttc caggagatca ccagcgtgag 15840
ccgcgcgctg gggcaggagg acacgagcag cctggaggcg actctgaact acctgctgac 15900
caaccggcgg cagaagattc cctcgctgca cagcctgacc tccgaggagg agcgcatctt 15960
gcgctacgtg cagcagagcg tgagcctgaa cctgatgcgc gacggggtga cgcccagcgt 16020
ggcgctggac atgaccgcgc gcaacatgga accgggcatg tacgccgcgc accggcctta 16080
catcaaccgc ctgatggact acctgcatcg cgcggcggcc gtgaaccccg agtactttac 16140
caacgccatc ctgaacccgc actggctccc gccgcccggg ttctacagcg ggggcttcga 16200
ggtcccggag accaacgatg gcttcctgtg ggacgacatg gacgacagcg tgttctcccc 16260
gcggccgcag gcgctggcgg aagcgtccct gctgcgtccc aagaaggagg aggaggagga 16320
ggcgagtcgc cgccgcggca gcagcggcgt ggcttctctg tccgagctgg gggcggcagc 16380
cgccgcgcgc cccgggtccc tgggcggcag cccctttccg agcctggtgg ggtctctgca 16440
cagcgagcgc accacccgcc ctcggctgct gggcgaggac gagtacctga ataactccct 16500
gctgcagccg gtgcgggaga aaaacctgcc tcccgccttc cccaacaacg ggatagagag 16560
cctggtggac aagatgagca gatggaagac ctatgcgcag gagcacaggg acgcgcctgc 16620
gctccggccg cccacgcggc gccagcgcca cgaccggcag cgggggctgg tgtgggatga 16680
cgaggactcc gcggacgata gcagcgtgct ggacctggga gggagcggca acccgttcgc 16740
gcacctgcgc ccccgcctgg ggaggatgtt ttaaaaaaaa aaaaaaaang caagaagcat 16800
gatgcaaaaa ttaaataaaa ctcaccaagg ccatggcgac cgagcgttgg tttcttgtgt 16860
tcccttcagt atgcggcgcg cggcgatgta ccaggaggga cctcctccct cttacgagag 16920
cgtggtgggc gcggcggcgg cggcgccctc ttctcccttt gcgtcgcagc tgctggagcc 16980
gccgtacgtg cctccgcgct acctgcggcc tacggggggg agaaacagca tccgttactc 17040
ggagctggcg cccctgttcg acaccacccg ggtgtacctg gtggacaaca agtcggcgga 17100
cgtggcctcc ctgaactacc agaacgacca cagcaatttt ttgaccacgg tcatccagaa 17160
caatgactac agcccgagcg aggccagcac ccagaccatc aatctggatg accggtcgca 17220
ctggggcggc gacctgaaaa ccatcctgca caccaacatg cccaacgtga acgagttcat 17280
gttcaccaat aagttcaagg cgcgggtgat ggtgtcgcgc tcgcacacca aggaagaccg 17340
ggtggagctg aagtacgagt gggtggagtt cgagctgcca gagggcaact actccgagac 17400
catgaccatt gacctgatga acaacgcgat cgtggagcac tatctgaaag tgggcaggca 17460
gaacggggtc ctggagagcg acatcggggt caagttcgac accaggaact tccgcctggg 17520
gctggacccc gtgaccgggc tggttatgcc cggggtgtac accaacgagg ccttccatcc 17580
cgacatcatc ctgctgcccg gctgcggggt ggacttcact tacagccgcc tgagcaacct 17640
cctgggcatc cgcaagcggc agcccttcca ggagggcttc aggatcacct acgaggacct 17700
ggaggggggc aacatccccg cgctcctcga tgtggaggcc taccaggata gcttgaagga 17760
aaatgaggcg ggacaggagg ataccgcccc cgccgcctcc gccgccgccg agcagggcga 17820
ggatgctgct gacaccgcgg ccgcggacgg ggcagaggcc gaccccgcta tggtggtgga 17880
ggctcccgag caggaggagg acatgaatga cagtgcggtg cgcggagaca ccttcgtcac 17940
ccggggggag gaaaagcaag cggaggccga ggccgcggcc gaggaaaagc aactggcggc 18000
agcagcggcg gcggcggcgt tggccgcggc ggaggctgag tctgagggga ccaagcccgc 18060
caaggagccc gtgattaagc ccctgaccga agatagcaag aagcgcagtt acaacctgct 18120
caaggacagc accaacaccg cgtaccgcag ctggtacctg gcctacaact acggcgaccc 18180
gtcgacgggg gtgcgctcct ggaccctgct gtgcacgccg gacgtgacct gcggctcgga 18240
gcaggtgtac tggtcgctgc ccgacatgat gcaagacccc gtgaccttcc gctccacgcg 18300
gcaggtcagc aacttcccgg tggtgggcgc cgagctgctg cccgtgcact ccaagagctt 18360
ctacaacgac caggccgtct actcccagct catccgccag ttcacctctc tgacccacgt 18420
gttcaatcgc tttcctgaga accagattct ggcgcgcccg cccgccccca ccatcaccac 18480
cgtcagtgaa aacgttcctg ctctcacaga tcacgggacg ctaccgctgc gcaacagcat 18540
cggaggagtc cagcgagtga ccgttactga cgccagacgc cgcacctgcc cctacgttta 18600
caaggccttg ggcatagtct cgccgcgcgt cctttccagc cgcacttttt gagcaacacc 18660
accatcatgt ccatcctgat ctcacccagc aataactccg gctggggact gctgcgcgcg 18720
cccagcaaga tgttcggagg ggcgaggaag cgttccgagc agcaccccgt gcgcgtgcgc 18780
gggcacttcc gcgccccctg gggagcgcac aaacgcggcc gcgcggggcg caccaccgtg 18840
gacgacgcca tcgactcggt ggtggagcag gcgcgcaact acaggcccgc ggtctctacc 18900
gtggacgcgg ccatccagac cgtggtgcgg ggcgcgcggc ggtacgccaa gctgaagagc 18960
cgccggaagc gcgtggcccg ccgccaccgc cgccgacccg gggccgccgc caaacgcgcc 19020
gccgcggccc tgcttcgccg ggccaagcgc acgggccgcc gcgccgccat gagggccgcg 19080
cgccgcttgg ccgccggcat caccgccgcc accatggccc cccgtacccg aagacgcgcg 19140
gccgccgccg ccgccgccgc catcagtgac atggccagca ggcgccgggg caacgtgtac 19200
tgggtgcgcg actcggtgac cggcacgcgc gtgcccgtgc gcttccgccc cccgcggact 19260
tgagatgatg tgaaaaaaca acactgagtc tcctgctgtt gtgtgtatcc cagcggcggc 19320
ggcgcgcgca gcgtcatgtc caagcgcaaa atcaaagaag agatgctcca ggtcgtcgcg 19380
ccggagatct atgggccccc gaagaaggaa gagcaggatt cgaagccccg caagataaag 19440
cgggtcaaaa agaaaaagaa agatgatgac gatgccgatg gggaggtgga gttcctgcgc 19500
gccacggcgc ccaggcgccc ggtgcagtgg aagggccggc gcgtaaagcg cgtcctgcgc 19560
cccggcaccg cggtggtctt cacgcccggc gagcgctcca cccggacttt caagcgcgtc 19620
tatgacgagg tgtacggcga cgaagacctg ctggagcagg ccaacgagcg cttcggagag 19680
tttgcttacg ggaagcgtca gcgggcgctg gggaaggagg acctgctggc gctgccgctg 19740
gaccagggca accccacccc cagtctgaag cccgtgaccc tgcagcaggt gctgccgagc 19800
agcgcaccct ccgaggcgaa gcggggtctg aagcgcgagg gcggcgacct ggcgcccacc 19860
gtgcagctca tggtgcccaa gcggcagagg ctggaggatg tgctggagaa aatgaaagta 19920
gaccccggtc tgcagccgga catcagggtc cgccccatca agcaggtggc gccgggcctc 19980
ggcgtgcaga ccgtggacgt ggtcatcccc accggcaact cccccgccgc cgccaccact 20040
accgctgcct ccacggacat ggagacacag accgatcccg ccgcagccgc agccgcagcc 20100
gccgccgcga cctcctcggc ggaggtgcag acggacccct ggctgccgcc ggcgatgtca 20160
gctccccgcg cgcgtcgcgg gcgcaggaag tacggcgccg ccaacgcgct cctgcccgag 20220
tacgccttgc atccttccat cgcgcccacc cccggctacc gaggctatac ctaccgcccg 20280
cgaagagcca agggttccac ccgccgtccc cgccgacgcg ccgccgccac cacccgccgc 20340
cgccgccgca gacgccagcc cgcactggct ccagtctccg tgaggaaagt ggcgcgcgac 20400
ggacacaccc tggtgctgcc cagggcgcgc taccacccca gcatcgttta aaagcctgtt 20460
gtggttcttg cagatatggc cctcacttgc cgcctccgtt tcccggtgcc gggataccga 20520
ggaggaagat cgcgccgcag gaggggtctg gccggccgcg gcctgagcgg aggcagccgc 20580
cgcgcgcacc ggcggcgacg cgccaccagc cgacgcatgc gcggcggggt gctgcccctg 20640
ttaatccccc tgatcgccgc ggcgatcggc gccgtgcccg ggatcgcctc cgtggccttg 20700
caagcgtccc agaggcattg acagacttgc aaacttgcaa atatggaaaa aaaaacccca 20760
ataaaaaagt ctagactctc acgctcgctt ggtcctgtga ctattttgta gaatggaaga 20820
catcaacttt gcgtcgctgg ccccgcgtca cggctcgcgc ccgttcctgg gacactggaa 20880
cgatatcggc accagcaaca tgagcggtgg cgccttcagt tggggctctc tgtggagcgg 20940
cattaaaagt atcgggtctg ccgttaaaaa ttacggctcc cgggcctgga acagcagcac 21000
gggccagatg ttgagagaca agttgaaaga gcagaacttc cagcagaagg tggtggaggg 21060
cctggcctcc ggcatcaacg gggtggtgga cctggccaac caggccgtgc agaataagat 21120
caacagcaga ctggaccccc ggccgccggt ggaggaggtg ccgccggcgc tggagacggt 21180
gtcccccgat gggcgtggcg agaagcgccc gcggcccgat agggaagaga ccactctggt 21240
cacgcagacc gatgagccgc ccccgtatga ggaggccctg aagcaaggtc tgcccaccac 21300
gcggcccatc gcgcccatgg ccaccggggt ggtgggccgc cacacccccg ccacgctgga 21360
cttgcctccg cccgccgatg tgccgcagca gcagaaggcg gcacagccgg gcccgcccgc 21420
gaccgcctcc cgttcctccg ccggtcctct gcgccgcgcg gccagcggcc cccgcggggg 21480
ggtcgcgagg cacggcaact ggcagagcac gctgaacagc atcgtgggtc tgggggtgcg 21540
gtccgtgaag cgccgccgat gctactgaat agcttagcta acgtgttgta tgtgtgtatg 21600
cgccctatgt cgccgccaga ggagctgctg agtcgccgcc gttcgcgcgc ccaccaccac 21660
cgccactccg cccctcaaga tggcgacccc atcgatgatg ccgcagtggt cgtacatgca 21720
catctcgggc caggacgcct cggagtacct gagccccggg ctggtgcagt tcgcccgcgc 21780
caccgagagc tacttcagcc tgagtaacaa gtttaggaac cccacggtgg cgcccacgca 21840
cgatgtgacc accgaccggt ctcagcgcct gacgctgcgg ttcattcccg tggaccgcga 21900
ggacaccgcg tactcgtaca aggcgcggtt caccctggcc gtgggcgaca accgcgtgct 21960
ggacatggcc tccacctact ttgacatccg cggggtgctg gaccggggtc ccactttcaa 22020
gccctactct ggcaccgcct acaactccct ggcccccaag ggcgctccca actcctgcga 22080
gtgggagcaa gaggaaactc aggcagttga agaagcagca gaagaggaag aagaagatgc 22140
tgacggtcaa gctgaggaag agcaagcagc taccaaaaag actcatgtat atgctcaggc 22200
tcccctttct ggcgaaaaaa ttagtaaaga tggtctgcaa ataggaacgg acgctacagc 22260
tacagaacaa aaacctattt atgcagaccc tacattccag cccgaacccc aaatcgggga 22320
gtcccagtgg aatgaggcag atgctacagt cgccggcggt agagtgctaa agaaatctac 22380
tcccatgaaa ccatgctatg gttcctatgc aagacccaca aatgctaatg gaggtcaggg 22440
tgtactaacg gcaaatgccc agggacagct agaatctcag gttgaaatgc aattcttttc 22500
aacttctgaa aacgcccgta acgaggctaa caacattcag cccaaattgg tgctgtatag 22560
tgaggatgtg cacatggaga ccccggatac gcacctttct tacaagcccg caaaaagcga 22620
tgacaattca aaaatcatgc tgggtcagca gtccatgccc aacagaccta attacatcgg 22680
cttcagagac aactttatcg gcctcatgta ttacaatagc actggcaaca tgggagtgct 22740
tgcaggtcag gcctctcagt tgaatgcagt ggtggacttg caagacagaa acacagaact 22800
gtcctaccag ctcttgcttg attccatggg tgacagaacc agatactttt ccatgtggaa 22860
tcaggcagtg gacagttatg acccagatgt tagaattatt gaaaatcatg gaactgaaga 22920
cgagctcccc aactattgtt tccctctggg tggcataggg gtaactgaca cttaccaggc 22980
tgttaaaacc aacaatggca ataacggggg ccaggtgact tggacaaaag atgaaacttt 23040
tgcagatcgc aatgaaatag gggtgggaaa caatttcgct atggagatca acctcagtgc 23100
caacctgtgg agaaacttcc tgtactccaa cgtggcgctg tacctaccag acaagcttaa 23160
gtacaacccc tccaatgtgg acatctctga caaccccaac acctacgatt acatgaacaa 23220
gcgagtggtg gccccggggc tggtggactg ctacatcaac ctgggcgcgc gctggtcgct 23280
ggactacatg gacaacgtca accccttcaa ccaccaccgc aatgcgggcc tgcgctaccg 23340
ctccatgctc ctgggcaacg ggcgctacgt gcccttccac atccaggtgc cccagaagtt 23400
ctttgccatc aagaacctcc tcctcctgcc gggctcctac acctacgagt ggaacttcag 23460
gaaggatgtc aacatggtcc tccagagctc tctgggtaac gatctcaggg tggacggggc 23520
cagcatcaag ttcgagagca tctgcctcta cgccaccttc ttccccatgg cccacaacac 23580
ggcctccacg ctcgaggcca tgctcaggaa cgacaccaac gaccagtcct tcaatgacta 23640
cctctccgcc gccaacatgc tctaccccat acccgccaac gccaccaacg tccccatctc 23700
catcccctcg cgcaactggg cggccttccg cggctgggcc ttcacccgcc tcaagaccaa 23760
ggagaccccc tccctgggct cgggattcga cccctactac acctactcgg gctccattcc 23820
ctacctggac ggcaccttct acctcaacca cactttcaag aaggtctcgg tcaccttcga 23880
ctcctcggtc agctggccgg gcaacgaccg tctgctcacc cccaacgagt tcgagatcaa 23940
gcgctcggtc gacggggagg gctacaacgt ggcccagtgc aacatgacca aggactggtt 24000
cctggtccag atgctggcca actacaacat cggctaccag ggcttctaca tcccagagag 24060
ctacaaggac aggatgtact ccttcttcag gaacttccag cccatgagcc ggcaggtggt 24120
ggaccagacc aagtacaagg actaccagga ggtgggcatc atccaccagc acaacaactc 24180
gggcttcgtg ggctacctcg cccccaccat gcgcgaggga caggcctacc ccgccaactt 24240
cccctatccg ctcataggca agaccgcggt cgacagcatc acccagaaaa agttcctctg 24300
cgaccgcacc ctctggcgca tccccttctc cagcaacttc atgtccatgg gtgcgctctc 24360
ggacctgggc cagaacttgc tctacgccaa ctccgcccac gccctcgaca tgaccttcga 24420
ggtcgacccc atggacgagc ccacccttct ctatgttctg ttcgaagtct ttgacgtggt 24480
ccgggtccac cagccgcacc gcggcgtcat cgagaccgtg tacctgcgta cgcccttctc 24540
ggccggcaac gccaccacct aaagaagcaa gccgcagtca tcgccgcctg catgccgtcg 24600
ggttccaccg agcaagagct cagggccatc gtcagagacc tgggatgcgg gccctatttt 24660
ttgggcacct tcgacaagcg cttccctggc tttgtctccc cacacaagct ggcctgcgcc 24720
atcgtcaaca cggccggccg cgagaccggg ggcgtgcact ggctggcctt cgcctggaac 24780
ccgcgctcca aaacatgctt cctctttgac cccttcggct tttcggacca gcggctcaag 24840
caaatctacg agttcgagta cgagggcttg ctgcgtcgca gcgccatcgc ctcctcgccc 24900
gaccgctgcg tcaccctcga aaagtccacc cagaccgtgc aggggcccga ctcggccgcc 24960
tgcggtctct tctgctgcat gtttctgcac gcctttgtgc actggcctca gagtcccatg 25020
gaccgcaacc ccaccatgaa cttgctgacg ggggtgccca actccatgct ccagagcccc 25080
caggtcgagc ccaccctgcg ccgcaaccag gagcagctct acagcttcct ggagcgccac 25140
tcgccttact tccgccgcca cagcgcacag atcaggaggg ccacctcctt ctgccacttg 25200
caagagatgc aagaagggta ataacgatgt acacactttt tttctcaata aatggcatct 25260
ttttatttat acaagctctc tggggtattc atttcccacc accacccgcc gttgtcgcca 25320
tctggctcta tttagaaatc gaaagggttc tgccgggagt cgccgtgcgc cacgggcagg 25380
gacacgttgc gatactggta gcgggtgccc cacttgaact cgggcaccac caggcgaggc 25440
agctcgggga agttttcgct ccacaggctg cgggtcagca ccagcgcgtt catcaggtcg 25500
ggcgccgaga tcttgaagtc gcagttgggg ccgccgccct gcgcgcgcga gttgcggtac 25560
accgggttgc agcactggaa caccaacagc gccgggtgct tcacgctggc cagcacgctg 25620
cggtcggaga tcagctcggc gtccaggtcc tccgcgttgc tcagcgcgaa cggggtcatc 25680
ttgggcactt gccgccccag gaagggcgcg tgccccggtt tcgagttgca gtcgcagcgc 25740
agcgggatca gcaggtgccc gtgcccggac tcggcgttgg ggtacagcgc gcgcatgaag 25800
gcctgcatct ggcggaaggc catctgggcc ttggcgccct ccgagaagaa catgccgcag 25860
gacttgcccg agaactggtt tgcggggcag ctggcgtcgt gcaggcagca gcgcgcgtcg 25920
gtgttggcga tctgcaccac gttgcgcccc caccggttct tcacgatctt ggccttggac 25980
gattgctcct tcagcgcgcg ctgcccgttc tcgctggtca catccatctc gatcacatgt 26040
tccttgttca ccatgctgct gccgtgcaga cacttcagct cgccctccgt ctcggtgcag 26100
cggtgctgcc acagcgcgca gcccgtgggc tcgaaagact tgtaggtcac ctccgcgaag 26160
gactgcaggt acccctgcaa aaagcggccc atcatggtca cgaaggtctt gttgctgctg 26220
aaggtcagct gcagcccgcg gtgctcctcg ttcagccagg tcttgcacac ggccgccagc 26280
gcctccacct ggtcgggcag catcttgaag ttcaccttca gctcattctc cacgtggtac 26340
ttgtccatca gcgtgcgcgc cgcctccatg cccttctccc aggccgacac cagcggcagg 26400
ctcacggggt tcttcaccat caccgtggcc gccgcctccg ccgcgctttc gctttccgcc 26460
ccgctgttct cttcctcttc ctcctcttcc tcgccgccgc ccactcgcag cccccgcacc 26520
acggggtcgt cttcctgcag gcgctgcacc ttgcgcttgc cgttgcgccc ctgcttgatg 26580
cgcacgggcg ggttgctgaa gcccaccatc accagcgcgg cctcttcttg ctcgtcctcg 26640
ctgtccagaa tgacctccgg ggaggggggg ttggtcatcc tcagtaccga ggcacgcttc 26700
tttttcttcc tgggggcgtt cgccagctcc gcggctgcgg ccgctgccga ggtcgaaggc 26760
cgagggctgg gcgtgcgcgg caccagcgcg tcctgcgagc cgtcctcgtc ctcctcggac 26820
tcgagacgga ggcgggcccg cttcttcggg ggcgcgcggg gcggcggagg cggcggcggc 26880
gacggagacg gggacgagac atcgtccagg gtgggtggac ggcgggccgc gccgcgtccg 26940
cgctcggggg tggtctcgcg ctggtcctct tcccgactgg ccatctccca ctgctccttc 27000
tcctataggc agaaagagat catggagtct ctcatgcgag tcgagaagga ggaggacagc 27060
ctaaccgccc cctctgagcc ctccaccacc gccgccacca ccgccaatgc cgccgcggac 27120
gacgcgccca ccgagaccac cgccagtacc accctcccca gcgacgcacc cccgctcgag 27180
aatgaagtgc tgatcgagca ggacccgggt tttgtgagcg gagaggagga tgaggtggat 27240
gagaaggaga aggaggaggt cgccgcctca gtgccaaaag aggataaaaa gcaagaccag 27300
gacgacgcag ataaggatga gacagcagtc gggcggggga acggaagcca tgatgctgat 27360
gacggctacc tagacgtggg agacgacgtg ctgcttaagc acctgcaccg ccagtgcgtc 27420
atcgtctgcg acgcgctgca ggagcgctgc gaagtgcccc tggacgtggc ggaggtcagc 27480
cgcgcctacg agcggcacct cttcgcgccg cacgtgcccc ccaagcgccg ggagaacggc 27540
acctgcgagc ccaacccgcg tctcaacttc tacccggtct tcgcggtacc cgaggtgctg 27600
gccacctacc acatcttttt ccaaaactgc aagatccccc tctcctgccg cgccaaccgc 27660
acccgcgccg acaaaaccct gaccctgcgg cagggcgccc acatacctga tatcgcctct 27720
ctggaggaag tgcccaagat cttcgagggt ctcggtcgcg acgagaaacg ggcggcgaac 27780
gctctgcacg gagacagcga aaacgagagt cactcggggg tgctggtgga gctcgagggc 27840
gacaacgcgc gcctggccgt actcaagcgc agcatagagg tcacccactt tgcctacccg 27900
gcgctcaacc tgccccccaa ggtcatgagt gtggtcatgg gcgagctcat catgcgccgc 27960
gcccagcccc tggccgcgga tgcaaacttg caagagtcct ccgaggaagg cctgcccgcg 28020
gtcagcgacg agcagctggc gcgctggctg gagacccgcg accccgcgca gctggaggag 28080
cggcgcaagc tcatgatggc cgcggtgctg gtcaccgtgg agctcgagtg tctgcagcgc 28140
ttcttcgcgg accccgagat gcagcgcaag ctcgaggaga ccctgcacta caccttccgc 28200
cagggctacg tgcgccaggc ctgcaagatc tccaacgtgg agctctgcaa cctggtctcc 28260
tacctgggca tcctgcacga gaaccgcctc gggcagaacg tcctgcactc caccctcaaa 28320
ggggaggcgc gccgcgacta catccgcgac tgcgcctacc tcttcctctg ctacacctgg 28380
cagacggcca tgggggtctg gcagcagtgc ctggaggagc gcaacctcaa ggagctggaa 28440
aagctcctca agcgcaccct cagggacctc tggacgggct tcaacgagcg ctcggtggcc 28500
gccgcgctgg cggacatcat ctttcccgag cgcctgctca agaccctgca gcagggcctg 28560
cccgacttca ccagccagag catgctgcag aacttcagga ctttcatcct ggagcgctcg 28620
ggcatcctgc cggccacttg ctgcgcgctg cccagcgact tcgtgcccat caagtacagg 28680
gagtgcccgc cgccgctctg gggccactgc tacctcttcc agctggccaa ctacctcgcc 28740
taccactcgg acctcatgga agacgtgagc ggcgagggcc tgctcgagtg ccactgccgc 28800
tgcaacctct gcacgcccca ccgctctcta gtctgcaacc cgcagctgct cagcgagagt 28860
cagattatcg gtaccttcga gctgcagggt ccctcgcctg acgagaagtc cgcggctcca 28920
gggctgaaac tcactccggg gctgtggact tccgcctacc tacgcaaatt tgtacctgag 28980
gactaccacg cccacgagat caggttctac gaagaccaat cccgcccgcc caaggcggag 29040
ctcaccgcct gcgtcatcac ccaggggcac atcctgggcc aattgcaagc catcaacaaa 29100
gcccgccgag agttcttgct gaaaaagggt cggggggtgt acctggaccc ccagtccggc 29160
gaggagctaa acccgctacc cccgccgccg ccccagcagc gggaccttgc ttcccaggat 29220
ggcacccaga aagaagcagc agccgccgcc gccgccgcag ccatacatgc ttctggagga 29280
agaggaggag gactgggaca gtcaggcaga ggaggtttcg gacgaggagc aggaggagat 29340
gatggaagac tgggaggagg acagcagcct agacgaggaa gcttcagagg ccgaagaggt 29400
ggcagacgca acaccatcgc cctcggtcgc agccccctcg ccggggcccc tgaaatcctc 29460
cgaacccagc accagcgcta taacctccgc tcctccggcg ccggcgccac ccgcccgcag 29520
acccaaccgt agatgggaca ccacaggaac cggggtcggt aagtccaagt gcccgccgcc 29580
gccaccgcag cagcagcagc agcagcgcca gggctaccgc tcgtggcgcg ggcacaagaa 29640
cgccatagtc gcctgcttgc aagactgcgg gggcaacatc tctttcgccc gccgcttcct 29700
gctattccac cacggggtcg cctttccccg caatgtcctg cattactacc gtcatctcta 29760
cagcccctac tgcagcggcg acccagaggc ggcagcggca gccacagcgg cgaccaccac 29820
ctaggaagat atcctccgcg ggcaagacag cggcagcagc ggccaggaga cccgcggcag 29880
cagcggcggg agcggtgggc gcactgcgcc tctcgcccaa cgaacccctc tcgacccggg 29940
agctcagaca caggatcttc cccactttgt atgccatctt ccaacagagc agaggccagg 30000
agcaggagct gaaaataaaa aacagatctc tgcgctccct cacccgcagc tgtctgtatc 30060
acaaaagcga agatcagctt cggcgcacgc tggaggacgc ggaggcactc ttcagcaaat 30120
actgcgcgct cactcttaaa gactagctcc gcgcccttct cgaatttagg cgggagaaaa 30180
ctacgtcatc gccggccgcc gcccagcccg cccagccgag atgagcaaag agattcccac 30240
gccatacatg tggagctacc agccgcagat gggactcgcg gcgggagcgg cccaggacta 30300
ctccacccgc atgaactaca tgagcgcggg accccacatg atctcacagg tcaacgggat 30360
ccgcgcccag cgaaaccaaa tactgctgga acaggcggcc atcaccgcca cgccccgcca 30420
taatctcaac ccccgaaatt ggcccgccgc cctcgtgtac caggaaaccc cctccgccac 30480
caccgtacta cttccgcgtg acgcccaggc cgaagtccag atgactaact caggggcgca 30540
gctcgcgggc ggctttcgtc acggggcgcg gccgctccga ccaggtataa gacacctgat 30600
gatcagaggc cgaggtatcc agctcaacga cgagtcggtg agctcttcgc tcggtctccg 30660
tccggacgga actttccagc tcgccggatc cggccgctct tcgttcacgc cccgccaggc 30720
gtacctgact ctgcagacct cgtcctcgga gccccgctcc ggcggcatcg gaaccctcca 30780
gttcgtggag gagttcgtgc cctcggtcta cttcaacccc ttctcgggac ctcccggacg 30840
ctaccccgac cagttcattc cgaactttga cgcggtgaag gactcggcgg acggctacga 30900
ctgaatgtca ggtgtcgagg cagagcagct tcgcctgaga cacctcgagc actgccgccg 30960
ccacaagtgc ttcgcccgcg gttctggtga gttctgctac tttcagctac ccgaggagca 31020
taccgagggg ccggcgcacg gcgtccgcct gaccacccag ggcgaggtta cctgttccct 31080
catccgggag tttaccctcc gtcccctgct agtggagcgg gagcggggtc cctgtgtcct 31140
aactatcgcc tgcaactgcc ctaaccctgg attacatcaa gatctttgct gtcatctctg 31200
tgctgagttt aataaacgct gagatcagaa tctactggga tttagtcccc tttaactaat 31260
caaacactgg aatcaataaa aagaatcact tacttaaaat cagacagcag gtctctgtcc 31320
agtttattca gcagcacctc cttcccctcc tcccaactct ggtactccaa acgccttctg 31380
gcggcaaact tcctccacac cctgaaggga atgtcagatt cttgctcctg tccctccgca 31440
cccactatct tcatgttgtt gcagatgaag cgcaccaaaa cgtctgacga gagcttcaac 31500
cccgtgtacc cctatgacac ggaaagcggc cctccctccg tccctttcct cacccctccc 31560
ttcgtgtctc ccgatggatt ccaagaaagt ccccccgggg tcctgtctct gaacctggcc 31620
gagcccctgg tcacttccca cggcatgctc gccctgaaaa tgggaagtgg cctctccctg 31680
gacgacgctg gcaacctcac ctctcaagat atcaccaccg ctagccctcc cctcaaaaaa 31740
accaagacca acctcagcct agaaacctca tcccccctaa ctgtgagcac ctcaggcgcc 31800
ctcaccgtag cagccgccgc tcccctggcg gtggccggca cctccctcac catgcaatca 31860
gaggcccccc tgacagtaca ggatgcaaaa ctcaccctgg ccaccaaagg ccccctgacc 31920
gtgtctgaag gcaaactggc cttgcaaaca tcggccccgc tgacggccgc tgacagcagc 31980
accctcacag tcagtgccac accacccctt agcacaagca atggcagctt gggtattgac 32040
atgcaagccc ccatttacac caccaatgga aaactaggac ttaactttgg cgctcccctg 32100
catgtggtag acagcctaaa tgcactgact gtagttactg gccaaggtct tacgataaac 32160
ggaacagccc tacaaactag agtctcaggt gccctcaact atgacacatc aggaaaccta 32220
gaattgagag ctgcaggggg tatgcgagtt gatgcaaatg gtcaacttat ccttgatgta 32280
gcttacccat ttgatgcaca aaacaatctc agccttaggc ttggacaggg acccctgttt 32340
gttaactctg cccacaactt ggatgttaac tacaacagag gcctctacct gttcacatct 32400
ggaaatacca aaaagctaga agttaatatc aaaacagcca agggtctcat ttatgatgac 32460
actgctatag caatcaatgc gggtgatggg ctacagtttg actcaggctc agatacaaat 32520
ccattaaaaa ctaaacttgg attaggactg gattatgact ccagcagagc cataattgct 32580
aaactgggaa ctggcctaag ctttgacaac acaggtgcca tcacagtagg caacaaaaat 32640
gatgacaagc ttaccttgtg gaccacacca gacccatccc ctaactgtag aatctattca 32700
gagaaagatg ctaaattcac acttgttttg actaaatgcg gcagtcaggt gttggccagc 32760
gtttctgttt tatctgtaaa aggtagcctt gcgcccatca gtggcacagt aactagtgct 32820
cagattgtcc tcagatttga tgaaaatgga gttctactaa gcaattcttc ccttgaccct 32880
caatactgga actacagaaa aggtgacctt acagagggca ctgcatatac caacgcagtg 32940
ggatttatgc ccaacctcac agcataccca aaaacacaga gccaaactgc taaaagcaac 33000
attgtaagtc aggtttactt gaatggggac aaatccaaac ccatgaccct caccattacc 33060
ctcaatggaa ctaatgaaac aggagatgcc acagtaagca cttactccat gtcattctca 33120
tggaactgga atggaagtaa ttacattaat gaaacgttcc aaaccaactc cttcaccttc 33180
tcctacatcg cccaagaata aaaagcatga cgctgttgat ttgattcaat gtgtttctgt 33240
tttattttca agcacaacaa aatcattcaa gtcattcttc catcttagct taatagacac 33300
agtagcttaa tagacccagt agtgcaaagc cccattctag cttataacta gtggagaagt 33360
actcgcctac atgggggtag agtcataatc gtgcatcagg atagggcggt ggtgctgcag 33420
cagcgcgcga ataaactgct gccgccgccg ctccgtcctg caggaataca acatggcagt 33480
ggtctcctca gcgatgattc gcaccgcccg cagcataagg cgccttgtcc tccgggcaca 33540
gcagcgcacc ctgatctcac ttaaatcagc acagtaactg cagcacagca ccacaatatt 33600
gttcaaaatc ccacagtgca aggcgctgta tccaaagctc atggcgggga ccacagaacc 33660
cacgtggcca tcataccaca agcgcaggta gattaagtgg cgacccctca taaacacgct 33720
ggacataaac attacctctt ttggcatgtt gtaattcacc acctcccggt accatataaa 33780
cctctgatta aacatggcgc catccaccac catcctaaac cagctggcca aaacctgccc 33840
gccggctata cactgcaggg aaccgggact ggaacaatga cagtggagag cccaggactc 33900
gtaaccatgg atcatcatgc tcgtcatgat atcaatgttg gcacaacaca ggcacacgtg 33960
catacacttc ctcaggatta caagctcctc ccgcgttaga accatatccc agggaacaac 34020
ccattcctga atcagcgtaa atcccacact gcagggaaga cctcgcacgt aactcacgtt 34080
gtgcattgtc aaagtgttac attcgggcag cagcggatga tcctccagta tggtagcgcg 34140
ggtttctgtc tcaaaaggag gtagacgatc cctactgtac ggagtgcgcc gagacaaccg 34200
agatcgtgtt ggtcgtagtg tcatgccaaa tggaacgccg gacgtagtca tatttcctga 34260
agtcttagat ctctcaacgc agcaccagca ccaacacttc gcagtgtaaa aggccaagtg 34320
ccgagagagt atatatagga ataaaaagtg acgtaaacgg gcaaagtcca aaaaacgccc 34380
agaaaaaccg cacgcgaacc tacgccccga aacgaaagcc aaaaaacact agacactccc 34440
ttccggcgtc aacttccgct ttcccacgct acgtcacttg ccccagtcaa acaaactaca 34500
tatcccgaac ttccaagtcg ccacgcccaa aacaccgcct acacctcccc gcccgccggc 34560
ccgcccccaa acccgcctcc cgccccgcgc cccgccccgc gccgcccatc tcattatcat 34620
attggcttca atccaaaata aggtatatta ttgatgatgg tttaaacgga tcctctagag 34680
tcgacctgca ggcatgcaag cttgagtatt ctatagtgtc acctaaatag cttggcgtaa 34740
tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata 34800
cgagccggaa gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta 34860
attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa 34920
tgaatcggcc aacgcgaacc ccttgcggcc gcccgggccg tcgaccaatt ctcatgtttg 34980
acagcttatc atcgaatttc tgccattcat ccgcttatta tcacttattc agctcggtac 35040
ccggggatcc tcgtttaaac aggcgtagca accaggcgtt taagggcacc aataactgcc 35100
ttaaaaaaat tacgccccgc cctgccactc atcgcagtac tgttgtaatt cattaagcat 35160
tctgccgaca tggaagccat cacaaacggc atgatgaacc tgaatcgcca gcggcatcag 35220
caccttgtcg ccttgcgtat aatatttgcc catggtgaaa acgggggcga agaagttgtc 35280
catattggcc acgtttaaat caaaactggt gaaactcacc cagggattgg ctgagacgaa 35340
aaacatattc tcaataaacc ctttagggaa ataggccagg ttttcaccgt aacacgccac 35400
atcttgcgaa tatatgtgta gaaactgccg gaaatcgtcg tggtattcac tccagagcga 35460
tgaaaacgtt tcagtttgct catggaaaac ggtgtaacaa gggtgaacac tatcccatat 35520
caccagctca ccgtctttca ttgccatacg gaattccgga tgagcattca tcaggcgggc 35580
aagaatgtga ataaaggccg gataaaactt gtgcttattt ttctttacgg tctttaaaaa 35640
ggccgtaata tccagctgaa cggtctggtt ataggtacat tgagcaactg actgaaatgc 35700
ctcaaaatgt tctttacgat gccattggga tatatcaacg gtggtatatc cagtgatttt 35760
tttctccatt ttagcttcct tagctcctga aaatctcgat aactcaaaaa atacgcccgg 35820
tagtgatctt atttcattat ggtgaaagtt ggaacctctt acgtgccgat caacgtctca 35880
ttttcgccaa aagttggccc agggcttccc ggtatcaaca gggacaccag gatttattta 35940
ttctgcgaag tgatcttccg tcacaggtat ttattcgcga taagctcatg gagcggcgta 36000
accgtcgcac aggaaggaca gagaaagcgc ggatctggga agtgacggac agaacggtca 36060
ggacctggat tggggaggcg gttgccgccg ctgctgctga cggtgtgacg ttctctgttc 36120
cggtcacacc acatacgttc cgccattcct atgcgatgca catgctgtat gccggtatac 36180
cgctgaaagt tctgcaaagc ctgatgggac ataagtccat cagttcaacg gaagtctaca 36240
cgaaggtttt tgcgctggat gtggctgccc ggcaccgggt gcagtttgcg atgccggagt 36300
ctgatgcggt tgcgatgctg aaacaattat cctgagaata aatgccttgg cctttatatg 36360
gaaatgtgga actgagtgga tatgctgttt ttgtctgtta aacagagaag ctggctgtta 36420
tccactgaga agcgaacgaa acagtcggga aaatctccca ttatcgtaga gatccgcatt 36480
attaatctca ggagcctgtg tagcgtttat aggaagtagt gttctgtcat gatgcctgca 36540
agcggtaacg aaaacgattt gaatatgcct tcaggaacaa tagaaatctt cgtgcggtgt 36600
tacgttgaag tggagcggat tatgtcagca atggacagaa caacctaatg aacacagaac 36660
catgatgtgg tctgtccttt tacagccagt agtgctcgcc gcagtcgagc gacagggcga 36720
agccctcgag tgagcgagga agcaccaggg aacagcactt atatattctg cttacacacg 36780
atgcctgaaa aaacttccct tggggttatc cacttatcca cggggatatt tttataatta 36840
ttttttttat agtttttaga tcttcttttt tagagcgcct tgtaggcctt tatccatgct 36900
ggttctagag aaggtgttgt gacaaattgc cctttcagtg tgacaaatca ccctcaaatg 36960
acagtcctgt ctgtgacaaa ttgcccttaa ccctgtgaca aattgccctc agaagaagct 37020
gttttttcac aaagttatcc ctgcttattg actctttttt atttagtgtg acaatctaaa 37080
aacttgtcac acttcacatg gatctgtcat ggcggaaaca gcggttatca atcacaagaa 37140
acgtaaaaat agcccgcgaa tcgtccagtc aaacgacctc actgaggcgg catatagtct 37200
ctcccgggat caaaaacgta tgctgtatct gttcgttgac cagatcagaa aatctgatgg 37260
caccctacag gaacatgacg gtatctgcga gatccatgtt gctaaatatg ctgaaatatt 37320
cggattgacc tctgcggaag ccagtaagga tatacggcag gcattgaaga gtttcgcggg 37380
gaaggaagtg gttttttatc gccctgaaga ggatgccggc gatgaaaaag gctatgaatc 37440
ttttccttgg tttatcaaac gtgcgcacag tccatccaga gggctttaca gtgtacatat 37500
caacccatat ctcattccct tctttatcgg gttacagaac cggtttacgc agtttcggct 37560
tagtgaaaca aaagaaatca ccaatccgta tgccatgcgt ttatacgaat ccctgtgtca 37620
gtatcgtaag ccggatggct caggcatcgt ctctctgaaa atcgactgga tcatagagcg 37680
ttaccagctg cctcaaagtt accagcgtat gcctgacttc cgccgccgct tcctgcaggt 37740
ctgtgttaat gagatcaaca gcagaactcc aatgcgcctc tcatacattg agaaaaagaa 37800
aggccgccag acgactcata tcgtattttc cttccgcgat atcacttcca tgacgacagg 37860
atagtctgag ggttatctgt cacagatttg agggtggttc gtcacatttg ttctgaccta 37920
ctgagggtaa tttgtcacag ttttgctgtt tccttcagcc tgcatggatt ttctcatact 37980
ttttgaactg taatttttaa ggaagccaaa tttgagggca gtttgtcaca gttgatttcc 38040
ttctctttcc cttcgtcatg tgacctgata tcgggggtta gttcgtcatc attgatgagg 38100
gttgattatc acagtttatt actctgaatt ggctatccgc gtgtgtacct ctacctggag 38160
tttttcccac ggtggatatt tcttcttgcg ctgagcgtaa gagctatctg acagaacagt 38220
tcttctttgc ttcctcgcca gttcgctcgc tatgctcggt tacacggctg cggcgagcgc 38280
tagtgataat aagtgactga ggtatgtgct cttcttatct ccttttgtag tgttgctctt 38340
attttaaaca actttgcggt tttttgatga ctttgcgatt ttgttgttgc tttgcagtaa 38400
attgcaagat ttaataaaaa aacgcaaagc aatgattaaa ggatgttcag aatgaaactc 38460
atggaaacac ttaaccagtg cataaacgct ggtcatgaaa tgacgaaggc tatcgccatt 38520
gcacagttta atgatgacag cccggaagcg aggaaaataa cccggcgctg gagaataggt 38580
gaagcagcgg atttagttgg ggtttcttct caggctatca gagatgccga gaaagcaggg 38640
cgactaccgc acccggatat ggaaattcga ggacgggttg agcaacgtgt tggttataca 38700
attgaacaaa ttaatcatat gcgtgatgtg tttggtacgc gattgcgacg tgctgaagac 38760
gtatttccac cggtgatcgg ggttgctgcc cataaaggtg gcgtttacaa aacctcagtt 38820
tctgttcatc ttgctcagga tctggctctg aaggggctac gtgttttgct cgtggaaggt 38880
aacgaccccc agggaacagc ctcaatgtat cacggatggg taccagatct tcatattcat 38940
gcagaagaca ctctcctgcc tttctatctt ggggaaaagg acgatgtcac ttatgcaata 39000
aagcccactt gctggccggg gcttgacatt attccttcct gtctggctct gcaccgtatt 39060
gaaactgagt taatgggcaa atttgatgaa ggtaaactgc ccaccgatcc acacctgatg 39120
ctccgactgg ccattgaaac tgttgctcat gactatgatg tcatagttat tgacagcgcg 39180
cctaacctgg gtatcggcac gattaatgtc gtatgtgctg ctgatgtgct gattgttccc 39240
acgcctgctg agttgtttga ctacacctcc gcactgcagt ttttcgatat gcttcgtgat 39300
ctgctcaaga acgttgatct taaagggttc gagcctgatg tacgtatttt gcttaccaaa 39360
tacagcaata gtaatggctc tcagtccccg tggatggagg agcaaattcg ggatgcctgg 39420
ggaagcatgg ttctaaaaaa tgttgtacgt gaaacggatg aagttggtaa aggtcagatc 39480
cggatgagaa ctgtttttga acaggccatt gatcaacgct cttcaactgg tgcctggaga 39540
aatgctcttt ctatttggga acctgtctgc aatgaaattt tcgatcgtct gattaaacca 39600
cgctgggaga ttagataatg aagcgtgcgc ctgttattcc aaaacatacg ctcaatactc 39660
aaccggttga agatacttcg ttatcgacac cagctgcccc gatggtggat tcgttaattg 39720
cgcgcgtagg agtaatggct cgcggtaatg ccattacttt gcctgtatgt ggtcgggatg 39780
tgaagtttac tcttgaagtg ctccggggtg atagtgttga gaagacctct cgggtatggt 39840
caggtaatga acgtgaccag gagctgctta ctgaggacgc actggatgat ctcatccctt 39900
cttttctact gactggtcaa cagacaccgg cgttcggtcg aagagtatct ggtgtcatag 39960
aaattgccga tgggagtcgc cgtcgtaaag ctgctgcact taccgaaagt gattatcgtg 40020
ttctggttgg cgagctggat gatgagcaga tggctgcatt atccagattg ggtaacgatt 40080
atcgcccaac aagtgcttat gaacgtggtc agcgttatgc aagccgattg cagaatgaat 40140
ttgctggaaa tatttctgcg ctggctgatg cggaaaatat ttcacgtaag attattaccc 40200
gctgtatcaa caccgccaaa ttgcctaaat cagttgttgc tcttttttct caccccggtg 40260
aactatctgc ccggtcaggt gatgcacttc aaaaagcctt tacagataaa gaggaattac 40320
ttaagcagca ggcatctaac cttcatgagc agaaaaaagc tggggtgata tttgaagctg 40380
aagaagttat cactctttta acttctgtgc ttaaaacgtc atctgcatca agaactagtt 40440
taagctcacg acatcagttt gctcctggag cgacagtatt gtataagggc gataaaatgg 40500
tgcttaacct ggacaggtct cgtgttccaa ctgagtgtat agagaaaatt gaggccattc 40560
ttaaggaact tgaaaagcca gcaccctgat gcgaccacgt tttagtctac gtttatctgt 40620
ctttacttaa tgtcctttgt tacaggccag aaagcataac tggcctgaat attctctctg 40680
ggcccactgt tccacttgta tcgtcggtct gataatcaga ctgggaccac ggtcccactc 40740
gtatcgtcgg tctgattatt agtctgggac cacggtccca ctcgtatcgt cggtctgatt 40800
attagtctgg gaccacggtc ccactcgtat cgtcggtctg ataatcagac tgggaccacg 40860
gtcccactcg tatcgtcggt ctgattatta gtctgggacc atggtcccac tcgtatcgtc 40920
ggtctgatta ttagtctggg accacggtcc cactcgtatc gtcggtctga ttattagtct 40980
ggaaccacgg tcccactcgt atcgtcggtc tgattattag tctgggacca cggtcccact 41040
cgtatcgtcg gtctgattat tagtctggga ccacgatccc actcgtgttg tcggtctgat 41100
tatcggtctg ggaccacggt cccacttgta ttgtcgatca gactatcagc gtgagactac 41160
gattccatca atgcctgtca agggcaagta ttgacatgtc gtcgtaacct gtagaacgga 41220
gtaacctcgg tgtgcggttg tatgcctgct gtggattgct gctgtgtcct gcttatccac 41280
aacattttgc gcacggttat gtggacaaaa tacctggtta cccaggccgt gccggcacgt 41340
taaccgggct gcatccgatg caagtgtgtc gctgtcgacg agctcgcgag ctcggacatg 41400
aggttgcccc gtattcagtg tcgctgattt gtattgtctg aagttgtttt tacgttaagt 41460
tgatgcagat caattaatac gatacctgcg tcataattga ttatttgacg tggtttgatg 41520
gcctccacgc acgttgtgat atgtagatga taatcattat cactttacgg gtcctttccg 41580
gtgatccgac aggttacggg gcggcgacct cgcgggtttt cgctatttat gaaaattttc 41640
cggtttaagg cgtttccgtt cttcttcgtc ataacttaat gtttttattt aaaataccct 41700
ctgaaaagaa aggaaacgac aggtgctgaa agcgagcttt ttggcctctg tcgtttcctt 41760
tctctgtttt tgtccgtgga atgaacaatg gaagtccgag ctcatcgcta ataacttcgt 41820
atagcataca ttatacgaag ttatattcga tgcggccgca aggggttcgc gtcagcgggt 41880
gttggcgggt gtcggggctg gcttaactat gcggcatcag agcagattgt actgagagtg 41940
caccatatgc ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc 42000
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 42060
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 42120
ttttcccagt cacgacgttg taaaacgacg gccagtgaat tgtaatacga ctcactatag 42180
ggcgaattcg agctcggtac ccggggatcc tcgtttaaac 42220
本開示は特許請求の範囲に記載の態様を包含する。
Claims (44)
- (a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片、及び
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片
を含むポリペプチドをコードするポリヌクレオチドであって、
宿主細胞において前記ポリペプチドの発現を指示する1つ以上の配列に作動可能に連結している、ポリヌクレオチド。 - 前記ポリペプチドが、配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90又は少なくとも100アミノ酸の少なくとも1個の断片をさらに含む、請求項1に記載のポリヌクレオチド。
- 前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも2個の断片
を含む、請求項1又は2に記載のポリヌクレオチド。 - 前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも3個の断片
を含む、請求項1~3のいずれか一項に記載のポリヌクレオチド。 - 前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも4個の断片
を含む、請求項1~4のいずれか一項に記載のポリヌクレオチド。 - 前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも5個の断片
を含む、請求項1~5のいずれか一項に記載のポリヌクレオチド。 - 前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも6個の断片
を含む、請求項1~6のいずれか一項に記載のポリヌクレオチド。 - 前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも7個の断片
を含む、請求項1~7のいずれか一項に記載のポリヌクレオチド。 - 前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも8個の断片
を含む、請求項1~8のいずれか一項に記載のポリヌクレオチド。 - 前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも9個の断片
を含む、請求項1~9のいずれか一項に記載のポリヌクレオチド。 - 前記ポリペプチドが、
(a)配列番号1のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(b)配列番号6のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(c)配列番号11のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、
(d)配列番号13のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片、又は
(e)配列番号21のうちの少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90若しくは少なくとも100アミノ酸の少なくとも10個の断片
を含む、請求項1~10のいずれか一項に記載のポリヌクレオチド。 - 配列番号1の断片が互いに隣接していない、請求項3から11のいずれか一項に記載のポリヌクレオチド。
- 配列番号6の断片が互いに隣接していない、請求項3から12のいずれか一項に記載のポリヌクレオチド。
- 配列番号11の断片が互いに隣接していない、請求項3から13のいずれか一項に記載のポリヌクレオチド。
- 配列番号13の断片が互いに隣接していない、請求項3から14のいずれか一項に記載のポリヌクレオチド。
- 配列番号21の断片が互いに隣接していない、請求項3から15のいずれか一項に記載のポリヌクレオチド。
- 前記ポリペプチドが、
(a)LMP1の第1及び第2の断片であって、前記LMP1の第1及び第2の断片は配列番号2~5からなる群から選択され、前記LMP1の第1及び第2の断片は前記ポリペプチドにおいて互いに隣接していない、前記LMP1の第1及び第2の断片、
(b)LMP2の第1及び第2の断片であって、前記LMP1の第1及び第2の断片は配列番号7~10からなる群から選択され、前記LMP2の第1及び第2の断片は前記ポリペプチドにおいて互いに隣接していない、前記LMP2の第1及び第2の断片、
(c)配列番号12からなるEBNA1の断片、並びに
(d)EBNA3Aの第1及び第2の断片であって、前記EBNA3Aの第1及び第2の断片は配列番号14~20からなる群から選択され、前記EBNA3Aの第1及び第2の断片は前記ポリペプチドにおいて互いに隣接していない、前記EBNA3Aの第1及び第2の断片
を含む、請求項1から16のいずれか一項に記載のポリヌクレオチド。 - 前記ポリペプチドが、
(a)配列番号2からなるLMP1の第1の断片、
(b)配列番号3からなるLMP1の第2の断片、
(c)配列番号4からなるLMP1の第3の断片、
(d)配列番号5からなるLMP1の第4の断片、
(e)配列番号7からなるLMP2の第1の断片、
(f)配列番号8からなるLMP2の第2の断片、
(g)配列番号9からなるLMP2の第3の断片、
(h)配列番号10からなるLMP2の第4の断片、
(i)配列番号12からなるEBNA1の第1の断片、
(j)配列番号14からなるEBNA3Aの第1の断片、
(k)配列番号15からなるEBNA3Aの第2の断片、
(l)配列番号16からなるEBNA3Aの第3の断片、
(m)配列番号17からなるEBNA3Aの第4の断片、
(n)配列番号18からなるEBNA3Aの第5の断片、
(o)配列番号19からなるEBNA3Aの第6の断片、及び
(p)配列番号20からなるEBNA3Aの第7の断片
を含み、
第1、第2、第3及び第4のLMP1断片が互いに隣接していない、第1、第2、第3及び第4のLMP2断片が互いに隣接していない、並びに第1、第2、第3、第4、第5、第6、及び第7のEBNA3A断片が互いに隣接していない、
請求項1から17のいずれか一項に記載のポリヌクレオチド。 - 前記ポリペプチドが、
(a)配列番号22からなるZEBRAの第1の断片、及び
(b)配列番号23からなるZEBRAの第2の断片
をさらに含み、
第1及び第2のZEBRA断片が互いに隣接していない、請求項17又は18に記載のポリヌクレオチド。 - 前記ポリペプチドが、配列番号24又は配列番号26に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である、請求項1~19のいずれか一項に記載のポリヌクレオチド。
- 断片が免疫原性断片である、請求項1~20のいずれか一項に記載のポリヌクレオチド。
- 請求項1~21のいずれか一項に記載のポリヌクレオチドを含むベクター。
- アデノウイルスベクター又はワクシニアウイルスベクターである、請求項22に記載のベクター。
- 非ヒトサルアデノウイルスベクターである、請求項22又は23に記載のベクター。
- 非ヒトサルアデノウイルスベクターが、チンパンジーアデノウイルスベクターである、請求項24に記載のベクター。
- 改変ワクシニアアンカラベクターである、請求項22又は23に記載のベクター。
- 配列番号50に対して少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%同一である核酸配列を含むChAd155-EBV-L発現ベクターである、請求項22から25のいずれか一項に記載のベクター。
- 配列番号51と少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%又は少なくとも99%同一である核酸配列を含むChAd155-EBV-LLy発現ベクターである、請求項22から25のいずれか一項に記載のベクター。
- 請求項1から21のいずれか一項に記載のポリヌクレオチド又は請求項22から28のいずれか一項に記載のベクターによってコードされたポリペプチド。
- 配列番号24又は配列番号26に対して少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%又は少なくとも99%同一である、請求項29に記載のポリペプチド。
- 請求項1から21のいずれか一項に記載のポリヌクレオチド、請求項22から28のいずれか一項に記載のベクター、又は請求項29若しくは30に記載のポリペプチド、及び薬学的に許容される賦形剤を含む免疫原性組成物。
- アジュバントをさらに含む、請求項31に記載の免疫原性組成物。
- エプスタインバールウイルス感染によって引き起こされる疾患の処置又は予防のための医薬の製造における、請求項1から21のいずれか一項に記載のポリヌクレオチド、請求項22から28のいずれか一項に記載のベクター、請求項29若しくは30に記載のポリペプチド、又は請求項31若しくは32に記載の免疫原性組成物の使用。
- エプスタインバールウイルス感染によって引き起こされる疾患の処置又は予防において使用するための、請求項1から21のいずれか一項に記載のポリヌクレオチド、請求項22から28のいずれか一項に記載のベクター、請求項29若しくは30に記載のポリペプチド、又は請求項31若しくは32に記載の免疫原性組成物。
- EBV抗原を発現することが可能である組換えウイルス粒子を生成する方法であって、宿主細胞において請求項22から28のいずれか一項に記載のベクターを発現させることを含む方法。
- 対象における免疫応答を誘導する方法であって、請求項1から21のいずれか一項に記載のポリヌクレオチド、請求項22から28のいずれか一項に記載のベクター、請求項29若しくは30に記載のポリペプチド、又は請求項31若しくは32に記載の免疫原性組成物を対象に投与することを含む方法。
- 対象が、エプスタインバールウイルス血清陰性である、請求項36に記載の方法。
- 対象が、エプスタインバールウイルス血清陽性である、請求項36に記載の方法。
- 対象におけるEBV関連疾患を処置又は予防する方法であって、請求項1から21のいずれか一項に記載のポリヌクレオチド、請求項22から28のいずれか一項に記載のベクター、請求項29若しくは30に記載のポリペプチド、又は請求項31若しくは32に記載の免疫原性組成物を対象に投与することを含む方法。
- EBV関連疾患が、EBV関連自己免疫疾患又はEBV関連悪性腫瘍である、請求項39に記載の方法。
- EBV関連疾患が、多発性硬化症、関節リウマチ及び全身性ループスエリテマトーデスからなる群から選択される、請求項39に記載の方法。
- 対象における免疫応答を誘導する方法であって、
(a)請求項1から21のいずれか一項に記載のポリヌクレオチドを含むアデノウイルスベクターを投与するステップ、及び
(b)請求項1から21のいずれか一項に記載のポリヌクレオチドを含むワクシニアウイルスベクターを投与するステップ
を含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法。 - 対象におけるEBV関連疾患を処置又は予防する方法であって、
(a)請求項1から21のいずれか一項に記載のポリヌクレオチドを含むアデノウイルスベクターを投与するステップ、及び
(b)請求項1から21のいずれか一項に記載のポリヌクレオチドを含むワクシニアウイルスベクターを投与するステップ
を含み、
ステップ(a)及び(b)がいずれかの順序で行われる、方法。 - ステップ(b)が、ステップ(a)の1、2、3、4、5、6、7、8、9、10、11、12週後又はそれより長い週数後に行われる、請求項42又は43に記載の方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762608038P | 2017-12-20 | 2017-12-20 | |
US62/608,038 | 2017-12-20 | ||
JP2020534609A JP2021507712A (ja) | 2017-12-20 | 2018-12-14 | エプスタインバールウイルス抗原構築物 |
PCT/IB2018/060101 WO2019123169A1 (en) | 2017-12-20 | 2018-12-14 | Epstein-barr virus antigen constructs |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020534609A Division JP2021507712A (ja) | 2017-12-20 | 2018-12-14 | エプスタインバールウイルス抗原構築物 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023145678A true JP2023145678A (ja) | 2023-10-11 |
Family
ID=65363319
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020534609A Pending JP2021507712A (ja) | 2017-12-20 | 2018-12-14 | エプスタインバールウイルス抗原構築物 |
JP2023126388A Pending JP2023145678A (ja) | 2017-12-20 | 2023-08-02 | エプスタインバールウイルス抗原構築物 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020534609A Pending JP2021507712A (ja) | 2017-12-20 | 2018-12-14 | エプスタインバールウイルス抗原構築物 |
Country Status (13)
Country | Link |
---|---|
US (2) | US11773139B2 (ja) |
EP (1) | EP3728291A1 (ja) |
JP (2) | JP2021507712A (ja) |
KR (1) | KR20200101394A (ja) |
CN (1) | CN111801342A (ja) |
AU (1) | AU2018392884B2 (ja) |
BR (1) | BR112020012361A2 (ja) |
CA (1) | CA3085975A1 (ja) |
EA (1) | EA202091178A1 (ja) |
IL (1) | IL275296A (ja) |
MX (1) | MX2020006225A (ja) |
SG (1) | SG11202005451SA (ja) |
WO (1) | WO2019123169A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111394376B (zh) * | 2020-03-30 | 2023-04-28 | 济宁医学院 | 一种融合基因bfna、重组腺病毒及其制备方法和应用 |
WO2023064612A2 (en) * | 2021-10-15 | 2023-04-20 | BioNTech SE | Pharmaceutical compositions for delivery of viral antigens and related methods |
WO2024003239A1 (en) * | 2022-06-29 | 2024-01-04 | Bavarian Nordic A/S | RECOMBINANT MODIFIED saRNA (VRP) AND VACCINIA VIRUS ANKARA (MVA) PRIME-BOOST REGIMEN |
WO2024084091A1 (en) | 2022-10-21 | 2024-04-25 | Medizinische Universität Wien | Materials and methods to treat epstein-barr virus (ebv) and ebv-induced diseases |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4427117C1 (de) * | 1994-07-30 | 1995-10-19 | Gsf Forschungszentrum Umwelt | Plasmid und damit transfizierte Zellen |
US5716845A (en) | 1995-07-20 | 1998-02-10 | Wisconsin Alumni Research Foundation | Immortalized lymphocytes for production of viral-free proteins |
CA2154854C (en) * | 1994-07-30 | 2006-03-14 | William M. Sugden | Immortalized lymphocytes for production of viral-free proteins |
US6083716A (en) | 1996-09-06 | 2000-07-04 | The Trustees Of The University Of Pennsylvania | Chimpanzee adenovirus vectors |
AU756081B2 (en) * | 1997-07-10 | 2003-01-02 | Council Of The Queensland Institute Of Medical Research, The | CTL epitopes from EBV |
US7445924B2 (en) | 2000-11-23 | 2008-11-04 | Bavarian Nordic A/S | Modified Vaccinia Ankara virus variant and cultivation method |
ES2256323T5 (es) | 2000-11-23 | 2016-11-21 | Bavarian Nordic A/S | Variante del virus Vaccinia Ankara Modificado |
HU228327B1 (en) | 2001-06-22 | 2013-03-28 | Wistar Inst | Methods of inducing a cytotoxic immune response and recombinant simian adenovirus compositions useful therein |
ATE449105T1 (de) | 2004-01-23 | 2009-12-15 | Angeletti P Ist Richerche Bio | Impfstoffträger für schimpansen-adenovirus |
JP4896021B2 (ja) | 2004-05-21 | 2012-03-14 | ノバルティス ヴァクシンズ アンド ダイアグノスティクス, インコーポレイテッド | 呼吸器系病原体ワクチンのためのアルファウイルスベクター |
FR2881746B1 (fr) * | 2005-02-07 | 2007-04-13 | Centre Nat Rech Scient | Epitopes t cd4+des antigenes de latence de type i et ii du virus epstein-barr aptes a etre reconnus par la majorite des individus de la population caucasienne et leurs applications |
JP4824389B2 (ja) * | 2005-10-28 | 2011-11-30 | 株式会社医学生物学研究所 | エプスタイン−バールウイルス感染細胞を特異的に攻撃する細胞傷害性t細胞エピトープペプチド及びその用途 |
AU2006338570B2 (en) | 2005-11-18 | 2013-07-11 | The Ohio State University Research Foundation | Viral gene products and methods for vaccination to prevent viral associated diseases |
CA2632402A1 (en) | 2005-12-06 | 2007-06-14 | Savine Therapeutics Pty Ltd | Treatment of epstein-barr virus-associated diseases |
US20090324630A1 (en) * | 2008-04-21 | 2009-12-31 | Jensen Michael C | Fusion multiviral chimeric antigen |
SG172935A1 (en) | 2009-02-02 | 2011-08-29 | Okairos Ag | Simian adenovirus nucleic acid- and amino acid-sequences, vectors containing same, and uses thereof |
WO2011005799A2 (en) | 2009-07-06 | 2011-01-13 | Novartis Ag | Self replicating rna molecules and uses thereof |
ES2770335T3 (es) | 2010-07-06 | 2020-07-01 | Glaxosmithkline Biologicals Sa | Administración de ARN para desencadenar múltiples vías inmunológicas |
EP4180057A1 (en) | 2010-07-06 | 2023-05-17 | GlaxoSmithKline Biologicals S.A. | Virion-like delivery particles for self-replicating rna molecules |
WO2012048817A2 (en) | 2010-10-15 | 2012-04-19 | Bavarian Nordic A/S | Recombinant modified vaccinia virus ankara influenza vaccine |
WO2012089231A1 (en) | 2010-12-30 | 2012-07-05 | Okairòs Ag | Paramyxovirus vaccines |
JP6091435B2 (ja) | 2011-02-22 | 2017-03-08 | カリフォルニア インスティチュート オブ テクノロジー | アデノ随伴ウイルス(aav)ベクターを用いたタンパク質の送達 |
CN110038135B (zh) * | 2011-03-17 | 2021-03-05 | 伯明翰大学 | 重新定向的免疫治疗 |
JP2014522842A (ja) | 2011-07-06 | 2014-09-08 | ノバルティス アーゲー | 免疫原性組み合わせ組成物およびその使用 |
EP2729168A2 (en) | 2011-07-06 | 2014-05-14 | Novartis AG | Immunogenic compositions and uses thereof |
CA3158572A1 (en) | 2012-08-01 | 2014-02-06 | Bavarian Nordic A/S | Recombinant modified vaccinia virus ankara (mva) respiratory syncytial virus (rsv) vaccine |
EP3872097A1 (en) * | 2012-10-19 | 2021-09-01 | The Council Of The Queensland Institute Of Medical Research | Improved human herpesvirus immunotherapy |
GB201312133D0 (en) * | 2013-07-05 | 2013-08-21 | Univ Birmingham | Immunotherapy |
EP3054971B1 (en) * | 2013-10-11 | 2021-03-10 | The United States of America, represented by the Secretary, Department of Health and Human Services | Epstein-barr virus vaccines |
EP3888676A1 (en) | 2014-06-13 | 2021-10-06 | GlaxoSmithKline Biologicals S.A. | Immunogenic combinations |
WO2016149384A1 (en) * | 2015-03-18 | 2016-09-22 | University Of Massachusetts | Virus-like particle compositions and vaccines against epstein-barr virus infection and disease |
CN108025058B (zh) * | 2015-06-12 | 2022-12-16 | 葛兰素史密丝克莱恩生物有限公司 | 腺病毒多核苷酸和多肽 |
WO2019055887A1 (en) * | 2017-09-16 | 2019-03-21 | City Of Hope | PSEUDO-VIRAL PARTICLES OF MULTIVALENT EPSTEIN-BARR VIRUS AND USES THEREOF |
-
2018
- 2018-12-14 US US16/770,963 patent/US11773139B2/en active Active
- 2018-12-14 MX MX2020006225A patent/MX2020006225A/es unknown
- 2018-12-14 EP EP18845444.1A patent/EP3728291A1/en active Pending
- 2018-12-14 JP JP2020534609A patent/JP2021507712A/ja active Pending
- 2018-12-14 CN CN201880089867.5A patent/CN111801342A/zh active Pending
- 2018-12-14 WO PCT/IB2018/060101 patent/WO2019123169A1/en unknown
- 2018-12-14 BR BR112020012361-7A patent/BR112020012361A2/pt unknown
- 2018-12-14 CA CA3085975A patent/CA3085975A1/en active Pending
- 2018-12-14 SG SG11202005451SA patent/SG11202005451SA/en unknown
- 2018-12-14 EA EA202091178A patent/EA202091178A1/ru unknown
- 2018-12-14 AU AU2018392884A patent/AU2018392884B2/en not_active Ceased
- 2018-12-14 KR KR1020207020466A patent/KR20200101394A/ko not_active Application Discontinuation
-
2020
- 2020-06-11 IL IL275296A patent/IL275296A/en unknown
-
2023
- 2023-07-25 US US18/358,350 patent/US20240076318A1/en active Pending
- 2023-08-02 JP JP2023126388A patent/JP2023145678A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
MX2020006225A (es) | 2020-12-07 |
SG11202005451SA (en) | 2020-07-29 |
KR20200101394A (ko) | 2020-08-27 |
US20210198321A1 (en) | 2021-07-01 |
CA3085975A1 (en) | 2019-06-27 |
IL275296A (en) | 2020-07-30 |
EP3728291A1 (en) | 2020-10-28 |
US20240076318A1 (en) | 2024-03-07 |
JP2021507712A (ja) | 2021-02-25 |
AU2018392884A1 (en) | 2020-06-25 |
US11773139B2 (en) | 2023-10-03 |
EA202091178A1 (ru) | 2020-09-01 |
WO2019123169A1 (en) | 2019-06-27 |
AU2018392884B2 (en) | 2021-11-11 |
BR112020012361A2 (pt) | 2020-11-24 |
CN111801342A (zh) | 2020-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019271972B2 (en) | Adenovirus polynucleotides and polypeptides | |
BE1023916B1 (fr) | Nouvel adenovirus | |
AU2019204982B2 (en) | Recombinant HCMV and RhCMV Vectors and Uses Thereof | |
RU2762854C2 (ru) | Последовательности нуклеиновых кислот и аминокислотные последовательности аденовирусов человекообразных обезьян, исключая человека, содержащие их векторы, и их применения | |
KR101763093B1 (ko) | 시미안 아데노바이러스 핵산- 및 아미노산-서열, 이를 포함하는 벡터 및 이의 용도 | |
JP2023145678A (ja) | エプスタインバールウイルス抗原構築物 | |
AU2011332025B2 (en) | Subfamily E simian adenoviruses A1321, A1325, A1295, A1309 and A1322 and uses thereof | |
DK2753355T3 (en) | ONCOLYTIC HERP SIMPLEX VIRUSES AND THERAPEUTIC APPLICATIONS THEREOF | |
AU2015289560B2 (en) | Human cytomegalovirus comprising exogenous antigens | |
JP2024073576A (ja) | 改変アデノウイルス | |
KR20140057654A (ko) | Cmv용 백신으로서의 조건부 복제 시토메갈로바이러스 | |
KR20200066349A (ko) | 복제 가능 아데노바이러스 벡터 | |
KR20230031929A (ko) | 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도 | |
KR20210053923A (ko) | 항종양 면역 반응을 자극하는 키메라 종양 용해성 허피스바이러스 | |
CN116940589A (zh) | 重组sars-cov-2疫苗 | |
CN114761030A (zh) | 具有诱导的抗肿瘤免疫的溶瘤病毒疗法 | |
NL2023464B1 (en) | Oncolytic Non-human adenoviruses and uses thereof | |
RU2800085C2 (ru) | Химерный онколитический вирус герпеса, стимулирующий противоопухолевый иммунный ответ | |
KR102032446B1 (ko) | 재조합 단순 헤르페스 바이러스의 제조를 위한 벡터 | |
DK2391638T3 (en) | Abeadenovirus nucleic acid and amino acid sequences, vectors containing them, and uses thereof. | |
CN114269363A (zh) | 用于hiv疫苗应用的复制缺陷型腺病毒载体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230816 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231002 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240625 |