KR20240047977A - 탈최적화된 sars-cov-2 변이체 및 그의 방법 및 용도 - Google Patents
탈최적화된 sars-cov-2 변이체 및 그의 방법 및 용도 Download PDFInfo
- Publication number
- KR20240047977A KR20240047977A KR1020247004613A KR20247004613A KR20240047977A KR 20240047977 A KR20240047977 A KR 20240047977A KR 1020247004613 A KR1020247004613 A KR 1020247004613A KR 20247004613 A KR20247004613 A KR 20247004613A KR 20240047977 A KR20240047977 A KR 20240047977A
- Authority
- KR
- South Korea
- Prior art keywords
- various embodiments
- seq
- cov
- sars
- variant
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 70
- 241001678559 COVID-19 virus Species 0.000 claims abstract description 524
- 241000700605 Viruses Species 0.000 claims abstract description 128
- 230000028993 immune response Effects 0.000 claims abstract description 58
- 230000001939 inductive effect Effects 0.000 claims abstract description 38
- 108091033319 polynucleotide Proteins 0.000 claims description 642
- 102000040430 polynucleotide Human genes 0.000 claims description 642
- 239000002157 polynucleotide Substances 0.000 claims description 642
- 101710198474 Spike protein Proteins 0.000 claims description 407
- 229940096437 Protein S Drugs 0.000 claims description 405
- 108091026890 Coding region Proteins 0.000 claims description 375
- 230000035772 mutation Effects 0.000 claims description 245
- 239000000203 mixture Substances 0.000 claims description 230
- 108020004705 Codon Proteins 0.000 claims description 192
- 239000002773 nucleotide Substances 0.000 claims description 175
- 239000012634 fragment Substances 0.000 claims description 174
- 125000003729 nucleotide group Chemical group 0.000 claims description 174
- 229960005486 vaccine Drugs 0.000 claims description 114
- 210000004027 cell Anatomy 0.000 claims description 94
- 238000012217 deletion Methods 0.000 claims description 77
- 230000037430 deletion Effects 0.000 claims description 77
- 108090000623 proteins and genes Proteins 0.000 claims description 67
- 108010067390 Viral Proteins Proteins 0.000 claims description 63
- 238000006467 substitution reaction Methods 0.000 claims description 55
- 229920001184 polypeptide Polymers 0.000 claims description 44
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 44
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 44
- 238000007792 addition Methods 0.000 claims description 43
- 241000699800 Cricetinae Species 0.000 claims description 38
- 230000002829 reductive effect Effects 0.000 claims description 33
- 241000711573 Coronaviridae Species 0.000 claims description 32
- 230000003053 immunization Effects 0.000 claims description 30
- 150000007523 nucleic acids Chemical class 0.000 claims description 30
- 238000002649 immunization Methods 0.000 claims description 29
- 108700010070 Codon Usage Proteins 0.000 claims description 28
- 102000004169 proteins and genes Human genes 0.000 claims description 25
- 102000004961 Furin Human genes 0.000 claims description 24
- 108090001126 Furin Proteins 0.000 claims description 24
- 238000003776 cleavage reaction Methods 0.000 claims description 24
- 230000007017 scission Effects 0.000 claims description 24
- 230000014509 gene expression Effects 0.000 claims description 20
- 102000039446 nucleic acids Human genes 0.000 claims description 19
- 108020004707 nucleic acids Proteins 0.000 claims description 19
- 229940031348 multivalent vaccine Drugs 0.000 claims description 17
- 210000003501 vero cell Anatomy 0.000 claims description 17
- 230000001681 protective effect Effects 0.000 claims description 16
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 11
- 230000001965 increasing effect Effects 0.000 claims description 10
- 238000004519 manufacturing process Methods 0.000 claims description 10
- 239000007923 nasal drop Substances 0.000 claims description 9
- 239000007922 nasal spray Substances 0.000 claims description 9
- 239000003937 drug carrier Substances 0.000 claims description 7
- 229940097496 nasal spray Drugs 0.000 claims description 6
- 210000003734 kidney Anatomy 0.000 claims description 4
- 125000003275 alpha amino acid group Chemical group 0.000 claims 3
- 208000015181 infectious disease Diseases 0.000 abstract description 43
- 150000001413 amino acids Chemical group 0.000 description 139
- 239000002299 complementary DNA Substances 0.000 description 127
- 229940125580 COVI-VAC Drugs 0.000 description 123
- 235000001014 amino acid Nutrition 0.000 description 96
- 230000003612 virological effect Effects 0.000 description 81
- 108020004414 DNA Proteins 0.000 description 71
- 241000282414 Homo sapiens Species 0.000 description 47
- 230000000875 corresponding effect Effects 0.000 description 44
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 37
- 241001465754 Metazoa Species 0.000 description 25
- 238000010790 dilution Methods 0.000 description 24
- 239000012895 dilution Substances 0.000 description 24
- 238000000338 in vitro Methods 0.000 description 24
- 108020000999 Viral RNA Proteins 0.000 description 22
- 230000002238 attenuated effect Effects 0.000 description 21
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 20
- 238000006243 chemical reaction Methods 0.000 description 20
- 230000002458 infectious effect Effects 0.000 description 20
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 19
- 239000012091 fetal bovine serum Substances 0.000 description 19
- LHEJDBBHZGISGW-UHFFFAOYSA-N 5-fluoro-3-(3-oxo-1h-2-benzofuran-1-yl)-1h-pyrimidine-2,4-dione Chemical compound O=C1C(F)=CNC(=O)N1C1C2=CC=CC=C2C(=O)O1 LHEJDBBHZGISGW-UHFFFAOYSA-N 0.000 description 18
- 238000003556 assay Methods 0.000 description 17
- 210000002966 serum Anatomy 0.000 description 17
- 241000282326 Felis catus Species 0.000 description 16
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 16
- 235000018102 proteins Nutrition 0.000 description 14
- 239000006228 supernatant Substances 0.000 description 14
- 238000013518 transcription Methods 0.000 description 14
- 230000035897 transcription Effects 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 13
- 238000004113 cell culture Methods 0.000 description 13
- 238000003757 reverse transcription PCR Methods 0.000 description 13
- 210000004072 lung Anatomy 0.000 description 12
- 239000000463 material Substances 0.000 description 12
- 241000282412 Homo Species 0.000 description 11
- 239000002671 adjuvant Substances 0.000 description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 11
- 239000002609 medium Substances 0.000 description 11
- 229940125575 vaccine candidate Drugs 0.000 description 11
- 229930006000 Sucrose Natural products 0.000 description 10
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 10
- 239000005720 sucrose Substances 0.000 description 10
- 238000011282 treatment Methods 0.000 description 10
- 208000025721 COVID-19 Diseases 0.000 description 9
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 9
- 238000011534 incubation Methods 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 239000002953 phosphate buffered saline Substances 0.000 description 9
- 238000003752 polymerase chain reaction Methods 0.000 description 9
- 230000009467 reduction Effects 0.000 description 9
- 230000002441 reversible effect Effects 0.000 description 9
- 238000012163 sequencing technique Methods 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 230000014616 translation Effects 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000004520 electroporation Methods 0.000 description 8
- 230000012010 growth Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 239000004471 Glycine Substances 0.000 description 7
- 102000011931 Nucleoproteins Human genes 0.000 description 7
- 108010061100 Nucleoproteins Proteins 0.000 description 7
- 108020004566 Transfer RNA Proteins 0.000 description 7
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 208000035475 disorder Diseases 0.000 description 7
- 241001493065 dsRNA viruses Species 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 229940100662 nasal drops Drugs 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 239000004094 surface-active agent Substances 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 241000023308 Acca Species 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 238000011529 RT qPCR Methods 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 239000011543 agarose gel Substances 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 239000000969 carrier Substances 0.000 description 6
- 238000012258 culturing Methods 0.000 description 6
- 229940124590 live attenuated vaccine Drugs 0.000 description 6
- 229940023012 live-attenuated vaccine Drugs 0.000 description 6
- 238000007857 nested PCR Methods 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 230000007505 plaque formation Effects 0.000 description 6
- 238000012809 post-inoculation Methods 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 241000894007 species Species 0.000 description 6
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- 108091006905 Human Serum Albumin Proteins 0.000 description 5
- 102000008100 Human Serum Albumin Human genes 0.000 description 5
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 5
- 101710137500 T7 RNA polymerase Proteins 0.000 description 5
- 230000004075 alteration Effects 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 5
- -1 but not limited to Chemical compound 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 5
- 230000002354 daily effect Effects 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 238000011081 inoculation Methods 0.000 description 5
- 230000003472 neutralizing effect Effects 0.000 description 5
- 238000011321 prophylaxis Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000002255 vaccination Methods 0.000 description 5
- 230000002747 voluntary effect Effects 0.000 description 5
- 101150011571 BSL2 gene Proteins 0.000 description 4
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 4
- 241000494545 Cordyline virus 2 Species 0.000 description 4
- PMATZTZNYRCHOR-CGLBZJNRSA-N Cyclosporin A Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O PMATZTZNYRCHOR-CGLBZJNRSA-N 0.000 description 4
- 108010010803 Gelatin Proteins 0.000 description 4
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 4
- 241000699673 Mesocricetus auratus Species 0.000 description 4
- QJJXYPPXXYFBGM-LFZNUXCKSA-N Tacrolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1\C=C(/C)[C@@H]1[C@H](C)[C@@H](O)CC(=O)[C@H](CC=C)/C=C(C)/C[C@H](C)C[C@H](OC)[C@H]([C@H](C[C@H]2C)OC)O[C@@]2(O)C(=O)C(=O)N2CCCC[C@H]2C(=O)O1 QJJXYPPXXYFBGM-LFZNUXCKSA-N 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 239000013553 cell monolayer Substances 0.000 description 4
- 239000013078 crystal Substances 0.000 description 4
- 230000000120 cytopathologic effect Effects 0.000 description 4
- 230000029087 digestion Effects 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 239000008273 gelatin Substances 0.000 description 4
- 229920000159 gelatin Polymers 0.000 description 4
- 235000019322 gelatine Nutrition 0.000 description 4
- 235000011852 gelatine desserts Nutrition 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 238000002887 multiple sequence alignment Methods 0.000 description 4
- 238000006386 neutralization reaction Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 230000008707 rearrangement Effects 0.000 description 4
- 108010061238 threonyl-glycine Proteins 0.000 description 4
- 239000003981 vehicle Substances 0.000 description 4
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 241000271566 Aves Species 0.000 description 3
- 241000283707 Capra Species 0.000 description 3
- 241000282693 Cercopithecidae Species 0.000 description 3
- 241000282552 Chlorocebus aethiops Species 0.000 description 3
- 108010036949 Cyclosporine Proteins 0.000 description 3
- HKVAMNSJSFKALM-GKUWKFKPSA-N Everolimus Chemical compound C1C[C@@H](OCCO)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 HKVAMNSJSFKALM-GKUWKFKPSA-N 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241000282339 Mustela Species 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 206010037660 Pyrexia Diseases 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- RIIWUGSYXOBDMC-UHFFFAOYSA-N benzene-1,2-diamine;hydron;dichloride Chemical compound Cl.Cl.NC1=CC=CC=C1N RIIWUGSYXOBDMC-UHFFFAOYSA-N 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000009089 cytolysis Effects 0.000 description 3
- 239000008121 dextrose Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 230000036039 immunity Effects 0.000 description 3
- 230000001506 immunosuppresive effect Effects 0.000 description 3
- 238000000126 in silico method Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000002483 medication Methods 0.000 description 3
- 239000002736 nonionic surfactant Substances 0.000 description 3
- 239000005022 packaging material Substances 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 239000000244 polyoxyethylene sorbitan monooleate Substances 0.000 description 3
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 3
- 229920000053 polysorbate 80 Polymers 0.000 description 3
- 229940068968 polysorbate 80 Drugs 0.000 description 3
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000007480 sanger sequencing Methods 0.000 description 3
- 238000013207 serial dilution Methods 0.000 description 3
- 230000037432 silent mutation Effects 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 230000002269 spontaneous effect Effects 0.000 description 3
- 239000003381 stabilizer Substances 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 239000011534 wash buffer Substances 0.000 description 3
- 230000004580 weight loss Effects 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 2
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 2
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 2
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- VOVIALXJUBGFJZ-KWVAZRHASA-N Budesonide Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@@H]2[C@@H]1[C@@H]1C[C@H]3OC(CCC)O[C@@]3(C(=O)CO)[C@@]1(C)C[C@@H]2O VOVIALXJUBGFJZ-KWVAZRHASA-N 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 241000700198 Cavia Species 0.000 description 2
- 241000288673 Chiroptera Species 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 108010008165 Etanercept Proteins 0.000 description 2
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 2
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 2
- 101100438614 Homo sapiens CPB1 gene Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 2
- 102000051628 Interleukin-1 receptor antagonist Human genes 0.000 description 2
- 108700021006 Interleukin-1 receptor antagonist Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- 108700001237 Nucleic Acid-Based Vaccines Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 102000002278 Ribosomal Proteins Human genes 0.000 description 2
- 108010000605 Ribosomal Proteins Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 241000315672 SARS coronavirus Species 0.000 description 2
- 238000011579 SCID mouse model Methods 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 241000270295 Serpentes Species 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 102000013530 TOR Serine-Threonine Kinases Human genes 0.000 description 2
- 108010065917 TOR Serine-Threonine Kinases Proteins 0.000 description 2
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- KXUKIBHIVRYOIP-ZKWXMUAHSA-N Val-Asp-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KXUKIBHIVRYOIP-ZKWXMUAHSA-N 0.000 description 2
- UZQJVUCHXGYFLQ-AYDHOLPZSA-N [(2s,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-4-[(2r,3r,4s,5r,6r)-4-[(2s,3r,4s,5r,6r)-3,5-dihydroxy-6-(hydroxymethyl)-4-[(2s,3r,4s,5s,6r)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]oxy-3,5-dihydroxy-6-(hydroxymethyl)oxan-2-yl]oxy-3,5-dihydroxy-6-(hy Chemical compound O([C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1[C@H](O)[C@@H](CO)O[C@H]([C@@H]1O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@]([C@@]3(CC[C@H]2[C@@]1(C=O)C)C)(C)CC(O)[C@]1(CCC(CC14)(C)C)C(=O)O[C@H]1[C@@H]([C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O[C@H]4[C@@H]([C@@H](O[C@H]5[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O5)O)[C@H](O)[C@@H](CO)O4)O)[C@H](O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)O)[C@H](O)[C@@H](CO)O1)O)[C@@H]1O[C@H](CO)[C@@H](O)[C@H](O)[C@H]1O UZQJVUCHXGYFLQ-AYDHOLPZSA-N 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- ZVDPYSVOZFINEE-BQBZGAKWSA-N alpha-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O ZVDPYSVOZFINEE-BQBZGAKWSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 230000036760 body temperature Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 239000001913 cellulose Substances 0.000 description 2
- 229920002678 cellulose Polymers 0.000 description 2
- 235000010980 cellulose Nutrition 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000011259 co-electroporation Methods 0.000 description 2
- 239000012228 culture supernatant Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 239000003018 immunosuppressive agent Substances 0.000 description 2
- 229940124589 immunosuppressive drug Drugs 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 239000002054 inoculum Substances 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 229960005435 ixekizumab Drugs 0.000 description 2
- VHOGYURTWQBHIL-UHFFFAOYSA-N leflunomide Chemical compound O1N=CC(C(=O)NC=2C=CC(=CC=2)C(F)(F)F)=C1C VHOGYURTWQBHIL-UHFFFAOYSA-N 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- HPNSFSBZBAHARI-UHFFFAOYSA-N micophenolic acid Natural products OC1=C(CC=C(C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-UHFFFAOYSA-N 0.000 description 2
- HPNSFSBZBAHARI-RUDMXATFSA-N mycophenolic acid Chemical compound OC1=C(C\C=C(/C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-RUDMXATFSA-N 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 210000000956 olfactory bulb Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002685 pulmonary effect Effects 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 229960004641 rituximab Drugs 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 238000002922 simulated annealing Methods 0.000 description 2
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- RVLOMLVNNBWRSR-KNIFDHDWSA-N (2s)-2-aminopropanoic acid;(2s)-2,6-diaminohexanoic acid Chemical compound C[C@H](N)C(O)=O.NCCCC[C@H](N)C(O)=O RVLOMLVNNBWRSR-KNIFDHDWSA-N 0.000 description 1
- DRHZYJAUECRAJM-DWSYSWFDSA-N (2s,3s,4s,5r,6r)-6-[[(3s,4s,4ar,6ar,6bs,8r,8ar,12as,14ar,14br)-8a-[(2s,3r,4s,5r,6r)-3-[(2s,3r,4s,5r,6s)-5-[(2s,3r,4s,5r)-4-[(2s,3r,4r)-3,4-dihydroxy-4-(hydroxymethyl)oxolan-2-yl]oxy-3,5-dihydroxyoxan-2-yl]oxy-3,4-dihydroxy-6-methyloxan-2-yl]oxy-5-[(3s,5s, Chemical compound O([C@H]1[C@H](O)[C@H](O[C@H]([C@@H]1O[C@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)O[C@H]1CC[C@]2(C)[C@H]3CC=C4[C@@H]5CC(C)(C)CC[C@@]5([C@@H](C[C@@]4(C)[C@]3(C)CC[C@H]2[C@@]1(C=O)C)O)C(=O)O[C@@H]1O[C@H](C)[C@@H]([C@@H]([C@H]1O[C@H]1[C@@H]([C@H](O)[C@@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@](O)(CO)CO3)O)[C@H](O)CO2)O)[C@H](C)O1)O)O)OC(=O)C[C@@H](O)C[C@H](OC(=O)C[C@@H](O)C[C@@H]([C@@H](C)CC)O[C@H]1[C@@H]([C@@H](O)[C@H](CO)O1)O)[C@@H](C)CC)C(O)=O)[C@@H]1OC[C@@H](O)[C@H](O)[C@H]1O DRHZYJAUECRAJM-DWSYSWFDSA-N 0.000 description 1
- HMLGSIZOMSVISS-ONJSNURVSA-N (7r)-7-[[(2z)-2-(2-amino-1,3-thiazol-4-yl)-2-(2,2-dimethylpropanoyloxymethoxyimino)acetyl]amino]-3-ethenyl-8-oxo-5-thia-1-azabicyclo[4.2.0]oct-2-ene-2-carboxylic acid Chemical compound N([C@@H]1C(N2C(=C(C=C)CSC21)C(O)=O)=O)C(=O)\C(=N/OCOC(=O)C(C)(C)C)C1=CSC(N)=N1 HMLGSIZOMSVISS-ONJSNURVSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- 101150072531 10 gene Proteins 0.000 description 1
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 1
- NWFLONJLUJYCNS-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-phenylpropanoyl)amino]acetyl]amino]acetyl]amino]-3-phenylpropanoic acid Chemical compound C=1C=CC=CC=1CC(C(O)=O)NC(=O)CNC(=O)CNC(=O)C(N)CC1=CC=CC=C1 NWFLONJLUJYCNS-UHFFFAOYSA-N 0.000 description 1
- 101800000535 3C-like proteinase Proteins 0.000 description 1
- 101800002396 3C-like proteinase nsp5 Proteins 0.000 description 1
- MJZJYWCQPMNPRM-UHFFFAOYSA-N 6,6-dimethyl-1-[3-(2,4,5-trichlorophenoxy)propoxy]-1,6-dihydro-1,3,5-triazine-2,4-diamine Chemical compound CC1(C)N=C(N)N=C(N)N1OCCCOC1=CC(Cl)=C(Cl)C=C1Cl MJZJYWCQPMNPRM-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 1
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 1
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- JPOQZCHGOTWRTM-FQPOAREZSA-N Ala-Tyr-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPOQZCHGOTWRTM-FQPOAREZSA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 1
- LXMKTIZAGIBQRX-HRCADAONSA-N Arg-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O LXMKTIZAGIBQRX-HRCADAONSA-N 0.000 description 1
- BECXEHHOZNFFFX-IHRRRGAJSA-N Arg-Ser-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BECXEHHOZNFFFX-IHRRRGAJSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 1
- YNSCBOUZTAGIGO-ZLUOBGJFSA-N Asn-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)N YNSCBOUZTAGIGO-ZLUOBGJFSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- XSGBIBGAMKTHMY-WHFBIAKZSA-N Asn-Asp-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O XSGBIBGAMKTHMY-WHFBIAKZSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- CZIXHXIJJZLYRJ-SRVKXCTJSA-N Asn-Cys-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CZIXHXIJJZLYRJ-SRVKXCTJSA-N 0.000 description 1
- AYKKKGFJXIDYLX-ACZMJKKPSA-N Asn-Gln-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AYKKKGFJXIDYLX-ACZMJKKPSA-N 0.000 description 1
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 1
- QPTAGIPWARILES-AVGNSLFASA-N Asn-Gln-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QPTAGIPWARILES-AVGNSLFASA-N 0.000 description 1
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- UHGUKCOQUNPSKK-CIUDSAMLSA-N Asn-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N UHGUKCOQUNPSKK-CIUDSAMLSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- BKFXFUPYETWGGA-XVSYOHENSA-N Asn-Phe-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BKFXFUPYETWGGA-XVSYOHENSA-N 0.000 description 1
- RBOBTTLFPRSXKZ-BZSNNMDCSA-N Asn-Phe-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RBOBTTLFPRSXKZ-BZSNNMDCSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- KBQOUDLMWYWXNP-YDHLFZDLSA-N Asn-Val-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KBQOUDLMWYWXNP-YDHLFZDLSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- HBUJSDCLZCXXCW-YDHLFZDLSA-N Asn-Val-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HBUJSDCLZCXXCW-YDHLFZDLSA-N 0.000 description 1
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 1
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- KLYPOCBLKMPBIQ-GHCJXIJMSA-N Asp-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N KLYPOCBLKMPBIQ-GHCJXIJMSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 1
- VNXQRBXEQXLERQ-CIUDSAMLSA-N Asp-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N VNXQRBXEQXLERQ-CIUDSAMLSA-N 0.000 description 1
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 1
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 241000416162 Astragalus gummifer Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 208000031648 Body Weight Changes Diseases 0.000 description 1
- 229940022962 COVID-19 vaccine Drugs 0.000 description 1
- XMTDCXXLDZKAGI-ACZMJKKPSA-N Cys-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N XMTDCXXLDZKAGI-ACZMJKKPSA-N 0.000 description 1
- WXKWQSDHEXKKNC-ZKWXMUAHSA-N Cys-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N WXKWQSDHEXKKNC-ZKWXMUAHSA-N 0.000 description 1
- ATPDEYTYWVMINF-ZLUOBGJFSA-N Cys-Cys-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ATPDEYTYWVMINF-ZLUOBGJFSA-N 0.000 description 1
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 1
- UCSXXFRXHGUXCQ-SRVKXCTJSA-N Cys-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N UCSXXFRXHGUXCQ-SRVKXCTJSA-N 0.000 description 1
- QQOWCDCBFFBRQH-IXOXFDKPSA-N Cys-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CS)N)O QQOWCDCBFFBRQH-IXOXFDKPSA-N 0.000 description 1
- KVCJEMHFLGVINV-ZLUOBGJFSA-N Cys-Ser-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KVCJEMHFLGVINV-ZLUOBGJFSA-N 0.000 description 1
- JLZCAZJGWNRXCI-XKBZYTNZSA-N Cys-Thr-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O JLZCAZJGWNRXCI-XKBZYTNZSA-N 0.000 description 1
- JRZMCSIUYGSJKP-ZKWXMUAHSA-N Cys-Val-Asn Chemical compound SC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JRZMCSIUYGSJKP-ZKWXMUAHSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 241001533413 Deltavirus Species 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 208000031448 Genomic Instability Diseases 0.000 description 1
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- ZDJZEGYVKANKED-NRPADANISA-N Gln-Cys-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O ZDJZEGYVKANKED-NRPADANISA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- XKBASPWPBXNVLQ-WDSKDSINSA-N Gln-Gly-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XKBASPWPBXNVLQ-WDSKDSINSA-N 0.000 description 1
- VGTDBGYFVWOQTI-RYUDHWBXSA-N Gln-Gly-Phe Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VGTDBGYFVWOQTI-RYUDHWBXSA-N 0.000 description 1
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- JKGHMESJHRTHIC-SIUGBPQLSA-N Gln-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JKGHMESJHRTHIC-SIUGBPQLSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- QBEWLBKBGXVVPD-RYUDHWBXSA-N Gln-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N QBEWLBKBGXVVPD-RYUDHWBXSA-N 0.000 description 1
- MQJDLNRXBOELJW-KKUMJFAQSA-N Gln-Pro-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O MQJDLNRXBOELJW-KKUMJFAQSA-N 0.000 description 1
- UWMDGPFFTKDUIY-HJGDQZAQSA-N Gln-Pro-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O UWMDGPFFTKDUIY-HJGDQZAQSA-N 0.000 description 1
- DCWNCMRZIZSZBL-KKUMJFAQSA-N Gln-Pro-Tyr Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O DCWNCMRZIZSZBL-KKUMJFAQSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 1
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- FKGNJUCQKXQNRA-NRPADANISA-N Glu-Cys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O FKGNJUCQKXQNRA-NRPADANISA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- ZWQVYZXPYSYPJD-RYUDHWBXSA-N Glu-Gly-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZWQVYZXPYSYPJD-RYUDHWBXSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- AAJHGGDRKHYSDH-GUBZILKMSA-N Glu-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O AAJHGGDRKHYSDH-GUBZILKMSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- SUDUYJOBLHQAMI-WHFBIAKZSA-N Gly-Asp-Cys Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O SUDUYJOBLHQAMI-WHFBIAKZSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 1
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 1
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 1
- XVYKMNXXJXQKME-XEGUGMAKSA-N Gly-Ile-Tyr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XVYKMNXXJXQKME-XEGUGMAKSA-N 0.000 description 1
- CVFOYJJOZYYEPE-KBPBESRZSA-N Gly-Lys-Tyr Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CVFOYJJOZYYEPE-KBPBESRZSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 1
- WTUSRDZLLWGYAT-KCTSRDHCSA-N Gly-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN WTUSRDZLLWGYAT-KCTSRDHCSA-N 0.000 description 1
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 1
- OCRQUYDOYKCOQG-IRXDYDNUSA-N Gly-Tyr-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 OCRQUYDOYKCOQG-IRXDYDNUSA-N 0.000 description 1
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 1
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 1
- MJUUWJJEUOBDGW-IHRRRGAJSA-N His-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MJUUWJJEUOBDGW-IHRRRGAJSA-N 0.000 description 1
- ILUVWFTXAUYOBW-CUJWVEQBSA-N His-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CN=CN1)N)O ILUVWFTXAUYOBW-CUJWVEQBSA-N 0.000 description 1
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 1
- 244000309467 Human Coronavirus Species 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- GRSZFWQUAKGDAV-KQYNXXCUSA-N IMP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(NC=NC2=O)=C2N=C1 GRSZFWQUAKGDAV-KQYNXXCUSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 1
- LLHYWBGDMBGNHA-VGDYDELISA-N Ile-Cys-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LLHYWBGDMBGNHA-VGDYDELISA-N 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- PDTMWFVVNZYWTR-NHCYSSNCSA-N Ile-Gly-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CCCCN)C(O)=O PDTMWFVVNZYWTR-NHCYSSNCSA-N 0.000 description 1
- VOBYAKCXGQQFLR-LSJOCFKGSA-N Ile-Gly-Val Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O VOBYAKCXGQQFLR-LSJOCFKGSA-N 0.000 description 1
- APDIECQNNDGFPD-PYJNHQTQSA-N Ile-His-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N APDIECQNNDGFPD-PYJNHQTQSA-N 0.000 description 1
- KYLIZSDYWQQTFM-PEDHHIEDSA-N Ile-Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N KYLIZSDYWQQTFM-PEDHHIEDSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- CEPIAEUVRKGPGP-DSYPUSFNSA-N Ile-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 CEPIAEUVRKGPGP-DSYPUSFNSA-N 0.000 description 1
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- RQJUKVXWAKJDBW-SVSWQMSJSA-N Ile-Ser-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N RQJUKVXWAKJDBW-SVSWQMSJSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- RTSQPLLOYSGMKM-DSYPUSFNSA-N Ile-Trp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N RTSQPLLOYSGMKM-DSYPUSFNSA-N 0.000 description 1
- 102000013462 Interleukin-12 Human genes 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- YQEZLKZALYSWHR-UHFFFAOYSA-N Ketamine Chemical compound C=1C=CC=C(Cl)C=1C1(NC)CCCCC1=O YQEZLKZALYSWHR-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- VYZAGTDAHUIRQA-WHFBIAKZSA-N L-alanyl-L-glutamic acid Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O VYZAGTDAHUIRQA-WHFBIAKZSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- KKXDHFKZWKLYGB-GUBZILKMSA-N Leu-Asn-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KKXDHFKZWKLYGB-GUBZILKMSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- GZAUZBUKDXYPEH-CIUDSAMLSA-N Leu-Cys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N GZAUZBUKDXYPEH-CIUDSAMLSA-N 0.000 description 1
- CQGSYZCULZMEDE-SRVKXCTJSA-N Leu-Gln-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CQGSYZCULZMEDE-SRVKXCTJSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- HMDDEJADNKQTBR-BZSNNMDCSA-N Leu-His-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMDDEJADNKQTBR-BZSNNMDCSA-N 0.000 description 1
- SGIIOQQGLUUMDQ-IHRRRGAJSA-N Leu-His-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C(C)C)C(=O)O)N SGIIOQQGLUUMDQ-IHRRRGAJSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- XXXXOVFBXRERQL-ULQDDVLXSA-N Leu-Pro-Phe Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XXXXOVFBXRERQL-ULQDDVLXSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- VHTIZYYHIUHMCA-JYJNAYRXSA-N Leu-Tyr-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VHTIZYYHIUHMCA-JYJNAYRXSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000984622 Leucodon Species 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- DZQYZKPINJLLEN-KKUMJFAQSA-N Lys-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O DZQYZKPINJLLEN-KKUMJFAQSA-N 0.000 description 1
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- XREQQOATSMMAJP-MGHWNKPDSA-N Lys-Ile-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XREQQOATSMMAJP-MGHWNKPDSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- JYVCOTWSRGFABJ-DCAQKATOSA-N Lys-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N JYVCOTWSRGFABJ-DCAQKATOSA-N 0.000 description 1
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 1
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- ZVXSESPJMKNIQA-YXMSTPNBSA-N Lys-Thr-Pro-Pro Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 ZVXSESPJMKNIQA-YXMSTPNBSA-N 0.000 description 1
- RMOKGALPSPOYKE-KATARQTJSA-N Lys-Thr-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMOKGALPSPOYKE-KATARQTJSA-N 0.000 description 1
- QFSYGUMEANRNJE-DCAQKATOSA-N Lys-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N QFSYGUMEANRNJE-DCAQKATOSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 1
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 1
- HUURTRNKPBHHKZ-JYJNAYRXSA-N Met-Phe-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 HUURTRNKPBHHKZ-JYJNAYRXSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- GWADARYJIJDYRC-XGEHTFHBSA-N Met-Thr-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GWADARYJIJDYRC-XGEHTFHBSA-N 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- RTGDFNSFWBGLEC-UHFFFAOYSA-N Mycophenolate mofetil Chemical compound COC1=C(C)C=2COC(=O)C=2C(O)=C1CC=C(C)CCC(=O)OCCN1CCOCC1 RTGDFNSFWBGLEC-UHFFFAOYSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 101800000511 Non-structural protein 2 Proteins 0.000 description 1
- 101800000508 Non-structural protein 5 Proteins 0.000 description 1
- 101800000507 Non-structural protein 6 Proteins 0.000 description 1
- 101800000509 Non-structural protein 8 Proteins 0.000 description 1
- 208000012868 Overgrowth Diseases 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- QGMRQYFBGABWDR-UHFFFAOYSA-M Pentobarbital sodium Chemical compound [Na+].CCCC(C)C1(CC)C(=O)NC(=O)[N-]C1=O QGMRQYFBGABWDR-UHFFFAOYSA-M 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- LJUUGSWZPQOJKD-JYJNAYRXSA-N Phe-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O LJUUGSWZPQOJKD-JYJNAYRXSA-N 0.000 description 1
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 1
- OMHMIXFFRPMYHB-SRVKXCTJSA-N Phe-Cys-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OMHMIXFFRPMYHB-SRVKXCTJSA-N 0.000 description 1
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 1
- PSBJZLMFFTULDX-IXOXFDKPSA-N Phe-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N)O PSBJZLMFFTULDX-IXOXFDKPSA-N 0.000 description 1
- IDUCUXTUHHIQIP-SOUVJXGZSA-N Phe-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O IDUCUXTUHHIQIP-SOUVJXGZSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- PMKIMKUGCSVFSV-CQDKDKBSSA-N Phe-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CC=CC=C2)N PMKIMKUGCSVFSV-CQDKDKBSSA-N 0.000 description 1
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- FELJDCNGZFDUNR-WDSKDSINSA-N Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FELJDCNGZFDUNR-WDSKDSINSA-N 0.000 description 1
- AJLVKXCNXIJHDV-CIUDSAMLSA-N Pro-Ala-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O AJLVKXCNXIJHDV-CIUDSAMLSA-N 0.000 description 1
- LCRSGSIRKLXZMZ-BPNCWPANSA-N Pro-Ala-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LCRSGSIRKLXZMZ-BPNCWPANSA-N 0.000 description 1
- LNLNHXIQPGKRJQ-SRVKXCTJSA-N Pro-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H]1CCCN1 LNLNHXIQPGKRJQ-SRVKXCTJSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 1
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 1
- HQVPQXMCQKXARZ-FXQIFTODSA-N Pro-Cys-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O HQVPQXMCQKXARZ-FXQIFTODSA-N 0.000 description 1
- VWXGFAIZUQBBBG-UWVGGRQHSA-N Pro-His-Gly Chemical compound C([C@@H](C(=O)NCC(=O)[O-])NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 VWXGFAIZUQBBBG-UWVGGRQHSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 1
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- CNUIHOAISPKQPY-HSHDSVGOSA-N Pro-Thr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CNUIHOAISPKQPY-HSHDSVGOSA-N 0.000 description 1
- DIDLUFMLRUJLFB-FKBYEOEOSA-N Pro-Trp-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC4=CC=C(C=C4)O)C(=O)O DIDLUFMLRUJLFB-FKBYEOEOSA-N 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 101100029566 Rattus norvegicus Rabggta gene Proteins 0.000 description 1
- 101150010882 S gene Proteins 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- UCXDHBORXLVBNC-ZLUOBGJFSA-N Ser-Asn-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(O)=O UCXDHBORXLVBNC-ZLUOBGJFSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- SNNSYBWPPVAXQW-ZLUOBGJFSA-N Ser-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O SNNSYBWPPVAXQW-ZLUOBGJFSA-N 0.000 description 1
- RNFKSBPHLTZHLU-WHFBIAKZSA-N Ser-Cys-Gly Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N)O RNFKSBPHLTZHLU-WHFBIAKZSA-N 0.000 description 1
- UFKPDBLKLOBMRH-XHNCKOQMSA-N Ser-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)C(=O)O UFKPDBLKLOBMRH-XHNCKOQMSA-N 0.000 description 1
- BPMRXBZYPGYPJN-WHFBIAKZSA-N Ser-Gly-Asn Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BPMRXBZYPGYPJN-WHFBIAKZSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 1
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 1
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 1
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- FRPNVPKQVFHSQY-BPUTZDHNSA-N Ser-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FRPNVPKQVFHSQY-BPUTZDHNSA-N 0.000 description 1
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 101000629318 Severe acute respiratory syndrome coronavirus 2 Spike glycoprotein Proteins 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 239000004138 Stearyl citrate Substances 0.000 description 1
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- TZKPNGDGUVREEB-FOHZUACHSA-N Thr-Asn-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O TZKPNGDGUVREEB-FOHZUACHSA-N 0.000 description 1
- PQLXHSACXPGWPD-GSSVUCPTSA-N Thr-Asn-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PQLXHSACXPGWPD-GSSVUCPTSA-N 0.000 description 1
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 1
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- GCXFWAZRHBRYEM-NUMRIWBASA-N Thr-Gln-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O GCXFWAZRHBRYEM-NUMRIWBASA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- VUVCRYXYUUPGSB-GLLZPBPUSA-N Thr-Gln-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O VUVCRYXYUUPGSB-GLLZPBPUSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- LCCSEJSPBWKBNT-OSUNSFLBSA-N Thr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N LCCSEJSPBWKBNT-OSUNSFLBSA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- RRRRCRYTLZVCEN-HJGDQZAQSA-N Thr-Leu-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O RRRRCRYTLZVCEN-HJGDQZAQSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 1
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 1
- FDQXPJCLVPFKJW-KJEVXHAQSA-N Thr-Met-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O FDQXPJCLVPFKJW-KJEVXHAQSA-N 0.000 description 1
- NZRUWPIYECBYRK-HTUGSXCWSA-N Thr-Phe-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O NZRUWPIYECBYRK-HTUGSXCWSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- NWECYMJLJGCBOD-UNQGMJICSA-N Thr-Phe-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O NWECYMJLJGCBOD-UNQGMJICSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- KVEWWQRTAVMOFT-KJEVXHAQSA-N Thr-Tyr-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O KVEWWQRTAVMOFT-KJEVXHAQSA-N 0.000 description 1
- 229920001615 Tragacanth Polymers 0.000 description 1
- IBBBOLAPFHRDHW-BPUTZDHNSA-N Trp-Asn-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N IBBBOLAPFHRDHW-BPUTZDHNSA-N 0.000 description 1
- UKINEYBQXPMOJO-UBHSHLNASA-N Trp-Asn-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N UKINEYBQXPMOJO-UBHSHLNASA-N 0.000 description 1
- UQHPXCFAHVTWFU-BVSLBCMMSA-N Trp-Phe-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UQHPXCFAHVTWFU-BVSLBCMMSA-N 0.000 description 1
- PEVVXUGSAKEPEN-AVGNSLFASA-N Tyr-Asn-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PEVVXUGSAKEPEN-AVGNSLFASA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- NSTPFWRAIDTNGH-BZSNNMDCSA-N Tyr-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NSTPFWRAIDTNGH-BZSNNMDCSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- IWRMTNJCCMEBEX-AVGNSLFASA-N Tyr-Glu-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O IWRMTNJCCMEBEX-AVGNSLFASA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- NWEGIYMHTZXVBP-JSGCOSHPSA-N Tyr-Val-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O NWEGIYMHTZXVBP-JSGCOSHPSA-N 0.000 description 1
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 1
- FZSPNKUFROZBSG-ZKWXMUAHSA-N Val-Ala-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O FZSPNKUFROZBSG-ZKWXMUAHSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- BVWPHWLFGRCECJ-JSGCOSHPSA-N Val-Gly-Tyr Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N BVWPHWLFGRCECJ-JSGCOSHPSA-N 0.000 description 1
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- MJFSRZZJQWZHFQ-SRVKXCTJSA-N Val-Met-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(=O)O)N MJFSRZZJQWZHFQ-SRVKXCTJSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- VNGKMNPAENRGDC-JYJNAYRXSA-N Val-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 VNGKMNPAENRGDC-JYJNAYRXSA-N 0.000 description 1
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- DLLRRUDLMSJTMB-GUBZILKMSA-N Val-Ser-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)O)N DLLRRUDLMSJTMB-GUBZILKMSA-N 0.000 description 1
- GBIUHAYJGWVNLN-UHFFFAOYSA-N Val-Ser-Pro Natural products CC(C)C(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O GBIUHAYJGWVNLN-UHFFFAOYSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- PGBMPFKFKXYROZ-UFYCRDLUSA-N Val-Tyr-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N PGBMPFKFKXYROZ-UFYCRDLUSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- OWFGFHQMSBTKLX-UFYCRDLUSA-N Val-Tyr-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N OWFGFHQMSBTKLX-UFYCRDLUSA-N 0.000 description 1
- XNLUVJPMPAZHCY-JYJNAYRXSA-N Val-Val-Phe Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 XNLUVJPMPAZHCY-JYJNAYRXSA-N 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 229960003697 abatacept Drugs 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- CUJRVFIICFDLGR-UHFFFAOYSA-N acetylacetonate Chemical compound CC(=O)[CH-]C(C)=O CUJRVFIICFDLGR-UHFFFAOYSA-N 0.000 description 1
- 229940119059 actemra Drugs 0.000 description 1
- 229960002964 adalimumab Drugs 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 229940042992 afinitor Drugs 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 230000001476 alcoholic effect Effects 0.000 description 1
- 229940037003 alum Drugs 0.000 description 1
- 229960004238 anakinra Drugs 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 239000008365 aqueous carrier Substances 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- 239000003125 aqueous solvent Substances 0.000 description 1
- 229940059756 arava Drugs 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- LMEKQMALGUDUQG-UHFFFAOYSA-N azathioprine Chemical compound CN1C=NC([N+]([O-])=O)=C1SC1=NC=NC2=C1NC=N2 LMEKQMALGUDUQG-UHFFFAOYSA-N 0.000 description 1
- 229960004669 basiliximab Drugs 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229940033687 beuthanasia Drugs 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 230000004579 body weight change Effects 0.000 description 1
- 229960004436 budesonide Drugs 0.000 description 1
- 229940046731 calcineurin inhibitors Drugs 0.000 description 1
- BPKIGYQJPYCAOW-FFJTTWKXSA-I calcium;potassium;disodium;(2s)-2-hydroxypropanoate;dichloride;dihydroxide;hydrate Chemical compound O.[OH-].[OH-].[Na+].[Na+].[Cl-].[Cl-].[K+].[Ca+2].C[C@H](O)C([O-])=O BPKIGYQJPYCAOW-FFJTTWKXSA-I 0.000 description 1
- 239000011545 carbonate/bicarbonate buffer Substances 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 229940107810 cellcept Drugs 0.000 description 1
- 229960003115 certolizumab pegol Drugs 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 229960001265 ciclosporin Drugs 0.000 description 1
- 229940090100 cimzia Drugs 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000003246 corticosteroid Substances 0.000 description 1
- 229960001334 corticosteroids Drugs 0.000 description 1
- 229940010466 cosentyx Drugs 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 229930182912 cyclosporin Natural products 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 229960002806 daclizumab Drugs 0.000 description 1
- 230000002498 deadly effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 229940027008 deltasone Drugs 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 108010054812 diprotin A Proteins 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 229940073621 enbrel Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229940104788 entyvio Drugs 0.000 description 1
- 229960000403 etanercept Drugs 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229960005167 everolimus Drugs 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 125000005456 glyceride group Chemical group 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 1
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 229960001743 golimumab Drugs 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 229940048921 humira Drugs 0.000 description 1
- 229960002751 imiquimod Drugs 0.000 description 1
- DOUYETYNHWVLEO-UHFFFAOYSA-N imiquimod Chemical compound C1=CC=CC2=C3N(CC(C)C)C=NC3=C(N)N=C21 DOUYETYNHWVLEO-UHFFFAOYSA-N 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 229960000598 infliximab Drugs 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 235000013902 inosinic acid Nutrition 0.000 description 1
- 229940117681 interleukin-12 Drugs 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 229960003299 ketamine Drugs 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 229940054136 kineret Drugs 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 229960000681 leflunomide Drugs 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- ZLNQQNXFFQJAID-UHFFFAOYSA-L magnesium carbonate Chemical compound [Mg+2].[O-]C([O-])=O ZLNQQNXFFQJAID-UHFFFAOYSA-L 0.000 description 1
- 239000001095 magnesium carbonate Substances 0.000 description 1
- 229910000021 magnesium carbonate Inorganic materials 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000007431 microscopic evaluation Methods 0.000 description 1
- 229940090126 millipred Drugs 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229940014456 mycophenolate Drugs 0.000 description 1
- 229940083410 myfortic Drugs 0.000 description 1
- 229960005027 natalizumab Drugs 0.000 description 1
- 229940063121 neoral Drugs 0.000 description 1
- 239000012457 nonaqueous media Substances 0.000 description 1
- 239000000346 nonvolatile oil Substances 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 229940035567 orencia Drugs 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 150000002895 organic esters Chemical class 0.000 description 1
- 229940029358 orthoclone okt3 Drugs 0.000 description 1
- 239000000123 paper Substances 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 238000005191 phase separation Methods 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 229960005205 prednisolone Drugs 0.000 description 1
- OIGNJSKKLXVSLS-VWUMJDOOSA-N prednisolone Chemical compound O=C1C=C[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 OIGNJSKKLXVSLS-VWUMJDOOSA-N 0.000 description 1
- VJZLQIPZNBPASX-OJJGEMKLSA-L prednisolone sodium phosphate Chemical compound [Na+].[Na+].O=C1C=C[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)COP([O-])([O-])=O)[C@@H]4[C@@H]3CCC2=C1 VJZLQIPZNBPASX-OJJGEMKLSA-L 0.000 description 1
- 229960004618 prednisone Drugs 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 229940072288 prograf Drugs 0.000 description 1
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 239000003380 propellant Substances 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 1
- 239000001397 quillaja saponaria molina bark Substances 0.000 description 1
- 229940099538 rapamune Drugs 0.000 description 1
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 229940116176 remicade Drugs 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 229950010550 resiquimod Drugs 0.000 description 1
- BXNMTOQRYBFHNZ-UHFFFAOYSA-N resiquimod Chemical compound C1=CC=CC2=C(N(C(COCC)=N3)CC(C)(C)O)C3=C(N)N=C21 BXNMTOQRYBFHNZ-UHFFFAOYSA-N 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 229940063122 sandimmune Drugs 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 229960004540 secukinumab Drugs 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 229940068638 simponi Drugs 0.000 description 1
- 229940115586 simulect Drugs 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000008247 solid mixture Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 229940071598 stelara Drugs 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229960001967 tacrolimus Drugs 0.000 description 1
- QJJXYPPXXYFBGM-SHYZHZOCSA-N tacrolimus Natural products CO[C@H]1C[C@H](CC[C@@H]1O)C=C(C)[C@H]2OC(=O)[C@H]3CCCCN3C(=O)C(=O)[C@@]4(O)O[C@@H]([C@H](C[C@H]4C)OC)[C@@H](C[C@H](C)CC(=C[C@@H](CC=C)C(=O)C[C@H](O)[C@H]2C)C)OC QJJXYPPXXYFBGM-SHYZHZOCSA-N 0.000 description 1
- 229940060681 taltz Drugs 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 229960003989 tocilizumab Drugs 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 229940079023 tysabri Drugs 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 229960003824 ustekinumab Drugs 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 108010009962 valyltyrosine Proteins 0.000 description 1
- 229960004914 vedolizumab Drugs 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
- BPICBUSOMSTKRF-UHFFFAOYSA-N xylazine Chemical compound CC1=CC=CC(C)=C1NC1=NCCCS1 BPICBUSOMSTKRF-UHFFFAOYSA-N 0.000 description 1
- 229960001600 xylazine Drugs 0.000 description 1
- 229940106067 zinbryta Drugs 0.000 description 1
- 229940043785 zortress Drugs 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/215—Coronaviridae, e.g. avian infectious bronchitis virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0043—Nose
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5254—Virus avirulent or attenuated
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/54—Medicinal preparations containing antigens or antibodies characterised by the route of administration
- A61K2039/541—Mucosal route
- A61K2039/543—Mucosal route intranasal
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/545—Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20021—Viruses as such, e.g. new isolates, mutants or their genomic sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2770/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
- C12N2770/00011—Details
- C12N2770/20011—Coronaviridae
- C12N2770/20034—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Virology (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Communicable Diseases (AREA)
- Epidemiology (AREA)
- Biotechnology (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Oncology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Mycology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pulmonology (AREA)
- Otolaryngology (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
변형된 SARS-CoV-2 변이체가 본원에 기술된다. 이들 바이러스는 재코딩되었고, 예를 들어, 코돈-탈최적화 또는 코돈-쌍 편향(codon pair bias) 탈최적화되었고, SARS-CoV-2 변이체 감염의 가능성이나 중증도를 감소시키거나, SARS-CoV-2 변이체 감염을 예방하거나, 면역 반응을 유도하거나, 또는 SARS-CoV-2 변이체 감염을 치료하는데 유용하다.
Description
관련 출원에 대한 상호 참조
본 출원은 그 전체가 참조에 의해 본원에 포함된, 2021년 7월 7일에 출원된 미국 임시 특허출원 63/219,263에 대한 우선권을 포함한다.
서열 목록에 대한 참조
본 출원은 2022년 6월 30일에 생성되고 바이트 단위 크기가 277,718바이트인 "SequenceListing_064955_000051WO00_ST25"라는 명칭의 전자 텍스트 파일로 제출된 서열 목록을 포함한다. 이 전자 파일에 포함된 정보는 그 전체가 참조에 의해 본원에 포함된다.
발명의 분야
본 발명은 변형된 SARS-CoV-2 코로나바이러스 변이체, 면역 반응을 유도하기 위한 조성물 및 보호 면역, 예방 및 치료를 제공하기 위한 백신에 관한 것이다.
본원의 모든 간행물은 각각의 개별 간행물 또는 특허 출원이 구체적이고 개별적으로 참조에 의해 포함되는 것으로 표시된 것과 동일한 정도로 참조로 포함된다. 하기 설명은 본 발명을 이해하는 데 유용할 수 있는 정보를 포함한다. 이는 본원에 제공된 임의의 정보가 현재 청구된 발명에 대해 선행 기술이거나 관련이 있거나, 구체적으로 또는 묵시적으로 참조된 임의의 간행물이 선행 기술이라는 것을 인정하는 것은 아니다.
2019년 12월 중순 중국 중부 우한시에서 새로운 코로나바이러스의 발생이 확인되었다. 현재 SARS-CoV-2로 지정된, 코로나바이러스의 신규한 균주가 확인되었다. 치명적인 코로나바이러스는 WHO에 의해 팬데믹(세계적 대유행)으로 선언되었다. 이 바이러스로 인한 공중 보건 위기는 2020년 1월 말 기준 수십 명의 목숨을 앗아가고 천 명 이상을 감염시키는 수준에서 2021년 7월 초 기준 400만 명 이상의 목숨을 앗아가고, 1억 8,500만 명 이상을 감염시켰고, 2022년 6월 현재 630만 명 이상의 목숨을 앗아가는 수준까지 빠르게 확대되었다.
발생 이후, SARS-CoV-2 변이체의 출현은 특히 심각했고, 모든 사람에게 면역력을 제공하려는 백신 노력을 방해했다. 따라서, SARS-CoV-2 변이체에 효과적인 예방 및 치료 처치가 여전히 매우 시급하게 요구된다.
발명의 요약
하기 구체예 및 그의 양태는 예시적이고 설명적인 것으로 의도되는 조성물 및 방법과 함께 기술되고, 예시되며, 범위를 한정하지 않다.
본 발명의 다양한 구체예는 모 SARS-CoV-2 변이체(parent SARS-CoV-2 variant)의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편을 코딩하는 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩된 것이고(recoded), 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편의 아미노산 서열은 동일하게 유지되거나, 또는 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편의 아미노산 서열은 최대 20개의 아미노산 치환, 첨가 또는 결실을 포함하고, 상기 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편은 스파이크 단백질 또는 그의 단편을 포함하는 것인 폴리뉴클레오티드를 제공한다.
다양한 구체예에서, 상기 모 SARS-CoV-2 변이체는 서열번호 1을 포함하거나, 또는 상기 모 SARS-CoV-2 변이체는 서열번호 1을 포함할 수 있거나, 상기 모 SARS-CoV-2 변이체는 nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1을 포함할 수 있거나, 또는 상기 모 SARS-CoV-2 변이체는 서열번호 1에 하나 이상의 돌연변이가 있는 것인 서열번호 1을 포함할 수 있고; 및 서열번호 1, 또는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 하나 이상의 돌연변이가 있는 서열번호 1의 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다.
다양한 구체예에서, 상기 SARS-CoV-2 변이체는 UK 변이체, 남아프리카 변이체, 브라질 변이체, 델타(Delta) 변이체, 및 오미크론(Omicron) 변이체로 구성된 군으로부터 선택될 수 있다.
다양한 구체예에서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈-쌍 편향(CPB)을 감소시키거나 코돈 사용빈도 편향(codon usage bias)을 감소시키는 것에 의해 재코딩될 수 있다. 다양한 구체예에서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CpG 또는 UpA 디뉴클레오티드의 수를 증가시키는 것에 의해 재코딩될 수 있다. 다양한 구체예에서, 각각의 재코딩된 하나 이상의 바이러스 단백질 또는 각각의 재코딩된 그의 하나 이상의 단편은 -0.05 미만, -0.1 미만, -0.2 미만, -0.3 미만, 또는 -0.4 미만의 코돈-쌍 편향을 가질 수 있다. 다양한 구체예에서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드에 비해 CPB 탈최적화될(deoptimized) 수 있다. 다양한 구체예에서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드에 비해 코돈-탈최적화될 수 있다. 다양한 구체예에서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 인간에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것일 수 있다. 다양한 구체예에서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 코로나바이러스에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것일 수 있다. 다양한 구체예에서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 야생형 SARS-CoV-2 코로나바이러스에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것일 수 있다. 다양한 구체예에서, 푸린 절단 부위(furin cleavage site)가 제거될 수 있다.
다양한 구체예는 본원에 기술된 본 발명의 폴리뉴클레오티드를 포함하는 벡터를 제공한다.
다양한 구체예는 본원에 기술된 본 발명의 폴리뉴클레오티드, 또는 본원에 기술된 본 발명의 벡터를 포함하는 세포를 제공한다. 다양한 구체예에서, 상기 세포는 베로(Vero) 세포 또는 BHK(baby hamster kidney) 세포일 수 있다.
다양한 구체예는 본원에 기술된 본 발명의 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드를 제공한다.
다양한 구체예는 본원에 기술된 본 발명의 폴리뉴클레오티드를 포함하는, 변형된 SARS-CoV-2 변이체를 제공한다. 다양한 구체예는 본원에 기술된 본 발명의 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하는, 변형된 SARS-CoV-2 변이체를 제공한다. 다양한 구체예는 본원에 기술된 본 발명의 변형된 SARS-CoV-2 변이체로서, 그의 하나 이상의 바이러스 단백질의 발현이 모 SARS-CoV-2 변이체에 비해 감소된 것인 변형된 SARS-CoV-2 변이체를 제공한다. 다양한 구체예는 본원에 기술된 본 발명의 변형된 SARS-CoV-2 변이체로서, 그의 하나 이상의 바이러스 단백질의 발현 감소는 스파이크 단백질 또는 그의 단편을 재코딩한 결과로서 감소될 수 있는 것인 변형된 SARS-CoV-2 변이체를 제공한다.
다양한 구체예는 본원에 기술된 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체(subject)에서 면역 반응을 유도하기 위한 면역 조성물 또는 백신 조성물을 제공한다. 다양한 구체예에서, 본원에 기술된 본 발명의 면역 조성물 또는 백신 조성물은 약학적으로 허용되는 담체 또는 부형제를 추가로 포함할 수 있다.
다양한 구체예는 본원에 기술된 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 다가 면역 조성물 또는 백신 조성물을 제공한다. 다양한 구체예에서, 본원에 기술된 본 발명의 다가 면역 조성물 또는 본원에 기술된 본 발명의 다가 백신 조성물은 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드로서, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않은 것인 폴리뉴클레오티드를 포함하는 변형된 SARS-CoV-2 코로나바이러스를 추가로 포함한다. 다양한 구체예에서, 본원에 기술된 본 발명의 다가 면역 조성물 또는 본원에 기술된 본 발명의 다가 백신 조성물은 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드로서, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 상기 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않은 것인 폴리펩티드를 포함하는 변형된 SARS-CoV-2 코로나바이러스를 추가로 포함할 수 있다. 다양한 구체예에서, 본원에 기술된 본 발명의 다가 면역 조성물 또는 본원에 기술된 본 발명의 다가 백신 조성물은 약학적으로 허용되는 담체 또는 부형제를 추가로 포함할 수 있다.
다양한 구체예는 대상체에서 면역 반응을 유도하는 방법으로서, 본원에 기술된 본 발명의 변형된 SARS-CoV-2 변이체의 용량을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법을 제공한다.
다양한 구체예는 대상체에서 면역 반응을 유도하는 방법으로서, 본원에 기술된 본 발명의 면역 조성물의 용량을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법을 제공한다.
다양한 구체예는 대상체에서 면역 반응을 유도하는 방법으로서, 본원에 기술된 본 발명의 백신 조성물의 용량을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법을 제공한다.
다양한 구체예는 대상체에서 면역 반응을 유도하는 방법으로서, 본원에 기술된 본 발명의 다가 면역 조성물 또는 다가 백신 조성물의 용량을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법을 제공한다.
다양한 구체예는 대상체에서 면역 반응을 유도하는 방법으로서, 본원에 기술된 본 발명의 변형된 SARS-CoV-2 코로나바이러스, 또는 본원에 기술된 본 발명의 백신 조성물, 또는 본원에 기술된 본 발명의 면역 조성물, 또는 본원에 기술된 본 발명의 다가 면역 또는 백신 조성물의 프라임 용량(prime dose)을 상기 대상체에게 투여하는 단계, 및 본원에 기술된 본 발명의 변형된 SARS-CoV-2 코로나바이러스, 또는 본원에 기술된 본 발명의 백신 조성물, 또는 본원에 기술된 본 발명의 면역 조성물, 또는 본원에 기술된 본 발명의 다가 면역 또는 백신 조성물의 1회 이상의 부스트 용량(boost dose)을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법을 제공한다.
다양한 구체예에서, 상기 면역 반응은 보호 면역(protective immunne) 반응일 수 있다. 다양한 구체예에서, 상기 용량은 예방적 유효량(prophylactically effective dose) 또는 치료적 유효량(therapeutically effective dose)이다.
다양한 구체예에서, 투여는 비강 경로를 통해 이루어질 수 있다. 다양한 구체예에서, 투여는 점비(nasal drop)를 통해 이루어질 수 있다. 다양한 구체예에서, 투여는 비강 스프레이를 통해 이루어질 수 있다.
다양한 구체예에서, 상기 용량은 약 104-106 PFU일 수 있거나, 또는 상기 프라임 용량은 약 약 104-106 PFU이고, 상기 하나 이상의 부스트 용량은 약 104-106 PFU일 수 있다. 1회 이상의 부스트 용량이 약 104-106 PFU일 수 있다.
다양한 구체예는 탈최적화된(deoptimized) SARS-CoV-2 변이체을 제조하는 방법으로서, 모 SARS-CoV-2 변이체의 하나 이상의 단백질 또는 그의 하나 이상의 단편을 코딩하는 뉴클레오티드 서열을 수득하는 단계; 상기 하나 이상의 단백질 또는 상기 그의 하나 이상의 단편의 단백질 발현을 감소시키기 위해 뉴클레오티드 서열을 재코딩하는 단계; 및 재코딩된 뉴클레오티드 서열을 갖는 핵산을 모 SARS-CoV-2 변이체 게놈 내로 치환하여 탈최적화된 SARS-CoV-2 변이체 게놈을 제조하는 단계를 포함하고, 상기 재코딩된 뉴클레오티드 서열의 발현은 모 바이러스에 비해 감소된 것인 방법을 제공한다. 다양한 구체예에서, 상기 탈최적화된 SARS-CoV-2 변이체는 본원에 기술된 탈최적화된 SARS-CoV-2 변이체일 수 있다.
본 발명의 다른 특징 및 장점은 본 발명의 구체예의 다양한 특징을 예로서 예시하는 첨부 도면과 함께 취해진 하기의 상세한 설명으로부터 명백해질 것이다.
발명의 설명
본원에 인용된 모든 참조 문헌은 완전히 설명된 것처럼 그 전체가 참조에 의해 포함된다. 달리 정의되지 않는 한, 본원에서 사용되는 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. Singleton et al., Dictionary of Microbiology and Molecular Biology 3 rd ed., Revised, J. Wiley & Sons (New York, NY 2006); March, Advanced Organic Chemistry Reactions, Mechanisms and Structure 7 th ed., J. Wiley & Sons (New York, NY 2013); 및 Sambrook and Russel, Molecular Cloning: A Laboratory Manual 4 th ed., Cold Spring Harbor Laboratory Press (Cold Spring Harbor, NY 2012)는 본 출원에서 사용되는 많은 용어에 대한 일반적인 가이드를 당업자에게 제공한다.
당업자는 본 발명의 실시에 사용될 수 있는 본원에 기재된 것과 유사하거나 균등한 많은 방법 및 재료를 인식할 것이다. 실제로, 본 발명은 기술된 방법 및 재료에 한정되지 않다. 본 발명의 목적을 위해, 다음 용어가 하기에 정의된다.
참조된 숫자 표시와 관련하여 사용될 때 본원에 사용된 용어 "약"은, 본원에서 달리 구체적으로 제공되지 않는 한, 참조된 숫자 표시에서 그 참조된 숫자 표시의 최대 5%를 더하거나 빼는 것을 의미한다. 예를 들어, "약 50%"라는 언어는 45% 내지 55%의 범위를 포함한다. 다양한 구체예에서, 참조된 숫자 표시와 관련하여 사용될 때 용어 "약"은 청구항에 구체적으로 제공된 경우, 참조된 숫자 표시에서 그 참조된 숫자 표시의 최대 4%, 3%, 2%, 1%, 또는 0.5%를 더하거나 빼는 것을 의미할 수 있다.
본원에 사용된 "모 바이러스(parent virus)"는 동일하거나 유사한 아미노산 서열을 코딩하기 위해 재코딩된 뉴클레오티드 서열이 비교되는 기준(reference) 바이러스를 의미한다.
본원에 사용된 "SARS-CoV-2" 및 "2019-nCoV"는 상호교환 가능하고, COVID-19를 유발하는 야생형 서열, 천연 분리주 서열(natural isolate sequence), 또는 상기 야생형 서열 또는 상기 천연 분리주 서열의 돌연변이 형태를 갖는 코로나바이러스를 의미한다. 돌연변이 형태는 바이러스의 복제 사이클을 통해 자연적으로, 또는 유전 공학을 통해 발생한다.
본원에 사용된 "SARS-CoV-2 변이체(SARS-CoV-2 variant)"는 인간과 같은 숙주 내에서 복제되고 및/또는 숙주 간에 전파될 때 바이러스의 복제 사이클을 통해 자연적으로 발생한 SARS-CoV-2의 돌연변이 형태를 지칭한다. SARS-CoV-2 변이체의 예는 알파 변이체 (UK 변이체, 20I/501Y.V1, VOC 202012/01, 또는 B.1.1.7로도 알려짐), 베타 변이체(남아프리카 변이체, 20H/501Y.V2 또는 B.1.351로도 알려짐), 델타 변이체 (B.1.617.2), 감마 변이체 (브라질 변이체 또는 P.1로도 알려짐), 오미크론 변이체 (B.1.1.529), 오미크론 변이체 계통(Omicron variant lineages) (BA.1, BA.1.1, BA.2, BA.3, BA.4 및 BA.5)를 포함하나, 이에 한정되지 않다.
SARS-CoV-2와 관련하여 본원에 사용된 "천연 분리주(natural isolate)"는 숙주 (예를 들어, 인간, 박쥐, 고양이, 돼지, 또는 임의의 다른 숙주) 또는 천연 저장소(reservoir)로부터 분리된 SARS-CoV-2와 같은 바이러스를 지칭한다. 천연 분리주의 서열은 동일하거나 숙주, 예를 들어 인간에서 복제되고 및/또는 숙주 간에 전달될 때 바이러스의 복제 사이클을 통해 자연적으로 발생한 돌연변이를 가질 수 있다.
본원에 사용된 "워싱턴 코로나바이러스 분리주" 또는 "워싱턴 분리주"는 그 전체가 완전히 설명된 것처럼 본원에 참고로 포함된, 2020년 7월 5일 기준 GenBank 수탁 번호 MN985325.1를 갖는 SARS-CoV-2의 야생형 분리주를 지칭한다.
"WW-WWD", "CDX-005" 및 "COVI-VAC"는 상호교환적으로 사용된다. "COVI-VAC"은 이전에 우선권 기초 출원(priority application)에서 CDX-005를 기술하기 위해 사용된 명칭이었다.
본원에 사용된 "빈번하게 사용되는 코돈(frequently used codon)" 또는 "코돈 사용빈도 편향(codon usage bias)"은 특정 종, 예를 들어, 인간, 코로나바이러스, 또는 SARS-CoV-2에 대한 코딩 DNA에서 동의 코돈(synonymous codon)의 발생 빈도의 차이를 지칭한다.
본원에 사용된 "코돈-쌍 편향(codon pair bias)"은 특정 종, 예를 들어, 인간, 코로나바이러스, 또는 SARS-CoV-2에서 통계적으로 예측된 것보다 더 빈번하게 또는 덜 빈번하게 사용되는 동의 코돈 쌍을 지칭한다.
본원에 사용된 "대상체(subject)"는 임의의 동물 또는 인공적으로 변형된 동물을 의미한다. 동물은 인간, 인간이 아닌 영장류, 원숭이, 소, 말, 양, 돼지, 개, 고양이, 토끼, 흰 족제비, 설치류, 예를 들면, 마우스, 랫트 및 기니피그, 박쥐, 뱀 및 새를 포함하나, 이에 한정되지 않다. 인공적으로 변형된 동물은 인간 면역계를 가진 SCID 마우스를 포함하나, 이에 한정되지 않다. 바람직한 구체예에서, 대상체는 인간이다.
"바이러스 숙주"는 바이러스가 감염시킬 수 있는 모든 동물 또는 인공적으로 변형된 동물을 의미한다. 동물은 인간, 인간이 아닌 영장류, 소, 말, 양, 돼지, 개, 고양이, 토끼, 흰 족제비, 마우스, 랫트 및 기니피그와 같은 설치류 및 조류를 포함하나, 이에 한정되지 않다. 인공적으로 변형된 동물은 인간 면역계를 가진 SCID 마우스를 포함하나, 이에 한정되지 않다. 다양한 구체예에서, 바이러스 숙주는 포유동물이다. 다양한 구체예에서, 바이러스 숙주는 영장류이다. 다양한 구체예에서, 바이러스 숙주는 인간이다. 조류의 구체예는 닭, 칠면조, 오리 및 거위를 포함하지만 이에 한정되지 않는 가축화된(domesticated) 가금류 종이다.
"예방적 유효량(prophylactically effective dose)"은 바이러스에 감염되기 쉽거나, 바이러스-관련 장애에 걸리기 쉬운 대상체에 투여될 때, 대상체에서 대상체를 바이러스에 감염되거나 상기 장애에 걸리는 것으로부터 보호하는 면역 반응을 유도하는 백신 또는 바이러스 조성물의 임의의 양이다. 대상체를 "보호"한다는 것은 대상체가 바이러스에 감염될 가능성을 줄이거나 대상체에서 장애의 발병 가능성을 적어도 2배, 바람직하게는 적어도 10배, 25배, 50배, 또는 100배 감소시키는 것을 의미한다. 예를 들어, 대상체가 바이러스에 감염될 가능성이 1%인 경우, 대상체가 바이러스에 감염될 가능성이 2배 감소하면 대상체가 바이러스에 감염될 가능성이 0.5%가 된다.
본원에 사용된, "치료적 유효량(therapeutically effective dose)"은 백신이 효과적으로 작용하는 장애를 앓는 대상체에게 투여될 때, 대상체에서 대상체가 상기 장애 및/또는 그 증상의 감소, 관해(remission) 또는 경감(regression)을 경험하게 하는 면역 반응을 유도하는 백신 또는 바이러스 조성물의 임의의 양이다. 바람직한 구체예에서, 장애 및/또는 그의 증상의 재발이 예방된다. 다른 바람직한 구체예에서, 대상체는 장애 및/또는 그의 증상이 치유된다.
본원에 사용된 "상응하는 서열(corresponding sequence)"은 변형된 서열이 비교 서열의 동일하거나 유사한 아미노산 서열을 코딩하는 경우의 비교 서열을 의미한다. 다양한 구체예에서, 상응하는 서열은 바이러스 단백질을 코딩하는 서열이다. 다양한 구체예에서, 상응하는 서열은 적어도 50개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 100개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 150개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 200개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 250개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 300개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 350개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 400개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 450개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 적어도 500개 코돈의 길이이다. 다양한 구체예에서, 상응하는 서열은 바이러스 단백질 서열이다. 다양한 구체예에서, 상응하는 서열은 전체 바이러스의 서열이다.
다양한 구체예에서, 본원에 사용된 "유사한 아미노산 서열(similar amino acid sequence)"은 비교 서열과 비교하여 2% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, "유사한 아미노산 서열"은 비교 서열과 비교하여 1.75% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 1.5% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 1.25% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 1% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 0.75% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 0.5% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다. 다양한 구체예에서, 청구범위에 구체적으로 제공된 경우, 비교 서열과 비교하여 0.25% 미만의 아미노산 치환, 결실 또는 첨가를 갖는 아미노산 서열을 의미한다.
본 면역화 및 치료 방법의 특정 구체예는 적어도 하나의 보조제를 대상체에게 투여하는 것을 추가로 포함한다. "보조제(adjuvant)"는 항원의 면역원성을 증진시키고 대상체에서 면역 반응을 증가(boost)시키는데 적합한 임의의 작용제를 의미할 것이다. 단백질- 및 핵산-기반 백신 모두와 함께 사용하기에 적합한 입자성(particulate) 보조제를 포함한, 많은 보조제, 및 항원과 보조제를 조합하는 방법이 당업자에게 잘 알려져 있다. 핵산 기반 백신에 적합한 보조제는 Quil A, 이미퀴모드, 레시퀴모드 및 정제된 단백질 또는 핵산 형태로 전달되는 인터루킨-12를 포함하나, 이에 한정되지 않다. 단백질 면역화와 함께 사용하기에 적합한 보조제는 명반(alum), 프로인트 불완전 보조제 (FIA), 사포닌, Quil A, 및 QS-21을 포함하나, 이에 한정되지 않다.
그의 유전자가 재코딩된, 예를 들어, 코돈-쌍 편향 탈최적화되거나 코돈 사용빈도 탈최적화된 SARS-CoV-2 변이체가 본원에 기술된다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 가지나; 뉴클레오티드 서열은 재코딩된 것이다. 본 발명에 따른 뉴클레오티드 서열의 재코딩(recoding)은 감소된 단백질 발현, 약독화(attenuation) 또는 둘 모두를 초래한다. 이들 재코딩된 SARS-CoV-2 변이체는 백신으로서, 특히 약독화 생백신으로 사용하기에 유용하다.
본 발명자들은 이전에 wt SARS-CoV-2로부터 합성 고 약독화 생백신(synthetic highly attenuated live vaccine) 후보, CDX-005를 생성하였다. 임의의 특정한 이론에 얽매이지 않기를 바라면서, 본 발명자들은 약독화에 대해 가장 가능성 있는 메커니즘은 미스폴딩(misfoled) 단백질을 초래하는 번역의 오류를 통한 둔화된 번역이고, RNA 2차 구조의 변화, 또는 변경된 조절 신호 모두가 단백질 생산 감소에 기여할 것이라 믿는다. 메커니즘이 무엇이든, 약독화된 CDX-005 바이러스는 모든 바이러스 항원을 그의 wt 형태로 제시하여, 광범위한 면역 반응에 대한 잠재력을 제공하고, 표적 균주에 유전적 부동(genetic drift)이 있는 경우에도 효능을 유지할 가능성이 있다. CDX-005는 수백 개의 침묵 (동의) 돌연변이가 표현형에 기여하기 때문에 병원성으로의 복귀에 대해 높은 내성을 가질 것으로 예상된다. 본 발명자의 복귀(reversion) 테스트는 후기 계대 바이러스(late passage viru)의 벌크 시퀀싱 및 푸린 절단 부위의 잠재적 변화의 평가에 의해 평가된 바와 같이 백신이 안정하다는 나타낸다.
본 발명자의 햄스터 연구는 CDX-005가 이 동물들에게 안전하다는 것을 입증한다. CDX-00는 고도로 약독화되어, 폐 및 후신경구(olfactory bulb)에서 더 낮은 총 바이러스 부하를 유도하고 뇌에서 완전히 제거하고, wt WA1이 접종된 동물보다 CDX-005가 접종된 동물의 폐에서 더 낮은 살아있는 바이러스 부하를 유도한다. wt 바이러스와 달리, CDX-005는 접종된 햄스터에서 체중 감소 또는 심각한 폐 병리를 유도하지 않았다.
햄스터 연구는 또한 CDX-005가 SARS CoV-2로부터 효과적으로 보호한다고 시사한다. Ab 역가의 평가는 혈청 IgG 및 중화 Ab의 유도에서 wt 바이러스만큼 효과적이라는 것을 보여준다. CDX-005는 wt 챌린지로부터 보호하고; CDX-005 접종은 폐 바이러스 역가를 낮추고, 뇌에서 바이러스에 대한 완전한 보호를 가져온다. CDX-005로 접종한 햄스터는 또한 비히클 접종 동물에서 관찰된 체중 감소를 나타내지 않다. 또한, 질환 강화(disease enhancement)의 증거가 없다.
전체적으로, 본 발명자의 데이터는 CDX-005가 현재 동물 및 인간에서 사용하기 위해 개발 중인 중요한 새로운 종류의 약독화 생백신의 일부라는 것을 나타낸다. CDX-005는 원형(native) 아미노산 서열과 유사한 모든 바이러스 항원을 제시하고, 비강 내 투여될 수 있고, 소동물 모델에서 단일 용량으로 안전하고 효과적이며, 복귀에 내성이 있고, 허용 온도에서 높은 역가로 성장할 수 있다. 현재 인간에서 안전성과 효능을 테스트하기 위한 임상 시험이 진행 중이다.
탈최적화된 CDX-005 (예를 들어, 서열번호 1을 포함함) 약독화 생백신 후보를 구축하기 위해, 먼저 야생형 WA1 공여자 바이러스의 게놈을 인 실리코(in silico)로 19개의 중첩 단편으로 분석하였다(parse). 각 단편은 각 인접 단편과 약 200 bp의 서열 중첩을 공유한다. F1-F19를 RT-PCR로 야생형 WA1 바이러스 RNA의 cDNA로부터 생성하였다. 단편을 생거 시퀀싱(Sanger sequencing)에 의해 서열 확인하였다. 그 후, 본 발명자들은 CDX-005의 cDNA 게놈을 생성하기 위해 WT WA1 바이러스의 단편 16을 탈최적화된 스파이크 유전자 서열을 가진 단편 16으로 교환했다.
다양한 구체예에서, 표적 SARS-CoV-2 및 그의 변이체를 RT-PCR을 통해 각각 약 50 내지 300 bp 중첩을 갖는 작은 단편으로 분자 분석하고(molecular parsing) 이들 단편 중 임의의 단편을 교환하는 것이 임의의 코돈 또는 코돈 쌍 탈최적화 바이러스의 cDNA 게놈 또는 게놈 단편을 구성하는 데 이용될 수 있는 과정이다. 그 후, 탈최적화된 카세트를 갖는 이 cDNA 게놈을 역유전학(reverse genetics)을 통해 탈최적화된 바이러스를 복구하는 데 사용할 수 있다.
CDX-005의 경우, 본 발명자들은 공개된 WA1 서열 (Vero 세포 계대 4)과 비교하여 본 발명자들의 WA1 공여자 바이러스 (Vero 세포 계대 6)의 서열에서 한 가지 주목할 만한 차이점을 확인했다. BEI Resources로부터 받은 WA1 바이러스의 Codagenix에서 Vero E6 세포에 대한 2회의 추가 WA1 바이러스 계대 동안, 스파이크 유전자 (게놈 위치 23594-23629)에서 36 nt 결실이 발생했다. 결실은 다염기성 푸린 절단 부위(polybasic furin cleavage site)를 포함하는 12개 아미노산 TNSPRRARSVAS (서열 번호 13)를 포함한다. SARS-CoV2 스파이크의 푸린 절단 부위는 인간 숙주에서 SARS-CoV2의 고병원성 표현형의 잠재적인 동인(driver)으로 제안되었다. 임의의 어떤 특정한 이론에 얽매이지 않기를 바라면서, 본 발명자들은 푸린 절단 부위의 부재가 시험관내 Vero 세포에서 SARS-CoV-2 바이러스 및 그의 변이체의 성장에 유익하고, 결실이 Vero 세포 배양에서 계대하는 동안 진화했다고 믿는다. 본 발명자들은 또한 푸린 절단 부위의 부재가 인간 숙주에서 그러한 돌연변이를 지닌 SARS-CoV-2 바이러스 또는 그의 변이체의 약독화에 기여할 수 있다고 믿는다. 따라서, 본 발명자들은 백신 후보 CDX-005 내로 유래된 푸린 절단 부위 결실을 통합하기로 결정했다. 푸린 절단 부위 결실은 어셈블리 단편 F15에 위치한다.
그러나, SARS-CoV-2 변이체의 출현 이후, 변이체 형태에 대한 강력한 보호를 보장하기 위해서는 새로운 백신이 필요하다. 따라서, 본 발명자들은 SARS-CoV-2 변이체에 대한 더 강한 보호를 위해, 탈최적화 SARS-CoV-2 변이체를 생성하기 시작했다.
본 발명은 적어도 부분적으로 전술한 내용 및 본원에 기술된 추가 정보에 기초한다.
다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 최대 약 20개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다. 그러나, 뉴클레오티드 서열이 재코딩되어, 단백질 발현 감소, 약독화 또는 둘 모두를 초래한다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 최대 약 10개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다;그러나, 뉴클레오티드 서열이 재코딩되어, 단백질 발현 감소, 약독화 또는 둘 모두를 초래한다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 1-5개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 6-10개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 11-15개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 16-20개 아미노산 결실(들), 치환(들), 또는 첨가(들)가 있다. 그러나 다시, 뉴클레오티드 서열이 재코딩되어서, 단백질 발현 감소, 약독화 또는 둘 모두를 초래한다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 12개의 아미노산 결실, 치환 또는 첨가를 갖고; 그러나 뉴클레오티드 서열이 재코딩되어, 단백질 발현 감소, 약독화 또는 둘 모두를 초래한다. 다양한 구체예에서, 아미노산 결실, 치환 또는 첨가는 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 앞의 핵산 결실(들), 치환(들) 또는 첨가(들)로부터 초래된다.
다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 12개의 아미노산 결실을 갖는다. 다양한 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 1-5개 아미노산 결실, 또는 6-10개 아미노산 결실, 또는 11-15개 아미노산 결실, 또는 16-20개 아미노산 결실을 갖는다. 다양한 구체예에서, 아미노산 결실은 푸린 절단 부위를 제거하는 스파이크 단백질에 있다. 다양한 특정 구체예에서, 본 발명의 SARS-CoV-2 변이체의 바이러스 단백질은 그의 모 SARS-CoV-2 변이체와 동일한 아미노산 서열을 갖지만 스파이크 단백질 상의 푸린 절단 부위의 제거를 초래하는 12개 아미노산 결실을 갖는다. 다양한 구체예에서, 아미노산 결실, 치환, 또는 첨가는 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 앞의 핵산 결실(들), 치환(들) 또는 첨가(들)로부터 초래된다.
다양한 구체예에서, SARS-CoV-2 변이체의 스파이크 단백질을 코딩하는 핵산(S 유전자로도 알려짐)이 재코딩된다. 다양한 구체예에서, 재코딩된 스파이크 단백질은 푸린 절단 부위를 제거하는 뉴클레오티드; 예를 들어, 하기 서열 actaattctcctcggcgggcacgtagtgtagctagt(서열번호 14)를 갖는 36개 뉴클레오티드 서열 또는 TNSPRRARSVAS(서열번호 13)를 코딩하는 핵산 서열의 결실을 포함한다.
본 발명의 약독화된 바이러스의 스파이크 단백질 코딩 서열의 재코딩은 본원에 논의된 개시에 비추어 당업자에 의해 이루어졌거나 이루어질 수 있다. 본 발명의 다양한 구체예에 따르면, 뉴클레오티드 치환은 스파이크 단백질 코딩 서열의 복수의 위치에서 조작되며, 상기 치환은 게놈 내로 복수의 동의 코돈(synonymous codon)을 도입한다. 특정 구체예에서, 동의 코돈 치환은 게놈에서 코돈 편향, 코돈-쌍 편향, 드문(infrequent) 코돈 또는 드물게 발생하는(infrequently occurring) 코돈 쌍의 밀도, RNA 2차 구조, CG 및/또는 TA (또는 UA) 디뉴클레오티드 함량, C+G 함량, 번역 프레임쉬프트 부위(translation frameshift site), 번역 정지 부위(translation pause site), 마이크로RNA 인식 서열의 존재 또는 부재 또는 이들의 임의의 조합을 변경한다. 코돈 치환은 스파이크 단백질 코딩 서열 전체에 걸쳐 분포된 복수의 위치, 또는 스파이크 단백질 코딩 서열의 일부로 제한된 복수의 위치에 조작될 수 있다. 관련된 다수의 결함 (즉, 뉴클레오티드 치환)으로 인해, 본 발명은 안정적으로 약독화된 바이러스 및 생백신의 생산을 가능하게 한다.
일부 구체예에서, 바이러스 코돈 쌍은 코돈-쌍 편향을 감소시키기 위해(즉, 그 값을 낮추기 위해) 재코딩된다. 특정 구체예에서, 코돈-쌍 편향은 감소될 수 있는 코돈-쌍 점수(codon-pair score)를 갖는 코돈-쌍을 스파이크 코딩 서열에서 확인하고, 상기 코돈-쌍을 더 낮은 코돈-쌍 점수를 갖는 코돈 쌍으로 치환함으로써 코돈-쌍 편향을 감소시키는 것에 의해 감소된다. 일부 구체예에서, 코돈 쌍의 이러한 치환은 서열의 기존 코돈을 재배열하는 형태를 취한다. 일부 이러한 구체예에서, 코돈 쌍의 서브세트는 동의 코돈의 서브세트를 재배열함으로써 치환된다. 다른 구체예에서, 코돈 쌍은 재배열된 동의 코돈의 수를 최대화하는 것에 의해 치환된다. 코돈의 재배열은 전체적으로 바이러스 코딩 서열에 대해 감소된 (더 음성으로 만드는) 코돈-쌍 편향을 초래하고, 재배열은 다수의 위치에서 감소된 CPS를 초래하는 반면, 다른 위치에서는 수반되는 CPS 증가가 있을 수 있지만, 평균적으로, 변형된 서열의 코돈 쌍 점수, 따라서 CPB는 감소된다는 것에 주목한다. 일부 구체예에서, 코돈 또는 코돈-쌍의 재코딩은 스파이크 코딩 서열의 G+C 함량의 변경을 고려할 수 있다. 일부 구체예에서, 코돈 또는 코돈-쌍의 재코딩은 스파이크 코딩 서열에서 CG 및/또는 TA 디뉴클레오티드의 빈도를 변경하는 것을 고려할 수 있다.
특정 구체예에서, 재코딩된 스파이크 단백질-코딩 서열은 -0.1 미만, 또는 -0.2 미만, 또는 -0.3 미만, 또는 -0.4 미만의 코돈-쌍 편향을 갖는다. 일부 구체예에서, 재코딩된 스파이크 단백질-코딩 서열은 -0.01 미만, -0.02 미만, -0.03 미만, 또는 -0.04 미만의 코돈-쌍 편향을 갖는다. 일부 구체예에서, 재코딩된 스파이크 단백질-코딩 서열은 -0.05 미만, 또는 -0.06 미만, 또는 -0.07 미만, 또는 -0.08 미만, 또는 -0.09 미만, 또는 -0.1 미만, 또는 -0.11 미만, 또는 -0.12 미만, 또는 -0.13 미만, 또는 -0.14 미만, 또는 -0.15 미만, 또는 -0.16 미만, 또는 -0.17 미만, 또는 -0.18 미만, 또는 -0.19 미만, 또는 -0.2 미만, 또는 -0.25 미만, 또는 -0.3 미만, 또는 -0.35 미만, 또는 -0.4 미만, 또는 -0.45 미만, 또는 -0.5 미만의 코돈-쌍 편향을 갖는다.
특정 구체예에서, 재코딩된 스파이크 단백질 코딩 서열의 코돈-쌍 편향은 그것이 유래된 모 스파이크 단백질 코딩 서열 (예를 들어, 모 서열 스파이크 단백질 코딩 서열, 변이체 스파이크 단백질 코딩 서열)과 비교하여 적어도 0.1, 또는 적어도 0.2, 또는 적어도 0.3, 또는 적어도 0.4 만큼 감소된다. 특정 구체예에서, 스파이크 단백질-코딩 서열의 동의 코돈의 재배열은 그것이 유래된 모 스파이크 단백질 코딩 서열과 비교하여 적어도 0.1, 또는 적어도 0.2, 또는 적어도 0.3, 또는 적어도 0.4의 코돈-쌍 편향 감소를 제공한다. 특정 구체예에서, 스파이크 단백질-코딩 서열의 동의 코돈의 재배열은 그것이 유래된 모 스파이크 단백질 코딩 서열과 비교하여 적어도 0.1, 또는 적어도 0.2, 또는 적어도 0.3, 또는 적어도 0.4의 코돈-쌍 편향 감소를 제공한다. 특정 구체예에서, 재코딩된 스파이크 단백질-코딩 서열의 코돈-쌍 편향은 모 바이러스 상의 상응하는 서열과 비교하여 적어도 0.05, 또는 적어도 0.06, 또는 적어도 0.07, 또는 적어도 0.08, 또는 적어도 0.09, 또는 적어도 0.1, 또는 적어도 0.11, 또는 적어도 0.12, 또는 적어도 0.13, 또는 적어도 0.14, 또는 적어도 0.15, 또는 적어도 0.16, 또는 적어도 0.17, 또는 적어도 0.18, 또는 적어도 0.19, 또는 적어도 0.2, 또는 적어도 0.25, 또는 적어도 0.3, 또는 적어도 0.35, 또는 적어도 0.4, 또는 적어도 0.45, 또는 적어도 0.5 만큼 감소된다. 특정 구체예에서, 그것은 계산이 이루어질 상응하는 서열, 예를 들어, 변이체 바이러스의 상응하는 서열 (예를 들어, 변이체 바이러스 상의 스파이크 단백질-코딩 서열)과의 비교이다.
일부 구체예에서, 바이러스 코딩 서열은 하나 이상의 코돈을 SARS-CoV-2 코로나바이러스 숙주(예: 인간, 뱀, 박쥐)에서 덜 빈번하게 사용되는 동의 코돈으로 치환하는 것에 의해 재코딩된다. 일부 구체예에서, 바이러스 코딩 서열은 하나 이상의 코돈을 코로나바이러스, 예를 들어, SARS-CoV-2 코로나바이러스에서 덜 빈번하게 사용되는 동의 코돈으로 치환하는 것에 의해 재코딩된다. 특정 구체예에서, 동의 코돈으로 치환된 코돈의 수는 5개 이상이다. 일부 구체예에서, 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 250, 300, 350, 400, 450 또는 500개의 코돈이 숙주에서 덜 빈번하게 사용되는 동의 코돈으로 치환된다. 특정 구체예에서, 변형된 서열은 덜 빈번하게 사용되는 동의 코돈으로 치환된 적어도 20개의 코돈을 포함한다. 특정 구체예에서, 변형된 서열은 덜 빈번하게 사용되는 동의 코돈으로 치환된 적어도 50개의 코돈을 포함한다. 특정 구체예에서, 변형된 서열은 덜 빈번하게 사용되는 동의 코돈으로 치환된 적어도 100개의 코돈을 포함한다. 특정 구체예에서, 변형된 서열은 덜 빈번하게 사용되는 동의 코돈으로 치환된 적어도 250개의 코돈을 포함한다. 특정 구체예에서, 변형된 서열은 덜 빈번하게 사용되는 동의 코돈으로 치환된 적어도 500개의 코돈을 포함한다.
예를 들어, 재코딩된 스파이크 단백질의 경우, 숙주에서 덜 빈번하게 사용되는 동의 코돈으로 치환된 코돈의 수는 적어도 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450 또는 500개의 코돈이다.
일부 구체예에서, 동의 코돈의 치환은 바이러스 숙주, 예를 들어 인간에서 덜 빈번한 코돈으로 이루어진다. 바이러스 숙주의 다른 예는 전술된 것을 포함하나, 이에 한정되지 않다. 일부 구체예에서, 동의 코돈의 치환은 바이러스 자체, 예를 들어, SARS-CoV-2 코로나바이러스에서 덜 빈번한 것들로 이루어진다.
변형된 서열이 모 바이러스의 상응하는 서열과 비교하여 증가된 수의 CpG 또는 UpA 디뉴클레오티드를 포함하는 것인 구체예에서, 증가는 상응하는 서열과 비교하여 약 15-55개의 CpG 또는 UpA 디뉴클레오티드이다. 다양한 구체예에서, 증가는 상응하는 서열과 비교하여 약 15, 20, 25, 30, 35, 40, 45 또는 55개의 CpG 또는 UpA 디뉴클레오티드이다. 일부 구체예에서, 상응하는 서열과 비교하여 증가된 CpG 또는 UpA 디뉴클레오티드의 수는 상응하는 서열과 비교하여 약 10-75, 15-25, 25-50 또는 50-75개의 CpG 또는 UpA 디뉴클레오티드이다.
일반적으로, 이러한 치환 및 변경은 코딩된 단백질의 아미노산 서열을 변경하지 않으면서 이루어지고, 코딩된 바이러스 단백질의 발현을 감소시킨다. 특정 구체예에서, 본 발명은 또한 보존적일 수도 있고 그렇지 않을 수도 있는, 코딩된 단백질에서 비-동의(non-synonysmous) 코돈의 치환 및 아미노산 치환을 초래하는 스파이크 코딩 서열의 변경을 포함한다. 일부 구체예에서, 이러한 치환 및 변경은 아미노산 결실, 첨가, 치환을 초래하는 치환 또는 변경을 추가로 포함한다. 예를 들어, 스파이크 단백질은 푸린 절단 부위의 제거를 초래하는 36개 뉴클레오티드 결실을 갖도록 재코딩될 수 있다.
다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 3/4이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되고, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 1/2이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되고, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 1/3이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되고, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 1/4이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되고, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 1/5이다.
다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 10-20%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 20-30%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 25-35%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 30-40%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 35-45%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 40-50%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 45-55%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 50-60%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 55-65%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 60-70%이다. 다양한 구체예에서, 바이러스 단백질의 연속 세그먼트가 재코딩되며, 상기 연속 세그먼트는 바이러스 단백질 길이의 약 70-80%이다.
대부분의 아미노산은 2개 이상의(more than one) 코돈에 의해 코딩된다. 표 1의 유전자 코드(genetic code)를 참조한다. 예를 들어, 알라닌은 GCU, GCC, GCA, 및 GCG에 의해 코딩된다. 3개의 아미노산 (Leu, Ser, 및 Arg)은 6개의 상이한 코돈에 의해 코딩되나, Trp 및 Met만 고유한 코돈을 갖는다. "동의" 코돈은 동일한 아미노산을 코딩하는 코돈이다. 따라서, 예를 들어, CUU, CUC, CUA, CUG, UUA, 및 UUG는 Leu를 코딩하는 동의 코돈이다. 동의 코돈은 동일한 빈도로 사용되지 않다. 일반적으로, 특정 유기체에서 가장 빈번하게 사용되는 코돈은 동족 tRNA가 풍부한 코돈이며, 이러한 코돈을 사용하면 단백질 번역의 속도 및/또는 정확도가 증진된다. 반대로, 드물게 사용되는 코돈에 대한 tRNA는 상대적으로 낮은 수준으로 발견되며, 희귀 코돈을 사용하면 번역 속도 및/또는 정확도가 감소하는 것으로 생각된다.
표 1. 유전자 코드
a 특정 아미노산을 코딩하는 각 코돈의 첫 번째 뉴클레오티드가 맨 왼쪽 열에 표시되고; 두 번째 뉴클레오티드는 맨 위 행에 표시되며; 세 번째 뉴클레오티드는 맨 오른쪽 열에 표시된다.
코돈 편향 (Codon Bias)
본원에 사용된, "희귀(rare)" 코돈은 해당 아미노산에 대해 가장 빈번하게 사용되는 코돈보다 훨씬 더 낮은 빈도로 mRNA에 존재하는 특정 아미노산을 코딩하는 적어도 2개의 동의 코돈 중 하나이다. 따라서, 희귀 코돈은 가장 빈번하게 사용되는 코돈보다 약 2배 낮은 빈도로 존재할 수 있다. 바람직하게는, 희귀 코돈은 해당 아미노산에 대해 가장 빈번하게 사용되는 코돈보다 적어도 3배, 더욱 바람직하게는 적어도 5배 더 낮은 빈도로 존재한다. 반대로, "빈번한(frequent)" 코돈은 해당 아미노산에 대해 가장 낮은 빈도로 사용되는 코돈보다 훨씬 더 높은 빈도로 mRNA에 존재하는 특정 아미노산을 코딩하는 적어도 2개의 동의 코돈 중 하나이다. 빈번한 코돈은 해당 아미노산에 대해 가장 낮은 빈도로 사용되는 코돈보다 약 2배, 바람직하게는 적어도 3배, 더욱 바람직하게는 적어도 5배 더 높은 빈도로 존재할 수 있다. 예를 들어, 인간 유전자는 사용의 40%로 루이신 코돈 CTG를 사용하지만, 동의 CTA를 단지 사용의 7%로 사용한다 (표 2 참조). 따라서, CTG는 빈번한 코돈인 반면, CTA는 희귀 코돈이다. 이러한 사용의 빈도와 대략 일치하게, 게놈에 CTG를 인식하는 tRNA에 대한 유전자의 6개의 카피가 있으나, CTA를 인식하는 tRNA에 대한 유전자는 2개의 카피만 있다. 유사하게, 인간 유전자는 각각 사용의 18% 및 22%로 세린에 대한 빈번한 코돈 TCT 및 TCC를 사용하나, 희귀 코돈 TCG는 단지 사용의 5%로 사용한다. TCT와 TCC는 게놈에 10개의 유전자 카피가 있는, 동일한 tRNA에 의해 워블(wobble)을 통해 해독되는 반면 TCG는 4개의 카피만 있는 tRNA에 의해 해독된다. 매우 활발하게 번역되는 mRNA는 가장 빈번한 코돈만을 사용하도록 강하게 편향되어 있다는 것은 잘 알려져 있다. 이는 리보솜 단백질 및 해당 효소에 대한 유전자를 포함한다. 반면에, 상대적으로 풍부하지 않은 단백질의 mRNA는 희귀 코돈을 사용할 수 있다.
표 2. 호모 사피엔스의 코돈 사용빈도(usage) (출처: www.kazusa.or.jp/codon/)
고도로 발현된 유전자가 빈번한 코돈을 사용하는 경향을 "코돈 편향"이라고 한다. 리보솜 단백질에 대한 유전자는 61개 코돈 중 가장 빈번하게 사용되는 20~25개의 코돈만을 사용하고, 높은 코돈 편향 (1에 가까운 코돈 편향)을 갖는 반면, 불충분하게 발현되는(poorly expressed) 유전자는 61개의 코돈을 모두 사용하고 거의 코돈 편향이 없다 (0에 가까운 코돈 편향). 빈번하게 사용되는 코돈은 더 많은 양의 동족 tRNA가 발현되는 코돈이며, 이러한 코돈을 사용하면 번역이 더 빠르게, 더 정확하게, 또는 더 빠르고 더 정확하게 진행될 수 있게 하는 것으로 사료된다.
코돈-쌍 편향
또한, 주어진 유기체는 주어진 코돈 A의 가장 가까운 코돈 이웃에 대한 선호도를 가지며, 이를 코돈 쌍 활용(codon pair utilization)의 편향이라고 한다. 기존 코돈을 변경하지 않으면서, 코돈-쌍 편향의 변경은 단백질 합성 및 단백질 생산 속도에 영향을 줄 수 있다.
코돈-쌍 편향은 8개의 상이한 코돈 쌍에 의해 코딩될 수 있는 아미노산 쌍 Ala-Glu를 고려하여 설명할 수 있다. 각 개별 코돈의 빈도 (표 2에 표시됨) 이외의 요인이 코돈 쌍의 빈도에 영향을 미치지 않는 경우, 8개의 코딩 각각의 예상 빈도는 2개의 관련 코돈의 빈도를 곱하여 계산할 수 있다. 예를 들어, 이 계산에 의해, 코돈 쌍 GCA-GAA는 모든 Ala-Glu 코딩 쌍 중 0.097의 빈도(0.23×0.42; 표 2의 빈도에 기초함)로 발생할 것으로 예상된다. 각 코돈 쌍의 예상(가상) 빈도를 인간 게놈에서 실제로 관찰된 빈도와 관련시키기 위해, 총 14,795개의 인간 유전자를 포함하는 일관되게 주석이 달린(consistently annotated) 인간 코딩 영역의 CCDS(Consensus CDS) 데이터베이스를 사용하였다. 이 유전자 세트는 인간 코딩 서열의 가장 포괄적인 표시(representation)이다. 이 유전자 세트를 사용하여, 코돈의 발생 횟수를 동일한 아미노산을 코딩하는 모든 동의 코돈의 수로 나누어 코돈 사용(codon usage)의 빈도를 재계산했다. 예상대로, 빈도는 표 2에 나와 있는 것과 같이 이전에 발표된 빈도와 밀접하게 상관되었다. 약간의 빈도 변동은 84949개(인간 유전자의 실제 수보다 훨씬 많음)의 인간 코딩 서열이 계산에 포함된 Kazusa DNA Research Institute (www.kazusa.or.jp/codon/codon.html)의 코돈 사용빈도 데이터베이스에 의해 제공된 데이터에서 가능하게는 오버샘플링(oversampling) 효과로 인한 것이다. 그에 따라 계산된 코돈 빈도를 먼저 두 개의 관련 코돈의 빈도를 상호 간에 곱하고(표 3 예상 빈도 참조), 이 결과를 (전체 CCDS 데이터 세트에서) 해당하는 코돈 쌍에 의해 코딩된 아미노산 쌍이 발생하는 것으로 관찰된 빈도로 곱하는 것에 의해 예상 코돈-쌍 빈도를 계산하는 데 사용하였다. 코돈 쌍 GCA-GAA의 예에서, 이 두 번째 계산은 (Kazusa 데이터 세트를 사용한 첫 번째 계산의 0.097과 비교하여)0.098의 예상 빈도를 제공한다. 마지막으로, 14,795개 인간 유전자의 세트에서 관찰된 실제 코돈 쌍 빈도는 이 세트에서 각 코돈 쌍의 총 발생 횟수를 계수하고, 이를 이 세트에서 동일한 아미노산 쌍을 코딩하는 모든 동의 동의 코딩 쌍의 수로 나누는 것에 의해 결정하였다(표 3; 관찰 빈도). 14,795개 인간 유전자의 세트를 기반으로 한, 완전한 3721개 (612) 코돈 쌍의 세트에 대한 빈도 및 관찰/예상 값이 표 3에 제공된다.
표 3. 아미노 쌍 Ala-Glu로 예시된 코돈 쌍 점수
코돈 쌍의 관찰 빈도/예상 빈도의 비율이 1보다 크면, 그 코돈 쌍은 과대표된(overrepresented) 것이라고 한다. 상기 비율이 1보다 작으면 저대표된(underrepresented) 것이라고 한다. 예에서, 코돈 쌍 GCA-GAA는 1.65배 과대표되고, 코딩 쌍 GCC-GAA는 5배 이상 저대표된다.
다수의 기타 코돈 쌍은 매우 강한 편향을 나타낸다; 일부 쌍은 저대표되고, 다른 쌍은 과대표된다. 예를 들어, 코돈 쌍 GCCGAA (AlaGlu) 및 GATCTG (AspLeu)는 3 내지 6배 저대표되고(바람직한 쌍은 각각 GCAGAG 및 GACCTG임), 코돈 쌍 GCCAAG (AlaLys) 및 AATGAA (AsnGlu)는 약 2배 이상 과대표된다. 코돈-쌍 편향은 아미노산 쌍의 빈도나 개별 코돈의 빈도와 관련이 없다는 점에 주목해야 한다. 예를 들어, 저대표된 쌍 GATCTG (AspLeu)는 가장 빈번한 Leu 코돈, (CTG)을 사용한다.
하기에서 더 자세히 논의되는 바와 같이, 코돈-쌍 편향은 코딩 서열의 전체 길이에 걸쳐 평균화된 코딩 서열의 각 코돈 쌍에 대한 점수를 고려한다. 본 발명에 따르면, 코돈-쌍 편향은 하기 식에 의해 결정된다:
.
따라서, 코딩 서열에 대한 유사한 코돈-쌍 편향이, 예를 들어, 서브서열(subsequence)에 대한 최소화된 코돈 쌍 점수, 또는 코딩 서열의 전체 길이에 대한 적당히 감소된 코돈 쌍 점수에 의해 수득될 수 있다.
코돈-쌍 편향의 계산
가능한 3721개 비-"정지(STOP)" 함유 코돈 쌍 (예를 들어, GTT-GCT)의 모든 개별 코돈 쌍은 유전자의 주어진 "트레이닝 세트(training set)"에 특이적인 할당된(assigned) "코돈 쌍 점수(codon pair score)," 또는 "CPS"를 갖는다. 주어진 코돈 쌍의 CPS는 이 유전자 세트 (이 예에서는 인간 게놈)에서 예상되었을 발생의 횟수에 대한 관찰된 발생의 횟수의 로그 비율로 정의된다. 특정 코돈 쌍의 실제 발생 횟수 (또는 특정 아미노산 쌍이 특정 코돈 쌍에 의해 코딩될 가능성)를 결정하는 것은 단순히 코딩 서열의 특정 세트에서 코돈 쌍의 실제 발생 횟수를 계수하는 문제이다. 그러나, 예상 숫자를 결정하려면 추가 계산이 필요하다. 예상 숫자는 Gutman and Hatfield와 유사하게 아미노산 빈도 및 코돈 편향 모두에 독립적이도록 계산된다. 즉, 아미노산이 특정 코돈에 의해 코딩되는 횟수의 상대적인 비율을 기반으로 예상 빈도를 계산한다. 양의 CPS 값은 주어진 코돈 쌍이 통계적으로 과대표된다는 것을 의미하고, 음의 CPS는 해당 쌍이 인간 게놈에서 통계적으로 저대표된다는 것을 나타낸다.
인간 맥락(context) 내에서 이러한 계산을 수행하기 위해, 총 14,795개의 유전자를 포함하는 일관되게 주석이 달린 인간 코딩 영역의 가장 최근의 CCDS(Consensus CDS) 데이터베이스를 사용하였다. 이 데이터 세트는 게놈 스케일에서, 코돈 및 코돈 쌍, 따라서 아미노산 및 아미노산 쌍 빈도를 제공했다.
Federov et al. (2002)의 패러다임을 이용하여 Gutman and Hatfield (1989)의 접근 방식을 더욱 향상시켰다. 이는 특정 아미노산 쌍을 코딩하는 인접한(neighboring) 코돈의 비-무작위 연관 및 코돈 빈도와 무관하게, 주어진 코돈 쌍의 예상 빈도를 계산할 수 있게 했다. CPB를 계산하기 위해 사용된 상세한 식은 WO 2008/121992 및 WO 2011/044561에 개시되며, 이들은 참조에 의해 포함된다.
계산에서, Pij는 그의 동의 그룹(synonymous group)에서 NO(Pij)의 빈도로 발생하는 코돈 쌍이다. Ci 및 Cj는 각각 그들의 동의 그룹에서 빈도 F(Ci) 및 F(Cj)로 발생하는, Pij를 포함하는 2개의 코돈이다. 보다 명시적으로, F(Ci)는 상응하는 아미노산 Xi가 모든 코딩 영역에 걸쳐 코돈 Ci에 의해 코딩되는 빈도이고 F(Ci)=NO(Cj)/NO(Xi)이며, 식 중에서, NO(Ci) 및 NO(Xi)는 각각 코돈 Ci 및 아미노산 Xi의 관찰 발생 횟수이다. 이에 따라 F(Cj)가 계산된다. 또한, NO(Xij)는 모든 코딩 영역에 걸친 아미노산 쌍 Xij의 발생 횟수이다. Pij의 코돈-쌍 편향 점수 S(Pij)는 Ne(Pij)의 예상 발생 횟수에 대한 관찰 빈도 No(Pij)의 로그-오즈비(log-odds ratio)로 계산되었다.
전술된 식을 사용하여, 전체 인간 CCDS 데이터 세트를 사용하여 계산된 상응하는 게놈 Ne(Pij) 값과 비교할 때 개별 코딩 서열의 개별 코돈 쌍이 과대표되는지 또는 저대표되는지 여부를 결정하였다. 이 계산은 인간 코딩 영역에서 과대표된 코돈 쌍에 대해 양의 S(Pij) 점수 값 및 저대표된 코돈 쌍에 대한 음성 값을 초래했다.
개별 코딩 서열의 "결합(combined)" 코돈-쌍 편향은 하기 식에 따라 모든 코돈 쌍 점수를 평균하여 계산되었다:
따라서 전체 코딩 영역의 코돈-쌍 편향은 영역을 구성하는 모든 개별 코돈 쌍 점수를 더하고, 이 합계를 코딩 서열의 길이로 나누는 것에 의해 계산된다.
코돈-쌍 편향의 계산, 코돈-쌍 편향을 변경하기 위한 알고리즘 구현.
코돈-쌍 편향을 정량화하기 위한 알고리즘이 개발되었다. 모든 가능한 개별 코돈 쌍에 "코돈 쌍 점수" 또는 "CPS"가 주어졌다. CPS는 모든 인간 코딩 영역에 대한 각 코돈 쌍의 예상 발생 횟수에 대한 관찰된 발생 횟수의 비율의 자연 로그로 정의되며, 여기서 인간은 재코딩될 해당 백신 바이러스(instant vaccine virus)의 숙주 종을 나타낸다.
특정 코돈 쌍의 관찰된 발생 횟수(occurrences)의 계산은 간단하지만(유전자 세트 내의 실제 카우트), 코돈 쌍의 예상된 발생 횟수는 추가 계산이 필요하다. 본 발명자들은 이 예상되는 횟수를 Gutman and Hatfield와 유사하게, 아미노산 빈도 및 코돈 편향 모두에 독립적이도록 계산한다. 즉, 예상 빈도는 아미노산이 특정 코돈에 의해 코딩되는 횟수의 상대적 비율에 근거하여 계산된다. CPS 값이 양수이면 인간 게놈에서 주어진 코돈 쌍이 통계적으로 과대표된다는 것을 의미하고, CPS가 음수이면 해당 쌍이 인간 게놈에서 통계적으로 저대표된다는 것을 나타낸다.
이러한 계산된 CPS를 사용하여, 모든 코딩 영역은 코돈 쌍 점수의 평균을 취하여 전체 유전자에 대한 코돈-쌍 편향 (CPB)을 제공함으로써 과대표된 또는 저대표된 코돈 쌍을 사용하는 것으로 평가될 수 있다.
표시되고 플롯팅된 식을 이용하여 모든 주석이 달린 인간 유전자에 대해 CPB가 계산되었다. 그래프의 각 포인트는 단일 인간 유전자의 CPB에 해당한다. 분포의 피크는 0.07의 양성 코돈-쌍 편향을 가지며, 이는 주석이 달린 모든 인간 유전자에 대한 평균 점수이다. 또한 음성 코돈-쌍 편향을 갖는 유전자는 거의 없다. 그 후, CPB를 정의하고 계산하기 위해 설정된 식을 이용하여 이 편향을 처리했다.
코돈-쌍 편향을 감소시키는 알고리즘.
단백질 코딩 서열의 재코딩은 예를 들어, 구배 하강법(gradient descent), 또는 모의 어닐링(simulated annealing) 또는 기타 최소화 루틴을 이용하여, 컴퓨터의 도움을 받거나 받지 않고 수행할 수 있다. 출발 서열에 있는 코돈을 재배열하는 절차의 예는 하기 단계들로 나타낼 수 있다:
1) 야생형 바이러스 게놈 서열을 수득하는 단계.
2) 약독화된 설계를 표적으로 하는 단백질 코딩 서열을 선택하는 단계.
3) 비-코딩(non-coding) 기능을 갖는, 공지된 또는 추측된 DNA 단편을 봉쇄시키는(lock down) 단계.
4) 재설계된 단백질의 나머지 아미노산에 대해 원하는 코돈 분포를 선택하는 단계.
5) 적어도 두 개의 동의 비봉쇄(unlocked) 코돈 위치의 랜덤 셔플(random shuffle)을 수행하고 코돈 쌍 점수를 계산하는 단계.
6) 선택적으로, 모의 어닐링 절차를 사용하여, 코돈 쌍 점수를 추가로 감소 (또는 증가)시키는 단계.
7) 결과적으로 수득된 설계를 과도한 2차 구조 및 원치 않는 제한 부위에 대해 검사하는 단계:
-예(Yes)인 경우 -> 단계 (5)로 이동하거나 문제 영역을 야생형 서열로 교체하여 설계를 수정하고 단계 (8)로 이동한다.
8) 바이러스 설계에 상응하는 DNA 서열을 합성하는 단계.
9) 바이러스 구조체(viral construct)를 제조하고, 바이러스 표현형을 평가하는 단계:
- 과도하게 약독화된 경우, 서브클론 구조체(subclone construct)를 제조하고, 9로 이동하고;
- 약독화가 충분하지 않은 경우, 2로 이동한다.
코돈-쌍 편향을 감소시키는 것에 의한 바이러스의 약독화가 WO 2008/121992 및 WO 2011/044561에 개시되어 있으며, 이들은 완전히 설명된 것처럼 참조에 의해 본원에 포함된다.
야생형 SARS-CoV-2 게놈 서열 (또는 COVID-19를 유발하는 야생형 서열의 돌연변이 형태)에 내재된(embedded) 전장 SARS-CoV-2 게놈 서열 또는 코돈 쌍 탈최적화된 서열을 수득하는 방법은 예를 들어, 감염성 cDNA 클론을 구축하거나, BAC 벡터를 이용하거나, 오버랩 신장(overlap extension) PCR 전략을 이용하거나, 긴 PCR 기반 융합 전략을 이용하는 것을 포함할 수 있다.
재
코딩된
폴리뉴클레오티드
본 발명의 다양한 구체예는 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편을 코딩하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 동일하게 유지되는 것인 폴리뉴클레오티드를 제공한다. 다양한 구체예에서, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 전에 동일하게 유지된다.
본 발명의 다양한 구체예는 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편을 코딩하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 최대 20개의 아미노산 치환, 첨가, 또는 결실을 포함하는 것인 폴리뉴클레오티드를 제공한다. 다양한 구체예에서, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 전에 최대 20개의 아미노산 치환, 첨가, 또는 결실을 포함한다.
본 발명의 다양한 구체예는 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편을 코딩하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 최대 10개의 아미노산 치환, 첨가, 또는 결실을 포함하는 것인 폴리뉴클레오티드를 제공한다. 다양한 구체예에서, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 전에 최대 10개의 아미노산 치환, 첨가, 또는 결실을 포함한다.
본 발명의 다양한 구체예는 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편을 코딩하는 폴리뉴클레오티드로서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 최대 12개의 아미노산 치환, 첨가, 또는 결실을 포함하는 것인 폴리뉴클레오티드를 제공한다. 다양한 구체예에서, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 전에 최대 12개의 아미노산 치환, 첨가, 또는 결실을 포함한다.
다양한 구체예에서, 상기 아미노산 서열은 최대 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 아미노산 치환, 첨가, 또는 결실을 포함한다. 다양한 구체예에서, 상기 아미노산 서열은 1-5, 6-10, 11-15 또는 16-20개의 아미노산 치환, 첨가, 또는 결실을 포함한다. 다양한 구체예에서, 상기 아미노산 결실, 치환 또는 첨가는 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 앞의 핵산 결실(들), 치환(들) 또는 첨가(들)로부터 초래된다.
다양한 구체예에서, 상기 아미노산 서열은 12개의 아미노산 결실을 포함한다. 다양한 구체예에서, 상기 아미노산 서열은 1-5, 6-10, 11-15, 또는 16-20개의 아미노산 결실을 포함한다. 다양한 구체예에서, 상기 아미노산 치환, 첨가 또는 결실은 재코딩된 서열에서 하나 이상의 점 돌연변이로 인한 것일 수 있다. 다양한 구체예에서, 상기 아미노산 결실, 치환, 또는 첨가는 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 앞의 핵산 결실(들), 치환(들) 또는 첨가(들)로부터 초래된다.
따라서, (핵산 결실(들), 치환(들) 또는 첨가(들)를 포함하거나 포함하지 않는) 이러한 재코딩된 폴리뉴클레오티드에 대한 다양한 구체예에서, 재코딩된 폴리뉴클레오티드는 폴리A 테일에 대해 상이한 길이; 예를 들면, 3' 말단에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 51, 52, 53 또는 54개의 연속적인 아데닌; 또는 예를 들어, 3' 말단에 1-6, 7-12, 13-18, 19-24, 25-30, 31-36, 37-42, 43-48 또는 49-54개의 연속적인 아데닌; 또는 예를 들어, 3' 말단에 9-37, 12-34, 15-33, 18-30 또는 21-27개의 연속적인 아데닌; 또는 예를 들어, 3' 말단에 19-25개의 연속적인 아데닌을 가질 수 있다.
다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈-쌍 편향(CPB)을 감소시킴으로써 재코딩된다. 다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈 사용빈도 편향(codon usage bias)을 감소시킴으로써 재코딩된다. 다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CpG 또는 UpA 디뉴클레오티드의 수를 증가시킴으로써 재코딩된다.
다양한 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편은 -0.05 미만, -0.1 미만, -0.2 미만, -0.3 미만, 또는 -0.4 미만의 코돈-쌍 편향을 갖는다.
특정 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편은 -0.05 미만, 또는 -0.06 미만, 또는 -0.07 미만, 또는 -0.08 미만, 또는 -0.09 미만, 또는 -0.1 미만, 또는 -0.11 미만, 또는 -0.12 미만, 또는 -0.13 미만, 또는 -0.14 미만, 또는 -0.15 미만, 또는 -0.16 미만, 또는 -0.17 미만, 또는 -0.18 미만, 또는 -0.19 미만, 또는 -0.2 미만, 또는 -0.25 미만, 또는 -0.3 미만, 또는 -0.35 미만, 또는 -0.4 미만, 또는 -0.45 미만, 또는 -0.5 미만의 코돈-쌍 편향을 갖는다.
특정 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편은 모 서열 상의 상응하는 서열과 비교하여 적어도 0.05, 또는 적어도 0.06, 또는 적어도 0.07, 또는 적어도 0.08, 또는 적어도 0.09, 또는 적어도 0.1, 또는 적어도 0.11, 또는 적어도 0.12, 또는 적어도 0.13, 또는 적어도 0.14, 또는 적어도 0.15, 또는 적어도 0.16, 또는 적어도 0.17, 또는 적어도 0.18, 또는 적어도 0.19, 또는 적어도 0.2, 또는 적어도 0.25, 또는 적어도 0.3, 또는 적어도 0.35, 또는 적어도 0.4, 또는 적어도 0.45, 또는 적어도 0.5 감소된다. 특정 구체예에서, 이는 계산이 이루어질 모 서열의 상응하는 서열, 예를 들면, 변이체 바이러스의 상응하는 서열과의 비교이다.
다양한 구체예에서, 모 SARS-CoV-2 코로나바이러스는 SARS-CoV-2 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 영국(U.K.) 변이체이다. 일부 구체예에서, SARS-CoV-2 변이체는 남아프리카 변이체이다. 일부 구체예에서, SARS-CoV-2 변이체는 브라질 변이체이다. 일부 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 일부 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 일부 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계열(sub-lineage) BA.1, BA.1.1, BA.2, BA.3, BA.4 또는 BA.5이다. 일부 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계열 BA.4이다. 일부 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계열 BA.5이다.
영국 변이체의 예는 2021년 1월 19일자 GenBank 수탁 번호 MW462650(SARS-CoV-2/human/USA/MN-MDH-2252/2020), MW463056(SARS-CoV-2/human/USA/FL-BPHL-2270/2020) 및 MW440433(SARS-CoV-2/human/USA/NY-Wadsworth- 291673-01/2020)을 포함하나, 이에 한정되지 않고, 이들은 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다. 영국 변이체의 추가 예는 GISAID ID 번호 EPI_ISL_778842(hCoV-19/USA/TX-CDC-9KXP-8438/2020; 2020-12-28), EPI_ISL_802609(hCoV-19/USA/CA-CDC-STM-050/2020; 2020-12-28), EPI_ISL_802647 (hCoV-19/미국/FL-CDC-STM-043/2020; 2020-12-26), EPI_ISL_832014(hCoV-19/USA/UT-UPHL-2101178518/2020; 2020-12-31), EPI_ISL_850618(hCoV-19/USA/IN-CDC-STM-183/2020; 2020-12-31) 및 EPI_ISL_850960(hCoV-19/미국/FL-CDC-STM-A100002/2021; 2021-01-04)을 포함하나, 이에 한정되지 않고, 이들은 모두 2021년 1월 20일자 기준이고, 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다. 영국 변이체의 추가 예는 GISAID ID 번호, 2021년 1월 20일 기준인 EPI_ISL_778842(hCoV-19/USA/TX-CDC-9KXP-8438/2020; 2020-12-28), EPI_ISL_802609(hCoV-19/USA/CA-CDC-STM-050/2020; 2020-12-28), EPI_ISL_802647 (hCoV-19/USA/FL-CDC-STM-043/2020; 2020-12-26), EPI_ISL_832014 (hCoV-19/USA/UT-UPHL-2101178518/2020; 2020-12-31), EPI_ISL_850618(hCoV-19/USA/IN-CDC-STM-183/2020; 2020-12-31) 및 EPI_ISL_850960(hCoV-19/USA/FL-CDC-STM-A100002/2021), 2021-01-04), 및 2021년 6월 28일 기준인 EPI_ISL_581117, EPI_ISL_596982, EPI_ISL_599956, EPI_ISL_600093, EPI_ISL_606375, EPI_ISL_606415, EPI_ISL_606424, EPI_ISL_608363 및 EPI_ISL_608430을 포함하나, 이에 한정되지 않고, 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다.
남아프리카 변이체의 예는 GISAID ID 번호 EPI_ISL_766709(hCoV-19/Sweden/20-13194/2020; 2020-12-24), EPI_ISL_768828(hCoV-19/France/PAC-NRC2933/2020; 2020-12-22), EPI_ISL_770441(hCoV-19/Englan/205280030/2020; 2020-12-24) 및 EPI_ISL_819798(hCoV-19/England/OXON-F440A7/2020; 2020-12-18)를 포함하나, 이에 한정되지 않고, 모두 2021년 1월 20일 기준이며, 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다. 추가의 예는 모두 2021년 6월 28일 기준인 hCoV-19/Sweden/20-13194/2020 (EPI_ISL_766709), hCoV-19/England/205280030/2020 (EPI_ISL_770441), hCoV-19/France/PAC- NRC2933/2020 (EPI_ISL_768828), hCoV-19/South Korea/KDCA0463/2020 (EPI_ISL_762992), hCoV-19/Japan/IC-0433/2020 (EPI_ISL_768642), hCoV-19/Australia/NSW3876/2021 (EPI_ISL_775242), hCoV-19/Australia/NSW3872/2021 (EPI_ISL_775245), hCoV-19/France/PAC-NRC2929/2020 (EPI_ISL_768827), hCoV-19/England/205300109/2020 (EPI_ISL_770467), hCoV-19/England/205320747/2020 (EPI_ISL_770469), hCoV-19/England/205261884/2020 (EPI_ISL_770438), hCoV-19/England/205260233/2020 (EPI_ISL_770437), hCoV-19/England/ALDP-C8FEC7/2020 (EPI_ISL_777292), hCoV-19/England/205221138/2020 (EPI_ISL_766245), hCoV-19/England/205300065/2020 (EPI_ISL_770463), hCoV-19/Botswana/1217-IN1699/2020 (EPI_ISL_770472), hCoV-19/Botswana/1217-IN1660/2020 (EPI_ISL_770471), hCoV-19/England/ALDP-C8E7FA/2020 (EPI_ISL_777266), hCoV-19/England/MILK-C90388/2020 (EPI_ISL_777229), hCoV-19/Botswana/CV1615722/2020 (EPI_ISL_770474), hCoV-19/Botswana/CV1605828/2020 (EPI_ISL_770473), hCoV-19/Scotland/EDB11343/2020 (EPI_ISL_764279), hCoV-19/Scotland/EDB11342/2020 (EPI_ISL_764278), hCoV-19/England/ALDP-C690AF/2020 (EPI_ISL_777190), hCoV-19/Botswana/1223-IN1490/2020 (EPI_ISL_770475), hCoV-19/England/MILK-CA9C09/2020 (EPI_ISL_762362), hCoV-19/England/ALDP-CB4807/2020 (EPI_ISL_761052), hCoV-19/England/205300064/2020 (EPI_ISL_770462), hCoV-19/England/MILK-CA9BB1/2020 (EPI_ISL_762499), hCoV-19/England/MILK-CAE2B7/2020 (EPI_ISL_761059), hCoV-19/England/205390867/2021 (EPI_ISL_768815), hCoV-19/Botswana/1224-IN462/2020| (EPI_ISL_770470), hCoV-19/England/205280028/2020(EPI_ISL_770439), 및 hCoV-19/England/205280029/2020 (EPI_ISL_770440)을 포함하나, 이에 한정되지 않고, 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다.
브라질 변이체의 예는 모두 2021년 1월 20일 기준인 GISAID ID 번호 EPI_ISL_677212(hCoV-19/USA/VA-DCLS-2187/2020; 2020-11-12), EPI_ISL_723494(hCoV-19/USA/VA-DCLS-2191/2020; 2020-11-12), EPI_ISL_845768(hCoV- 19/USA/GA-EHC-458R/2021; 2021-01-05), EPI_ISL_848196(hCoV-19/Canada/LTRI-1192/2020; 2020-12-24) 및 EPI_ISL_848197(hCoV-19/Canada/LTRI-1258/2020; 2020-12-24)를 포함하나, 이에 한정되지 않고, 모두 그 전체가 설명된 것처럼 본원에 참조에 의해 포함된다.
델타(B1.617.2) 변이체의 예는 모두 2021년 6월 28일 기준인 GISAID ID 번호 EPI_ISL_1653403, EPI_ISL_1697977, EPI_ISL_1718959, EPI_ISL_1719027, EPI_ISL_2121225, EPI_ISL_2121637, EPI_ISL_2121989, EPI_ISL_2122659, EPI_ISL_212546 3, EPI_ISL_2126212, EPI_ISL_2126374, EPI_ISL_2127610, EPI_ISL_2127624, EPI_ISL_2127831 및 EPI_ISL_2131345를 포함하나, 이에 한정되지 않다.
다양한 구체예에서, 모 SARS-CoV-2 변이체는 이전에 변형된 바이러스 핵산이거나 이전에 약독화된 바이러스 핵산이다.
다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CPB 탈최적화된다. 다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈 사용빈도 최적화된다.
다양한 구체예에서, 탈최적화된 CPB는 인간의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 코로나바이러스의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 SARS-CoV-2 코로나바이러스의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 야생형 SARS-CoV-2 코로나바이러스의 CPB를 기반으로 한다. 야생형 SARS-CoV-2 코로나바이러스는 본원에서 논의된 다양한 구체예에 따른 SARS-CoV-2 변이체 코로나바이러스일 수 있다.
다양한 구체예에서, 탈최적화된 코돈 사용 빈도는 인간에서 빈번하게 사용되는 코돈에 기초한다. 다양한 구체예에서, 탈최적화된 코돈 사용빈도는 코로나바이러스에서 빈번하게 사용되는 코돈을 기반으로 한다. 다양한 구체예에서, 역최적화된 코돈 사용빈도는 빈번하게 사용되는 코돈 또는 SARS-CoV-2 코로나바이러스를 기반으로 한다. 다양한 구체예에서, 역최적화된 코돈 사용빈도는 야생형 SARS-CoV-2 코로나바이러스에서 빈번하게 사용되는 코돈 또는 CPB를 기반으로 한다. 야생형 SARS-CoV-2 코로나바이러스는 본 문서에 논의된 다양한 실시예에 따른 SARS-CoV-2 변이체 코로나바이러스일 수 있다.
다양한 구체예에서, 폴리뉴클레오티드는 재코딩된 스파이크 단백질, 스파이크 단백질의 단편, 및 이들의 조합을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 스파이크 단백질에서 푸린 절단 부위를 제거하는 아미노산의 결실을 초래하는 뉴클레오티드의 결실을 포함한다. 특정 이론에 얽매이고 싶지는 않지만, 본 발명자들은 푸린 절단 부위를 제거하는 것이 백신 및/또는 면역 조성물의 안전성의 동인(driver) 중 하나라고 믿는다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경되며, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 하나 이상의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 2개 이상의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 5개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 10개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 20개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 30개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 40개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 50개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 60개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 상기 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되고, 서열번호 1에 최대 70개의 돌연변이가 존재한다. 다양한 구체예에서, 서열번호 1의 돌연변이는 알파 변이체, 베타 변이체, 델타 변이체, 감마 변이체 또는 오미크론 변이체가 아니다.
서열번호 1은 야생형 WA-1 서열(완전히 설명된 것처럼 본원에 참조로 포함된 GenBank: MN985325.1)과 비교하여 탈최적화된 서열이다.
다양한 구체예에서, SARS-CoV-2 변이체는 알파 변이체이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 감마 변이체이다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하며, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
전장 재코딩된 서열(full length recoded sequence)
다양한 구체예에서, 폴리뉴클레오티드는 천연 분리주로부터의 SARS-CoV-2 변이체 서열을 포함하며, 상기 SARS-CoV-2 변이체 서열 중 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다. 다양한 구체예에서, SARS-CoV-2 변이체는 알파 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 감마 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.1, BA.1.1, BA.2, BA.3, BA.4 또는 BA.5이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.4 또는 BA.5이다. 이들 변이체의 예시적인 서열은 본원에 제공된 바와 같다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 폴리뉴클레오티드는 3' 말단에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 51, 52, 53 또는 54개의 연속적인 아데닌이 존재한다.
벡터, 세포, 폴리펩티드
다양한 구체예는 본 발명의 폴리뉴클레오티드를 포함하는 벡터를 제공한다. 본 발명의 폴리뉴클레오티드는 본원에서 논의된 바와 같은 재코딩된 폴리펩티드이다.
다양한 구체예는 본 발명의 폴리뉴클레오티드를 포함하는 벡터를 포함하는 세포를 제공한다. 본 발명의 폴리뉴클레오티드를 포함하는 벡터는 본원에서 논의된 것들이다.
다양한 구체예는 본 발명의 폴리뉴클레오티드를 포함하는 박테리아 인공 염색체(bacterial artificial chromosome: BAC)를 제공한다. 본 발명의 폴리뉴클레오티드는 본원에 논의된 바와 같이 재코딩된 폴리펩티드이다.
다양한 구체예는 본 발명의 폴리뉴클레오티드를 포함하는 세포를 제공한다. 다양한 구체예는 본 발명의 변형된/탈최적화된 감염성 SARS-CoV-2 변이체 RNA를 포함하는 세포를 제공한다.
다양한 구체예에서, 세포는 Vero 세포, HeLa 세포, BHK(baby hamster kidney) 세포, MA104 세포, 293T 세포, BSR-T7 세포, MRC-5 세포, CHO 세포, 또는 PER.C6 세포이다. 특정 구체예에서, 세포는 Vero 세포 또는 BHK 세포이다.
다양한 구체예는 본 발명의 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 제공한다. 본 발명의 폴리뉴클레오티드는 본원에서 논의된 바와 같은 재코딩된 폴리펩티드이다. 이 폴리펩티드는 천연 분리주로부터의 SARS-CoV-2 변이체에 의해 코딩된 폴리펩티드와 다른 특성을 나타낸다. 예를 들어, 본원에 논의된 바와 같이 재코딩된 폴리뉴클레오티드 및 탈최적화된 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 바이러스에 대해 약독화 특성을 발휘할 수 있다.
변형된 바이러스
본 발명의 다양한 구체예는 본 발명의 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드를 포함하는 변형된 SARS-CoV-2 변이체를 제공한다. 본 발명의 폴리뉴클레오티드는 본원에 논의된 바와 같은 재코딩된 폴리펩티드이다.
본 발명의 다양한 구체예는 본 발명의 폴리뉴클레오티드를 포함하는 변형된 SARS-CoV-2 변이체를 제공한다. 본 발명의 폴리뉴클레오티드는 본원에서 논의된 재코딩된 폴리펩티드 중 어느 하나이다.
다양한 구체예에서, 하나 이상의 바이러스 단백질의 발현은 모 SARS-CoV-2 변이체에 비해 감소된다.
다양한 구체예에서, 모 SARS-CoV-2 코로나바이러스는 SARS-CoV-2 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 영국 변이체, 남아프리카 변이체, 브라질 변이체, 델타 변이체, 또는 오미크론 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.1, BA.1.1, BA.2, BA.3, BA.4 또는 BA.5이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.4 또는 BA.5이다.
영국 변이체, 남아프리카 변이체, 브라질 변이체, 델타 변이체, 및 오미크론 변이체의 예는 본원에서 논의된 것들을 포함하나, 이에 한정되지 않다.
다양한 구체예에서, 모 SARS-CoV-2 변이체는 이전에 변형된 바이러스 핵산이거나 이전에 약독화된 바이러스 핵산이다.
다양한 구체예에서, 바이러스 단백질 중 하나 이상의 발현 감소는 스파이크 단백질의 재코딩 결과로서 감소된다.
다양한 구체예에서, 폴리뉴클레오티드는 모 SARS-CoV-2 변이체의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편을 코딩하고, 상기 폴리뉴클레오티드는 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 동일하게 유지된다.
다양한 구체예에서, 폴리뉴클레오티드는 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편을 코딩하고, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩되고, 상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 스파이크 단백질 또는 그의 단편의 아미노산 서열은 최대 15개의 아미노산 치환, 첨가 또는 결실을 포함한다. 다양한 구체예에서, 아미노산 서열은 최대 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15개의 아미노산 치환, 첨가 또는 삭제를 포함한다. 다양한 구체예에서, 아미노산 서열은 12개의 아미노산 결실을 포함한다. 다양한 구체예에서, 아미노산 서열은 1-3, 4-6, 7-9, 10-12 또는 13-15개의 아미노산 결실을 포함한다. 아미노산 치환, 첨가 또는 결실은 재코딩된 서열의 하나 이상의 점 돌연변이로 인한 것일 수 있다. 다양한 구체예에서, 아미노산 결실, 치환 또는 첨가는 모 SARS-CoV-2 변이체 서열의 핵산 서열의 폴리A 테일 전 핵산 결실, 치환 또는 첨가로부터 초래된다.
다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈-쌍 편향(CPB)을 감소시키거나 코돈 사용빈도 편향(codon usage bias)을 감소시킴으로써 재코딩된다.
다양한 구체예에서, 폴리뉴클레오티드는 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CpG 또는 UpA 디뉴클레오티드의 수를 증가시킴으로써 재코딩된다.
다양한 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편 각각은 -0.05 미만, -0.1 미만, -0.2 미만, -0.3 미만, 또는 -0.4 미만의 코돈-쌍 편향을 갖는다.
다양한 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편 각각은 -0.01 미만, -0.02 미만, -0.03 미만, 또는 -0.04 미만의 코돈-쌍 편향을 갖는다. 다양한 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편 각각은 -0.05 미만, 또는 -0.06 미만, 또는 -0.07 미만, 또는 -0.08 미만, 또는 -0.09 미만, 또는 -0.1 미만, 또는 -0.11 미만, 또는 -0.12 미만, 또는 -0.13 미만, 또는 -0.14 미만, 또는 -0.15 미만, 또는 -0.16 미만, 또는 -0.17 미만, 또는 -0.18 미만, 또는 -0.19 미만, 또는 -0.2 미만, 또는 -0.25 미만, 또는 -0.3 미만, 또는 -0.35 미만, 또는 -0.4 미만, 또는 -0.45 미만, 또는 -0.5 미만의 코돈-쌍 편향을 갖는다.
다양한 구체예에서, 재코딩된 스파이크 단백질 또는 그의 단편 각각의 코돈-쌍 편향은 적어도 0.01, 또는 적어도 0.02, 또는 적어도 0.03, 또는 적어도 0.04만큼 감소된다. 다양한 구체예에서, 코딩된 스파이크 단백질 또는 그의 단편 각각의 코돈-쌍 편향은 스파이크 단백질 또는 그의 단편을 코딩하는 상응하는 핵산과 비교하여, 적어도 0.05, 또는 적어도 0.06, 또는 적어도 0.07, 또는 적어도 0.08, 또는 적어도 0.09, 또는 적어도 0.1, 또는 적어도 0.11, 또는 적어도 0.12, 또는 적어도 0.13, 또는 적어도 0.14, 또는 적어도 0.15, 또는 적어도 0.16, 또는 적어도 0.17, 또는 적어도 0.18, 또는 적어도 0.19, 또는 적어도 0.2, 또는 적어도 0.25, 또는 적어도 0.3, 또는 적어도 0.35, 또는 적어도 0.4, 또는 적어도 0.45, 또는 적어도 0.5 만큼 감소된다. 특정 구체예에서, 이는 계산이 이루어질 상응하는 서열, 예를 들면, SARS-CoV-2 변이체의 스파이크 코딩 핵산의 상응하는 서열과 비교된다.
다양한 구체예에서, 모 SARS-CoV-2 코로나바이러스는 SARS-CoV-2 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 영국 변이체, 남아프리카 변이체, 브라질 변이체, 델타 변이체, 또는 오미크론 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.1, BA.1.1, BA.2, BA.3, BA.4 또는 BA.5이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.4 또는 BA.5이다.
영국 변이체, 남아프리카 변이체, 브라질 변이체, 델타 변이체, 및 오미크론 변이체의 예는 본원에서 논의된 것들을 포함하나, 이에 한정되지 않다.
다양한 구체예에서, 모 SARS-CoV-2 변이체는 이전에 변형된 바이러스 핵산이거나 이전에 약독화된 바이러스 핵산이다.
다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CPB 탈최적화된다. 다양한 구체예에서, 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈 탈최적화된다.
다양한 구체예에서, 탈최적화된 CPB는 인간의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 코로나바이러스의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 SARS-CoV-2 코로나바이러스의 CPB를 기반으로 한다. 다양한 구체예에서, 탈최적화된 CPB는 야생형 SARS-CoV-2 코로나바이러스의 CPB를 기반으로 한다. 야생형 SARS-CoV-2 코로나바이러스는 본원에서 논의된 다양한 구체예에 따른 SARS-CoV-2 변이체 코로나바이러스일 수 있다.
다양한 구체예에서, 탈최적화된 코돈 사용빈도는 인간에서 빈번하게 사용되는 코돈에 기초한다. 다양한 구체예에서, 탈최적화된 코돈 사용빈도는 코로나바이러스에서 빈번하게 사용되는 코돈을 기반으로 한다. 다양한 구체예에서, 탈최적화된 코돈 사용빈도는 SARS-CoV-2 코로나바이러스에서 빈번하게 사용되는 코돈을 기반으로 한다. 다양한 구체예에서, 탈최적화된 코돈 사용빈도는 야생형 SARS-CoV-2 코로나바이러스에서 빈번하게 사용되는 코돈을 기반으로 한다. 일부 구체예에서, 야생형 SARS-CoV-2 코로나바이러스는 본원에서 논의된 다양한 구체예에 따른 SARS-CoV-2 변이체 코로나바이러스일 수 있다.
다양한 구체예에서, 폴리뉴클레오티드는 스파이크 단백질 또는 그의 단편을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 스파이크 단백질에서 푸린 절단 부위를 제거하는 아미노산의 결실을 초래하는 뉴클레오티드의 결실을 포함한다. 특정 이론에 얽매이기를 원치 않으나, 본 발명자들은 푸린 절단 부위를 제거하는 것이 백신 및/또는 면역 조성물의 안전성의 동인 중 하나가 될 것이라고 믿는다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하며, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다.
다양한 구체예에서, 폴리뉴클레오티드는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 하나 이상의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 2개 이상의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 5개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 10개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 20개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 30개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 40개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 50개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 60개의 돌연변이가 존재한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 1을 포함하고, 서열번호 1에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체되며, 서열번호 1에 최대 70개의 돌연변이가 존재한다. 다양한 구체예에서, 서열번호 1의 돌연변이는 알파 변이체, 베타 변이체, 델타 변이체, 감마 변이체 또는 오미크론 변이체가 아니다.
다양한 구체예에서, SARS-CoV-2 변이체는 알파 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 감마 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.1, BA.1.1, BA.2, BA.3, BA.4 또는 BA.5이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통 BA.4 또는 BA.5이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 천연 분리주로부터의 SARS-CoV-2 변이체 서열을 포함하고, 상기 SARS-CoV-2 변이체 서열에서 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된다. 다양한 구체예에서, SARS-CoV-2 변이체는 알파 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 감마 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체 하위 계통이다. 이들 변이체의 예시적인 서열은 본원에 제공된 바와 같다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 폴리뉴클레오티드는 3' 말단에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 45, 46, 47, 48, 49, 50, 51, 52, 53 또는 54개의 연속적인 아데닌을 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 2(재코딩된 스파이크 단백질)를 코딩한다. 다양한 구체예에서, 폴리뉴클레오티드는 최대 10개의 돌연변이를 갖는, 서열번호 2(재코딩된 스파이크 단백질)를 인코딩한다.
다양한 구체예에서, 이들 변형된 변이체에 대한 최대 10개의 돌연변이를 갖는 재코딩된 스파이크 단백질 코딩 서열은 서열번호 1의 스파이크 코딩 서열이 아니다. 다양한 구체예에서, 이들 변형된 변이체에 대한 최대 10개의 돌연변이를 갖는 재코딩된 스파이크 단백질 코딩 서열은 nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1의 스파이크 코딩 서열이 아니다.
면역 및/또는 백신 조성물
다양한 구체예는 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 면역 조성물을 제공한다. 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12에 최대 20개의 돌연변이가 있는, 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 본 발명의 변형된 SARS-CoV-2 변이체는 생-약독화 바이러스(live-attenuated virus)이다.
다양한 구체예는 본 발명의 2개 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 보호 면역 반응을 유도하기 위한 다가 면역 조성물을 제공한다.
다양한 구체예는 원래의(original) SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 보호 면역 반응을 유도하기 위한 다가 면역 조성물을 제공한다. 즉, 원래의 SARS-CoV-2 코로나바이러스에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주(Washington Isolate)에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
일부 구체예에서 면역 조성물은 본원에 기술된 바와 같은 허용되는 부형제 또는 담체를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 본원에 기술된 안정화제를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 본원에 기술된 바와 같은 보조제(adjuvant)를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 수크로오스, 글리신 또는 둘 다를 추가로 포함한다. 다양한 구체예에서, 면역 조성물은 수크로오스(약 5%) 및 글리신(약 5%)을 추가로 포함한다. 다양한 구체예에서, 허용되는 담체 또는 부형제는 당, 아미노산, 계면활성제 및 이들의 조합으로 이루어진 군으로부터 선택된다. 다양한 구체예에서, 아미노산은 약 5% w/v의 농도로 존재한다. 적합한 아미노산의 비한정적 예는 아르기닌 및 히스티딘을 포함한다. 적합한 담체의 비한정적 예는 젤라틴 및 인간 혈청 알부민을 포함한다. 적합한 계면활성제의 비한정적 예는 0.01-0.05%의 매우 낮은 농도의 폴리소르베이트 80과 같은 비이온성 계면활성제를 포함한다.
다양한 구체예에서, 면역 조성물은 약 103-107 PFU의 투여량(dosage)으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 104-106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 108 PFU의 투여량으로 제공된다.
다양한 구체예에서, 면역 조성물은 약 5x103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x108 PFU의 투여량으로 제공된다.
다양한 구체예는 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 백신 조성물을 제공한다. 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 본 발명의 변형된 SARS-CoV-2 변이체는 생-약독화 바이러스이다.
다양한 구체예는 본 발명의 2개 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 다가 백신 조성물을 제공한다.
다양한 구체예는 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 보호 면역 반응을 유도하기 위한 다가 면역 조성물을 제공한다. 즉, 원래의 SARS-CoV-2 코로나바이러스에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
일부 구체예에서 면역 조성물은 본원에 기술된 바와 같은 허용되는 부형제 또는 담체를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 본원에 기술된 안정화제를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 본원에 기술된 바와 같은 보조제를 추가로 포함한다. 일부 구체예에서, 면역 조성물은 수크로오스, 글리신 또는 둘 다를 추가로 포함한다. 다양한 구체예에서, 면역 조성물은 수크로오스(5%) 및 글리신(5%)을 추가로 포함한다. 다양한 구체예에서, 허용되는 담체 또는 부형제는 당, 아미노산, 계면활성제 및 이들의 조합으로 이루어진 군으로부터 선택된다. 다양한 구체예에서, 아미노산은 약 5% w/v의 농도로 존재한다. 적합한 아미노산의 비한정적 예는 아르기닌 및 히스티딘을 포함한다. 적합한 담체의 비한정적 예는 젤라틴 및 인간 혈청 알부민을 포함한다. 적합한 계면활성제의 비한정적 예는 0.01-0.05%의 매우 낮은 농도의 폴리소르베이트 80과 같은 비이온성 계면활성제를 포함한다.
다양한 구체예에서, 백신 조성물은 약 103-107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 104-106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 108 PFU의 투여량으로 제공된다.
다양한 구체예에서, 면역 조성물은 약 5x103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 5x105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x108 PFU의 투여량으로 제공된다.
다양한 구체예는 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 백신 조성물을 제공한다. 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 본 발명의 변형된 SARS-CoV-2 변이체는 생-약독화 바이러스이다.
다양한 구체예는 본 발명의 2개 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 다가 백신 조성물을 제공한다.
다양한 구체예는 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 보호 면역 반응을 유도하기 위한 다가 면역 조성물을 제공한다. 즉, 원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
일부 구체예에서, 백신 조성물은 본원에 기술된 바와 같은 허용되는 부형제 또는 담체를 추가로 포함한다. 일부 구체예에서, 백신 조성물은 본원에 기술된 안정화제를 추가로 포함한다. 일부 구체예에서, 백신 조성물은 본원에 기술된 바와 같은 보조제를 추가로 포함한다. 일부 구체예에서, 백신 조성물은 수크로오스, 글리신 또는 둘 다를 추가로 포함한다. 다양한 구체예에서, 백신 조성물은 수크로오스(5%) 및 글리신(5%)을 추가로 포함한다. 다양한 구체예에서, 허용되는 담체 또는 부형제는 당, 아미노산, 계면활성제 및 이들의 조합으로 이루어진 군으로부터 선택된다. 다양한 구체예에서, 아미노산은 약 5% w/v의 농도로 존재한다. 적합한 아미노산의 비한정적 예는 아르기닌 및 히스티딘을 포함한다. 적합한 담체의 비한정적 예는 젤라틴 및 인간 혈청 알부민을 포함한다. 적합한 계면활성제의 비한정적 예는 0.01-0.05%의 매우 낮은 농도의 폴리소르베이트 80과 같은 비이온성 계면활성제를 포함한다.
다양한 구체예에서, 백신 조성물은 약 103-107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 104-106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 108 PFU의 투여량으로 제공된다.
다양한 구체예에서, 면역 조성물은 약 5x103 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x104 PFU의 투여량으로 제공된다. 다양한 구체예에서, 백신 조성물은 약 5x105 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x106 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x107 PFU의 투여량으로 제공된다. 다양한 구체예에서, 면역 조성물은 약 5x108 PFU의 투여량으로 제공된다.
대상체에서 면역 반응(또는 보호 면역 반응)을 유도하거나 대상체가 바이러스-관련 질병에 걸리는 것을 예방하거나, 또는 그 가능성을 감소시키기 위해 사용되는 경우, 본 발명의 약독화 바이러스는 약학적으로 허용되는 담체 또는 부형제를 추가로 포함하는 조성물의 형태로 대상체에게 투여될 수 있는 것으로 이해되어야 한다. 약학적으로 허용되는 담체 및 부형제는 당업자에게 공지되어 있으며, 0.01-0.1M, 바람직하게는 0.05M 인산염 완충액, 인산염 완충 식염수(PBS), DMEM, L-15, PBS 중 10-25% 수크로오스 용액, DMEM 중 10-25% 수크로오스 용액 또는 0.9% 식염수(saline)을 포함하나, 이에 한정되지 않는다. 이러한 담체는 또한 수성 또는 비수성 용액, 현탁액 및 에멀전을 포함한다. 수성 담체는 물, 알코올성/수성 용액, 에멀전 또는 현탁액, 식염수 및 완충된 매질(buffered media)을 포함한다. 비-수성 용매의 예로는 프로필렌 글리콜, 폴리에틸렌 글리콜, 올리브유와 같은 식물성 오일, 및 에틸 올레에이트(ethyl oleate)와 같은 주사 가능한 유기 에스테르가 있다. 비경구 비히클에는 염화나트륨 용액, 링거 덱스트로오스(Ringer's dextrose), 덱스트로오스 및 염화나트륨, 젖산 링거(lactated Ringer's) 및 고정 오일이 포함된다. 정맥 비히클에는 체액 및 영양 보충제(fluid and nutrient replenisher), 전해질 보충제, 예를 들면, 링거 덱스트로오스에 기반한 보충제 등이 포함된다. 고체 조성물은 예를 들어 글루코오스, 수크로오스, 만니톨, 소르비톨, 락토스, 전분, 스테아르산 마그네슘, 셀룰로오스 또는 셀룰로오스 유도체, 탄산나트륨, 젤라틴, 재조합 인간 혈청 알부민, 인간 혈청 알부민 및/또는 탄산마그네슘과 같은 무독성 고체 담체를 포함할 수 있다. 폐 및/또는 비강내 전달과 같은 에어로졸 투여를 위해, 작용제(agent) 또는 조성물은 바람직하게는 무독성 계면활성제, 예를 들어 C6 내지 C22 지방산의 에스테르 또는 부분 에스테르 또는 천연 글리세리드, 및 추진제와 함께 제제화된다. 비강내 전달을 촉진하기 위해 레시틴과 같은 추가 담체가 포함될 수 있다. 약학적으로 허용되는 담체 또는 부형제는 소량의 보조 물질, 예를 들면, 습윤제 또는 유화제, 보존제 및 기타 첨가제, 예를 들면, 항미생물제, 항산화제 및 킬레이트제를 추가로 포함할 수 있고, 이들은 유효 기간 및/또는 활성 성분의 효과를 증진시킨다. 본 발명의 조성물은 당업계에 널리 공지된 바와 같이, 대상체에게 투여한 후 활성 성분의 신속, 지속 또는 지연 방출을 제공하도록 제형화될 수 있다.
다양한 구체예에서, 백신 조성물 또는 면역 조성물은 정맥내, 또는 척수강내, 피하, 근육내, 피내 또는 비강내 전달을 위해 제형화된다. 다양한 구체예에서, 백신 조성물 또는 면역 조성물은 비강내 전달을 위해 제형화된다. 다양한 구체예에서, 백신 조성물 또는 면역 조성물은 점비제(nasal drop) 또는 비강 스프레이(nasal spray)를 통해 전달되도록 제형화된다.
본 발명의 조성물을 사용하는 방법.
본 발명의 면역 조성물의 용량(dose)을 대상체에게 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 면역 조성물은 본원에서 논의된 면역 조성물 중 하나이다. 다양한 구체예에서, 상기 용량은 예방적 유효량 또는 치료적 유효량이다.
본 발명의 다가 면역 조성물의 용량을 대상체에게 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다가 면역 조성물은 본원에서 논의된 면역 조성물 중 하나이다. 다양한 구체예에서, 상기 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하며, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 다가 면역 조성물은 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함한다. 즉, 원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
다양한 구체예에서, 면역 조성물은 정맥내, 척수강내, 피하, 근육내, 피내 또는 비강내로 투여된다. 다양한 구체예에서, 면역 조성물은 비강내로 투여된다. 다양한 구체예에서, 면역 조성물은 점비액 또는 점비 스프레이를 통해 투여된다.
다양한 구체예는 대상체에게 본 발명의 백신 조성물의 용량을 투여하는 것을 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 백신 조성물은 본원에 논의된 백신 조성물 중 어느 하나이다.
다양한 구체예는 대상체에게 본 발명의 다가 백신 조성물의 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다가 백신 조성물은 본원에 논의된 백신 조성물 중 어느 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 다가 백신 조성물은 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함한다. 즉, 원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
다양한 구체예에서, 면역 반응은 보호 면역 반응이다. 다양한 구체예에서, 상기 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, 백신 조성물은 정맥내, 척수강내, 피하, 근육내, 피내 또는 비강내로 투여된다. 다양한 구체예에서, 백신 조성물은 비강내로 투여된다. 다양한 실시 형태에서, 백신 조성물은 점비제 또는 점비 스프레이를 통해 투여된다.
다양한 구체예는 대상체에게 본 발명의 변형된 SARS-CoV-2 변이체의 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하며, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 면역 반응은 보호 면역 반응이다. 다양한 구체예에서, 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, 상기 용량은 약 103-107 PFU이다. 다양한 구체예에서, 상기 용량은 약 104-106 PFU이다. 다양한 구체예에서, 상기 용량은 약 103 PFU이다. 다양한 구체예에서, 상기 용량은 약 104 PFU이다. 다양한 구체예에서, 상기 용량은 약 105 PFU이다. 다양한 구체예에서, 상기 용량은 약 106 PFU이다. 다양한 구체예에서, 상기 용량은 약 107 PFU이다. 다양한 구체예에서, 상기 용량은 약 108 PFU이다.
다양한 구체예에서, 상기 용량은 약 5x103 PFU이다. 다양한 구체예에서, 상기 용량은 약 5x104 PFU이다. 다양한 구체예에서, 상기 용량은 약 5x105 PFU이다. 다양한 구체예에서, 상기 용량은 약 5x106 PFU이다. 다양한 구체예에서, 상기 용량은 약 5x107 PFU이다. 다양한 구체예에서, 상기 용량은 약 5x108 PFU이다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 정맥내, 또는 척수강내, 피하, 근육내, 피내 또는 비강내로 투여된다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 비강내로 투여된다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 점비제 또는 점비 스프레이를 통해 투여된다.
다양한 구체예는 본 발명의 변형된 SARS-CoV-2 변이체의 프라임 용량(prime dose)을 상기 대상체에게 투여하는 단계, 및 본 발명의 변형된 SARS-CoV-2 변이체의 1회 이상의 부스트 용량(boost dose)을 상기 대상체에게 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 본원에 논의된 변형된 SARS-CoV-2 변이체 중 어느 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하며, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 동일한 변형된 SARS-CoV-2 변이체를 이용한다. 다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 상이한 변형된 SARS-CoV-2 변이체를 이용한다. 다양한 구체예에서, 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체의 프라임 용량 및/또는 1회 이상의 부스트 용량은 정맥내로, 또는 척수강내로, 피하로, 근육내로, 피내로 또는 비강내로 투여된다. 다양한 구체예에서, 변형된 SARS-CoV-2 변이체의 프라임 용량 및/또는 1회 이상의 부스트 용량은 비강내로 투여된다. 다양한 구체예에서, 변형된 SARS-CoV-2 변이체의 프라임 용량 및/또는 1회 이상의 부스트 용량은 점비제 또는 점비 스프레이를 통해 투여된다.
다양한 구체예는 대상체에게 본 발명의 면역 조성물의 프라임 용량을 투여하는 단계; 및 대상체에게 본 발명의 면역 조성물의 1회 이상의 부스트 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다양한 구체예에서, 면역 조성물은 본원에 논의된 면역 조성물 중 어느 하나이다.
다양한 구체예는 대상체에게 본 발명의 다가 면역 조성물의 프라임 용량을 투여하는 단계; 및 대상체에게 본 발명의 다가 면역 조성물의 1회 이상의 부스트 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다양한 구체예에서, 다가 면역 조성물은 본원에 논의된 면역 조성물 중 어느 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 다가 백신 조성물은 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함한다. 즉, 원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 동일한 변형된 SARS-CoV-2 변이체를 포함하는 동일한 면역 조성물을 이용한다. 다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 상이한 변형된 SARS-CoV-2 변이체를 포함하는 상이한 면역 조성물을 이용한다. 다양한 구체예에서, 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, 면역 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 정맥내로, 또는 척수강내, 피하, 근육내, 피내 또는 비강내로 투여된다. 다양한 구체예에서, 면역 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 비강내로 투여된다. 다양한 구체예에서, 면역 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 점비제 또는 점비 스프레이를 통해 투여된다.
다양한 구체예는 대상체에게 본 발명의 백신 조성물의 프라임 용량을 투여하는 단계; 및 대상체에게 본 발명의 백신 조성물의 1회 이상의 부스트 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다양한 구체예에서, 백신 조성물은 본원에 논의된 백신 조성물 중 어느 하나이다.
다양한 구체예는 대상체에게 본 발명의 다가 백신 조성물의 프라임 용량을 투여하는 단계; 및 대상체에게 본 발명의 다가 백신 조성물의 1회 이상의 부스트 용량을 투여하는 단계를 포함하는, 대상체에서 면역 반응을 유도하는 방법을 제공한다. 다양한 구체예에서, 백신 조성물은 본원에 논의된 백신 조성물 중 어느 하나이다.
다양한 구체예에서, SARS-CoV-2 변이체는 베타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8을 포함하고, 서열번호 8에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 8과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 델타 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9를 포함하고, 서열번호 9에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 9와 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10을 포함하며, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 10과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11을 포함하고, 서열번호 10에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 11과 적어도 99.5% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, SARS-CoV-2 변이체는 오미크론 변이체이다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12를 포함하고, 서열번호 12에 최대 20개의 돌연변이를 갖는다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 95%, 96%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다. 다양한 구체예에서, 폴리뉴클레오티드는 서열번호 12와 적어도 99.5%의 서열 동일성을 갖는 폴리뉴클레오티드를 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체는 재코딩된 스파이크 단백질을 포함한다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 8의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 9의 뉴클레오티드 21,563 내지 25,342이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 3이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 4이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 5이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 6이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 7이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 10의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 11의 뉴클레오티드 21,563 내지 25,339이다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 최대 10개의 돌연변이를 갖는 서열번호 12의 뉴클레오티드 21,563 내지 25,333이다.
다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 3과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 4와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 5와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 6과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 7과 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 10의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 11의 뉴클레오티드 21,563 내지 25,339와 적어도 98%, 또는 적어도 99% 동일하다. 다양한 구체예에서, 재코딩된 스파이크 단백질 코딩 서열은 서열번호 12의 뉴클레오티드 21,563 내지 25,333과 적어도 98%, 또는 적어도 99% 동일하다.
다양한 구체예에서, 다가 백신 조성물은 원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스 및 본 발명의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함한다. 즉, 원래의 SARS-CoV-2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스는 변형된 SARS-CoV-2 변이체가 아니다. 각각의 변형된 SARS-CoV-2 변이체는 본원에서 논의된 변형된 SARS-CoV-2 변이체 중 하나이다.
원래의 SARS-CoV2에 대해 탈최적화된 변형된 SARS-CoV-2 코로나바이러스의 예는 워싱턴 분리주에 대해 탈최적화된 것이다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않다. 다양한 구체예에서, 변형된 SARS-CoV-2 코로나바이러스는 서열번호 1, nt 9469는 A에서 G로 변경되고, nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하고, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않다.
다양한 구체예에서, 기본 용량 및 1회 이상의 추가 부스트 용량은 동일한 변형된 SARS-CoV-2 변이체를 포함하는 동일한 백신 조성물을 활용한다. 다양한 구체예에서, 프라임 용량 및 1회 이상의 추가 부스트 용량은 상이한 변형된 SARS-CoV-2 변이체를 포함하는 상이한 백신 조성물을 활용한다. 다양한 구체예에서, 용량은 예방적으로 유효하거나 치료적으로 효과적인 용량이다.
다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 동일한 변형된 SARS-CoV-2 변이체를 포함하는 동일한 백신 조성물을 이용한다. 다양한 구체예에서, 프라임 용량 및 1회 이상의 부스트 용량은 상이한 변형된 SARS-CoV-2 변이체를 포함하는 상이한 백신 조성물을 이용한다. 다양한 구체예에서, 용량은 예방적 유효량 또는 치료적 유효량이다.
다양한 구체예에서, 백신 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 정맥내로, 또는 척수강내, 피하, 근육내, 피내 또는 비강내로 투여된다. 다양한 구체예에서, 백신 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 비강내로 투여된다. 다양한 구체예에서, 백신 조성물의 프라임 용량 및/또는 1회 이상의 부스트 용량은 점비제 또는 점비 스프레이를 통해 투여된다.
프라임 투여량과 부스트 투여량 사이의 시간 간격(timing)은, 예를 들어 감염 또는 질병의 단계(예를 들면, 비-감염, 감염, 감염 후 일수) 및 환자의 건강에 따라 달라질 수 있다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 2주 후에 투여된다. 즉, 프라임 용량이 투여되고, 약 2주 후에 부스트 용량이 투여된다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 4주 후에 투여된다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 6주 후에 투여된다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 8주 후에 투여된다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 12주 후에 투여된다. 다양한 구체예에서, 1회 이상의 부스트 용량은 프라임 용량의 투여 약 1-12주 후에 투여된다.
다양한 구체예에서, 1회 이상의 부스트 용량은 1회 부스트 용량으로 제공될 수 있다. 다른 구체예에서, 1회 이상의 부스트 용량은 주기적으로 부스트 용량으로 제공될 수 있다. 예를 들어, 분기별, 4개월마다, 6개월마다, 매년, 2년마다, 3년마다, 4년마다, 5년마다, 6년마다, 7년마다, 8년마다, 9년마다 또는 10년마다 제공될 수 있다.
다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 103-107 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 104-106 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 103 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 104 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 105 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 106 PFU이다. 다양한 구체예에서, 용량은 약 107 PFU이다. 다양한 구체예에서, 용량은 약 108 PFU이다.
다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 5x103 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 5x104 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 각각 약 5x105 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 각각 약 5x106 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 각각 약 5x107 PFU이다. 다양한 구체예에서, 프라임 용량 및 부스트 용량은 각각 약 5x108 PFU이다.
다양한 구체예에서, 프라임 용량 및 부스트 용량의 투여량은 동일하다.
다양한 구체예에서, 투여량(dosage amount)은 프라임 투여량과 부스트 투여량 간에 달라질 수 있다. 비한정적인 예로서, 프라임 용량은 부스트 용량에 비해 더 적은 수의 바이러스 카피를 포함할 수 있다. 예를 들어, 프라임 용량은 약 103 PFU이고 부스트 용량은 약 104-106 PFU이거나, 또는 프라임 용량은 약 104이고 부스트 용량은 약 105-107 PFU이다.
부스트 용량이 주기적으로 투여되는 것인 다양한 구체예에서, 후속 부스트 용량은 최초 부스트 용량보다 적을 수 있다.
또 다른 비한정적인 예로서, 프라임 용량은 부스트 용량에 비해 더 많은 바이러스 카피를 포함할 수 있다.
다양한 구체예에서, 면역 반응은 보호 면역 반응이다.
다양한 구체예에서, 용량은 예방적 유효량이거나, 또는 치료적 유효량이다.
다양한 구체예에서, 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 면역 조성물, 본 발명의 백신 조성물, 본 발명의 다가 면역 조성물, 또는 본 발명의 다가 백신 조성물의 비강내 투여는 대상체에게 코를 풀고 머리를 뒤로 젖히도록 지시하는 단계; 선택적으로, 조성물이 코 외부 또는 목 아래로 떨어지는 것을 방지하기 위해 대상체에게 머리 위치를 변경하도록 지시하는 단계; 각 콧구멍에 투여량을 포함하는 약 0.25 mL를 투여하는 단계; 상기 대상체에게 부드럽게 흡입(sniff)하도록 지시하는 단계; 및 대상체에게 일정 기간, 예를 들면, 약 60분 동안 코를 풀지 말라고 지시하는 단계를 포함한다.
일부 구체예에서, 대상체는 어떠한 면역억제 약물도 복용하지 않는다. 다양한 구체예에서, 대상체는 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 면역 조성물 또는 본 발명의 백신 조성물의 투여 전 약 180일, 150일, 120일, 90일, 75일, 60일, 45일, 30일, 15일 또는 7일 동안 면역억제 약물을 복용하지 않는다. 다양한 구체예에서, 대상체는 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 면역 조성물 또는 본 발명의 백신 조성물의 투여 후 약 1일, 7일, 14일, 30일, 45일, 60일, 75일, 90일, 120일, 150일, 180일, 9개월, 12개월, 15개월, 18개월, 21개월 또는 24개월 동안 어떠한 면역억제 약물도 복용하지 않는다.
면역억제 약물은 하기를 포함하나, 그에 한정되지 않는다: 코르티코스테로이드(예를 들면, 프레드니손(Deltasone, Orasone), 부데소니드(Entocort EC), 프레드니솔론(Millipred)), 칼시뉴린 억제제(예를 들면, 사이클로스포린(Neoral, Sandimmune, SangCya), 타크롤리무스(Astagraf XL, Envarsus XR, Prograf), mTOR(Mechanistic target of rapamycin) 억제제(예를 들면, 시롤리무스(Rapamune), 에베롤리무스(Afinitor, Zortress)), 이노신 모노포스페이트 탈수소효소(IMDH) 억제제(예를 들면, 아자티오프린 (Azasan, Imuran), 레플루노미드(Arava), 미코페놀레이트 (CellCept, Myfortic)), 생물 제제(biologics) (예를 들면, 아바타셉트 (Orencia), 아달리무맙 (Humira), 아나킨라 (Kineret), 세르톨리주맙 (Cimzia), 에타네르셉트 (Enbrel), 골리무맙 (Simponi), 인플릭시맙(Remicade), 익세키주맙(ixekizumab) (Taltz), 나탈리주맙(Tysabri), 리툭시맙(Rituxan), 세쿠키누맙(Cosentyx), 토실리주맙(Actemra), 우스테키누맙(Stelara), 베돌리주맙(Entyvio)), 단일클론 항체(예를 들면, 바실릭시맙 (Simulect), 다클리주맙 (Zinbryta), 무로모납 (Orthoclone OKT3)).
의약 용도
본 발명의 다양한 구체예는 면역 반응을 유도하는 데 사용하거나 COVID-19의 치료 또는 예방적 치료를 위한 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물을 제공한다.
본 발명의 다양한 구체예는 면역 반응의 유도에서의 용도를 위한 COVID-19의 치료 또는 예방적 치료의 용도를 위한 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물로서, 상기 용도는 본 발명의 변형된 SARS-CoV-2 변이체, 또는 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물의 프라임 용량 및 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물의 1회 이상의 부스트 용량을 포함하는 것인 COVID-19의 치료 또는 예방적 치료의 용도를 위한 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물을 제공한다.
본 발명의 다양한 구체예는 면역 반응을 유도하거나 COVID-19의 치료 또는 예방적 치료를 위한 약제의 제조에서 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물 또는 본 발명의 면역 조성물의 용도를 제공한다.
본 발명의 다양한 구체예는 면역 반응을 유도하거나 COVID-19의 치료 또는 예방적 치료를 위한 약제의 제조에서 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물 또는 본 발명의 면역 조성물의 용도로서, 본 발명의 변형된 SARS-CoV-2 변이체, 또는 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물의 프라임 용량 및 본 발명의 변형된 SARS-CoV-2 변이체, 본 발명의 백신 조성물, 또는 본 발명의 면역 조성물의 1회 이상의 부스트 용량을 포함하는 것인 용도를 제공한다.
다양한 구체예에서, 면역 조성물은 본원에 기술된 다가 면역 조성물이다.
다양한 구체예에서, 백신 조성물은 본원에 기술된 다가 백신 조성물이다.
본 발명의 변형된 SARS-CoV-2 변이체는 본원에 논의된 변형된 SARS-CoV-2 코로나바이러스 중 어느 하나이다. 본 발명의 백신 조성물은 본원에 논의된 백신 조성물 중 어느 하나이다. 본 발명의 면역 조성물은 본원에 논의된 면역 조성물 중 어느 하나이다.
다양한 구체예에서, 면역 반응은 보호 면역 반응이다.
제조 방법
다양한 구체예는 모 SARS-CoV-2 변이체의 하나 이상의 단백질 또는 그의 하나 이상의 단편을 코딩하는 뉴클레오티드 서열을 수득하는 단계; 상기 하나 이상의 단백질 또는 그의 하나 이상의 단편의 단백질 발현을 감소시키기 위해 뉴클레오티드 서열을 재코딩하는 단계, 및 상기 재코딩된 뉴클레오티드 서열을 갖는 핵산을 모 SARS-CoV-2 변이체 게놈 내로 치환하여 변형된 SARS-CoV-2 변이체 게놈을 제조하는 단계를 포함하는, 변형된 SARS-CoV-2 변이체를 제조하는 방법으로서, 상기 재코딩된 뉴클레오티드 서열의 발현은 모 바이러스에 비해 감소된 것인 방법을 제공한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체 게놈을 제조하는 것은 클로닝 숙주를 사용하는 것을 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체 게놈을 제조하는 것은 BAC 벡터를 사용하거나, 오버랩 신장(overlap extension) PCR 전략 또는 긴 PCR 기반 융합(long PCR-based fusion) 전략을 사용하여 감염성 cDNA 클론을 구축하는 것을 포함한다.
다양한 구체예에서, 변형된 SARS-CoV-2 변이체 게놈은 결실, 치환 및 첨가를 포함한, 하나 이상의 돌연변이를 추가로 포함한다. 하나 이상은 1-5, 6-10, 11-15, 16-20, 21-25, 26-30, 31-35, 36-40, 41-45, 46-50, 51-60, 61-70, 71-80, 81-90 또는 91-100개의 돌연변이일 수 있다.
다양한 구체예에서, 상기 하나 이상의 단백질 또는 그의 하나 이상의 단편의 단백질 발현을 감소시키기 위해 뉴클레오티드 서열을 재코딩하는 것은 본원에서 논의된 바와 같이, 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈-쌍 편향(CPB)을 감소시키거나, 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈 사용빈도 편향을 감소시키거나, 모 SARS-CoV-2 변이 폴리뉴클레오티드와 비교하여 CpG 또는 UpA 디뉴클레오티드의 수를 증가시키는 것에 의해 이루어진다.
본 발명의 다양한 구체예는 SARS-CoV-2 변이체의 바이러스 RNA에 대해 역전사 중합효소 연쇄 반응("RT-PCR")을 수행하여 cDNA를 생성하는 단계; 중합효소 연쇄 반응("PCR")을 수행하여 cDNA로부터 2개 이상의 중첩(overlapping) cDNA 단편을 생성하고 증폭하는 단계로서, 상기 2개 이상의 중첩 cDNA 단편은 전체적으로 SARS-CoV-2 변이체를 코딩하는 것인 단계; 바이러스 RNA로부터 생성된 하나 이상의 상응하는 중첩 cDNA 단편을 변형된 서열을 포함하는 하나 이상의 중첩 cDNA 단편으로 치환하는 단계; 및 중첩 및 증폭 PCR을 수행하여 변형된 바이러스 게놈을 구축하는 단계로서, 상기 변형된 바이러스 게놈은 하나 이상의 변형된 서열을 포함하는 것인 단계를 포함하는, 변형된 바이러스 게놈을 생성하는 방법을 포함한다. 다양한 구체예에서, 이 방법은 cDNA를 생성하기 위해 SARS-CoV-2 변이체의 바이러스 RNA에 대해 RT-PCR을 수행하기 전에 허용 세포(permissive cell)에서 SARS-CoV-2 변이체 RNA 바이러스 분리물의 적어도 1회 계대를 수행하는 단계를 포함한다.
중합효소 연쇄 반응("PCR")을 수행하여, SARS-CoV-2 변이체의 바이러스 RNA를 코딩하는 cDNA로부터 2개 이상의 중첩 PCR을 생성하고 증폭시키는 단계로서, 상기 2개 이상의 중첩 cDNA 단편은 전체적으로(collectively) SARS-CoV-2 변이체를 코딩하고, 하나 이상의 상응하는 중첩 cDNA 단편을 변형된 서열을 포함하는 하나 이상의 중첩 cDNA 단편은 변형된 서열을 코딩하는 것인 단계; 및 중첩 및 증폭 PCR을 수행하여 변형된 바이러스 게놈을 구축하는 단계로서, 상기 변형된 바이러스 게놈은 하나 이상의 변형된 서열을 포함하는 것인 단계를 포함하는, 변형된 바이러스 게놈을 생성하는 방법을 포함한다.
본 발명의 다양한 구체예는 중합효소 연쇄 반응("PCR")을 수행하여, SARS-CoV-2 변이체의 바이러스 RNA를 코딩하는 cDNA로부터 2개 이상의 중첩 PCR을 생성하고 증폭시키는 단계로서, 상기 2개 이상의 중첩 cDNA 단편은 전체적으로 SARS-CoV-2 변이체를 코딩하는 것인 단계; 하나 이상의 상응하는 중첩 cDNA 단편을 변형된 서열을 포함하는 하나 이상의 중첩 cDNA 단편으로 치환하는 단계; 중첩 및 증폭 PCR을 수행하여 변형된 바이러스 게놈을 구축하는 단계로서, 상기 변형된 바이러스 게놈은 하나 이상의 변형된 서열을 포함하는 것인 단계를 포함하는, 변형된 바이러스 게놈을 생성하는 방법을 제공한다.
다양한 구체예에서, cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성 및 증폭하기 위해 PCR을 수행하는 것은 2개 이상의 프라이머 쌍을 사용하는 것을 포함하고, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다. 다양한 구체예에서, cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 표 4에서 선택된 2개 이상의 프라이머 쌍을 사용하는 것을 포함한다.
다양한 구체예에서, cDNA로부터 두 개 이상의 중첩 cDNA 단편을 생성 및 증폭하기 위해 PCR을 수행하는 것은 5개 이상의 프라이머 쌍을 사용하는 것을 포함하고, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다. 다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 5개 이상의 중첩 cDNA 단편이고, 5개 이상의 중첩 cDNA 단편은 전체적으로 RNA 바이러스를 코딩한다. 다양한 구체예에서, cDNA로부터 5개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 표 4에서 선택된 5개 이상의 프라이머 쌍을 사용하는 것을 포함한다.
다양한 구체예에서, cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성 및 증폭하기 위해 PCR을 수행하는 것은 10개 이상의 프라이머 쌍을 사용하는 것을 포함하고, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다. 다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 10개 이상의 중첩 cDNA 단편이고, 10개 이상의 중첩 cDNA 단편은 전체적으로 RNA 바이러스를 코딩한다. 다양한 구체예에서, cDNA로부터 10개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 표 4에서 선택된 10개 이상의 프라이머 쌍을 사용하는 것을 포함한다.
다양한 구체예에서, cDNA로부터 두 개 이상의 중첩 cDNA 단편을 생성하고 증폭하기 위해 PCR을 수행하는 것은 15개 이상의 프라이머 쌍을 사용하는 것을 포함하고, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다. 다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 15개 이상의 중첩 cDNA 단편이고, 15개 이상의 중첩 cDNA 단편은 전체적으로 RNA 바이러스를 코딩한다. 다양한 구체예에서, cDNA로부터 15개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 표 4에서 선택된 15개 이상의 프라이머 쌍을 사용하는 것을 포함한다.
다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 20개 이상의 중첩 cDNA 단편이고, 20개 이상의 중첩 cDNA 단편은 전체적으로 RNA 바이러스를 코딩한다. 다양한 구체예에서, cDNA로부터 20개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 20개 이상의 프라이머 쌍을 사용하는 것을 포함하며, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다.
다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 25개 이상의 중첩 cDNA 단편이고, 25개 이상의 중첩 cDNA 단편은 전체적으로 RNA 바이러스를 코딩한다. 다양한 구체예에서, cDNA로부터 25개 이상의 중첩 cDNA 단편을 생성하고 증폭시키기 위해 PCR을 수행하는 것은 25개 이상의 프라이머 쌍을 사용하는 것을 포함하며, 각 쌍은 각각의 중첩 cDNA 단편에 특이적이다.
다양한 구체예에서, cDNA로부터의 2개 이상의 중첩 cDNA 단편은 19개의 중첩 cDNA 단편이고, 19개의 중첩 cDNA 단편은 전체적으로 SARS-CoV-2 변이체, 예를 들어, 본원에 논의된 알파, 베타, 델타 또는 감마를 코딩한다. 다양한 구체예에서, PCR을 수행하여 제1 cDNA로부터 19개의 중첩 cDNA 단편을 생성하고 증폭시키는 것은 표 4의 19개 프라이머 쌍 모두를 사용하는 것을 포함한다.
다양한 구체예에서, 중첩(overlap) 길이는 약 40-400bp이다. 다양한 구체예에서, 중첩 길이는 약 200bp이다. 다양한 구체예에서, 중첩 길이는 약 40-100bp이다. 다양한 구체예에서, 중첩 길이는 약 100-200bp이다. 다양한 구체예에서, 중첩 길이는 약 100-150bp이다. 다양한 구체예에서, 중첩 길이는 약 150-200bp이다. 다양한 구체예에서, 중첩 길이는 약 200-250bp이다. 다양한 구체예에서, 중첩 길이는 약 200-300bp이다. 다양한 구체예에서, 중첩 길이는 약 300-400bp이다.
다양한 구체예에서, 프라이머의 길이는 약 15-55 염기쌍(bp) 길이이다. 다양한 구체예에서, 프라이머의 길이는 약 19-55bp 길이이다. 다양한 구체예에서, 프라이머의 길이는 약 10-65bp 길이이다. 다양한 구체예에서, 프라이머의 길이는 약 16-20, 21-25, 26-30, 31-35, 36-40, 41-45, 46-50, 51-55, 56-60 또는 61-65bp 길이이다.
다양한 구체예에서, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 2개 이상의 중첩 cDNA 단편에 대해 동시에 수행된다. 따라서, 5개 이상의 중첩 cDNA 단편이 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 5개의 단편에 대해 동시에 수행된다. 추가 예로서, 중첩 cDNA 단편이 8개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 8개의 단편에 대해 동시에 수행되고; 중첩 cDNA 단편이 10개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 10개의 단편에 대해 동시에 수행되며; 중첩 cDNA 단편이 15개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 15개의 단편에 대해 동시에 수행되고; 중첩 cDNA 단편이 19개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 19개의 단편에 대해 동시에 수행되고; 중첩 cDNA 단편이 20개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 20개의 단편에 대해 동시에 수행되며; 중첩 cDNA 단편이 25개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 25개의 단편에 대해 동시에 수행되고; 중첩 cDNA 단편이 30개 더 존재하는 경우, 탈최적화된 바이러스 게놈을 구축하기 위해 중첩 PCR을 수행하는 것은 해당하는 30개의 단편에 대해 동시에 수행된다.
다양한 구체예에서, 본 발명의 방법은 플라스미드, BAC 또는 YAC와 같은 중간 DNA 클론을 사용하지 않는다. 다양한 구체예에서, 본 발명의 방법은 클로닝 숙주를 사용하지 않는다. 다양한 구체예에서, 본 발명의 방법은 서열에 인공 인트론을 포함하지 않으며; 예를 들어, 문제가 되는 서열 유전자좌를 중단시키기 위한 인공 인트론을 포함하지 않는다.
약독화된
바이러스 생성
본 발명의 다양한 구체예는 변형된 SARS-CoV-2 변이체를 생성하는 방법을 제공한다.
다양한 구체예에서, 상기 방법은 본 발명의 바이러스 게놈을 포함하는 벡터로 세포 집단을 형질감염시키는 단계; 세포 배양에서 상기 세포 집단을 적어도 1회 계대시키는 단계; 세포 배양에서 상층액을 수집하는 단계를 포함한다.
다양한 구체예에서, 상기 방법은 세포 집단을 본 발명의 변형된 감염성 SARS-CoV-2 변이체 RNA로 형질감염시키는 단계; 세포 집단을 배양하는 단계; 및 변형된 SARS-CoV-2 변이체를 포함하는 감염 배지를 수집하는 단계를 포함한다. 다양한 구체예에서, 세포 집단을 배양하는 단계는 세포 배양에서 세포 집단을 1회 이상 계대시키는 것을 포함한다.
다양한 실시 양태에서, 상기 방법은 상층액 또는 감염 배지를 농축하는 단계를 추가로 포함한다.
다양한 구체예에서, 상기 방법은 세포 집단을 2 내지 15회 계대시키는 단계; 및 세포 집단의 세포 배양물로부터 상층액을 수집하는 단계를 포함한다. 다양한 구체예에서, 방법은 세포 집단을 2 내지 10회 계대배양시키는 단계; 및 세포 집단의 세포 배양물로부터 상층액을 수집하는 단계를 포함한다. 다양한 구체예에서, 방법은 세포 집단을 2 내지 7회 계대시키는 단계; 및 세포 집단의 세포 배양물로부터 상층액을 수집하는 단계를 포함한다. 다양한 구체예에서, 방법은 세포 집단을 2 내지 5회 계대시키는 단계; 및 세포 집단의 세포 배양물로부터 상층액을 수집하는 단계를 포함한다. 다양한 구체예에서, 방법은 세포 집단을 2, 3, 4, 5, 6, 7, 8 또는 10회 계대시키는 단계; 및 세포 집단의 세포 배양물로부터 상층액을 수집하는 단계를 포함한다. 다양한 구체예에서, 세포 배양물로부터 상층액을 수집하는 단계는 세포 집단의 각 계대 동안 수행된다. 다른 구체예에서, 세포 배양물로부터 상층액을 수집하는 단계는 세포 집단의 1회 이상의 계대 동안 수행된다. 예를 들어, 이는 격 계대로, 2계대 마다, 또는 3계대 마다 등으로 수행될 수 있다.
본 발명의 다양한 구체예는 일정량의(a quantity of) 탈최적화된 감염성 RNA로 숙주 세포를 형질감염시키는 단계; 숙주 세포를 배양하는 단계; 및 탈최적화된 바이러스를 포함하는 감염 배지를 수집하는 단계를 포함하는, 탈최적화된 SARS-CoV-2 변이체를 생성하는 방법을 제공한다.
다양한 구체예에서, 이 방법은 SARS-CoV-2 변이체의 바이러스 RNA에 대해 역전사 중합효소 연쇄 반응("RT-PCR")을 수행하여 cDNA를 생성하는 단계; 중합효소 연쇄 반응("PCR")을 수행하여 cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성하고 증폭시키는 단계로서, 상기 2개 이상의 중첩 cDNA 단편은 전체적으로 SARS-CoV-2 변이체를 코딩하는 것인 단계; 바이러스 RNA로부터 생성된 하나 이상의 상응하는 중첩 cDNA 단편을 탈최적화된 서열을 포함하는 하나 이상의 중첩 cDNA 단편으로 치환하는 단계; 중첩 및 증폭 PCR을 수행하여 탈최적화된 바이러스 게놈을 구축하는 단계로서, 상기 탈최적화된 바이러스 게놈은 하나 이상의 탈최적화된 서열을 포함하는 것인 단계; 탈최적화된 게놈의 시험관내(in vitro) 전사를 수행하여 탈최적화된 RNA 전사체를 생성하는 단계; 및 탈최적화된 바이러스를 포함하는 감염 배지를 수집하는 단계를 포함한다.
다양한 구체예에서, 방법은 일정량의 탈최적화된 감염성 RNA으로 숙주 세포를 형질감염시키기 전에 일정량의 본 발명의 다양한 구체예에 따른 탈최적화된 감염성 RNA를 생성하는 단계를 추가로 포함한다. 따라서, 본 발명은 탈최적화된 바이러스 게놈의 시험관내 전사를 수행하여 탈최적화된 RNA 전사체를 생성하는 단계; 및 일정량의 탈최적화된 감염성 RNA로 숙주 세포를 형질감염시키는 단계; 숙주 세포를 배양하는 단계; 및 탈최적화된 바이러스를 포함하는 감염 배지를 수집하는 단계를 포함한다.
다른 구체예에서, 방법은 중합효소 연쇄 반응("PCR")을 수행하여 SARS-CoV-2 변이체의 바이러스 RNA를 코딩하는 cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성하고 증폭시키는 단계로서, 상기 2개 이상의 중첩 cDNA는 단편은 전체적으로 SARS-CoV-2 변이체를 코딩하고, 하나 이상의 중첩 cDNA 단편은 탈최적화된 서열을 포함하는 것인 단계; 중첩 및 증폭 PCR을 수행하여 탈최적화된 바이러스 게놈을 구축하는 단계로서, 상기 탈최적화된 바이러스 게놈은 하나 이상의 탈최적화된 서열을 포함하는 것인 단계; 및 탈최적화된 바이러스 게놈의 시험관내 전사를 수행하여 탈최적화된 RNA 전사체를 생성하는 단계; 숙주 세포를 배양하는 단계; 및 탈최적화된 바이러스를 포함하는 감염 배지를 수집하는 단계를 포함한다.
다른 구체예에서, 방법은 중합효소 연쇄 반응("PCR")을 수행하여 SARS-CoV-2 변이체의 바이러스 RNA를 코딩하는 cDNA로부터 2개 이상의 중첩 cDNA 단편을 생성하고 증폭시키는 단계로서, 상기 2개 이상의 중첩 cDNA는 단편은 전체적으로 SARS-CoV-2 변이체를 코딩하는 단계; 바이러스 RNA로부터 생성된 하나 이상의 상응하는 중첩 cDNA 단편을 탈최적화된 서열을 포함하는 하나 이상의 중첩 cDNA 단편으로 치환하는 단계; 중첩 및 증폭 PCR을 수행하여 탈최적화된 바이러스 게놈을 구축하는 단계로서, 상기 탈최적화된 바이러스 게놈은 하나 이상의 탈최적화된 서열을 포함하는 것인 단계; 및 탈최적화된 바이러스 게놈의 시험관내 전사를 수행하여 탈최적화된 RNA 전사체를 생성하는 단계; 숙주 세포를 배양하는 단계; 및 탈최적화된 바이러스를 포함하는 감염 배지를 수집하는 단계를 포함한다.
다양한 구체예에서, 상기 방법은 cDNA를 생성하기 위해 SARS-CoV-2 변이체의 바이러스 RNA에 대해 RT-PCR을 수행하기 전에 허용 세포에서 야생형 RNA 바이러스 분리주의 적어도 1회 계대를 수행하는 단계를 포함한다.
다양한 구체예에서, 상기 방법은 RT-PCR을 수행하기 전에 SARS-CoV-2 변이체로부터 바이러스 RNA를 추출하는 단계를 추가로 포함한다.
변형된 바이러스 게놈 및 변형된 바이러스 게놈을 생성하는 방법의 특정한 구체예는 본원에 제공되는 바와 같으며 변형된 SARS-CoV-2 변이체의 생성의 이러한 구체예에 포함된다.
키트
본 발명은 또한 대상체에 백신을 접종하거나, 면역 반응을 유도하거나, 대상체에서 보호 면역 반응을 유도하기 위한 키트에 관한 것이다. 키트는 면역 반응을 유도하거나 보호 면역 반응을 유도하는 본 발명의 방법을 실시하는 데 유용하다. 키트는 본 발명의 조성물 중 하나 이상을 포함하는 재료 또는 구성요소의 집합(assemblage)이다. 따라서, 일부 구체예에서, 키트는 본 발명의 본원에 논의된 변형 SARS-CoV-2 변이체 중 어느 하나를 포함하는 조성물, 본원에 논의된 면역 조성물 중 어느 하나, 또는 본원에 논의된 백신 조성물 중 어느 하나를 포함한다. 따라서, 일부 구체예에서 키트는 본원에 기술된 바와 같은 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는 조성물, 면역 조성물 또는 백신 조성물의 단위화된(unitized) 단일 투여량을 포함하고; 예를 들어, 각 바이알은 약 103-107 PFU의 변형된 SARS-CoV-2 변이체, 더 구체적으로는 104-106 PFU의 변형된 SARS-CoV-2 변이체, 104 PFU의 변형된 SARS-CoV-2 변이체, 105 PFU의 변형된 SARS-CoV-2 변이체 또는 106 PFU의 변형된 SARS-CoV-2 변이체, 또는 더 구체적으로는 5x104-5x106 PFU의 변형된 SARS-CoV-2 변이체, 5x104 PFU의 변형된 SARS-CoV-2 변이체, 5x105 PFU의 변형된 SARS-CoV-2 변이체, 또는 5x106 PFU CoV-2 변이체 또는 5x107 PFU의 변형된 SARS-CoV-2 변이체의 용량을 위해 충분한 양을 포함한다. 다양한 구체예에서, 키트는 본원에 기술된 바와 같은 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는 조성물, 면역 조성물, 백신 조성물, 다가 면역 조성물 또는 다가 백신 조성물을 포함하는 조성물의 다중 투여량을 포함하고; 예를 들어, 키트가 바이알당 10회의 투여량을 포함하는 경우, 각 바이알은 약 10 x 103-107 PFU의 변형된 SARS-CoV-2 변이체, 더 구체적으로는 10 x 104-106 PFU의 변형된 SARS-CoV-2 변이체, 10 x 104 PFU의 변형된 SARS-CoV-2 변이체, 10 x 105 PFU의 변형된 SARS-CoV-2 변이체 또는 10 x 106 PFU의 변형된 SARS-CoV-2 변이체, 또는 더 구체적으로는 50x104-50x106 PFU의 변형된 SARS-CoV-2 변이체, 50x104 PFU의 변형된 SARS-CoV-2 변이체, 50x105 PFU의 변형된 SARS-CoV-2 변이체, 또는 50x106 PFU CoV-2 변이체 또는 50x107 PFU의 변형된 SARS-CoV-2 변이체를 포함한다.
본 발명의 키트에 설계된(configured) 구성요소의 정확한 특성은 의도된 목적에 따라 달라진다. 예를 들어, 일부 구체예는 대상체에게 백신을 접종하거나, 면역 반응을 유도하거나, 대상체에서 보호 면역 반응을 유도할 목적으로 설계된다. 일 구체예에서, 키트는 구체적으로 포유동물 대상체를 예방적으로 치료할 목적으로 설계된다. 또 다른 구체예에서, 키트는 구체적으로 인간 대상체를 예방적으로 치료할 목적으로 설계된다. 추가 구체예에서, 키트는 농장 동물, 가축 및 실험실 동물과 같은, 그러나 이에 한정되지 않는 대상체를 치료하는 수의학적 적용을 위해 설계된다.
사용 설명서가 키트에 포함될 수 있다. "사용 설명서(instructions for use)"는 일반적으로 대상체에게 백신을 접종하거나, 대상체에서 면역 반응을 유도하거나 또는 보호 면역 반응을 유도하는 것과 같은 원하는 결과를 얻기 위해 키트의 구성요소를 사용하는 데 이용되는 기술을 설명하는 유형의 표현을 포함한다. 예를 들어, 비강 투여의 경우, 사용 설명서는 대상체가 코를 풀고 머리를 뒤로 젖히라는 설명, 대상체가 조성물이 코 외부 또는 목 아래로 떨어지는 것을 방지하기 위해 머리의 위치를 바꾸라는 설명, 각 콧구멍에 투여량을 포함하는 약 0.25 mL를 투여하라는 설명; 대상체가 부드럽게 흡입(sniff)하라는 설명 및/또는 대상체가 일정 기간 동안, 예를 들면, 약 60분 동안 코를 풀지 말라는 설명을 포함할 수 있으나, 그에 한정되지 않는다. 추가 설명은 대상체가 면역억제 약물을 복용하지 말라는 설명을 포함할 수 있다.
선택적으로, 키트는 기타 유용한 구성 요소, 예를 들면, 희석제, 완충제, 약학적으로 허용되는 담체, 주사기, 점적기(dropper), 카테터, 애플리케이터(applicator), 피펫팅 또는 측정 도구, 붕대 재료 또는 당업자에 의해 용이하게 인식될 기타 유용한 도구를 포함한다.
키트로 조립된 재료 또는 구성요소는 작동성과 유용성을 보존하는 임의의 편리하고 적합한 방식으로 보관되어 의사에게 제공될 수 있다. 예를 들어, 구성요소는 용해된 형태, 탈수된 형태 또는 동결건조된 형태일 수 있고, 실온, 냉장 또는 냉동 온도에서 제공될 수 있다. 구성요소는 일반적으로 적합한 포장재에 들어 있다. 본원에 사용된 문구 "포장재(packaging material)"는 본 발명의 조성물 등과 같은 키트의 내용물을 수용하는 데 사용되는 하나 이상의 물리적 구조를 의미한다. 포장재는 공지된 방법에 의해 구축되며, 바람직하게는 무균, 무오염 환경을 제공하도록 구축된다. 키트에 사용되는 포장재는 백신에 일반적으로 사용되는 포장재이다. 본원에 사용된 용어 "패키지(package)"는 개별 키트 구성요소를 수용할 수 있는 유리, 플라스틱, 종이, 호일 등과 같은 적합한 고체 매트릭스 또는 재료를 의미하다. 따라서, 예를 들어, 패키지는 본원에 기술된 본 발명의 변형된 SARS-CoV-2 변이체를 포함하는 조성물, 면역 조성물 또는 백신 조성물의 적합한 양을 포함하는 데 사용되는 유리 바이알일 수 있다. 포장재에는 일반적으로 키트 및/또는 그의 구성요소의 내용물 및/또는 목적을 나타내는 외부 라벨이 있다.
서열
서열번호 1(워싱턴 분리주(GenBank: MN985325.1)에 대해 탈최적화됨, 스파이크 단백질에 36개 뉴클레오티드 결실이 있고 폴리A 테일이 없음).
서열번호 2 (USA/WA1/2020 야생형 스파이크와 비교하여 재코딩된 스파이크 단백질)
전형적인 구체예가 참조된 도면에 예시된다. 본원에 개시된 구체예 및 도면은 제한적인 것이 아니라 예시적인 것으로 간주되어야 한다.
도 1a는 CDX-005(탈최적화 SARS-CoV-2 "워싱턴 분리주(Washington Isolate)" 바이러스)가 온도 민감성이고, 즉, 더 높은 온도에서 더 약독화된다는 것을 도시한다. 동일한 양의 CDX-005 바이러스(예를 들면, 100,000/5log 희석 또는 10,000/4log 희석)는 37℃에서 플라크를 형성하나, 40℃에서는 플라크를 형성하지 않을 것이다. 40℃에서는 플라크를 보려면 훨씬 더 많은 바이러스(즉, 100/2log 희석과 같은 더 낮은 희석)가 필요하며 그들은 매우 작다. 반면에, wt 바이러스는 온도 민감성으로 보이지 않다; 두 온도 모두에서 동일하게 잘 기능한다.
도 1b는 CDX-005, CDX-005.1(베타 변이체)에 대한 플라크 형성을 도시한다. 제1행은 37℃에서 3일간 인큐베이션된 CDX-005를 도시한다. 제2행은 40℃에서 3일간 인큐베이션된 CDX-005를 도시한다. 제3행은 37℃에서 3일간 인큐베이션된 CDX-005.1(베타 변이체)을 도시한다. 제2행은 40℃에서 3일간 인큐베이션된 CDX-005.1(베타 변이체)을 도시한다. 이 도면은 또한 CDX-005와 CDX-005.1이 온도 민감성이고, 즉, 더 높은 온도에서 더 약독화된다는 것을 보여준다. 동일한 양의 CDX-005 및 CDX-005.1 바이러스(예를 들면, 100,000/5log 희석 또는 10,000/4log 희석)는 37℃에서 플라크를 형성하나, 40℃에서는 플라크를 형성하지 않을 것이다. 40℃에서는 플라크를 보려면 훨씬 더 많은 바이러스(즉, 100/2log 희석과 같은 더 낮은 희석)가 필요하며 그들은 매우 작다. 이는 CDX-005.1이 40℃에서 온도에 매우 민감하다는 것을 보여준다. 플라크 분석(plaque assay)은 12-웰 클러스터에서 Vero E6 세포 단층의 동일한 배치에서 동시에 수행하고, 37℃ 또는 40℃에서 3일간 인큐베이션한 후 크리스틸 바이올렛(Crystal Violet)으로 염색하였다. 동일한 바이러스 연속 희석물(dilution series)로부터의 CDX-005(상단 2개의 행) 및 CDX-005.1(하단 2개의 행) 샘플을 사용하여 37℃ 또는 40℃에서 플라크 분석을 수행했다. CDX-005와 CDX-005.1은 모두 37℃에서 유사하게 플라크를 형성하는 반면, 40℃에서 CDX-005 플라크는 훨씬 더 작고, 불규칙한 모양이며, 갯수가 크게 감소되었다(약 1,000배). CDX-005.1은 CDX-005보다 훨씬 더 심하게 온도에 의해 제한되었고, 어떤 희석 비율에서도 40℃에서 가시적인 플라크를 형성하지 않았다. 상승된 온도(사람의 발열과 동등함)에서 온도 민감성 표현형은 일반적으로 약독화 바이러스 생백신의 긍정적인 안전성 특징으로 간주된다. 반면, 도 1a의 wt 바이러스의 경우, 온도 민감성으로 보이지 않다; wt 바이러스는 두 온도 모두에서 동일하게 잘 기능한다. 온도 민감성 표현형은 약독화 생백신의 우수하고 바람직한 특징이다. 이는 "안전 밸브(safety valve)"로 작용할 수 있다. 백신은 백신 접종자의 더 낮은 온도(37℃(정상 체온))에서 면역 반응을 유도하기에 충분히 잘 복제된다. 백신에 과민한 특정 개인에서와 같이, 상황이 계획대로 수행되지 않는 경우, 해당 개인은 열이 발생할 수 있으며, 이는 바이러스 복제/활성을 감소시켜, 상황이 악화되는 것을 방지할 것이다.
도 2는 시리아 골드 햄스터(Syrian Gold hamster)에서 야생형 SARS-COV-2 및 CDX-005의 투여 후 체중 변화를 도시한다.
도 3은 Vero 세포에서 wt WA1 및 CDX-005의 증식(growth)을 도시한다. Vero 세포를 0.01MOI의 wt WA1 또는 CDX-005로 감염시키고 33℃ 또는 37℃에서 최대 96시간 동안 배양했다. 바이러스를 회수하기 위해 상층액을 수집하였다. 역가는 플라크 형성 분석에 의해 측정되고, PFU/ml 배양 배지의 로그로 보고되었다.
도 4a-4d는 햄스터에서 CDX-005의 생체내(in vivo) 약독화를 도시한다. 햄스터에 5x104 또는 5x103 PFU/ml의 wt WA1, 5x104 PFU/ml CDX-005를 접종했다. 바이러스 RNA를 4a) 후신경구(olfactory bulb), 4b) 뇌, 및 4c) 폐에서 PI 2일차 및 4일차에 qPCR로 측정하였다. (N=3/그룹; 막대=SEM). 4d) 접종된 햄스터의 좌측 폐 조직에서 감염성 바이러스 부하(infectious virus load)를 TCID50 분석으로 평가하고 TCID50/ml의 log10으로 표현하였다. CDX-005와 wt WA1 처리 그룹 간의 차이는 유의했다 (N=3/그룹; P<0.001; 막대=SEM). 수평선은 LOD를 표시한다.
도 5a-5c는 햄스터에서 CDX-005의 생체내 약독화를 도시한다. 햄스터에 5x104 또는 5x103 PFU/ml의 wt WA1 또는 5x104 PFU/ml CDX-005를 접종했다. 5a) 햄스터의 중량을 9일 동안 매일 측정하였다. 중량 변화는 CDX-005와 wt WA1 처리 그룹 간에 유의하게 상이하였다 (CDX-005 및 wt WA1 5x104의 경우, N=10-40/그룹; wt WA1 5x103의 경우, N=3-12/그룹; P<0.001; 막대=SEM). 5b & 5c) 헤마톡실린 및 에오신 염색된 폐 절편을 PI 2일차, 4일차 및 6일차에 검사하고 세포 침윤에 대해 점수를 매겼다. (N=3/그룹)
도 6a-6d는 햄스터에서의 효능(efficacy)을 도시한다. 6a) 나이브(naive) 햄스터 대조군 혈청 또는 wt WA1 또는 5x104 PFU CDX-005의 접종 후 16일차에 햄스터로부터 수집한 혈청으로 스파이크-S1 ELISA를 수행했다. CDX-005 접종된 햄스터에서 스파이크 S1 IgG를 또한 18일차 (WA1 챌린지(challenge) 후 2일)에 측정하였다. 종점(endpoint) IgG 역가는 백그라운드보다 5X 높은 희석의 로그로 나타낸다. (N=3/그룹; 막대=SEM) 6b) SARS-CoV-2 WA1에 대한 플라크 감소 중화 역가 (Plaque Reduction Neutralization Titer: PRNT)는 5x104 또는 5x103 PFU의 wt WA1 또는 5x104 PFU의 CDX-005로 접종 후 16일차에 햄스터의 혈청에서 테스트하였다. PRNT는 나이브 햄스터 혈청을 함유하는 웰에 비해 플라크 수를 50, 80 또는 90% 감소시킨 최종 혈청 희석 배율(dilution)의 역수이다. (N=3/그룹; 막대=SD); 6c) 백신 접종 후 16일차에 CDX-005 백신 접종한 햄스터 및 나이브 동물을 5x104 PFU wt SARS-CoV-2로 챌린지하였다. 챌린지 후 2일차에 폐를 채취하고, 바이러스 부하(viral load)를 qPCR로 측정하고 qPCR 게놈/조직 ml의 log10으로 표현하였다. (N=3/그룹; 막대=SD). 6d) 햄스터에 비히클, 5x104 PFU의 wt WA1 또는 5x104 CDX-005로 백신 접종하고, 접종 후 27일차에 비강 내로 5x104 PFU/ml wt WA1로 챌린지하였다. 챌린지 당일 및 그 후 4일 동안 매일 중량을 기록하였다. (0-2일차 N=5-6, 3-4일차 N=3, 막대=SEM). 6a)와 6b)의 결과는 두 개의 개별 햄스터 연구에서 나온 것이다.
도 7은 아프리카 녹색 원숭이(African Green Monkey)의 약독화를 도시한다. 기관 세척액(tracheal lavage fluid)을 106 PFU wt WA1 또는 CDX-005의 접종 후 4일차 및 6일차에 원숭이로부터 수집하였다. 세척액을 RT-qPCR에 적용하여 바이러스를 검출하였다. N=3/그룹 (4일차) 또는 N=2/그룹 (6일차).
도 8은 아프리카 녹색 원숭이에서 106의 wt SARS-COV2 대 CDX-005 비강내 용량(intranasal dose)을 도시한다.
도 9는 Vero 세포로부터 채취된 CDX-005의 조 벌크 역가(crude bulk titre)를 도시한다. 베로 WHO "10-87" 세포를 1.8 x 104 PFU의 CDX-005 (~0.01 MOI)로 접종하고, 그 후, 48시간 동안 성장시켰다. 표시된 상이한 계획(scheme)을 이용하여 바이러스를 채취하였다.
도 10은 역유전학(Reverse Genetics)을 통한 CDX-005.1 바이러스의 성공적인 구제(rescue)를 보여준다. 2021년 5월 7일, 합성 게놈 DNA에서 유래된 합성 게놈 RNA로 Vero WHO 10-87 세포를 형질감염시킨 후 3일차에, 세포 상층액을 VeroE6 세포에 대한 플라크 분석을 통해 감염성 CDX-005.1 바이러스의 존재에 대해 테스트했다. 감염성 CDX-005.1 바이러스는 4.6 x 105 PFU/mL의 역가로 검출되었고, 플라크 크기는 CDX-005와 구별할 수 없었다.
도 11은 역유전학을 통한 CDX-005.2 바이러스의 성공적인 구제를 보여준다. 합성 게놈 DNA로부터 유래된 합성 게놈 RNA로 Vero WHO 10-87 세포를 형질감염시킨 후 4일차에, 세포 상층액을 VeroE6 세포에 대한 플라크 분석을 통해 감염성 CDX-005.2 바이러스의 존재에 대해 테스트했다. 감염성 CDX-005.2 바이러스는 2.5x105 PFU/mL의 역가로 검출되었rh, 플라크 크기는 CDX-005와 구별할 수 없었다.
도 12는 CDX-005.2가 40℃에서 온도에 민감하다는 것을 보여준다. 플라크 분석은 12-웰 클러스터에서 Vero E6 세포 단층의 동일한 배치에서 동시에 수행하고, 37℃ 또는 40℃에서 4일간 인큐베이션한 후 크리스탈 바이올렛으로 염색하였다. 동일한 바이러스 연속 희석물로부터의 CDX-005.2(상단 행) 및 CDX-005(하단 행) 샘플을 사용하여 37℃ 또는 40℃에서 플라크 분석을 수행했다. 40℃에서, 37℃의 허용 온도(permissive temperature) 대비 두 바이러스 모두에 대한 플라크는 훨씬 더 작고, 불규칙한 모양이며, 갯수가 크게 감소되었다(CDX-005의 경우 약 1,000배, 및 CDX-005.2의 경우 약 10,000배). 상승된 온도(사람의 발열과 동등함)에서 온도 민감성 표현형은 일반적으로 약독화 바이러스 생백신의 긍정적인 안전성 특징으로 간주된다.
도 13은 남아프리카 변이체(S.African variant) B.1.351에 대한 백신으로서 탈최적화 SARS-CoV2 (CDX.005)의 효능을 보여준다.
도 1a는 CDX-005(탈최적화 SARS-CoV-2 "워싱턴 분리주(Washington Isolate)" 바이러스)가 온도 민감성이고, 즉, 더 높은 온도에서 더 약독화된다는 것을 도시한다. 동일한 양의 CDX-005 바이러스(예를 들면, 100,000/5log 희석 또는 10,000/4log 희석)는 37℃에서 플라크를 형성하나, 40℃에서는 플라크를 형성하지 않을 것이다. 40℃에서는 플라크를 보려면 훨씬 더 많은 바이러스(즉, 100/2log 희석과 같은 더 낮은 희석)가 필요하며 그들은 매우 작다. 반면에, wt 바이러스는 온도 민감성으로 보이지 않다; 두 온도 모두에서 동일하게 잘 기능한다.
도 1b는 CDX-005, CDX-005.1(베타 변이체)에 대한 플라크 형성을 도시한다. 제1행은 37℃에서 3일간 인큐베이션된 CDX-005를 도시한다. 제2행은 40℃에서 3일간 인큐베이션된 CDX-005를 도시한다. 제3행은 37℃에서 3일간 인큐베이션된 CDX-005.1(베타 변이체)을 도시한다. 제2행은 40℃에서 3일간 인큐베이션된 CDX-005.1(베타 변이체)을 도시한다. 이 도면은 또한 CDX-005와 CDX-005.1이 온도 민감성이고, 즉, 더 높은 온도에서 더 약독화된다는 것을 보여준다. 동일한 양의 CDX-005 및 CDX-005.1 바이러스(예를 들면, 100,000/5log 희석 또는 10,000/4log 희석)는 37℃에서 플라크를 형성하나, 40℃에서는 플라크를 형성하지 않을 것이다. 40℃에서는 플라크를 보려면 훨씬 더 많은 바이러스(즉, 100/2log 희석과 같은 더 낮은 희석)가 필요하며 그들은 매우 작다. 이는 CDX-005.1이 40℃에서 온도에 매우 민감하다는 것을 보여준다. 플라크 분석(plaque assay)은 12-웰 클러스터에서 Vero E6 세포 단층의 동일한 배치에서 동시에 수행하고, 37℃ 또는 40℃에서 3일간 인큐베이션한 후 크리스틸 바이올렛(Crystal Violet)으로 염색하였다. 동일한 바이러스 연속 희석물(dilution series)로부터의 CDX-005(상단 2개의 행) 및 CDX-005.1(하단 2개의 행) 샘플을 사용하여 37℃ 또는 40℃에서 플라크 분석을 수행했다. CDX-005와 CDX-005.1은 모두 37℃에서 유사하게 플라크를 형성하는 반면, 40℃에서 CDX-005 플라크는 훨씬 더 작고, 불규칙한 모양이며, 갯수가 크게 감소되었다(약 1,000배). CDX-005.1은 CDX-005보다 훨씬 더 심하게 온도에 의해 제한되었고, 어떤 희석 비율에서도 40℃에서 가시적인 플라크를 형성하지 않았다. 상승된 온도(사람의 발열과 동등함)에서 온도 민감성 표현형은 일반적으로 약독화 바이러스 생백신의 긍정적인 안전성 특징으로 간주된다. 반면, 도 1a의 wt 바이러스의 경우, 온도 민감성으로 보이지 않다; wt 바이러스는 두 온도 모두에서 동일하게 잘 기능한다. 온도 민감성 표현형은 약독화 생백신의 우수하고 바람직한 특징이다. 이는 "안전 밸브(safety valve)"로 작용할 수 있다. 백신은 백신 접종자의 더 낮은 온도(37℃(정상 체온))에서 면역 반응을 유도하기에 충분히 잘 복제된다. 백신에 과민한 특정 개인에서와 같이, 상황이 계획대로 수행되지 않는 경우, 해당 개인은 열이 발생할 수 있으며, 이는 바이러스 복제/활성을 감소시켜, 상황이 악화되는 것을 방지할 것이다.
도 2는 시리아 골드 햄스터(Syrian Gold hamster)에서 야생형 SARS-COV-2 및 CDX-005의 투여 후 체중 변화를 도시한다.
도 3은 Vero 세포에서 wt WA1 및 CDX-005의 증식(growth)을 도시한다. Vero 세포를 0.01MOI의 wt WA1 또는 CDX-005로 감염시키고 33℃ 또는 37℃에서 최대 96시간 동안 배양했다. 바이러스를 회수하기 위해 상층액을 수집하였다. 역가는 플라크 형성 분석에 의해 측정되고, PFU/ml 배양 배지의 로그로 보고되었다.
도 4a-4d는 햄스터에서 CDX-005의 생체내(in vivo) 약독화를 도시한다. 햄스터에 5x104 또는 5x103 PFU/ml의 wt WA1, 5x104 PFU/ml CDX-005를 접종했다. 바이러스 RNA를 4a) 후신경구(olfactory bulb), 4b) 뇌, 및 4c) 폐에서 PI 2일차 및 4일차에 qPCR로 측정하였다. (N=3/그룹; 막대=SEM). 4d) 접종된 햄스터의 좌측 폐 조직에서 감염성 바이러스 부하(infectious virus load)를 TCID50 분석으로 평가하고 TCID50/ml의 log10으로 표현하였다. CDX-005와 wt WA1 처리 그룹 간의 차이는 유의했다 (N=3/그룹; P<0.001; 막대=SEM). 수평선은 LOD를 표시한다.
도 5a-5c는 햄스터에서 CDX-005의 생체내 약독화를 도시한다. 햄스터에 5x104 또는 5x103 PFU/ml의 wt WA1 또는 5x104 PFU/ml CDX-005를 접종했다. 5a) 햄스터의 중량을 9일 동안 매일 측정하였다. 중량 변화는 CDX-005와 wt WA1 처리 그룹 간에 유의하게 상이하였다 (CDX-005 및 wt WA1 5x104의 경우, N=10-40/그룹; wt WA1 5x103의 경우, N=3-12/그룹; P<0.001; 막대=SEM). 5b & 5c) 헤마톡실린 및 에오신 염색된 폐 절편을 PI 2일차, 4일차 및 6일차에 검사하고 세포 침윤에 대해 점수를 매겼다. (N=3/그룹)
도 6a-6d는 햄스터에서의 효능(efficacy)을 도시한다. 6a) 나이브(naive) 햄스터 대조군 혈청 또는 wt WA1 또는 5x104 PFU CDX-005의 접종 후 16일차에 햄스터로부터 수집한 혈청으로 스파이크-S1 ELISA를 수행했다. CDX-005 접종된 햄스터에서 스파이크 S1 IgG를 또한 18일차 (WA1 챌린지(challenge) 후 2일)에 측정하였다. 종점(endpoint) IgG 역가는 백그라운드보다 5X 높은 희석의 로그로 나타낸다. (N=3/그룹; 막대=SEM) 6b) SARS-CoV-2 WA1에 대한 플라크 감소 중화 역가 (Plaque Reduction Neutralization Titer: PRNT)는 5x104 또는 5x103 PFU의 wt WA1 또는 5x104 PFU의 CDX-005로 접종 후 16일차에 햄스터의 혈청에서 테스트하였다. PRNT는 나이브 햄스터 혈청을 함유하는 웰에 비해 플라크 수를 50, 80 또는 90% 감소시킨 최종 혈청 희석 배율(dilution)의 역수이다. (N=3/그룹; 막대=SD); 6c) 백신 접종 후 16일차에 CDX-005 백신 접종한 햄스터 및 나이브 동물을 5x104 PFU wt SARS-CoV-2로 챌린지하였다. 챌린지 후 2일차에 폐를 채취하고, 바이러스 부하(viral load)를 qPCR로 측정하고 qPCR 게놈/조직 ml의 log10으로 표현하였다. (N=3/그룹; 막대=SD). 6d) 햄스터에 비히클, 5x104 PFU의 wt WA1 또는 5x104 CDX-005로 백신 접종하고, 접종 후 27일차에 비강 내로 5x104 PFU/ml wt WA1로 챌린지하였다. 챌린지 당일 및 그 후 4일 동안 매일 중량을 기록하였다. (0-2일차 N=5-6, 3-4일차 N=3, 막대=SEM). 6a)와 6b)의 결과는 두 개의 개별 햄스터 연구에서 나온 것이다.
도 7은 아프리카 녹색 원숭이(African Green Monkey)의 약독화를 도시한다. 기관 세척액(tracheal lavage fluid)을 106 PFU wt WA1 또는 CDX-005의 접종 후 4일차 및 6일차에 원숭이로부터 수집하였다. 세척액을 RT-qPCR에 적용하여 바이러스를 검출하였다. N=3/그룹 (4일차) 또는 N=2/그룹 (6일차).
도 8은 아프리카 녹색 원숭이에서 106의 wt SARS-COV2 대 CDX-005 비강내 용량(intranasal dose)을 도시한다.
도 9는 Vero 세포로부터 채취된 CDX-005의 조 벌크 역가(crude bulk titre)를 도시한다. 베로 WHO "10-87" 세포를 1.8 x 104 PFU의 CDX-005 (~0.01 MOI)로 접종하고, 그 후, 48시간 동안 성장시켰다. 표시된 상이한 계획(scheme)을 이용하여 바이러스를 채취하였다.
도 10은 역유전학(Reverse Genetics)을 통한 CDX-005.1 바이러스의 성공적인 구제(rescue)를 보여준다. 2021년 5월 7일, 합성 게놈 DNA에서 유래된 합성 게놈 RNA로 Vero WHO 10-87 세포를 형질감염시킨 후 3일차에, 세포 상층액을 VeroE6 세포에 대한 플라크 분석을 통해 감염성 CDX-005.1 바이러스의 존재에 대해 테스트했다. 감염성 CDX-005.1 바이러스는 4.6 x 105 PFU/mL의 역가로 검출되었고, 플라크 크기는 CDX-005와 구별할 수 없었다.
도 11은 역유전학을 통한 CDX-005.2 바이러스의 성공적인 구제를 보여준다. 합성 게놈 DNA로부터 유래된 합성 게놈 RNA로 Vero WHO 10-87 세포를 형질감염시킨 후 4일차에, 세포 상층액을 VeroE6 세포에 대한 플라크 분석을 통해 감염성 CDX-005.2 바이러스의 존재에 대해 테스트했다. 감염성 CDX-005.2 바이러스는 2.5x105 PFU/mL의 역가로 검출되었rh, 플라크 크기는 CDX-005와 구별할 수 없었다.
도 12는 CDX-005.2가 40℃에서 온도에 민감하다는 것을 보여준다. 플라크 분석은 12-웰 클러스터에서 Vero E6 세포 단층의 동일한 배치에서 동시에 수행하고, 37℃ 또는 40℃에서 4일간 인큐베이션한 후 크리스탈 바이올렛으로 염색하였다. 동일한 바이러스 연속 희석물로부터의 CDX-005.2(상단 행) 및 CDX-005(하단 행) 샘플을 사용하여 37℃ 또는 40℃에서 플라크 분석을 수행했다. 40℃에서, 37℃의 허용 온도(permissive temperature) 대비 두 바이러스 모두에 대한 플라크는 훨씬 더 작고, 불규칙한 모양이며, 갯수가 크게 감소되었다(CDX-005의 경우 약 1,000배, 및 CDX-005.2의 경우 약 10,000배). 상승된 온도(사람의 발열과 동등함)에서 온도 민감성 표현형은 일반적으로 약독화 바이러스 생백신의 긍정적인 안전성 특징으로 간주된다.
도 13은 남아프리카 변이체(S.African variant) B.1.351에 대한 백신으로서 탈최적화 SARS-CoV2 (CDX.005)의 효능을 보여준다.
실시예
하기 실시예는 청구된 발명을 더 잘 설명하기 위해 제공되며 본 발명의 범위를 제한하는 것으로 해석되어서는 안 된다. 특정 재료가 언급되는 정도는, 단지 예시를 위한 것이며 본 발명을 제한하려는 의도는 아니다. 당업자는 발명 능력의 발휘 없이, 본 발명의 범위를 벗어나지 않으면서, 동등한 수단 또는 반응물을 개발할 수 있다.
실시예
1
SARS-
CoV
-2 알파 변이체, 베타 변이체 및 델타 변이체의 합성
알파 변이체, 베타 변이체 및 델타 변이체의 합성은 각 변이체의 돌연변이를 갖는 단편을 제외하고는, 본원에 기술된 탈최적화된 SARS- CoV -2, 코로나바이러스 균주 2019-nCoV/USA-WA1/2020에 대해 기술된 것과 유사하다.
스파이크 유전자 내의 각 변이체에 대한 주요 돌연변이가 확인되었다. 변이체의 약 6-10개 서열을 GISAID에서 선택하고, BLASTn을 이용한 다중 정렬로 본 발명자들의 원래의 WT 디자인 또는 CDX-005(스파이크의 탈최적화 포함)와 비교하였다.
뉴클레오티드 돌연변이를 확인한 후, (본원에 기술된) 탈최적화된 코로나바이러스 균주 2019-nCoV/USA-WA1/2020 설계의 코돈을 변이체의 코돈으로 대체했다. 돌연변이가 결실을 초래한 경우, 변이체의 탈최적화된 서열에 대해 동일한 결실이 이루어졌다.
그 후, 이러한 돌연변이를 보유하는 DNA 단편을 합성하였다. 스파이크 유전자를 본원에서 F14, F15 및 F16으로 지칭한, 3개의 단편으로 분리하였다. F16은 탈최적화된 영역을 포함했다. 돌연변이의 위치에 따라, 이들 단편 중 2개 또는 3개 모두를 합성하였다.
요약하면, PCR/RT-PCR 과정에 의해 19개의 단편 모두를 수득한 후, 중첩 PCR을 수행하여 바이러스 게놈을 구축하고, 뒤이어 시험관내 전사 및 Vero E6 형질감염을 수행했다. 탈최적화된 SARS-CoV-2의 합성에 사용된 것과 동일한 프라이머 쌍ㅇ을 탈최적화된 SARS-CoV-2 변이체의 합성에 사용하였다.
실시예
2
SARS-
CoV
-2의 합성
절차
RT-
PCR
코로나바이러스 균주 2019-nCoV/USA-WA1/2020("WA1")(BEI Resources NR-52281, Lot 70034262)은 CDC에서 Vero(CCL81)에서의 3회의 계대 및 BEI Resources에서 Vero E6에서의 1회의 계대 후에 BEI Resources에 의해 배포되었다. 4회 계대 후 전체 바이러스 게놈 서열은 CDC에 의해 결정되었고, 그것이 유래된 임상 표본과 비교하여 뉴클레오티드 차이가 없는 것(Harcourt et al., 2020)으로 밝혀졌다(GenBank Accession MN985325). 수령 후에, 37℃에서 2% FBS가 포함된 DMEM에서 Vero E6 세포에서의 추가적인 2회 계대로 WAI를 증폭시켰다.
계대 6 WA1 바이러스를 사용하여, 표준 프로토콜에 따라 Trizol 시약(Thermo Fisher)을 사용한 추출에 의해 바이러스 게놈 RNA를 정제하였다. 요약하면, 1x 10^7 PFU/ml 역가의 0.5ml 바이러스 샘플을 동일한 부피의 Trizol로 추출했다. 이 절차는 이전에 SARS-CoV2 바이러스 감염성을 완전히 불활성화시키기 위한 4개의 개별 실험에서 검증되었다. 0.1ml 클로로포름을 첨가하여 상 분리한 후, 수성 상의 RNA를 동일한 부피의 이소프로판올로 침전시켰다. 침전된 RNA를 70% 에탄올로 세척하고, 건조시키고, 20 ㎕의 RNAse 불포함 물에 재현탁시켰다.
바이러스
cDNA 생성
SuperScript IV First Strand Synthesis 시스템을 사용하여 야생형 cDNA를 합성했다. 튜브 #1의 13 ㎕의 총 반응 부피는 하기와 같이 설정되었다:
1. 50μM 올리고 d(T)20: 1 ㎕(또는 프라이머 #1822(10μM): 1 ㎕)
2. 50ng/㎕ 랜덤 헥사머(Random Hexamer): 1 ㎕
3. 10mM dNTP: 1 ㎕
4. WT RNA: 2-10 ㎕
5. H2O: 13 ㎕까지 첨가함
샘플을 혼합하고 65℃에서 5분간 인큐베이션하고, 즉시 얼음 위에 1분간 두었다. 7 ㎕의 총 반응 부피로 또 다른 튜브(튜브 #2)를 준비했다:
1. 5x 버퍼: 4 ㎕
2. 100mM DTT: 1 ㎕
3. Rnase 억제제(40U/㎕): 1 ㎕(선택적)
4. SuperScript IV 효소: 1 ㎕
본 발명자들은 총 반응 부피가 20㎕가 되도록 튜브 #1과 튜브 #2를 혼합하고, 23℃에서 10분 동안 인큐베이션하고, 뒤이어 50℃에서 50분 및 80℃에서 10분 동안 인큐베이션하여 cDNA를 생성했다.
중첩 중합효소 연쇄 반응 (Overlapping Polymerase Chain Reaction)
Q5 High-Fidelity 2x Master Mixture(NEB, Ipswich, Massachusetts)를 사용하여 cDNA로부터 게놈 단편을 증폭시켰다.
20 ㎕ 반응은 1 ㎕의 신선하게 제조된 cDNA, 1 ㎕의 정방향 및 역방향 프라이머(표 4에 상세하게 기술됨)(0.5μM 농도), 10 ㎕의 2x Q5 마스터 혼합물 및 H2O를 포함했다. 반응 파라미터는 하기와 같았다: 반응 개시를 위한 98℃, 30초, 뒤이은 98℃에서 10초, 60℃에서 30초, 65℃에서 1분의 30회 사이클, 최종 신장을 위한 65℃, 5분. 단편 19(약 1.2Kb)를 제외하고 모두 약 1.8 Kb인 총 19개의 게놈 단편을 수득했고, 이들은 특이적 프라이머를 사용한, 그들 중 2개의 단편간 200bp 중첩 영역으로 전체 바이러스 게놈을 커버했다(표 4). 앰플리콘을 아가로스 겔 전기영동으로 확인하고 QIAquick PCR Purification Kit(Qiagen)를 사용하여 정제했다. 용리물은 Nanodrop으로 정량하였다.
전체 코로나-19 게놈을 재구축하기 위해 Q5® High-Fidelity DNA Polymerase(NEB, Ipswich, Massachusetts)를 사용하였다.
먼저, 전체 게놈을 재구축하기 위해 중첩 반응에서 19개 게놈 단편 모두를 사용했다. 요약하면, 각 DNA 단편 30-40 ng(모든 조각 간의 몰비는 1:1임), 10 ㎕ 5x 반응 완충액, 1 ㎕ 10mM dNTP, 0.5 ㎕ Q5 폴리머라아제 및 최종 부피 50 ㎕까지의 H2O의 혼합물을 준비하였다. 반응은 하기 조건으로 수행했다: 98℃에서 30초, 72℃에서 16분, 30초의 10회 사이클.
다음으로, 2 ㎕ 중첩 반응 산물을 4 ㎕의 5x 반응 완충액, 1 ㎕의 10 mM dNTP, 1 ㎕의 각각의 측접(flanking) 프라이머 0.5μM, 0.2 ㎕ Q5 폴리머라아제 및 H2O와 최종 부피 20 ㎕까지 혼합하고 PCR을 다음과 같이 수행했다: 98℃에서 30초로 반응 개시, 이어서 98℃에서 10초, 60℃에서 45초, 72℃에서 16분 30초의 15회 사이클, 및 65℃에서 5분의 최종 신장. 결과를 확인하기 위해, 5 ㎕ PCR 산물을 0.4% 아가로오스 겔에서 시각화했다.
RT- PCR용 프라이머 | |||
서열번호 | No. |
명칭 |
올리고 서열 5'-3' |
15 | 2312 | 2312-Fr1-T7G-F3 | GAtaatacgactcactatagATTAAAGGTTTATACCTTCCCAGGTAAC |
16 | 1786 | 1786-COV-2 | GATGCCAAAATAATGGCGATCTC |
17 | 1787 | 1787-COV-3 | GTTGGTTGCCATAACAAGTGTG |
18 | 1788 | 1788-COV-4 | CTAATTGAGGTTGAACCTCAACAATTG |
19 | 1789 | 1789-COV-5 | GAGTATGGTACTGAAGATGATTACCAAG |
20 | 1790 | 1790-COV-6 | CTAGGTGGAATGTGGTAGGATTAC |
21 | 1791 | 1791-COV-7 | GCTGTTACAGCGTATAATGGTTATCTTAC |
22 | 1792 | 1792-COV-8 | GCTGGTTTAAGTATAATGTCTCCTACAAC |
23 | 1793 | 1793-COV-9 | GCACAAAACCAGTTGAAACATCAAATTC |
24 | 1794 | 1794-COV-10 | GCAACTAGTGTTTTGAGTTTTTCCATTG |
25 | 1795 | 1795-COV-11 | GTGAAGAATCATCTGCAAAATCAGC |
26 | 1796 | 1796-COV-12 | CAAATGATATAAGCAATTGTTATCCAGAAAGG |
27 | 1797 | 1797-COV-13 | GCCTTTAATACTTTACTATTCCTTATGTCATTCAC |
28 | 1798 | 1798-COV-14 | CCAGACAAACTAGTATCAACCATATCC |
29 | 1799 | 1799-COV-15 | GCTATGGGTATTATTGCTATGTCTG |
30 | 1800 | 1800-COV-16 | CCTACAAGGTGGTTCCAGTTC |
31 | 1801 | 1801-COV-17 | CGACAGATGTCTTGTGCTG |
32 | 1802 | 1802-COV-18 | GGTATCCAGTTGAAACTACAAATGG |
33 | 1803 | 1803-COV-19 | GATCAGACATACCACCCAAATTG |
34 | 1804 | 1804-COV-20 | CTTATGTATTGTAAGTACAAATGAAAGACATCAG |
35 | 1805 | 1805-COV-21 | GGTGATGATTATGTGTACCTTCCTTAC |
36 | 1806 | 1806-COV-22 | CTGTTAATTGCAGATGAAACATCATGC |
37 | 1807 | 1807-COV-23 | GTGTGTAGACTTATGAAAACTATAGGTCC |
38 | 1808 | 1808-COV-24 | CATACAAACTGCCACCATCAC |
39 | 1809 | 1809-COV-25 | CCTTGTAGTGACAAAGCTTATAAAATAGAAG |
40 | 1810 | 1810-COV-26 | CTGGTGCAACTCCTTTATCAG |
41 | 1811 | 1811-COV-27 | GCAAAGAATGCTATTAGAAAAGTGTGAC |
42 | 1812 | 1812-COV-28 | GATAGATTCCTTTTTCTACAGTGAAGGATTTC |
43 | 1813 | 1813-COV-29 | GACTCCTGGTGATTCTTCTTCAG |
44 | 1814 | 1814-COV-30 | CTCTAGCAGCAATATCACCAAGG |
45 | 1815 | 1815-COV-31 | GCACAAGTCAAACAAATTTACAAAACAC |
46 | 1816 | 1816-COV-32 | CAAAAGGTGTGAGTAAACTGTTACAAAC |
47 | 1817 | 1817-COV-33 | CTCACTCCCTTTCGGATGG |
48 | 1818 | 1818-COV-34 | GAGGTTTATGATGTAATCAAGATTCCAAATGG |
49 | 1819 | 1819-COV-35 | GCTACAGGATTGGCAACTATAAATTAAAC |
50 | 1820 | 1820-COV-36 | CCATTCTAGCAGGAGAAGTTCC |
51 | 1821 | 1821-COV-37 | GCAATCCTGCTAACAATGCTG |
52 | 1822 | 1822-COV-38 | ttttTTTTTTTTTTTTTTTTTTTTTGTCATTCTCCTAAGAAGCTATTAAAATC |
시험관내(in vitor) 전사
전장 PCR로부터 증폭된 DNA 주형을 RNA 작업 전에 기존의 페놀/클로로포름 추출 및 뒤이은 3M 아세트산나트륨 존재 하에서의 에탄올 침전을 이용하여 정제하였다. 제조사의 설명서에 따라, 일부 수정으로, HiScribe T7 Transcription Kit(New England Biolabs)를 사용하여 RNA 전사체를 시험관내에서 합성하였다. 500ng DNA 주형 및 2.4 ㎕ 50 mM GTP(캡 유사체(cap analog) 대 GTP 비율은 1:1)를 첨가하여, 20 ㎕ 반응을 구성했다. 반응물을 37℃에서 3시간 동안 인큐베이션하였다. 그 후, 염화리튬 침전에 의해 침전시키고 정제하고, 70% 에탄올로 1회 세척했다. N 유전자 DNA 주형은 또한 특정한 정방향 프라이머(2320-NF: GAAtaatacgactcactataggGACGTTCGTGTTGTTTTAGATTTCATCTAAACG(서열번호 53))(서열에서 소문자 서열은 T7 프로모터를 나타내고 밑줄 친 서열은 N 유전자 ORF의 상류 5' NTR을 나타냄) 및 역방향 프라이머(2130-NR, tttttttttttttttttttttGTCATTCTCCTAAGAAGCTATTAAAATCACATGG(서열번호 54))를 사용한 PCR에 의해 cDNA로부터 준비했다.
RNA 전기천공에 의한
Vero
E6 세포의 형질감염
Vero E6 세포는 ATCC(CRL-1586)로부터 얻었고 10% FBS가 보충된 DMEM 고글루코스에서 유지시켰다. 바이러스 RNA를 형질감염시키기 위해, 제조사의 설명서에 따라, Maxcyte ATX 시스템을 사용하여 5 ㎍의 캡핑된 WA1-N mRNA와 함께 10 ㎍의 정제된 전장 게놈 RNA 전사체를 Vero E6 세포에 전기천공했다. 요약하면, 3-4 x 106개의 Vero E6 세포를 Maxcyte 전기천공 완충액으로 1회 세척하고 100 ㎕의 동일한 완충액에 재현탁시켰다. 세포 현탁액을 RNA 샘플과 부드럽게 혼합하고, RNA/세포 혼합물을 Maxcyte OC-100 처리 어셈블리로 옮겼다. 미리 프로그래밍된(pre-programmed) Vero 세포 전기천공 프로토콜을 이용하여 전기천공을 수행했다. 37C/5%CO2에서 형질감염된 세포를 30분 동안 회수한 후, 세포를 가온된(warm) DMEM/10% FBS에 재현탁하고, 다양한 접종 밀도(총 세포의 1/2, 1/3, 1/6)로 3개의 T25 플라스크에 분배했다. 형질감염된 세포를 37℃/5%CO2에서 6일 동안 또는 CPE가 나타날 때까지 인큐베이션했다. 감염 배지는 2일, 4일, 6일차에 수집하고, 2일 및 4일차에 배지를 완전히 교체했다(DMEM/5%FBS). 생성된 바이러스는 빠르게는 형질감염 후 2일 만에 플라크 분석으로 검출할 수 있었고, 최대(peak) 바이러스 생성은 4-6일 사이에 나타났다.
Vero
E6 세포에서 SARS-
CoV
-2의
스톡
바이러스
계대
및 플라크 적정(plaque titration)
DMEM/2%FBS에서 연속 10배 희석액을 제조했다. 각 희석액 0.5ml를 80% 컨플루언시(confluent)인 까지 Vero E6 세포의 12-웰에 첨가했다. 37℃에서 1시간 동안 인큐베이션한 후, 접종물을 제거하고, 1x DMEM, 0.3% 트라가칸트 검(Gum Tragacanth), 2% FBS 및 1x 페니실린/스트렙토마이신을 함유한 반고체 오버레이(semisolid overlay) 2ml를 웰당 첨가했다. 37℃/5%CO2에서 3 또는 4일 동안 인큐베이션한 후, 오버레이를 제거하고, 웰을 PBS로 부드럽게 세정하고, 뒤이어 고정하고, 크리스탈 바이올렛(Crystal Violet)으로 염색했다.
시험관내 전사로부터 수득된 RNA를 사용하여 Vero E6 세포를 wt WA1 및 CDX-005로 형질감염시키고, Vero E6 세포에서 적정된 살아있는 바이러스를 회수했다. 3일 동안 인큐베이션한 후, 플라크 분석을 염색하였다.
다단계 바이러스 성장 역학(Multisetp Virus Growth Kinetics)
Vero 세포(WHO 10-87)를 5% 소태아혈청(FBS)을 포함하는 1ml DMEM을 담은 12 웰 플레이트에서 거의 컨플루언시에 도달할 때까지 3일 동안 성장시켰다. 감염 전, 사용된 세포 배양 배지를 1% FBS 및 30 PFU의 표시된 바이러스(0.0001 MOI)를 포함하는 0.5ml의 신선한 DMEM으로 교체했다. 33℃ 또는 37℃/5% CO2에서 1시간 동안 인큐베이션한 후, 접종물을 버리고, 세포 단층을 Dulbecco PBS 1ml로 1회 세척하고, 뒤이어 1% FBS를 포함하는 DMEM 1 ml를 첨가했다. 감염된 세포를 33℃ 또는 37℃에서 0, 6, 24, 48 또는 72시간 동안 배양했다. 표시된 시점에서, 세포와 상층액을 수집하고(시점당 하나의 웰), -80℃에서 1회 동결시키고, 해동했다. 용해물 중 감염성 바이러스 역가는 37℃에서 Vero E6에서 플라크 분석에 의해 결정하였다.
결과
개별 게놈 단편 1-19의 생성 및 중첩 PCR에 의해 생성된 전체 게놈 DNA는 잘 진행되었고, 0.4% 아가로스 겔에서 투명한 밴드가 관찰되었다.
시험관내 전사는 Vero E6 세포를 S-WWW(WT) 및 S-WWD로 형질감염시키고 Vero E6 세포에서 적정된 살아있는 바이러스를 회수하는 데 사용되는 RNA를 생성했다. 3일 동안 인큐베이션한 후, 플라크 분석을 염색하고, 부분적으로 스파이크가 탈최적화된(spike-deoptimized) S-WWD 후보(도 1)에서 관찰된 더 작은 플라크 및 40% 감소된 최종 역가를 관찰했다.
실시예
3
CDX-005 프리-마스터(pre-master) 바이러스 시드(preMVS)를 하기와 같이 개발했다: SARS-COV-2 BetaCoV/USA/WA1/2020(GenBank: MN985325.1)의 RNA를 감염되고, 특성규명된 Vero E6 세포(ATCC CRL-1586 Lot # 70010177)로부터 추출하고, 시판되는 시약 및 키트를 사용하여 RT-PCR을 통해 19개의 중첩 DNA 단편으로 전환시켰다. 중첩 PCR을 이용하여 19개의 1.8kb wt 게놈 단편을 하나의 탈최적화된 스파이크 유전자 카세트를 이용하여 함께 연결했다. 구체적으로, 스파이크 ORF의 1,272개 뉴클레오티드는 게놈 위치 24115-25387에서 탈최적화된 인간 코돈 쌍이어서, 모 WA1/2020 바이러스 대비 283개의 침묵 돌연변이 변화를 초래했다. 결과적으로 수득된 전장 cDNA를 시험관 내에서 전사하여 전장 바이러스 RNA를 제조했다. 바이러스 회수(viral recovery)는 2020년 4월에 처음으로 의뢰한 Stony Brook University(NY)의 새로운 BSL-3 실험실에서 수행되었고, 본 발명자들의 프로젝트는 그 실험실에서 진행된 유일한 프로젝트였다. 그 후, 이 바이러스 RNA를 특성규명된(특성화된) Vero E6 세포(Lot # 70010177)에 전기천공했다. 이는 CDX-005 바이러스를 생성했고(도 1), 이 바이러스는 후속으로 Vero E6 세포에서 추가적으로 계대되어 계대 1(passage 1), P1(Lot # 1-060820-9-1)을 생성했다. P1 바이러스(P1 material)은 하기 기술되는 햄스터 연구에 사용되었다.
실시예
4
햄스터 연구
COVID-19 모델링에 관한 WHO 임시 전문가 실무 그룹(WHO ad hoc Expert Working Group)은 붉은털원숭이(rhesus macaque)와 흰족제비(white ferret)가 경증 내지 중등도의 인간 질병을 재현하는 것으로 보인다고 결론을 내렸지만, 보다 최근 연구에서는 시리아 골든 햄스터(Syrian Golden Hamster)가 이 감염의 더 심각한 폐 징후(pulmonary manifestation)를 재현하는 데 더 유용한 모델일 수 있다는 것을 시사한다.
5-6주령의 수컷 시리아 햄스터(Charles Rivers) 36마리를 연구에 활용했다. 챌린지를 위해, 햄스터를 복강내 주사를 통해 케타민(100 mg/kg) 및 자일라진(10 mg/kg)으로 마취시키고, 0일차에 5x104 PFU/ml 또는 5x103 PFU/ml wt WA1 SARS-CoV-2 또는 5x104 PFU/ml CDX-005의 명목 용량(nominal dose) 0.05ml를 비강 내로 접종했다(그룹당 12마리). 동물을 매일 2회 관찰하고 체중을 8일차까지 매일 수집하고, 16일차부터 18일차까지 매일 수집했다. 16일차에, 3마리의 CDX-005 접종된 동물에 5x104 PFU/ml wt WA1을 비강내로 챌린지했다. 5x104 PFU/ml(N=3) 또는 5x103 PFU/ml(N=3)의 wt WA1로 접종된 6마리의 나이브(naive) 햄스터가 대조군으로 작용했다. 두 접종 용량에서 역가가 중첩되어, 본 발명자들은 이 두 그룹을 결합했다.
중량
이들 36마리의 햄스터 및 추가의 58마리(반은 암컷/반은 수컷)의 5-6주령 시리아 골든 햄스터(찰스 리버스(Charles Rivers))를 이용하여 중량 감소로 평가된 햄스터 건강에 대한 CDX-005 및 wt WA1 접종의 효과를 연구했다. (이러한 추가 햄스터는 현재 다른 CDX-005 및 wt WA1 매개 효과에 대해 평가되고 있다.) 전체적으로, 40 마리의 5 x 104 PFU CDX-005, 40 마리의 5 x 104 PFU wt WA1 및 12 마리의 5 x 103 PFU wt WA1을 최대 9일 동안 매일 계량했다. 동물들이 접종 후(PI) 다양한 일자에 다른 종점(endpoint)를 위해 희생되므로, 각 그룹에 대해 N은 시간의 경과에 따라 감소했다. 5 x 104 PFU CDX-005 및 5 x 104 PFU wt WA1의 최소 N은 10이었고, 5 x 103 PFU wt WA1의 경우 3이었다.
조직 채취(Tissue Harvesting)
접종 후 2, 4, 6일차에, 각 그룹의 햄스터 3마리와 16일차에 챌린지된 동물 중 햄스터 3마리를 18일차에 뷰타나시아(Beuthanasia) 150mg/kg의 정맥내 주사로 안락사시켰다. 바이러스 부하(viral load) 측정을 위해 좌측 폐를 수집했다. 바이러스 부하를 측정하기 위해, 16일차에 챌린지된 동물에서 18일차에 조직 균질화기(Omni 균질화기)를 사용하여 항생제가 포함된 DMEM에서 10% w/v로 폐를 균질화시켰다. 본 발명자들은 이 소형 동물들에서 비강 세척(nasal wash)을 수행했으나, 재현가능한 세척액을 얻는데 성공하지 못했다.
조직병리학
조직병리학은 맹검 자격을 갖춘 수의 병리학자(blined licensed veterinary pathologist)에 의해 수행되었다. 폐, 뇌, 및 신장을 포르말린으로 고정하고 탈수시킨 후 파라핀에 포매하고 헤마톡실린과 에오신으로 염색했다. 광학현미경 평가는 맹검 공인 수의 병리학자(blinded board-certified veterinary pathologist)에 의해 수행되었다. 각 조직을 여러 병리학적 파라미터에 따라 등급을 평가하고, 절편(section)을 0=정상, 1=최소(Minimal), 2=경증(Mild), 3=중등도(Moderate), 4=현저(Marked) 또는 5=중증(Severe)로 점수를 매겼다. 모든 조직의 평가는 세포 침윤의 평가를 포함했다. 각 기관에 대해 최소 5개의 절편을 검사하고 점수를 평균했다.
바이러스 부하(Viral Load)
채취된 조직에서 qPCR 및 TCID50에 의해 바이러스 부하를 측정했다. 바이러스 부하를 측정하기 위해 조직을 비드 밀 균질화기(bead mill homogenizer)(Omni)를 사용하여 항생제를 포함하는 DMEM에서 10% w/v로 균질화시켰다. 감염성 바이러스 역가는 Vero E6 세포에서 폐 균질액의 10배 연속 희석을 적정하는 50% 조직 배양 감염 용량(50% tissue culture infectious dose: TCID50) 분석에 의해 결정했고, ml당 log10 TCID50 유닛으로 표시된다. 제조사의 프로토콜에 따라 Quick-RNA Viral Kit(Zymo Research)를 사용하여 100 ㎕의 뇌 균질액으로부터 RNA를 추출했다. 하기 PCR 사이클링 조건을 이용하고, iTaq 1-단계 범용 프로브 키트(Bio-Rad)를 사용하여 qRT-PCR을 수행했다: 95℃에서 15초, 60℃에서 15초, 및 72℃에서 20초의 사이클 40회.
항체 - 플라크 감소 중화
역가(Plaque Reduction Neutrailization Titer)
PI 16일차에 수집된 햄스터 혈청을 56℃에서 30분(30') 동안 열 불활성화시켰다. 1:5의 초기 희석으로 시작하여, 96웰 U-바닥 플레이트 중 DMEM/1% FBS에서 50 ㎕ 2배 연속 희석을 수행했다. 50 ㎕ DMEM/1% FBS 중 약 30 PFU의 SARS-CoV-2 Washington/1/2020을 혈청 희석물에 첨가하고, 혼합하여, 중화 웰에서 최종 부피를 100 ㎕로 만들고, 총 초기 혈청 희석을 1:10으로 만들었다. 희석 플레이트를 37℃/5% CO2에서 1시간 동안 인큐베이션시켰다.
Vero E6 세포(1일 전 DMEM/5%FBS에 접종)의 합류성 단층(confluent monolayer)을 포함하는 24-웰 플레이트 상의 세포 성장 배지를 제거하고, 150 ㎕의 신선한 DMEM/1%FBS를 첨가하고, 뒤이어 100 ㎕의 각 중화 반응액을 첨가했다. 37℃/5% CO2에서 1시간 동안 바이러스를 흡착시킨 후, 0.75 ml 반고체 오버레이를 1 ml의 최종 부피 중 1 X DMEM, 1.75% FBS, 0.3% 트라가칸트 검, 1x 페니실린 + 스트렙토마이신의 최종 농도로 24 웰 플레이트에 첨가하였다. 24 웰 플레이트를 37℃에서 48시간 동안 인큐베이션하여 플라크가 형성될 수 있게 했다. 50% 메탄올/4% 포름알데히드 중 1% 크리스탈 바이올렛으로 세포 단층을 고정하고 염색하여 플라크를 시각화했다. 플라크 감소 중화 역가(PRNT)50, 80, 90은 비-중화 웰(나이브 햄스터 혈청 포함) 중 플라크 수와 비교하여 미리 정의된 컷오프(50%, 80%, 90%)에 따라 플라크 수를 감소시킨 마지막 혈청 희석 비율의 역수로 결정되었다. 가장 낮은 희석 비율(1:10)에서 중화에 실패한 혈청에 5의 역가를 부여하고, 가장 높은 테스트 혈청 희석 비율(1:1280)에서 중화된 혈청에는 ≥1280의 역가를 부여했다.
항체 -
IgG
ELISA
96 웰 플레이트를 50ng/ml BSA/0.05M 탄산염/중탄산염 완충액 pH 9.6에서 30ng/웰의 SARS-CoV-2(2019-nCoV) 스파이크 S1-His(Sino Biological)로 4℃에서 밤새 코팅시켰다. 플레이트를 37℃에서 2시간 동안 PBS 중 10% 염소 혈청으로 차단하고, 세척 완충액(PBS 중 0.1% Tween 20)으로 4회 세척한 후, PBS 중 10% 염소 혈청/0.05% Tween-20에 연속적으로 희석된 혈청(1:10 출발 희석, 그 후 2배)과 37℃에서 1시간 동안 인큐베이션시켰다. 플레이트를 세척 완충액으로 4회 세척한 후 1:10,000 호스래디쉬 퍼옥시다아제(horseradish peroxidase: HRP) 접합 친화도 순수 염소 항-시리아 햄스터 IgG(H & L)(Jackson ImmunoResearch Laboratories, Inc.)와 37℃에서 1시간 동안 인큐베이션시켰다. 인큐베이션 후에, 플레이트를 세척 완충액으로 4회 세척하고 비색 반응을 위해 Thermo Scientific OPD(o-페닐렌디아민 디히드로클로라이드)를 첨가했다. 암소에서 25℃에서 10분간 인큐베이션한 후, 2.5M 황산 용액 50ml를 첨가하여 반응을 정지시키고, 결과적인 흡광도를 마이크로플레이트 판독기에서 490nm에서 판독했다. 다양한 그룹 간의 상대적 IgG 수준을 보고하고, OPD 비색 반응 산물의 강도가 백그라운드(혈청 불포함) 대조군 강도보다 5배 더 높은 수준에 도달한 희석 비율의 로그로 비교했다.
실시예
5
CDX
-005 특성
CDX-005는 wt WA1 바이러스와 비교하여 스파이크 유전자에 283개의 침묵 돌연변이를 포함한다. 결과적으로 수득된 전장 wt WA1 및 탈최적화된 cDNA를 시험관 내에서 전사하여 전장 바이러스 RNA를 제조하고, Vero E6 세포에 전기천공했다. 형질감염된 세포를 6일 동안 또는 CPE가 나타날 때까지 인큐베이션했다. 감염 배지를 2일, 4일, 6일차에 수집했다. 바이러스 역가는 Vero E6 세포에 대한 플라크 분석에 의해 결정했다. 플라크는 빠르게는 형질감염 후 2일차에 가시적으로 나타났고, 4-6일차에 최대 바이러스 생성이 이루어졌다. CDX-005 및 CDX-007에 의해 형성된 플라크는 wt보다 작았으나, 둘 다 Vero E6 세포에서 강건하게 성장하여, 그들이 대규모 제조(scale-up manufacturing)에 적합하다는 것을 나타냈다. 따라서, 본 발명자들의 다른 SAVE 백신과 마찬가지로, 본 발명자들은 상이한 약독화 정도를 갖는 여러 백신 후보를 신속하게 생성할 수 있었다.
CDX-005에서, 스파이크 ORF의 1,272개의 뉴클레오티드는 인간 세포에 대해 탈최적화된 코돈 쌍이었고, 283개의 침묵 돌연변이를 생성했다. 부가적인 약독화 및 안전성을 위해 스파이크 단백질에서 다염기성 푸린 절단 부위(polybasic furin cleavage site)를 제거했다.
본 발명자들은 2020년 4분기까지 대규모 백신 생산을 시작할 수 있도록 GMP 특성규명된 AOF(animal origin-free) Vero(WHO-10-87) 세포에서 CDX-005에 대한 성장 최적화 연구를 수행했다. 33℃에서의 성장은 37℃에서보다 CDX-005 및 wt WA1 둘 다에 대해 더 높은 역가를 가져온다. 바이러스는 세포변성 효과(cytopathic effect: CPE)가 관찰되기 전에 피크(peak)에 도달하고, 바이러스의 80-90%가 피크에서 세포와 회합된다. 역학(kinetics)은 다르나, 0.01 MOI와 0.0001 MOI에서 유사한 바이러스 역가를 달성할 수 있다.
본 발명자들은 또한 바이러스 채취를 위한 최적의 조건을 조사했다. Vero WHO 10-87 세포를 37℃/5% CO2에서 5% 소태아혈청(FBS)을 포함하는 DMEM에서 성장시켰다. 33℃ 배양물에서 CDX-005에 의한 감염 후 48시간 차에, 도 9에 기술된 계획(scheme)을 이용하여, 세포 및 상층액을 채취했다.
데이터는 33℃에서 0.01 MOI 감염 후 48시간에 대부분의 CDX-005가 세포와 회합되나(cell-associated)(~80-90%), Vero 세포로부터의 바이러스 회수는 간단하다는 것을 입증한다. 저장액 용해(hypotonic lysis)는 CDX-005를 채취하는 효과적인 수단이고, 넓은 용해 창(lysis window)은 이 방법이 어느 정도 유연성이 유용할 수 있는 대규모 배치(scaled batch)에서 실행 가능할 것이라는 것을 시사한다.
동결/해동 용해(freeze/thaw lysis)도 효과적이고, FBS는 필요하지도 유익하지도 않다. 감염 동안 FBS가 Vero 세포의 과증식을 유발하여 바이러스 수율을 감소시킬 수 있고, FDA는 무혈청 생산을 선호하기 때문에, 이것은 바람직하다. 또한, FBS가 최소한 2회의 동결/해동 사이클 후에 안정화를 거의 또는 전혀 제공하지 않았기 때문에, CDX-005는 일반 DMEM 중에 동결되었을 때 안정한 것으로 보인다. 따라서, 최적의 채취 시기에, 33℃ 또는 37℃에서 성장했는지 여부에 관계없이, 2-3 x 107 PFU/ml의 CDX-005의 조 벌크 역가 또는 약 106 PFU/cm2 성장 표면적(grwoth surface area)이 통상적으로 관찰된다.
이들 연구에 기초하여, 본 발명자들은 현재 Vero(WHO-10-87) 세포에 33℃에서 0.01 MOI로 접종하여 CDX-005를 성장시키고 있다. 본 발명자들은 영국에서 인간에서의 최초 연구(first-in-human study)를 위해 5% 수크로오스 및 5% 글리신을 포함하는 DMEM의 백신 제형을 선택하고 테스트했다. 이 제형에서, CDX-005는 적어도 3회의 동결-해동 주기와 -80℃에서 1개월 동안(현재까지 테스트된 가장 긴 저장 기간) 안정적이다.
마지막으로, CDX-005의 게놈 안정성을 평가하는 첫 번째 단계로서, Vero(WHO 10-87) 세포에서 바이러스를 증식시킨 후 바이러스 계대 1-6을 시퀀싱했다. 데이터는 바이러스가 매우 안정적이라는 것을 나타낸다. 계대 6의 시퀀에서 하위집단(subpopulation)이 나타나지 않았다. 본 발명자들은 9 계대를 성장시키고 채취했다.
실시예
6
CDX-005를 최초 인간 임상 시험으로 전환하기 위한 준비(prelude)로서, 본 발명자들은 백신에 대한 비-인간 영장류의 반응을 조사했다. 본 발명자들은 15마리의 아프리카 녹색 원숭이에, 6마리에는 106 PFU wt WA1, 6마리에는 106 PFU CDX-005, 3마리에는 Dulbecco PBS를 비강 내로 접종했다. 본 결과는 wt WA1 및 CDX-005 접종된 동물의 세척액(lavage fluid) 내 바이러스 역가는 PI 4일차에 유사했고, 바이러스 역가는 wt WA1에서는 높게 유지되었지만 CDX-005 접종된 원숭이에서는 검출할 수 없을 정도로 급감했다는 것을 보여준다. 이 데이터는 SARS-CoV-2 백신으로서의 CDX-005의 잠재력을 더욱 입증한다.
실시예
7
SARS-
CoV2
베타 바이러스
CDX
.005.1의 회수
CDX-005.1은 이전에 회수된 임상 단계 CDX-005(우한 계통)의 백본을 기반으로 하다. CDX-005 스파이크 유전자에는 Codagenix SAVE(Synthetic Attenuated Virus Engineering) 플랫폼에서 설계한 283개 동의 돌연변이(synonymous mutation)의 코돈-쌍 탈최적화 카세트가 포함되어 있다. 스파이크 유전자는 푸린 절단 부위의 결실(36개 뉴클레오티드 결실)에 의해 추가로 변형되었다. 특정 이론에 얽매이기를 원치 않으나, 푸린 절단 부위의 부재가 그러한 돌연변이를 갖는 SARS-CoV-2의 인간 숙주에서 약독화에 기여할 수 있다고 사료된다. 따라서, 본 발명자들은 CDX-005를 CDX-005.1의 백본으로 사용하기로 결정했다. 푸린 절단 부위 결실은 게놈 단편 F15에 위치한다.
SARS-CoV-2 베타 백신 후보(CDX-005.1)에 대한 서열을 정의하기 위해, GISAID의 다양한 베타 변이체를 선택하고 NCBI Blastn 다중 서열 정렬을 통해 CDX-005와 비교했다. CDX-005 스파이크에 대한 9개의 주요 돌연변이가 본 발명자들이 평가한 대부분의 베타 서열의 스파이크 유전자에 존재했다(표 5).
표 5. CDX-005.1 스파이크를 생성하기 위한 CDX-005 스파이크에 대한 유전자 변형 요약
스파이크 유전자 중 위치 (nt) | 원래의 뉴클레오티드 |
돌연변이 뉴클레오티드 |
결과적인 아미노산 변화 |
21614 | C | T | L18 (CTT) → F (TTT) |
21801 | A | C | D80 (GAT) → A (GCT) |
22206 | A | G | D215 (GAT) → G (GGT) |
22286-22294 | CTTGCTTTA | 결실 | Del242-244 |
22813 | G | T | K417 (AAG) → N (AAT) |
23012 | G | A | E484 (GAA) → K (AAA) |
23063 | A | T | N501 (AAT) → Y (TAT) |
23403 | A | G | D614 (GAT) → G (GGT) |
23628 | C | T | A701 (GCA) → V (GTA) |
탈최적화된 CDX-005.1 게놈을 구축하기 위해, 본 발명자들은 9개의 확인된 SARS-CoV-2 베타 돌연변이를 포함하는 새로운 단편 F14 및 F15를 신생(de novo) 합성했다. 나머지 17개 단편(F1-F13 및 F16-19)은 CDX-005 1상 임상시험 물질로부터 회수하였다. CDX-005.1의 전장 합성 cDNA 게놈을 조립하기 위해, 19개의 중첩 PCR 단편을 단일 중첩 PCR 반응으로 조합했다.
결과적으로 생성된 전장 PCR-조립된 cDNA 게놈을 F1의 5' 말단에 추가된 T7 프로모터에 의해 구동되는 T7 RNA 폴리머라아제를 사용한 시험관내(in vitro) 전사를 위한 주형으로 사용하였다. 시험관내 전사된 핵단백질(NP) 헬퍼 mRNA와 함께 시험관내 전사된 전장 게놈 RNA를 전기천공에 의해 Vero WHO 10-87 세포에 동시-형질감염시켰다. 이 형질감염으로 인해 생성된 바이러스를 CDX-005.1로 명명한다.
CDX-005(SIIPL 백신 배치 403002)의 바이러스 게놈을 역전사에 의해 cDNA로 전환시키고, 17개의 중첩 서브-게놈(sub-genomic) DNA 단편으로 PCR 증폭시켰다. 또한, 본 발명자들은 두 개의 새로운 베타-특이적 단편 14 및 15를 신생 합성했다. 각 단편은 그의 인접한 단편(들)과 약 200 bp 중첩되었다. 정제된 개별 CDX-005.1 단편 F14, F15 및 CDX-005 게놈 단편 F1-F13 및 F16-F19를 바이러스 게놈을 측접하는(flanking) 2개의 프라이머에 의한 단일 튜브 오버랩 PCR 반응에서 풀링했다. 바이러스 게놈의 5' 말단에 상응하는 정방향 프라이머(2312)는 상류 T7 RNA 폴리머라아제 프로모터를 포함했다. 19-단편 오버랩 PCR은 약 30 kb의 DNA 앰플리콘을 생성하여, 전체 게놈 cDNA가 성공적으로 생성되었다는 것을 시사했고, 0.5% 아가로오스 겔에서 명확한 밴드를 볼 수 있었다. 정제 후, PCR로 조립된 전장 cDNA 게놈을 G 캡-유사체 존재 하에 시험관내 전사에 의한 감염성 바이러스 RNA의 합성을 위한 주형으로 사용했다. 결과적으로 생성된 전사체 RNA는 나란히 전개된 DNA 래더(ladder)와 비교하여 8 kb 내지 1 kb 범위의 끌림(smear)으로 나타났다.
PCR-조립된 전장 cDNA 게놈의 무결성(integrity)을 테스트하기 위해, 제한 엔도뉴클레아제 Nhe I에 의한 분해(digestion)를 이용하였다. CDX-005.1 게놈 cDNA는 스파이크의 탈최적화된 영역에 설계된 추가적인 Nhe I 부위 때문에, 독특하고 구별되는 단편 패턴을 생성했다.
Nhe I 처리된 cDNA 게놈의 단편 패턴은 인 실리코(in silico)-예측 DNA 단편 크기와 일치하여, 바이러스 cDNA 게놈이 정확하게 조립되었다는 것을 나타냈다. 주목되는 것은 아가로오스 겔로 이동하지 않은 PCR 산물의 부분은 Nhe I 분해 후 사라지고 예상 크기의 Nhe I RFLP 단편으로 전환되어, 이 물질도 정확하게 형성된 전장 게놈 cDNA에 해당했다는 것을 시사한다는 것이다.
역유전학-유래(reverse genetics-derived) 합성 CDX-005.1 바이러스는 헬퍼로서 핵단백질 mRNA와 함께 시험관내에서 전사된 게놈 RNA의 Vero 10-87 세포 내로의 동시-전기천공에 의해 구제되었다. CDX-005.1 백신 균주의 바이러스 회수는 승인된 기관 생물안전성 위원회(Institutional Biosafety Committee) 가이드라인에 따라 BSL2+(biosafety level 2 enhanced) 조건 하에서 수행되었다. 감염성 CDX-005.1 바이러스는 전기천공(4.6x105 PFU/ml) 후 3일차에 플라크 분석에 의해 배양 상층액에서 검출되었으며, 6일차까지 꾸준히 약 107 PFU/ml로 증가했다(도 9).
본 발명자들은 이전에 원래의 CDX-005 백신 균주가 인간 체온(human heat)과 동등한 온도에서 바이러스 차단(shutoff)을 그럴듯하게 예측할 수 있기 때문에, 생 약독화 백신에 대한 바람직한 안전성 특징인 40℃에서 플라크 형성에 대해 온도 민감성이라 것을 관찰했다. 그 표현형이 CDX-005.1까지 확장되는지 테스트하기 위해, 허용 온도(37℃) 및 제한 온도(40℃)에서 CDX-005와 CDX-005.1의 병렬(side by side) 플라크 분석을 수행했다. 실제로, 본 발명자들은 두 바이러스 모두의 상당한 온도 민감성 표현형을 관찰했고, CDX-005의 경우 플라크 형성이 약 1,000배 감소하고(이전 관찰 확인), CDX-005.1은 어떤 희석 비율에서도 검출 가능한 플라크를 형성할 수 없었다(도 10).
중첩 PCR을 통한 코로나바이러스 게놈 조립의 확립된 방법을 이용하여, Codagenix는 합성 서열의 접수 후 3주 내에 SARS-CoV-2 변이체 베타(CDX-005.1)에 대한 생백신 후보를 회수했다.
CDX-005.1은 허용 온도(33℃-37℃)에서 CDX-005(1-5 x107 PFU/mL)와 유사한 역가로 성장하고 유사한 플라크 형태를 보인다. CDX-005.1은 모 CDX-005(우한(Wuhan) 계통)에서 이전에 관찰된 특징인 40℃에서 성장에 대해 성장에 대해 심하게 온도 제한되었다(temperature restricted).
실시예
8
계대 1에서 베타(
CDX
-005.
1)의
시퀀싱
SARS-CoV-2 베타 백신 후보에 대한 서열을 정의하기 위해, GISAID에서 10-20개의 베타 변이체를 선택하고 NCBI Blastn 다중 서열 정렬을 통해 CDX-005와 비교했다. 평가된 모든 베타 서열의 스파이크 유전자에는 10개의 주요 돌연변이가 존재했으며 9개의 뉴클레오티드가 결실되었다. 그 후, 원래의 CDX-005 스파이크 유전자의 10개 뉴클레오티드를 이들 선택된 돌연변이로 치환하여 베타 변이체 스파이크 서열을 수득했다. 바이러스 백본은 푸린 절단 부위가 결실된 CDX-005이다(36-nt 결실).
새로 구축된 전장 베타 바이러스 게놈을 시험관내에서 전사시키고, 뒤이어 RNA를 정제했다. 그 후, 정제된 게놈 RNA를 WHO 10-87 Vero 세포에 형질감염시켰다. 계대 1에서 회수된 바이러스를 채취하고, Trizol 프로토콜에 의해 바이러스 RNA를 추출했다. 표준 RT-PCR을 수행하였고, 19개의 PCR 단편을 PCR 증폭시킨 후 Sanger 시퀀싱을 수행하여 바이러스 정체(identity)를 확인하고 가짜 돌연변이를 파악했다. 시퀀싱 반응물은 BSL2 격리 하에 Codagenix에서 혼합되고 시퀀싱을 위해 Genewiz에 제출되었다. 결과적으로 수득된 서열을 백신 균주 CDX-005의 백본에 있는 COVID-베타 변이체의 설계된 서열과 정렬시켰다.
10개의 뉴클레오티드 돌연변이와 9개의 결실이 하기와 같이 나열된다:
베타 백신 후보의 설계된 서열 CDX.005.1과 비교하여, 계대 1에서 수득된 서열은 3개의 점 돌연변이, 즉 A1870G, A7917U 및 G14540U를 가졌다. 시퀀싱 트레이스(sequencing trace)는 돌연변이된 뉴클레오티드를 가진 게놈이 바이러스 복제 동안 그들의 원래의 대응물을 능가한다는 것을 입증했다. 돌연변이된 뉴클레오티드는 계대 1에서 이미 우세한 종이어서, 이는 그들이 세포 적응(cell-adapted) 돌연변이라는 것을 나타낸다.
A1870G를 제외하고, 2개의 돌연변이는 아미노산 변화를 초래했다. 설계된 서열과 다른 돌연변이가 하기에 열거된다:
실시예
9
CDX
-005.2, 델타의 회수
유전자 변형, 생 약독화 SARS-CoV-2 델타 변이체 백신 후보 CDX-005.2를 Codagenix에서 개발한 코로나바이러스(CoV)에 대한 역유전학 접근법에 의해 생성하였다. 본 발명자들의 접근 방식은 전적으로 "테스트 튜브-기반"이며 CoV 게놈을 유전적으로 조작하기 위해 중간 클로닝 숙주(예를 들면, 대장균 또는 효모)의 필요성을 제거한다. 이는 본 발명자들이 전통적인 박테리아- 또는 효모-기반 역유전학 시스템에서 흔히 당면하게 되는 CoV 게놈의 유전적 불안정성/독성 문제를 회피할 수 있게 했다.
CDX-005.2는 이전에 Codagenix에서 회수된 임상 단계 CDX-005(우한 계통)의 백본을 기반으로 한다. SARS-CoV-2 베타 백신 후보(CDX-005.2)에 대한 서열을 정의하기 위해, GISAID의 다양한 베타 변이체를 선택하고 NCBI Blastn 다중 서열 정렬을 통해 CDX-005와 비교했다. CDX-005 스파이크에 대한 8개의 주요 돌연변이가 모든 평가된 델타 서열의 스파이크 유전자에 존재했다(표 6).
표 6. CDX-005.2 스파이크를 생성하기 위한 CDX-005 스파이크에 대한 유전자 변형 요약
탈최적화된 CDX-005.2 게놈을 구축하기 위해, 본 발명자들은 8개의 확인된 SARS-CoV-2 델타 돌연변이를 포함하는 새로운 단편 F14, F15, 및 F16을 신생 합성했다. 나머지 16개 단편(F1-F13 및 F17-19)은 CDX-005 1상 임상시험 물질로부터 회수하였다. CDX-005.2의 전장 합성 cDNA 게놈을 조립하기 위해, 회수된 19개의 중첩 PCR 단편을 단일 중첩 PCR 반응으로 조합했다. F16-Min DNA 주형은 원래의 CDX-005에 존재하는 것과 유사한, 1213개 뉴클레오티드의 코돈 쌍-탈최적화 영역을 포함하도록 설계되었다. 결과적으로 생성된 전장 PCR-조립된 cDNA 게놈을 F1의 5' 말단에 첨가된 T7 프로모터에 의해 구동되는 T7 RNA 폴리머라아제를 사용한 시험관내 전사를 위한 주형으로 사용하였다. 결과적으로 생성된 전장 PCR-조립된 cDNA 게놈을 F1의 5' 말단에 추가된 T7 프로모터에 의해 구동되는 T7 RNA 폴리머라아제를 사용한 시험관내(in vitro) 전사를 위한 주형으로 사용하였다. 시험관내 전사된 핵단백질(NP) 헬퍼 mRNA와 함께 시험관내 전사된 전장 게놈 RNA를 전기천공에 의해 Vero WHO 10-87 세포에 동시-형질감염시켰다. 이 형질감염으로 인해 생성된 바이러스를 CDX-005.2로 명명한다.
CDX-005(SIIPL 백신 배치 403002)의 바이러스 게놈을 역전사에 의해 cDNA로 전환시키고, 16개의 중첩 서브-게놈 DNA 단편으로 PCR 증폭시켰다. 또한, 본 발명자들은 3개의 새로운 델타-특이적 단편 14, 15, 및 16을 신생 합성했다. 각 단편은 그의 인접한 단편(들)과 약 200 bp 중첩되었다. 정제된 개별 CDX-005.2 단편 14-16 및 CDX-005 게놈 단편 1-13 및 17-10를 바이러스 게놈을 측접하는 2개의 프라이머에 의한 단일 튜브 오버랩 PCR 반응에서 풀링했다. 바이러스 게놈의 5' 말단에 상응하는 정방향 프라이머(2312)는 상류 T7 RNA 폴리머라아제 프로모터를 포함했다. 19-단편 오버랩 PCR은 약 30 kb의 DNA 앰플리콘을 생성하여, 전체 게놈 cDNA가 성공적으로 생성되었다는 것을 시사했고, 0.4% 아가로오스 겔에서 명확한 밴드를 볼 수 있었다. 정제 후, PCR로 조립된 전장 cDNA 게놈을 G 캡-유사체 존재 하에 시험관내 전사에 의한 감염성 바이러스 RNA의 합성을 위한 주형으로 사용했다. 결과적으로 생성된 전사체 RNA는 나란히 전개된 DNA 래더와 비교하여 8 kb 내지 1 kb 범위의 끌림으로 나타났다.
PCR-조립된 전장 cDNA 게놈의 무결성을 테스트하기 위해, 제한 엔도뉴클레아제 Nhe I에 의한 분해를 이용하였다. CDX-005.2 게놈 cDNA는 스파이크의 탈최적화된 영역에 설계된 추가적인 Nhe I 부위 때문에, 독특하고 구별되는 단편 패턴을 생성했다. Nhe I 처리된 cDNA 게놈의 단편 패턴은 인 실리코-예측 DNA 단편 크기와 일치하여, 바이러스 cDNA 게놈이 정확하게 조립되었다는 것을 나타냈다. 주목되는 것은 아가로오스 겔로 이동하지 않은 PCR 산물의 부분은 Nhe I 분해 후 사라지고 예상되는 크기의 Nhe I RFLP 단편으로 전환되어, 이 물질도 정확하게 형성된 전장 게놈 cDNA에 해당했다는 것을 시사한다는 것이다.
역유전학-유래 합성 CDX-005.2 바이러스는 헬퍼로서 핵단백질 mRNA와 함께 시험관내에서 전사된 게놈 RNA의 Vero 10-87 세포 내로의 동시-전기천공에 의해 구제되었다. CDX-005.2 백신 균주의 바이러스 회수는 승인된 기관 생물안전성 위원회(Institutional Biosafety Committee) 가이드라인에 따라 BSL2+(biosafety level 2 enhanced) 조건 하에서 수행되었다. 감염성 CDX-005.2 바이러스는 전기천공(2.5x105 PFU/ml) 후 4일차에 플라크 분석에 의해 배양 상층액에서 검출되었으며, 7일차까지 꾸준히 약 107 PFU/ml로 증가했다(도 12).
본 발명자들은 이전에 원래의 CDX-005 백신 균주가 인간 체온과 동등한 온도에서 바이러스 차단을 그럴듯하게 예측할 수 있기 때문에, 생 약독화 백신에 대한 바람직한 안전성 특징인 40℃에서 플라크 형성에 대해 온도 민감성이라 것을 관찰했다. 그 표현형이 CDX-005.2까지 확장되는지 테스트하기 위해, 허용 온도(37℃) 및 제한 온도(40℃)에서 CDX-005와 CDX-005.2의 병렬 플라크 분석을 수행했다. 실제로, 본 발명자들은 CDX-005 및 CDX-005.2에 대해 각각 플라크 형성의 약 1,000배 및 10,000배 감소로, 두 바이러스 모두의 상당한 온도 민감성 표현형을 관찰했다 (도 13).
회수된 CDX-005.2는 모 CDX-005와 유사하게 40℃에서 성장에 대해 온도 민감성이고, CDX-005와 유사한 플라크 형태를 갖는다.
실시예
10
계대 1 및 2에서 SARS-
CoV
-2 델타 백신 후보(
CDX
-005.
2)의
시퀀싱 보고
SARS-CoV-2 델타 백신 후보(CDX-005.2)에 대한 서열을 정의하기 위해, GISAID에서 10-20개의 델타 변이체를 선택하고, NCBI Blastn 다중 서열 정렬을 통해 CDX-005와 비교했다. 평가된 모든 델타 서열의 스파이크 유전자에 8개의 주요 돌연변이가 존재했다. 그 후, 원래의 CDX-005 스파이크 유전자의 8개 뉴클레오티드를 이들 선택된 돌연변이로 치환하여 델타 변이체 스파이크 서열을 수득했다.
델타 돌연변이가 탈최적화된 영역에 있는 경우, 탈최적화된 코돈을 야생형 코돈으로 대체하였다. 바이러스 백본은 푸린 절단 부위의 36개 뉴클레오티드 결실을 포함하는 CDX-005이다. 새로 구축된 전장 델타 바이러스 게놈을 전사한 후 RNA 정제를 수행했다.
이어서, 정제된 게놈 RNA를 WHO 10-87 Vero 세포에 형질감염시켰다. 계대 1과 계대 2에서 회수된 바이러스를 채취하고, 제조사의 프로토콜을 통해 TRIzol™(계대 1의 경우) 및 QiaAmp 바이러스 키트(계대 2의 경우)로 바이러스 RNA를 추출했다. 표준 RT-PCR을 수행하고, 19개의 PCR 단편을 추가로 증폭시키고 Sanger 시퀀싱에 의해 분석하여 바이러스 정체를 확인하고 가짜 돌연변이를 파악했다.
시퀀싱 반응물은 BSL2 격리 하에 Codagenix에서 혼합되고 시퀀싱을 위해 Genewiz Inc(South Plainfield, NJ) 및 Eurofins Genomics(Louisville, KY)에 제출되었다. 결과적으로 수득된 서열을 백신 균주 CDX-005의 백본에 있는 COVID-델타 변이체의 설계된 서열과 정렬시켰다.
설계 시에 우세한 SARS-CoV-2 델타 변이체의 아미노산 서열과 일치하는 아미노산 서열을 갖는 CDX-005.2를 생성하기 위해, 11개의 단일 뉴클레오티드 변화 및 1개의 6개 뉴클레오티드 결실을 CDX-005의 스파이크 유전자에 도입하였다(표 7). 모든 델타-특이적 서열 교정(edit)이 계대 1(Lot 1-071521-1) 및 계대 2(Lot 1-073121-1) 모두에서 CDX.005.2 바이러스에서 확인되었다. CDX-005에 존재하는 것과 동일한 12개 아미노산 푸린 절단 부위 결실이 CDX-005.2에서 구현되었고, 본원에서 검증되었다. 계대 1과 계대 2에서 CDX-005.2의 게놈 서열은 동일했다. 계대 1과 계대 2 모두에서 CDX-005.2에서 5개의 자발적(spontaneous) 점 돌연변이가 검출되었다: G1013A, C10833A, A11089G, A12557U, 및 G21668A. 돌연변이가 있는 각 위치의 시퀀싱 트레이스는 일정 수준의 유전적 이질성(genetic heterogeneity)을 보이고, 집단의 일부는 여전히 원래의 뉴클레오티드를 갖는다. 돌연변이된 뉴클레오티드가 계대 1에서 우세한 종이었으나, 그 중 4개가 추가 계대(계대 2)에서 원래의 대응물을 능가했으며, 이는 그들이 세포 배양 적응 돌연변이일 수 있다는 것을 나타낸다. C10833A는 혼합 종으로 남아 있었고, 계대 2에서는 아데닌이 우세했다. 돌연변이 중 4개는 아미노산 변화를 초래한 반면, A11098G는 동일한 아미노산을 유지했다. 설계 서열과의 모든 아미노산 차이는 탈최적화된 영역 외부에 있었고, 세포 배양에 대한 정상적인 바이러스 적응의 결과일 수 있다.
CDX-005(Codagenix Passage 2)와 CDX-005.2(Codagenix Passage 2) 사이의 하나의 추가적인 서열 변이가 게놈 위치 28818에서 검출되었다. 이 위치는 CDX-005 기준(reference) 서열(Codagenix Passage 2)에서 시티딘인 반면, CDX-005.2에서는 우라실이어서, N 핵단백질에서 Ser에서 Leu로의 아미노산 변화를 초래하다.
표 7. CDX-005(P2, Lot 1-061920-1)와 CDX-005.2-델타(P2, Lot 1-073121-1) 간의 서열 비교
게놈 위치(유전자) | CDX-005 (P2) 중 뉴클레오티드 |
CDX-005.2 (P2) 중 뉴클레오티드 |
결과적인 아미노산 변화 |
비고 |
1013 (nsp2) | G | A | Glu (GAA)→Lys (AAA) | 자발적 (spontaneous) |
10833 (nsp5) | C | A | Ala (GCC)→Asp (GAC) | 자발적 |
11089 (nsp6) | A | G | Glu (GAA→GAG), 불변 | 자발적 |
12557 (nsp8) | A | U | Ile (AUC)→Phe (UUC) | 자발적 |
21618 (스파이크) | C | G | Thr (ACA)→Arg (AGA) | 델타 특이적 |
21668 (스파이크) | G | A | Val (GUU)→Ile (AUU) | 자발적 |
21846 (스파이크) | U* | C | Ile (AUU)→Thr (ACU) | 델타 특이적 |
21987 (스파이크) | G | A | Gly (GGU)→Asp (GAU) | 델타 특이적 |
22029 (스파이크) | A (del) | G | Glu (GAG)→Gly (GGA) | 델타 특이적 |
22030 (스파이크) | G (del) | A | 델타 특이적 | |
22296 (스파이크) | G* | A (22290) | Arg (CGU)→His (CAU) | 델타 특이적 |
22917 (스파이크) | U | G (22911) | Leu (CUG)→Arg (CGG) | 델타 특이적 |
22995 (스파이크) | C | A (22989) | Thr (ACA)→Lys (AAA) | 델타 특이적 |
23403 (스파이크) | A | G (23397) | His (CAU)→Arg (CGU) | 델타 특이적 |
24201 (스파이크) | U* | C (24195) | Val (GUA)→Ala (GCA) | 델타 특이적 |
24374 (스파이크) | G | A (24368) | Asp (GAC)→Asn (AAU) | 델타 특이적 |
24376 (스파이크) | C | U (24370) | 델타 특이적 | |
28818 (N) | C | U (22812) | Ser (UCA)→Leu (UUA) | SIIPL Vaccine Lot 중 U |
*wt SARS-CoV-2(델타) 특이적 아미노산으로 복원된 CDX-005의 자발적 돌연변이
실시예
11
햄스터에 탈최적화된 SARS-CoV2(CDX.005) 또는 야생형 SARS-CoV2 WA/1를 IN 으로 백신접종했다. 백신접종 후 27일차에 햄스터에 SARS-CoV2 변이체 베타를 IN으로 챌린지했다. SARS-CoV2 변이체 베타에 대한 MN 분석을 통해 중화 항체 역가를 평가했다. 도 14는 WT-감염된 햄스터의 혈청보다 B.1.351에 대한 더 우수한 교차 중화(cross-neutralization)가 있었다는 것을 보여준다.
본 발명의 다양한 구체예는 상세한 설명에 전술된다. 이러한 설명은 전술된 구체예를 직접적으로 설명하나, 당업자는 본원에 표시되고, 기술된 특정한 구체예에 대한 수정 및/또는 변형을 고안할 수 있다는 것이 이해된다. 본 설명의 범위에 속하는 그러한 모든 수정 또는 변형도 본 설명에 포함되도록 의도된다. 구체적으로 언급하지 않는 한, 명세서 및 청구범위의 단어 및 문구에 해당 분야의 통상의 기술자에게 일반적이고 익숙한 의미를 부여하는 것이 발명자의 의도이다.
본원의 출원 당시 출원인에게 알려진 본 발명의 다양한 구체예에 대한 전술된 설명이 제시되었고, 예시 및 설명의 목적으로 의도된다. 본 설명은 완전하거나 개시된 정확한 형태로 본 발명을 한정하는 것으로 의도되지 않으며, 전술된 교시에 비추어 많은 수정 및 변형이 가능하다. 기술된 구체예는 본 발명의 원리 및 그의 실제 응용을 설명하고, 당업자가 다양한 구체예로 및 고려되는 특정 용도에 적합한 다양한 수정을 통해 본 발명을 활용할 수 있게 하는 역할을 한다. 따라서, 본 발명은 본 발명을 수행하기 위해 개시된 특정한 구체예로 한정되지 않는 것으로 의도된다.
본 발명의 특정 구체예가 표시되고 설명되었으나, 본 발명 및 그의 더 넓은 양태로부터 벗어나지 않으면서, 본 명세서의 교시에 기초하여 변경 및 수정이 가능하고, 따라서, 첨부된 청구범위는 본 발명의 진정한 사상 및 범위 내에 있는 모든 변경과 수정을 그 범위 내에 포함한다는 것이 당업자에게 자명할 것이다. 일반적으로, 본원에서 사용된 용어는 일반적으로 "개방형(open)" 용어로 의도된다는 것이 당업자에 의해 이해될 것이다(예를 들어, "포함하는"이라는 용어는 "포함하지만 그에 한정되지 않는"으로 해석되어야 하며, "갖는"이라는 용어는 "적어도 갖는"으로 해석되어야 하며, 용어 "포함한다"는 "포함하지만 그에 한정되지 않는다"로 해석되어야 한다.).
본원에 사용된 용어 "포함하는" 또는 "포함한다"는 구체예에 유용한 조성물, 방법 및 그의 개별적인 성분들과 관련하여 사용되나, 유용성 여부에 관계없이 불특정 요소의 포함에 개방적이다. 일반적으로 본원에 사용된 용어는 일반적으로 "개방형" 용어로 의도된다는 것이 당업자에 의해 이해될 것이다(예를 들어, "포함하는"이라는 용어는 "포함하지만 그에 한정되지 않는"으로 해석되어야 하며, "갖는"이라는 용어는 "적어도 갖는"으로 해석되어야 하며, 용어 "포함한다"는 "포함하지만 그에 한정되지 않는다"로 해석되어야 한다.). 포함하는, 함유하는, 또는 갖는과 같은 용어의 동의어로서, 개방형 용어 "포함하는"이 본 발명을 설명하고 청구하기 위해 본원에서 사용되나, 본 발명, 또는 그의 구체예는 대안적으로 다음과 같은 대체 용어, 예를 들면, "구성되는" 또는 "필수적으로 구성되는(consisting essentially of)"을 이용하여 기술될 수 있다.
SEQUENCE LISTING
<110> CODAGENIX INC.
MUELLER, Steffen
COLEMAN, John Robert
WANG, Ying
YANG, Chen
SONG, Yutong
<120> DEOPTIMIZED SARS-CoV-2 VARIANTS AND METHODS AND USES THEREOF
<130> 064955-000051WO00
<150> 63/219,263
<151> 2021-07-07
<160> 54
<170> PatentIn version 3.5
<210> 1
<211> 29834
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 1
attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60
gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120
cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180
ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240
cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300
acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360
agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420
cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480
acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540
cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600
cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660
tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720
tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780
actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840
ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900
atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960
tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020
gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080
ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140
gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200
caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260
gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320
aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380
atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440
cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500
ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560
ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620
aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680
gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740
aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800
aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860
tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920
tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980
aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040
taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100
gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160
agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220
ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280
ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340
tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400
ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460
tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520
aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580
agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640
aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700
cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760
agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820
acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880
ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940
actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000
tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060
agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120
agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180
agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240
cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300
agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360
aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420
aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480
aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540
tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600
acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660
gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720
tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780
tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840
aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900
gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960
caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020
cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080
tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140
agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200
gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260
gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320
cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380
ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440
tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500
agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560
gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620
tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680
agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740
ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800
agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860
taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920
ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980
aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040
acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100
acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160
tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220
cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280
caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340
acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400
acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460
gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520
taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580
cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640
agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700
tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760
gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820
acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880
ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940
tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000
tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060
tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120
aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180
taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240
gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300
tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360
cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420
ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480
aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540
cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600
attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660
tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720
aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780
ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840
atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900
ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960
gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020
tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080
ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140
tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200
atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260
tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320
ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380
acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440
tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500
ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560
gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620
tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680
cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740
tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800
ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860
taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920
atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980
agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040
tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100
agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160
ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220
tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280
ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340
tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400
atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460
tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520
tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580
gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640
tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700
tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760
tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820
attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880
gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940
tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000
ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060
ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120
acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180
tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240
agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300
atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360
accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420
tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagaa gagcttttgg 9480
tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540
ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600
gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660
cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720
tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780
tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840
gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900
taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960
tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020
accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080
atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140
tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200
gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260
ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320
taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380
acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440
tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500
ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560
tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620
aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680
cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740
ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800
actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860
agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920
tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980
gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040
agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100
accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160
gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220
ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280
tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340
aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400
gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460
catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520
gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580
tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640
ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700
ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760
gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820
tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880
actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940
ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000
ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060
agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120
atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180
ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240
ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300
gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360
gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420
aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480
tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540
atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600
tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660
ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720
gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780
caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840
atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900
ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960
aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020
acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080
tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140
taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200
ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260
ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320
acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380
ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440
gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500
ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560
aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620
gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680
caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740
ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800
aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860
acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920
gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980
cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040
attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100
gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160
ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220
ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280
aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340
tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400
ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460
gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520
ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580
cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640
cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700
gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760
ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820
ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880
gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940
tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000
tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060
caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120
tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180
gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240
atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300
aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360
aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420
caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480
tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540
acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600
cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660
tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720
gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780
aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840
actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900
aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960
ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020
tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080
tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140
gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200
tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260
aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320
tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380
gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440
agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500
gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560
attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620
agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680
tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740
gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800
aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860
gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920
tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980
attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040
tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100
agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160
tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220
aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280
aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340
gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400
gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460
cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520
atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580
gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640
gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700
aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760
gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820
ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880
accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940
aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000
agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060
tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120
agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180
gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240
ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300
ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360
cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420
cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480
cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540
caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600
catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660
tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720
catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780
ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840
catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900
aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960
gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020
gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080
tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140
tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200
aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260
aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320
acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380
tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440
ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500
gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560
ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620
agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680
gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740
gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800
cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860
gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920
gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980
gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040
gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100
agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160
aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220
caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280
ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340
agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400
tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460
acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520
gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580
actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640
ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700
tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760
acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820
aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880
gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940
cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000
tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060
aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120
gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180
tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240
actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300
ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360
aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420
aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480
cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540
cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600
tcagtgtgtt aatcttacaa ccagaactca attaccccct gcatacacta attctttcac 21660
acgtggtgtt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720
cttgttctta cctttctttt ccaatgttac ttggttccat gctatacatg tctctgggac 21780
caatggtact aagaggtttg ataaccctgt cctaccattt aatgatggtg tttattttgc 21840
ttccattgag aagtctaaca taataagagg ctggattttt ggtactactt tagattcgaa 21900
gacccagtcc ctacttattg ttaataacgc tactaatgtt gttattaaag tctgtgaatt 21960
tcaattttgt aatgatccat ttttgggtgt ttattaccac aaaaacaaca aaagttggat 22020
ggaaagtgag ttcagagttt attctagtgc gaataattgc acttttgaat atgtctctca 22080
gccttttctt atggaccttg aaggaaaaca gggtaatttc aaaaatctta gggaatttgt 22140
gtttaagaat attgatggtt attttaaaat atattctaag cacacgccta ttaatttagt 22200
gcgtgatctc cctcagggtt tttcggcttt agaaccattg gtagatttgc caataggtat 22260
taacatcact aggtttcaaa ctttacttgc tttacgtaga agttatttga ctcctggtga 22320
ttcttcttca ggttggacag ctggtgctgc agcttattat gtgggttatc ttcaacctag 22380
gacttttcta ttaaaatata atgaaaatgg aaccattaca gatgctgtag actgtgcact 22440
tgaccctctc tcagaaacaa agtgtacgtt gaaatccttc actgtagaaa aaggaatcta 22500
tcaaacttct aactttagag tccaaccaac agaatctatt gttagatttc ctaatattac 22560
aaacttgtgc ccttttggtg aagtttttaa cgccaccaga tttgcatctg tttatgcttg 22620
gaacaggaag agaatcagca actgtgttgc tgattattct gtcctatata attccgcatc 22680
attttccact tttaagtgtt atggagtgtc tcctactaaa ttaaatgatc tctgctttac 22740
taatgtctat gcagattcat ttgtaattag aggtgatgaa gtcagacaaa tcgctccagg 22800
gcaaactgga aagattgctg attataatta taaattacca gatgatttta caggctgcgt 22860
tatagcttgg aattctaaca atcttgattc taaggttggt ggtaattata attacctgta 22920
tagattgttt aggaagtcta atctcaaacc ttttgagaga gatatttcaa ctgaaatcta 22980
tcaggccggt agcacacctt gtaatggtgt tgaaggtttt aattgttact ttcctttaca 23040
atcatatggt ttccaaccca ctaatggtgt tggttaccaa ccatacagag tagtagtact 23100
ttcttttgaa cttctacatg caccagcaac tgtttgtgga cctaaaaagt ctactaattt 23160
ggttaaaaac aaatgtgtca atttcaactt caatggttta acaggcacag gtgttcttac 23220
tgagtctaac aaaaagtttc tgcctttcca acaatttggc agagacattg ctgacactac 23280
tgatgctgtc cgtgatccac agacacttga gattcttgac attacaccat gttcttttgg 23340
tggtgtcagt gttataacac caggaacaaa tacttctaac caggttgctg ttctttatca 23400
ggatgttaac tgcacagaag tccctgttgc tattcatgca gatcaactta ctcctacttg 23460
gcgtgtttat tctacaggtt ctaatgtttt tcaaacacgt gcaggctgtt taataggggc 23520
tgaacatgtc aacaactcat atgagtgtga catacccatt ggtgcaggta tatgcgctag 23580
ttatcagact cagcaatcca tcattgccta cactatgtca cttggtgcag aaaattcagt 23640
tgcttactct aataactcta ttgccatacc cacaaatttt actattagtg ttaccacaga 23700
aattctacca gtgtctatga ccaagacatc agtagattgt acaatgtaca tttgtggtga 23760
ttcaactgaa tgcagcaatc ttttgttgca atatggcagt ttttgtacac aattaaaccg 23820
tgctttaact ggaatagctg ttgaacaaga caaaaacacc caagaagttt ttgcacaagt 23880
caaacaaatt tacaaaacac caccaattaa agattttggt ggttttaatt tttcacaaat 23940
attaccagat ccatcaaaac caagcaagag gtcatttatt gaagatctac ttttcaacaa 24000
agtgacactt gcagatgctg gcttcatcaa acaatatggt gattgccttg gtgatattgc 24060
tgctagagat ctcatttgcg ctcaaaaatt taacggactt acagttttac cacctttact 24120
tactgacgaa atgattgcgc aatatacatc cgcattgtta gccggaacta ttacatccgg 24180
atggactttt ggcgcaggcg tagcattaca gattccattc gctatgcaaa tggcttatag 24240
gtttaacggt ataggcgtta cgcaaaacgt actttatgag aatcaaaaac ttatcgctaa 24300
ccaatttaat tccgctatcg gtaagattca ggattcattg tctagtactg ctagtgcact 24360
cggtaagttg caagacgtag tgaatcaaaa cgctcaagca cttaatacac tcgttaaaca 24420
gcttagttct aattttggcg caatttctag tgtgcttaac gatatactat ctagactcga 24480
taaagtcgaa gccgaagtgc aaatcgatag attgattacc ggtaggttgc aatcattgca 24540
aacatacgtt acacagcaat tgattagggc cgcagagata cgcgctagcg ctaatctcgc 24600
agctactaaa atgtctgaat gcgtactcgg acaatctaaa cgtgtcgatt tttgcggtaa 24660
gggatatcat cttatgtctt ttccacaatc tgcacctcac ggagtcgtgt ttttacacgt 24720
tacttatgtg ccagctcaag agaaaaattt tacaaccgct cctgctattt gtcatgacgg 24780
taaggcacat tttcctagag agggcgtatt cgtttctaac ggtacacatt ggttcgttac 24840
acaacgtaat ttttacgaac ctcaaattat tactactgat aatacattcg tatcaggtaa 24900
ttgtgacgta gtgataggta tcgttaataa tacagtttac gatccacttc aacctgaact 24960
cgatagtttt aaagaggaac tcgataagta ttttaaaaat catacatcac ctgacgtcga 25020
cttaggcgat atttcaggta ttaacgctag tgtcgttaac attcaaaaag agattgatag 25080
acttaacgaa gtcgctaaaa atcttaacga atcacttatc gatctgcaag agttaggtaa 25140
gtatgagcaa tatattaaat ggccttggta tatttggtta ggctttatag ccggattgat 25200
cgcaatcgtt atggttacaa ttatgttatg ttgtatgaca tcatgttgtt catgtcttaa 25260
gggatgttgt tcatgcggat catgttgtaa atttgacgaa gacgattccg aaccagtgct 25320
taaaggcgtt aagttacatt atacataaac gaacttatgg atttgtttat gagaatcttc 25380
acaattggaa ctgtaacttt gaagcaaggt gaaatcaagg atgctactcc ttcagatttt 25440
gttcgcgcta ctgcaacgat accgatacaa gcctcactcc ctttcggatg gcttattgtt 25500
ggcgttgcac ttcttgctgt ttttcagagc gcttccaaaa tcataaccct caaaaagaga 25560
tggcaactag cactctccaa gggtgttcac tttgtttgca acttgctgtt gttgtttgta 25620
acagtttact cacacctttt gctcgttgct gctggccttg aagccccttt tctctatctt 25680
tatgctttag tctacttctt gcagagtata aactttgtaa gaataataat gaggctttgg 25740
ctttgctgga aatgccgttc caaaaaccca ttactttatg atgccaacta ttttctttgc 25800
tggcatacta attgttacga ctattgtata ccttacaata gtgtaacttc ttcaattgtc 25860
attacttcag gtgatggcac aacaagtcct atttctgaac atgactacca gattggtggt 25920
tatactgaaa aatgggaatc tggagtaaaa gactgtgttg tattacacag ttacttcact 25980
tcagactatt accagctgta ctcaactcaa ttgagtacag acactggtgt tgaacatgtt 26040
accttcttca tctacaataa aattgttgat gagcctgaag aacatgtcca aattcacaca 26100
atcgacggtt catccggagt tgttaatcca gtaatggaac caatttatga tgaaccgacg 26160
acgactacta gcgtgccttt gtaagcacaa gctgatgagt acgaacttat gtactcattc 26220
gtttcggaag agacaggtac gttaatagtt aatagcgtac ttctttttct tgctttcgtg 26280
gtattcttgc tagttacact agccatcctt actgcgcttc gattgtgtgc gtactgctgc 26340
aatattgtta acgtgagtct tgtaaaacct tctttttacg tttactctcg tgttaaaaat 26400
ctgaattctt ctagagttcc tgatcttctg gtctaaacga actaaatatt atattagttt 26460
ttctgtttgg aactttaatt ttagccatgg cagattccaa cggtactatt accgttgaag 26520
agcttaaaaa gctccttgaa caatggaacc tagtaatagg tttcctattc cttacatgga 26580
tttgtcttct acaatttgcc tatgccaaca ggaataggtt tttgtatata attaagttaa 26640
ttttcctctg gctgttatgg ccagtaactt tagcttgttt tgtgcttgct gctgtttaca 26700
gaataaattg gatcaccggt ggaattgcta tcgcaatggc ttgtcttgta ggcttgatgt 26760
ggctcagcta cttcattgct tctttcagac tgtttgcgcg tacgcgttcc atgtggtcat 26820
tcaatccaga aactaacatt cttctcaacg tgccactcca tggcactatt ctgaccagac 26880
cgcttctaga aagtgaactc gtaatcggag ctgtgatcct tcgtggacat cttcgtattg 26940
ctggacacca tctaggacgc tgtgacatca aggacctgcc taaagaaatc actgttgcta 27000
catcacgaac gctttcttat tacaaattgg gagcttcgca gcgtgtagca ggtgactcag 27060
gttttgctgc atacagtcgc tacaggattg gcaactataa attaaacaca gaccattcca 27120
gtagcagtga caatattgct ttgcttgtac agtaagtgac aacagatgtt tcatctcgtt 27180
gactttcagg ttactatagc agagatatta ctaattatta tgaggacttt taaagtttcc 27240
atttggaatc ttgattacat cataaacctc ataattaaaa atttatctaa gtcactaact 27300
gagaataaat attctcaatt agatgaagag caaccaatgg agattgatta aacgaacatg 27360
aaaattattc ttttcttggc actgataaca ctcgctactt gtgagcttta tcactaccaa 27420
gagtgtgtta gaggtacaac agtactttta aaagaacctt gctcttctgg aacatacgag 27480
ggcaattcac catttcatcc tctagctgat aacaaatttg cactgacttg ctttagcact 27540
caatttgctt ttgcttgtcc tgacggcgta aaacacgtct atcagttacg tgccagatca 27600
gtttcaccta aactgttcat cagacaagag gaagttcaag aactttactc tccaattttt 27660
cttattgttg cggcaatagt gtttataaca ctttgcttca cactcaaaag aaagacagaa 27720
tgattgaact ttcattaatt gacttctatt tgtgcttttt agcctttctg ctattccttg 27780
ttttaattat gcttattatc ttttggttct cacttgaact gcaagatcat aatgaaactt 27840
gtcacgccta aacgaacatg aaatttcttg ttttcttagg aatcatcaca actgtagctg 27900
catttcacca agaatgtagt ttacagtcat gtactcaaca tcaaccatat gtagttgatg 27960
acccgtgtcc tattcacttc tattctaaat ggtatattag agtaggagct agaaaatcag 28020
cacctttaat tgaattgtgc gtggatgagg ctggttctaa atcacccatt cagtacatcg 28080
atatcggtaa ttatacagtt tcctgttcac cttttacaat taattgccag gaacctaaat 28140
tgggtagtct tgtagtgcgt tgttcgttct atgaagactt tttagagtat catgacgttc 28200
gtgttgtttt agatttcatc taaacgaaca aactaaaatg tctgataatg gaccccaaaa 28260
tcagcgaaat gcaccccgca ttacgtttgg tggaccctca gattcaactg gcagtaacca 28320
gaatggagaa cgcagtgggg cgcgatcaaa acaacgtcgg ccccaaggtt tacccaataa 28380
tactgcgtct tggttcaccg ctctcactca acatggcaag gaagacctta aattccctcg 28440
aggacaaggc gttccaatta acaccaatag cagtccagat gaccaaattg gctactaccg 28500
aagagctacc agacgaattc gtggtggtga cggtaaaatg aaagatctca gtccaagatg 28560
gtatttctac tacctaggaa ctgggccaga agctggactt ccctatggtg ctaacaaaga 28620
cggcatcata tgggttgcaa ctgagggagc cttgaataca ccaaaagatc acattggcac 28680
ccgcaatcct gctaacaatg ctgcaatcgt gctacaactt cctcaaggaa caacattgcc 28740
aaaaggcttc tacgcagaag ggagcagagg cggcagtcaa gcctcttctc gttcctcatc 28800
acgtagtcgc aacagttcaa gaaattcaac tccaggcagc agtaggggaa cttctcctgc 28860
tagaatggct ggcaatggcg gtgatgctgc tcttgctttg ctgctgcttg acagattgaa 28920
ccagcttgag agcaaaatgt ctggtaaagg ccaacaacaa caaggccaaa ctgtcactaa 28980
gaaatctgct gctgaggctt ctaagaagcc tcggcaaaaa cgtactgcca ctaaagcata 29040
caatgtaaca caagctttcg gcagacgtgg tccagaacaa acccaaggaa attttgggga 29100
ccaggaacta atcagacaag gaactgatta caaacattgg ccgcaaattg cacaatttgc 29160
ccccagcgct tcagcgttct tcggaatgtc gcgcattggc atggaagtca caccttcggg 29220
aacgtggttg acctacacag gtgccatcaa attggatgac aaagatccaa atttcaaaga 29280
tcaagtcatt ttgctgaata agcatattga cgcatacaaa acattcccac caacagagcc 29340
taaaaaggac aaaaagaaga aggctgatga aactcaagcc ttaccgcaga gacagaagaa 29400
acagcaaact gtgactcttc ttcctgctgc agatttggat gatttctcca aacaattgca 29460
acaatccatg agcagtgctg actcaactca ggcctaaact catgcagacc acacaaggca 29520
gatgggctat ataaacgttt tcgcttttcc gtttacgata tatagtctac tcttgtgcag 29580
aatgaattct cgtaactaca tagcacaagt agatgtagtt aactttaatc tcacatagca 29640
atctttaatc agtgtgtaac attagggagg acttgaaaga gccaccacat tttcaccgag 29700
gccacgcgga gtacgatcga gtgtacagtg aacaatgcta gggagagctg cctatatgga 29760
agagccctaa tgtgtaaaat taattttagt agtgctatcc ccatgtgatt ttaatagctt 29820
cttaggagaa tgac 29834
<210> 2
<211> 1261
<212> PRT
<213> Coronavirus
<400> 2
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu Arg Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly
675 680 685
Ala Glu Asn Ser Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr
690 695 700
Asn Phe Thr Ile Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr
705 710 715 720
Lys Thr Ser Val Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu
725 730 735
Cys Ser Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn
740 745 750
Arg Ala Leu Thr Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu
755 760 765
Val Phe Ala Gln Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp
770 775 780
Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro
785 790 795 800
Ser Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu
805 810 815
Ala Asp Ala Gly Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile
820 825 830
Ala Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val
835 840 845
Leu Pro Pro Leu Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala
850 855 860
Leu Leu Ala Gly Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Val
865 870 875 880
Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly
885 890 895
Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala
900 905 910
Asn Gln Phe Asn Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser
915 920 925
Thr Ala Ser Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala
930 935 940
Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala
945 950 955 960
Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu
965 970 975
Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu
980 985 990
Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala
995 1000 1005
Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly
1010 1015 1020
Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met
1025 1030 1035
Ser Phe Pro Gln Ser Ala Pro His Gly Val Val Phe Leu His Val
1040 1045 1050
Thr Tyr Val Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala
1055 1060 1065
Ile Cys His Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe
1070 1075 1080
Val Ser Asn Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr
1085 1090 1095
Glu Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn
1100 1105 1110
Cys Asp Val Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro
1115 1120 1125
Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr
1130 1135 1140
Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser
1145 1150 1155
Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg
1160 1165 1170
Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu
1175 1180 1185
Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr
1190 1195 1200
Ile Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val
1205 1210 1215
Thr Ile Met Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys
1220 1225 1230
Gly Cys Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp
1235 1240 1245
Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
1250 1255 1260
<210> 3
<211> 3777
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 3
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttacaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatctctggg accaatggta ctaagaggtt tgataaccct 240
gtcctaccat ttaatgatgg tgtttatttt gcttccactg agaagtctaa cataataaga 300
ggctggattt ttggtactac tttagattcg aagacccagt ccctacttat tgttaataac 360
gctactaatg ttgttattaa agtctgtgaa tttcaatttt gtaatgatcc atttttgggt 420
gtttaccaca aaaacaacaa aagttggatg gaaagtgagt tcagagttta ttctagtgcg 480
aataattgca cttttgaata tgtctctcag ccttttctta tggaccttga aggaaaacag 540
ggtaatttca aaaatcttag ggaatttgtg tttaagaata ttgatggtta ttttaaaata 600
tattctaagc acacgcctat taatttagtg cgtgatctcc ctcagggttt ttcggcttta 660
gaaccattgg tagatttgcc aataggtatt aacatcacta ggtttcaaac tttacttgct 720
ttacatagaa gttatttgac tcctggtgat tcttcttcag gttggacagc tggtgctgca 780
gcttattatg tgggttatct tcaacctagg acttttctat taaaatataa tgaaaatgga 840
accattacag atgctgtaga ctgtgcactt gaccctctct cagaaacaaa gtgtacgttg 900
aaatccttca ctgtagaaaa aggaatctat caaacttcta actttagagt ccaaccaaca 960
gaatctattg ttagatttcc taatattaca aacttgtgcc cttttggtga agtttttaac 1020
gccaccagat ttgcatctgt ttatgcttgg aacaggaaga gaatcagcaa ctgtgttgct 1080
gattattctg tcctatataa ttccgcatca ttttccactt ttaagtgtta tggagtgtct 1140
cctactaaat taaatgatct ctgctttact aatgtctatg cagattcatt tgtaattaga 1200
ggtgatgaag tcagacaaat cgctccaggg caaactggaa agattgctga ttataattat 1260
aaattaccag atgattttac aggctgcgtt atagcttgga attctaacaa tcttgattct 1320
aaggttggtg gtaattataa ttacctgtat agattgttta ggaagtctaa tctcaaacct 1380
tttgagagag atatttcaac tgaaatctat caggccggta gcacaccttg taatggtgtt 1440
gaaggtttta attgttactt tcctttacaa tcatatggtt tccaacccac ttatggtgtt 1500
ggttaccaac catacagagt agtagtactt tcttttgaac ttctacatgc accagcaact 1560
gtttgtggac ctaaaaagtc tactaatttg gttaaaaaca aatgtgtcaa tttcaacttc 1620
aatggtttaa caggcacagg tgttcttact gagtctaaca aaaagtttct gcctttccaa 1680
caatttggca gagacattga tgacactact gatgctgtcc gtgatccaca gacacttgag 1740
attcttgaca ttacaccatg ttcttttggt ggtgtcagtg ttataacacc aggaacaaat 1800
acttctaacc aggttgctgt tctttatcag ggtgttaact gcacagaagt ccctgttgct 1860
attcatgcag atcaacttac tcctacttgg cgtgtttatt ctacaggttc taatgttttt 1920
caaacacgtg caggctgttt aataggggct gaacatgtca acaactcata tgagtgtgac 1980
atacccattg gtgcaggtat atgcgctagt tatcagactc agcaatccat cattgcctac 2040
actatgtcac ttggtgcaga aaattcagtt gcttactcta ataactctat tgccataccc 2100
ataaatttta ctattagtgt taccacagaa attctaccag tgtctatgac caagacatca 2160
gtagattgta caatgtacat ttgtggtgat tcaactgaat gcagcaatct tttgttgcaa 2220
tatggcagtt tttgtacaca attaaaccgt gctttaactg gaatagctgt tgaacaagac 2280
aaaaacaccc aagaagtttt tgcacaagtc aaacaaattt acaaaacacc accaattaaa 2340
gattttggtg gttttaattt ttcacaaata ttaccagatc catcaaaacc aagcaagagg 2400
tcatttattg aagatctact tttcaacaaa gtgacacttg cagatgctgg cttcatcaaa 2460
caatatggtg attgccttgg tgatattgct gctagagacc tcatttgcgc tcaaaaattt 2520
aacggactta cagttttacc acctttactt actgacgaaa tgattgcgca atatacatcc 2580
gcattgttag ccggaactat tacatccgga tggacttttg gcgcaggcgc agcattacag 2640
attccattcg ctatgcaaat ggcttatagg tttaacggta taggcgttac gcaaaacgta 2700
ctttatgaga atcaaaaact tatcgctaac caatttaatt ccgctatcgg taagattcag 2760
gattcattgt ctagtactgc tagtgcactc ggtaagttgc aagacgtagt gaatcaaaac 2820
gctcaagcac ttaatacact cgttaaacag cttagttcta attttggcgc aatttctagt 2880
gtgcttaacg atatactagc aagactcgat aaagtcgaag ccgaagtgca aatcgataga 2940
ttgattaccg gtaggttgca atcattgcaa acatacgtta cacagcaatt gattagggcc 3000
gcagagatac gcgctagcgc taatctcgca gctactaaaa tgtctgaatg cgtactcgga 3060
caatctaaac gtgtcgattt ttgcggtaag ggatatcatc ttatgtcttt tccacaatct 3120
gcacctcacg gagtcgtgtt tttacacgtt acttatgtgc cagctcaaga gaaaaatttt 3180
acaaccgctc ctgctatttg tcatgacggt aaggcacatt ttcctagaga gggcgtattc 3240
gtttctaacg gtacacattg gttcgttaca caacgtaatt tttacgaacc tcaaattatt 3300
actactcaca atacattcgt atcaggtaat tgtgacgtag tgataggtat cgttaataat 3360
acagtttacg atccacttca acctgaactc gatagtttta aagaggaact cgataagtat 3420
tttaaaaatc atacatcacc tgacgtcgac ttaggcgata tttcaggtat taacgctagt 3480
gtcgttaaca ttcaaaaaga gattgataga cttaacgaag tcgctaaaaa tcttaacgaa 3540
tcacttatcg atctgcaaga gttaggtaag tatgagcaat atattaaatg gccttggtat 3600
atttggttag gctttatagc cggattgatc gcaatcgtta tggttacaat tatgttatgt 3660
tgtatgacat catgttgttc atgtcttaag ggatgttgtt catgcggatc atgttgtaaa 3720
tttgacgaag acgattccga accagtgctt aaaggcgtta agttacatta tacataa 3777
<210> 4
<211> 3777
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 4
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa ttttacaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgct 240
aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300
ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360
aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420
ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480
tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540
ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600
tttaaaatat attctaagca cacgcctatt aatttagtgc gtggtctccc tcagggtttt 660
tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720
ttacatagaa gttatttgac tcctggtgat tcttcttcag gttggacagc tggtgctgca 780
gcttattatg tgggttatct tcaacctagg acttttctat taaaatataa tgaaaatgga 840
accattacag atgctgtaga ctgtgcactt gaccctctct cagaaacaaa gtgtacgttg 900
aaatccttca ctgtagaaaa aggaatctat caaacttcta actttagagt ccaaccaaca 960
gaatctattg ttagatttcc taatattaca aacttgtgcc cttttggtga agtttttaac 1020
gccaccagat ttgcatctgt ttatgcttgg aacaggaaga gaatcagcaa ctgtgttgct 1080
gattattctg tcctatataa ttccgcatca ttttccactt ttaagtgtta tggagtgtct 1140
cctactaaat taaatgatct ctgctttact aatgtctatg cagattcatt tgtaattaga 1200
ggtgatgaag tcagacaaat cgctccaggg caaactggaa atattgctga ttataattat 1260
aaattaccag atgattttac aggctgcgtt atagcttgga attctaacaa tcttgattct 1320
aaggttggtg gtaattataa ttacctgtat agattgttta ggaagtctaa tctcaaacct 1380
tttgagagag atatttcaac tgaaatctat caggccggta gcacaccttg taatggtgtt 1440
aaaggtttta attgttactt tcctttacaa tcatatggtt tccaacccac ttatggtgtt 1500
ggttaccaac catacagagt agtagtactt tcttttgaac ttctacatgc accagcaact 1560
gtttgtggac ctaaaaagtc tactaatttg gttaaaaaca aatgtgtcaa tttcaacttc 1620
aatggtttaa caggcacagg tgttcttact gagtctaaca aaaagtttct gcctttccaa 1680
caatttggca gagacattgc tgacactact gatgctgtcc gtgatccaca gacacttgag 1740
attcttgaca ttacaccatg ttcttttggt ggtgtcagtg ttataacacc aggaacaaat 1800
acttctaacc aggttgctgt tctttatcag ggtgttaact gcacagaagt ccctgttgct 1860
attcatgcag atcaacttac tcctacttgg cgtgtttatt ctacaggttc taatgttttt 1920
caaacacgtg caggctgttt aataggggct gaacatgtca acaactcata tgagtgtgac 1980
atacccattg gtgcaggtat atgcgctagt tatcagactc agcaatccat cattgcctac 2040
actatgtcac ttggtgtaga aaattcagtt gcttactcta ataactctat tgccataccc 2100
acaaatttta ctattagtgt taccacagaa attctaccag tgtctatgac caagacatca 2160
gtagattgta caatgtacat ttgtggtgat tcaactgaat gcagcaatct tttgttgcaa 2220
tatggcagtt tttgtacaca attaaaccgt gctttaactg gaatagctgt tgaacaagac 2280
aaaaacaccc aagaagtttt tgcacaagtc aaacaaattt acaaaacacc accaattaaa 2340
gattttggtg gttttaattt ttcacaaata ttaccagatc catcaaaacc aagcaagagg 2400
tcatttattg aagatctact tttcaacaaa gtgacacttg cagatgctgg cttcatcaaa 2460
caatatggtg attgccttgg tgatattgct gctagagatc tcatttgcgc tcaaaaattt 2520
aacggactta cagttttacc acctttactt actgacgaaa tgattgcgca atatacatcc 2580
gcattgttag ccggaactat tacatccgga tggacttttg gcgcaggcgc agcattacag 2640
attccattcg ctatgcaaat ggcttatagg tttaacggta taggcgttac gcaaaacgta 2700
ctttatgaga atcaaaaact tatcgctaac caatttaatt ccgctatcgg taagattcag 2760
gattcattgt ctagtactgc tagtgcactc ggtaagttgc aagacgtagt gaatcaaaac 2820
gctcaagcac ttaatacact cgttaaacag cttagttcta attttggcgc aatttctagt 2880
gtgcttaacg atatactatc tagactcgat aaagtcgaag ccgaagtgca aatcgataga 2940
ttgattaccg gtaggttgca atcattgcaa acatacgtta cacagcaatt gattagggcc 3000
gcagagatac gcgctagcgc taatctcgca gctactaaaa tgtctgaatg cgtactcgga 3060
caatctaaac gtgtcgattt ttgcggtaag ggatatcatc ttatgtcttt tccacaatct 3120
gcacctcacg gagtcgtgtt tttacacgtt acttatgtgc cagctcaaga gaaaaatttt 3180
acaaccgctc ctgctatttg tcatgacggt aaggcacatt ttcctagaga gggcgtattc 3240
gtttctaacg gtacacattg gttcgttaca caacgtaatt tttacgaacc tcaaattatt 3300
actactgata atacattcgt atcaggtaat tgtgacgtag tgataggtat cgttaataat 3360
acagtttacg atccacttca acctgaactc gatagtttta aagaggaact cgataagtat 3420
tttaaaaatc atacatcacc tgacgtcgac ttaggcgata tttcaggtat taacgctagt 3480
gtcgttaaca ttcaaaaaga gattgataga cttaacgaag tcgctaaaaa tcttaacgaa 3540
tcacttatcg atctgcaaga gttaggtaag tatgagcaat atattaaatg gccttggtat 3600
atttggttag gctttatagc cggattgatc gcaatcgtta tggttacaat tatgttatgt 3660
tgtatgacat catgttgttc atgtcttaag ggatgttgtt catgcggatc atgttgtaaa 3720
tttgacgaag acgattccga accagtgctt aaaggcgtta agttacatta tacataa 3777
<210> 5
<211> 3780
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 5
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttagaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240
aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300
ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360
aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420
ttggatgttt attaccacaa aaacaacaaa agttggatgg aaagtggagt ttattctagt 480
gcgaataatt gcacttttga atatgtctct cagccttttc ttatggacct tgaaggaaaa 540
cagggtaatt tcaaaaatct tagggaattt gtgtttaaga atattgatgg ttattttaaa 600
atatattcta agcacacgcc tattaattta gtgcgtgatc tccctcaggg tttttcggct 660
ttagaaccat tggtagattt gccaataggt attaacatca ctaggtttca aactttactt 720
gctttacata gaagttattt gactcctggt gattcttctt caggttggac agctggtgct 780
gcagcttatt atgtgggtta tcttcaacct aggacttttc tattaaaata taatgaaaat 840
ggaaccatta cagatgctgt agactgtgca cttgaccctc tctcagaaac aaagtgtacg 900
ttgaaatcct tcactgtaga aaaaggaatc tatcaaactt ctaactttag agtccaacca 960
acagaatcta ttgttagatt tcctaatatt acaaacttgt gcccttttgg tgaagttttt 1020
aacgccacca gatttgcatc tgtttatgct tggaacagga agagaatcag caactgtgtt 1080
gctgattatt ctgtcctata taattccgca tcattttcca cttttaagtg ttatggagtg 1140
tctcctacta aattaaatga tctctgcttt actaatgtct atgcagattc atttgtaatt 1200
agaggtgatg aagtcagaca aatcgctcca gggcaaactg gaaagattgc tgattataat 1260
tataaattac cagatgattt tacaggctgc gttatagctt ggaattctaa caatcttgat 1320
tctaaggttg gtggtaatta taattaccgg tatagattgt ttaggaagtc taatctcaaa 1380
ccttttgaga gagatatttc aactgaaatc tatcaggccg gtagcaaacc ttgtaatggt 1440
gttgaaggtt ttaattgtta ctttccttta caatcatatg gtttccaacc cactaatggt 1500
gttggttacc aaccatacag agtagtagta ctttcttttg aacttctaca tgcaccagca 1560
actgtttgtg gacctaaaaa gtctactaat ttggttaaaa acaaatgtgt caatttcaac 1620
ttcaatggtt taacaggcac aggtgttctt actgagtcta acaaaaagtt tctgcctttc 1680
caacaatttg gcagagacat tgctgacact actgatgctg tccgtgatcc acagacactt 1740
gagattcttg acattacacc atgttctttt ggtggtgtca gtgttataac accaggaaca 1800
aatacttcta accaggttgc tgttctttat cagggtgtta actgcacaga agtccctgtt 1860
gctattcatg cagatcaact tactcctact tggcgtgttt attctacagg ttctaatgtt 1920
tttcaaacac gtgcaggctg tttaataggg gctgaacatg tcaacaactc atatgagtgt 1980
gacataccca ttggtgcagg tatatgcgct agttatcaga ctcagcaatc catcattgcc 2040
tacactatgt cacttggtgc agaaaattca gttgcttact ctaataactc tattgccata 2100
cccacaaatt ttactattag tgttaccaca gaaattctac cagtgtctat gaccaagaca 2160
tcagtagatt gtacaatgta catttgtggt gattcaactg aatgcagcaa tcttttgttg 2220
caatatggca gtttttgtac acaattaaac cgtgctttaa ctggaatagc tgttgaacaa 2280
gacaaaaaca cccaagaagt ttttgcacaa gtcaaacaaa tttacaaaac accaccaatt 2340
aaagattttg gtggttttaa tttttcacaa atattaccag atccatcaaa accaagcaag 2400
aggtcattta ttgaagatct acttttcaac aaagtgacac ttgcagatgc tggcttcatc 2460
aaacaatatg gtgattgcct tggtgatatt gctgctagag acctcatttg cgctcaaaaa 2520
tttaacggac ttacagtttt accaccttta cttactgacg aaatgattgc gcaatataca 2580
tccgcattgt tagccggaac tattacatcc ggatggactt ttggcgcagg cgcagcatta 2640
cagattccat tcgctatgca aatggcttat aggtttaacg gtataggcgt tacgcaaaac 2700
gtactttatg agaatcaaaa acttatcgct aaccaattta attccgctat cggtaagatt 2760
caggattcat tgtctagtac tgctagtgca ctcggtaagt tgcaaaatgt agtgaatcaa 2820
aacgctcaag cacttaatac actcgttaaa cagcttagtt ctaattttgg cgcaatttct 2880
agtgtgctta acgatatact atctagactc gataaagtcg aagccgaagt gcaaatcgat 2940
agattgatta ccggtaggtt gcaatcattg caaacatacg ttacacagca attgattagg 3000
gccgcagaga tacgcgctag cgctaatctc gcagctacta aaatgtctga atgcgtactc 3060
ggacaatcta aacgtgtcga tttttgcggt aagggatatc atcttatgtc ttttccacaa 3120
tctgcacctc acggagtcgt gtttttacac gttacttatg tgccagctca agagaaaaat 3180
tttacaaccg ctcctgctat ttgtcatgac ggtaaggcac attttcctag agagggcgta 3240
ttcgtttcta acggtacaca ttggttcgtt acacaacgta atttttacga acctcaaatt 3300
attactactg ataatacatt cgtatcaggt aattgtgacg tagtgatagg tatcgttaat 3360
aatacagttt acgatccact tcaacctgaa ctcgatagtt ttaaagagga actcgataag 3420
tattttaaaa atcatacatc acctgacgtc gacttaggcg atatttcagg tattaacgct 3480
agtgtcgtta acattcaaaa agagattgat agacttaacg aagtcgctaa aaatcttaac 3540
gaatcactta tcgatctgca agagttaggt aagtatgagc aatatattaa atggccttgg 3600
tatatttggt taggctttat agccggattg atcgcaatcg ttatggttac aattatgtta 3660
tgttgtatga catcatgttg ttcatgtctt aagggatgtt gttcatgcgg atcatgttgt 3720
aaatttgacg aagacgattc cgaaccagtg cttaaaggcg ttaagttaca ttatacataa 3780
<210> 6
<211> 3777
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 6
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa ttttacaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgct 240
aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300
ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360
aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420
ttgggtgttt attaccacaa aaacaacaaa agttggatgg aaagtgagtt cagagtttat 480
tctagtgcga ataattgcac ttttgaatat gtctctcagc cttttcttat ggaccttgaa 540
ggaaaacagg gtaatttcaa aaatcttagg gaatttgtgt ttaagaatat tgatggttat 600
tttaaaatat attctaagca cacgcctatt aatttagtgc gtggtctccc tcagggtttt 660
tcggctttag aaccattggt agatttgcca ataggtatta acatcactag gtttcaaact 720
ttacatagaa gttatttgac tcctggtgat tcttcttcag gttggacagc tggtgctgca 780
gcttattatg tgggttatct tcaacctagg acttttctat taaaatataa tgaaaatgga 840
accattacag atgctgtaga ctgtgcactt gaccctctct cagaaacaaa gtgtacgttg 900
aaatccttca ctgtagaaaa aggaatctat caaacttcta actttagagt ccaaccaaca 960
gaatctattg ttagatttcc taatattaca aacttgtgcc cttttggtga agtttttaac 1020
gccaccagat ttgcatctgt ttatgcttgg aacaggaaga gaatcagcaa ctgtgttgct 1080
gattattctg tcctatataa ttccgcatca ttttccactt ttaagtgtta tggagtgtct 1140
cctactaaat taaatgatct ctgctttact aatgtctatg cagattcatt tgtaattaga 1200
ggtgatgaag tcagacaaat cgctccaggg caaactggaa atattgctga ttataattat 1260
aaattaccag atgattttac aggctgcgtt atagcttgga attctaacaa tcttgattct 1320
aaggttggtg gtaattataa ttacctgtat agattgttta ggaagtctaa tctcaaacct 1380
tttgagagag atatttcaac tgaaatctat caggccggta gcacaccttg taatggtgtt 1440
aaaggtttta attgttactt tcctttacaa tcatatggtt tccaacccac ttatggtgtt 1500
ggttaccaac catacagagt agtagtactt tcttttgaac ttctacatgc accagcaact 1560
gtttgtggac ctaaaaagtc tactaatttg gttaaaaaca aatgtgtcaa tttcaacttc 1620
aatggtttaa caggcacagg tgttcttact gagtctaaca aaaagtttct gcctttccaa 1680
caatttggca gagacattgc tgacactact gatgctgtcc gtgatccaca gacacttgag 1740
attcttgaca ttacaccatg ttcttttggt ggtgtcagtg ttataacacc aggaacaaat 1800
acttctaacc aggttgctgt tctttatcag ggtgttaact gcacagaagt ccctgttgct 1860
attcatgcag atcaacttac tcctacttgg cgtgtttatt ctacaggttc taatgttttt 1920
caaacacgtg caggctgttt aataggggct gaacatgtca acaactcata tgagtgtgac 1980
atacccattg gtgcaggtat atgcgctagt tatcagactc agcaatccat cattgcctac 2040
actatgtcac ttggtgtaga aaattcagtt gcttactcta ataactctat tgccataccc 2100
acaaatttta ctattagtgt taccacagaa attctaccag tgtctatgac caagacatca 2160
gtagattgta caatgtacat ttgtggtgat tcaactgaat gcagcaatct tttgttgcaa 2220
tatggcagtt tttgtacaca attaaaccgt gctttaactg gaatagctgt tgaacaagac 2280
aaaaacaccc aagaagtttt tgcacaagtc aaacaaattt acaaaacacc accaattaaa 2340
gattttggtg gttttaattt ttcacaaata ttaccagatc catcaaaacc aagcaagagg 2400
tcatttattg aagatctact tttcaacaaa gtgacacttg cagatgctgg cttcatcaaa 2460
caatatggtg attgccttgg tgatattgct gctagagatc tcatttgcgc tcaaaaattt 2520
aacggactta cagttttacc acctttactt actgacgaaa tgattgcgca atatacatcc 2580
gcattgttag ccggaactat tacatccgga tggacttttg gcgcaggcgt agcattacag 2640
attccattcg ctatgcaaat ggcttatagg tttaacggta taggcgttac gcaaaacgta 2700
ctttatgaga atcaaaaact tatcgctaac caatttaatt ccgctatcgg taagattcag 2760
gattcattgt ctagtactgc tagtgcactc ggtaagttgc aagacgtagt gaatcaaaac 2820
gctcaagcac ttaatacact cgttaaacag cttagttcta attttggcgc aatttctagt 2880
gtgcttaacg atatactatc tagactcgat aaagtcgaag ccgaagtgca aatcgataga 2940
ttgattaccg gtaggttgca atcattgcaa acatacgtta cacagcaatt gattagggcc 3000
gcagagatac gcgctagcgc taatctcgca gctactaaaa tgtctgaatg cgtactcgga 3060
caatctaaac gtgtcgattt ttgcggtaag ggatatcatc ttatgtcttt tccacaatct 3120
gcacctcacg gagtcgtgtt tttacacgtt acttatgtgc cagctcaaga gaaaaatttt 3180
acaaccgctc ctgctatttg tcatgacggt aaggcacatt ttcctagaga gggcgtattc 3240
gtttctaacg gtacacattg gttcgttaca caacgtaatt tttacgaacc tcaaattatt 3300
actactgata atacattcgt atcaggtaat tgtgacgtag tgataggtat cgttaataat 3360
acagtttacg atccacttca acctgaactc gatagtttta aagaggaact cgataagtat 3420
tttaaaaatc atacatcacc tgacgtcgac ttaggcgata tttcaggtat taacgctagt 3480
gtcgttaaca ttcaaaaaga gattgataga cttaacgaag tcgctaaaaa tcttaacgaa 3540
tcacttatcg atctgcaaga gttaggtaag tatgagcaat atattaaatg gccttggtat 3600
atttggttag gctttatagc cggattgatc gcaatcgtta tggttacaat tatgttatgt 3660
tgtatgacat catgttgttc atgtcttaag ggatgttgtt catgcggatc atgttgtaaa 3720
tttgacgaag acgattccga accagtgctt aaaggcgtta agttacatta tacataa 3777
<210> 7
<211> 3780
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 7
atgtttgttt ttcttgtttt attgccacta gtctctagtc agtgtgttaa tcttagaacc 60
agaactcaat taccccctgc atacactaat tctttcacac gtggtgttta ttaccctgac 120
aaagttttca gatcctcagt tttacattca actcaggact tgttcttacc tttcttttcc 180
aatgttactt ggttccatgc tatacatgtc tctgggacca atggtactaa gaggtttgat 240
aaccctgtcc taccatttaa tgatggtgtt tattttgctt ccactgagaa gtctaacata 300
ataagaggct ggatttttgg tactacttta gattcgaaga cccagtccct acttattgtt 360
aataacgcta ctaatgttgt tattaaagtc tgtgaatttc aattttgtaa tgatccattt 420
ttggatgttt attaccacaa aaacaacaaa agttggatgg aaagtggagt ttattctagt 480
gcgaataatt gcacttttga atatgtctct cagccttttc ttatggacct tgaaggaaaa 540
cagggtaatt tcaaaaatct tagggaattt gtgtttaaga atattgatgg ttattttaaa 600
atatattcta agcacacgcc tattaattta gtgcgtgatc tccctcaggg tttttcggct 660
ttagaaccat tggtagattt gccaataggt attaacatca ctaggtttca aactttactt 720
gctttacata gaagttattt gactcctggt gattcttctt caggttggac agctggtgct 780
gcagcttatt atgtgggtta tcttcaacct aggacttttc tattaaaata taatgaaaat 840
ggaaccatta cagatgctgt agactgtgca cttgaccctc tctcagaaac aaagtgtacg 900
ttgaaatcct tcactgtaga aaaaggaatc tatcaaactt ctaactttag agtccaacca 960
acagaatcta ttgttagatt tcctaatatt acaaacttgt gcccttttgg tgaagttttt 1020
aacgccacca gatttgcatc tgtttatgct tggaacagga agagaatcag caactgtgtt 1080
gctgattatt ctgtcctata taattccgca tcattttcca cttttaagtg ttatggagtg 1140
tctcctacta aattaaatga tctctgcttt actaatgtct atgcagattc atttgtaatt 1200
agaggtgatg aagtcagaca aatcgctcca gggcaaactg gaaagattgc tgattataat 1260
tataaattac cagatgattt tacaggctgc gttatagctt ggaattctaa caatcttgat 1320
tctaaggttg gtggtaatta taattaccgg tatagattgt ttaggaagtc taatctcaaa 1380
ccttttgaga gagatatttc aactgaaatc tatcaggccg gtagcaaacc ttgtaatggt 1440
gttgaaggtt ttaattgtta ctttccttta caatcatatg gtttccaacc cactaatggt 1500
gttggttacc aaccatacag agtagtagta ctttcttttg aacttctaca tgcaccagca 1560
actgtttgtg gacctaaaaa gtctactaat ttggttaaaa acaaatgtgt caatttcaac 1620
ttcaatggtt taacaggcac aggtgttctt actgagtcta acaaaaagtt tctgcctttc 1680
caacaatttg gcagagacat tgctgacact actgatgctg tccgtgatcc acagacactt 1740
gagattcttg acattacacc atgttctttt ggtggtgtca gtgttataac accaggaaca 1800
aatacttcta accaggttgc tgttctttat cagggtgtta actgcacaga agtccctgtt 1860
gctattcatg cagatcaact tactcctact tggcgtgttt attctacagg ttctaatgtt 1920
tttcaaacac gtgcaggctg tttaataggg gctgaacatg tcaacaactc atatgagtgt 1980
gacataccca ttggtgcagg tatatgcgct agttatcaga ctcagcaatc catcattgcc 2040
tacactatgt cacttggtgc agaaaattca gttgcttact ctaataactc tattgccata 2100
cccacaaatt ttactattag tgttaccaca gaaattctac cagtgtctat gaccaagaca 2160
tcagtagatt gtacaatgta catttgtggt gattcaactg aatgcagcaa tcttttgttg 2220
caatatggca gtttttgtac acaattaaac cgtgctttaa ctggaatagc tgttgaacaa 2280
gacaaaaaca cccaagaagt ttttgcacaa gtcaaacaaa tttacaaaac accaccaatt 2340
aaagattttg gtggttttaa tttttcacaa atattaccag atccatcaaa accaagcaag 2400
aggtcattta ttgaagatct acttttcaac aaagtgacac ttgcagatgc tggcttcatc 2460
aaacaatatg gtgattgcct tggtgatatt gctgctagag atctcatttg cgctcaaaaa 2520
tttaacggac ttacagtttt accaccttta cttactgacg aaatgattgc gcaatataca 2580
tccgcattgt tagccggaac tattacatcc ggatggactt ttggcgcagg cgcagcatta 2640
cagattccat tcgctatgca aatggcttat aggtttaacg gtataggcgt tacgcaaaac 2700
gtactttatg agaatcaaaa acttatcgct aaccaattta attccgctat cggtaagatt 2760
caggattcat tgtctagtac tgctagtgca ctcggtaagt tgcaaaatgt agtgaatcaa 2820
aacgctcaag cacttaatac actcgttaaa cagcttagtt ctaattttgg cgcaatttct 2880
agtgtgctta acgatatact atctagactc gataaagtcg aagccgaagt gcaaatcgat 2940
agattgatta ccggtaggtt gcaatcattg caaacatacg ttacacagca attgattagg 3000
gccgcagaga tacgcgctag cgctaatctc gcagctacta aaatgtctga atgcgtactc 3060
ggacaatcta aacgtgtcga tttttgcggt aagggatatc atcttatgtc ttttccacaa 3120
tctgcacctc acggagtcgt gtttttacac gttacttatg tgccagctca agagaaaaat 3180
tttacaaccg ctcctgctat ttgtcatgac ggtaaggcac attttcctag agagggcgta 3240
ttcgtttcta acggtacaca ttggttcgtt acacaacgta atttttacga acctcaaatt 3300
attactactg ataatacatt cgtatcaggt aattgtgacg tagtgatagg tatcgttaat 3360
aatacagttt acgatccact tcaacctgaa ctcgatagtt ttaaagagga actcgataag 3420
tattttaaaa atcatacatc acctgacgtc gacttaggcg atatttcagg tattaacgct 3480
agtgtcgtta acattcaaaa agagattgat agacttaacg aagtcgctaa aaatcttaac 3540
gaatcactta tcgatctgca agagttaggt aagtatgagc aatatattaa atggccttgg 3600
tatatttggt taggctttat agccggattg atcgcaatcg ttatggttac aattatgtta 3660
tgttgtatga catcatgttg ttcatgtctt aagggatgtt gttcatgcgg atcatgttgt 3720
aaatttgacg aagacgattc cgaaccagtg cttaaaggcg ttaagttaca ttatacataa 3780
<210> 8
<211> 29825
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 8
attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60
gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120
cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180
ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240
cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300
acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360
agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420
cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480
acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540
cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600
cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660
tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720
tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780
actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840
ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900
atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960
tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020
gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080
ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140
gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200
caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260
gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320
aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380
atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440
cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500
ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560
ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620
aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680
gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740
aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800
aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860
tctttatgcg tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920
tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980
aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040
taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100
gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160
agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220
ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280
ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340
tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400
ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460
tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520
aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580
agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640
aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700
cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760
agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820
acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880
ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940
actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000
tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060
agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120
agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180
agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240
cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300
agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360
aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420
aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480
aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540
tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600
acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660
gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720
tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780
tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840
aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900
gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960
caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020
cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080
tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140
agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200
gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260
gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320
cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380
ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440
tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500
agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560
gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620
tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680
agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740
ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800
agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860
taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920
ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980
aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040
acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100
acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160
tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220
cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280
caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340
acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400
acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460
gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520
taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580
cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640
agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700
tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760
gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820
acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880
ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940
tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000
tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060
tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120
aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180
taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240
gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300
tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360
cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420
ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480
aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540
cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600
attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660
tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720
aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780
ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840
atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900
ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960
gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020
tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080
ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140
tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200
atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260
tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320
ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380
acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440
tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500
ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560
gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620
tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680
cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740
tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800
ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860
taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagtatc 7920
atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980
agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040
tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100
agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160
ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220
tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280
ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340
tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400
atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460
tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520
tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580
gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640
tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700
tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760
tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820
attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880
gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940
tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000
ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060
ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120
acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180
tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240
agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300
atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360
accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420
tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagaa gagcttttgg 9480
tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540
ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600
gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660
cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720
tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780
tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840
gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900
taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960
tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020
accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080
atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140
tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200
gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260
ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320
taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380
acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440
tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500
ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560
tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620
aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680
cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740
ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800
actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860
agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920
tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980
gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040
agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100
accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160
gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220
ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280
tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340
aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400
gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460
catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520
gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580
tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640
ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700
ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760
gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820
tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880
actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940
ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000
ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060
agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120
atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180
ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240
ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300
gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360
gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420
aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480
tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540
atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600
tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660
ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720
gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780
caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840
atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900
ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960
aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020
acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080
tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140
taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200
ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260
ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320
acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380
ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440
gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500
ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560
aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620
gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680
caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740
ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800
aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860
acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920
gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980
cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040
attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100
gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160
ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220
ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280
aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340
tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400
ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460
gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520
ttacatagct ctagacttat ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580
cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640
cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700
gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760
ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820
ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880
gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940
tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000
tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060
caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120
tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180
gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240
atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300
aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360
aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420
caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480
tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540
acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600
cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660
tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720
gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780
aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840
actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900
aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960
ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020
tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080
tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140
gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200
tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260
aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320
tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380
gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440
agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500
gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560
attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620
agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680
tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740
gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800
aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860
gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920
tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980
attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040
tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100
agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160
tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220
aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280
aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340
gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400
gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460
cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520
atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580
gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640
gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700
aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760
gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820
ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880
accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940
aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000
agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060
tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120
agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180
gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240
ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300
ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360
cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420
cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480
cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540
caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600
catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660
tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720
catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780
ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840
catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900
aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960
gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020
gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080
tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140
tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200
aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260
aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320
acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380
tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440
ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500
gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560
ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620
agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680
gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740
gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800
cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860
gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920
gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980
gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040
gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100
agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160
aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220
caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280
ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340
agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400
tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460
acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520
gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580
actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640
ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700
tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760
acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820
aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880
gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940
cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000
tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060
aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120
gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180
tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240
actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300
ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360
aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420
aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480
cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540
cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600
tcagtgtgtt aattttacaa ccagaactca attaccccct gcatacacta attctttcac 21660
acgtggtgtt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720
cttgttctta cctttctttt ccaatgttac ttggttccat gctatacatg tctctgggac 21780
caatggtact aagaggtttg ctaaccctgt cctaccattt aatgatggtg tttattttgc 21840
ttccactgag aagtctaaca taataagagg ctggattttt ggtactactt tagattcgaa 21900
gacccagtcc ctacttattg ttaataacgc tactaatgtt gttattaaag tctgtgaatt 21960
tcaattttgt aatgatccat ttttgggtgt ttattaccac aaaaacaaca aaagttggat 22020
ggaaagtgag ttcagagttt attctagtgc gaataattgc acttttgaat atgtctctca 22080
gccttttctt atggaccttg aaggaaaaca gggtaatttc aaaaatctta gggaatttgt 22140
gtttaagaat attgatggtt attttaaaat atattctaag cacacgccta ttaatttagt 22200
gcgtggtctc cctcagggtt tttcggcttt agaaccattg gtagatttgc caataggtat 22260
taacatcact aggtttcaaa ctttacatag aagttatttg actcctggtg attcttcttc 22320
aggttggaca gctggtgctg cagcttatta tgtgggttat cttcaaccta ggacttttct 22380
attaaaatat aatgaaaatg gaaccattac agatgctgta gactgtgcac ttgaccctct 22440
ctcagaaaca aagtgtacgt tgaaatcctt cactgtagaa aaaggaatct atcaaacttc 22500
taactttaga gtccaaccaa cagaatctat tgttagattt cctaatatta caaacttgtg 22560
cccttttggt gaagttttta acgccaccag atttgcatct gtttatgctt ggaacaggaa 22620
gagaatcagc aactgtgttg ctgattattc tgtcctatat aattccgcat cattttccac 22680
ttttaagtgt tatggagtgt ctcctactaa attaaatgat ctctgcttta ctaatgtcta 22740
tgcagattca tttgtaatta gaggtgatga agtcagacaa atcgctccag ggcaaactgg 22800
aaatattgct gattataatt ataaattacc agatgatttt acaggctgcg ttatagcttg 22860
gaattctaac aatcttgatt ctaaggttgg tggtaattat aattacctgt atagattgtt 22920
taggaagtct aatctcaaac cttttgagag agatatttca actgaaatct atcaggccgg 22980
tagcacacct tgtaatggtg ttaaaggttt taattgttac tttcctttac aatcatatgg 23040
tttccaaccc acttatggtg ttggttacca accatacaga gtagtagtac tttcttttga 23100
acttctacat gcaccagcaa ctgtttgtgg acctaaaaag tctactaatt tggttaaaaa 23160
caaatgtgtc aatttcaact tcaatggttt aacaggcaca ggtgttctta ctgagtctaa 23220
caaaaagttt ctgcctttcc aacaatttgg cagagacatt gctgacacta ctgatgctgt 23280
ccgtgatcca cagacacttg agattcttga cattacacca tgttcttttg gtggtgtcag 23340
tgttataaca ccaggaacaa atacttctaa ccaggttgct gttctttatc agggtgttaa 23400
ctgcacagaa gtccctgttg ctattcatgc agatcaactt actcctactt ggcgtgttta 23460
ttctacaggt tctaatgttt ttcaaacacg tgcaggctgt ttaatagggg ctgaacatgt 23520
caacaactca tatgagtgtg acatacccat tggtgcaggt atatgcgcta gttatcagac 23580
tcagcaatcc atcattgcct acactatgtc acttggtgta gaaaattcag ttgcttactc 23640
taataactct attgccatac ccacaaattt tactattagt gttaccacag aaattctacc 23700
agtgtctatg accaagacat cagtagattg tacaatgtac atttgtggtg attcaactga 23760
atgcagcaat cttttgttgc aatatggcag tttttgtaca caattaaacc gtgctttaac 23820
tggaatagct gttgaacaag acaaaaacac ccaagaagtt tttgcacaag tcaaacaaat 23880
ttacaaaaca ccaccaatta aagattttgg tggttttaat ttttcacaaa tattaccaga 23940
tccatcaaaa ccaagcaaga ggtcatttat tgaagatcta cttttcaaca aagtgacact 24000
tgcagatgct ggcttcatca aacaatatgg tgattgcctt ggtgatattg ctgctagaga 24060
tctcatttgc gctcaaaaat ttaacggact tacagtttta ccacctttac ttactgacga 24120
aatgattgcg caatatacat ccgcattgtt agccggaact attacatccg gatggacttt 24180
tggcgcaggc gtagcattac agattccatt cgctatgcaa atggcttata ggtttaacgg 24240
tataggcgtt acgcaaaacg tactttatga gaatcaaaaa cttatcgcta accaatttaa 24300
ttccgctatc ggtaagattc aggattcatt gtctagtact gctagtgcac tcggtaagtt 24360
gcaagacgta gtgaatcaaa acgctcaagc acttaataca ctcgttaaac agcttagttc 24420
taattttggc gcaatttcta gtgtgcttaa cgatatacta tctagactcg ataaagtcga 24480
agccgaagtg caaatcgata gattgattac cggtaggttg caatcattgc aaacatacgt 24540
tacacagcaa ttgattaggg ccgcagagat acgcgctagc gctaatctcg cagctactaa 24600
aatgtctgaa tgcgtactcg gacaatctaa acgtgtcgat ttttgcggta agggatatca 24660
tcttatgtct tttccacaat ctgcacctca cggagtcgtg tttttacacg ttacttatgt 24720
gccagctcaa gagaaaaatt ttacaaccgc tcctgctatt tgtcatgacg gtaaggcaca 24780
ttttcctaga gagggcgtat tcgtttctaa cggtacacat tggttcgtta cacaacgtaa 24840
tttttacgaa cctcaaatta ttactactga taatacattc gtatcaggta attgtgacgt 24900
agtgataggt atcgttaata atacagttta cgatccactt caacctgaac tcgatagttt 24960
taaagaggaa ctcgataagt attttaaaaa tcatacatca cctgacgtcg acttaggcga 25020
tatttcaggt attaacgcta gtgtcgttaa cattcaaaaa gagattgata gacttaacga 25080
agtcgctaaa aatcttaacg aatcacttat cgatctgcaa gagttaggta agtatgagca 25140
atatattaaa tggccttggt atatttggtt aggctttata gccggattga tcgcaatcgt 25200
tatggttaca attatgttat gttgtatgac atcatgttgt tcatgtctta agggatgttg 25260
ttcatgcgga tcatgttgta aatttgacga agacgattcc gaaccagtgc ttaaaggcgt 25320
taagttacat tatacataaa cgaacttatg gatttgttta tgagaatctt cacaattgga 25380
actgtaactt tgaagcaagg tgaaatcaag gatgctactc cttcagattt tgttcgcgct 25440
actgcaacga taccgataca agcctcactc cctttcggat ggcttattgt tggcgttgca 25500
cttcttgctg tttttcagag cgcttccaaa atcataaccc tcaaaaagag atggcaacta 25560
gcactctcca agggtgttca ctttgtttgc aacttgctgt tgttgtttgt aacagtttac 25620
tcacaccttt tgctcgttgc tgctggcctt gaagcccctt ttctctatct ttatgcttta 25680
gtctacttct tgcagagtat aaactttgta agaataataa tgaggctttg gctttgctgg 25740
aaatgccgtt ccaaaaaccc attactttat gatgccaact attttctttg ctggcatact 25800
aattgttacg actattgtat accttacaat agtgtaactt cttcaattgt cattacttca 25860
ggtgatggca caacaagtcc tatttctgaa catgactacc agattggtgg ttatactgaa 25920
aaatgggaat ctggagtaaa agactgtgtt gtattacaca gttacttcac ttcagactat 25980
taccagctgt actcaactca attgagtaca gacactggtg ttgaacatgt taccttcttc 26040
atctacaata aaattgttga tgagcctgaa gaacatgtcc aaattcacac aatcgacggt 26100
tcatccggag ttgttaatcc agtaatggaa ccaatttatg atgaaccgac gacgactact 26160
agcgtgcctt tgtaagcaca agctgatgag tacgaactta tgtactcatt cgtttcggaa 26220
gagacaggta cgttaatagt taatagcgta cttctttttc ttgctttcgt ggtattcttg 26280
ctagttacac tagccatcct tactgcgctt cgattgtgtg cgtactgctg caatattgtt 26340
aacgtgagtc ttgtaaaacc ttctttttac gtttactctc gtgttaaaaa tctgaattct 26400
tctagagttc ctgatcttct ggtctaaacg aactaaatat tatattagtt tttctgtttg 26460
gaactttaat tttagccatg gcagattcca acggtactat taccgttgaa gagcttaaaa 26520
agctccttga acaatggaac ctagtaatag gtttcctatt ccttacatgg atttgtcttc 26580
tacaatttgc ctatgccaac aggaataggt ttttgtatat aattaagtta attttcctct 26640
ggctgttatg gccagtaact ttagcttgtt ttgtgcttgc tgctgtttac agaataaatt 26700
ggatcaccgg tggaattgct atcgcaatgg cttgtcttgt aggcttgatg tggctcagct 26760
acttcattgc ttctttcaga ctgtttgcgc gtacgcgttc catgtggtca ttcaatccag 26820
aaactaacat tcttctcaac gtgccactcc atggcactat tctgaccaga ccgcttctag 26880
aaagtgaact cgtaatcgga gctgtgatcc ttcgtggaca tcttcgtatt gctggacacc 26940
atctaggacg ctgtgacatc aaggacctgc ctaaagaaat cactgttgct acatcacgaa 27000
cgctttctta ttacaaattg ggagcttcgc agcgtgtagc aggtgactca ggttttgctg 27060
catacagtcg ctacaggatt ggcaactata aattaaacac agaccattcc agtagcagtg 27120
acaatattgc tttgcttgta cagtaagtga caacagatgt ttcatctcgt tgactttcag 27180
gttactatag cagagatatt actaattatt atgaggactt ttaaagtttc catttggaat 27240
cttgattaca tcataaacct cataattaaa aatttatcta agtcactaac tgagaataaa 27300
tattctcaat tagatgaaga gcaaccaatg gagattgatt aaacgaacat gaaaattatt 27360
cttttcttgg cactgataac actcgctact tgtgagcttt atcactacca agagtgtgtt 27420
agaggtacaa cagtactttt aaaagaacct tgctcttctg gaacatacga gggcaattca 27480
ccatttcatc ctctagctga taacaaattt gcactgactt gctttagcac tcaatttgct 27540
tttgcttgtc ctgacggcgt aaaacacgtc tatcagttac gtgccagatc agtttcacct 27600
aaactgttca tcagacaaga ggaagttcaa gaactttact ctccaatttt tcttattgtt 27660
gcggcaatag tgtttataac actttgcttc acactcaaaa gaaagacaga atgattgaac 27720
tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt gttttaatta 27780
tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact tgtcacgcct 27840
aaacgaacat gaaatttctt gttttcttag gaatcatcac aactgtagct gcatttcacc 27900
aagaatgtag tttacagtca tgtactcaac atcaaccata tgtagttgat gacccgtgtc 27960
ctattcactt ctattctaaa tggtatatta gagtaggagc tagaaaatca gcacctttaa 28020
ttgaattgtg cgtggatgag gctggttcta aatcacccat tcagtacatc gatatcggta 28080
attatacagt ttcctgttca ccttttacaa ttaattgcca ggaacctaaa ttgggtagtc 28140
ttgtagtgcg ttgttcgttc tatgaagact ttttagagta tcatgacgtt cgtgttgttt 28200
tagatttcat ctaaacgaac aaactaaaat gtctgataat ggaccccaaa atcagcgaaa 28260
tgcaccccgc attacgtttg gtggaccctc agattcaact ggcagtaacc agaatggaga 28320
acgcagtggg gcgcgatcaa aacaacgtcg gccccaaggt ttacccaata atactgcgtc 28380
ttggttcacc gctctcactc aacatggcaa ggaagacctt aaattccctc gaggacaagg 28440
cgttccaatt aacaccaata gcagtccaga tgaccaaatt ggctactacc gaagagctac 28500
cagacgaatt cgtggtggtg acggtaaaat gaaagatctc agtccaagat ggtatttcta 28560
ctacctagga actgggccag aagctggact tccctatggt gctaacaaag acggcatcat 28620
atgggttgca actgagggag ccttgaatac accaaaagat cacattggca cccgcaatcc 28680
tgctaacaat gctgcaatcg tgctacaact tcctcaagga acaacattgc caaaaggctt 28740
ctacgcagaa gggagcagag gcggcagtca agcctcttct cgttcctcat cacgtagtcg 28800
caacagttca agaaattcaa ctccaggcag cagtagggga acttctcctg ctagaatggc 28860
tggcaatggc ggtgatgctg ctcttgcttt gctgctgctt gacagattga accagcttga 28920
gagcaaaatg tctggtaaag gccaacaaca acaaggccaa actgtcacta agaaatctgc 28980
tgctgaggct tctaagaagc ctcggcaaaa acgtactgcc actaaagcat acaatgtaac 29040
acaagctttc ggcagacgtg gtccagaaca aacccaagga aattttgggg accaggaact 29100
aatcagacaa ggaactgatt acaaacattg gccgcaaatt gcacaatttg cccccagcgc 29160
ttcagcgttc ttcggaatgt cgcgcattgg catggaagtc acaccttcgg gaacgtggtt 29220
gacctacaca ggtgccatca aattggatga caaagatcca aatttcaaag atcaagtcat 29280
tttgctgaat aagcatattg acgcatacaa aacattccca ccaacagagc ctaaaaagga 29340
caaaaagaag aaggctgatg aaactcaagc cttaccgcag agacagaaga aacagcaaac 29400
tgtgactctt cttcctgctg cagatttgga tgatttctcc aaacaattgc aacaatccat 29460
gagcagtgct gactcaactc aggcctaaac tcatgcagac cacacaaggc agatgggcta 29520
tataaacgtt ttcgcttttc cgtttacgat atatagtcta ctcttgtgca gaatgaattc 29580
tcgtaactac atagcacaag tagatgtagt taactttaat ctcacatagc aatctttaat 29640
cagtgtgtaa cattagggag gacttgaaag agccaccaca ttttcaccga ggccacgcgg 29700
agtacgatcg agtgtacagt gaacaatgct agggagagct gcctatatgg aagagcccta 29760
atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct tcttaggaga 29820
atgac 29825
<210> 9
<211> 29828
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 9
attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60
gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120
cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180
ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240
cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300
acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360
agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420
cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480
acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540
cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600
cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660
tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720
tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780
actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840
ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900
atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960
tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct ataaattgca 1020
gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080
ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140
gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200
caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260
gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320
aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380
atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440
cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500
ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560
ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620
aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680
gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740
aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800
aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860
tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920
tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980
aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040
taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100
gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160
agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220
ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280
ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340
tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400
ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460
tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520
aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580
agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640
aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700
cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760
agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820
acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880
ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940
actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000
tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060
agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120
agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180
agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240
cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300
agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360
aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420
aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480
aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540
tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600
acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660
gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720
tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780
tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840
aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900
gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960
caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020
cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080
tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140
agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200
gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260
gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320
cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380
ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440
tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500
agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560
gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620
tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680
agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740
ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800
agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860
taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920
ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980
aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040
acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100
acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160
tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220
cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280
caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340
acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400
acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460
gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520
taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580
cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640
agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700
tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760
gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820
acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880
ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940
tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000
tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060
tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120
aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180
taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240
gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300
tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360
cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420
ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480
aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540
cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600
attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660
tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720
aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780
ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840
atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900
ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960
gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020
tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080
ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140
tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200
atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260
tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320
ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380
acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440
tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500
ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560
gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620
tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680
cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740
tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800
ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860
taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920
atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980
agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040
tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100
agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160
ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220
tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280
ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340
tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400
atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460
tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520
tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580
gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640
tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700
tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760
tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820
attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880
gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940
tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000
ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060
ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120
acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180
tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240
agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300
atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360
accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420
tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagaa gagcttttgg 9480
tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540
ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600
gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660
cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720
tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780
tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840
gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900
taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960
tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020
accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080
atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140
tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200
gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260
ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320
taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380
acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440
tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500
ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560
tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620
aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680
cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740
ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800
actaggacct ctttctgctc aaactggaat tgacgtttta gatatgtgtg cttcattaaa 10860
agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920
tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980
gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040
agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaga atgccttttt 11100
accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160
gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220
ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280
tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340
aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400
gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460
catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520
gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580
tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640
ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700
ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760
gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820
tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880
actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940
ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000
ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060
agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120
atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180
ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240
ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300
gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360
gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420
aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480
tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540
atcagcattg tgggaattcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600
tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660
ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720
gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780
caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840
atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900
ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960
aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020
acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080
tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140
taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200
ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260
ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320
acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380
ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440
gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500
ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560
aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620
gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680
caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740
ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800
aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860
acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920
gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980
cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040
attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100
gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160
ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220
ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280
aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340
tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400
ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460
gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520
ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580
cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640
cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700
gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760
ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820
ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880
gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940
tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000
tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060
caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120
tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180
gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240
atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300
aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360
aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420
caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480
tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540
acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600
cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660
tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720
gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780
aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840
actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900
aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960
ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020
tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080
tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140
gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200
tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260
aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320
tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380
gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440
agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500
gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560
attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620
agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680
tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740
gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800
aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860
gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920
tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980
attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040
tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100
agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160
tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220
aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280
aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340
gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400
gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460
cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520
atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580
gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640
gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700
aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760
gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820
ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880
accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940
aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000
agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060
tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120
agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180
gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240
ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300
ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360
cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420
cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480
cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540
caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600
catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660
tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720
catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780
ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840
catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900
aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960
gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020
gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080
tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140
tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200
aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260
aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320
acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380
tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440
ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500
gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560
ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620
agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680
gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740
gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800
cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860
gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920
gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980
gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040
gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100
agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160
aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220
caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280
ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340
agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400
tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460
acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520
gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580
actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640
ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700
tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760
acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820
aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880
gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940
cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000
tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060
aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120
gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180
tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240
actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300
ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360
aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420
aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480
cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540
cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600
tcagtgtgtt aatcttagaa ccagaactca attaccccct gcatacacta attctttcac 21660
acgtggtatt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720
cttgttctta cctttctttt ccaatgttac ttggttccat gctatacatg tctctgggac 21780
caatggtact aagaggtttg ataaccctgt cctaccattt aatgatggtg tttattttgc 21840
ttccactgag aagtctaaca taataagagg ctggattttt ggtactactt tagattcgaa 21900
gacccagtcc ctacttattg ttaataacgc tactaatgtt gttattaaag tctgtgaatt 21960
tcaattttgt aatgatccat ttttggatgt ttattaccac aaaaacaaca aaagttggat 22020
ggaaagtgga gtttattcta gtgcgaataa ttgcactttt gaatatgtct ctcagccttt 22080
tcttatggac cttgaaggaa aacagggtaa tttcaaaaat cttagggaat ttgtgtttaa 22140
gaatattgat ggttatttta aaatatattc taagcacacg cctattaatt tagtgcgtga 22200
tctccctcag ggtttttcgg ctttagaacc attggtagat ttgccaatag gtattaacat 22260
cactaggttt caaactttac ttgctttaca tagaagttat ttgactcctg gtgattcttc 22320
ttcaggttgg acagctggtg ctgcagctta ttatgtgggt tatcttcaac ctaggacttt 22380
tctattaaaa tataatgaaa atggaaccat tacagatgct gtagactgtg cacttgaccc 22440
tctctcagaa acaaagtgta cgttgaaatc cttcactgta gaaaaaggaa tctatcaaac 22500
ttctaacttt agagtccaac caacagaatc tattgttaga tttcctaata ttacaaactt 22560
gtgccctttt ggtgaagttt ttaacgccac cagatttgca tctgtttatg cttggaacag 22620
gaagagaatc agcaactgtg ttgctgatta ttctgtccta tataattccg catcattttc 22680
cacttttaag tgttatggag tgtctcctac taaattaaat gatctctgct ttactaatgt 22740
ctatgcagat tcatttgtaa ttagaggtga tgaagtcaga caaatcgctc cagggcaaac 22800
tggaaagatt gctgattata attataaatt accagatgat tttacaggct gcgttatagc 22860
ttggaattct aacaatcttg attctaaggt tggtggtaat tataattacc ggtatagatt 22920
gtttaggaag tctaatctca aaccttttga gagagatatt tcaactgaaa tctatcaggc 22980
cggtagcaaa ccttgtaatg gtgttgaagg ttttaattgt tactttcctt tacaatcata 23040
tggtttccaa cccactaatg gtgttggtta ccaaccatac agagtagtag tactttcttt 23100
tgaacttcta catgcaccag caactgtttg tggacctaaa aagtctacta atttggttaa 23160
aaacaaatgt gtcaatttca acttcaatgg tttaacaggc acaggtgttc ttactgagtc 23220
taacaaaaag tttctgcctt tccaacaatt tggcagagac attgctgaca ctactgatgc 23280
tgtccgtgat ccacagacac ttgagattct tgacattaca ccatgttctt ttggtggtgt 23340
cagtgttata acaccaggaa caaatacttc taaccaggtt gctgttcttt atcagggtgt 23400
taactgcaca gaagtccctg ttgctattca tgcagatcaa cttactccta cttggcgtgt 23460
ttattctaca ggttctaatg tttttcaaac acgtgcaggc tgtttaatag gggctgaaca 23520
tgtcaacaac tcatatgagt gtgacatacc cattggtgca ggtatatgcg ctagttatca 23580
gactcagcaa tccatcattg cctacactat gtcacttggt gcagaaaatt cagttgctta 23640
ctctaataac tctattgcca tacccacaaa ttttactatt agtgttacca cagaaattct 23700
accagtgtct atgaccaaga catcagtaga ttgtacaatg tacatttgtg gtgattcaac 23760
tgaatgcagc aatcttttgt tgcaatatgg cagtttttgt acacaattaa accgtgcttt 23820
aactggaata gctgttgaac aagacaaaaa cacccaagaa gtttttgcac aagtcaaaca 23880
aatttacaaa acaccaccaa ttaaagattt tggtggtttt aatttttcac aaatattacc 23940
agatccatca aaaccaagca agaggtcatt tattgaagat ctacttttca acaaagtgac 24000
acttgcagat gctggcttca tcaaacaata tggtgattgc cttggtgata ttgctgctag 24060
agatctcatt tgcgctcaaa aatttaacgg acttacagtt ttaccacctt tacttactga 24120
cgaaatgatt gcgcaatata catccgcatt gttagccgga actattacat ccggatggac 24180
ttttggcgca ggcgcagcat tacagattcc attcgctatg caaatggctt ataggtttaa 24240
cggtataggc gttacgcaaa acgtacttta tgagaatcaa aaacttatcg ctaaccaatt 24300
taattccgct atcggtaaga ttcaggattc attgtctagt actgctagtg cactcggtaa 24360
gttgcaaaat gtagtgaatc aaaacgctca agcacttaat acactcgtta aacagcttag 24420
ttctaatttt ggcgcaattt ctagtgtgct taacgatata ctatctagac tcgataaagt 24480
cgaagccgaa gtgcaaatcg atagattgat taccggtagg ttgcaatcat tgcaaacata 24540
cgttacacag caattgatta gggccgcaga gatacgcgct agcgctaatc tcgcagctac 24600
taaaatgtct gaatgcgtac tcggacaatc taaacgtgtc gatttttgcg gtaagggata 24660
tcatcttatg tcttttccac aatctgcacc tcacggagtc gtgtttttac acgttactta 24720
tgtgccagct caagagaaaa attttacaac cgctcctgct atttgtcatg acggtaaggc 24780
acattttcct agagagggcg tattcgtttc taacggtaca cattggttcg ttacacaacg 24840
taatttttac gaacctcaaa ttattactac tgataataca ttcgtatcag gtaattgtga 24900
cgtagtgata ggtatcgtta ataatacagt ttacgatcca cttcaacctg aactcgatag 24960
ttttaaagag gaactcgata agtattttaa aaatcataca tcacctgacg tcgacttagg 25020
cgatatttca ggtattaacg ctagtgtcgt taacattcaa aaagagattg atagacttaa 25080
cgaagtcgct aaaaatctta acgaatcact tatcgatctg caagagttag gtaagtatga 25140
gcaatatatt aaatggcctt ggtatatttg gttaggcttt atagccggat tgatcgcaat 25200
cgttatggtt acaattatgt tatgttgtat gacatcatgt tgttcatgtc ttaagggatg 25260
ttgttcatgc ggatcatgtt gtaaatttga cgaagacgat tccgaaccag tgcttaaagg 25320
cgttaagtta cattatacat aaacgaactt atggatttgt ttatgagaat cttcacaatt 25380
ggaactgtaa ctttgaagca aggtgaaatc aaggatgcta ctccttcaga ttttgttcgc 25440
gctactgcaa cgataccgat acaagcctca ctccctttcg gatggcttat tgttggcgtt 25500
gcacttcttg ctgtttttca gagcgcttcc aaaatcataa ccctcaaaaa gagatggcaa 25560
ctagcactct ccaagggtgt tcactttgtt tgcaacttgc tgttgttgtt tgtaacagtt 25620
tactcacacc ttttgctcgt tgctgctggc cttgaagccc cttttctcta tctttatgct 25680
ttagtctact tcttgcagag tataaacttt gtaagaataa taatgaggct ttggctttgc 25740
tggaaatgcc gttccaaaaa cccattactt tatgatgcca actattttct ttgctggcat 25800
actaattgtt acgactattg tataccttac aatagtgtaa cttcttcaat tgtcattact 25860
tcaggtgatg gcacaacaag tcctatttct gaacatgact accagattgg tggttatact 25920
gaaaaatggg aatctggagt aaaagactgt gttgtattac acagttactt cacttcagac 25980
tattaccagc tgtactcaac tcaattgagt acagacactg gtgttgaaca tgttaccttc 26040
ttcatctaca ataaaattgt tgatgagcct gaagaacatg tccaaattca cacaatcgac 26100
ggttcatccg gagttgttaa tccagtaatg gaaccaattt atgatgaacc gacgacgact 26160
actagcgtgc ctttgtaagc acaagctgat gagtacgaac ttatgtactc attcgtttcg 26220
gaagagacag gtacgttaat agttaatagc gtacttcttt ttcttgcttt cgtggtattc 26280
ttgctagtta cactagccat ccttactgcg cttcgattgt gtgcgtactg ctgcaatatt 26340
gttaacgtga gtcttgtaaa accttctttt tacgtttact ctcgtgttaa aaatctgaat 26400
tcttctagag ttcctgatct tctggtctaa acgaactaaa tattatatta gtttttctgt 26460
ttggaacttt aattttagcc atggcagatt ccaacggtac tattaccgtt gaagagctta 26520
aaaagctcct tgaacaatgg aacctagtaa taggtttcct attccttaca tggatttgtc 26580
ttctacaatt tgcctatgcc aacaggaata ggtttttgta tataattaag ttaattttcc 26640
tctggctgtt atggccagta actttagctt gttttgtgct tgctgctgtt tacagaataa 26700
attggatcac cggtggaatt gctatcgcaa tggcttgtct tgtaggcttg atgtggctca 26760
gctacttcat tgcttctttc agactgtttg cgcgtacgcg ttccatgtgg tcattcaatc 26820
cagaaactaa cattcttctc aacgtgccac tccatggcac tattctgacc agaccgcttc 26880
tagaaagtga actcgtaatc ggagctgtga tccttcgtgg acatcttcgt attgctggac 26940
accatctagg acgctgtgac atcaaggacc tgcctaaaga aatcactgtt gctacatcac 27000
gaacgctttc ttattacaaa ttgggagctt cgcagcgtgt agcaggtgac tcaggttttg 27060
ctgcatacag tcgctacagg attggcaact ataaattaaa cacagaccat tccagtagca 27120
gtgacaatat tgctttgctt gtacagtaag tgacaacaga tgtttcatct cgttgacttt 27180
caggttacta tagcagagat attactaatt attatgagga cttttaaagt ttccatttgg 27240
aatcttgatt acatcataaa cctcataatt aaaaatttat ctaagtcact aactgagaat 27300
aaatattctc aattagatga agagcaacca atggagattg attaaacgaa catgaaaatt 27360
attcttttct tggcactgat aacactcgct acttgtgagc tttatcacta ccaagagtgt 27420
gttagaggta caacagtact tttaaaagaa ccttgctctt ctggaacata cgagggcaat 27480
tcaccatttc atcctctagc tgataacaaa tttgcactga cttgctttag cactcaattt 27540
gcttttgctt gtcctgacgg cgtaaaacac gtctatcagt tacgtgccag atcagtttca 27600
cctaaactgt tcatcagaca agaggaagtt caagaacttt actctccaat ttttcttatt 27660
gttgcggcaa tagtgtttat aacactttgc ttcacactca aaagaaagac agaatgattg 27720
aactttcatt aattgacttc tatttgtgct ttttagcctt tctgctattc cttgttttaa 27780
ttatgcttat tatcttttgg ttctcacttg aactgcaaga tcataatgaa acttgtcacg 27840
cctaaacgaa catgaaattt cttgttttct taggaatcat cacaactgta gctgcatttc 27900
accaagaatg tagtttacag tcatgtactc aacatcaacc atatgtagtt gatgacccgt 27960
gtcctattca cttctattct aaatggtata ttagagtagg agctagaaaa tcagcacctt 28020
taattgaatt gtgcgtggat gaggctggtt ctaaatcacc cattcagtac atcgatatcg 28080
gtaattatac agtttcctgt tcacctttta caattaattg ccaggaacct aaattgggta 28140
gtcttgtagt gcgttgttcg ttctatgaag actttttaga gtatcatgac gttcgtgttg 28200
ttttagattt catctaaacg aacaaactaa aatgtctgat aatggacccc aaaatcagcg 28260
aaatgcaccc cgcattacgt ttggtggacc ctcagattca actggcagta accagaatgg 28320
agaacgcagt ggggcgcgat caaaacaacg tcggccccaa ggtttaccca ataatactgc 28380
gtcttggttc accgctctca ctcaacatgg caaggaagac cttaaattcc ctcgaggaca 28440
aggcgttcca attaacacca atagcagtcc agatgaccaa attggctact accgaagagc 28500
taccagacga attcgtggtg gtgacggtaa aatgaaagat ctcagtccaa gatggtattt 28560
ctactaccta ggaactgggc cagaagctgg acttccctat ggtgctaaca aagacggcat 28620
catatgggtt gcaactgagg gagccttgaa tacaccaaaa gatcacattg gcacccgcaa 28680
tcctgctaac aatgctgcaa tcgtgctaca acttcctcaa ggaacaacat tgccaaaagg 28740
cttctacgca gaagggagca gaggcggcag tcaagcctct tctcgttcct catcacgtag 28800
tcgcaacagt ttaagaaatt caactccagg cagcagtagg ggaacttctc ctgctagaat 28860
ggctggcaat ggcggtgatg ctgctcttgc tttgctgctg cttgacagat tgaaccagct 28920
tgagagcaaa atgtctggta aaggccaaca acaacaaggc caaactgtca ctaagaaatc 28980
tgctgctgag gcttctaaga agcctcggca aaaacgtact gccactaaag catacaatgt 29040
aacacaagct ttcggcagac gtggtccaga acaaacccaa ggaaattttg gggaccagga 29100
actaatcaga caaggaactg attacaaaca ttggccgcaa attgcacaat ttgcccccag 29160
cgcttcagcg ttcttcggaa tgtcgcgcat tggcatggaa gtcacacctt cgggaacgtg 29220
gttgacctac acaggtgcca tcaaattgga tgacaaagat ccaaatttca aagatcaagt 29280
cattttgctg aataagcata ttgacgcata caaaacattc ccaccaacag agcctaaaaa 29340
ggacaaaaag aagaaggctg atgaaactca agccttaccg cagagacaga agaaacagca 29400
aactgtgact cttcttcctg ctgcagattt ggatgatttc tccaaacaat tgcaacaatc 29460
catgagcagt gctgactcaa ctcaggccta aactcatgca gaccacacaa ggcagatggg 29520
ctatataaac gttttcgctt ttccgtttac gatatatagt ctactcttgt gcagaatgaa 29580
ttctcgtaac tacatagcac aagtagatgt agttaacttt aatctcacat agcaatcttt 29640
aatcagtgtg taacattagg gaggacttga aagagccacc acattttcac cgaggccacg 29700
cggagtacga tcgagtgtac agtgaacaat gctagggaga gctgcctata tggaagagcc 29760
ctaatgtgta aaattaattt tagtagtgct atccccatgt gattttaata gcttcttagg 29820
agaatgac 29828
<210> 10
<211> 29825
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 10
attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60
gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120
cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180
ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240
cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300
acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360
agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420
cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480
acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540
cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600
cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660
tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720
tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780
actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840
ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900
atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960
tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020
gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080
ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140
gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200
caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260
gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320
aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380
atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440
cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500
ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560
ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620
aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680
gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740
aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800
aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860
tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920
tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980
aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040
taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100
gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160
agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220
ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280
ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340
tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400
ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460
tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520
aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580
agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640
aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700
cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760
agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820
acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880
ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940
actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000
tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060
agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120
agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180
agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240
cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300
agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360
aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420
aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480
aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540
tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600
acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660
gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720
tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780
tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840
aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900
gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960
caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020
cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080
tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140
agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200
gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260
gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320
cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380
ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440
tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500
agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560
gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620
tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680
agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740
ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800
agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860
taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920
ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980
aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040
acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100
acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160
tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220
cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280
caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340
acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400
acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460
gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520
taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580
cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640
agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700
tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760
gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820
acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880
ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940
tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000
tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060
tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120
aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180
taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240
gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300
tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360
cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420
ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480
aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540
cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600
attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660
tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720
aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780
ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840
atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900
ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960
gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020
tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080
ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140
tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200
atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260
tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320
ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380
acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440
tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500
ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560
gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620
tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680
cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740
tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800
ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860
taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920
atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980
agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040
tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100
agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160
ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220
tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280
ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340
tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400
atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460
tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520
tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580
gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640
tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700
tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760
tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820
attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880
gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940
tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000
ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060
ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120
acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180
tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240
agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300
atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360
accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420
tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagga gagcttttgg 9480
tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540
ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600
gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660
cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720
tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780
tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840
gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900
taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960
tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020
accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080
atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140
tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200
gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260
ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320
taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380
acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440
tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500
ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560
tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620
aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680
cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740
ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800
actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860
agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920
tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980
gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040
agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100
accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160
gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220
ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280
tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340
aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400
gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460
catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520
gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580
tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640
ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700
ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760
gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820
tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880
actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940
ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000
ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060
agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120
atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180
ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240
ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300
gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360
gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420
aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480
tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540
atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600
tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660
ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720
gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780
caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840
atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900
ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960
aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020
acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080
tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140
taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200
ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260
ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320
acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380
ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440
gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500
ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560
aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620
gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680
caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740
ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800
aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860
acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920
gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980
cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040
attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100
gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160
ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220
ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280
aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340
tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400
ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460
gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520
ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580
cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640
cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700
gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760
ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820
ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880
gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940
tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000
tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060
caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120
tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180
gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240
atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300
aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360
aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420
caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480
tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540
acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600
cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660
tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720
gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780
aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840
actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900
aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960
ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020
tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080
tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140
gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200
tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260
aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320
tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380
gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440
agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500
gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560
attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620
agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680
tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740
gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800
aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860
gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920
tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980
attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040
tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100
agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160
tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220
aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280
aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340
gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400
gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460
cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520
atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580
gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640
gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700
aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760
gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820
ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880
accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940
aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000
agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060
tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120
agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180
gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240
ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300
ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360
cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420
cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480
cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540
caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600
catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660
tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720
catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780
ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840
catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900
aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960
gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020
gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080
tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140
tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200
aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260
aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320
acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380
tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440
ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500
gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560
ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620
agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680
gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740
gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800
cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860
gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920
gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980
gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040
gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100
agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160
aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220
caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280
ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340
agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400
tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460
acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520
gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580
actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640
ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700
tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760
acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820
aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880
gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940
cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000
tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060
aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120
gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180
tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240
actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300
ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360
aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420
aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480
cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540
cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600
tcagtgtgtt aatcttacaa ccagaactca attaccccct gcatacacta attctttcac 21660
acgtggtgtt tattaccctg acaaagtttt cagatcctca gttttacatt caactcagga 21720
cttgttctta cctttctttt ccaatgttac ttggttccat gttatctctg ggaccaatgg 21780
tactaagagg tttgataacc ctgtcctacc atttaatgat ggtgtttatt ttgcttccat 21840
tgagaagtct aacataataa gaggctggat ttttggtact actttagatt cgaagaccca 21900
gtccctactt attgttaata acgctactaa tgttgttatt aaagtctgtg aatttcaatt 21960
ttgtaatgat ccatttttgg accacaaaaa caacaaaagt tggatggaaa gtgagttcag 22020
agtttattct agtgcgaata attgcacttt tgaatatgtc tctcagcctt ttcttatgga 22080
ccttgaagga aaacagggta atttcaaaaa tcttagggaa tttgtgttta agaatattga 22140
tggttatttt aaaatatatt ctaagcacac gcctattata gtgcgtgagc cagaagatct 22200
ccctcagggt ttttcggctt tagaaccatt ggtagatttg ccaataggta ttaacatcac 22260
taggtttcaa actttacttg ctttacatag aagttatttg actcctggtg attcttcttc 22320
aggttggaca gctggtgctg cagcttatta tgtgggttat cttcaaccta ggacttttct 22380
attaaaatat aatgaaaatg gaaccattac agatgctgta gactgtgcac ttgaccctct 22440
ctcagaaaca aagtgtacgt tgaaatcctt cactgtagaa aaaggaatct atcaaacttc 22500
taactttaga gtccaaccaa cagaatctat tgttagattt cctaatatta caaacttgtg 22560
cccttttgat gaagttttta acgccaccag atttgcatct gtttatgctt ggaacaggaa 22620
gagaatcagc aactgtgttg ctgattattc tgtcctatat aatctcgcac catttttcac 22680
ttttaagtgt tatggagtgt ctcctactaa attaaatgat ctctgcttta ctaatgtcta 22740
tgcagattca tttgtaatta gaggtgatga agtcagacaa atcgctccag ggcaaactgg 22800
aaatattgct gattataatt ataaattacc agatgatttt acaggctgcg ttatagcttg 22860
gaattctaac aagcttgatt ctaaggttag tggtaattat aattacctgt atagattgtt 22920
taggaagtct aatctcaaac cttttgagag agatatttca actgaaatct atcaggccgg 22980
taacaaacct tgtaatggtg ttgcaggttt taattgttac tttcctttac gatcatatag 23040
tttccgaccc acttatggtg ttggtcacca accatacaga gtagtagtac tttcttttga 23100
acttctacat gcaccagcaa ctgtttgtgg acctaaaaag tctactaatt tggttaaaaa 23160
caaatgtgtc aatttcaact tcaatggttt aaaaggcaca ggtgttctta ctgagtctaa 23220
caaaaagttt ctgcctttcc aacaatttgg cagagacatt gctgacacta ctgatgctgt 23280
ccgtgatcca cagacacttg agattcttga cattacacca tgttcttttg gtggtgtcag 23340
tgttataaca ccaggaacaa atacttctaa ccaggttgct gttctttatc agggtgttaa 23400
ctgcacagaa gtccctgttg ctattcatgc agatcaactt actcctactt ggcgtgttta 23460
ttctacaggt tctaatgttt ttcaaacacg tgcaggctgt ttaatagggg ctgaatatgt 23520
caacaactca tatgagtgtg acatacccat tggtgcaggt atatgcgcta gttatcagac 23580
tcagcaatcc atcattgcct acactatgtc acttggtgca gaaaattcag ttgcttactc 23640
taataactct attgccatac ccacaaattt tactattagt gttaccacag aaattctacc 23700
agtgtctatg accaagacat cagtagattg tacaatgtac atttgtggtg attcaactga 23760
atgcagcaat cttttgttgc aatatggcag tttttgtaca caattaaaac gtgctttaac 23820
tggaatagct gttgaacaag acaaaaacac ccaagaagtt tttgcacaag tcaaacaaat 23880
ttacaaaaca ccaccaatta aatattttgg tggttttaat ttttcacaaa tattaccaga 23940
tccatcaaaa ccaagcaaga ggtcatttat tgaagatcta cttttcaaca aagtgacact 24000
tgcagatgct ggcttcatca aacaatatgg tgattgcctt ggtgatattg ctgctagaga 24060
tctcatttgc gctcaaaaat ttaagggact tacagtttta ccacctttac ttactgacga 24120
aatgattgcg caatatacat ccgcattgtt agccggaact attacatccg gatggacttt 24180
tggcgcaggc gcagcattac agattccatt cgctatgcaa atggcttata ggtttaacgg 24240
tataggcgtt acgcaaaacg tactttatga gaatcaaaaa cttatcgcta accaatttaa 24300
ttccgctatc ggtaagattc aggattcatt gtctagtact gctagtgcac tcggtaagtt 24360
gcaagacgta gtgaatcaca acgctcaagc acttaataca ctcgttaaac agcttagttc 24420
taagtttggc gcaatttcta gtgtgcttaa cgatatattt tcgagactcg ataaagtcga 24480
agccgaagtg caaatcgata gattgattac cggtaggttg caatcattgc aaacatacgt 24540
tacacagcaa ttgattaggg ccgcagagat acgcgctagc gctaatctcg cagctactaa 24600
aatgtctgaa tgcgtactcg gacaatctaa acgtgtcgat ttttgcggta agggatatca 24660
tcttatgtct tttccacaat ctgcacctca cggagtcgtg tttttacacg ttacttatgt 24720
gccagctcaa gagaaaaatt ttacaaccgc tcctgctatt tgtcatgacg gtaaggcaca 24780
ttttcctaga gagggcgtat tcgtttctaa cggtacacat tggttcgtta cacaacgtaa 24840
tttttacgaa cctcaaatta ttactactga taatacattc gtatcaggta attgtgacgt 24900
agtgataggt atcgttaata atacagttta cgatccactt caacctgaac tcgatagttt 24960
taaagaggaa ctcgataagt attttaaaaa tcatacatca cctgacgtcg acttaggcga 25020
tatttcaggt attaacgcta gtgtcgttaa cattcaaaaa gagattgata gacttaacga 25080
agtcgctaaa aatcttaacg aatcacttat cgatctgcaa gagttaggta agtatgagca 25140
atatattaaa tggccttggt atatttggtt aggctttata gccggattga tcgcaatcgt 25200
tatggttaca attatgttat gttgtatgac atcatgttgt tcatgtctta agggatgttg 25260
ttcatgcgga tcatgttgta aatttgacga agacgattcc gaaccagtgc ttaaaggcgt 25320
taagttacat tatacataaa cgaacttatg gatttgttta tgagaatctt cacaattgga 25380
actgtaactt tgaagcaagg tgaaatcaag gatgctactc cttcagattt tgttcgcgct 25440
actgcaacga taccgataca agcctcactc cctttcggat ggcttattgt tggcgttgca 25500
cttcttgctg tttttcagag cgcttccaaa atcataaccc tcaaaaagag atggcaacta 25560
gcactctcca agggtgttca ctttgtttgc aacttgctgt tgttgtttgt aacagtttac 25620
tcacaccttt tgctcgttgc tgctggcctt gaagcccctt ttctctatct ttatgcttta 25680
gtctacttct tgcagagtat aaactttgta agaataataa tgaggctttg gctttgctgg 25740
aaatgccgtt ccaaaaaccc attactttat gatgccaact attttctttg ctggcatact 25800
aattgttacg actattgtat accttacaat agtgtaactt cttcaattgt cattacttca 25860
ggtgatggca caacaagtcc tatttctgaa catgactacc agattggtgg ttatactgaa 25920
aaatgggaat ctggagtaaa agactgtgtt gtattacaca gttacttcac ttcagactat 25980
taccagctgt actcaactca attgagtaca gacactggtg ttgaacatgt taccttcttc 26040
atctacaata aaattgttga tgagcctgaa gaacatgtcc aaattcacac aatcgacggt 26100
tcatccggag ttgttaatcc agtaatggaa ccaatttatg atgaaccgac gacgactact 26160
agcgtgcctt tgtaagcaca agctgatgag tacgaactta tgtactcatt cggttcggaa 26220
gagacaggta cgttaatagt taatagcgta cttctttttc ttgctttcgt ggtattcttg 26280
ctagttacac tagccatcct tactgcgctt cgattgtgtg cgtactgctg caatattgtt 26340
aacgtgagtc ttgtaaaacc ttctttttac gtttactctc gtgttaaaaa tctgaattct 26400
tctagagttc ctgatcttct ggtctaaacg aactaaatat tatattagtt tttctgtttg 26460
gaactttaat tttagccatg gcagattcca acggtactat taccgttgaa gagcttaaaa 26520
agctccttga acaatggaac ctagtaatag gtttcctatt ccttacatgg atttgtcttc 26580
tacaatttgc ctatgccaac aggaataggt ttttgtatat aattaagtta attttcctct 26640
ggctgttatg gccagtaact ttagcttgtt ttgtgcttgc tgctgtttac agaataaatt 26700
ggatcaccgg tggaattgct atcgcaatgg cttgtcttgt aggcttgatg tggctcagct 26760
acttcattgc ttctttcaga ctgtttgcgc gtacgcgttc catgtggtca ttcaatccag 26820
aaactaacat tcttctcaac gtgccactcc atggcactat tctgaccaga ccgcttctag 26880
aaagtgaact cgtaatcgga gctgtgatcc ttcgtggaca tcttcgtatt gctggacacc 26940
atctaggacg ctgtgacatc aaggacctgc ctaaagaaat cactgttgct acatcacgaa 27000
cgctttctta ttacaaattg ggagcttcgc agcgtgtagc aggtgactca ggttttgctg 27060
catacagtcg ctacaggatt ggcaactata aattaaacac agaccattcc agtagcagtg 27120
acaatattgc tttgcttgta cagtaagtga caacagatgt ttcatctcgt tgactttcag 27180
gttactatag cagagatatt actaattatt atgaggactt ttaaagtttc catttggaat 27240
cttgattaca tcataaacct cataattaaa aatttatcta agtcactaac tgagaataaa 27300
tattctcaat tagatgaaga gcaaccaatg gagattgatt aaacgaacat gaaaattatt 27360
cttttcttgg cactgataac actcgctact tgtgagcttt atcactacca agagtgtgtt 27420
agaggtacaa cagtactttt aaaagaacct tgctcttctg gaacatacga gggcaattca 27480
ccatttcatc ctctagctga taacaaattt gcactgactt gctttagcac tcaatttgct 27540
tttgcttgtc ctgacggcgt aaaacacgtc tatcagttac gtgccagatc agtttcacct 27600
aaactgttca tcagacaaga ggaagttcaa gaactttact ctccaatttt tcttattgtt 27660
gcggcaatag tgtttataac actttgcttc acactcaaaa gaaagacaga atgattgaac 27720
tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt gttttaatta 27780
tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact tgtcacgcct 27840
aaacgaacat gaaatttctt gttttcttag gaatcatcac aactgtagct gcatttcacc 27900
aagaatgtag tttacagtca tgtactcaac atcaaccata tgtagttgat gacccgtgtc 27960
ctattcactt ctattctaaa tggtatatta gagtaggagc tagaaaatca gcacctttaa 28020
ttgaattgtg cgtggatgag gctggttcta aatcacccat tcagtacatc gatatcggta 28080
attatacagt ttcctgttca ccttttacaa ttaattgcca ggaacctaaa ttgggtagtc 28140
ttgtagtgcg ttgttcgttc tatgaagact ttttagagta tcatgacgtt cgtgttgttt 28200
tagatttcat ctaaacgaac aaactaaaat gtctgataat ggaccccaaa atcagcgaaa 28260
tgcaccccgc attacgtttg gtggaccctc agattcaact ggcagtaacc agaatggaga 28320
acgcagtggg gcgcgatcaa aacaacgtcg gccccaaggt ttacccaata atactgcgtc 28380
ttggttcacc gctctcactc aacatggcaa ggaagacctt aaattccctc gaggacaagg 28440
cgttccaatt aacaccaata gcagtccaga tgaccaaatt ggctactacc gaagagctac 28500
cagacgaatt cgtggtggtg acggtaaaat gaaagatctc agtccaagat ggtatttcta 28560
ctacctagga actgggccag aagctggact tccctatggt gctaacaaag acggcatcat 28620
atgggttgca actgagggag ccttgaatac accaaaagat cacattggca cccgcaatcc 28680
tgctaacaat gctgcaatcg tgctacaact tcctcaagga acaacattgc caaaaggctt 28740
ctacgcagaa gggagcagag gcggcagtca agcctcttct cgttcctcat cacgtagtcg 28800
caacagttca agaaattcaa ctccaggcag cagtagggga acttctcctg ctagaatggc 28860
tggcaatggc ggtgatgctg ctcttgcttt gctgctgctt gacagattga accagcttga 28920
gagcaaaatg tctggtaaag gccaacaaca acaaggccaa actgtcacta agaaatctgc 28980
tgctgaggct tctaagaagc ctcggcaaaa acgtactgcc actaaagcat acaatgtaac 29040
acaagctttc ggcagacgtg gtccagaaca aacccaagga aattttgggg accaggaact 29100
aatcagacaa ggaactgatt acaaacattg gccgcaaatt gcacaatttg cccccagcgc 29160
ttcagcgttc ttcggaatgt cgcgcattgg catggaagtc acaccttcgg gaacgtggtt 29220
gacctacaca ggtgccatca aattggatga caaagatcca aatttcaaag atcaagtcat 29280
tttgctgaat aagcatattg acgcatacaa aacattccca ccaacagagc ctaaaaagga 29340
caaaaagaag aaggctgatg aaactcaagc cttaccgcag agacagaaga aacagcaaac 29400
tgtgactctt cttcctgctg cagatttgga tgatttctcc aaacaattgc aacaatccat 29460
gagcagtgct gactcaactc aggcctaaac tcatgcagac cacacaaggc agatgggcta 29520
tataaacgtt ttcgcttttc cgtttacgat atatagtcta ctcttgtgca gaatgaattc 29580
tcgtaactac atagcacaag tagatgtagt taactttaat ctcacatagc aatctttaat 29640
cagtgtgtaa cattagggag gacttgaaag agccaccaca ttttcaccga ggccacgcgg 29700
agtacgatcg agtgtacagt gaacaatgct agggagagct gcctatatgg aagagcccta 29760
atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct tcttaggaga 29820
atgac 29825
<210> 11
<211> 29825
<212> DNA
<213> Artificial
<220>
<223> Synthetic Construct
<400> 11
attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60
gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120
cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180
ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240
cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300
acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360
agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420
cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480
acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540
cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600
cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660
tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720
tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780
actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840
ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900
atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960
tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020
gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080
ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140
gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200
caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260
gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320
aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380
atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440
cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500
ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560
ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620
aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680
gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740
aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800
aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860
tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920
tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980
aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040
taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100
gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160
agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220
ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280
ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340
tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400
ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460
tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520
aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580
agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640
aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700
cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760
agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820
acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880
ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940
actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000
tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060
agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120
agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180
agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240
cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300
agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360
aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420
aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480
aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540
tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600
acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660
gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720
tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780
tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840
aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900
gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960
caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020
cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080
tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140
agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200
gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260
gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320
cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380
ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440
tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500
agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560
gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620
tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680
agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740
ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800
agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860
taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920
ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980
aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040
acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100
acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160
tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220
cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280
caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340
acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400
acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460
gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520
taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580
cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640
agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700
tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760
gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820
acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880
ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940
tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000
tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060
tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120
aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180
taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240
gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300
tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360
cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420
ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480
aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540
cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600
attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660
tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720
aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780
ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840
atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900
ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960
gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020
tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080
ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140
tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200
atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260
tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320
ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380
acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440
tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500
ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560
gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620
tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680
cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740
tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800
ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860
taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920
atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980
agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040
tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100
agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160
ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220
tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280
ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340
tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400
atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460
tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520
tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580
gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640
tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700
tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760
tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820
attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880
gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940
tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000
ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060
ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120
acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180
tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240
agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300
atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360
accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420
tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagga gagcttttgg 9480
tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540
ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600
gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660
cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720
tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780
tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840
gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900
taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960
tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020
accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080
atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140
tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200
gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260
ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320
taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380
acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440
tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500
ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560
tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620
aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680
cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740
ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800
actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860
agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920
tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980
gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040
agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100
accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160
gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220
ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280
tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340
aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400
gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460
catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520
gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580
tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640
ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700
ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760
gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820
tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880
actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940
ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000
ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060
agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120
atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180
ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240
ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300
gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360
gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420
aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480
tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540
atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600
tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660
ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720
gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780
caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840
atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900
ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960
aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020
acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080
tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140
taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200
ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260
ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320
acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380
ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440
gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500
ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560
aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620
gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680
caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740
ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800
aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860
acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920
gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980
cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040
attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100
gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160
ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220
ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280
aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340
tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400
ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460
gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520
ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580
cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640
cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700
gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760
ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820
ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880
gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940
tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000
tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060
caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120
tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180
gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240
atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300
aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360
aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420
caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480
tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540
acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600
cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660
tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720
gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780
aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840
actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900
aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960
ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020
tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080
tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140
gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200
tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260
aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320
tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380
gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440
agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500
gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560
attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620
agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680
tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740
gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800
aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860
gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920
tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980
attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040
tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100
agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160
tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220
aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280
aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340
gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400
gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460
cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520
atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580
gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640
gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700
aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760
gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820
ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880
accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940
aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000
agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060
tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120
agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180
gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240
ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300
ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360
cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420
cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480
cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540
caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600
catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660
tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720
catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780
ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840
catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900
aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960
gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020
gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080
tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140
tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200
aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260
aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320
acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380
tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440
ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500
gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560
ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620
agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680
gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740
gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800
cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860
gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920
gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980
gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040
gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100
agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160
aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220
caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280
ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340
agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400
tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460
acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520
gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580
actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640
ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700
tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760
acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820
aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880
gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940
cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000
tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060
aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120
gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180
tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240
actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300
ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360
aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420
aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480
cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540
cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600
tcagtgtgtt aatcttataa ccagaactca atcatacact aattctttca cacgtggtgt 21660
ttattaccct gacaaagttt tcagatcctc agttttacat tcaactcagg acttgttctt 21720
acctttcttt tccaatgtta cttggttcca tgctatacat gtctctggga ccaatggtac 21780
taagaggttt gataaccctg tcctaccatt taatgatggt gtttattttg cttccactga 21840
gaagtctaac ataataagag gctggatttt tggtactact ttagattcga agacccagtc 21900
cctacttatt gttaataacg ctactaatgt tgttattaaa gtctgtgaat ttcaattttg 21960
taatgatcca tttttggatg tttattacca caaaaacaac aaaagttgga tggaaagtga 22020
gttcagagtt tattctagtg cgaataattg cacttttgaa tatgtctctc agccttttct 22080
tatggacctt gaaggaaaac agggtaattt caaaaatctt agggaatttg tgtttaagaa 22140
tattgatggt tattttaaaa tatattctaa gcacacgcct attaatttag ggcgtgatct 22200
ccctcagggt ttttcggctt tagaaccatt ggtagatttg ccaataggta ttaacatcac 22260
taggtttcaa actttacttg ctttacatag aagttatttg actcctggtg attcttcttc 22320
aggttggaca gctggtgctg cagcttatta tgtgggttat cttcaaccta ggacttttct 22380
attaaaatat aatgaaaatg gaaccattac agatgctgta gactgtgcac ttgaccctct 22440
ctcagaaaca aagtgtacgt tgaaatcctt cactgtagaa aaaggaatct atcaaacttc 22500
taactttaga gtccaaccaa cagaatctat tgttagattt cctaatatta caaacttgtg 22560
cccttttgat gaagttttta acgccaccag atttgcatct gtttatgctt ggaacaggaa 22620
gagaatcagc aactgtgttg ctgattattc tgtcctatat aatttcgcac catttttcgc 22680
ttttaagtgt tatggagtgt ctcctactaa attaaatgat ctctgcttta ctaatgtcta 22740
tgcagattca tttgtaatta gaggtaatga agtcagccaa atcgctccag ggcaaactgg 22800
aaatattgct gattataatt ataaattacc agatgatttt acaggctgcg ttatagcttg 22860
gaattctaac aagcttgatt ctaaggttgg tggtaattat aattacctgt atagattgtt 22920
taggaagtct aatctcaaac cttttgagag agatatttca actgaaatct atcaggccgg 22980
taacaaacct tgtaatggtg ttgcaggttt taattgttac tttcctttac gatcatatgg 23040
tttccgaccc acttatggtg ttggtcacca accatacaga gtagtagtac tttcttttga 23100
acttctacat gcaccagcaa ctgtttgtgg acctaaaaag tctactaatt tggttaaaaa 23160
caaatgtgtc aatttcaact tcaatggttt aacaggcaca ggtgttctta ctgagtctaa 23220
caaaaagttt ctgcctttcc aacaatttgg cagagacatt gctgacacta ctgatgctgt 23280
ccgtgatcca cagacacttg agattcttga cattacacca tgttcttttg gtggtgtcag 23340
tgttataaca ccaggaacaa atacttctaa ccaggttgct gttctttatc agggtgttaa 23400
ctgcacagaa gtccctgttg ctattcatgc agatcaactt actcctactt ggcgtgttta 23460
ttctacaggt tctaatgttt ttcaaacacg tgcaggctgt ttaatagggg ctgaatatgt 23520
caacaactca tatgagtgtg acatacccat tggtgcaggt atatgcgcta gttatcagac 23580
tcagcaatcc atcattgcct acactatgtc acttggtgca gaaaattcag ttgcttactc 23640
taataactct attgccatac ccacaaattt tactattagt gttaccacag aaattctacc 23700
agtgtctatg accaagacat cagtagattg tacaatgtac atttgtggtg attcaactga 23760
atgcagcaat cttttgttgc aatatggcag tttttgtaca caattaaaac gtgctttaac 23820
tggaatagct gttgaacaag acaaaaacac ccaagaagtt tttgcacaag tcaaacaaat 23880
ttacaaaaca ccaccaatta aatattttgg tggttttaat ttttcacaaa tattaccaga 23940
tccatcaaaa ccaagcaaga ggtcatttat tgaagatcta cttttcaaca aagtgacact 24000
tgcagatgct ggcttcatca aacaatatgg tgattgcctt ggtgatattg ctgctagaga 24060
cctcatttgc gctcaaaaat ttaacggact tacagtttta ccacctttac ttactgacga 24120
aatgattgcg caatatacat ccgcattgtt agccggaact attacatccg gatggacttt 24180
tggcgcaggc gcagcattac agattccatt cgctatgcaa atggcttata ggtttaacgg 24240
tataggcgtt acgcaaaacg tactttatga gaatcaaaaa cttatcgcta accaatttaa 24300
ttccgctatc ggtaagattc aggattcatt gtctagtact gctagtgcac tcggtaagtt 24360
gcaagacgta gtgaatcata acgctcaagc acttaataca ctcgttaaac agcttagttc 24420
taaatttggc gcaatttcta gtgtgcttaa cgatatacta tctagactcg ataaagtcga 24480
agccgaagtg caaatcgata gattgattac cggtaggttg caatcattgc aaacatacgt 24540
tacacagcaa ttgattaggg ccgcagagat acgcgctagc gctaatctcg cagctactaa 24600
aatgtctgaa tgcgtactcg gacaatctaa acgtgtcgat ttttgcggta agggatatca 24660
tcttatgtct tttccacaat ctgcacctca cggagtcgtg tttttacacg ttacttatgt 24720
gccagctcaa gagaaaaatt ttacaaccgc tcctgctatt tgtcatgacg gtaaggcaca 24780
ttttcctaga gagggcgtat tcgtttctaa cggtacacat tggttcgtta cacaacgtaa 24840
tttttacgaa cctcaaatta ttactactga taatacattc gtatcaggta attgtgacgt 24900
agtgataggt atcgttaata atacagttta cgatccactt caacctgaac tcgatagttt 24960
taaagaggaa ctcgataagt attttaaaaa tcatacatca cctgacgtcg acttaggcga 25020
tatttcaggt attaacgcta gtgtcgttaa cattcaaaaa gagattgata gacttaacga 25080
agtcgctaaa aatcttaacg aatcacttat cgatctgcaa gagttaggta agtatgagca 25140
atatattaaa tggccttggt atatttggtt aggctttata gccggattga tcgcaatcgt 25200
tatggttaca attatgttat gttgtatgac atcatgttgt tcatgtctta agggatgttg 25260
ttcatgcgga tcatgttgta aatttgacga agacgattcc gaaccagtgc ttaaaggcgt 25320
taagttacat tatacataaa cgaacttatg gatttgttta tgagaatctt cacaattgga 25380
actgtaactt tgaagcaagg tgaaatcaag gatgctactc cttcagattt tgttcgcgct 25440
actgcaacga taccgataca agcctcactc cctttcggat ggcttattgt tggcgttgca 25500
cttcttgctg tttttcagag cgcttccaaa atcataaccc tcaaaaagag atggcaacta 25560
gcactctcca agggtgttca ctttgtttgc aacttgctgt tgttgtttgt aacagtttac 25620
tcacaccttt tgctcgttgc tgctggcctt gaagcccctt ttctctatct ttatgcttta 25680
gtctacttct tgcagagtat aaactttgta agaataataa tgaggctttg gctttgctgg 25740
aaatgccgtt ccaaaaaccc attactttat gatgccaact attttctttg ctggcatact 25800
aattgttacg actattgtat accttacaat agtgtaactt cttcaattgt cattacttca 25860
ggtgatggca caacaagtcc tatttctgaa catgactacc agattggtgg ttatactgaa 25920
aaatgggaat ctggagtaaa agactgtgtt gtattacaca gttacttcac ttcagactat 25980
taccagctgt actcaactca attgagtaca gacactggtg ttgaacatgt taccttcttc 26040
atctacaata aaattgttga tgagcctgaa gaacatgtcc aaattcacac aatcgacggt 26100
tcatccggag ttgttaatcc agtaatggaa ccaatttatg atgaaccgac gacgactact 26160
agcgtgcctt tgtaagcaca agctgatgag tacgaactta tgtactcatt cggttcggaa 26220
gagacaggta cgttaatagt taatagcgta cttctttttc ttgctttcgt ggtattcttg 26280
ctagttacac tagccatcct tactgcgctt cgattgtgtg cgtactgctg caatattgtt 26340
aacgtgagtc ttgtaaaacc ttctttttac gtttactctc gtgttaaaaa tctgaattct 26400
tctagagttc ctgatcttct ggtctaaacg aactaaatat tatattagtt tttctgtttg 26460
gaactttaat tttagccatg gcagattcca acggtactat taccgttgaa gagcttaaaa 26520
agctccttga acaatggaac ctagtaatag gtttcctatt ccttacatgg atttgtcttc 26580
tacaatttgc ctatgccaac aggaataggt ttttgtatat aattaagtta attttcctct 26640
ggctgttatg gccagtaact ttagcttgtt ttgtgcttgc tgctgtttac agaataaatt 26700
ggatcaccgg tggaattgct atcgcaatgg cttgtcttgt aggcttgatg tggctcagct 26760
acttcattgc ttctttcaga ctgtttgcgc gtacgcgttc catgtggtca ttcaatccag 26820
aaactaacat tcttctcaac gtgccactcc atggcactat tctgaccaga ccgcttctag 26880
aaagtgaact cgtaatcgga gctgtgatcc ttcgtggaca tcttcgtatt gctggacacc 26940
atctaggacg ctgtgacatc aaggacctgc ctaaagaaat cactgttgct acatcacgaa 27000
cgctttctta ttacaaattg ggagcttcgc agcgtgtagc aggtgactca ggttttgctg 27060
catacagtcg ctacaggatt ggcaactata aattaaacac agaccattcc agtagcagtg 27120
acaatattgc tttgcttgta cagtaagtga caacagatgt ttcatctcgt tgactttcag 27180
gttactatag cagagatatt actaattatt atgaggactt ttaaagtttc catttggaat 27240
cttgattaca tcataaacct cataattaaa aatttatcta agtcactaac tgagaataaa 27300
tattctcaat tagatgaaga gcaaccaatg gagattgatt aaacgaacat gaaaattatt 27360
cttttcttgg cactgataac actcgctact tgtgagcttt atcactacca agagtgtgtt 27420
agaggtacaa cagtactttt aaaagaacct tgctcttctg gaacatacga gggcaattca 27480
ccatttcatc ctctagctga taacaaattt gcactgactt gctttagcac tcaatttgct 27540
tttgcttgtc ctgacggcgt aaaacacgtc tatcagttac gtgccagatc agtttcacct 27600
aaactgttca tcagacaaga ggaagttcaa gaactttact ctccaatttt tcttattgtt 27660
gcggcaatag tgtttataac actttgcttc acactcaaaa gaaagacaga atgattgaac 27720
tttcattaat tgacttctat ttgtgctttt tagcctttct gctattcctt gttttaatta 27780
tgcttattat cttttggttc tcacttgaac tgcaagatca taatgaaact tgtcacgcct 27840
aaacgaacat gaaatttctt gttttcttag gaatcatcac aactgtagct gcatttcacc 27900
aagaatgtag tttacagtca tgtactcaac atcaaccata tgtagttgat gacccgtgtc 27960
ctattcactt ctattctaaa tggtatatta gagtaggagc tagaaaatca gcacctttaa 28020
ttgaattgtg cgtggatgag gctggttcta aatcacccat tcagtacatc gatatcggta 28080
attatacagt ttcctgttca ccttttacaa ttaattgcca ggaacctaaa ttgggtagtc 28140
ttgtagtgcg ttgttcgttc tatgaagact ttttagagta tcatgacgtt cgtgttgttt 28200
tagatttcat ctaaacgaac aaactaaaat gtctgataat ggaccccaaa atcagcgaaa 28260
tgcaccccgc attacgtttg gtggaccctc agattcaact ggcagtaacc agaatggaga 28320
acgcagtggg gcgcgatcaa aacaacgtcg gccccaaggt ttacccaata atactgcgtc 28380
ttggttcacc gctctcactc aacatggcaa ggaagacctt aaattccctc gaggacaagg 28440
cgttccaatt aacaccaata gcagtccaga tgaccaaatt ggctactacc gaagagctac 28500
cagacgaatt cgtggtggtg acggtaaaat gaaagatctc agtccaagat ggtatttcta 28560
ctacctagga actgggccag aagctggact tccctatggt gctaacaaag acggcatcat 28620
atgggttgca actgagggag ccttgaatac accaaaagat cacattggca cccgcaatcc 28680
tgctaacaat gctgcaatcg tgctacaact tcctcaagga acaacattgc caaaaggctt 28740
ctacgcagaa gggagcagag gcggcagtca agcctcttct cgttcctcat cacgtagtcg 28800
caacagttca agaaattcaa ctccaggcag cagtagggga acttctcctg ctagaatggc 28860
tggcaatggc ggtgatgctg ctcttgcttt gctgctgctt gacagattga accagcttga 28920
gagcaaaatg tctggtaaag gccaacaaca acaaggccaa actgtcacta agaaatctgc 28980
tgctgaggct tctaagaagc ctcggcaaaa acgtactgcc actaaagcat acaatgtaac 29040
acaagctttc ggcagacgtg gtccagaaca aacccaagga aattttgggg accaggaact 29100
aatcagacaa ggaactgatt acaaacattg gccgcaaatt gcacaatttg cccccagcgc 29160
ttcagcgttc ttcggaatgt cgcgcattgg catggaagtc acaccttcgg gaacgtggtt 29220
gacctacaca ggtgccatca aattggatga caaagatcca aatttcaaag atcaagtcat 29280
tttgctgaat aagcatattg acgcatacaa aacattccca ccaacagagc ctaaaaagga 29340
caaaaagaag aaggctgatg aaactcaagc cttaccgcag agacagaaga aacagcaaac 29400
tgtgactctt cttcctgctg cagatttgga tgatttctcc aaacaattgc aacaatccat 29460
gagcagtgct gactcaactc aggcctaaac tcatgcagac cacacaaggc agatgggcta 29520
tataaacgtt ttcgcttttc cgtttacgat atatagtcta ctcttgtgca gaatgaattc 29580
tcgtaactac atagcacaag tagatgtagt taactttaat ctcacatagc aatctttaat 29640
cagtgtgtaa cattagggag gacttgaaag agccaccaca ttttcaccga ggccacgcgg 29700
agtacgatcg agtgtacagt gaacaatgct agggagagct gcctatatgg aagagcccta 29760
atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct tcttaggaga 29820
atgac 29825
<210> 12
<211> 29819
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 12
attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 60
gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 120
cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc 180
ttctgcaggc tgcttacggt ttcgtccgtg ttgcagccga tcatcagcac atctaggttt 240
cgtccgggtg tgaccgaaag gtaagatgga gagccttgtc cctggtttca acgagaaaac 300
acacgtccaa ctcagtttgc ctgttttaca ggttcgcgac gtgctcgtac gtggctttgg 360
agactccgtg gaggaggtct tatcagaggc acgtcaacat cttaaagatg gcacttgtgg 420
cttagtagaa gttgaaaaag gcgttttgcc tcaacttgaa cagccctatg tgttcatcaa 480
acgttcggat gctcgaactg cacctcatgg tcatgttatg gttgagctgg tagcagaact 540
cgaaggcatt cagtacggtc gtagtggtga gacacttggt gtccttgtcc ctcatgtggg 600
cgaaatacca gtggcttacc gcaaggttct tcttcgtaag aacggtaata aaggagctgg 660
tggccatagt tacggcgccg atctaaagtc atttgactta ggcgacgagc ttggcactga 720
tccttatgaa gattttcaag aaaactggaa cactaaacat agcagtggtg ttacccgtga 780
actcatgcgt gagcttaacg gaggggcata cactcgctat gtcgataaca acttctgtgg 840
ccctgatggc taccctcttg agtgcattaa agaccttcta gcacgtgctg gtaaagcttc 900
atgcactttg tccgaacaac tggactttat tgacactaag aggggtgtat actgctgccg 960
tgaacatgag catgaaattg cttggtacac ggaacgttct gaaaagagct atgaattgca 1020
gacacctttt gaaattaaat tggcaaagaa atttgacacc ttcaatgggg aatgtccaaa 1080
ttttgtattt cccttaaatt ccataatcaa gactattcaa ccaagggttg aaaagaaaaa 1140
gcttgatggc tttatgggta gaattcgatc tgtctatcca gttgcgtcac caaatgaatg 1200
caaccaaatg tgcctttcaa ctctcatgaa gtgtgatcat tgtggtgaaa cttcatggca 1260
gacgggcgat tttgttaaag ccacttgcga attttgtggc actgagaatt tgactaaaga 1320
aggtgccact acttgtggtt acttacccca aaatgctgtt gttaaaattt attgtccagc 1380
atgtcacaat tcagaagtag gacctgagca tagtcttgcc gaataccata atgaatctgg 1440
cttgaaaacc attcttcgta agggtggtcg cactattgcc tttggaggct gtgtgttctc 1500
ttatgttggt tgccataaca agtgtgccta ttgggttcca cgtgctagcg ctaacatagg 1560
ttgtaaccat acaggtgttg ttggagaagg ttccgaaggt cttaatgaca accttcttga 1620
aatactccaa aaagagaaag tcaacatcaa tattgttggt gactttaaac ttaatgaaga 1680
gatcgccatt attttggcat ctttttctgc ttccacaagt gcttttgtgg aaactgtgaa 1740
aggtttggat tataaagcat tcaaacaaat tgttgaatcc tgtggtaatt ttaaagttac 1800
aaaaggaaaa gctaaaaaag gtgcctggaa tattggtgaa cagaaatcaa tactgagtcc 1860
tctttatgca tttgcatcag aggctgctcg tgttgtacga tcaattttct cccgcactct 1920
tgaaactgct caaaattctg tgcgtgtttt acagaaggcc gctataacaa tactagatgg 1980
aatttcacag tattcactga gactcattga tgctatgatg ttcacatctg atttggctac 2040
taacaatcta gttgtaatgg cctacattac aggtggtgtt gttcagttga cttcgcagtg 2100
gctaactaac atctttggca ctgtttatga aaaactcaaa cccgtccttg attggcttga 2160
agagaagttt aaggaaggtg tagagtttct tagagacggt tgggaaattg ttaaatttat 2220
ctcaacctgt gcttgtgaaa ttgtcggtgg acaaattgtc acctgtgcaa aggaaattaa 2280
ggagagtgtt cagacattct ttaagcttgt aaataaattt ttggctttgt gtgctgactc 2340
tatcattatt ggtggagcta aacttaaagc cttgaattta ggtgaaacat ttgtcacgca 2400
ctcaaaggga ttgtacagaa agtgtgttaa atccagagaa gaaactggcc tactcatgcc 2460
tctaaaagcc ccaaaagaaa ttatcttctt agagggagaa acacttccca cagaagtgtt 2520
aacagaggaa gttgtcttga aaactggtga tttacaacca ttagaacaac ctactagtga 2580
agctgttgaa gctccattgg ttggtacacc agtttgtatt aacgggctta tgttgctcga 2640
aatcaaagac acagaaaagt actgtgccct tgcacctaat atgatggtaa caaacaatac 2700
cttcacactc aaaggcggtg caccaacaaa ggttactttt ggtgatgaca ctgtgataga 2760
agtgcaaggt tacaagagtg tgaatatcac ttttgaactt gatgaaagga ttgataaagt 2820
acttaatgag aagtgctctg cctatacagt tgaactcggt acagaagtaa atgagttcgc 2880
ctgtgttgtg gcagatgctg tcataaaaac tttgcaacca gtatctgaat tacttacacc 2940
actgggcatt gatttagatg agtggagtat ggctacatac tacttatttg atgagtctgg 3000
tgagtttata ttggcttcac atatgtattg ttctttctac cctccagatg aggatgaaga 3060
agaaggtgat tgtgaagaag aagagtttga gccatcaact caatatgagt atggtactga 3120
agatgattac caaggtaaac ctttggaatt tggtgccact tctgctgctc ttcaacctga 3180
agaagagcaa gaagaagatt ggttagatga tgatagtcaa caaactgttg gtcaacaaga 3240
cggcagtgag gacaatcaga caactactat tcaaacaatt gttgaggttc aacctcaatt 3300
agagatggaa cttacaccag ttgttcagac tattgaagtg aatagtttta gtggttattt 3360
aaaacttact gacaatgtat acattaaaaa tgcagacatt gtggaagaag ctaaaaaggt 3420
aaaaccaaca gtggttgtta atgcagccaa tgtttacctt aaacatggag gaggtgttgc 3480
aggagcctta aataaggcta ctaacaatgc catgcaagtt gaatctgatg attacatagc 3540
tactaatgga ccacttaaag tgggtggtag ttgtgtttta agcggacaca atcttgctaa 3600
acactgtctt catgttgtcg gcccaaatgt taacaaaggt gaagacattc aacttcttaa 3660
gagtgcttat gaaaatttta atcagcacga agttctactt gcaccattat tatcagctgg 3720
tatttttggt gctgacccta tacattcttt aagagtttgt gtagatactg ttcgcacaaa 3780
tgtctactta gctgtctttg ataaaaatct ctatgacaaa cttgtttcaa gctttttgga 3840
aatgaagagt gaaaagcaag ttgaacaaaa gatcgctgag attcctaaag aggaagttaa 3900
gccatttata actgaaagta aaccttcagt tgaacagaga aaacaagatg ataagaaaat 3960
caaagcttgt gttgaagaag ttacaacaac tctggaagaa actaagttcc tcacagaaaa 4020
cttgttactt tatattgaca ttaatggcaa tcttcatcca gattctgcca ctcttgttag 4080
tgacattgac atcactttct taaagaaaga tgctccatat atagtgggtg atgttgttca 4140
agagggtgtt ttaactgctg tggttatacc tactaaaaag gctggtggca ctactgaaat 4200
gctagcgaaa gctttgagaa aagtgccaac agacaattat ataaccactt acccgggtca 4260
gggtttaaat ggttacactg tagaggaggc aaagacagtg cttaaaaagt gtaaaagtgc 4320
cttttacatt ctaccatcta ttatctctaa tgagaagcaa gaaattcttg gaactgtttc 4380
ttggaatttg cgagaaatgc ttgcacatgc agaagaaaca cgcaaattaa tgcctgtctg 4440
tgtggaaact aaagccatag tttcaactat acagcgtaaa tataagggta ttaaaataca 4500
agagggtgtg gttgattatg gtgctagatt ttacttttac accagtaaaa caactgtagc 4560
gtcacttatc aacacactta acgatctaaa tgaaactctt gttacaatgc cacttggcta 4620
tgtaacacat ggcttaaatt tggaagaagc tgctcggtat atgagatctc tcaaagtgcc 4680
agctacagtt tctgtttctt cacctgatgc tgttacagcg tataatggtt atcttacttc 4740
ttcttctaaa acacctgaag aacattttat tgaaaccatc tcacttgctg gttcctataa 4800
agattggtcc tattctggac aatctacaca actaggtata gaatttctta agagaggtga 4860
taaaagtgta tattacacta gtaatcctac cacattccac ctagatggtg aagttatcac 4920
ctttgacaat cttaagacac ttctttcttt gagagaagtg aggactatta aggtgtttac 4980
aacagtagac aacattaacc tccacacgca agttgtggac atgtcaatga catatggaca 5040
acagtttggt ccaacttatt tggatggagc tgatgttact aaaataaaac ctcataattc 5100
acatgaaggt aaaacatttt atgttttacc taatgatgac actctacgtg ttgaggcttt 5160
tgagtactac cacacaactg atcctagttt tctgggtagg tacatgtcag cattaaatca 5220
cactaaaaag tggaaatacc cacaagttaa tggtttaact tctattaaat gggcagataa 5280
caactgttat cttgccactg cattgttaac actccaacaa atagagttga agtttaatcc 5340
acctgctcta caagatgctt attacagagc aagggctggt gaagctgcta acttttgtgc 5400
acttatctta gcctactgta ataagacagt aggtgagtta ggtgatgtta gagaaacaat 5460
gagttacttg tttcaacatg ccaatttaga ttcttgcaaa agagtcttga acgtggtgtg 5520
taaaacttgt ggacaacagc agacaaccct taagggtgta gaagctgtta tgtacatggg 5580
cacactttct tatgaacaat ttaagaaagg tgttcagata ccttgtacgt gtggtaaaca 5640
agctacaaaa tatctagtac aacaggagtc accttttgtt atgatgtcag caccacctgc 5700
tcagtatgaa cttaagcatg gtacatttac ttgtgctagt gagtacactg gtaattacca 5760
gtgtggtcac tataaacata taacttctaa agaaactttg tattgcatag acggtgcttt 5820
acttacaaag tcctcagaat acaaaggtcc tattacggat gttttctaca aagaaaacag 5880
ttacacaaca accataaaac cagttactta taaattggat ggtgttgttt gtacagaaat 5940
tgaccctaag ttggacaatt attataagaa agacaattct tatttcacag agcaaccaat 6000
tgatcttgta ccaaaccaac catatccaaa cgcaagcttc gataatttta agtttgtatg 6060
tgataatatc aaatttgctg atgatttaaa ccagttaact ggttataaga aacctgcttc 6120
aagagagctt aaagttacat ttttccctga cttaaatggt gatgtggtgg ctattgatta 6180
taaacactac acaccctctt ttaagaaagg agctaaattg ttacataaac ctattgtttg 6240
gcatgttaac aatgcaacta ataaagccac gtataaacca aatacctggt gtatacgttg 6300
tctttggagc acaaaaccag ttgaaacatc aaattcgttt gatgtactga agtcagagga 6360
cgcgcaggga atggataatc ttgcctgcga agatctaaaa ccagtctctg aagaagtagt 6420
ggaaaatcct accatacaga aagacgttct tgagtgtaat gtgaaaacta ccgaagttgt 6480
aggagacatt atacttaaac cagcaaataa tagtttaaaa attacagaag aggttggcca 6540
cacagatcta atggctgctt atgtagacaa ttctagtctt actattaaga aacctaatga 6600
attatctaga gtattaggtt tgaaaaccct tgctactcat ggtttagctg ctgttaatag 6660
tgtcccttgg gatactatag ctaattatgc taagcctttt cttaacaaag ttgttagtac 6720
aactactaac atagttacac ggtgtttaaa ccgtgtttgt actaattata tgccttattt 6780
ctttacttta ttgctacaat tgtgtacttt tactagaagt acaaattcta gaattaaagc 6840
atctatgccg actactatag caaagaatac tgttaagagt gtcggtaaat tttgtctaga 6900
ggcttcattt aattatttga agtcacctaa tttttctaaa ctgataaata ttataatttg 6960
gtttttacta ttaagtgttt gcctaggttc tttaatctac tcaaccgctg ctttaggtgt 7020
tttaatgtct aatttaggca tgccttctta ctgtactggt tacagagaag gctatttgaa 7080
ctctactaat gtcactattg caacctactg tactggttct ataccttgta gtgtttgtct 7140
tagtggttta gattctttag acacctatcc ttctttagaa actatacaaa ttaccatttc 7200
atcttttaaa tgggatttaa ctgcttttgg cttagttgca gagtggtttt tggcatatat 7260
tcttttcact aggtttttct atgtacttgg attggctgca atcatgcaat tgtttttcag 7320
ctattttgca gtacatttta ttagtaattc ttggcttatg tggttaataa ttaatcttgt 7380
acaaatggcc ccgatttcag ctatggttag aatgtacatc ttctttgcat cattttatta 7440
tgtatggaaa agttatgtgc atgttgtaga cggttgtaat tcatcaactt gtatgatgtg 7500
ttacaaacgt aatagagcaa caagagtcga atgtacaact attgttaatg gtgttagaag 7560
gtccttttat gtctatgcta atggaggtaa aggcttttgc aaactacaca attggaattg 7620
tgttaattgt gatacattct gtgctggtag tacatttatt agtgatgaag ttgcgagaga 7680
cttgtcacta cagtttaaaa gaccaataaa tcctactgac cagtcttctt acatcgttga 7740
tagtgttaca gtgaagaatg gttccatcca tctttacttt gataaagctg gtcaaaagac 7800
ttatgaaaga cattctctct ctcattttgt taacttagac aacctgagag ctaataacac 7860
taaaggttca ttgcctatta atgttatagt ttttgatggt aaatcaaaat gtgaagaatc 7920
atctgcaaaa tcagcgtctg tttactacag tcagcttatg tgtcaaccta tactgttact 7980
agatcaggca ttagtgtctg atgttggtga tagtgcggaa gttgcagtta aaatgtttga 8040
tgcttacgtt aatacgtttt catcaacttt taacgtacca atggaaaaac tcaaaacact 8100
agttgcaact gcagaagctg aacttgcaaa gaatgtgtcc ttagacaatg tcttatctac 8160
ttttatttca gcagctcggc aagggtttgt tgattcagat gtagaaacta aagatgttgt 8220
tgaatgtctt aaattgtcac atcaatctga catagaagtt actggcgata gttgtaataa 8280
ctatatgctc acctataaca aagttgaaaa catgacaccc cgtgaccttg gtgcttgtat 8340
tgactgtagt gcgcgtcata ttaatgcgca ggtagcaaaa agtcacaaca ttgctttgat 8400
atggaacgtt aaagatttca tgtcattgtc tgaacaacta cgaaaacaaa tacgtagtgc 8460
tgctaaaaag aataacttac cttttaagtt gacatgtgca actactagac aagttgttaa 8520
tgttgtaaca acaaagatag cacttaaggg tggtaaaatt gttaataatt ggttgaagca 8580
gttaattaaa gttacacttg tgttcctttt tgttgctgct attttctatt taataacacc 8640
tgttcatgtc atgtctaaac atactgactt ttcaagtgaa atcataggat acaaggctat 8700
tgatggtggt gtcactcgtg acatagcatc tacagatact tgttttgcta acaaacatgc 8760
tgattttgac acatggttta gtcagcgtgg tggtagttat actaatgaca aagcttgccc 8820
attgattgct gcagtcataa caagagaagt gggttttgtc gtgcctggtt tgcctggcac 8880
gatattacgc acaactaatg gtgacttttt gcatttctta cctagagttt ttagtgcagt 8940
tggtaacatc tgttacacac catcaaaact tatagagtac actgactttg caacatcagc 9000
ttgtgttttg gctgctgaat gtacaatttt taaagatgct tctggtaagc cagtaccata 9060
ttgttatgat accaatgtac tagaaggttc tgttgcttat gaaagtttac gccctgacac 9120
acgttatgtg ctcatggatg gctctattat tcaatttcct aacacctacc ttgaaggttc 9180
tgttagagtg gtaacaacct ttgattctga gtactgtagg cacggcactt gtgaaagatc 9240
agaagctggt gtttgtgtat ctactagtgg tagatgggta cttaacaatg attattacag 9300
atctttacca ggagttttct gtggtgtaga tgctgtaaat ttacttacta atatgtttac 9360
accactaatt caacctattg gtgctttgga catatcagca tctatagtag ctggtggtat 9420
tgtagctatc gtagtaacat gccttgccta ctattttatg aggtttagga gagcttttgg 9480
tgaatacagt catgtagttg cctttaatac tttactattc cttatgtcat tcactgtact 9540
ctgtttaaca ccagtttact cattcttacc tggtgtttat tctgttattt acttgtactt 9600
gacattttat cttactaatg atgtttcttt tttagcacat attcagtgga tggttatgtt 9660
cacaccttta gtacctttct ggataacaat tgcttatatc atttgtattt ccacaaagca 9720
tttctattgg ttctttagta attacctaaa gagacgtgta gtctttaatg gtgtttcctt 9780
tagtactttt gaagaagctg cgctgtgcac ctttttgtta aataaagaaa tgtatctaaa 9840
gttgcgtagt gatgtgctat tacctcttac gcaatataat agatacttag ctctttataa 9900
taagtacaag tattttagtg gagcaatgga tacaactagc tacagagaag ctgcttgttg 9960
tcatctcgca aaggctctca atgacttcag taactcaggt tctgatgttc tttaccaacc 10020
accacaaacc tctatcacct cagctgtttt gcagagtggt tttagaaaaa tggcattccc 10080
atctggtaaa gttgagggtt gtatggtaca agtaacttgt ggtacaacta cacttaacgg 10140
tctttggctt gatgacgtag tttactgtcc aagacatgtg atctgcacct ctgaagacat 10200
gcttaaccct aattatgaag atttactcat tcgtaagtct aatcataatt tcttggtaca 10260
ggctggtaat gttcaactca gggttattgg acattctatg caaaattgtg tacttaagct 10320
taaggttgat acagccaatc ctaagacacc taagtataag tttgttcgca ttcaaccagg 10380
acagactttt tcagtgttag cttgttacaa tggttcacca tctggtgttt accaatgtgc 10440
tatgaggccc aatttcacta ttaagggttc attccttaat ggttcatgtg gtagtgttgg 10500
ttttaacata gattatgact gtgtctcttt ttgttacatg caccatatgg aattaccaac 10560
tggagttcat gctggcacag acttagaagg taacttttat ggaccttttg ttgacaggca 10620
aacagcacaa gcagctggta cggacacaac tattacagtt aatgttttag cttggttgta 10680
cgctgctgtt ataaatggag acaggtggtt tctcaatcga tttaccacaa ctcttaatga 10740
ctttaacctt gtggctatga agtacaatta tgaacctcta acacaagacc atgttgacat 10800
actaggacct ctttctgctc aaactggaat tgccgtttta gatatgtgtg cttcattaaa 10860
agaattactg caaaatggta tgaatggacg taccatattg ggtagtgctt tattagaaga 10920
tgaatttaca ccttttgatg ttgttagaca atgctcaggt gttactttcc aaagtgcagt 10980
gaaaagaaca atcaagggta cacaccactg gttgttactc acaattttga cttcactttt 11040
agttttagtc cagagtactc aatggtcttt gttctttttt ttgtatgaaa atgccttttt 11100
accttttgct atgggtatta ttgctatgtc tgcttttgca atgatgtttg tcaaacataa 11160
gcatgcattt ctctgtttgt ttttgttacc ttctcttgcc actgtagctt attttaatat 11220
ggtctatatg cctgctagtt gggtgatgcg tattatgaca tggttggata tggttgatac 11280
tagtttgtct ggttttaagc taaaagactg tgttatgtat gcatcagctg tagtgttact 11340
aatccttatg acagcaagaa ctgtgtatga tgatggtgct aggagagtgt ggacacttat 11400
gaatgtcttg acactcgttt ataaagttta ttatggtaat gctttagatc aagccatttc 11460
catgtgggct cttataatct ctgttacttc taactactca ggtgtagtta caactgtcat 11520
gttcttggcc agaggtattg tttttatgtg tgttgagtat tgccctattt tcttcataac 11580
tggtaataca cttcagtgta taatgctagt ttattgtttc ttaggctatt tttgtacttg 11640
ttactttggc ctcttttgtt tactcaaccg ctactttaga ctgactcttg gtgtttatga 11700
ttacttagtt tctacacagg agtttagata tatgaattca cagggactac tcccacccaa 11760
gaatagcata gatgccttca aactcaacat taaattgttg ggtgttggtg gcaaaccttg 11820
tatcaaagta gccactgtac agtctaaaat gtcagatgta aagtgcacat cagtagtctt 11880
actctcagtt ttgcaacaac tcagagtaga atcatcatct aaattgtggg ctcaatgtgt 11940
ccagttacac aatgacattc tcttagctaa agatactact gaagcctttg aaaaaatggt 12000
ttcactactt tctgttttgc tttccatgca gggtgctgta gacataaaca agctttgtga 12060
agaaatgctg gacaacaggg caaccttaca agctatagcc tcagagttta gttcccttcc 12120
atcatatgca gcttttgcta ctgctcaaga agcttatgag caggctgttg ctaatggtga 12180
ttctgaagtt gttcttaaaa agttgaagaa gtctttgaat gtggctaaat ctgaatttga 12240
ccgtgatgca gccatgcaac gtaagttgga aaagatggct gatcaagcta tgacccaaat 12300
gtataaacag gctagatctg aggacaagag ggcaaaagtt actagtgcta tgcagacaat 12360
gcttttcact atgcttagaa agttggataa tgatgcactc aacaacatta tcaacaatgc 12420
aagagatggt tgtgttccct tgaacataat acctcttaca acagcagcca aactaatggt 12480
tgtcatacca gactataaca catataaaaa tacgtgtgat ggtacaacat ttacttatgc 12540
atcagcattg tgggaaatcc aacaggttgt agatgcagat agtaaaattg ttcaacttag 12600
tgaaattagt atggacaatt cacctaattt agcatggcct cttattgtaa cagctttaag 12660
ggccaattct gctgtcaaat tacagaataa tgagcttagt cctgttgcac tacgacagat 12720
gtcttgtgct gccggtacta cacaaactgc ttgcactgat gacaatgcgt tagcttacta 12780
caacacaaca aagggaggta ggtttgtact tgcactgtta tccgatttac aggatttgaa 12840
atgggctaga ttccctaaga gtgatggaac tggtactatc tatacagaac tggaaccacc 12900
ttgtaggttt gttacagaca cacctaaagg tcctaaagtg aagtatttat actttattaa 12960
aggattaaac aacctaaata gaggtatggt acttggtagt ttagctgcca cagtacgtct 13020
acaagctggt aatgcaacag aagtgcctgc caattcaact gtattatctt tctgtgcttt 13080
tgctgtagat gctgctaaag cttacaaaga ttatctagct agtgggggac aaccaatcac 13140
taattgtgtt aagatgttgt gtacacacac tggtactggt caggcaataa cagttacacc 13200
ggaagccaat atggatcaag aatcctttgg tggtgcatcg tgttgtctgt actgccgttg 13260
ccacatagat catccaaatc ctaaaggatt ttgtgactta aaaggtaagt atgtacaaat 13320
acctacaact tgtgctaatg accctgtggg ttttacactt aaaaacacag tctgtaccgt 13380
ctgcggtatg tggaaaggtt atggctgtag ttgtgatcaa ctccgcgaac ccatgcttca 13440
gtcagctgat gcacaatcgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca 13500
ccgtgcggca caggcactag tactgatgtc gtatacaggg cttttgacat ctacaatgat 13560
aaagtagctg gttttgctaa attcctaaaa actaattgtt gtcgcttcca agaaaaggac 13620
gaagatgaca atttaattga ttcttacttt gtagttaaga gacacacttt ctctaactac 13680
caacatgaag aaacaattta taatttactt aaggattgtc cagctgttgc taaacatgac 13740
ttctttaagt ttagaataga cggtgacatg gtaccacata tatcacgtca acgtcttact 13800
aaatacacaa tggcagacct cgtctatgct ttaaggcatt ttgatgaagg taattgtgac 13860
acattaaaag aaatacttgt cacatacaat tgttgtgatg atgattattt caataaaaag 13920
gactggtatg attttgtaga aaacccagat atattacgcg tatacgccaa cttaggtgaa 13980
cgtgtacgcc aagctttgtt aaaaacagta caattctgtg atgccatgcg aaatgctggt 14040
attgttggtg tactgacatt agataatcaa gatctcaatg gtaactggta tgatttcggt 14100
gatttcatac aaaccacgcc aggtagtgga gttcctgttg tagattctta ttattcattg 14160
ttaatgccta tattaacctt gaccagggct ttaactgcag agtcacatgt tgacactgac 14220
ttaacaaagc cttacattaa gtgggatttg ttaaaatatg acttcacgga agagaggtta 14280
aaactctttg accgttattt taaatattgg gatcagacat accacccaaa ttgtgttaac 14340
tgtttggatg acagatgcat tctgcattgt gcaaacttta atgttttatt ctctacagtg 14400
ttcccaccta caagttttgg accactagtg agaaaaatat ttgttgatgg tgttccattt 14460
gtagtttcaa ctggatacca cttcagagag ctaggtgttg tacataatca ggatgtaaac 14520
ttacatagct ctagacttag ttttaaggaa ttacttgtgt atgctgctga ccctgctatg 14580
cacgctgctt ctggtaatct attactagat aaacgcacta cgtgcttttc agtagctgca 14640
cttactaaca atgttgcttt tcaaactgtc aaacccggta attttaacaa agacttctat 14700
gactttgctg tgtctaaggg tttctttaag gaaggaagtt ctgttgaatt aaaacacttc 14760
ttctttgctc aggatggtaa tgctgctatc agcgattatg actactatcg ttataatcta 14820
ccaacaatgt gtgatatcag acaactacta tttgtagttg aagttgttga taagtacttt 14880
gattgttacg atggtggctg tattaatgct aaccaagtca tcgtcaacaa cctagacaaa 14940
tcagctggtt ttccatttaa taaatggggt aaggctagac tttattatga ttcaatgagt 15000
tatgaggatc aagatgcact tttcgcatat acaaaacgta atgtcatccc tactataact 15060
caaatgaatc ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc 15120
tctatctgta gtactatgac caatagacag tttcatcaaa aattattgaa atcaatagcc 15180
gccactagag gagctactgt agtaattgga acaagcaaat tctatggtgg ttggcacaac 15240
atgttaaaaa ctgtttatag tgatgtagaa aaccctcacc ttatgggttg ggattatcct 15300
aaatgtgata gagccatgcc taacatgctt agaattatgg cctcacttgt tcttgctcgc 15360
aaacatacaa cgtgttgtag cttgtcacac cgtttctata gattagctaa tgagtgtgct 15420
caagtattga gtgaaatggt catgtgtggc ggttcactat atgttaaacc aggtggaacc 15480
tcatcaggag atgccacaac tgcttatgct aatagtgttt ttaacatttg tcaagctgtc 15540
acggccaatg ttaatgcact tttatctact gatggtaaca aaattgccga taagtatgtc 15600
cgcaatttac aacacagact ttatgagtgt ctctatagaa atagagatgt tgacacagac 15660
tttgtgaatg agttttacgc atatttgcgt aaacatttct caatgatgat actctctgac 15720
gatgctgttg tgtgtttcaa tagcacttat gcatctcaag gtctagtggc tagcataaag 15780
aactttaagt cagttcttta ttatcaaaac aatgttttta tgtctgaagc aaaatgttgg 15840
actgagactg accttactaa aggacctcat gaattttgct ctcaacatac aatgctagtt 15900
aaacagggtg atgattatgt gtaccttcct tacccagatc catcaagaat cctaggggcc 15960
ggctgttttg tagatgatat cgtaaaaaca gatggtacac ttatgattga acggttcgtg 16020
tctttagcta tagatgctta cccacttact aaacatccta atcaggagta tgctgatgtc 16080
tttcatttgt acttacaata cataagaaag ctacatgatg agttaacagg acacatgtta 16140
gacatgtatt ctgttatgct tactaatgat aacacttcaa ggtattggga acctgagttt 16200
tatgaggcta tgtacacacc gcatacagtc ttacaggctg ttggggcttg tgttctttgc 16260
aattcacaga cttcattaag atgtggtgct tgcatacgta gaccattctt atgttgtaaa 16320
tgctgttacg accatgtcat atcaacatca cataaattag tcttgtctgt taatccgtat 16380
gtttgcagtg ctccaggttg tgatgtcaca gatgtgactc aactttactt aggaggtatg 16440
agctattatt gtaaatcaca taaaccaccc attagttttc cattgtgtgc taatggacaa 16500
gtttttggtt tatataaaaa tacatgtgtt ggtagcgata atgttactga ctttaatgca 16560
attgcaacat gtgactggac aaatgctggt gattacattt tagctaacac ctgtactgaa 16620
agactcaagc tttttgcagc agaaacgctc aaagctactg aggagacatt taaactgtct 16680
tatggtattg ctactgtacg tgaagtgctg tctgacagag aattacatct ttcatgggaa 16740
gttggtaaac ctagaccacc acttaaccga aattatgtct ttactggtta tcgtgtaact 16800
aaaaacagta aagtacaaat aggagagtac acctttgaaa aaggtgacta tggtgatgct 16860
gttgtttacc gaggtacaac aacttacaaa ttaaatgttg gtgattattt tgtgctgaca 16920
tcacatacag taatgccatt aagtgcacct acactagtgc cacaagagca ctatgttaga 16980
attactggct tatacccaac actcaatatc tcagatgagt tttctagcaa tgttgcaaat 17040
tatcaaaagg ttggtatgca aaagtattct acactccagg gaccacctgg tactggtaag 17100
agtcattttg ctattggcct agctctctac tacccttctg ctcgcatagt gtatacagct 17160
tgctctcatg ccgctgttga tgcactatgt gagaaggcat taaaatattt gcctatagat 17220
aaatgtagta gaattatacc tgcacgtgct cgtgtagagt gttttgataa attcaaagtg 17280
aattcaacat tagaacagta tgtcttttgt actgtaaatg cattgcctga gacgacagca 17340
gatatagttg tctttgatga aatttcaatg gccacaaatt atgatttgag tgttgtcaat 17400
gccagattac gtgctaagca ctatgtgtac attggcgacc ctgctcaatt acctgcacca 17460
cgcacattgc taactaaggg cacactagaa ccagaatatt tcaattcagt gtgtagactt 17520
atgaaaacta taggtccaga catgttcctc ggaacttgtc ggcgttgtcc tgctgaaatt 17580
gttgacactg tgagtgcttt ggtttatgat aataagctta aagcacataa agacaaatca 17640
gctcaatgct ttaaaatgtt ttataagggt gttatcacgc atgatgtttc atctgcaatt 17700
aacaggccac aaataggcgt ggtaagagaa ttccttacac gtaaccctgc ttggagaaaa 17760
gctgtcttta tttcacctta taattcacag aatgctgtag cctcaaagat tttgggacta 17820
ccaactcaaa ctgttgattc atcacagggc tcagaatatg actatgtcat attcactcaa 17880
accactgaaa cagctcactc ttgtaatgta aacagattta atgttgctat taccagagca 17940
aaagtaggca tactttgcat aatgtctgat agagaccttt atgacaagtt gcaatttaca 18000
agtcttgaaa ttccacgtag gaatgtggca actttacaag ctgaaaatgt aacaggactt 18060
tttaaagatt gtagtaaggt aatcactggg ttacatccta cacaggcacc tacacacctc 18120
agtgttgaca ctaaattcaa aactgaaggt ttatgtgttg acatacctgg catacctaag 18180
gacatgacct atagaagact catctctatg atgggtttta aaatgaatta tcaagttaat 18240
ggttacccta acatgtttat cacccgcgaa gaagctataa gacatgtacg tgcatggatt 18300
ggcttcgatg tcgaggggtg tcatgctact agagaagctg ttggtaccaa tttaccttta 18360
cagctaggtt tttctacagg tgttaaccta gttgctgtac ctacaggtta tgttgataca 18420
cctaataata cagatttttc cagagttagt gctaaaccac cgcctggaga tcaatttaaa 18480
cacctcatac cacttatgta caaaggactt ccttggaatg tagtgcgtat aaagattgta 18540
caaatgttaa gtgacacact taaaaatctc tctgacagag tcgtatttgt cttatgggca 18600
catggctttg agttgacatc tatgaagtat tttgtgaaaa taggacctga gcgcacctgt 18660
tgtctatgtg atagacgtgc cacatgcttt tccactgctt cagacactta tgcctgttgg 18720
catcattcta ttggatttga ttacgtctat aatccgttta tgattgatgt tcaacaatgg 18780
ggttttacag gtaacctaca aagcaaccat gatctgtatt gtcaagtcca tggtaatgca 18840
catgtagcta gttgtgatgc aatcatgact aggtgtctag ctgtccacga gtgctttgtt 18900
aagcgtgttg actggactat tgaatatcct ataattggtg atgaactgaa gattaatgcg 18960
gcttgtagaa aggttcaaca catggttgtt aaagctgcat tattagcaga caaattccca 19020
gttcttcacg acattggtaa ccctaaagct attaagtgtg tacctcaagc tgatgtagaa 19080
tggaagttct atgatgcaca gccttgtagt gacaaagctt ataaaataga agaattattc 19140
tattcttatg ccacacattc tgacaaattc acagatggtg tatgcctatt ttggaattgc 19200
aatgtcgata gatatcctgc taattccatt gtttgtagat ttgacactag agtgctatct 19260
aaccttaact tgcctggttg tgatggtggc agtttgtatg taaataaaca tgcattccac 19320
acaccagctt ttgataaaag tgcttttgtt aatttaaaac aattaccatt tttctattac 19380
tctgacagtc catgtgagtc tcatggaaaa caagtagtgt cagatataga ttatgtacca 19440
ctaaagtctg ctacgtgtat aacacgttgc aatttaggtg gtgctgtctg tagacatcat 19500
gctaatgagt acagattgta tctcgatgct tataacatga tgatctcagc tggctttagc 19560
ttgtgggttt acaaacaatt tgatacttat aacctctgga acacttttac aagacttcag 19620
agtttagaaa atgtggcttt taatgttgta aataagggac actttgatgg acaacagggt 19680
gaagtaccag tttctatcat taataacact gtttacacaa aagttgatgg tgttgatgta 19740
gaattgtttg aaaataaaac aacattacct gttaatgtag catttgagct ttgggctaag 19800
cgcaacatta aaccagtacc agaggtgaaa atactcaata atttgggtgt ggacattgct 19860
gctaatactg tgatctggga ctacaaaaga gatgctccag cacatatatc tactattggt 19920
gtttgttcta tgactgacat agccaagaaa ccaactgaaa cgatttgtgc accactcact 19980
gtcttttttg atggtagagt tgatggtcaa gtagacttat ttagaaatgc ccgtaatggt 20040
gttcttatta cagaaggtag tgttaaaggt ttacaaccat ctgtaggtcc caaacaagct 20100
agtcttaatg gagtcacatt aattggagaa gccgtaaaaa cacagttcaa ttattataag 20160
aaagttgatg gtgttgtcca acaattacct gaaacttact ttactcagag tagaaattta 20220
caagaattta aacccaggag tcaaatggaa attgatttct tagaattagc tatggatgaa 20280
ttcattgaac ggtataaatt agaaggctat gccttcgaac atatcgttta tggagatttt 20340
agtcatagtc agttaggtgg tttacatcta ctgattggac tagctaaacg ttttaaggaa 20400
tcaccttttg aattagaaga ttttattcct atggacagta cagttaaaaa ctatttcata 20460
acagatgcgc aaacaggttc atctaagtgt gtgtgttctg ttattgattt attacttgat 20520
gattttgttg aaataataaa atcccaagat ttatctgtag tttctaaggt tgtcaaagtg 20580
actattgact atacagaaat ttcatttatg ctttggtgta aagatggcca tgtagaaaca 20640
ttttacccaa aattacaatc tagtcaagcg tggcaaccgg gtgttgctat gcctaatctt 20700
tacaaaatgc aaagaatgct attagaaaag tgtgaccttc aaaattatgg tgatagtgca 20760
acattaccta aaggcataat gatgaatgtc gcaaaatata ctcaactgtg tcaatattta 20820
aacacattaa cattagctgt accctataat atgagagtta tacattttgg tgctggttct 20880
gataaaggag ttgcaccagg tacagctgtt ttaagacagt ggttgcctac gggtacgctg 20940
cttgtcgatt cagatcttaa tgactttgtc tctgatgcag attcaacttt gattggtgat 21000
tgtgcaactg tacatacagc taataaatgg gatctcatta ttagtgatat gtacgaccct 21060
aagactaaaa atgttacaaa agaaaatgac tctaaagagg gttttttcac ttacatttgt 21120
gggtttatac aacaaaagct agctcttgga ggttccgtgg ctataaagat aacagaacat 21180
tcttggaatg ctgatcttta taagctcatg ggacacttcg catggtggac agcctttgtt 21240
actaatgtga atgcgtcatc atctgaagca tttttaattg gatgtaatta tcttggcaaa 21300
ccacgcgaac aaatagatgg ttatgtcatg catgcaaatt acatattttg gaggaataca 21360
aatccaattc agttgtcttc ctattcttta tttgacatga gtaaatttcc ccttaaatta 21420
aggggtactg ctgttatgtc tttaaaagaa ggtcaaatca atgatatgat tttatctctt 21480
cttagtaaag gtagacttat aattagagaa aacaacagag ttgttatttc tagtgatgtt 21540
cttgttaaca actaaacgaa caatgtttgt ttttcttgtt ttattgccac tagtctctag 21600
tcagtgtgtt aatcttataa ccagaactca atcatacact aattctttca cacgtggtgt 21660
ttattaccct gacaaagttt tcagatcctc agttttacat tcaactcagg acttgttctt 21720
acctttcttt tccaatgtta cttggttcca tgctatctct gggaccaatg gtactaagag 21780
gtttgataac cctgtcctac catttaatga tggtgtttat tttgcttcca ctgagaagtc 21840
taacataata agaggctgga tttttggtac tactttagat tcgaagaccc agtccctact 21900
tattgttaat aacgctacta atgttgttat taaagtctgt gaatttcaat tttgtaatga 21960
tccatttttg gatgtttatt accacaaaaa caacaaaagt tggatggaaa gtgagttcag 22020
agtttattct agtgcgaata attgcacttt tgaatatgtc tctcagcctt ttcttatgga 22080
ccttgaagga aaacagggta atttcaaaaa tcttagggaa tttgtgttta agaatattga 22140
tggttatttt aaaatatatt ctaagcacac gcctattaat ttagggcgtg atctccctca 22200
gggtttttcg gctttagaac cattggtaga tttgccaata ggtattaaca tcactaggtt 22260
tcaaacttta cttgctttac atagaagtta tttgactcct ggtgattctt cttcaggttg 22320
gacagctggt gctgcagctt attatgtggg ttatcttcaa cctaggactt ttctattaaa 22380
atataatgaa aatggaacca ttacagatgc tgtagactgt gcacttgacc ctctctcaga 22440
aacaaagtgt acgttgaaat ccttcactgt agaaaaagga atctatcaaa cttctaactt 22500
tagagtccaa ccaacagaat ctattgttag atttcctaat attacaaact tgtgcccttt 22560
tgatgaagtt tttaacgcca ccagatttgc atctgtttat gcttggaaca ggaagagaat 22620
cagcaactgt gttgctgatt attctgtcct atataatttc gcaccatttt tcgcttttaa 22680
gtgttatgga gtgtctccta ctaaattaaa tgatctctgc tttactaatg tctatgcaga 22740
ttcatttgta attagaggta atgaagtcag ccaaatcgct ccagggcaaa ctggaaatat 22800
tgctgattat aattataaat taccagatga ttttacaggc tgcgttatag cttggaattc 22860
taacaagctt gattctaagg ttggtggtaa ttataattac cggtatagat tgtttaggaa 22920
gtctaatctc aaaccttttg agagagatat ttcaactgaa atctatcagg ccggtaacaa 22980
accttgtaat ggtgttgcag gtgttaattg ttactttcct ttacaatcat atggtttccg 23040
acccacttat ggtgttggtc accaaccata cagagtagta gtactttctt ttgaacttct 23100
acatgcacca gcaactgttt gtggacctaa aaagtctact aatttggtta aaaacaaatg 23160
tgtcaatttc aacttcaatg gtttaacagg cacaggtgtt cttactgagt ctaacaaaaa 23220
gtttctgcct ttccaacaat ttggcagaga cattgctgac actactgatg ctgtccgtga 23280
tccacagaca cttgagattc ttgacattac accatgttct tttggtggtg tcagtgttat 23340
aacaccagga acaaatactt ctaaccaggt tgctgttctt tatcagggtg ttaactgcac 23400
agaagtccct gttgctattc atgcagatca acttactcct acttggcgtg tttattctac 23460
aggttctaat gtttttcaaa cacgtgcagg ctgtttaata ggggctgaat atgtcaacaa 23520
ctcatatgag tgtgacatac ccattggtgc aggtatatgc gctagttatc agactcagca 23580
atccatcatt gcctacacta tgtcacttgg tgcagaaaat tcagttgctt actctaataa 23640
ctctattgcc atacccacaa attttactat tagtgttacc acagaaattc taccagtgtc 23700
tatgaccaag acatcagtag attgtacaat gtacatttgt ggtgattcaa ctgaatgcag 23760
caatcttttg ttgcaatatg gcagtttttg tacacaatta aaacgtgctt taactggaat 23820
agctgttgaa caagacaaaa acacccaaga agtttttgca caagtcaaac aaatttacaa 23880
aacaccacca attaaatatt ttggtggttt taatttttca caaatattac cagatccatc 23940
aaaaccaagc aagaggtcat ttattgaaga tctacttttc aacaaagtga cacttgcaga 24000
tgctggcttc atcaaacaat atggtgattg ccttggtgat attgctgcta gagacctcat 24060
ttgcgctcaa aaatttaacg gacttacagt tttaccacct ttacttactg acgaaatgat 24120
tgcgcaatat acatccgcat tgttagccgg aactattaca tccggatgga cttttggcgc 24180
aggcgcagca ttacagattc cattcgctat gcaaatggct tataggttta acggtatagg 24240
cgttacgcaa aacgtacttt atgagaatca aaaacttatc gctaaccaat ttaattccgc 24300
tatcggtaag attcaggatt cattgtctag tactgctagt gcactcggta agttgcaaga 24360
cgtagtgaat caaaacgctc aagcacttaa tacactcgtt aaacagctta gttctaattt 24420
tggcgcaatt tctagtgtgc ttaacgatat actatctaga ctcgataaag tcgaagccga 24480
agtgcaaatc gatagattga ttaccggtag gttgcaatca ttgcaaacat acgttacaca 24540
gcaattgatt agggccgcag agatacgcgc tagcgctaat ctcgcagcta ctaaaatgtc 24600
tgaatgcgta ctcggacaat ctaaacgtgt cgatttttgc ggtaagggat atcatcttat 24660
gtcttttcca caatctgcac ctcacggagt cgtgttttta cacgttactt atgtgccagc 24720
tcaagagaaa aattttacaa ccgctcctgc tatttgtcat gacggtaagg cacattttcc 24780
tagagagggc gtattcgttt ctaacggtac acattggttc gttacacaac gtaattttta 24840
cgaacctcaa attattacta ctgataatac attcgtatca ggtaattgtg acgtagtgat 24900
aggtatcgtt aataatacag tttacgatcc acttcaacct gaactcgata gttttaaaga 24960
ggaactcgat aagtatttta aaaatcatac atcacctgac gtcgacttag gcgatatttc 25020
aggtattaac gctagtgtcg ttaacattca aaaagagatt gatagactta acgaagtcgc 25080
taaaaatctt aacgaatcac ttatcgatct gcaagagtta ggtaagtatg agcaatatat 25140
taaatggcct tggtatattt ggttaggctt tatagccgga ttgatcgcaa tcgttatggt 25200
tacaattatg ttatgttgta tgacatcatg ttgttcatgt cttaagggat gttgttcatg 25260
cggatcatgt tgtaaatttg acgaagacga ttccgaacca gtgcttaaag gcgttaagtt 25320
acattataca taaacgaact tatggatttg tttatgagaa tcttcacaat tggaactgta 25380
actttgaagc aaggtgaaat caaggatgct actccttcag attttgttcg cgctactgca 25440
acgataccga tacaagcctc actccctttc ggatggctta ttgttggcgt tgcacttctt 25500
gctgtttttc agagcgcttc caaaatcata accctcaaaa agagatggca actagcactc 25560
tccaagggtg ttcactttgt ttgcaacttg ctgttgttgt ttgtaacagt ttactcacac 25620
cttttgctcg ttgctgctgg ccttgaagcc ccttttctct atctttatgc tttagtctac 25680
ttcttgcaga gtataaactt tgtaagaata ataatgaggc tttggctttg ctggaaatgc 25740
cgttccaaaa acccattact ttatgatgcc aactattttc tttgctggca tactaattgt 25800
tacgactatt gtatacctta caatagtgta acttcttcaa ttgtcattac ttcaggtgat 25860
ggcacaacaa gtcctatttc tgaacatgac taccagattg gtggttatac tgaaaaatgg 25920
gaatctggag taaaagactg tgttgtatta cacagttact tcacttcaga ctattaccag 25980
ctgtactcaa ctcaattgag tacagacact ggtgttgaac atgttacctt cttcatctac 26040
aataaaattg ttgatgagcc tgaagaacat gtccaaattc acacaatcga cggttcatcc 26100
ggagttgtta atccagtaat ggaaccaatt tatgatgaac cgacgacgac tactagcgtg 26160
cctttgtaag cacaagctga tgagtacgaa cttatgtact cattcggttc ggaagagaca 26220
ggtacgttaa tagttaatag cgtacttctt tttcttgctt tcgtggtatt cttgctagtt 26280
acactagcca tccttactgc gcttcgattg tgtgcgtact gctgcaatat tgttaacgtg 26340
agtcttgtaa aaccttcttt ttacgtttac tctcgtgtta aaaatctgaa ttcttctaga 26400
gttcctgatc ttctggtcta aacgaactaa atattatatt agtttttctg tttggaactt 26460
taattttagc catggcagat tccaacggta ctattaccgt tgaagagctt aaaaagctcc 26520
ttgaacaatg gaacctagta ataggtttcc tattccttac atggatttgt cttctacaat 26580
ttgcctatgc caacaggaat aggtttttgt atataattaa gttaattttc ctctggctgt 26640
tatggccagt aactttagct tgttttgtgc ttgctgctgt ttacagaata aattggatca 26700
ccggtggaat tgctatcgca atggcttgtc ttgtaggctt gatgtggctc agctacttca 26760
ttgcttcttt cagactgttt gcgcgtacgc gttccatgtg gtcattcaat ccagaaacta 26820
acattcttct caacgtgcca ctccatggca ctattctgac cagaccgctt ctagaaagtg 26880
aactcgtaat cggagctgtg atccttcgtg gacatcttcg tattgctgga caccatctag 26940
gacgctgtga catcaaggac ctgcctaaag aaatcactgt tgctacatca cgaacgcttt 27000
cttattacaa attgggagct tcgcagcgtg tagcaggtga ctcaggtttt gctgcataca 27060
gtcgctacag gattggcaac tataaattaa acacagacca ttccagtagc agtgacaata 27120
ttgctttgct tgtacagtaa gtgacaacag atgtttcatc tcgttgactt tcaggttact 27180
atagcagaga tattactaat tattatgagg acttttaaag tttccatttg gaatcttgat 27240
tacatcataa acctcataat taaaaattta tctaagtcac taactgagaa taaatattct 27300
caattagatg aagagcaacc aatggagatt gattaaacga acatgaaaat tattcttttc 27360
ttggcactga taacactcgc tacttgtgag ctttatcact accaagagtg tgttagaggt 27420
acaacagtac ttttaaaaga accttgctct tctggaacat acgagggcaa ttcaccattt 27480
catcctctag ctgataacaa atttgcactg acttgcttta gcactcaatt tgcttttgct 27540
tgtcctgacg gcgtaaaaca cgtctatcag ttacgtgcca gatcagtttc acctaaactg 27600
ttcatcagac aagaggaagt tcaagaactt tactctccaa tttttcttat tgttgcggca 27660
atagtgttta taacactttg cttcacactc aaaagaaaga cagaatgatt gaactttcat 27720
taattgactt ctatttgtgc tttttagcct ttctgctatt ccttgtttta attatgctta 27780
ttatcttttg gttctcactt gaactgcaag atcataatga aacttgtcac gcctaaacga 27840
acatgaaatt tcttgttttc ttaggaatca tcacaactgt agctgcattt caccaagaat 27900
gtagtttaca gtcatgtact caacatcaac catatgtagt tgatgacccg tgtcctattc 27960
acttctattc taaatggtat attagagtag gagctagaaa atcagcacct ttaattgaat 28020
tgtgcgtgga tgaggctggt tctaaatcac ccattcagta catcgatatc ggtaattata 28080
cagtttcctg ttcacctttt acaattaatt gccaggaacc taaattgggt agtcttgtag 28140
tgcgttgttc gttctatgaa gactttttag agtatcatga cgttcgtgtt gttttagatt 28200
tcatctaaac gaacaaacta aaatgtctga taatggaccc caaaatcagc gaaatgcacc 28260
ccgcattacg tttggtggac cctcagattc aactggcagt aaccagaatg gagaacgcag 28320
tggggcgcga tcaaaacaac gtcggcccca aggtttaccc aataatactg cgtcttggtt 28380
caccgctctc actcaacatg gcaaggaaga ccttaaattc cctcgaggac aaggcgttcc 28440
aattaacacc aatagcagtc cagatgacca aattggctac taccgaagag ctaccagacg 28500
aattcgtggt ggtgacggta aaatgaaaga tctcagtcca agatggtatt tctactacct 28560
aggaactggg ccagaagctg gacttcccta tggtgctaac aaagacggca tcatatgggt 28620
tgcaactgag ggagccttga atacaccaaa agatcacatt ggcacccgca atcctgctaa 28680
caatgctgca atcgtgctac aacttcctca aggaacaaca ttgccaaaag gcttctacgc 28740
agaagggagc agaggcggca gtcaagcctc ttctcgttcc tcatcacgta gtcgcaacag 28800
ttcaagaaat tcaactccag gcagcagtag gggaacttct cctgctagaa tggctggcaa 28860
tggcggtgat gctgctcttg ctttgctgct gcttgacaga ttgaaccagc ttgagagcaa 28920
aatgtctggt aaaggccaac aacaacaagg ccaaactgtc actaagaaat ctgctgctga 28980
ggcttctaag aagcctcggc aaaaacgtac tgccactaaa gcatacaatg taacacaagc 29040
tttcggcaga cgtggtccag aacaaaccca aggaaatttt ggggaccagg aactaatcag 29100
acaaggaact gattacaaac attggccgca aattgcacaa tttgccccca gcgcttcagc 29160
gttcttcgga atgtcgcgca ttggcatgga agtcacacct tcgggaacgt ggttgaccta 29220
cacaggtgcc atcaaattgg atgacaaaga tccaaatttc aaagatcaag tcattttgct 29280
gaataagcat attgacgcat acaaaacatt cccaccaaca gagcctaaaa aggacaaaaa 29340
gaagaaggct gatgaaactc aagccttacc gcagagacag aagaaacagc aaactgtgac 29400
tcttcttcct gctgcagatt tggatgattt ctccaaacaa ttgcaacaat ccatgagcag 29460
tgctgactca actcaggcct aaactcatgc agaccacaca aggcagatgg gctatataaa 29520
cgttttcgct tttccgttta cgatatatag tctactcttg tgcagaatga attctcgtaa 29580
ctacatagca caagtagatg tagttaactt taatctcaca tagcaatctt taatcagtgt 29640
gtaacattag ggaggacttg aaagagccac cacattttca ccgaggccac gcggagtacg 29700
atcgagtgta cagtgaacaa tgctagggag agctgcctat atggaagagc cctaatgtgt 29760
aaaattaatt ttagtagtgc tatccccatg tgattttaat agcttcttag gagaatgac 29819
<210> 13
<211> 12
<212> PRT
<213> Artificial
<220>
<223> Synthetic construct
<400> 13
Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala Ser
1 5 10
<210> 14
<211> 36
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 14
actaattctc ctcggcgggc acgtagtgta gctagt 36
<210> 15
<211> 48
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 15
gataatacga ctcactatag attaaaggtt tataccttcc caggtaac 48
<210> 16
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 16
gatgccaaaa taatggcgat ctc 23
<210> 17
<211> 22
<212> DNA
<213> Artificial
<220>
<223> Synthetic Construct
<400> 17
gttggttgcc ataacaagtg tg 22
<210> 18
<211> 27
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 18
ctaattgagg ttgaacctca acaattg 27
<210> 19
<211> 28
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 19
gagtatggta ctgaagatga ttaccaag 28
<210> 20
<211> 24
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 20
ctaggtggaa tgtggtagga ttac 24
<210> 21
<211> 29
<212> DNA
<213> Artificial
<220>
<223> Synthetic Construct
<400> 21
gctgttacag cgtataatgg ttatcttac 29
<210> 22
<211> 29
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 22
gctggtttaa gtataatgtc tcctacaac 29
<210> 23
<211> 28
<212> DNA
<213> Artificial
<220>
<223> Synthetic Construct
<400> 23
gcacaaaacc agttgaaaca tcaaattc 28
<210> 24
<211> 28
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 24
gcaactagtg ttttgagttt ttccattg 28
<210> 25
<211> 25
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 25
gtgaagaatc atctgcaaaa tcagc 25
<210> 26
<211> 32
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 26
caaatgatat aagcaattgt tatccagaaa gg 32
<210> 27
<211> 35
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 27
gcctttaata ctttactatt ccttatgtca ttcac 35
<210> 28
<211> 27
<212> DNA
<213> Artificial
<220>
<223> Synthetic Construct
<400> 28
ccagacaaac tagtatcaac catatcc 27
<210> 29
<211> 25
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 29
gctatgggta ttattgctat gtctg 25
<210> 30
<211> 21
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 30
cctacaaggt ggttccagtt c 21
<210> 31
<211> 19
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 31
cgacagatgt cttgtgctg 19
<210> 32
<211> 25
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 32
ggtatccagt tgaaactaca aatgg 25
<210> 33
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 33
gatcagacat accacccaaa ttg 23
<210> 34
<211> 34
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 34
cttatgtatt gtaagtacaa atgaaagaca tcag 34
<210> 35
<211> 27
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 35
ggtgatgatt atgtgtacct tccttac 27
<210> 36
<211> 27
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 36
ctgttaattg cagatgaaac atcatgc 27
<210> 37
<211> 29
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 37
gtgtgtagac ttatgaaaac tataggtcc 29
<210> 38
<211> 21
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 38
catacaaact gccaccatca c 21
<210> 39
<211> 31
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 39
ccttgtagtg acaaagctta taaaatagaa g 31
<210> 40
<211> 21
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 40
ctggtgcaac tcctttatca g 21
<210> 41
<211> 28
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 41
gcaaagaatg ctattagaaa agtgtgac 28
<210> 42
<211> 32
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 42
gatagattcc tttttctaca gtgaaggatt tc 32
<210> 43
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 43
gactcctggt gattcttctt cag 23
<210> 44
<211> 23
<212> DNA
<213> Artificial
<220>
<223> Synthetic Construct
<400> 44
ctctagcagc aatatcacca agg 23
<210> 45
<211> 28
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 45
gcacaagtca aacaaattta caaaacac 28
<210> 46
<211> 28
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 46
caaaaggtgt gagtaaactg ttacaaac 28
<210> 47
<211> 19
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 47
ctcactccct ttcggatgg 19
<210> 48
<211> 32
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 48
gaggtttatg atgtaatcaa gattccaaat gg 32
<210> 49
<211> 29
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 49
gctacaggat tggcaactat aaattaaac 29
<210> 50
<211> 22
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 50
ccattctagc aggagaagtt cc 22
<210> 51
<211> 21
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 51
gcaatcctgc taacaatgct g 21
<210> 52
<211> 53
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 52
tttttttttt tttttttttt tttttgtcat tctcctaaga agctattaaa atc 53
<210> 53
<211> 55
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 53
gaataatacg actcactata gggacgttcg tgttgtttta gatttcatct aaacg 55
<210> 54
<211> 55
<212> DNA
<213> Artificial
<220>
<223> Synthetic construct
<400> 54
tttttttttt tttttttttt tgtcattctc ctaagaagct attaaaatca catgg 55
Claims (33)
- 모 SARS-CoV-2 변이체(parent SARS-CoV-2 variant)의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편을 코딩하는 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드로서,
상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 재코딩된(recoded) 것이고,
상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편의 아미노산 서열은 동일하게 유지되거나, 또는
상기 폴리뉴클레오티드에 의해 코딩된 모 SARS-CoV-2 변이체의 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편의 아미노산 서열은 최대 20개의 아미노산 치환, 첨가 또는 결실을 포함하고,
상기 하나 이상의 바이러스 단백질 또는 그의 하나 이상의 단편은 스파이크 단백질 또는 그의 단편을 포함하는 것인 폴리뉴클레오티드. - 청구항 1에 있어서,
상기 모 SARS-CoV-2 변이체는 서열번호 1을 포함하거나, 또는
상기 모 SARS-CoV-2 변이체는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1을 포함하거나, 또는
상기 모 SARS-CoV-2 변이체는 서열번호 1을 포함하고, 서열번호 1에 하나 이상의 돌연변이가 있고; 및
서열번호 1, 또는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 하나 이상의 돌연변이가 있는 것인 서열번호 1의 스파이크 단백질 코딩 서열은 SARS-CoV-2 변이체로부터의 재코딩된 스파이크 단백질 코딩 서열로 대체된 것인 폴리뉴클레오티드. - 청구항 1에 있어서, 상기 SARS-CoV-2 변이체는 영국 변이체, 남아프리카 변이체, 브라질 변이체, 델타 변이체, 및 오미크론 변이체로 구성된 군으로부터 선택되는 것인 폴리뉴클레오티드.
- 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 코돈-쌍 편향(CPB)을 감소시키거나 코돈 사용빈도 편향(codon usage bias)을 감소시키는 것에 의해 재코딩된 것인 폴리뉴클레오티드.
- 청구항 1 내지 3 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드와 비교하여 CpG 또는 UpA 디뉴클레오티드의 수를 증가시키는 것에 의해 재코딩된 것인 폴리뉴클레오티드.
- 전술된 항 중 어느 한 항에 있어서, 각각의 재코딩된 하나 이상의 바이러스 단백질 또는 각각의 재코딩된 그의 하나 이상의 단편은 -0.05 미만, -0.1 미만, -0.2 미만, -0.3 미만, 또는 -0.4 미만의 코돈-쌍 편향을 갖는 것인 폴리뉴클레오티드.
- 전술된 항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드에 비해 CPB 탈최적화된(deoptimized) 것인 폴리뉴클레오티드.
- 전술된 항 중 어느 한 항에 있어서, 상기 폴리뉴클레오티드는 그의 모 SARS-CoV-2 변이체 폴리뉴클레오티드에 비해 코돈-탈최적화된 것인 폴리뉴클레오티드.
- 청구항 7 내지 8 중 어느 한 항에 있어서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 인간에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것인 폴리뉴클레오티드.
- 청구항 7 내지 8 중 어느 한 항에 있어서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 코로나바이러스에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것인 폴리뉴클레오티드.
- 청구항 7 내지 8 중 어느 한 항에 있어서, 상기 코돈-탈최적화 또는 CPB 탈최적화는 야생형 SARS-CoV-2 코로나바이러스에서 빈번하게 사용되는 코돈 또는 CPB에 근거한 것인 폴리뉴클레오티드.
- 전술된 항 중 어느 한 항에 있어서, 푸린 절단 부위가 제거된 것인 폴리뉴클레오티드.
- 청구항 1 내지 12 중 어느 한 항의 폴리뉴클레오티드를 포함하는 벡터.
- 청구항 1 내지 12 중 어느 한 항의 폴리뉴클레오티드, 또는 청구항 13의 벡터를 포함하는 세포.
- 청구항 14에 있어서, 상기 세포는 Vero 세포 또는 BHK(baby hamster kidney) 세포인 것인 세포.
- 청구항 1 내지 12 중 어느 한 항의 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드.
- 청구항 1 내지 12 중 어느 한 항의 폴리뉴클레오티드를 포함하는, 변형된 SARS-CoV-2 변이체.
- 청구항 1 내지 12 중 어느 한 항의 폴리뉴클레오티드에 의해 코딩된 폴리펩티드를 포함하는, 변형된 SARS-CoV-2 변이체.
- 청구항 17 내지 19 중 어느 한 항에 있어서, 하나 이상의 바이러스 단백질의 발현이 모 SARS-CoV-2 변이체에 비해 감소된 것인 변형된 SARS-CoV-2 변이체.
- 청구항 17 내지 19 중 어느 한 항에 있어서, 하나 이상의 바이러스 단백질의 발현 감소는 스파이크 단백질 또는 그의 단편을 재코딩한 결과에 의한 것인 변형된 SARS-CoV-2 변이체.
- 청구항 17 내지 20 중 어느 한 항의 하나 이상의 변형된 SARS-CoV-2 변이체를 포함하는, 대상체에서 면역 반응을 유도하기 위한 면역 조성물 또는 백신 조성물.
- 청구항 21에 있어서, 변형된 SARS-CoV-2 코로나바이러스를 추가로 포함하고, 상기 변형된 SARS-CoV-2 코로나바이러스는
서열번호 1, 또는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드로서, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드는 상기 변형된 SARS-CoV-2 변이체의 폴리뉴클레오티드와 동일하지 않은 것인 폴리뉴클레오티드, 또는
서열번호 1, 또는 nt 9469는 A에서 G로 변경되고 nt 26222는 T에서 G로 변경된 것인 서열번호 1, 또는 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드로서, 상기 최대 20개의 돌연변이를 갖는 서열번호 1을 갖는 폴리뉴클레오티드에 의해 코딩된 폴리펩티드는 상기 변형된 SARS-CoV-2 변이체의 폴리펩티드와 동일하지 않은 것인 폴리펩티드를 포함하고,
상기 면역 조성물 또는 백신 조성물은 다기 면역 조성물 또는 다가 백신 조성물인 것인 면역 조성물 또는 백신 조성물. - 청구항 21 또는 청구항 22에 있어서, 약학적으로 허용되는 담체 또는 부형제를 추가로 포함하는 것인 면역 조성물 또는 백신 조성물.
- 대상체에서 면역 반응을 유도하는 방법으로서,
청구항 17 내지 20 중 어느 한 항의 변형된 SARS-CoV-2 변이체, 또는
청구항 21 내지 23 중 어느 한 항의 면역 조성물 또는 백신 조성물의 용량을 상기 대상체에게 투여하는 단계를 포함하는 것인 방법. - 대상체에서 면역 반응을 유도하는 방법으로서,
청구항 17 내지 20 중 어느 한 항의 변형된 SARS-CoV-2 코로나바이러스, 또는 청구항 21 내지 23 중 어느 한 항의 면역 조성물 또는 백신 조성물의 프라임 용량(prime dose)을 투여하는 단계, 및
청구항 17 내지 20 중 어느 한 항의 변형된 SARS-CoV-2 코로나바이러스, 또는 청구항 21 내지 23 중 어느 한 항의 면역 조성물 또는 백신 조성물의 1회 이상의 부스트 용량(boost dose)을 투여하는 단계를 포함하는 것인 방법. - 청구항 24 내지 25 중 어느 한 항에 있어서, 상기 면역 반응은 보호 면역 반응인 것인 방법.
- 청구항 24 내지 26 중 어느 한 항에 있어서, 상기 용량은 예방적 유효량 또는 치료적 유효량인 것인 방법.
- 청구항 24 내지 27 중 어느 한 항에 있어서, 투여가 비강 경로를 통해 이루어지는 것인 방법.
- 청구항 24 내지 27 중 어느 한 항에 있어서, 투여가 점비(nasal drop)를 통해 이루어지는 것인 방법.
- 청구항 24 내지 27 중 어느 한 항에 있어서, 투여가 비강 스프레이를 통해 이루어지는 것인 방법
- 청구항 24 내지 30 중 어느 한 항에 있어서, 상기 용량은 약 104-106 PFU이거나, 상기 프라임 용량은 약 104-106 PFU이고, 상기 1회 이상의 부스트 용량은 약 104-106 PFU인 것인 방법.
- 탈최적화된 SARS-CoV-2 변이체를 제조하는 방법으로서,
모 SARS-CoV-2 변이체의 하나 이상의 단백질 또는 그의 하나 이상의 단편을 코딩하는 뉴클레오티드 서열을 수득하는 단계;
상기 하나 이상의 단백질 또는 상기 그의 하나 이상의 단편의 단백질 발현을 감소시키기 위해 뉴클레오티드 서열을 재코딩하는 단계; 및
재코딩된 뉴클레오티드 서열을 갖는 핵산을 모 SARS-CoV-2 변이체 게놈 내로 치환하여 탈최적화된 SARS-CoV-2 변이체 게놈을 제조하는 단계를 포함하고,
상기 재코딩된 뉴클레오티드 서열의 발현은 모 바이러스에 비해 감소된 것인 방법. - 청구항 32에 있어서, 상기 탈최적화된 SARS-CoV-2 변이체는 청구항 17 내지 20 중 어느 한 항의 변이체인 것인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163219263P | 2021-07-07 | 2021-07-07 | |
US63/219,263 | 2021-07-07 | ||
PCT/US2022/035824 WO2023283106A1 (en) | 2021-07-07 | 2022-06-30 | Deoptimized sars-cov-2 variants and methods and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240047977A true KR20240047977A (ko) | 2024-04-12 |
Family
ID=84800983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247004613A KR20240047977A (ko) | 2021-07-07 | 2022-06-30 | 탈최적화된 sars-cov-2 변이체 및 그의 방법 및 용도 |
Country Status (12)
Country | Link |
---|---|
US (1) | US20240299533A1 (ko) |
EP (1) | EP4366766A1 (ko) |
JP (1) | JP2024526316A (ko) |
KR (1) | KR20240047977A (ko) |
CN (1) | CN118215499A (ko) |
AR (1) | AR126396A1 (ko) |
AU (1) | AU2022306850A1 (ko) |
CA (1) | CA3229050A1 (ko) |
IL (1) | IL309956A (ko) |
MX (1) | MX2024000304A (ko) |
TW (1) | TW202309290A (ko) |
WO (1) | WO2023283106A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024052336A1 (en) | 2022-09-05 | 2024-03-14 | Freie Universität Berlin | A live attenuated sars-cov-2 and a vaccine made thereof |
EP4331602A1 (en) * | 2022-09-05 | 2024-03-06 | Freie Universität Berlin | A live attenuated sars-cov-2 and a vaccine made thereof |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021055467A1 (en) * | 2019-09-16 | 2021-03-25 | University Of Miami | Orally administrable nano-medicine for viral diseases |
US10906944B2 (en) * | 2020-06-29 | 2021-02-02 | The Scripps Research Institute | Stabilized coronavirus spike (S) protein immunogens and related vaccines |
-
2022
- 2022-06-30 CA CA3229050A patent/CA3229050A1/en active Pending
- 2022-06-30 JP JP2024500630A patent/JP2024526316A/ja active Pending
- 2022-06-30 KR KR1020247004613A patent/KR20240047977A/ko unknown
- 2022-06-30 CN CN202280060702.1A patent/CN118215499A/zh active Pending
- 2022-06-30 AU AU2022306850A patent/AU2022306850A1/en active Pending
- 2022-06-30 WO PCT/US2022/035824 patent/WO2023283106A1/en active Application Filing
- 2022-06-30 EP EP22838262.8A patent/EP4366766A1/en active Pending
- 2022-06-30 US US18/574,973 patent/US20240299533A1/en active Pending
- 2022-06-30 IL IL309956A patent/IL309956A/en unknown
- 2022-06-30 MX MX2024000304A patent/MX2024000304A/es unknown
- 2022-07-07 AR ARP220101777A patent/AR126396A1/es unknown
- 2022-07-07 TW TW111125563A patent/TW202309290A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023283106A1 (en) | 2023-01-12 |
EP4366766A1 (en) | 2024-05-15 |
IL309956A (en) | 2024-03-01 |
MX2024000304A (es) | 2024-02-02 |
US20240299533A1 (en) | 2024-09-12 |
AU2022306850A1 (en) | 2024-02-01 |
CN118215499A (zh) | 2024-06-18 |
CA3229050A1 (en) | 2023-01-12 |
AR126396A1 (es) | 2023-10-11 |
JP2024526316A (ja) | 2024-07-17 |
TW202309290A (zh) | 2023-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240100151A1 (en) | Variant strain-based coronavirus vaccines | |
KR20220132588A (ko) | 탈최적화된 SARS-CoV-2 및 이의 방법 및 용도 | |
US20240216500A1 (en) | Respiratory virus combination vaccines | |
Casais et al. | Reverse genetics system for the avian coronavirus infectious bronchitis virus | |
KR20240047977A (ko) | 탈최적화된 sars-cov-2 변이체 및 그의 방법 및 용도 | |
CN110079541B (zh) | 一种构建冠状病毒感染性克隆的方法及其应用 | |
EP3394085B1 (en) | Feline calicivirus vaccine | |
KR20100019423A (ko) | 백신에 유용한 약독화 바이러스 | |
JP2002522078A (ja) | 低温適応性ウマインフルエンザウィルス | |
EP1736539A1 (en) | Attenuated SARS-CoV vaccines | |
JP7198759B2 (ja) | 弱毒化表現型を有するヒト呼吸器多核体ウイルス(rsv)のためのワクチン候補 | |
CA2413800A1 (en) | Manipulation of negative stranded rna viruses by rearrangement of their genes and uses thereof | |
Ruan et al. | Generation and evaluation of a vaccine candidate of attenuated and heat-resistant genotype VIII Newcastle disease virus | |
WO2022027749A1 (zh) | 耐热表型稳定遗传、携带负标记的重组口蹄疫病毒无毒株及o/a型口蹄疫二价灭活疫苗 | |
CN113073115B (zh) | 一种包装重组流感病毒的重组载体和重组流感病毒及其构建方法和应用 | |
KR20230038205A (ko) | 키메라 rsv 및 코로나바이러스 단백질, 면역원성 조성물, 및 사용 방법 | |
EP4181956A1 (en) | Live-attenuated virus vaccine | |
CN112111467A (zh) | 一种基因vii型新城疫标记疫苗株及其制备方法与应用 | |
Inayoshi et al. | Bacterial artificial chromosome-based reverse genetics system for cloning and manipulation of the full-length genome of infectious bronchitis virus | |
CN118620850B (zh) | 一种禽传染性支气管炎病毒弱毒株的制备及其应用 | |
CN111500547A (zh) | 一种鸡传染性支气管炎重组病毒及其构建方法和应用 | |
TW202400800A (zh) | 用於預防和治療狂犬病毒感染的組合物和方法 | |
CN118620850A (zh) | 一种禽传染性支气管炎病毒弱毒株的制备及其应用 | |
Khodabandehloo et al. | Cloning of Rota Virus Outer Capsid Protein (VP7) Gene into the pGEM Vector | |
JP2006121948A (ja) | 組換えウイルス |