CN116887865A - 包封rna的指环病毒衣壳的体外组装 - Google Patents
包封rna的指环病毒衣壳的体外组装 Download PDFInfo
- Publication number
- CN116887865A CN116887865A CN202180093903.7A CN202180093903A CN116887865A CN 116887865 A CN116887865 A CN 116887865A CN 202180093903 A CN202180093903 A CN 202180093903A CN 116887865 A CN116887865 A CN 116887865A
- Authority
- CN
- China
- Prior art keywords
- sequence
- nucleic acid
- genetic element
- orf1
- protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003612 virological effect Effects 0.000 title description 37
- 238000000338 in vitro Methods 0.000 title description 16
- 210000000234 capsid Anatomy 0.000 title description 14
- 239000000203 mixture Substances 0.000 claims abstract description 93
- 230000002068 genetic effect Effects 0.000 claims description 478
- 239000013598 vector Substances 0.000 claims description 318
- 108090000623 proteins and genes Proteins 0.000 claims description 300
- 101000651236 Homo sapiens NCK-interacting protein with SH3 domain Proteins 0.000 claims description 257
- 102100024407 Jouberin Human genes 0.000 claims description 257
- 101000833492 Homo sapiens Jouberin Proteins 0.000 claims description 256
- 210000004027 cell Anatomy 0.000 claims description 246
- 102000004169 proteins and genes Human genes 0.000 claims description 240
- 238000000034 method Methods 0.000 claims description 115
- 210000004777 protein coat Anatomy 0.000 claims description 36
- 210000004962 mammalian cell Anatomy 0.000 claims description 18
- 238000004519 manufacturing process Methods 0.000 claims description 16
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 12
- 210000005260 human cell Anatomy 0.000 claims description 12
- 238000007385 chemical modification Methods 0.000 claims description 8
- 239000000969 carrier Substances 0.000 abstract description 21
- 150000007523 nucleic acids Chemical class 0.000 description 468
- 241000700605 Viruses Species 0.000 description 278
- 102000039446 nucleic acids Human genes 0.000 description 262
- 108020004707 nucleic acids Proteins 0.000 description 262
- 235000018102 proteins Nutrition 0.000 description 233
- 108091028043 Nucleic acid sequence Proteins 0.000 description 215
- 239000002773 nucleotide Substances 0.000 description 166
- 239000012636 effector Substances 0.000 description 160
- 125000003729 nucleotide group Chemical group 0.000 description 158
- 108090000765 processed proteins & peptides Proteins 0.000 description 132
- 102000004196 processed proteins & peptides Human genes 0.000 description 117
- 239000012634 fragment Substances 0.000 description 114
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 113
- 229920001184 polypeptide Polymers 0.000 description 103
- 108020004414 DNA Proteins 0.000 description 92
- 125000003275 alpha amino acid group Chemical group 0.000 description 86
- 101710159752 Poly(3-hydroxyalkanoate) polymerase subunit PhaE Proteins 0.000 description 77
- 101710130262 Probable Vpr-like protein Proteins 0.000 description 77
- 230000027455 binding Effects 0.000 description 77
- 241000701447 unidentified baculovirus Species 0.000 description 76
- 235000001014 amino acid Nutrition 0.000 description 72
- 229940024606 amino acid Drugs 0.000 description 72
- 150000001413 amino acids Chemical class 0.000 description 72
- 101710118046 RNA-directed RNA polymerase Proteins 0.000 description 69
- 101710172711 Structural protein Proteins 0.000 description 69
- 101710189078 Helicase Proteins 0.000 description 68
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 68
- 235000015110 jellies Nutrition 0.000 description 62
- 239000008274 jelly Substances 0.000 description 62
- 241001533384 Circovirus Species 0.000 description 60
- 230000014509 gene expression Effects 0.000 description 53
- 241000238631 Hexapoda Species 0.000 description 48
- 230000000694 effects Effects 0.000 description 38
- 230000001105 regulatory effect Effects 0.000 description 38
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 36
- 101150097234 ORF2/3 gene Proteins 0.000 description 35
- 239000002245 particle Substances 0.000 description 34
- 230000010076 replication Effects 0.000 description 34
- 101100028137 Torque teno virus (isolate Human/Finland/Hel32/2002) ORF1/1 gene Proteins 0.000 description 31
- 101100028140 Torque teno virus (isolate Human/Finland/Hel32/2002) ORF1/2 gene Proteins 0.000 description 29
- 108091070501 miRNA Proteins 0.000 description 29
- 239000004475 Arginine Substances 0.000 description 27
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 27
- 108700026244 Open Reading Frames Proteins 0.000 description 25
- 108020004999 messenger RNA Proteins 0.000 description 24
- 230000004048 modification Effects 0.000 description 23
- 238000012986 modification Methods 0.000 description 23
- 230000001225 therapeutic effect Effects 0.000 description 23
- 201000010099 disease Diseases 0.000 description 22
- 208000002474 Tinea Diseases 0.000 description 21
- 241000893966 Trichophyton verrucosum Species 0.000 description 21
- 239000003814 drug Substances 0.000 description 21
- 108091007491 NSP3 Papain-like protease domains Proteins 0.000 description 20
- 108020005004 Guide RNA Proteins 0.000 description 19
- -1 e.g. Proteins 0.000 description 19
- 239000013612 plasmid Substances 0.000 description 19
- 239000000047 product Substances 0.000 description 19
- 238000000746 purification Methods 0.000 description 19
- 108091033409 CRISPR Proteins 0.000 description 18
- 108020004459 Small interfering RNA Proteins 0.000 description 18
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 18
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 17
- 101710113540 ORF2 protein Proteins 0.000 description 17
- 101710090523 Putative movement protein Proteins 0.000 description 17
- 108090000565 Capsid Proteins Proteins 0.000 description 16
- 102100023321 Ceruloplasmin Human genes 0.000 description 16
- 102000053602 DNA Human genes 0.000 description 16
- 230000001580 bacterial effect Effects 0.000 description 16
- 102000004127 Cytokines Human genes 0.000 description 15
- 108010076504 Protein Sorting Signals Proteins 0.000 description 15
- 239000003795 chemical substances by application Substances 0.000 description 15
- 230000001717 pathogenic effect Effects 0.000 description 15
- 108010042407 Endonucleases Proteins 0.000 description 14
- 102000004533 Endonucleases Human genes 0.000 description 14
- 208000035475 disorder Diseases 0.000 description 14
- 239000003102 growth factor Substances 0.000 description 14
- 239000008194 pharmaceutical composition Substances 0.000 description 14
- 102000005962 receptors Human genes 0.000 description 14
- 108020003175 receptors Proteins 0.000 description 14
- 235000000346 sugar Nutrition 0.000 description 14
- 108090000695 Cytokines Proteins 0.000 description 13
- 101710125418 Major capsid protein Proteins 0.000 description 13
- 241000960387 Torque teno virus Species 0.000 description 13
- 150000001875 compounds Chemical class 0.000 description 13
- 238000004806 packaging method and process Methods 0.000 description 13
- 101710132601 Capsid protein Proteins 0.000 description 12
- 229910019142 PO4 Inorganic materials 0.000 description 12
- 210000004899 c-terminal region Anatomy 0.000 description 12
- 230000000295 complement effect Effects 0.000 description 12
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 239000013604 expression vector Substances 0.000 description 12
- 239000010452 phosphate Substances 0.000 description 12
- 210000001519 tissue Anatomy 0.000 description 12
- 101710094648 Coat protein Proteins 0.000 description 11
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 11
- 101710141454 Nucleoprotein Proteins 0.000 description 11
- 101710083689 Probable capsid protein Proteins 0.000 description 11
- 108020004682 Single-Stranded DNA Proteins 0.000 description 11
- 101710196623 Stimulator of interferon genes protein Proteins 0.000 description 11
- 101150110932 US19 gene Proteins 0.000 description 11
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 11
- 238000012546 transfer Methods 0.000 description 11
- 206010028980 Neoplasm Diseases 0.000 description 10
- 239000000356 contaminant Substances 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000010362 genome editing Methods 0.000 description 10
- 230000035772 mutation Effects 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- 238000013518 transcription Methods 0.000 description 10
- 241001465754 Metazoa Species 0.000 description 9
- 101710182846 Polyhedrin Proteins 0.000 description 9
- 108700026226 TATA Box Proteins 0.000 description 9
- 239000004202 carbamide Substances 0.000 description 9
- 230000015556 catabolic process Effects 0.000 description 9
- 238000006731 degradation reaction Methods 0.000 description 9
- 239000003112 inhibitor Substances 0.000 description 9
- 230000003834 intracellular effect Effects 0.000 description 9
- 229940124597 therapeutic agent Drugs 0.000 description 9
- 108020003589 5' Untranslated Regions Proteins 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 8
- 108091034057 RNA (poly(A)) Proteins 0.000 description 8
- 108700009124 Transcription Initiation Site Proteins 0.000 description 8
- 201000011510 cancer Diseases 0.000 description 8
- 238000003776 cleavage reaction Methods 0.000 description 8
- 238000001493 electron microscopy Methods 0.000 description 8
- 230000006801 homologous recombination Effects 0.000 description 8
- 238000002744 homologous recombination Methods 0.000 description 8
- 230000028993 immune response Effects 0.000 description 8
- 230000002163 immunogen Effects 0.000 description 8
- 208000015181 infectious disease Diseases 0.000 description 8
- 230000000977 initiatory effect Effects 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 230000007017 scission Effects 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 102000003951 Erythropoietin Human genes 0.000 description 7
- 108090000394 Erythropoietin Proteins 0.000 description 7
- 108060003951 Immunoglobulin Proteins 0.000 description 7
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 7
- 108020005198 Long Noncoding RNA Proteins 0.000 description 7
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 7
- 239000004472 Lysine Substances 0.000 description 7
- 101710163270 Nuclease Proteins 0.000 description 7
- 239000000427 antigen Substances 0.000 description 7
- 108091007433 antigens Proteins 0.000 description 7
- 102000036639 antigens Human genes 0.000 description 7
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 7
- 230000002950 deficient Effects 0.000 description 7
- 229940105423 erythropoietin Drugs 0.000 description 7
- 238000009472 formulation Methods 0.000 description 7
- 239000005556 hormone Substances 0.000 description 7
- 229940088597 hormone Drugs 0.000 description 7
- 102000018358 immunoglobulin Human genes 0.000 description 7
- 102000042567 non-coding RNA Human genes 0.000 description 7
- 108091027963 non-coding RNA Proteins 0.000 description 7
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 239000003981 vehicle Substances 0.000 description 7
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 108091035707 Consensus sequence Proteins 0.000 description 6
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 6
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 6
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 6
- 108091027967 Small hairpin RNA Proteins 0.000 description 6
- 108091028113 Trans-activating crRNA Proteins 0.000 description 6
- 239000012190 activator Substances 0.000 description 6
- 238000001261 affinity purification Methods 0.000 description 6
- 210000004102 animal cell Anatomy 0.000 description 6
- 108010057085 cytokine receptors Proteins 0.000 description 6
- 230000001086 cytosolic effect Effects 0.000 description 6
- 230000009368 gene silencing by RNA Effects 0.000 description 6
- 238000001415 gene therapy Methods 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 230000008929 regeneration Effects 0.000 description 6
- 238000011069 regeneration method Methods 0.000 description 6
- 230000011664 signaling Effects 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 238000002560 therapeutic procedure Methods 0.000 description 6
- 241000256251 Spodoptera frugiperda Species 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 210000004671 cell-free system Anatomy 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 230000002458 infectious effect Effects 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 4
- 101000666833 Autographa californica nuclear polyhedrosis virus Uncharacterized 20.8 kDa protein in FGF-VUBI intergenic region Proteins 0.000 description 4
- 101000977027 Azospirillum brasilense Uncharacterized protein in nodG 5'region Proteins 0.000 description 4
- 101000962005 Bacillus thuringiensis Uncharacterized 23.6 kDa protein Proteins 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 108020004638 Circular DNA Proteins 0.000 description 4
- 241000702421 Dependoparvovirus Species 0.000 description 4
- 101000785191 Drosophila melanogaster Uncharacterized 50 kDa protein in type I retrotransposable element R1DM Proteins 0.000 description 4
- 101000747704 Enterobacteria phage N4 Uncharacterized protein Gp1 Proteins 0.000 description 4
- 101000861206 Enterococcus faecalis (strain ATCC 700802 / V583) Uncharacterized protein EF_A0048 Proteins 0.000 description 4
- 101000769180 Escherichia coli Uncharacterized 11.1 kDa protein Proteins 0.000 description 4
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 4
- 101000976301 Leptospira interrogans Uncharacterized 35 kDa protein in sph 3'region Proteins 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 101000658690 Neisseria meningitidis serogroup B Transposase for insertion sequence element IS1106 Proteins 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- 101000748660 Pseudomonas savastanoi Uncharacterized 21 kDa protein in iaaL 5'region Proteins 0.000 description 4
- 101000584469 Rice tungro bacilliform virus (isolate Philippines) Protein P1 Proteins 0.000 description 4
- 101000818096 Spirochaeta aurantia Uncharacterized 15.5 kDa protein in trpE 3'region Proteins 0.000 description 4
- 101000766081 Streptomyces ambofaciens Uncharacterized HTH-type transcriptional regulator in unstable DNA locus Proteins 0.000 description 4
- 101000804403 Synechococcus elongatus (strain PCC 7942 / FACHB-805) Uncharacterized HIT-like protein Synpcc7942_1390 Proteins 0.000 description 4
- 101000750910 Synechococcus elongatus (strain PCC 7942 / FACHB-805) Uncharacterized HTH-type transcriptional regulator Synpcc7942_2319 Proteins 0.000 description 4
- 101000644897 Synechococcus sp. (strain ATCC 27264 / PCC 7002 / PR-6) Uncharacterized protein SYNPCC7002_B0001 Proteins 0.000 description 4
- 108091036066 Three prime untranslated region Proteins 0.000 description 4
- 101000916336 Xenopus laevis Transposon TX1 uncharacterized 82 kDa protein Proteins 0.000 description 4
- 101001000760 Zea mays Putative Pol polyprotein from transposon element Bs1 Proteins 0.000 description 4
- 101000678262 Zymomonas mobilis subsp. mobilis (strain ATCC 10988 / DSM 424 / LMG 404 / NCIMB 8938 / NRRL B-806 / ZM1) 65 kDa protein Proteins 0.000 description 4
- 150000003838 adenosines Chemical class 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 125000004432 carbon atom Chemical group C* 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 102000003675 cytokine receptors Human genes 0.000 description 4
- 230000005782 double-strand break Effects 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 238000011194 good manufacturing practice Methods 0.000 description 4
- 229960002897 heparin Drugs 0.000 description 4
- 229920000669 heparin Polymers 0.000 description 4
- 125000004430 oxygen atom Chemical group O* 0.000 description 4
- 239000012071 phase Substances 0.000 description 4
- 229920005989 resin Polymers 0.000 description 4
- 239000011347 resin Substances 0.000 description 4
- 238000001542 size-exclusion chromatography Methods 0.000 description 4
- 241001147420 ssDNA viruses Species 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 208000035657 Abasia Diseases 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- 108091028075 Circular RNA Proteins 0.000 description 3
- 102100031256 Cyclic GMP-AMP synthase Human genes 0.000 description 3
- 101710118064 Cyclic GMP-AMP synthase Proteins 0.000 description 3
- 241000701022 Cytomegalovirus Species 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 108010009202 Growth Factor Receptors Proteins 0.000 description 3
- 102000009465 Growth Factor Receptors Human genes 0.000 description 3
- 102000014150 Interferons Human genes 0.000 description 3
- 108010050904 Interferons Proteins 0.000 description 3
- 208000032825 Ring chromosome 2 syndrome Diseases 0.000 description 3
- 241000194020 Streptococcus thermophilus Species 0.000 description 3
- 238000010459 TALEN Methods 0.000 description 3
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 3
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 3
- 108020005202 Viral DNA Proteins 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 230000003915 cell function Effects 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 229940090124 dipeptidyl peptidase 4 (dpp-4) inhibitors for blood glucose lowering Drugs 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 150000002148 esters Chemical class 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003472 neutralizing effect Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 235000004252 protein component Nutrition 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 2
- MPCAJMNYNOGXPB-UHFFFAOYSA-N 1,5-anhydrohexitol Chemical class OCC1OCC(O)C(O)C1O MPCAJMNYNOGXPB-UHFFFAOYSA-N 0.000 description 2
- LZINOQJQXIEBNN-UHFFFAOYSA-N 4-hydroxybutyl dihydrogen phosphate Chemical compound OCCCCOP(O)(O)=O LZINOQJQXIEBNN-UHFFFAOYSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000255789 Bombyx mori Species 0.000 description 2
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 102100030091 Dickkopf-related protein 2 Human genes 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- 108010069091 Dystrophin Proteins 0.000 description 2
- 102000001039 Dystrophin Human genes 0.000 description 2
- 238000012286 ELISA Assay Methods 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108091007413 Extracellular RNA Proteins 0.000 description 2
- 108091008794 FGF receptors Proteins 0.000 description 2
- 206010016654 Fibrosis Diseases 0.000 description 2
- 101710198884 GATA-type zinc finger protein 1 Proteins 0.000 description 2
- 102400000322 Glucagon-like peptide 1 Human genes 0.000 description 2
- DTHNMHAUYICORS-KTKZVXAJSA-N Glucagon-like peptide 1 Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC=1N=CNC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)C1=CC=CC=C1 DTHNMHAUYICORS-KTKZVXAJSA-N 0.000 description 2
- 102000005744 Glycoside Hydrolases Human genes 0.000 description 2
- 108010031186 Glycoside Hydrolases Proteins 0.000 description 2
- 101000987586 Homo sapiens Eosinophil peroxidase Proteins 0.000 description 2
- 101000920686 Homo sapiens Erythropoietin Proteins 0.000 description 2
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 2
- 101001043594 Homo sapiens Low-density lipoprotein receptor-related protein 5 Proteins 0.000 description 2
- 102000002265 Human Growth Hormone Human genes 0.000 description 2
- 108010000521 Human Growth Hormone Proteins 0.000 description 2
- 239000000854 Human Growth Hormone Substances 0.000 description 2
- 241000257303 Hymenoptera Species 0.000 description 2
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- 241000255777 Lepidoptera Species 0.000 description 2
- 102100021926 Low-density lipoprotein receptor-related protein 5 Human genes 0.000 description 2
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 2
- 102000003792 Metallothionein Human genes 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 108091005461 Nucleic proteins Proteins 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 241000186429 Propionibacterium Species 0.000 description 2
- 108010029485 Protein Isoforms Proteins 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 2
- 102000002067 Protein Subunits Human genes 0.000 description 2
- 101150007742 RING1 gene Proteins 0.000 description 2
- 208000009341 RNA Virus Infections Diseases 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 208000035217 Ring chromosome 1 syndrome Diseases 0.000 description 2
- 229940044665 STING agonist Drugs 0.000 description 2
- 108010000303 Secretory Proteinase Inhibitory Proteins Proteins 0.000 description 2
- 102000002255 Secretory Proteinase Inhibitory Proteins Human genes 0.000 description 2
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 101710181863 Structural DNA-binding protein p10 Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 108010009583 Transforming Growth Factors Proteins 0.000 description 2
- 102000009618 Transforming Growth Factors Human genes 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 101710086987 X protein Proteins 0.000 description 2
- 125000002015 acyclic group Chemical group 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 238000005571 anion exchange chromatography Methods 0.000 description 2
- 230000008485 antagonism Effects 0.000 description 2
- 239000005557 antagonist Substances 0.000 description 2
- 230000000259 anti-tumor effect Effects 0.000 description 2
- 230000000840 anti-viral effect Effects 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- PKFDLKSEZWEFGL-MHARETSRSA-N c-di-GMP Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]3[C@@H](O)[C@H](N4C5=C(C(NC(N)=N5)=O)N=C4)O[C@@H]3COP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=C(NC2=O)N)=C2N=C1 PKFDLKSEZWEFGL-MHARETSRSA-N 0.000 description 2
- 125000002837 carbocyclic group Chemical group 0.000 description 2
- 101150059443 cas12a gene Proteins 0.000 description 2
- 101150038500 cas9 gene Proteins 0.000 description 2
- 230000015271 coagulation Effects 0.000 description 2
- 238000005345 coagulation Methods 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 238000003271 compound fluorescence assay Methods 0.000 description 2
- 231100000433 cytotoxic Toxicity 0.000 description 2
- 230000001472 cytotoxic effect Effects 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 2
- 102000004419 dihydrofolate reductase Human genes 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 230000008995 epigenetic change Effects 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 230000004761 fibrosis Effects 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000012224 gene deletion Methods 0.000 description 2
- 125000003976 glyceryl group Chemical group [H]C([*])([H])C(O[H])([H])C(O[H])([H])[H] 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 102000044890 human EPO Human genes 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 229940079322 interferon Drugs 0.000 description 2
- 239000003591 leukocyte elastase inhibitor Substances 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 238000011140 membrane chromatography Methods 0.000 description 2
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical group CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000012434 mixed-mode chromatography Methods 0.000 description 2
- 108091008800 n-Myc Proteins 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 238000000424 optical density measurement Methods 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 210000001672 ovary Anatomy 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 229940023041 peptide vaccine Drugs 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000007363 ring formation reaction Methods 0.000 description 2
- 238000004062 sedimentation Methods 0.000 description 2
- 239000004017 serum-free culture medium Substances 0.000 description 2
- 230000003584 silencer Effects 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 230000009885 systemic effect Effects 0.000 description 2
- 108010050014 systemin Proteins 0.000 description 2
- HOWHQWFXSLOJEF-MGZLOUMQSA-N systemin Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H]2N(CCC2)C(=O)[C@H]2N(CCC2)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)C(C)C)CCC1 HOWHQWFXSLOJEF-MGZLOUMQSA-N 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 239000005451 thionucleotide Substances 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- WDVIDPRACNGFPP-QWRGUYRKSA-N (2s)-2-[[(2s)-6-amino-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NCC(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WDVIDPRACNGFPP-QWRGUYRKSA-N 0.000 description 1
- MSTNYGQPCMXVAQ-RYUDHWBXSA-N (6S)-5,6,7,8-tetrahydrofolic acid Chemical compound C([C@H]1CNC=2N=C(NC(=O)C=2N1)N)NC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 MSTNYGQPCMXVAQ-RYUDHWBXSA-N 0.000 description 1
- FGODUFHTWYYOOB-UHFFFAOYSA-N 1,3-diaminopropan-2-yl dihydrogen phosphate Chemical compound NCC(CN)OP(O)(O)=O FGODUFHTWYYOOB-UHFFFAOYSA-N 0.000 description 1
- CQHUTCADZHXJLW-UHFFFAOYSA-N 2-aminododecyl dihydrogen phosphate Chemical compound CCCCCCCCCCC(N)COP(O)(O)=O CQHUTCADZHXJLW-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- KUQZVISZELWDNZ-UHFFFAOYSA-N 3-aminopropyl dihydrogen phosphate Chemical compound NCCCOP(O)(O)=O KUQZVISZELWDNZ-UHFFFAOYSA-N 0.000 description 1
- HYCSHFLKPSMPGO-UHFFFAOYSA-N 3-hydroxypropyl dihydrogen phosphate Chemical compound OCCCOP(O)(O)=O HYCSHFLKPSMPGO-UHFFFAOYSA-N 0.000 description 1
- GOZMBJCYMQQACI-UHFFFAOYSA-N 6,7-dimethyl-3-[[methyl-[2-[methyl-[[1-[3-(trifluoromethyl)phenyl]indol-3-yl]methyl]amino]ethyl]amino]methyl]chromen-4-one;dihydrochloride Chemical compound Cl.Cl.C=1OC2=CC(C)=C(C)C=C2C(=O)C=1CN(C)CCN(C)CC(C1=CC=CC=C11)=CN1C1=CC=CC(C(F)(F)F)=C1 GOZMBJCYMQQACI-UHFFFAOYSA-N 0.000 description 1
- XYVLZAYJHCECPN-UHFFFAOYSA-N 6-aminohexyl phosphate Chemical compound NCCCCCCOP(O)(O)=O XYVLZAYJHCECPN-UHFFFAOYSA-N 0.000 description 1
- XYVLZAYJHCECPN-UHFFFAOYSA-L 6-aminohexyl phosphate Chemical compound NCCCCCCOP([O-])([O-])=O XYVLZAYJHCECPN-UHFFFAOYSA-L 0.000 description 1
- IXQPRUQVJIJUEB-UHFFFAOYSA-N 7-(diethylamino)-n-[2-(2,5-dioxopyrrol-1-yl)ethyl]-2-oxochromene-3-carboxamide Chemical compound O=C1OC2=CC(N(CC)CC)=CC=C2C=C1C(=O)NCCN1C(=O)C=CC1=O IXQPRUQVJIJUEB-UHFFFAOYSA-N 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 244000198134 Agave sisalana Species 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 241001339993 Anelloviridae Species 0.000 description 1
- 108700042778 Antimicrobial Peptides Proteins 0.000 description 1
- 102000044503 Antimicrobial Peptides Human genes 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241001203868 Autographa californica Species 0.000 description 1
- 241000201370 Autographa californica nucleopolyhedrovirus Species 0.000 description 1
- 108700040077 Baculovirus p10 Proteins 0.000 description 1
- 101000760889 Beak and feather disease virus Capsid protein Proteins 0.000 description 1
- 244000180534 Berberis hybrid Species 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 241000409811 Bombyx mori nucleopolyhedrovirus Species 0.000 description 1
- QCMYYKRYFNMIEC-UHFFFAOYSA-N COP(O)=O Chemical compound COP(O)=O QCMYYKRYFNMIEC-UHFFFAOYSA-N 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 238000010446 CRISPR interference Methods 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 241000725585 Chicken anemia virus Species 0.000 description 1
- 241001478240 Coccus Species 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 101710099523 Dickkopf-related protein 2 Proteins 0.000 description 1
- 101000599885 Dictyostelium discoideum Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 101100219622 Escherichia coli (strain K12) casC gene Proteins 0.000 description 1
- 101100382541 Escherichia coli (strain K12) casD gene Proteins 0.000 description 1
- 101100326871 Escherichia coli (strain K12) ygbF gene Proteins 0.000 description 1
- 101100005249 Escherichia coli (strain K12) ygcB gene Proteins 0.000 description 1
- 102000044168 Fibroblast Growth Factor Receptor Human genes 0.000 description 1
- 241000724791 Filamentous phage Species 0.000 description 1
- YXWOAJXNVLXPMU-ZXXMMSQZSA-N Fructose 2,6-diphosphate Chemical compound OP(=O)(O)O[C@]1(CO)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O YXWOAJXNVLXPMU-ZXXMMSQZSA-N 0.000 description 1
- 102100030708 GTPase KRas Human genes 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- 102000016354 Glucuronosyltransferase Human genes 0.000 description 1
- 108010092364 Glucuronosyltransferase Proteins 0.000 description 1
- 108060003393 Granulin Proteins 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 101000864647 Homo sapiens Dickkopf-related protein 2 Proteins 0.000 description 1
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 1
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 102000006496 Immunoglobulin Heavy Chains Human genes 0.000 description 1
- 108010019476 Immunoglobulin Heavy Chains Proteins 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 241001112693 Lachnospiraceae Species 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 108010059343 MM Form Creatine Kinase Proteins 0.000 description 1
- 101710141347 Major envelope glycoprotein Proteins 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 102000003939 Membrane transport proteins Human genes 0.000 description 1
- 108090000301 Membrane transport proteins Proteins 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 102100026057 Myosin regulatory light chain 2, atrial isoform Human genes 0.000 description 1
- 101710098224 Myosin regulatory light chain 2, atrial isoform Proteins 0.000 description 1
- 101100387128 Myxococcus xanthus (strain DK1622) devR gene Proteins 0.000 description 1
- 101100387131 Myxococcus xanthus (strain DK1622) devS gene Proteins 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 102000019040 Nuclear Antigens Human genes 0.000 description 1
- 108010051791 Nuclear Antigens Proteins 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 108020003217 Nuclear RNA Proteins 0.000 description 1
- 102000043141 Nuclear RNA Human genes 0.000 description 1
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 1
- BQMQLJQPTQPEOV-UHFFFAOYSA-N OP(=O)OC=C Chemical class OP(=O)OC=C BQMQLJQPTQPEOV-UHFFFAOYSA-N 0.000 description 1
- 101710115724 ORF1/2 protein Proteins 0.000 description 1
- 102000003840 Opioid Receptors Human genes 0.000 description 1
- 108090000137 Opioid Receptors Proteins 0.000 description 1
- 102000004067 Osteocalcin Human genes 0.000 description 1
- 108090000573 Osteocalcin Proteins 0.000 description 1
- 241000701945 Parvoviridae Species 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000015731 Peptide Hormones Human genes 0.000 description 1
- 108010038988 Peptide Hormones Proteins 0.000 description 1
- 108010043958 Peptoids Proteins 0.000 description 1
- BELBBZDIHDAJOR-UHFFFAOYSA-N Phenolsulfonephthalein Chemical compound C1=CC(O)=CC=C1C1(C=2C=CC(O)=CC=2)C2=CC=CC=C2S(=O)(=O)O1 BELBBZDIHDAJOR-UHFFFAOYSA-N 0.000 description 1
- 102000012435 Phosphofructokinase-1 Human genes 0.000 description 1
- 108010022684 Phosphofructokinase-1 Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 241001144416 Picornavirales Species 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 101710150114 Protein rep Proteins 0.000 description 1
- 101000879211 Pseudomonas phage PAJU2 Structural protein 2 Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 101710152114 Replication protein Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 208000035193 Ring chromosome 10 syndrome Diseases 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 102100023105 Sialin Human genes 0.000 description 1
- 101710105284 Sialin Proteins 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- 101100059152 Thermococcus onnurineus (strain NA1) csm1 gene Proteins 0.000 description 1
- 101100273269 Thermus thermophilus (strain ATCC 27634 / DSM 579 / HB8) cse3 gene Proteins 0.000 description 1
- 241000259907 Tomato mottle Taino virus Species 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 241000255993 Trichoplusia ni Species 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000005273 aeration Methods 0.000 description 1
- 102000006707 alpha-beta T-Cell Antigen Receptors Human genes 0.000 description 1
- 108010087408 alpha-beta T-Cell Antigen Receptors Proteins 0.000 description 1
- 229910021529 ammonia Inorganic materials 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000013406 biomanufacturing process Methods 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 229940022399 cancer vaccine Drugs 0.000 description 1
- 238000009566 cancer vaccine Methods 0.000 description 1
- 101150090505 cas10 gene Proteins 0.000 description 1
- 101150117416 cas2 gene Proteins 0.000 description 1
- 101150055191 cas3 gene Proteins 0.000 description 1
- 101150111685 cas4 gene Proteins 0.000 description 1
- 101150049463 cas5 gene Proteins 0.000 description 1
- 101150106467 cas6 gene Proteins 0.000 description 1
- 101150044165 cas7 gene Proteins 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 239000013522 chelant Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 229960003957 dexamethasone Drugs 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 229940121647 egfr inhibitor Drugs 0.000 description 1
- 238000000635 electron micrograph Methods 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000009144 enzymatic modification Effects 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 230000010437 erythropoiesis Effects 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 102000052178 fibroblast growth factor receptor activity proteins Human genes 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 239000013022 formulation composition Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- 102000017941 granulin Human genes 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 201000010284 hepatitis E Diseases 0.000 description 1
- PHNWGDTYCJFUGZ-UHFFFAOYSA-L hexyl phosphate Chemical compound CCCCCCOP([O-])([O-])=O PHNWGDTYCJFUGZ-UHFFFAOYSA-L 0.000 description 1
- 108091008039 hormone receptors Proteins 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 230000001965 increasing effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 229940047124 interferons Drugs 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 210000001985 kidney epithelial cell Anatomy 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 125000005647 linker group Chemical group 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108020004084 membrane receptors Proteins 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 210000002161 motor neuron Anatomy 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 210000000066 myeloid cell Anatomy 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- YIEDSISPYKQADU-UHFFFAOYSA-N n-acetyl-n-[2-methyl-4-[(2-methylphenyl)diazenyl]phenyl]acetamide Chemical compound C1=C(C)C(N(C(C)=O)C(=O)C)=CC=C1N=NC1=CC=CC=C1C YIEDSISPYKQADU-UHFFFAOYSA-N 0.000 description 1
- UZHSEJADLWPNLE-GRGSLBFTSA-N naloxone Chemical compound O=C([C@@H]1O2)CC[C@@]3(O)[C@H]4CC5=CC=C(O)C2=C5[C@@]13CCN4CC=C UZHSEJADLWPNLE-GRGSLBFTSA-N 0.000 description 1
- 229960004127 naloxone Drugs 0.000 description 1
- DQCKKXVULJGBQN-XFWGSAIBSA-N naltrexone Chemical compound N1([C@@H]2CC3=CC=C(C=4O[C@@H]5[C@](C3=4)([C@]2(CCC5=O)O)CC1)O)CC1CC1 DQCKKXVULJGBQN-XFWGSAIBSA-N 0.000 description 1
- 229960003086 naltrexone Drugs 0.000 description 1
- 239000006225 natural substrate Substances 0.000 description 1
- 108010090677 neurofilament protein L Proteins 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 229940005483 opioid analgesics Drugs 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 229960003531 phenolsulfonphthalein Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 108091008695 photoreceptors Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 239000012268 protein inhibitor Substances 0.000 description 1
- 229940121649 protein inhibitor Drugs 0.000 description 1
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 1
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000012266 salt solution Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 229960002930 sirolimus Drugs 0.000 description 1
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000011272 standard treatment Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002381 testicular Effects 0.000 description 1
- 239000005460 tetrahydrofolate Substances 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000009752 translational inhibition Effects 0.000 description 1
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000006648 viral gene expression Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 230000009614 wildtype growth Effects 0.000 description 1
Landscapes
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
本发明总体上涉及用于制备指环载体的组合物及其用途。
Description
相关申请的交叉引用
本申请要求2020年12月23日提交的美国临时申请号63/130,360以及2021年2月8日提交的美国临时申请号63/147,064的权益。上述申请的内容通过引用以其全文特此并入。
序列表
本申请包含序列表,该序列表已以ASCII格式电子提交,并通过引用以其全文特此并入。所述ASCII副本创建于2021年12月21日,名为V2057-7017WO_SL.txt,并且大小为286,720字节。
背景技术
一直需要开发用于制备合适载体的组合物和方法,以将治疗性效应物递送至患者。
发明内容
本披露提供了用于产生指环载体(例如合成的指环载体)的组合物和方法,该指环载体可用作递送媒介物,例如,用于将遗传物质、用于将效应物(例如有效载荷)、或用于将治疗剂或治疗性效应物递送至真核细胞(例如,人类细胞或人类组织)。虽然天然存在的指环病毒(Anellovirus)具有DNA基因组,但本披露提供了具有包含RNA的遗传元件的指环载体。
指环载体(例如,使用如本文所述的组合物或方法产生的指环载体)通常包含包封在蛋白质外壳(例如,包含指环病毒衣壳蛋白例如指环病毒ORF1蛋白或由指环病毒ORF1核酸编码的多肽的蛋白质外壳,例如,如本文所述)中的遗传元件(例如,包含或编码效应物(例如外源性或内源性效应物,例如治疗性效应物)的遗传元件),能够将该遗传元件引入细胞(例如,哺乳动物细胞,如人类细胞)中。遗传元件可以包括RNA。在一些实施例中,指环载体是感染性媒介物或颗粒,其包含蛋白质外壳,该蛋白质外壳包含由指环病毒ORF1核酸(例如,甲型细环病毒、乙型细环病毒或丙型细环病毒的ORF1核酸,如甲型细环病毒分支1、甲型细环病毒分支2、甲型细环病毒分支3、甲型细环病毒分支4、甲型细环病毒分支5、甲型细环病毒分支6或甲型细环病毒分支7的ORF1,例如,如本文所述)编码的多肽。本披露的指环载体的遗传元件通常是环状和/或单链RNA分子(例如,环状和单链的),其具有与包封它的蛋白质外壳结合的蛋白结合序列,或与之相连的多肽,这可能有助于将遗传元件包封在蛋白质外壳内,和/或相对于其他核酸而言,将遗传元件富集在蛋白质外壳内。在一些实施例中,指环载体的遗传元件是使用杆状病毒、核酸构建体(例如,杆粒和/或供体载体)、昆虫细胞和/或动物细胞系产生的,例如,如本文所述。
在一些情况下,遗传元件包含或编码效应物(例如,包含核酸效应物如非编码RNA,或编码多肽效应物如蛋白质),例如,可以在靶细胞中表达的效应物。在一些实施例中,效应物是治疗剂或治疗性效应物,例如,如本文所述的。在一些实施例中,效应物是内源性效应物或外源性效应物,例如针对野生型指环病毒或靶细胞而言是外源性的。在一些实施例中,效应物针对野生型指环病毒或靶细胞而言是外源性的。在一些实施例中,指环载体可以通过接触细胞并将编码效应物的遗传元件引入细胞中,从而将效应物递送到细胞内,使得效应物由细胞产生或表达。在某些情况下,效应物是内源性效应物(例如,针对靶细胞而言是内源性的,但是,例如由指环载体以更大的量提供的内源性效应物)。在其他情况下,效应物是外源性效应物。在一些情况下,效应物可以调节细胞的功能或者调节细胞中靶分子的活性或水平。例如,效应物可以降低细胞中靶蛋白的水平(例如,如PCT/US19/65995的实例3和4中所述)。在另一实例中,指环载体可以在体内递送和表达效应物,例如外源性蛋白(例如,如PCT/US19/65995的实例19和28中所述)。例如,指环载体可用于将遗传物质递送到靶细胞、组织或受试者;将效应物递送到靶细胞、组织或受试者;或用于治疗疾病和障碍,例如,通过将可作为治疗剂的效应物递送到所需细胞、组织或受试者。
在一些实施例中,本文所述的组合物和方法可用于产生合成指环载体的遗传元件,例如在宿主细胞中。合成指环载体与野生型病毒(例如,野生型指环病毒,例如,如本文所述)相比具有至少一种结构差异,例如,相对于野生型病毒的缺失、插入、置换、修饰(例如,酶促修饰)。一般而言,合成指环载体包括包封在蛋白质外壳内的外源性遗传元件,其可用于将遗传元件或在其中编码的(例如,多肽或核酸效应物)效应物(例如,外源性效应物或内源性效应物)递送至真核(例如,人类)细胞中。在实施例中,指环载体不会造成可检测的和/或不必要的免疫或炎症反应,例如,不会造成一种或多种炎症分子标志如TNF-α、IL-6、IL-12、IFN增加超过1%、5%、10%、15%,以及不会造成B细胞应答,如反应性或中和性抗体,例如,指环载体对靶细胞、组织或受试者是基本上非免疫原性的。
在一些实施例中,本文所述的组合物和方法可用于产生指环载体的遗传元件,该指环载体包括:(i)包含ORF1分子的蛋白质外壳;以及(ii)包含RNA的遗传元件;其中遗传元件被包封在蛋白质外壳内。在一些实施例中,遗传元件由至少10%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%RNA组成。在一些实施例中,遗传元件不包含DNA。在一些实施例中,遗传元件不包含ssDNA。替代性地,在一些实施例中,遗传元件包含DNA区域。在一些实施例中,本文所述的DNA或RNA分子包含一个或多个经修饰的核苷酸(例如碱基修饰、糖修饰或骨架修饰)。在一些实施例中,遗传元件是单链的。在一些实施例中,遗传元件包含双链区域。在一些实施例中,遗传元件是线性多肽。替代性地,在一些实施例中,遗传元件是环状多核苷酸。在一些实施例中,核酸序列经过密码子优化,例如,用于在昆虫细胞中表达。在一些实施例中,核酸序列中至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的密码子经过密码子优化,例如,用于在昆虫细胞中表达。在一些实施例中,核酸序列经过密码子优化,例如,用于在哺乳动物(如,人类)细胞中表达。在一些实施例中,核酸序列中至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的密码子经过密码子优化,例如,用于在哺乳动物(如,人类)细胞中表达。在一些实施例中,遗传元件的长度为约10-20、20-30、30-40、50-60、60-70、70-80、80-90、90-100、100-125、125-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-3500、3500-4000或4000-4500个核苷酸。在一些实施例中,遗传元件的长度为至少约10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000或4500个核苷酸。
在一些实施例中,本文所述的组合物和方法可用于产生包含衣壳(例如,包含指环病毒ORF如ORF1、多肽的衣壳)的感染性(例如,对人类细胞具有感染性)指环载体、媒介物或颗粒的遗传元件,该衣壳封装遗传元件,该遗传元件包含与衣壳结合的蛋白结合序列和编码治疗性效应物的异源(针对指环病毒而言)序列。在实施例中,指环载体能够将遗传元件递送至哺乳动物(例如,人类)细胞中。
在一方面,本发明的特征在于通过体外组装制备指环载体的方法。在一些实施例中,制备指环载体的方法包括:(a)提供混合物,其包含:(i)包含RNA的遗传元件,和(ii)ORF1分子;以及(b)在适用于将遗传元件包封在包含ORF1分子的蛋白质内的条件下孵育混合物,从而制备指环载体;任选地,其中该混合物不包含在细胞中。在一些实施例中,方法进一步包括在提供(a)之前,例如在宿主细胞(例如昆虫细胞或哺乳动物细胞)中表达ORF1分子。在一些实施例中,表达包括在适用于产生ORF1分子的条件下孵育包含编码ORF1分子的核酸分子(例如杆状病毒表达载体)的宿主细胞(例如,昆虫细胞或哺乳动物细胞)。在一些实施例中,方法进一步包括在提供(a)之前,纯化由宿主细胞表达的ORF1分子。
在一些实施例中,如本文所述的指环载体可用作有效的递送媒介物,用于将作用剂如本文所述的效应物引入靶细胞中,例如,待接受治疗性或预防性治疗的受试者中的靶细胞。
在一方面,本发明的特征在于药物组合物,其包含如本文所述的指环载体(例如,合成指环载体)。在一些实施例中,药物组合物进一步包含药学上可接受的载剂或赋形剂。在实施例中,药物组合物包含单位剂量,该单位剂量包含每千克目标受试者约105-1014(例如,约106-1013、107-1012、108-1011或109-1010)个基因组当量的指环载体。在一些实施例中,包含制剂的药物组合物在可接受的期限和温度范围内是稳定的,和/或与所期望的施用途径和/或该施用途径所需的任何装置(例如,针头或注射器)相容。在一些实施例中,将药物组合物配制用于作为单剂量或多剂量施用。在一些实施例中,将药物组合物在施用场所配制,例如由医疗保健专业人员配制。在一些实施例中,药物组合物包含所期望的浓度的指环载体基因组或基因组当量(例如,由每体积的基因组数量来定义)。
在一方面,本发明的特征在于治疗受试者中疾病或障碍的方法,该方法包括向该受试者施用指环载体,例如,合成指环载体,例如,如本文所述的。
在一方面,本发明的特征在于将效应物或有效载荷(例如,内源性或外源性效应物)递送至细胞、组织或受试者的方法,该方法包括向该受试者施用指环载体,例如合成指环载体,例如,如本文所述的,其中该指环载体包含编码该效应物的核酸序列。在一些实施例中,有效载荷是核酸。在一些实施例中,有效载荷是多肽。
在一方面,本发明的特征在于将指环载体递送至细胞的方法,该方法包括使该指环载体(例如合成指环载体,例如,如本文所述)与细胞(例如真核细胞,如哺乳动物细胞)进行接触,例如,在体内或离体条件下进行接触。
任何前述指环载体、组合物或方法的其他特征包括以下列举的实施例中的一个或多个。
本领域技术人员将会认识到,或者仅使用常规实验就能够确定本文所述本发明的具体实施例的许多等同形式。这样的等同形式意在由以下列举的实施例所涵盖。
列举的实施例
1.一种指环载体,其含有:
a)包含ORF1分子的蛋白质外壳;
b)包含RNA的遗传元件,
其中该遗传元件被包封在该蛋白质外壳内。
2.根据实施例1所述的指环载体,其中该遗传元件由至少10%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%RNA组成。
3.根据实施例1或2所述的指环载体,其中该RNA包含一个或多个化学修饰。
4.根据前述实施例中任一项所述的指环载体,其中该遗传元件由RNA组成或基本上由RNA组成。
5.根据前述实施例中任一项所述的指环载体,其中该指环载体不包含DNA。
6.根据前述实施例中任一项所述的指环载体,其中该指环载体不包含ssDNA。
7.根据前述实施例中任一项所述的指环载体,其中该遗传元件包含DNA区域。
8.根据前述实施例中任一项所述的指环载体,其中该DNA区域的所有核苷酸都经过化学修饰。
9.根据实施例7或8所述的指环载体,其中该DNA区域与该遗传元件的RNA共价连接。
10.根据前述实施例中任一项所述的指环载体,其中该DNA区域的至少一部分与该遗传元件的RNA的至少一部分杂交。
11.根据前述实施例中任一项所述的指环载体,其中该DNA区域的长度为10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900或900-1000个核苷酸。
12.根据前述实施例中任一项所述的指环载体,其中该遗传元件是单链的。
13.根据前述实施例中任一项所述的指环载体,其中该遗传元件包含双链区域(例如,与RNA配对的RNA区域或与RNA配对的DNA区域)。
14.根据前述实施例中任一项所述的指环载体,其中该遗传元件是线性的。
15.根据前述实施例中任一项所述的指环载体,其中该遗传元件是环状的。
16.根据前述实施例中任一项所述的指环载体,其中该遗传元件包含第一区域和可与该第一区域杂交的第二区域。
17.根据前述实施例中任一项所述的指环载体,其中该遗传元件不包含5'端或3'端。
18.根据实施例15-17中任一项所述的指环载体,其中该遗传元件不包含游离磷酸和游离糖中的一种或两种。
19.根据实施例15-18中任一项所述的指环载体,其中该遗传元件中的每个磷酸通过该磷酸所包含的第一氧原子共价连接到第一糖,并且通过该磷酸所包含的第二氧原子共价连接到第二糖。
20.根据实施例15-19中任一项所述的指环载体,其中该遗传元件中的每个糖通过该糖所包含的第一碳原子共价连接到第一磷酸,并且通过该糖所包含的第二碳原子共价连接到第二磷酸。
21.根据实施例15-20中任一项所述的指环载体,其中该遗传元件通过使线性RNA环化而产生。
22.根据前述实施例中任一项所述的指环载体,其中该遗传元件的长度为约10-20、20-30、30-40、50-60、60-70、70-80、80-90、90-100、100-125、125-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-3500、3500-4000或4000-4500个核苷酸。
23.根据前述实施例中任一项所述的指环载体,其中该遗传元件的长度为至少约10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000或4500个核苷酸。
24.根据前述实施例中任一项所述的指环载体,其中该遗传元件结合该ORF1分子。
25.根据前述实施例中任一项所述的指环载体,其中该遗传元件结合该ORF1分子所包含的胶冻卷结构域。
26.根据前述实施例中任一项所述的指环载体,其中该遗传元件结合该ORF1分子所包含的富含精氨酸的结构域。
27.根据前述实施例中任一项所述的指环载体,其中该指环载体包含多个遗传元件,例如,至少2、3、4、5、10、20、30、40、50或60个遗传元件。
28.根据实施例27所述的指环载体,其中多个遗传元件各自包含相同的序列。
29.根据实施例27所述的指环载体,其中多个遗传元件包含不同的序列。
30.根据前述实施例中任一项所述的指环载体,其中该遗传元件编码外源性效应物。
31.根据实施例30所述的指环载体,其中编码该外源性效应物的序列的长度为至少约10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500或3000个核苷酸。
32.根据实施例30-31中任一项所述的指环载体,其中该外源性效应物包含治疗性效应物(例如,多肽或核酸分子)。
33.根据实施例30-32中任一项所述的指环载体,其中该外源性效应物包含人蛋白质或包含与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的多肽。
34.根据实施例30-33中任一项所述的指环载体,其中该外源性效应物包含核酸分子。
35.根据实施例30-34中任一项所述的指环载体,其中该外源性效应物包含非编码核酸分子,例如功能性RNA,例如mRNA、miRNA或siRNA。
36.根据实施例30-35中任一项所述的指环载体,其中该遗传元件是编码外源性效应物(例如,肽或多肽,例如,治疗性肽或多肽)的mRNA分子。
37.根据实施例36所述的指环载体,其中该非编码核酸分子是人非编码核酸分子或包含与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列的核酸分子。
38.根据实施例30-37中任一项所述的指环载体,其中该外源性效应物包含胞质多肽或胞质肽(例如,DPP-4抑制剂、GLP-1信号传导激活剂、或中性粒细胞弹性蛋白酶抑制剂或其功能片段)。
39.根据实施例38所述的指环载体,其中该外源性效应物包含调节性细胞内多肽。
40.根据实施例30-39中任一项所述的指环载体,其中该外源性效应物包含分泌的多肽或肽(例如,细胞因子、抗体分子、激素、生长因子或凝血相关因子,或其功能片段)。
41.根据实施例30-40中任一项所述的指环载体,其中该外源性效应物包含蛋白质替代治疗剂。
42.根据实施例30-41中任一项所述的指环载体,其中该外源性效应物包含酶。
43.根据实施例30-42中任一项所述的指环载体,其中该外源性效应物包含促红细胞生成素(EPO)或人生长激素(hGH),或其功能片段。
44.根据实施例30-43中任一项所述的指环载体,其中该外源性效应物包含基因编辑系统的组分(例如,CRISPR系统的组分,例如Cas9、Cpf1或其功能片段)。
45.根据前述实施例中任一项所述的指环载体,其中该RNA包含化学修饰的RNA,例如,如本文所述。
46.根据前述实施例中任一项所述的指环载体,其中该RNA包含帽。
47.根据前述实施例中任一项所述的指环载体,其中该RNA包含多聚A尾,例如,长度为至少约5、10、15、20、25、30、40、50、60、70、80、90或100个腺苷。
48.根据前述实施例中任一项所述的指环载体,其中该RNA缺少多聚A尾,例如,包含不超过5、10、15、20、25、30、40、50、60、70、80、90或100个连续的腺苷。
49.根据前述实施例中任一项所述的指环载体,其中该蛋白质外壳包含约60个(例如,约40、50、60、70或80个)拷贝的ORF1分子。
50.根据前述实施例中任一项所述的指环载体,其中这些ORF1分子的胶冻卷结构域面向该蛋白质外壳的内部。
51.根据前述实施例中任一项所述的指环载体,其中该ORF1分子包含如表N-S和37A-37C中任一个列出的氨基酸序列,或与其具有至少30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
52.根据前述实施例中任一项所述的指环载体,其中该ORF1分子包含富含精氨酸的区域,例如,包含如表N-S和37A-37C中任一个列出的富含精氨酸的区域的氨基酸序列,或与其具有至少30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
53.根据实施例52所述的指环载体,其中该富含精氨酸的区域包含至少约70%(例如,至少约70%、75%、80%、85%、90%、95%或100%)碱性残基(例如,精氨酸或赖氨酸)。
54.根据前述实施例中任一项所述的指环载体,其中该ORF1分子包含胶冻卷结构域,例如,包含如表N-S和37A-37C中任一个列出的胶冻卷结构域的氨基酸序列,或与其具有至少30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
55.根据实施例54所述的指环载体,其中该胶冻卷结构域包含以下特征中的一个或多个(例如,1、2、3或4个):
(i)该胶冻卷结构域的至少30%(例如,至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、90%或更多)的氨基酸是一个或多个β-折叠的部分;
(ii)该胶冻卷结构域的二级结构包含至少四个(例如,至少4、5、6、7、8、9、10、11或12个)β-折叠;和/或
(iii)该胶冻卷结构域的三级结构包含至少两个(例如,至少2、3或4个)β-折叠;和/或
(iv)该胶冻卷结构域包含β-折叠与α-螺旋的比例为至少2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。
56.根据实施例54所述的指环载体,其中该胶冻卷结构域包含两个β-折叠,例如,相对于彼此以反平行方向排列。
57.根据实施例54所述的指环载体,其中该胶冻卷结构域包含八条β-链。
58.根据实施例52-57中任一项所述的指环载体,其中该胶冻卷结构域包含与Dβ-链的序列具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的区域,例如,如图3所示。
59.根据实施例52所述的指环载体,其中该Dβ-链包含1、2或3或更多个碱性残基(例如,精氨酸或赖氨酸)。
60.根据实施例52-59中任一项所述的指环载体,其中该胶冻卷结构域包含与Gβ-链的序列具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的区域,例如,如图3所示。
61.根据实施例52所述的指环载体,其中该Gβ-链包含至少约1、2或3或更多个碱性残基(例如,精氨酸或赖氨酸)。
62.根据前述实施例中任一项所述的指环载体,其中该ORF1分子包含N22结构域,例如,包含如表N-S和37A-37C中任一个列出的N22结构域的氨基酸序列,或与其具有至少30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
63.根据前述实施例中任一项所述的指环载体,其中该N22结构域包含氨基酸序列YNPX2DXGX2N,其中Xn各自独立地为任何n个氨基酸的连续序列。
64.根据前述实施例中任一项所述的指环载体,其中该N22结构域包含氨基酸序列YNPX2DXGX2N侧翼的第一β链和第二β链,例如,其中该第一β链包含氨基酸序列YNPX2DXGX2N的酪氨酸(Y)残基和/或其中该第二β链包含氨基酸序列YNPX2DXGX2N的第二天冬酰胺(N)残基(从N到C)。
65.根据前述实施例中任一项所述的指环载体,其中该ORF1分子包含C-末端结构域,例如,包含表N-S和37A-37C中任一个列出的C-末端结构域的氨基酸序列,或与其具有至少30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
66.根据前述实施例中任一项所述的指环载体,其中该遗传元件缺少编码指环病毒ORF1蛋白的序列(例如,如本文所述)。
67.根据前述实施例中任一项所述的指环载体,其中该遗传元件缺少编码指环病毒ORF2蛋白的序列(例如,如本文所述)。
68.根据前述实施例中任一项所述的指环载体,其中该遗传元件缺少编码指环病毒ORF3蛋白的序列(例如,如本文所述)。
69.根据前述实施例中任一项所述的指环载体,其中该指环载体被配置为将该遗传元件递送到细胞(例如,真核细胞,例如哺乳动物细胞,例如,人类细胞)。
70.根据实施例69所述的指环载体,其中至少1000个该指环载体的群体能够将至少约100个拷贝(例如,至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、5000、10,000、50,000、100,000、500,000或1,000,000个拷贝)的该遗传元件递送到一个或多个细胞中。
71.根据实施例69或70所述的指环载体,其中该指环载体的群体(例如,每个细胞至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000个基因组当量的该遗传元件)能够将该遗传元件递送到这些细胞的群体的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多中。
72.根据实施例69-71中任一项所述的指环载体,其中该指环载体的群体(例如,每个细胞至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000个基因组当量的该遗传元件)能够将每个细胞至少1、2、3、4、5、6、7、8、9、10、20、50、100、200、500、1000、2000、5000、8,000、1x 104、1x 105、1x 106、1x 107或更多个拷贝的该遗传元件递送到这些细胞的群体中。
73.根据实施例69-72中任一项所述的指环载体,其中该指环载体的群体(例如,每个细胞至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000个基因组当量的该遗传元件)能够将每个细胞1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、5-10、10-20、20-50、50-100、100-1000、1000-104、1x 104-1x 105、1x 104-1x 106、1x 104-1x 107、1x 105-1x 106、1x 105-1x 107或1x 106-1x 107个拷贝的该遗传元件递送到这些细胞的群体中。
74.根据前述实施例中任一项所述的指环载体,其中该指环载体选择性地将该效应物递送到所需细胞类型、组织或器官(例如,骨髓、血液、心脏、GI、皮肤、视网膜中的光感受器、上皮衬里或胰腺),或在其中以更高水平存在(例如,优选地在其中累积)。
75.根据前述实施例中任一项所述的指环载体,其中该遗传元件免受RNA酶(例如,蛋白质外壳)的酶切,或对其具有抗性。
76.根据前述实施例中任一项所述的指环载体,其中包封在该蛋白质外壳内的该遗传元件对核酸内切酶酶切,例如RNA酶酶切具有抗性。
77.根据前述实施例中任一项所述的指环载体,其中该遗传元件包含启动子元件。
78.根据前述实施例中任一项所述的指环载体,其中该遗传元件包含蛋白质结合序列。
79.根据实施例78所述的指环载体,其中该蛋白质结合序列能够结合该ORF1分子。
80.一种组合物,其包含多个根据前述实施例中任一项所述的指环载体。
81.根据实施例80所述的组合物,其中该组合物中至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的包含ORF1分子的蛋白质外壳包含至少一个拷贝的该遗传元件。
82.根据实施例80所述的组合物,其中该组合物中至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的包含ORF1分子的蛋白质外壳包含至少一个拷贝的指环载体遗传元件。
83.根据实施例80-82中任一项所述的组合物,其中该组合物包含至少102、103、104、104、105、106或107个相同指环载体。
84.根据实施例80-83中任一项所述的组合物,其中多个包括至少103、104、105、106、107、108、109、1010、1011、1012、1013、1014或1015个指环载体(例如,该指环载体的拷贝);或其中该组合物包含至少105、106、107、108、109、1010、1011、1012、1013、1014或1015个指环载体/mL。
85.根据实施例80-84中任一项所述的组合物,其具有以下特征中的一个或多个(例如,1、2、3、4、5或6个):
a)该组合物符合药品或良好生产规范(GMP)标准;
b)该组合物根据良好生产规范(GMP)制造;
c)该组合物具有低于预定参考值的病原体水平,例如,基本上不含病原体;
d)该组合物具有低于预定参考值的污染物水平,例如,基本上不含污染物(例如变性剂,例如尿素);
e)该组合物具有预定水平的非感染性颗粒或预定比率的颗粒:感染性单位(例如,<300:1、<200:1、<100:1或<50:1),或
f)该药物组合物具有低免疫原性或基本上是非免疫原性的,例如,如本文所述;
任选地,其中该组合物包含浓度小于0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、0.9M、1M、1.1M、1.2M、1.3M、1.5M、1.5M、1.6M、1.7M、1.8M、1.9M或2M的尿素。
86.根据实施例80-85中任一项所述的组合物,其中该药物组合物具有低于预定参考值的污染物水平,例如,基本上不含污染物。
87.根据实施例80-86中任一项所述的组合物,其中该组合物包含浓度小于0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、0.9M、1M、1.1M、1.2M、1.3M、1.5M、1.5M、1.6M、1.7M、1.8M、1.9M或2M的尿素。
88.根据实施例86或87所述的组合物,其中该污染物包含以下中的一种或多种:支原体、内毒素、宿主细胞核酸(例如,宿主细胞DNA和/或宿主细胞RNA)、动物源性的工艺杂质(例如,血清白蛋白或胰蛋白酶)、可复制型因子(RCA),例如可复制型病毒或不必要的指环载体(例如,除了所期望的指环载体,例如本文所述合成指环载体之外的指环载体)、游离病毒衣壳蛋白、外源因子和/或聚集体。
89.根据实施例80-88中任一项所述的组合物,其中该组合物包含按重量计小于10%(例如小于约10%、5%、4%、3%、2%、1%、0.5%或0.1%)的污染物。
90.根据实施例80-89中任一项所述的组合物,其中至少90%的蛋白质外壳包含相同的遗传元件(例如,该指环载体的遗传元件)。
91.根据实施例80-90中任一项所述的组合物,其中至少90%的蛋白质外壳包含相同的ORF1分子。
92.一种药物组合物,其包含根据前述实施例中任一项所述的指环载体或组合物,以及药学上可接受的载剂或赋形剂。
93.一种制备指环载体的方法,该方法包括:
(a)提供混合物,其包含:
(i)包含RNA的遗传元件,和
(ii)ORF1分子;以及
(b)在适用于将该遗传元件包封在包含该ORF1分子的蛋白质外壳内的条件下孵育该混合物,从而制备指环载体;
任选地,其中该混合物不包含在细胞中。
94.根据实施例93所述的方法,其进一步包括在提供(a)之前,例如在宿主细胞(例如昆虫细胞或哺乳动物细胞)中表达该ORF1分子。
95.根据实施例94所述的方法,其中该表达包括在适用于产生该ORF1分子的条件下孵育包含编码该ORF1分子的核酸分子(例如杆状病毒表达载体)的宿主细胞(例如,昆虫细胞或哺乳动物细胞)。
96.根据实施例94或95所述的方法,其进一步包括在提供(a)之前,纯化由该宿主细胞表达的该ORF1分子。
97.一种纯化指环载体的方法,该方法包括:
(a)提供指环载体(例如,如本文所述),其包含:
(i)遗传元件,例如,包含RNA的遗传元件,和
(ii)包含ORF1分子的蛋白质外壳,该蛋白质外壳包封该遗传元件;以及
(b)纯化该指环载体。
98.根据实施例96或97所述的方法,其中该纯化(例如,该ORF1分子的纯化或该指环载体的纯化)包括亲和纯化,例如肝素亲和纯化。
99.根据实施例96-98中任一项所述的方法,其中该纯化(例如,该ORF1分子的纯化或该指环载体的纯化)包括尺寸排阻色谱法(例如,使用Tris缓冲液流动相)。
100.根据实施例96-99中任一项所述的方法,其中该纯化(例如,该ORF1分子的纯化或该指环载体的纯化)包括亲和纯化(例如肝素亲和纯化)随后进行尺寸排阻色谱法。
101.根据实施例96-100中任一项所述的方法,其中该纯化(例如,该ORF1分子的纯化或该指环载体的纯化)包括阴离子交换色谱法(例如,Mustang Q膜色谱法)。
102.根据实施例96-101中任一项所述的方法,其中该纯化(例如,该ORF1分子的纯化或该指环载体的纯化)包括混合模式色谱法(例如,使用混合模式树脂,例如,Cato700树脂)。
103.根据实施例96-102中任一项所述的方法,其中该纯化(例如,该ORF1分子的纯化或该指环载体的纯化)产生包含一个或多个病毒样颗粒(VLP)的组合物,该病毒样颗粒包含至少约20、30、40、50或60个拷贝,或20-30、30-40、40-50或50-60个拷贝的该ORF1分子。
104.根据实施例103所述的方法,其中至少75%、80%、90%、95%、96%、97%、98%、99%或100%的该病毒样颗粒包含蛋白质外壳,这些蛋白质外壳为60聚体或直径为至少30、31、32、33、34或35nm的颗粒。
105.根据实施例103所述的方法,其中该组合物包含至少105、106、107、108、109、1010个颗粒/mL,或包含105-106、106-107、107-109、108-109、109-1010或1010-1011个颗粒/mL(例如,如通过电子显微镜测量的)。
106.根据实施例93-105中任一项所述的方法,其进一步包括在提供(a)之前,在适用于分解包含该ORF1分子的蛋白质外壳(例如,病毒样颗粒(VLP))的条件下孵育该ORF1分子。
107.根据实施例106所述的方法,其中适用于分解包含该ORF1分子的该蛋白质外壳的条件包括在变性剂存在下孵育。
108.根据实施例106-107中任一项所述的方法,其中该变性剂包括离液剂(例如,尿素)或洗涤剂(例如,SDS(例如,0.1%SDS)、Tween或Triton)。
109.根据实施例106-108中任一项所述的方法,其中适用于分解包含该ORF1分子的该蛋白质外壳的条件包括预定的电导率、高盐溶液(例如,包含NaCl的溶液,例如,浓度为至少约1M,例如至少约0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、2、3、4或5M)、热度(例如,温度高于约85、86、87、88、89、90、91、92、93、94或95℃)或pH值(例如,酸性pH或碱性pH)。
110.根据实施例106-109中任一项所述的方法,其中适用于分解包含该ORF1分子的该蛋白质外壳的条件包括在包含浓度为至少0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、0.9M、1M、1.1M、1.2M、1.3M、1.5M、1.5M、1.6M、1.7M、1.8M、1.9M或2M的尿素的溶液中孵育。
111.根据实施例106-110中任一项所述的方法,其中(b)的孵育导致至少50%、60%、70%、75%、80%、85%、90%、96%或100%的包含该ORF1分子或其拷贝的颗粒群体被分解。
112.根据实施例106-111中任一项所述的方法,其中适用于分解该蛋白质外壳的条件足以分解包含至少约20、30、40、50或60个拷贝,或20-30、30-40、40-50或50-60个拷贝的ORF1分子的复合物(例如蛋白质外壳)。
113.根据实施例106-112中任一项所述的方法,其中适用于分解该蛋白质外壳的条件导致少于108个剩余的完整颗粒/mL。
114.根据实施例106-113中任一项所述的方法,其进一步包括在提供(a)之前,将该ORF1分子从适用于分解该蛋白质外壳的条件中去除(例如,使ORF1分子经受非变性条件)。
115.根据实施例114所述的方法,其中将该ORF1分子从适用于分解该蛋白质外壳的条件中去除包括降低该变性剂的浓度,例如,将该变性剂(例如尿素)的浓度降低至低于0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、0.9M、1M、1.1M、1.2M、1.3M、1.5M、1.5M、1.6M、1.7M、1.8M、1.9M或2M。
116.根据实施例114或115所述的方法,其中该去除导致形成一个或多个指环载体,这些指环载体各自包封至少一个拷贝(例如,至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、150、200、250、300、400、500、600、700、800、900或1000个拷贝)的该遗传元件(例如,mRNA)。
117.根据实施例116所述的方法,其中在所得溶液中包封至少一个拷贝的该遗传元件的指环载体的数量为至少105、106、107、108、109、1010或1011个;或105-106、106-107、107-109、108-109、109-1010或1010-1011个(例如,如通过电子显微镜测量的)。
118.根据实施例116所述的方法,其中在所得溶液中包封至少一个拷贝的该遗传元件的指环载体的数量为至少105、106、107、108、109、1010或1011个指环载体/mL;或105-106、106-107、107-109、108-109、109-1010或1010-1011个指环载体/mL(例如,如通过电子显微镜测量的)。
119.根据实施例114-118中任一项所述的方法,其中该去除产生了包含至少105、106、107、108、109、1010或1011个指环载体/mL;或105-106、106-107、107-109、108-109、109-1010或1010-1011个指环载体/mL(例如,如通过电子显微镜测量的)的溶液,其中这些指环载体各自包封至少一个拷贝(例如,至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、150、200、250、300、400、500、600、700、800、900或1000个拷贝)的该遗传元件(例如,mRNA)。
120.根据实施例114-119中任一项所述的方法,其中至少75%、80%、90%、95%、96%、97%、98%、99%或100%的该指环载体包含蛋白质外壳,这些蛋白质外壳为60聚体或颗粒或为直径为至少30、31、32、33、34或35nm的颗粒。
121.根据实施例93-120中任一项所述的方法,其中该指环载体的遗传元件对核酸内切酶(例如,RNA酶)具有抗性。
122.根据实施例93-121中任一项所述的方法,其中(a)包括混合(i)和(ii)。
123.根据实施例93-122中任一项所述的方法,其在无细胞系统中进行。
124.一种制备指环载体组合物的方法,其包括:
(a)提供多个根据前述实施例中任一项所述的指环载体或组合物;
(b)任选地对多个根据前述实施例中任一项所述的指环载体或组合物评估以下一种或多种:本文所述的污染物、光密度测量(例如,OD 260)、颗粒数(例如,通过HPLC)、感染性(例如,颗粒:感染性单位比,例如,通过荧光和/或ELISA测定);以及
(c)例如,如果(b)中的一个或多个参数满足指定阈值,则将多个指环载体配制为,例如,适用于施用给受试者的药物组合物。
125.一种治疗有需要的受试者的疾病或障碍的方法,该方法包括向该受试者施用根据前述实施例中任一项所述的指环载体或组合物,从而治疗该受试者的疾病或障碍(例如,如本文所述)。
126.一种调节,例如增强或抑制,受试者的生物学功能(例如,如本文所述)的方法,该方法包括向该受试者施用根据前述实施例中任一项所述的指环载体或组合物。
127.一种将遗传元件递送到细胞的方法,该方法包括使根据前述实施例中任一项所述的指环载体或组合物与细胞,例如真核细胞,例如哺乳动物细胞,例如人类细胞,接触。
128.根据前述实施例中任一项所述的指环载体或组合物用于治疗受试者的疾病或障碍(例如,如本文所述)的用途。
129.根据前述实施例中任一项所述的指环载体或组合物,用于在用于治疗受试者的疾病或障碍(例如,如本文所述)的方法中使用。
130.根据前述实施例中任一项所述的指环载体或组合物,用于在生产用于治疗受试者的疾病或障碍(例如,如本文所述)的药物中使用。
根据说明书和附图并且根据权利要求,本发明的其他特征、目的和优点将是显而易见的。
除非另外定义,否则本文所用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同含义。本文提及的所有出版物、专利申请、专利和其他参考文献均通过引用以其全文并入。另外,材料、方法和实例仅是说明性的,而并非意在进行限制。
附图说明
图1是一系列电子显微照片,显示来自指环病毒株的重组衣壳蛋白在体外形成病毒样颗粒(VLP)。如通过负染色电子显微镜观察到的,在不同细胞系中产生的衣壳蛋白在体外形成VLP。(A)从昆虫细胞中纯化的Ring 2ORF1 VLP,观察到的直径为大约35nm。(B)从昆虫细胞中纯化的Ring 10 ORF1 VLP,观察到的直径为大约35nm。(C)从哺乳动物细胞中纯化的CAV VP1 VLP,观察到的直径为大约20nm。
图2是显示在喙羽病病毒(BFDV)的结构中观察到的八条β-链胶冻卷结构域(或胶冻卷折叠)的图。按照惯例,β链被标记为B到I。这些链形成四个反平行β折叠,取向为B-I-D-G和C-H-E-F。B-I-D-G折叠形成病毒衣壳的内部。
图3是氨基酸序列比对,其描绘了与喙羽病病毒(BFDV)/戊型肝炎衣壳蛋白(HepE)的胶冻卷结构域相比,指环病毒ORF1蛋白的胶冻卷序列。
图4A-4E是一系列图,显示了生产包封编码eGFP的mRNA分子的基于指环病毒ORF1蛋白的病毒样颗粒(VLP)的示例性方法。(A)如本文所述,ORF1蛋白在细胞中产生并进行分离。(B)然后由ORF1蛋白形成的VLP在2M尿素溶液中分解。(C)当在不存在mRNA的情况下去除尿素时,少量VLP重新形成(通过电子显微镜检测到滴度小于108个颗粒/mL)。(D,E)当在编码eGFP的mRNA存在下去除尿素时,通过电子显微镜(EM)检测到大量VLP(滴度为1x109-1x1010个颗粒/mL)。
当结合附图阅读时,将会更好地理解以下对本发明实施例的详细描述。出于说明本发明的目的,在附图中示出了现在举例说明的实施例。然而,应该理解的是,本发明不限于附图中所示实施例的精确布置及手段。
具体实施方式
定义
本发明将针对特定实施例并参考某些附图进行描述,但本发明并不限于此,而是仅由权利要求书来限定。除非另有说明,否则通常应以其通常意义来理解下文中所阐述的术语。
在本说明书和权利要求书中使用术语“包含”时,它并不排除其他要素。出于本发明的目的,术语“由......组成”被认为是术语“包含......”的优选实施例。如果在下文中将组定义为包含至少一定数量的实施例,则这应理解为优选地还披露了仅由这些实施例组成的组。
当提及单数名词时,如果使用了不定冠词或定冠词,例如“一种/一个(a)”、“一种/一个(an)”或“该(the)”,这包括该名词的复数,除非另有明确说明。
词语“用于治疗、调节等的化合物、组合物、产物等”应理解为是指本身适合于所指定的治疗、调节等目的的化合物、组合物、产物等。词语“用于治疗、调节等的化合物、组合物、产物等”另外作为实施例披露了这样的化合物、组合物、产物等用于治疗、调节等。
词语“用于......的化合物、组合物、产物等”、“化合物、组合物、产物等在生产用于......的药物、药物组合物、兽用组合物、诊断组合物等中的用途”或“用作药物......的化合物、组合物、产物等”表示这些化合物、组合物、产物等将用于可在人体或动物体上实施的治疗方法中。它们被认为是关于治疗方法等的实施例和权利要求的等同披露。因此,如果实施例或权利要求是指“用于治疗疑似患有某种疾病的人或动物的化合物”,则这也被认为是披露了“化合物在生产用于治疗疑似患有某种疾病的人或动物的药物中的用途”或“通过向疑似患有某种疾病的人或动物施用化合物的治疗方法”。词语“用于治疗、调节等的化合物、组合物、产物等”应理解为是指本身适合于所指定的治疗、调节等目的的化合物、组合物、产物等。
如果在下文的括号中提供了术语、值、数量等的实例,则这应理解为表示在括号中提及的实例可以构成实施例。例如,如果指出“在实施例中,核酸分子包含与表1的指环病毒ORF1编码核苷酸序列(例如,表1的核酸序列中571-2613位核苷酸)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列”,则一些实施例涉及包含与表1的核酸序列的571-2613位核苷酸具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列的核酸分子。
如本文所用的术语“扩增”,指的是核酸分子或其部分的复制,以产生一个或多个另外拷贝的该核酸分子或其部分(例如,遗传元件或遗传元件区域)。在一些实施例中,扩增导致核酸序列的部分复制。在一些实施例中,扩增经由滚环式复制进行。
如本文所用的,术语“指环载体”是指包含包封在蛋白质外壳中的遗传元件(例如RNA,例如环状RNA)的媒介物。在一些实施例中,遗传元件基本上被蛋白质外壳保护免于RNA酶酶切。如本文所用的“合成指环载体”通常指的是非天然存在的指环载体,例如,其具有与野生型病毒(例如,如本文所述的野生型指环病毒)不同的序列。在一些实施例中,合成指环载体是工程化的或重组的,例如,其包含遗传元件,该遗传元件包含相对于野生型病毒基因组(例如,如本文所述的野生型指环病毒基因组)的差异或修饰。在一些实施例中,包封在蛋白质外壳内涵盖100%的蛋白质外壳覆盖率,以及小于100%的覆盖,例如95%、90%、85%、80%、70%、60%、50%或更少。例如,蛋白质外壳可能存在缺口或间断(例如,这使得蛋白质外壳对水、离子、肽或小分子具有可渗透性),只要遗传元件例如在进入宿主细胞之前,保留在蛋白质外壳中或免受RNA酶的酶切。在一些实施例中,将指环载体纯化,例如,将其从其原始来源中分离和/或基本上不含(>50%、>60%、>70%、>80%、>90%)其他组分。在一些实施例中,指环载体能够将遗传元件引入靶细胞中(例如,经由感染)。在一些实施例中,指环载体是含有某些指环病毒元件(例如,指环病毒ORF1分子)的感染性合成病毒颗粒。
如本文所用的,术语“抗体分子”是指包含至少一个免疫球蛋白可变结构域序列的蛋白质,例如免疫球蛋白链或其片段。术语“抗体分子”涵盖全长抗体和抗体片段(例如,scFv)。在一些实施例中,抗体分子是多特异性抗体分子,例如,该抗体分子包含多个免疫球蛋白可变结构域序列,其中该多个中第一免疫球蛋白可变结构域序列对第一表位具有结合特异性,而该多个中第二免疫球蛋白可变结构域序列对第二表位具有结合特异性。在一些实施例中,多特异性抗体分子是双特异性抗体分子。双特异性抗体分子的特征通常在于对第一表位具有结合特异性的第一免疫球蛋白可变结构域序列和对第二表位具有结合特异性的第二免疫球蛋白可变结构域序列。
如本文所用的,术语“骨架”或“骨架区域”是指核酸分子内(例如,在杆粒或供体载体内,例如,如本文所述)的区域,其包含参与(例如,必需和/或足够)宿主细胞中核酸分子复制和/或维持的一个或多个元件。在一些实施例中,骨架区域,例如“杆状病毒骨架区域”,包含一个或多个杆状病毒元件(例如杆状病毒基因组或其功能片段),例如,适用于在昆虫细胞(例如Sf9细胞)中进行核酸构建体复制。在一些实施例中,骨架进一步包含选择性标志。在一些实施例中,核酸分子包含遗传元件区域和骨架区域(例如,杆状病毒骨架区域和/或适于在细菌细胞中复制的骨架区域)。
如本文所用的,术语“杆粒”是指包含足够的杆状病毒骨架元件以使其适于在昆虫细胞中复制而且还适于在细菌细胞中复制的核酸分子。在一些实施例中,核酸分子适于在细菌细胞(例如,大肠杆菌细胞,例如,DH 10Bac细胞)中复制。
如本文所用的,“环状”核酸是指形成没有游离5'端或3'端的结构的核酸。在一些实施例中,环状核酸通过共价键或非共价键闭合。例如,环状核酸可以例如用磷酸-糖键或合成接头部分通过共价连接线性核酸的末端而制备。在其他实施例中,环状核酸包括靠近且不游离的两个末端(核酸外切酶基本上不可接近)。例如,环状核酸可以通过直接或通过核酸夹板将线性核酸的末端杂交来制备。
如本文所用的,“DNA区域”是指包含多个DNA核苷酸的多核苷酸链的一部分。例如,在一些实施例中,DNA区域是并入到RNA链中的多个DNA核苷酸。例如,DNA区域在多核苷酸链内包含约5-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90或90-100个DNA核苷酸。
如本文所用的,“编码……”的核酸是指编码氨基酸序列或者多核苷酸例如mRNA或功能性多核苷酸(例如非编码RNA,例如siRNA或miRNA)的核酸序列。
如本文所用的“外源性”作用剂(例如,效应物、核酸(例如,RNA)、基因、有效载荷、蛋白质)是指不由相应的野生型病毒,例如,如本文所述的指环病毒包含或编码的作用剂。在一些实施例中,外源性作用剂不是天然存在的,例如具有相对于天然存在的蛋白质或核酸而言发生改变(例如,通过插入、缺失或置换)的序列的蛋白质或核酸。在一些实施例中,外源性因子不天然存在于宿主细胞中。在一些实施例中,外源性因子天然存在于宿主细胞中,但是对于病毒是外源的。在一些实施例中,外源性作用剂天然存在于宿主细胞中,但是不以期望的水平或在期望的时间存在。
如本文中针对另一种作用剂或元件(例如,效应物、核酸序列、氨基酸序列)所用的“异源”作用剂或元件(例如,效应物、核酸序列、氨基酸序列),指的是并非天然存在于一起的作用剂或元件,例如,在野生型病毒,如指环病毒中。在一些实施例中,异源核酸序列可以与天然存在的核酸序列(例如,天然存在于指环病毒中的序列)存在于同一核酸中。在一些实施例中,相对于指环载体的其他(例如,其余的)元件所基于的指环病毒而言,异源作用剂或元件是外源性的。
如本文所用的,术语“遗传元件”指的是核酸分子,其包封在或可以包封在蛋白质外壳内(例如,蛋白质外壳保护其免受RNA酶的酶切),例如,以形成如本文所述的指环载体。应当理解的是,遗传元件可以作为裸RNA产生,并且任选地进一步组装到蛋白质外壳中。还应理解的是,指环载体可将其遗传元件插入细胞中,其结果是遗传元件存在于细胞中,而蛋白质外壳不一定进入细胞。
如本文所用的,“遗传元件构建体”是指包含遗传元件序列或其片段的核酸构建体(例如,质粒、杆粒、供体载体、粘粒或微环)。在一些实施例中,如本文所述的杆粒或供体载体是包含遗传元件序列或其片段的遗传元件构建体。
如本文所用的术语“遗传元件区域”指的是包含遗传元件序列的构建体区域。在一些实施例中,遗传元件区域包含与野生型指环病毒序列或其片段具有足够同一性的序列,由蛋白质外壳包封,从而形成指环载体(例如,与野生型指环病毒序列或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列)。在实施例中,遗传元件区域包含蛋白结合序列,例如,如本文所述的(例如,如本文所述的5’UTR、3’UTR和/或GC富集区,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列)。在一些实施例中,包含遗传元件区域的构建体没有包封在蛋白质外壳中,但是由构建体产生的遗传元件可以包封在蛋白质外壳中。在一些实施例中,包含遗传元件区域的构建体进一步包括载体骨架(例如,杆粒骨架或供体载体骨架)。在一些实施例中,构建体(例如,杆粒)包含一个或多个杆状病毒元件(例如,杆状病毒基因组,其例如包含遗传元件区域)。
如本文所用的,当用于基因组(例如,指环病毒基因组)或其片段时,术语“突变体”指的是相对于相应的野生型指环病毒序列具有至少一处变化的序列。在一些实施例中,相对于相应的野生型指环病毒序列,突变体基因组或其片段包含至少一个单核苷酸多态性、添加、缺失或移码。在一些实施例中,相对于相应的野生型指环病毒序列,突变体基因组或其片段包含至少一种指环病毒ORF(例如,ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2中一种或多种)的缺失。在一些实施例中,相对于相应的野生型指环病毒序列,突变体基因组或其片段包含所有指环病毒ORF(例如,所有ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和ORF1/2)的缺失。在一些实施例中,相对于相应的野生型指环病毒序列,突变体基因组或其片段包含至少一种指环病毒非编码区(例如,5’UTR、3’UTR和/或GC富集区中一种或多种)的缺失。在一些实施例中,突变体基因组或其片段包含或者编码外源性效应物。
如本文所用的,术语“ORF分子”是指具有指环病毒ORF蛋白(例如,包含指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2蛋白的多肽)或其功能性片段的活性和/或结构特征的多肽。当一般使用(即,“ORF分子”)时,多肽可以包含本文所述的任何指环病毒ORF(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2中任一种)或其功能性片段的活性和/或结构特征。当与修饰词一起使用以说明特定的开放阅读框(例如,“ORF1分子”、“ORF2分子”、“ORF2/2分子”、“ORF2/3分子”、“ORF1/1分子”或“ORF1/2分子”)时,通常表示多肽包含相应的指环病毒ORF蛋白或其功能性片段(例如,如下文针对“ORF1分子”所定义)的活性和/或结构特征。例如,“ORF2分子”包含指环病毒ORF2蛋白或其功能性片段的活性和/或结构特征。
如本文所用,术语“ORF1分子”是指具有指环病毒ORF1蛋白(例如,如本文所述的指环病毒ORF1蛋白)或其功能性片段的活性和/或结构特征的多肽。在一些情况下,ORF1分子可以包含以下中的一个或多个(例如,1、2、3或4个):包含至少60%碱性残基(例如,至少60%精氨酸残基)的第一区域、包含至少约六个β链(例如,至少4、5、6、7、8、9、10、11或12个β链)的第二区域、包含指环病毒N22结构域(例如,如本文所述的,例如来自如本文所述的指环病毒ORF1蛋白的N22结构域)的结构或活性的第三区域和/或包含指环病毒C-末端结构域(CTD)(例如,如本文所述的,例如来自如本文所述的指环病毒ORF1蛋白的CTD)的结构或活性的第四区域。在一些情况下,ORF1分子按照从N-末端到C-末端的顺序包含该第一、第二、第三和第四区域。在一些情况下,指环载体包含ORF1分子,该分子按照从N-末端到C-末端的顺序包含该第一、第二、第三和第四区域。在一些情况下,ORF1分子可以包含由指环病毒ORF1核酸编码的多肽。在一些情况下,ORF1分子可进一步包含异源序列,例如高变区(HVR),例如来自指环病毒ORF1蛋白的HVR,例如,如本文所述的。如本文所用的“指环病毒ORF1蛋白”指的是由指环病毒基因组(例如,野生型指环病毒基因组,例如,如本文所述)编码的ORF1蛋白。
如本文所用的,术语“ORF2分子”是指具有指环病毒ORF2蛋白(例如,如本文所述的指环病毒ORF2蛋白)或其功能性片段的活性和/或结构特征的多肽。如本文所用的“指环病毒ORF2蛋白”指的是由指环病毒基因组(例如,野生型指环病毒基因组,例如,如本文所述)编码的ORF2蛋白。
如本文所用的,术语“蛋白质外壳”是指主要(例如,>50%、>60%、>70%、>80%、>90%)是蛋白质的外壳组分。
如本文所用的,术语“调节性核酸”是指修饰编码表达产物的DNA序列的表达,例如转录和/或翻译的核酸序列。在一些实施例中,表达产物包括RNA或蛋白质。
如本文所用的,术语“调节性序列”是指修饰靶基因产物的转录的核酸序列。在一些实施例中,调节性序列是启动子或增强子。
如本文所用的,“基本上非致病性”生物体、颗粒或组分是指不会导致或诱发不可接受的疾病或致病性状况的生物体、颗粒(例如,病毒或指环载体,例如,如本文所述)或其组分,例如,在宿主生物体,例如哺乳动物,如人类中。在一些实施例中,向受试者施用指环载体可导致轻微的反应或副作用,作为标准治疗的一部分,这些反应或副反应是可以接受的。
如本文所用的,术语“非致病性”是指不会导致或诱发不良状况(例如,疾病或致病性状况)的生物体或其组分,例如,在宿主生物体,例如,哺乳动物,如人类中。
如本文所用的,“基本上非整合的”遗传元件是指遗传元件,例如,病毒或指环载体中的遗传元件,例如,如本文所述的,其中进入宿主细胞(例如,真核细胞)或生物体(例如,哺乳动物,如人类)的遗传元件中低于约0.01%、0.05%、0.1%、0.5%或1%整合到基因组中。在一些实施例中,遗传元件没有可检测地整合到例如宿主细胞的基因组中。在一些实施例中,可以使用本文所述的技术,例如核酸测序、PCR检测和/或核酸杂交,检测遗传元件整合到基因组中。在一些实施例中,整合频率是通过对从游离载体中分离出来的基因组DNA进行定量凝胶纯化测定来确定的,例如,如Wang等人中所述(2004,Gene Therapy[基因治疗],11:711-721,其通过引用以其全文并入本文)。
如本文所用的,“基本上非免疫原性”生物体、颗粒或组分是指不会导致或诱发不期望的或非靶向的免疫应答的生物体、颗粒(例如,病毒或指环载体,例如,如本文所述)或其组分,例如,在宿主组织或生物体(例如,哺乳动物,如人类)中。在一些实施例中,基本上非免疫原性生物体、颗粒或组分不会产生具有临床意义的免疫应答。在一些实施例中,基本上非免疫原性指环载体不会产生针对包含氨基酸序列或者由指环病毒或指环载体遗传元件的核酸序列编码的蛋白质的具有临床意义的免疫应答。在一些实施例中,通过测定受试者中抗体(例如,中和抗体)的存在或水平(例如,抗指环载体抗体的存在或水平,例如针对文中所述的指环载体的抗体的存在或水平)来检测免疫应答(例如,不期望的或未靶向的免疫应答),例如,根据Tsuda等人(1999;J.Virol.Methods[病毒学方法杂志]77:199-206;通过引用并入文中)中所述的抗TTV抗体检测方法和/或Kakkola等人(2008;Virology[病毒学]382:182-189;通过引用并入文中)中所述的测定抗TTV IgG水平的方法。还可以通过本领域用于检测抗病毒抗体的方法来检测针对指环病毒或基于指环病毒的指环载体的抗体(例如,中和性抗体),这些方法是例如检测抗AAV抗体的方法,例如,如Calcedo等人(2013;Front.Immunol.[免疫学前沿]4(341):1-7;其通过引用并入本文)中所述。
如本文所用的“子序列”是指分别包含在较大核酸序列或氨基酸序列中的核酸序列或氨基酸序列。在一些情况下,子序列可以包含较大序列的结构域或功能性片段。在一些情况下,子序列可以包含较大序列的片段,当从较大序列中分离出来时,该片段能够形成二级和/或三级结构,类似于当与较大序列的其余部分一起存在时由该子序列形成的二级和/或三级结构。在一些情况下,子序列可以替换为另一序列(例如,包含外源性序列或对较大序列的其余部分而言异源的序列的子序列,例如,来自不同指环病毒的相应子序列)。
本发明总体上涉及指环载体,例如,合成指环载体,及其用途。本披露提供指环载体、包含指环载体的组合物,以及制备或使用指环载体的方法。指环载体通常用作递送媒介物,例如用于将治疗剂递送至真核细胞。通常,本文所述的指环载体将包括遗传元件,该遗传元件包含包封在蛋白质外壳内的RNA序列(例如,编码效应物,例如外源性效应物或内源性效应物的RNA序列)。相对于指环病毒序列(例如,如本文所述),指环载体可包括序列(例如,如本文所述的区域或结构域)的一个或多个缺失。指环载体可以用作基本上非免疫原性媒介物,用于将遗传元件或其中编码的效应物(例如,多肽或核酸效应物,例如,如本文所述)递送到真核细胞中,例如,用以治疗包含这些细胞的受试者中的疾病或障碍。
目录
I.用于通过体外组装制备指环载体的组合物和方法
A.指环载体的组分和组装
i.用于组装指环载体的ORF1分子
ii.用于组装指环载体的ORF2分子
B.遗传元件
i.包含RNA的遗传元件
a.仅RNA遗传元件
b.杂交RNA-ssDNA遗传元件
c RNA/DNA缀合物
C.遗传元件构建体
D.基于RNA的遗传元件的产生
E.蛋白质成分的产生
i.杆状病毒表达系统
ii.昆虫细胞系统
iii.哺乳动物细胞系统
F.效应物
G.体外组装方法
H.富集和纯化
II.指环载体
A.指环病毒
B.ORF1分子
C.ORF2分子
D.遗传元件
E.蛋白结合序列
F.5’UTR区
G.GC富集区
H.效应物
I.调节性序列
J.其他序列
K.蛋白质外壳
III.使用方法
IV.施用/递送
I.用于通过体外组装制备指环载体的组合物和方法
在一些方面,本披露提供了可用于产生指环载体(例如,具有包含RNA的遗传元件的指环载体,如本文所述)的组合物和方法。在一些实施例中,本文所述的组合物和方法可以用于产生遗传元件或遗传元件构建体。在一些实施例中,本文所述的组合物和方法可以用于通过体外组装产生遗传元件或遗传元件构建体。在一些实施例中,本文所述的组合物和方法可以用于产生一个或多个指环病毒ORF分子(例如,ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2分子或其功能性片段或剪接变体)。在一些实施例中,本文所述的组合物和方法可以用于在例如宿主细胞(例如,昆虫细胞,例如,Sf9细胞)中产生蛋白质外壳或其组分(例如,ORF1分子)。
指环载体的组分和组装
本文的组合物和方法可用于产生指环载体。如本文所述的,指环载体通常包含包封在蛋白质外壳(例如,包含由指环病毒ORF1核酸编码的多肽,例如,如本文所述)内的遗传元件(例如,RNA分子)。在一些实施例中,遗传元件包含一个或多个编码指环病毒ORF(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2中的一种或多种)的序列。如本文所用的,指环病毒ORF或ORF分子(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2)包括包含与相应指环病毒ORF序列(例如,如PCT/US2018/037379或PCT/US19/65995(其各自通过引用以其全文并入本文)中所述的)具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽。在实施例中,遗传元件包含编码指环病毒ORF1或者其剪接变体或功能性片段(例如,胶冻卷区域,例如,如本文所述)的序列。在一些实施例中,蛋白质外壳包含由指环病毒ORF1核酸编码的多肽(例如,指环病毒ORF1分子或者其剪接变体或功能性片段)。
在一些实施例中,通过将遗传元件(例如,如本文所述)包封在蛋白质外壳(例如,如本文所述)内来组装指环载体。在一些实施例中,将遗传元件包封在宿主细胞(例如,昆虫细胞,例如,Sf9细胞)的蛋白质外壳内。在一些实施例中,宿主细胞表达蛋白质外壳中包含的一种或多种多肽(例如,由指环病毒ORF1核酸编码的多肽,如ORF1分子)。例如,在一些实施例中,宿主细胞包含编码指环病毒ORF1分子,例如,指环病毒ORF1多肽(例如,野生型指环病毒ORF1蛋白或由野生型指环病毒ORF1核酸编码的多肽,例如,如本文所述)的剪接变体或功能性片段的核酸序列。在实施例中,编码指环病毒ORF1分子的核酸序列包含在宿主细胞中包含的核酸构建体(例如,质粒、病毒载体、病毒、微环、杆粒或人工染色体)中。在实施例中,编码指环病毒ORF1分子的核酸序列整合到宿主细胞的基因组中。
在一些实施例中,宿主细胞包含遗传元件和/或包含遗传元件序列的核酸构建体。在一些实施例中,核酸构建体选自质粒、病毒核酸、微环、杆粒或人工染色体。在一些实施例中,将遗传元件从核酸构建体(例如,杆粒)上切离,并且任选地,从双链形式转化为单链形式(例如,通过变性)。在一些实施例中,遗传元件是通过聚合酶根据核酸构建体(例如,杆粒)中的模板序列生成的。在一些实施例中,聚合酶产生遗传元件序列的单链拷贝,其可以任选地进行环化以形成如本文所述的遗传元件。
在一些实施例中,宿主细胞包含遗传元件构建体(例如,杆粒、质粒或微环)和包含一个或多个编码指环病毒ORF分子(例如,ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2ORF分子)或其功能性片段的序列的杆粒。在一些实施例中,蛋白质外壳蛋白质从杆粒表达。在实施例中,从杆粒表达的蛋白质外壳蛋白质包封遗传元件,从而形成指环载体。在一些实施例中,杆粒包含适于核酸构建体在昆虫细胞(例如,Sf9细胞)中复制的骨架,例如,杆状病毒骨架区域。在一些实施例中,杆粒包含适于遗传元件构建体在细菌细胞(例如,大肠杆菌细胞,例如,DH 10Bac细胞)中复制的骨架区域。在一些实施例中,遗传元件构建体包含适于核酸构建体在昆虫细胞(例如,Sf9细胞)中复制的骨架,例如,杆状病毒骨架区域。在一些实施例中,遗传元件构建体包含适于遗传元件构建体在细菌细胞(例如,大肠杆菌细胞,例如,DH 10Bac细胞)中复制的骨架区域。在一些实施例中,将杆粒经由杆状病毒颗粒引入宿主细胞中。在实施例中,通过生产细胞例如昆虫细胞(例如,Sf9细胞)或细菌细胞(例如,大肠杆菌细胞,例如,DH 10Bac细胞)来产生杆粒。在实施例中,生产细胞包含杆粒和/或供体载体,例如,如本文所述。在实施例中,生产细胞进一步包含足以用于杆粒和/或供体载体的复制的细胞机构。
ORF1分子,例如用于组装指环载体的ORF1分子
例如,可以通过将遗传元件包封在蛋白质外壳内来制备指环载体。在一些实施例中,包封在无细胞系统或细胞中发生。指环载体的蛋白质外壳通常包含由指环病毒ORF1核酸编码的多肽(例如,指环病毒ORF1分子或者其剪接变体或功能性片段,例如,如本文所述)。在一些实施例中,ORF1分子包含以下一个或多个:包含精氨酸富集区的第一区域,例如具有至少60%的碱性残基(例如,至少60%、65%、70%、75%、80%、85%、90%、95%或100%碱性残基;例如,60%-90%、60%-80%、70%-90%或70-80%的碱性残基)的区域,以及包含胶冻卷结构域的第二区域,例如至少六个β链(例如,4、5、6、7、8、9、10、11或12个β链)。在实施例中,蛋白质外壳包含指环病毒ORF1精氨酸富集区、胶冻卷区域、N22结构域、高变区和/或C-末端结构域中的一种或多种(例如,1、2、3、4种或全部5种)。在一些实施例中,蛋白质外壳包含指环病毒ORF1胶冻卷区域(例如,如本文所述)。在一些实施例中,蛋白质外壳包含指环病毒ORF1精氨酸富集区(例如,如本文所述)。在一些实施例中,蛋白质外壳包含指环病毒ORF1 N22结构域(例如,如本文所述)。在一些实施例中,蛋白质外壳包含指环病毒高变区(例如,如本文所述)。在一些实施例中,蛋白质外壳包含指环病毒ORF1 C-末端结构域(例如,如本文所述)。
在一些实施例中,指环载体包含ORF1分子和/或编码ORF1分子的核酸。一般而言,ORF1分子包括具有指环病毒ORF1蛋白(例如,如本文所述的指环病毒ORF1蛋白)的结构特征和/或活性的多肽或其功能性片段。在一些实施例中,ORF1分子包含相对于指环病毒ORF1蛋白(例如,如本文所述的指环病毒ORF1蛋白)的截短。在一些实施例中,ORF1分子是截短了至少10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650或700个氨基酸的指环病毒ORF1蛋白。在一些实施例中,ORF1分子包含与甲型细环病毒、乙型细环病毒或丙型细环病毒ORF1蛋白(例如,如本文所述)具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。ORF1分子通常可以结合核酸分子,例如DNA(例如,遗传元件,例如,如本文所述)。在一些实施例中,ORF1分子定位于细胞核。在某些实施例中,ORF1分子定位于细胞的核仁。
不希望受到理论的束缚,ORF1分子可能能够与其他ORF1分子结合,例如,以形成蛋白质外壳(例如,如本文所述)。可以将这样的ORF1分子描述为具有形成衣壳的能力。在一些实施例中,蛋白质外壳可以包封核酸分子(例如,如本文所述的遗传元件)。在一些实施例中,多个ORF1分子可形成多聚体,例如,以产生蛋白质外壳。在一些实施例中,多聚体可以是同型多聚体。在其他实施例中,多聚体可以是异型多聚体。
ORF2分子,例如用于组装指环载体的ORF2分子
使用本文所述的组合物或方法产生指环载体可能涉及表达指环病毒ORF2分子(例如,如本文所述)或者其剪接变体或功能性片段。在一些实施例中,指环载体包含ORF2分子或者其剪接变体或功能性片段,和/或编码ORF2分子或者其剪接变体或功能性片段的核酸。在一些实施例中,指环载体不包含ORF2分子或者其剪接变体或功能性片段,和/或编码ORF2分子或者其剪接变体或功能性片段的核酸。在一些实施例中,产生指环载体包括ORF2分子或者其剪接变体或功能性片段的表达,但是该ORF2分子未并入指环载体中。
遗传元件
包含RNA的遗传元件
在一些实施例中,遗传元件是核酸或包含核酸。在一些实施例中,遗传元件是单链多核苷酸。在一些实施例中,遗传元件包含一个或多个双链区域。在一些实施例中,遗传元件包含RNA。在一些实施例中,遗传元件包含RNA发夹结构。在一些实施例中,遗传元件是mRNA,例如,化学修饰的mRNA。在一些实施例中,遗传元件由至少10%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%RNA组成。在一些实施例中,遗传元件包含DNA链和RNA链,例如,其中至少一部分DNA链与至少一部分RNA链杂交。
在一些实施例中,遗传元件不编码指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3或ORF2t/3中的任一个。
在一些实施例中,RNA遗传元件编码效应物,例如效应蛋白。
在一些实施例中,RNA遗传元件是效应物或包含效应物,例如功能性RNA。在一些实施例中,RNA选自由以下组成的组:mRNA、rRNA、tRNA(例如TREM)、调节RNA、非编码RNA、长非编码RNA(lncRNA)、环状RNA(circRNA)、双链RNA(dsRNA)、引导RNA(gRNA)、小干扰RNA(siRNA)、短发夹RNA(shRNA)、piwi相互作用RNA(piRNA)、小核仁RNA(snoRNA)、小核RNA(snRNA)、细胞外RNA(exRNA)、小卡哈尔体特异性RNA(scaRNA)、微小RNA(miRNA)和其他RNAi分子。
在一些实施例中,遗传元件包含RNA,例如化学修饰的RNA。在一些实施例中,遗传元件的RNA的一个或多个核苷酸被化学修饰。在一些实施例中,RNA包含对一个或多个碱基的一种或多种化学修饰。在一些实施例中,RNA包含对一个或多个糖的一种或多种化学修饰。在一些实施例中,遗传元件的RNA的至少1、2、3、4、5、6、7、8、9或10个核苷酸被化学修饰。在一些实施例中,RNA包含一个或多个骨架修饰。在一些实施例中,修饰包含非天然存在的修饰,例如表5-9中任一个中所述的修饰。可以根据本领域已知的方法进行非天然存在的修饰。
在一些实施例中,本文所述的遗传元件包含表5中提供的非天然存在的修饰,或其组合。
表5:示例性的非天然存在的修饰
在一些实施例中,本文所述的遗传元件包含表6中提供的修饰或其组合。表6中提供的修饰天然存在于RNA中,并且可以在本文中在不是天然存在的位置用于遗传元件中。
表6:另外的示例性修饰
在实施例中,本文所述的遗传元件包含表7中提供的非天然存在的修饰,或其组合。
表7:另外的示例性非天然存在的修饰
在实施例中,本文所述的遗传元件包含表8中提供的非天然存在的修饰,或其组合。
表8:示例性主链修饰
在实施例中,本文所述的遗传元件包含表9中提供的非天然存在的修饰,或其组合。
表9:示例性的非天然存在的主链修饰
合成的主链修饰的名称 |
硫代磷酸酯 |
限制性核酸(CNA) |
2'O'甲基化 |
2'-O-甲氧基乙基核糖(MOE) |
2'氟 |
锁核酸(LNA) |
(S)-限制性乙基(cEt) |
氟己糖醇核酸(FHNA) |
5'硫代磷酸酯 |
二氨基磷酸酯吗啉代低聚物(PMO) |
三环DNA(tcDNA) |
(S)5'-C-甲基 |
(E)-乙烯基膦酸酯 |
膦酸甲酯 |
(S)5'-C-甲基与磷酸酯 |
在一些实施例中,遗传元件包含帽。帽典型地位于mRNA的5'端,但帽也可以位于RNA的3'端。在一些实施例中,帽保护遗传元件免受核酸外切酶降解,并且可以帮助细胞内递送和/或定位。帽可以存在于5'-末端(5'帽)或3'-末端(3'帽)或可以存在于两端。5'帽的非限制性实例包括但不限于甘油基、反向脱氧脱碱基残基(部分);4’,5’-亚甲基核苷酸、1-(β-D-赤呋喃糖基)核苷酸、4′-硫代核苷酸;碳环核苷酸;1,5-脱水己糖醇核苷酸;L-核苷酸;α-核苷酸;经修饰的碱基核苷酸;二硫代磷酸酯连接;苏-戊呋喃糖基核苷酸;无环3’,4’-开环核苷酸;无环3,4-二羟丁基核苷酸;无环3,5-二羟戊基核苷酸、3’-3’-反向核苷酸部分;3’-3’-反向脱碱基部分;3’-2’-反向核苷酸部分;3’-2’-反向脱碱基部分;1,4-丁二醇磷酸酯;3’-氨基磷酸酯;己基磷酸酯;氨基己基磷酸酯;3’-磷酸酯;3’-硫代磷酸酯;二硫代磷酸酯;或桥接或非桥接甲基膦酸酯部分。
3'帽的非限制性实例包括但不限于甘油基、反向脱氧脱碱基残基(部分);4’,5’-亚甲基核苷酸、1-(β-D-赤呋喃糖基)核苷酸;4’-硫代核苷酸、碳环核苷酸;5’-氨基烷基磷酸酯;1,3-二氨基-2-丙基磷酸酯;3-氨基丙基磷酸酯;6-氨基己基磷酸酯;1,2-氨基十二烷基磷酸酯;羟基丙基磷酸酯;1,5-脱水己糖醇核苷酸;L-核苷酸;α-核苷酸;经修饰的碱基核苷酸;二硫代磷酸酯;苏-戊呋喃糖基核苷酸;无环3′,4′-开环核苷酸;3,4-二羟基丁基核苷酸;3,5-二羟基戊基核苷酸,5′-5′-反向核苷酸部分;5′-5′-反向脱碱基部分;5′-氨基磷酸酯;5′-硫代磷酸酯;1,4-丁二醇磷酸酯;5’-氨基;桥联和/或非桥联5′-氨基磷酸酯、硫代磷酸酯和/或二硫代磷酸酯、桥接或非桥接甲基膦酸酯和5’-巯基部分(更多细节参见Beaucage和Iyer,1993,Tetrahedron[四面体]49,1925;其通过引用并入本文)。
在一些实施例中,遗传元件包括多聚A尾。在一些实施例中,多聚A尾的长度包含至少约5、10、15、20、25、30、40、50、60、70、80、90或100个腺苷。在一些实施例中,RNA缺少多聚A尾。在一些实施例中,其中RNA缺少多聚A尾,RNA包含不超过约5、10、15、20、25、30、40、50、60、70、80、90或100个连续的腺苷。
在一些实施例中,遗传元件是线性的。在一些实施例中,遗传元件是环状的。在一些实施例中,遗传元件包含第一区域和可与该第一区域杂交的第二区域。在一些实施例中,遗传元件包含第一区域和可与第一区域杂交以形成环的第二区域。在一些实施例中,遗传元件不包含5'端或3'端。在一些实施例中,遗传元件不包含游离磷酸和游离糖中的一种或两种。在一些实施例中,遗传元件中的每个磷酸通过磷酸所包含的第一氧原子与第一糖共价连接,并且通过磷酸所包含的第二氧原子与第二糖共价连接。在一些实施例中,遗传元件中的每个糖通过糖所包含的第一碳原子与第一磷酸共价连接,并且通过糖所包含的第二碳原子与第二磷酸共价连接。在一些实施例中,遗传元件通过使线性RNA环化而产生。环状RNA在例如美国专利公开20200306286中描述,其通过引用以其全文并入本文。
在一些实施例中,遗传元件的长度为约10-20、20-30、30-40、50-60、60-70、70-80、80-90、90-100、100-125、125-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-3500、3500-4000或4000-4500个核苷酸。在一些实施例中,遗传元件的长度为至少约10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000或4500个核苷酸。
仅RNA遗传元件
在一些实施例中,遗传元件由RNA组成或基本上由RNA组成。例如,在一些实施例中,遗传元件基本上不含DNA。在一些实施例中,遗传元件包含单链RNA。在一些实施例中,遗传元件包含至少一个双链区域。在一些实施例中,遗传元件的双链区域包含与RNA配对的RNA区域。
杂交的RNA-ssDNA遗传元件
在一些实施例中,遗传元件包含DNA区域。在一些实施例中,包含RNA的遗传元件进一步包含DNA区域。例如,遗传元件可以是单链的,其中单链的第一部分包含核糖核苷酸,单链的第二部分包含脱氧核糖核苷酸。在一些实施例中,包含DNA区域的遗传元件包含一个或多个具有化学修饰的DNA核苷酸。在一些实施例中,遗传元件包含DNA区域,其中DNA区域的所有核苷酸都被化学修饰。
在一些实施例中,遗传元件的至少一部分是单链的。在一些实施例中,遗传元件是单链的。在一些实施例中,遗传元件包含ssDNA。在一些实施例中,遗传元件包含双链区域。在一些实施例中,遗传元件的双链区域包含与RNA配对的RNA区域。在一些这样的实施例中,遗传元件的双链区域包含与RNA配对的DNA区域。在一些实施例中,DNA区域的至少一部分与遗传元件的RNA的至少一部分杂交。
在一些实施例中,DNA区域的长度为约10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900或900-1000个核苷酸。
RNA/DNA缀合物
在一些实施例中,遗传元件包含DNA区域。在一些实施例中,包含RNA的遗传元件进一步包含DNA区域。在一些实施例中,包含DNA区域的遗传元件包含一个或多个具有化学修饰的DNA核苷酸。在一些实施例中,遗传元件包含DNA区域,其中DNA区域的所有核苷酸都被化学修饰。
在一些实施例中,遗传元件的至少一部分是单链的。在一些实施例中,遗传元件是单链的。在一些实施例中,遗传元件包含ssDNA。在一些实施例中,遗传元件包含双链区域。在一些实施例中,遗传元件的双链区域包含与RNA配对的RNA区域。在一些这样的实施例中,遗传元件的双链区域包含与RNA配对的DNA区域。在一些实施例中,其中遗传元件包含RNA,DNA区域与遗传元件的RNA共价连接。
在一些实施例中,DNA区域的长度为约10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900或900-1000个核苷酸。
遗传元件构建体
在一些实施例中,遗传元件由遗传元件构建体产生。例如,在一些实施例中,遗传元件构建体是DNA,例如,双链DNA,并且遗传元件可以通过转录产生,从而产生RNA遗传元件。
如本文所述的指环载体的遗传元件可以从遗传元件构建体产生,该构建体包含遗传元件区域和任选的其他序列,例如杆粒(例如,包含杆状病毒基因组或其片段,例如,一个或多个杆状病毒元件)或供体载体骨架。在一些实施例中,遗传元件构建体包含指环病毒5’UTR(例如,如本文所述)。遗传元件构建体可以是适于将遗传元件序列递送到宿主细胞或无细胞系统中的任何核酸构建体,其中该遗传元件可以包封在蛋白质外壳内。在一些实施例中,遗传元件构建体包含启动子。在一些实施例中,从遗传元件构建体转录产生RNA遗传元件。
在一些实施例中,遗传元件构建体是线性核酸分子。在一些实施例中,遗传元件构建体是环状核酸分子(例如,质粒、杆粒、供体载体或微环,例如,如本文所述)。在一些实施例中,遗传元件构建体可以是双链的。在其他实施例中,遗传元件是单链的。在一些实施例中,遗传元件构建体包含DNA。在一些实施例中,遗传元件构建体包含RNA。在一些实施例中,遗传元件构建体包含一个或多个经修饰的核苷酸。
质粒
在一些实施例中,遗传元件构建体是质粒。质粒通常包含如本文所述的遗传元件序列以及适于在宿主细胞中复制的复制起点(例如,用于在细菌细胞中复制的细菌复制起点)和选择性标志(例如,抗生素抗性基因)。在一些实施例中,可以将遗传元件序列从质粒上切离。在一些实施例中,质粒能够在细菌细胞中复制。在一些实施例中,质粒能够在哺乳动物细胞(例如,人类细胞)中复制。在一些实施例中,质粒的长度为至少300、400、500、600、700、800、900、1000、2000、3000、4000或5000bp。在一些实施例中,质粒的长度小于600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10,000bp。在一些实施例中,质粒的长度为300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-4000或4000-5000bp。
小型环状核酸构建体
在一些实施例中,遗传元件构建体是环状核酸构建体,例如,缺少载体骨架(例如,缺少细菌复制起点和/或选择性标志)。在实施例中,遗传元件是单或双链环状核酸构建体。在实施例中,通过体外环化(IVC),例如,如本文所述的体外环化来产生环状核酸构建体。在实施例中,可以将双链环状核酸构建体引入宿主细胞中,在宿主细胞中它可以转化为单链环状遗传元件或用作生成单链环状遗传元件的模板,例如,如本文所述的。在一些实施例中,环状核酸构建体不包含质粒骨架或其功能性片段。在一些实施例中,环状核酸构建体的长度为至少2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400或4500bp。在一些实施例中,环状核酸构建体的长度小于2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5500或6000bp。在一些实施例中,环状核酸构建体的长度为2000-2100、2100-2200、2200-2300、2300-2400、2400-2500、2500-2600、2600-2700、2700-2800、2800-2900、2900-3000、3000-3100、3100-3200、3200-3300、3300-3400、3400-3500、3500-3600、3600-3700、3700-3800、3800-3900、3900-4000、4000-4100、4100-4200、4200-4300、4300-4400或4400-4500bp。在一些实施例中,环状核酸构建体是微环。
顺式/反式构建体
在一些实施例中,如本文所述的遗传元件构建体(例如,杆粒或供体载体)包含一个或多个编码一种或多种指环病毒ORF,例如,蛋白质外壳组分(例如,由指环病毒ORF1核酸编码的多肽,例如,如本文所述)的序列。例如,遗传元件构建体可以包含编码指环病毒ORF1分子的核酸序列。这样的遗传元件构建体可适于将遗传元件和一种或多种指环病毒ORF以顺式引入宿主细胞中。在其他实施例中,如本文所述的遗传元件构建体不包含编码一种或多种指环病毒ORF,例如,蛋白质外壳组分(例如,由指环病毒ORF1核酸编码的多肽,例如,如本文所述)的序列。例如,遗传元件构建体可以不包含编码指环病毒ORF1分子的核酸序列。这样的遗传元件构建体可适用于将遗传元件引入宿主细胞中,其中一种或多种指环病毒ORF以反式提供(例如,经由引入编码一种或多种指环病毒ORF的第二核酸构建体,或者经由整合到宿主细胞基因组中的指环病毒ORF盒)。在一些实施例中,遗传元件构建体包含适于核酸构建体在昆虫细胞(例如,Sf9细胞)中复制的骨架,例如,杆状病毒骨架区域。在一些实施例中,遗传元件构建体包含适于遗传元件构建体在细菌细胞(例如,大肠杆菌细胞,例如,DH 10Bac细胞)中复制的骨架区域。
在一些实施例中,遗传元件构建体(例如,杆粒或供体载体)包含编码指环病毒ORF1分子或者其剪接变体或功能性片段(例如,胶冻卷区域,例如,如本文所述)的序列。在实施例中,不包含遗传元件序列的遗传元件部分包含编码指环病毒ORF1分子或者其剪接变体或功能性片段的序列(例如,在包含启动子和编码指环病毒ORF1分子或者其剪接变体或功能性片段的序列的盒中)。在另外的实施例中,包含遗传元件序列的构建体部分包含编码指环病毒ORF1分子或者其剪接变体或功能性片段(例如,胶冻卷区域,例如,如本文所述)的序列。在实施例中,将这样的遗传元件包封在蛋白质外壳中(例如,如本文所述)产生了可复制型组分指环载体(例如,指环载体在感染细胞后,使细胞能够产生另外拷贝的指环载体,而无需将另外的核酸构建体,例如,编码一种或多种如本文所述的指环病毒ORF的核酸构建体引入细胞中)。
在其他实施例中,遗传元件不包含编码指环病毒ORF1分子或者其剪接变体或功能性片段(例如,胶冻卷区域,例如,如本文所述)的序列。在实施例中,将这样的遗传元件包封在蛋白质外壳中(例如,如本文所述)产生了非复制型指环载体(例如,指环载体在感染细胞后,不能使受感染细胞产生另外的指环载体,例如,在缺乏一种或多种另外构建体(例如,编码一种或多种如本文所述的指环病毒ORF)的情况下)。
表达盒
在一些实施例中,遗传元件构建体(例如,杆粒或供体载体)包含一个或多个用于表达多肽或非编码RNA(例如,miRNA或siRNA)的盒。在一些实施例中,遗传元件构建体包含用于表达效应物(例如,外源性或内源性效应物),例如,如本文所述的多肽或非编码RNA的盒。在一些实施例中,遗传元件构建体包含用于表达指环病毒蛋白(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2,或者其功能性片段)的盒。在一些实施例中,表达盒可以位于遗传元件序列内。在实施例中,效应物的表达盒位于遗传元件序列内。在实施例中,指环病毒蛋白的表达盒位于遗传元件序列内。在其他实施例中,表达盒位于遗传元件序列之外的遗传元件构建体内的某个位置(例如,在骨架中)。在实施例中,指环病毒蛋白的表达盒位于遗传元件序列之外的遗传元件构建体内的某个位置(例如,在骨架中)。
多肽表达盒通常包含启动子和编码多肽的编码序列(例如,编码指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2或者其功能性片段的序列),该多肽例如是效应物(例如,如本文所述的外源性或内源性效应物)或指环病毒蛋白。可以包含在多肽表达盒中的示例性启动子(例如,以驱动多肽的表达)包括但不限于组成型启动子(例如,CMV、RSV、PGK、EF1a或SV40启动子)、细胞或组织特异性启动子(例如,骨骼肌α-肌动蛋白启动子、肌球蛋白轻链2A启动子、抗肌萎缩蛋白启动子、肌肉型肌酸激酶启动子、肝白蛋白启动子、乙型肝炎病毒核心启动子、骨钙素启动子、骨唾液酸蛋白启动子、CD2启动子、免疫球蛋白重链启动子、T细胞受体α链启动子、神经元特异性烯醇化酶(NSE)启动子或神经丝蛋白轻链启动子)以及诱导型启动子(例如,锌诱导型绵羊金属硫蛋白(MT)启动子;地塞米松(Dex)诱导型小鼠乳腺瘤病毒(MMTV)启动子;T7聚合酶启动子系统、四环素阻遏系统、四环素诱导系统、RU486诱导系统、雷帕霉素诱导系统),例如,如本文所述。在一些实施例中,表达盒进一步包含增强子,例如,如本文所述的增强子。
基于RNA的遗传元件的产生
基于RNA的遗传元件可以通过多种方法产生。例如,包含DNA的遗传元件构建体可以被转录以产生包含RNA的遗传元件,例如,如上所述。转录可以发生例如在细胞或无细胞系统中。RNA可以在体外合成,例如通过固相合成。
蛋白质组分的产生
指环载体的蛋白质组分,例如ORF1,可以以本文描述的多种方式产生。
杆状病毒表达系统
病毒表达系统(例如,杆状病毒表达系统)可以用于表达蛋白质(例如,用于产生指环载体),例如,如本文所述。杆状病毒为具有环状、超螺旋的双链DNA基因组的杆状的病毒。杆状病毒属包括:甲型杆状病毒(核型多角体病毒(nucleopolyhedrovirus,NPV),从鳞翅目分离)、乙型杆状病毒(颗粒体病毒(GV),从鳞翅目分离)、丙型杆状病毒(NPV,从膜翅目(Hymenoptera)分离)和丁型杆状病毒(NPV,从双翅目(Diptera)分离)。GV通常每个包膜仅含有一个核衣壳,而NPV通常每个包膜含有单个(SNPV)或多个(MNPV)核衣壳。有包膜的病毒体被进一步包含在GV的颗粒蛋白基质中和NPV的多角体蛋白中。杆状病毒通常具有裂解和包含的生命周期。在一些实施例中,裂解和包含的生命周期在病毒复制的三个阶段中独立出现:早期、晚期和极晚期。在一些实施例中,在早期期间,病毒DNA复制在病毒进入宿主细胞、早期病毒基因表达和宿主基因表达机构切断之后发生。在一些实施例中,在晚期,编码病毒DNA复制的晚期基因被表达,病毒颗粒被组装,并且细胞外病毒(EV)由宿主细胞产生。在一些实施例中,在极晚期,多角体蛋白和p10基因被表达,封闭病毒(OV)由宿主细胞产生,并且宿主细胞被裂解。由于杆状病毒感染昆虫物种,它们可以用作在生物制剂,在杆状病毒允许性昆虫细胞或幼虫中产生外源性蛋白。杆状病毒的不同分离株,例如苜蓿银纹夜蛾(Autographa californica)多核多角体病毒(AcMNPV)和家蚕(Bombyx mori)(桑蚕)核多角体病毒(BmNPV)可以用于外源性蛋白表达。各种杆状病毒表达系统是市售的,例如,购自赛默飞世尔公司(ThermoFisher)。
在一些实施例中,本文所述的蛋白质(例如,指环病毒ORF分子,例如,ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2或其功能性片段或剪接变体)可以使用包含本文所述的一种或多种组分的杆状病毒表达载体(例如,杆粒)表达。例如,杆状病毒表达载体可以包含选择性标志(例如,kanR)、复制起点(例如,细菌复制起点和昆虫细胞复制起点中的一种或两种)、重组酶识别位点(例如,att位点)和启动子中的一种或多种(例如,所有)。在一些实施例中,可以通过用编码本文所述蛋白质的基因替换天然存在的编码杆状病毒包含体的野生型多角体蛋白基因来产生杆状病毒表达载体(例如,如本文所述的杆粒)。在一些实施例中,将编码本文所述蛋白质的基因克隆到含有杆状病毒启动子的杆状病毒表达载体(例如,如本文所述的杆粒)。在一些实施例中,杆状病毒载体包含一个或多个非杆状病毒启动子,例如,哺乳动物启动子或指环病毒启动子。在一些实施例中,将编码本文所述蛋白质的基因克隆到供体载体(例如,如本文所述)中,随后将该载体与空杆状病毒表达载体(例如,空杆粒)接触,使得编码本文所述蛋白质的基因从供体载体转移(例如,通过同源重组或转座酶活性)至杆状病毒表达载体(例如,杆粒)中。在一些实施例中,杆状病毒启动子的侧翼是来自非必要多角体蛋白基因座的杆状病毒DNA。在一些实施例中,本文所述的蛋白质在病毒复制的极晚期处于AcNPV多角体蛋白启动子的转录控制下。在一些实施例中,适合用于昆虫细胞中的杆状病毒表达的强启动子包括但不限于杆状病毒p10启动子、多角体蛋白(polh)启动子、p6.9启动子和衣壳蛋白启动子。适合用于昆虫细胞中的杆状病毒表达的弱启动子包括杆状病毒的ie1、ie2、ie0、et1、39K(aka pp31)和gp64启动子。
在一些实施例中,通过杆状病毒基因组(例如,野生型或突变型杆状病毒基因组)与转移载体之间的同源重组来产生重组杆状病毒。在一些实施例中,将一个或多个编码本文所述蛋白质的基因克隆到转移载体中。在一些实施例中,转移载体进一步含有杆状病毒启动子,该启动子的侧翼是来自非必要基因座例如多角体蛋白基因的DNA。在一些实施例中,通过杆状病毒基因组与转移载体之间的同源重组将一个或多个编码本文所述蛋白质的基因插入杆状病毒基因组中。在一些实施例中,将杆状病毒基因组在一个或多个独特位点处线性化。在一些实施例中,线性化的位点位于靶位点附近,该靶位点用于将编码本文所述蛋白质的基因插入杆状病毒基因组中。在一些实施例中,可以使用缺失基因(例如多角体蛋白基因)下游的杆状病毒基因组的线性化杆状病毒基因组进行同源重组。在一些实施例中,将杆状病毒基因组和转移载体共转染到昆虫细胞中。在一些实施例中,产生重组杆状病毒的方法包括以下步骤:制备用于与含有编码一种或多种本文所述蛋白质的基因的转移载体进行同源重组的杆状病毒基因组,并且将该转移载体与杆状病毒基因组DNA共转染到昆虫细胞中。在一些实施例中,杆状病毒基因组包含与转移载体的区域同源的区域。这些同源区域可以增强杆状病毒基因组与转移载体之间重组的可能性。在一些实施例中,转移载体中的同源区域位于启动子上游或下游。在一些实施例中,为诱导同源重组,将杆状病毒基因组与转移载体以约1:1至10:1的重量比混合。
在一些实施例中,通过以下方法产生重组杆状病毒:该方法包括用Tn7进行位点特异性转座,例如,从而将编码本文所述蛋白质的基因插入杆粒DNA中,例如,在细菌中繁殖,这些细菌是例如大肠杆菌(例如,DH 10Bac细胞)。在一些实施例中,将编码本文所述蛋白质的基因克隆到载体中并且转化到感受态细胞例如感受态细胞(含有具有最小attTn7靶位点的杆粒DNA)中。在一些实施例中,杆状病毒表达载体(例如,载体)可以具有启动子,例如双启动子(例如,多角体蛋白启动子、p10启动子)。市售供体质粒包括:pFASTBAC 1、pFASTBAC HT和pFASTBAC DUAL。在一些实施例中,鉴定含有重组杆粒DNA的集落并且分离杆粒DNA以转染昆虫细胞。
在一些实施例中,将杆状病毒载体与辅助核酸一起引入昆虫细胞中。引入可以为同时进行或依次进行。在一些实施例中,辅助核酸提供了一种或多种杆状病毒蛋白,例如,以促进杆状病毒载体的包装。在一些实施例中,在昆虫细胞中产生(例如,通过同源重组)的重组杆状病毒被扩增并用于感染昆虫细胞(例如,在中对数生长期)以进行重组蛋白表达。在一些实施例中,通过在细菌例如大肠杆菌中的位点特异性转座产生的重组杆粒DNA用于使用转染剂(例如II)来转染昆虫细胞。关于杆状病毒表达系统的其他信息在美国专利申请号14/447,341、14/277,892和12/278,916中讨论,以上申请通过引用特此并入。
昆虫细胞系统
本文所述的蛋白质可以在用重组杆状病毒或杆粒DNA(例如,如上所述)感染或转染的昆虫细胞中表达。在一些实施例中,昆虫细胞包括:来源于草地贪夜蛾(Spodopterafrugiperda)的Sf9和Sf21细胞以及来源于粉纹夜蛾(Trichoplusia ni)的Tn-368和HighFiveTMBTI-TN-5B1-4细胞(也称为Hi5细胞)。在一些实施例中,来源于蛹期草地贪夜蛾(Spodoptera frugiperda,fall army worm)卵巢的昆虫细胞系Sf21和Sf9可以用于使用杆状病毒表达系统表达重组蛋白。在一些实施例中,Sf21和Sf9昆虫细胞可以在市售的补充血清的培养基或无血清培养基中培养。用于培养昆虫细胞的合适培养基包括:格雷斯补充培养基(Grace’s Supplemented,TNM-FH)、IPL-41、TC-100、施耐德果蝇培养基(Schneider’sDrosophila,)、SF-900II SFM和EXPRESS-FIVETMSFM。在一些实施例中,一些无血清培养基配制品利用磷酸盐缓冲系统将培养物pH维持在6.0-6.4范围内(Licari等人,Insect cellhosts for baculovirus expression vectors contain endogenous exoglycosidaseactivity[用于杆状病毒表达载体的昆虫细胞宿主含有内源性外切糖苷酶活性].Biotechnology Progress[生物技术进展]9:146-152(1993)和Drugmand等人Insectcells as factories for biomanufacturing[作为生物制造工厂的昆虫细胞].Biotechnology Advances[生物技术进展]30:1140-1157(2012)),用于培养和重组蛋白产生。在一些实施例中,对于培养不同昆虫细胞系而言,可以使用6.0-6.8的pH。在一些实施例中,昆虫细胞在25℃至30℃的温度在通气情况下在悬浮液中培养或作为单层培养。关于昆虫细胞的其他信息在例如专利申请号14/564,512和14/775,154中讨论,以上每篇申请均通过引用特此并入。
哺乳动物细胞系统
在一些实施例中,本文所述的蛋白质可在用编码蛋白质的载体感染或转染的动物细胞系中体外表达,例如,如本文所述。在本披露的背景下设想的动物细胞系包括猪细胞系,例如,永生化猪细胞系,如但不限于猪肾上皮细胞系PK-15和SK、单核髓系细胞系3D4/31和睾丸细胞系ST。此外,还包括其他哺乳动物细胞系,如CHO细胞(中国仓鼠卵巢)、MARC-145、MDBK、RK-13、EEL。另外地或替代性地,本发明方法的特定实施例利用了动物细胞系,其是上皮细胞系,即上皮谱系细胞的细胞系。适合表达本文所述蛋白质的细胞系包括但不限于人类或灵长类动物来源的细胞系,例如人或灵长类动物肾癌细胞系。
效应物
本文所述的组合物和方法可用于产生指环载体的遗传元件,该指环载体包含编码效应物(例如,外源性效应物或内源性效应物)的序列,例如,如本文所述的。在一些实施例中,遗传元件是效应物,例如,遗传元件是功能性RNA。在一些情况下,效应物可以是内源性效应物或外源性效应物。在一些实施例中,效应物是治疗性效应物。在一些实施例中,效应物包括多肽(例如,治疗性多肽或肽,例如,如本文所述)。在一些实施例中,效应物包括非编码RNA(例如,miRNA、siRNA、shRNA、mRNA、lncRNA、RNA、DNA、反义RNA或gRNA)。在一些实施例中,效应物包括调节性核酸,例如,如本文所述的调节性核酸。
体外组装方法
例如,可以通过体外组装产生指环载体。在一些实施例中,遗传元件在允许组装的条件下在体外与ORF1接触。
在一些实施例中,杆状病毒构建体用于产生指环病毒蛋白。然后可以使用这些蛋白质,例如,用于体外组装以包封遗传元件,例如,包含RNA的遗传元件。在一些实施例中,将编码一种或多种指环病毒蛋白的多核苷酸与启动子融合,以在宿主细胞(例如昆虫或动物细胞)中表达。在一些实施例中,将多核苷酸克隆到杆状病毒表达系统中。在一些实施例中,将宿主细胞,例如昆虫细胞用杆状病毒表达系统感染并孵育一段时间。在一些实施例中,将感染的细胞孵育约1、2、3、4、5、10、15或20天。在一些实施例中,将感染细胞裂解以回收指环病毒蛋白。
在一些实施例中,将分离的指环病毒蛋白纯化。在一些实施例中,使用纯化技术将指环病毒蛋白纯化,这些纯化技术包括但不限于螯合纯化、肝素纯化、梯度沉降纯化和/或SEC纯化。在一些实施例中,将纯化的指环病毒蛋白与遗传元件混合以包封遗传元件,例如,包含RNA的遗传元件。在一些实施例中,使用ORF1蛋白、ORF2蛋白或其经修饰形式包封遗传元件。在一些实施例中,包封两个核酸。例如,第一核酸可以是mRNA,例如化学修饰的mRNA,第二核酸可以是DNA。
在一些实施例中,编码指环病毒(AV)ORF1(例如,野生型ORF1蛋白、携带突变(例如以改善组装效率、产量或稳定性)的ORF1蛋白,嵌合ORF1蛋白或其片段)的DNA在昆虫细胞系(例如,Sf9和/或HighFive)、动物细胞系(例如,鸡细胞系(MDCC))、细菌细胞(例如,大肠杆菌)和/或哺乳动物细胞系(例如,293expi和/或MOLT4)中表达。在一些实施例中,编码AVORF1的DNA可以是未标记的。在一些实施例中,编码AV ORF1的DNA可以含有N-末端和/或C-末端融合的标签。在一些实施例中,编码AV ORF1的DNA可能在ORF1蛋白内携带突变、插入或缺失以引入标签,例如,从而帮助纯化和/或通过免疫染色测定(包括但不限于ELISA或蛋白质印迹)鉴定身份。在一些实施例中,编码AV ORF1的DNA可以单独表达或与任意数量的辅助蛋白一起表达。在一些实施例中,编码AV ORF1的DNA与AV ORF2和/或ORF3蛋白一起表达。
在一些实施例中,携带突变以改善组装效率的ORF1蛋白可以包括但不限于携带引入N-末端精氨酸臂(ARG臂)以改变ARG臂的pI的突变的ORF1蛋白质,从而允许pH敏感性核酸结合以触发颗粒组装(SEQ ID 3-5)。在一些实施例中,携带改善稳定性的突变的ORF1蛋白可以包括对接触典型胶冻卷β-桶的β链F和G的原体间的突变,以改变原体表面的疏水状态并改善衣壳形成的热力学有利性。
在一些实施例中,嵌合ORF1蛋白可以包括但不限于ORF1蛋白,其序列的一部分或多部分被来自另一种衣壳蛋白(例如,喙羽病病毒(BFDV)衣壳蛋白,或戊型肝炎衣壳蛋白)的可比部分替代,例如,Ring 9ORF1的ARG臂或F和Gβ链被来自BFDV衣壳蛋白的可比组分替代。在一些实施例中,嵌合ORF1蛋白还可以包括ORF1蛋白,其序列的一部分或多部分被另一种AV ORF1蛋白的可比部分替代(例如,Ring 2ORF1的胶冻卷片段或C-末端部分被Ring9ORF1的可比部分替代)。
在一些实施例中,本披露描述了制备指环载体的方法,该方法包括:(a)提供混合物,该混合物含有:(i)包含RNA的遗传元件,和(ii)ORF1分子;以及(b)在适用于将遗传元件包封在包含ORF1分子的蛋白质外壳内的条件下孵育混合物,从而制备指环载体;任选地,其中该混合物不包含在细胞中。在一些实施例中,方法进一步包括在提供(a)之前,例如在宿主细胞(例如昆虫细胞或哺乳动物细胞)中表达ORF1分子。在一些实施例中,表达包括在适用于产生ORF1分子的条件下孵育包含编码ORF1分子的核酸分子(例如杆状病毒表达载体)的宿主细胞(例如,昆虫细胞或哺乳动物细胞)。在一些实施例中,方法进一步包括在提供(a)之前,纯化由宿主细胞表达的ORF1分子。在一些实施例中,该方法在无细胞系统中进行。在一些实施例中,本披露描述了制备指环载体组合物的方法,其包括:(a)提供多个根据前述实施例中任一项所述的指环载体或组合物;(b)任选地对多个根据前述实施例中任一项所述的指环载体或组合物评估以下一种或多种:本文所述的污染物、光密度测量(例如,OD260)、颗粒数(例如,通过HPLC)、感染性(例如,颗粒:感染性单位比,例如,通过荧光和/或ELISA测定);以及(c)例如,如果(b)中的一个或多个参数满足指定阈值,则将多个指环载体配制为,例如,适合施用给受试者的药物组合物。
富集和纯化
可以纯化和/或富集收获的指环载体,例如,以产生指环载体制剂。在一些实施例中,从收获溶液中存在的其他成分或污染物中分离出收获的指环载体,例如,使用本领域已知的纯化病毒颗粒的方法(例如,通过沉降、色谱法和/或超滤进行纯化)。在一些实施例中,将收获的指环载体通过亲和纯化(例如,肝素亲和纯化)进行纯化。在一些实施例中,将收获的指环载体通过尺寸排阻色谱法(例如,使用Tris缓冲液流动相)来纯化。在一些实施例中,将收获的指环载体通过阴离子交换色谱法(例如,Mustang Q膜色谱法)来纯化。在一些实施例中,将收获的指环载体通过混合模式色谱法(例如,使用混合模式树脂,例如Cato700树脂)来纯化。在一些实施例中,纯化步骤包括从制剂中去除血清、宿主细胞DNA、宿主细胞蛋白质、缺少遗传元件的颗粒和/或酚红中的一种或多种。在一些实施例中,相对于收获溶液中存在的其他成分或污染物,富集收获的指环载体,例如,使用本领域已知的富集病毒颗粒的方法。
在一些实施例中,由此产生的制剂或包含该制剂的药物组合物在可接受的期限和温度范围内是稳定的,和/或与所期望的施用途径和/或该施用途径所期望的任何装置,例如,针头或注射器相容。
II.指环载体
在一些方面,本披露提供了使用和制备指环载体、指环载体制剂和治疗性组合物的组合物和方法。在一些实施例中,指环载体包含一种或多种核酸或多肽,这些核酸或多肽包含基于指环病毒(例如,如本文所述的指环病毒)或者其片段或部分或者其他基本上非致病性病毒(例如,共生病毒(symbiotic virus)、共栖病毒(commensal virus)、原生病毒)的序列、结构和/或功能。在一些实施例中,基于指环病毒的指环载体包含至少一个针对该指环病毒而言具有外源性的元件,例如,外源性效应物或编码位于指环载体遗传元件内的外源性效应物的核酸序列。在一些实施例中,基于指环病毒的指环载体包含至少一个针对来自该指环病毒的另一元件具有异源性的元件,例如,效应物编码核酸序列,其针对另一相连的核酸序列,如启动子元件,具有异源性。在一些实施例中,指环载体包含遗传元件(例如,环状DNA,例如,单链DNA),其包含至少一个相对于该遗传元件的其余部分和/或蛋白质外壳而言具有异源性的元件(例如,编码效应物的外源性元件,例如,如本文所述)。指环载体可以是用于使有效载荷进入宿主,例如人类中的递送媒介物(例如,基本上非致病性递送媒介物)。在一些实施例中,指环载体能够在真核细胞例如哺乳动物细胞例如人类细胞中复制。在一些实施例中,指环载体在哺乳动物(例如人类)细胞中是基本上非致病性的和/或基本上非整合的。在一些实施例中,指环载体在哺乳动物例如人类中是基本上非免疫原性的。在一些实施例中,指环载体是复制缺损型。在一些实施例中,指环载体是可复制型。
在一些实施例中,指环载体包含愈合子(curon)或其组分(例如,遗传元件,例如,包含编码效应物和/或蛋白质外壳的序列),例如,如PCT申请号PCT/US2018/037379中所述的,其通过引用以其全文并入本文。在一些实施例中,指环载体包含指环载体或其组分(例如,遗传元件,例如,包含编码效应物和/或蛋白质外壳的序列),例如,如PCT申请号PCT/US19/65995中所述的,其通过引用以其全文并入本文。
在一方面,本发明包括指环载体,其包含:(i)遗传元件,其包含启动子元件、编码效应物(例如,内源性效应物或外源性效应物,例如,有效载荷)的序列和蛋白质结合序列(例如,外壳蛋白质结合序列,例如,包装信号),其中该遗传元件是单链DNA,并具有以下一种或两种特性:为环状和/或以小于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合到真核细胞的基因组中;和(ii)蛋白质外壳;其中遗传元件被包封在蛋白质外壳内;并且其中该指环载体能够将遗传元件递送到真核细胞中。
在本文描述的指环载体的一些实施例中,遗传元件以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合。在一些实施例中,施用给受试者的多个指环载体的少于约0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%或5%的遗传元件将整合到受试者的一个或多个宿主细胞的基因组中。在一些实施例中,指环载体,例如,如本文所述的指环载体群体的遗传元件整合到宿主细胞基因组中的频率低于同类的AAV病毒群体的频率,例如,其频率比同类的AAV病毒群体低约50%、60%、70%、75%、80%、85%、90%、95%、100%或更多。
在一方面,本发明包括指环载体,该指环载体包含:(i)遗传元件,其包含启动子元件和编码效应物(例如,内源性效应物或外源性效应物,例如有效载荷)的序列和蛋白质结合序列(例如,外壳蛋白质结合序列),其中该遗传元件与野生型指环病毒序列(例如,野生型细环病毒(TTV)、小细环病毒(TTMV)或TTMDV序列,例如本文所述的野生型指环病毒序列)具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;和(ii)蛋白质外壳;其中遗传元件被包封在蛋白质外壳内;并且其中该指环载体能够将遗传元件递送到真核细胞中。
在一个方面中,本发明包括指环载体,该指环载体包含:
a)遗传元件,其包含(i)编码外壳蛋白(例如,非致病性外壳蛋白)的序列,(ii)使该遗传元件与该非致病性外壳蛋白结合的外壳蛋白结合序列,和(iii)编码效应物(例如,内源性效应物或外源性效应物)的序列;以及
b)蛋白质外壳,其与该遗传元件相关联,例如,包裹或包封该遗传元件。
在一些实施例中,指环载体包括来自非包膜环状单链DNA病毒的序列或表达产物(或与其具有>70%、75%、80%、85%、90%、95%、97%、98%、99%、100%同源性)。动物性环状单链DNA病毒通常是指感染真核非植物宿主并具有环状基因组的单链DNA(ssDNA)病毒亚群。因此,动物性环状ssDNA病毒可区别于感染原核生物的ssDNA病毒(即,微小噬菌体科和丝状噬菌体科)和感染植物的ssDNA病毒(即,双生病毒科和矮化病毒科)。它们也可区别于感染非植物真核生物的线性ssDNA病毒(即,细小病毒科)。
在一些实施例中,指环载体调节宿主细胞功能,例如,短暂或长期调节。在某些实施例中,细胞功能发生稳定改变,例如持续存在以下时间的调节:至少约1小时至约30天,或至少约2小时、6小时、12小时、18小时、24小时、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、16天、17天、18天、19天、20天、21天、22天、23天、24天、25天、26天、27天、28天、29天、30天、60天或更长时间或者其间的任何时间。在某些实施例中,细胞功能发生短暂改变,例如持续存在以下时间的调节:不超过约30分钟至约7天,或不超过约1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、24小时、36小时、48小时、60小时、72小时、4天、5天、6天、7天或其间的任何时间。
在一些实施例中,遗传元件包括启动子元件。在实施例中,启动子元件选自RNA聚合酶II依赖性启动子、RNA聚合酶III依赖性启动子、PGK启动子、CMV启动子、EF-1α启动子、SV40启动子、CAGG启动子或UBC启动子、TTV病毒启动子、组织特异性启动子、U6(pollIII)、具有活化蛋白(TetR-VP16、Gal4-VP16、dCas9-VP16等)的上游DNA结合位点的最小CMV启动子。在实施例中,启动子元件包含TATA盒。在实施例中,启动子元件对于野生型指环病毒,例如,如本文所述的野生型指环病毒而言是内源性的。
在一些实施例中,遗传元件包括以下特征中的一种或多种:单链、环状、负链和/或DNA。在实施例中,遗传元件包括附加体。在一些实施例中,除效应物之外的遗传元件部分的组合大小为约2.5kb-5kb(例如,约2.8kb-4kb、约2.8kb-3.2kb、约3.6kb-3.9kb或约2.8kb-2.9kb)、小于约5kb(例如,小于约2.9kb、3.2kb、3.6kb、3.9kb或4kb)或至少100个核苷酸(例如,至少1kb)。
在一些实施例中,将指环载体或指环载体中包含的遗传元件引入细胞(例如,人类细胞)中。在一些实施例中,例如由指环载体的遗传元件编码的效应子(例如,RNA,例如miRNA)在细胞(例如,人类细胞)中表达,例如,一旦将指环载体或遗传元件引入细胞中。在实施例中,将指环载体或其中包含的遗传元件引入细胞中例如通过改变细胞中靶分子的表达水平,来调节(例如,增加或减少)靶分子(例如,靶核酸,例如RNA,或靶多肽)在细胞中的水平。在实施例中,引入指环载体或其中包含的遗传元件降低了细胞产生的干扰素的水平。在实施例中,将指环载体或其中包含的遗传元件引入细胞中调节(例如,增加或减少)细胞的功能。在实施例中,将指环载体或其中包含的遗传元件引入细胞中调节(例如,增加或降低)细胞的存活力。在实施例中,将指环载体或其中包含的遗传元件引入细胞中降低了细胞(例如癌细胞)的存活力。
在一些实施例中,本文所述的指环载体(例如,合成指环载体)诱发的抗体阳性率低于70%(例如,低于约60%、50%、40%、30%、20%或10%的抗体阳性率)。在实施例中,根据本领域已知的方法确定抗体阳性率。在实施例中,通过检测生物样品中针对指环病毒(例如,如本文所述)或基于其的指环载体的抗体来确定抗体阳性率,例如,根据在以下文献中描述的抗TTV抗体检测方法:Tsuda等人(1999;J.Virol.Methods[病毒学方法杂志]77:199-206;通过引用并入本文)和/或根据在以下文献中描述的用于测定抗TTV IgG血清阳性率的方法:Kakkola等人(2008;Virology[病毒学]382:182-189;通过引用并入本文)。还可以通过本领域用于检测抗病毒抗体的方法来检测针对指环病毒或基于指环病毒的指环载体的抗体,这些方法是例如检测抗AAV抗体的方法,例如,如Calcedo等人(2013;Front.Immunol.[免疫学前沿]4(341):1-7;其通过引用并入本文)中所述。
在一些实施例中,复制缺损型、复制缺陷型或非复制型遗传元件不编码遗传元件复制所需的所有必要机构或组分。在一些实施例中,复制缺陷型遗传元件不编码复制因子。在一些实施例中,复制缺陷型遗传元件不编码一种或多种ORF(例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3,例如,如本文所述)。在一些实施例中,可以以反式提供不由遗传元件编码的机构或组分(例如,在由宿主细胞包含的核酸中编码,例如整合到宿主细胞的基因组中),例如,使得遗传元件可以在以反式提供的机构或组分存在的情况下进行复制。
在一些实施例中,包装缺损型、包装缺陷型或非包装型遗传元件不能被包装到蛋白质外壳(例如,其中蛋白质外壳包含衣壳或其部分,例如,包含由ORF1核酸编码的多肽,例如,如本文所述)中。在一些实施例中,与野生型指环病毒(例如,如本文所述)相比,包装缺损型遗传元件被包装到蛋白质外壳中的效率低于10%(例如,低于10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%或0.001%)。在一些实施例中,即使在存在允许包装野生型指环病毒遗传元件(例如,如本文所述)的因子(例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、或ORF2t/3)的情况下,包装缺陷型遗传元件也不能被包装到蛋白质外壳中。在一些实施例中,即使在存在允许包装野生型指环病毒遗传元件(例如,如本文所述)的因子(例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3或ORF2t/3)的情况下,与野生型指环病毒(例如,如本文所述)相比,包装缺损型遗传元件被包装到蛋白质外壳中的效率也低于10%(例如,低于10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%或0.001%)。
在一些实施例中,可包装型遗传元件可被包装到蛋白质外壳(例如,其中蛋白质外壳包含衣壳或其部分,例如,包含由ORF1核酸编码的多肽,例如,如本文所述)中。在一些实施例中,与野生型指环病毒(例如,如本文所述)相比,可包装型遗传元件被包装到蛋白质外壳中的效率为至少20%(例如,至少20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%或更高)。在一些实施例中,在存在允许包装野生型指环病毒遗传元件(例如,如本文所述)的因子(例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、或ORF2t/3)的情况下,可包装型遗传元件可以被包装到蛋白质外壳中。在一些实施例中,在存在允许包装野生型指环病毒遗传元件(例如,如本文所述)的因子(例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3或ORF2t/3)的情况下,与野生型指环病毒(例如,如本文所述)相比,可包装型遗传元件被包装到蛋白质外壳中的效率为至少20%(例如,至少20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%或更高)。
指环病毒
在一些实施例中,指环载体,例如,如本文所述的指环载体包含源自指环病毒的序列或表达产物。在一些实施例中,指环载体包括一个或多个相对于指环病毒而言具有外源性的序列或表达产物。在一些实施例中,指环载体包括一个或多个相对于指环病毒而言具有内源性的序列或表达产物。在一些实施例中,指环载体包括一个或多个相对于指环载体中一个或多个其他序列或表达产物而言具有异源性的序列或表达产物。指环病毒通常具有负极性的单链环状DNA基因组。
在一些实施例中,遗传元件包含编码以下的核苷酸序列:氨基酸序列或其功能性片段或与本文所述的氨基酸序列中任一个(例如,指环病毒氨基酸序列)具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,如本文所述的指环载体包含一种或多种核酸分子(例如,如本文所述的遗传元件),这些核酸分子包含与指环病毒序列,例如,如本文所述的指环病毒序列或者其片段具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,如本文所述的指环载体包含一种或多种核酸分子(例如,如本文所述的遗传元件),这些核酸分子包含与指环病毒(例如,如本文所述的指环病毒)的TATA盒、加帽位点、起始元件、转录起始位点、5’UTR保守结构域、ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3、三个开放阅读框区域、多(A)信号、GC富集区或其任何组合中的一种或多种具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,核酸分子包含编码衣壳蛋白,例如,本文所述任一指环病毒的ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3的序列。在实施例中,核酸分子包含编码衣壳蛋白的序列,该衣壳蛋白包含与指环病毒ORF1蛋白(或者其剪接变体或功能性片段)或由指环病毒ORF1核酸编码的多肽具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在实施例中,核酸分子包含与表A1的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF2t/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表B1的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表C1的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒TAIP核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表D1的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒TAIP核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表D1的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表E1的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒TAIP核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在一些实施例中,遗传元件包含编码以下的核苷酸序列:氨基酸序列或其功能性片段或与本文所述的氨基酸序列中任一个(例如,指环病毒氨基酸序列)具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,如本文所述的指环载体包含一种或多种核酸分子(例如,如本文所述的遗传元件),这些核酸分子包含与指环病毒序列,例如,如本文所述的指环病毒序列或者其片段具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,指环载体包含选自如表A1-M2中任一个所示的序列或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列的核酸序列。在实施例中,指环载体包含多肽,该多肽包含表A2-M2中任一个所示的序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,如本文所述的指环载体包含一种或多种核酸分子(例如,如本文所述的遗传元件),这些核酸分子包含与本文所述的指环病毒中任一个的TATA盒、加帽位点、起始元件、转录起始位点、5’UTR保守结构域、ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3、三个开放阅读框区域、多(A)信号、GC富集区或其任何组合中的一种或多种具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列(例如,表A-M中任一个所注释的指环病毒序列或表A-M中任一个所列序列编码的指环病毒序列)。在一些实施例中,核酸分子包含编码衣壳蛋白,例如,本文所述任一指环病毒的ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3序列(例如,表A-M中任一个所注释的指环病毒序列或表A-M中任一个所列序列编码的指环病毒序列)。在实施例中,核酸分子包含编码衣壳蛋白的序列,该衣壳蛋白包含与指环病毒ORF1或ORF2蛋白(例如,表A2-M2中任一个所示的ORF1或ORF2氨基酸序列,或者由表A1-M1中任一个所示的核酸序列编码的ORF1或ORF2氨基酸序列)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,核酸分子包含编码衣壳蛋白的序列,该衣壳蛋白包含与指环病毒ORF1蛋白(例如,表A2-M2中任一个所示的ORF1氨基酸序列,或者由表A1-M1中任一个所示的核酸序列编码的ORF1氨基酸序列)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一些实施例中,如本文所述的指环载体是嵌合指环载体。在一些实施例中,嵌合指环载体进一步包含一种或多种来自除指环病毒以外的病毒的元件、多肽或核酸。
在实施例中,嵌合指环载体包含多种多肽(例如,指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3),这些多肽包含来自多种不同指环病毒(例如,如本文所述的指环病毒)的序列。例如,嵌合指环载体可以包含来自一种指环病毒的ORF1分子(例如,Ring1 ORF1分子,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1分子);和来自不同指环病毒的ORF2分子(例如,Ring2 ORF2分子,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2分子)。在另一实例中,嵌合指环载体可以包含来自一种指环病毒的第一ORF1分子(例如,Ring1 ORF1分子,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1分子)和来自不同指环病毒的第二ORF1分子(例如,Ring2 ORF1分子,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1分子)。
在一些实施例中,指环载体包含嵌合多肽(例如,指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3),例如,该嵌合多肽包含至少一个来自一种指环病毒(例如,如本文所述)的部分和至少一个来自不同病毒(例如,如本文所述)的部分。
在一些实施例中,指环载体包含嵌合多肽(例如,指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3),例如,该嵌合多肽包含至少一个来自一种指环病毒(例如,如本文所述)的部分和至少一个来自不同指环病毒(例如,如本文所述)的部分。在实施例中,指环载体包含嵌合ORF1分子,其包含来自一种指环病毒(例如,如本文所述)的ORF1分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF1分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1分子的至少一个部分。在实施例中,嵌合ORF1分子包含来自一种指环病毒的ORF1胶冻卷结构域,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列;和来自不同指环病毒的ORF1氨基酸子序列(例如,如本文所述)或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,嵌合ORF1分子包含来自一种指环病毒的ORF1精氨酸富集区,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列;和来自不同指环病毒的ORF1氨基酸子序列(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,嵌合ORF1分子包含来自一种指环病毒的ORF1高变结构域,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列;和来自不同指环病毒的ORF1氨基酸子序列(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,嵌合ORF1分子包含来自一种指环病毒的ORF1N22结构域,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列;和来自不同指环病毒的ORF1氨基酸子序列(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,嵌合ORF1分子包含来自一种指环病毒的ORF1 C-末端结构域,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列;和来自不同指环病毒的ORF1氨基酸子序列(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,指环载体包含嵌合ORF1/1分子,其包含来自一种指环病毒(例如,如本文所述)的ORF1/1分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1/1分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF1/1分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1/1分子的至少一个部分。在实施例中,指环载体包含嵌合ORF1/2分子,其包含来自一种指环病毒(例如,如本文所述)的ORF1/2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1/2分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF1/2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1/2分子的至少一个部分。在实施例中,指环载体包含嵌合ORF2分子,其包含来自一种指环病毒(例如,如本文所述)的ORF2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2分子的至少一个部分。在实施例中,指环载体包含嵌合ORF2/2分子,其包含来自一种指环病毒(例如,如本文所述)的ORF2/2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2/2分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF2/2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2/2分子的至少一个部分。在实施例中,指环载体包含嵌合ORF2/3分子,其包含来自一种指环病毒(例如,如本文所述)的ORF2/3分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2/3分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF2/3分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2/3分子的至少一个部分。在实施例中,指环载体包含嵌合ORF2T/3分子,其包含来自一种指环病毒(例如,如本文所述)的ORF2T/3分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2T/3分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF2T/3分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2T/3分子的至少一个部分。
例如,在PCT申请号PCT/US2018/037379和PCT/US19/65995(其通过引用以其全文并入本文)中描述了其他示例性指环病毒基因组,其中包含的序列或子序列可用于本文所述的组合物和方法中。在一些实施例中,示例性指环病毒序列包含如PCT/US19/65995(其通过引用并入本文)的表A1、A3、A5、A7、A9、A11、B1-B5、1、3、5、7、9、11、13、15或17中任一个所列的核酸序列。在一些实施例中,示例性指环病毒序列包含如PCT/US19/65995(其通过引用并入本文)的表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中任一个所列的氨基酸序列。在一些实施例中,示例性指环病毒序列包含ORF1分子序列或编码其的核酸序列,例如,如PCT/US19/65995(其通过引用并入本文)的表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10或37A-37C中任一个所列。
表A1.示例性指环病毒核酸序列(甲型细环病毒,分支3)
注释:
表A2.示例性指环病毒氨基酸序列(甲型细环病毒,分支3)
表B1.示例性指环病毒核酸序列(乙型细环病毒)
注释:
表B2.示例性指环病毒氨基酸序列(乙型细环病毒)
表C1.示例行指环病毒核酸序列(丙型细环病毒)
注释:
表C2.示例性指环病毒氨基酸序列(丙型细环病毒)
表D1.示例性指环病毒核酸序列(乙型细环病毒)
注释:
表D2.示例性指环病毒氨基酸序列(乙型细环病毒)
表E1:示例性指环病毒核酸序列(乙型细环病毒)
注释:
表E2.示例性指环病毒氨基酸序列(乙型细环病毒)
在一些实施例中,指环载体包含核酸,该核酸包含在PCT申请号PCT/US2018/037379(其通过引用以其全文并入本文)中列出的序列。在一些实施例中,指环载体包含多肽,该多肽包含在PCT申请号PCT/US2018/037379(其通过引用以其全文并入本文)中列出的序列。在一些实施例中,指环载体包含核酸,该核酸包含在PCT申请号PCT/US19/65995(其通过引用以其全文并入本文)中列出的序列。在一些实施例中,指环载体包含多肽,该多肽包含在PCT申请号PCT/US19/65995(其通过引用以其全文并入本文)中列出的序列。
ORF1分子
在一些实施例中,指环载体包含ORF1分子和/或编码ORF1分子的核酸。一般而言,ORF1分子包括具有指环病毒ORF1蛋白(例如,如本文所述的指环病毒ORF1蛋白)的结构特征和/或活性的多肽。在一些实施例中,ORF1分子包含相对于指环病毒ORF1蛋白(例如,如本文所述的指环病毒ORF1蛋白)的截短。ORF1分子可能能够与其他ORF1分子结合,例如,以形成蛋白质外壳(例如,如本文所述的蛋白质外壳),例如,衣壳。在一些实施例中,蛋白质外壳可以包封核酸分子(例如,如本文所述的遗传元件)。在一些实施例中,多个ORF1分子可形成多聚体,例如,以形成蛋白质外壳。在一些实施例中,多聚体可以是同型多聚体。在其他实施例中,多聚体可以是异型多聚体。
在一些实施例中,ORF1分子包含以下一个或多个:包含精氨酸富集区的第一区域,例如具有至少60%的碱性残基(例如,至少60%、65%、70%、75%、80%、85%、90%、95%或100%碱性残基;例如,60%-90%、60%-80%、70%-90%或70-80%的碱性残基)的区域,以及包含胶冻卷结构域的第二区域,例如至少六个β链(例如,4、5、6、7、8、9、10、11或12个β链)。
在一些实施例中,本文所述的ORF1分子包含相对于野生型ORF1蛋白序列的一个或多个赖氨酸至组氨酸突变(例如,如本文所述)。在某些实施例中,ORF1分子在精氨酸富集区和/或第一β链中包含一个或多个赖氨酸至组氨酸突变。
精氨酸富集区
精氨酸富集区与本文所述的精氨酸富集区序列或者包含至少60%、70%或80%碱性残基(例如,精氨酸、赖氨酸或其组合)的至少约40个氨基酸的序列具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性。
胶冻卷结构域
胶冻卷结构域或区域包含(例如,由其组成)具有以下特征中一种或多种(例如,1、2或3种)的多肽(例如,较大多肽中包含的结构域或区域):
(i)胶冻卷结构域的至少30%(例如,至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、90%或更多)的氨基酸是一个或多个β-折叠的部分;
(ii)胶冻卷结构域的二级结构包含至少四个(例如,至少4、5、6、7、8、9、10、11或12个)β-折叠;和/或
(iii)胶冻卷结构域的三级结构包含至少两个(例如,至少2、3或4个)β-折叠;和/或
(iv)胶冻卷结构域包含β-折叠与α-螺旋的比例为至少2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。
在某些实施例中,胶冻卷结构域包含两个β-折叠。
在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含约八个(例如,4、5、6、7、8、9、10、11或12个)β-链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含八个β-链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含七个β-链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含六个β-链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含五个β-链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含四个β-链。
在一些实施例中,胶冻卷结构域包含与第二β-折叠反向平行取向的第一β-折叠。在某些实施例中,第一β-折叠包含约四个(例如,3、4、5或6个)β-链。在某些实施例中,第二β-折叠包含约四个(例如,3、4、5或6个)β-链。在实施例中,第一和第二β-折叠总共包含约八个(例如,6、7、8、9、10、11或12个)β-链。
在某些实施例中,胶冻卷结构域是衣壳蛋白(例如,如本文所述的ORF1分子)的组分。在某些实施例中,胶冻卷结构域具有自组装活性。在一些实施例中,包含胶冻卷结构域的多肽与另一拷贝的包含胶冻卷结构域的多肽结合。在一些实施例中,第一多肽的胶冻卷结构域与该多肽的第二拷贝的胶冻卷结构域结合。
N22结构域
ORF1分子还可包括包含指环病毒N22结构域(例如,如本文所述的,例如,来自如本文所述的指环病毒ORF1蛋白的N22结构域)的结构或活性的第三区域,和/或包含指环病毒C-末端结构域(CTD)(例如,如本文所述的,例如,来自如本文所述的指环病毒ORF1蛋白的CTD)的结构或活性的第四区域。在一些实施例中,ORF1分子按照N-末端到C-末端的顺序包含该第一、第二、第三和第四区域。
高变区(HVR)
在一些实施例中,ORF1分子可以进一步包含高变区(HVR),例如来自指环病毒ORF1蛋白(例如,如本文所述)的HVR。在一些实施例中,HVR位于该第二区域和该第三区域之间。在一些实施例中,HVR包含至少约55个(例如,至少约45、50、51、52、53、54、55、56、57、58、59、60或65个)氨基酸(例如,约45-160、50-160、55-160、60-160、45-150、50-150、55-150、60-150、45-140、50-140、55-140或60-140个氨基酸)。
示例性ORF1序列
下表中提供了示例性指环病毒ORF1氨基酸序列和示例性ORF1结构域的序列。在一些实施例中,本文所述的多肽(例如,ORF1分子)包含与一个或多个指环病毒ORF1子序列(例如,如表N-Z中任一个所述)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,本文所述的指环载体包含ORF1分子,该分子包含与一种或多种指环病毒ORF1子序列(例如,如表N-Z中任一个所述)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,本文所述的指环载体包含编码ORF1分子的核酸分子(例如,遗传元件),该分子包含与一种或多种指环病毒ORF1子序列(例如,如表N-Z中任一个所述)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一些实施例中,一个或多个指环病毒ORF1子序列包含精氨酸(Arg)富集结构域、胶冻卷结构域、高变区(HVR)、N22结构域或C-末端结构域(CTD)中的一种或多种(例如,如表N-Z中任一个所列的),或与其具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,ORF1分子包含来自不同指环病毒的多个子序列(例如,选自表N-Z中所列的甲型细环病毒分支1-7子序列中ORF1子序列的任何组合)。在实施例中,ORF1分子包含来自一种指环病毒的Arg富集结构域、胶冻卷结构域、N22结构域和CTD中的一种或多种,以及来自另一种指环病毒的HVR。在实施例中,ORF1分子包含来自一种指环病毒的胶冻卷结构域、HVR、N22结构域和CTD中的一种或多种,以及来自另一种指环病毒的Arg富集结构域。在实施例中,ORF1分子包含来自一种指环病毒的Arg富集结构域、HVR、N22结构域和CTD中的一种或多种,以及来自另一种指环病毒的胶冻卷结构域。在实施例中,ORF1分子包含来自一种指环病毒的Arg富集结构域、胶冻卷结构域、HVR和CTD中的一种或多种,以及来自另一种指环病毒的N22结构域。在实施例中,ORF1分子包含来自一种指环病毒的Arg富集结构域、胶冻卷结构域、HVR和N22结构域中的一种或多种,以及来自另一种指环病毒的CTD。
例如,在PCT申请号PCT/US2018/037379和PCT/US19/65995(其通过引用以其全文并入本文)中描述了其他示例性指环病毒,这些指环病毒的ORF1分子或者其剪接变体或功能性片段可用于本文所述组合物和方法中,例如,以形成指环载体的蛋白质外壳,例如,通过包封遗传元件。
表N.示例性指环病毒ORF1氨基酸子序列(甲型细环病毒,分支3)
注释:
表O.示例性指环病毒ORF1氨基酸子序列(甲型细环病毒,分支3)
表P.示例性指环病毒ORF1氨基酸子序列(乙型细环病毒)
注释:
表Q.示例性指环病毒ORF1氨基酸子序列(乙型细环病毒)
表R.示例性指环病毒ORF1氨基酸子序列(丙型细环病毒)
注释:
表S.示例性指环病毒ORF1氨基酸子序列(丙型细环病毒)
在一些实施例中,第一区域可以结合核酸分子(例如,DNA)。在一些实施例中,碱性残基选自精氨酸、组氨酸或赖氨酸,或其组合。在一些实施例中,第一区域包含至少60%、65%、70%、75%、80%、85%、90%、95%或100%的精氨酸残基(例如,60%-90%、60%-80%、70%-90%或70%-80%精氨酸残基)。在一些实施例中,第一区域包含约30-120个氨基酸(例如,约40-120、40-100、40-90、40-80、40-70、50-100、50-90、50-80、50-70、60-100、60-90或60-80个氨基酸)。在一些实施例中,第一区域包含病毒ORF1精氨酸富集区(例如,来自指环病毒ORF1蛋白的精氨酸富集区,例如,如本文所述)的结构或活性。在一些实施例中,第一区域包含核定位信号。
在一些实施例中,第二区域包含胶冻卷结构域,例如,病毒ORF1胶冻卷结构域的结构或活性(例如,来自指环病毒ORF1蛋白的胶冻卷结构域,例如,如本文所述)。在一些实施例中,第二区域能够与另一ORF1分子的第二区域结合,例如,以形成蛋白质外壳(例如,衣壳)或其部分。
在一些实施例中,第四区域暴露在蛋白质外壳(例如,包含ORF1分子的多聚体的蛋白质外壳,例如,如本文所述)的表面上。
在一些实施例中,第一区域、第二区域、第三区域、第四区域和/或HVR各自包含少于四个(例如,0、1、2或3个)个β折叠。
在一些实施例中,第一区域、第二区域、第三区域、第四区域和/或HVR中的一个或多个可以由异源氨基酸序列(例如,来自异源ORF1分子的相应区域)替换。在一些实施例中,异源氨基酸序列具有所期望的功能,例如,如本文所述的。
在一些实施例中,ORF1分子包含多个保守基序(例如,包含约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100个或更多个氨基酸的基序)(例如,如PCT/US19/65995的图34所示)。在一些实施例中,保守基序可以显示出与一种或多种野生型指环病毒分支(例如,甲型细环病毒,分支1;甲型细环病毒,分支2;甲型细环病毒,分支3;甲型细环病毒,分支4;甲型细环病毒,分支5;甲型细环病毒,分支6;甲型细环病毒,分支7;乙型细环病毒;和/或丙型细环病毒)的ORF1蛋白存在60%、70%、80%、85%、90%、95%或100%序列同一性。在实施例中,每个保守基序的长度为1-1000个(例如,5-10、5-15、5-20、10-15、10-20、15-20、5-50、5-100、10-50、10-100、10-1000、50-100、50-1000或100-1000个)氨基酸。在某些实施例中,保守基序由约2%-4%(例如,约1%-8%、1%-6%、1%-5%、1%-4%、2%-8%、2%-6%、2%-5%或2%-4%)的ORF1分子序列组成,并且每个都显示出与野生型指环病毒分支的ORF1蛋白中相应基序存在100%序列同一性。在某些实施例中,保守基序由约5%-10%(例如,约1%-20%、1%-10%、5%-20%或5%-10%)的ORF1分子序列组成,并且每个都显示出与野生型指环病毒分支的ORF1蛋白中相应基序存在80%序列同一性。在某些实施例中,保守基序由约10%-50%(例如,约10%-20%、10%-30%、10%-40%、10%-50%、20%-40%、20%-50%或30%-50%)的ORF1分子序列组成,并且每个都显示出与野生型指环病毒分支的ORF1蛋白中相应基序存在60%序列同一性。在一些实施例中,保守基序包含一个或多个如表19中所列的氨基酸序列。
在一些实施例中,ORF1分子或编码其的核酸分子包含相对于野生型ORF1蛋白(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变)。
N22结构域中的保守ORF1基序
在一些实施例中,本文所述的多肽(例如,ORF1分子)包含氨基酸序列YNPX2DXGX2N(SEQ ID NO:829),其中Xn是任何n个氨基酸的连续序列。例如,X2表示任何两个氨基酸的连续序列。在一些实施例中,YNPX2DXGX2N(SEQ ID NO:829)包含在ORF1分子的N22结构域内,例如,如本文所述。在一些实施例中,本文所述的遗传元件包含编码氨基酸序列YNPX2DXGX2N(SEQ ID NO:829)的核酸序列(例如,编码ORF1分子的核酸序列,例如,如本文所述),其中Xn是任何n个氨基酸的连续序列。
在一些实施例中,多肽(例如,ORF1分子)包含保守的二级结构,例如,侧接和/或包含YNPX2DXGX2N(SEQ ID NO:829)基序的一部分,例如,在N22结构域中。在一些实施例中,保守二级结构包含第一β链和/或第二β链。在一些实施例中,第一β链的长度为约5-6个(例如,3、4、5、6、7或8个)氨基酸。在一些实施例中,第一β链包含位于YNPX2DXGX2N(SEQ ID NO:829)基序的N-末端的酪氨酸(Y)残基。在一些实施例中,YNPX2DXGX2N(SEQ ID NO:829)基序包含无规则卷曲(例如,约8-9个氨基酸的无规则卷曲)。在一些实施例中,第二β链的长度为约7-8个(例如,5、6、7、8、9或10个)氨基酸。在一些实施例中,第二β链包含位于YNPX2DXGX2N(SEQID NO:829)基序的C-末端的天冬酰胺(N)残基。
在PCT/US19/65995(其通过引用以其全文并入本文)的实例47和图48中描述了示例性YNPX2DXGX2N(SEQ ID NO:829)基序侧翼二级结构。在一些实施例中,ORF1分子包含如下区域,该区域包含PCT/US19/65995的图48中所示的一个或多个(例如,1、2、3、4、5、6、7、8、9、10个或全部)二级结构元件(例如,β链)。在一些实施例中,ORF1分子包含如下区域,该区域包含PCT/US19/65995的图48中所示的一个或多个(例如,1、2、3、4、5、6、7、8、9、10个或全部)二级结构元件(例如,β链),位于YNPX2DXGX2N(SEQ ID NO:829)基序(例如,如本文所述)的侧翼。
ORF1胶冻卷结构域中的保守二级结构基序
在一些实施例中,本文所述的多肽(例如,ORF1分子)包含一个或多个由指环病毒ORF1蛋白(例如,如本文所述)所包含的二级结构元件。在一些实施例中,ORF1分子包含一个或多个由指环病毒ORF1蛋白(例如,如本文所述)的胶冻卷结构域所包含的二级结构元件。一般而言,ORF1胶冻卷结构域包含二级结构,该二级结构按照从N-末端到C-末端的方向依次包含第一β链、第二β链、第一α螺旋、第三β链、第四β链、第五β链、第二α螺旋、第六β链、第七β链、第八β链和第九β链。在一些实施例中,ORF1分子包含二级结构,该二级结构按照从N-末端到C-末端的方向依次包含第一β链、第二β链、第一α螺旋、第三β链、第四β链、第五β链、第二α螺旋、第六β链、第七β链、第八β链和/或第九β链。
在一些实施例中,一对保守的二级结构元件(即,β链和/或α螺旋)由间隙氨基酸序列隔开,例如,包含无规则卷曲序列、β链或α螺旋,或其组合。保守二级结构元件之间的间隙氨基酸序列可包含例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个氨基酸。在一些实施例中,ORF1分子可进一步包含一个或多个另外的β链和/或α螺旋(例如,在胶冻卷结构域中)。在一些实施例中,可以组合连续的β链或连续的α螺旋。在一些实施例中,第一β链和第二β链包含在更大的β链中。在一些实施例中,第三β链和第四β链包含在更大的β链中。在一些实施例中,第四β链和第五β链包含在更大的β链中。在一些实施例中,第六β链和第七β链包含在更大的β链中。在一些实施例中,第七条β链和第八条β链包含在更大的β链中。在一些实施例中,第八β链和第九β链包含在更大的β链中。
在一些实施例中,第一β链的长度为约5-7个(例如,3、4、5、6、7、8、9或10个)氨基酸。在一些实施例中,第二β链的长度为约15-16个(例如,13、14、15、16、17、18或19个)氨基酸。在一些实施例中,第一α螺旋的长度为约15-17个(例如,13、14、15、16、17、18、19或20个)氨基酸。在一些实施例中,第三β链的长度为约3-4个(例如,1、2、3、4、5或6个)氨基酸。在一些实施例中,第四β链的长度为约10-11个(例如,8、9、10、11、12或13个)氨基酸。在一些实施例中,第五β链的长度为约6-7个(例如,4、5、6、7、8、9或10个)氨基酸。在一些实施例中,第二α螺旋的长度为约8-14个(例如,5、6、7、8、9、10、11、12、13、14、15、16或17个)氨基酸。在一些实施例中,第二α螺旋可以分解成两个较小的α螺旋(例如,由无规则卷曲序列隔开)。在一些实施例中,两个较小的α螺旋中的每一个的长度为约4-6个(例如,2、3、4、5、6、7或8个)氨基酸。在一些实施例中,第六β链的长度为约4-5个(例如,2、3、4、5、6或7个)氨基酸。在一些实施例中,第七β链的长度为约5-6个(例如,3、4、5、6、7、8或9个)氨基酸。在一些实施例中,第八β链的长度为约7-9个(例如,5、6、7、8、9、10、11、12或13个)氨基酸。在一些实施例中,第九β链的长度为约5-7个(例如,3、4、5、6、7、8、9或10个)氨基酸。
在PCT/US19/65995的实例47和图47中描述了示例性胶冻卷结构域二级结构。在一些实施例中,ORF1分子包含如下区域,该区域包含PCT/US19/65995的图47中所示的任何胶冻卷结构域二级结构的一个或多个(例如,1、2、3、4、5、6、7、8、9、10个或全部)二级结构元件(例如,β链和/或α螺旋)。
共有ORF1结构域序列
在一些实施例中,ORF1分子(例如,如本文所述)包含胶冻卷结构域、N22结构域和/或C-末端结构域(CTD)中的一个或多个。在一些实施例中,胶冻卷结构域包含具有如本文所述的胶冻卷结构域共有序列的氨基酸序列(例如,如表37A-37C中任一个所列)。在一些实施例中,N22结构域包含具有如本文所述的N22结构域共有序列的氨基酸序列(例如,如表37A-37C中任一个所列)。在一些实施例中,CTD结构域包含具有如本文所述的CTD结构域共有序列的氨基酸序列(例如,如表37A-37C中任一个所列)。在一些实施例中,表37A-37C的任一中以“(Xa-b)”格式列出的氨基酸包含一系列连续氨基酸,其中该系列包含至少a个和至多b个氨基酸。在某些实施例中,该系列中的所有氨基酸都是相同的。在其他实施例中,该系列包括至少两个(例如,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或21个)不同的氨基酸。
表37A.甲型细环病毒ORF1结构域共有序列
表37B.乙型细环病毒ORF1结构域共有序列
表37C.丙型细环病毒ORF1结构域共有序列
在一些实施例中,胶冻卷结构域包含如表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10、或37A-37C中任一个所列的胶冻卷结构域氨基酸序列,或与其具有至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,N22结构域包含如表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10、或37A-37C中任一个所列的N22结构域氨基酸序列,或与其具有至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,CTD结构域包含如表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10、或37A-37C中任一个所列的CTD结构域氨基酸序列,或与其具有至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
ORF1蛋白序列的鉴定
在一些实施例中,可以从指环病毒的基因组中鉴定指环病毒ORF1蛋白序列或编码ORF1蛋白的核酸序列(例如,推定的指环病毒基因组,例如,通过核酸测序技术如深度测序技术来鉴定)。在一些实施例中,通过以下一种或多种(例如,1、2或全部3种)选择标准来鉴定ORF1蛋白序列:
(i)长度选择:针对大于约600个氨基酸残基的那些序列,可以对蛋白序列(例如,符合下文(ii)或(iii)中描述的标准的推定的指环病毒ORF1序列)进行大小选择,以鉴定推定的指环病毒ORF1蛋白。在一些实施例中,指环病毒ORF1蛋白序列的长度为至少约600、650、700、750、800、850、900、950或1000个氨基酸残基。在一些实施例中,甲型细环病毒ORF1蛋白序列的长度为至少约700、710、720、730、740、750、760、770、780、790、800、900或1000个氨基酸残基。在一些实施例中,乙型细环病毒ORF1蛋白序列的长度为至少约650、660、670、680、690、700、750、800、900或1000个氨基酸残基。在一些实施例中,丙型细环病毒ORF1蛋白序列的长度为至少约650、660、670、680、690、700、750、800、900或1000个氨基酸残基。在一些实施例中,编码指环病毒ORF1蛋白的核酸序列的长度为至少约1800、1900、2000、2100、2200、2300、2400或2500个核苷酸。在一些实施例中,编码甲型细环病毒ORF1蛋白序列的核酸序列的长度为至少约2100、2150、2200、2250、2300、2400或2500个核苷酸。在一些实施例中,编码乙型细环病毒ORF1蛋白序列的核酸序列的长度为至少约1900、1950、2000、2500、2100、2150、2200、2250、2300、2400或2500或1000个核苷酸。在一些实施例中,编码丙型细环病毒ORF1蛋白序列的核酸序列的长度为至少约1900、1950、2000、2500、2100、2150、2200、2250、2300、2400或2500或1000个核苷酸。
(ii)存在ORF1基序:可以对蛋白序列(例如,符合上文(i)或下文(iii)中描述的标准的推定的指环病毒ORF1序列)进行过滤,以鉴定在上述N22结构域中含有保守ORF1基序的那些序列。在一些实施例中,推定的指环病毒ORF1序列包含序列YNPXXDXGXXN。在一些实施例中,推定的指环病毒ORF1序列包含序列Y[NCS]PXXDX[GASKR]XX[NTSVAK]。
(iii)存在精氨酸富集区:针对包括精氨酸富集区(例如,如本文所述)的那些序列,可以对蛋白序列(例如,符合上文(i)和/或(ii)中描述的标准的推定的指环病毒ORF1序列)进行过滤。在一些实施例中,推定的指环病毒ORF1序列包含至少约30、35、40、45、50、55、60、65或70个氨基酸的连续序列,其包含至少30%(例如,至少约20%、25%、30%、35%、40%、45%或50%)的精氨酸残基。在一些实施例中,推定的指环病毒ORF1序列包含约35-40、40-45、45-50、50-55、55-60、60-65或65-70个氨基酸的连续序列,其包含至少30%(例如,至少约20%、25%、30%、35%、40%、45%或50%)的精氨酸残基。在一些实施例中,精氨酸富集区位于推定的指环病毒ORF1蛋白起始密码子下游至少约30、40、50、60、70或80个氨基酸处。在一些实施例中,精氨酸富集区位于推定的指环病毒ORF1蛋白起始密码子下游至少约50个氨基酸处。
ORF2分子
在一些实施例中,指环载体包含ORF2分子和/或编码ORF2分子的核酸。一般而言,ORF2分子包括具有指环病毒ORF2蛋白(例如,如本文所述的指环病毒ORF2蛋白,例如,如表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中的任一个所列的)的结构特征和/或活性的多肽,或其功能性片段。在一些实施例中,ORF2分子包含与如表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中任一个所示的指环病毒ORF2蛋白序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一些实施例中,ORF2分子包含与甲型细环病毒、乙型细环病毒或丙型细环病毒ORF2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施例中,ORF2分子(例如,与甲型细环病毒ORF2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的ORF2分子)的长度为250个或更少个氨基酸(例如,约150-200个氨基酸)。在一些实施例中,ORF2分子(例如,与乙型细环病毒ORF2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的ORF2分子)的长度约为50-150个氨基酸。在一些实施例中,ORF2分子(例如,与丙型细环病毒ORF2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的ORF2分子)的长度为约100-200个氨基酸(例如,约100-150个氨基酸)。在一些实施例中,ORF2分子包含螺旋-转角-螺旋基序(例如,包含位于转角区侧翼的两个α螺旋的螺旋-转角-螺旋基序)。在一些实施例中,ORF2分子不包含TTV分离株TA278或TTV分离株SANBAN的ORF2蛋白的氨基酸序列。在一些实施例中,ORF2分子具有蛋白磷酸酶活性。在一些实施例中,ORF2分子或编码其的核酸分子包含相对于例如如本文所述的野生型ORF2蛋白(例如,如表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中的任一个中所示)的至少一个差异(例如,突变、化学修饰或表观遗传改变)。
保守的ORF2基序
在一些实施例中,本文所述的多肽(例如,ORF2分子)包含氨基酸序列[W/F]X7HX3CX1CX5H(SEQ ID NO:949),其中Xn是任何n个氨基酸的连续序列。在实施例中,X7表示任何七个氨基酸的连续序列。在实施例中,X3表示任何三个氨基酸的连续序列。在实施例中,X1表示任何单个氨基酸。在实施例中,X5表示任何五个氨基酸的连续序列。在一些实施例中,[W/F]可以是色氨酸或苯丙氨酸。在一些实施例中,[W/F]X7HX3CX1CX5H(SEQ ID NO:949)包含在ORF2分子的N22结构域内,例如,如文中所述。在一些实施例中,本文所述的遗传元件包含编码氨基酸序列[W/F]X7HX3CX1CX5H(SEQ ID NO:949)的核酸序列(例如,编码ORF2分子的核酸序列,例如,如本文所述),其中Xn是任何n个氨基酸的连续序列。
遗传元件
在一些实施例中,指环载体包含遗传元件。在一些实施例中,遗传元件具有以下特征中的一种或多种:基本上不与宿主细胞的基因组整合,是游离核酸,是单链RNA,是环状的,大约1至10kb,存在于细胞核内,可以与内源性蛋白质结合,产生效应子,例如靶向宿主或靶细胞的基因、活性或功能的多肽或核酸(例如,RNA、iRNA、微小RNA)。在一个实施例中,遗传元件是基本上非整合的。在一些实施例中,遗传元件包含包装信号,例如,结合衣壳蛋白的序列。在一些实施例中,在包装或衣壳结合序列之外,遗传元件与野生型指环病毒核酸序列具有小于70%、60%、50%、40%、30%、20%、10%、5%序列同一性,例如,与指环病毒核酸序列,例如,如本文所述的指环病毒核酸序列具有小于70%、60%、50%、40%、30%、20%、10%、5%序列同一性。在一些实施例中,在包装或衣壳结合序列之外,遗传元件具有与指环病毒核酸序列至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%同一性的少于500、450、400、350、300、250、200、150或100个连续核苷酸。
在一些实施例中,遗传元件的长度小于20kb(例如,小于约19kb、18kb、17kb、16kb、15kb、14kb、13kb、12kb、11kb、10kb、9kb、8kb、7kb、6kb、5kb、4kb、3kb、2kb、1kb或更小)。在一些实施例中,独立地或附加地,遗传元件的长度大于1000b(例如,至少约1.1kb、1.2kb、1.3kb、1.4kb、1.5kb、1.6kb、1.7kb、1.8kb、1.9kb、2kb、2.1kb、2.2kb、2.3kb、2.4kb、2.5kb、2.6kb、2.7kb、2.8kb、2.9kb、3kb、3.1kb、3.2kb、3.3kb、3.4kb、3.5kb、3.6kb、3.7kb、3.8kb、3.9kb、4kb、4.1kb、4.2kb、4.3kb、4.4kb、4.5kb、4.6kb、4.7kb、4.8kb、4.9kb、5kb或更大)。在一些实施例中,遗传元件的长度为约2.5kb-4.6kb、2.8kb-4.0kb、3.0kb-3.8kb或3.2kb-3.7kb。在一些实施例中,遗传元件的长度为约1.5kb-2.0kb、1.5kb-2.5kb、1.5kb-3.0kb、1.5kb-3.5kb、1.5kb-3.8kb、1.5kb-3.9kb、1.5kb-4.0kb、1.5kb-4.5kb或1.5kb-5.0kb。在一些实施例中,遗传元件的长度为约2.0kb-2.5kb、2.0kb-3.0kb、2.0kb-3.5kb、2.0kb-3.8kb、2.0kb-3.9kb、2.0kb-4.0kb、2.0kb-4.5kb或2.0kb-5.0kb。在一些实施例中,遗传元件的长度为约2.5kb-3.0kb、2.5kb-3.5kb、2.5kb-3.8kb、2.5kb-3.9kb、2.5kb-4.0kb、2.5kb-4.5kb或2.5kb-5.0kb。在一些实施例中,遗传元件的长度为约3.0kb-5.0kb、3.5kb-5.0kb、4.0kb-5.0kb或4.5kb-5.0kb。在一些实施例中,遗传元件的长度为约1.5kb-2.0kb、2.0kb-2.5kb、2.5kb-3.0kb、3.0kb-3.5kb、3.1kb-3.6kb、3.2kb-3.7kb、3.3kb-3.8kb、3.4kb-3.9kb、3.5kb-4.0kb、4.0kb-4.5kb或4.5kb-5.0kb。在一些实施例中,遗传元件的长度为约3.6-3.9kb。在一些实施例中,遗传元件的长度为约2.8-2.9kb。在一些实施例中,遗传元件的长度为约2.0-3.2kb。
在一些实施例中,遗传元件包含本文所述的一种或多种特征,例如,编码基本上非致病性蛋白的序列、蛋白结合序列、编码调节性核酸的一个或多个序列、一个或多个调节性序列、编码复制蛋白的一个或多个序列,以及其他序列。
在实施例中,遗传元件是由双链环状DNA产生的(例如,通过转录产生)。
在一些实施例中,遗传元件不包含一种或多种细菌质粒元件(例如,细菌复制起点或选择性标志,如细菌抗性基因)。在一些实施例中,遗传元件不包含细菌质粒骨架。
在一个实施例中,本披露提供了遗传元件,该遗传元件包含编码(i)基本上非致病性外壳蛋白,(ii)使该遗传元件结合至该基本上非致病性外壳蛋白的外壳蛋白结合序列,以及(iii)调节性核酸的核酸序列(例如,RNA序列)。在这样的实施例中,遗传元件可包含一个或多个与天然病毒序列(例如,天然指环病毒序列,例如,如本文所述)的任一个核苷酸序列具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性的序列。
蛋白结合序列
在一些实施例中,遗传元件编码与基本上非致病性蛋白质结合的蛋白结合序列。在一些实施例中,蛋白结合序列有助于将遗传元件包装到蛋白质外壳中。在一些实施例中,蛋白结合序列特异性结合基本上非致病性蛋白质的精氨酸富集区。在一些实施例中,遗传元件包含如PCT/US19/65995的实例8中所述的蛋白结合序列。
在一些实施例中,遗传元件包含与指环病毒序列的5’UTR保守结构域或GC富集结构域(例如,如本文所述)具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的蛋白结合序列。
在实施例中,蛋白结合序列与指环病毒5’UTR保守结构域核苷酸序列(例如,如本文所述)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
5’UTR区域
在一些实施例中,如本文所述的核酸分子(例如,遗传元件、遗传元件构建体或遗传元件区域)包含5’UTR序列,例如,如本文所述的5’UTR保守结构域序列(例如,在表A1、表B1或表C1的任一中)或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。
在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGGGX1CAGTCT,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGGGX1CAGTCT,或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如,置换、缺失或添加)的核酸序列。在实施例中,X1是A。在实施例中,X1不存在。
在一些实施例中,5’UTR序列包含甲型细环病毒(例如,Ring1)5’UTR的核酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,5’UTR序列包含表A1中列出的5’UTR保守结构域的核酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,核酸分子包含与表A1中列出的5’UTR保守结构域具有至少95%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表A1中列出的5’UTR保守结构域具有至少95.775%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表A1中列出的5’UTR保守结构域具有至少97%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表A1中列出的5’UTR保守结构域具有至少97.183%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGC TCGGGACTGGC,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGCTCGGGACT GGC,或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如,置换、缺失或添加)的核酸序列。
在一些实施例中,5’UTR序列包含乙型细环病毒(例如,Ring2)5’UTR的核酸序列,或与其具有至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,5’UTR序列包含表B1中列出的5’UTR保守结构域的核酸序列,或与其具有至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少85%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少87%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少87.324%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少88%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少88.732%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少91%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少91.549%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少92%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少92.958%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少94%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少94.366%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少95%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少95.775%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少97%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少97.183%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGATC AGTCT,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGATCAG TCT,或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如,置换、缺失或添加)的核酸序列。
在一些实施例中,5’UTR序列包含丙型细环病毒(例如,Ring4)5’UTR的核酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,5’UTR序列包含表C1中列出的5’UTR保守结构域的核酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,核酸分子包含与表C1中列出的5’UTR保守结构域具有至少97%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表C1中列出的5’UTR保守结构域具有至少97.183%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAGGTCTAGGGGCAATTCGG GCTAGGGCAGTCT,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAGGTCTAGGGGCAATTCGGGCTAGGGCA GTCT,或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如,置换、缺失或添加)的核酸序列。
在一些实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与指环病毒5’UTR序列,例如表38中所示的核酸序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在一些实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含表38所示的共有5'UTR序列的核酸序列,其中X1、X2、X3、X4和X5各自独立地是任何核苷酸,例如其中X1=G或T,X2=C或A,X3=G或A,X4=T或C,并且X5=A、C或T。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的共有5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的示例性TTV 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的TTV-CT30F 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的TTV-HD23a 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的TTV-JA20 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的TTV-TJN02 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的TTV-tth8 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒共有5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支1 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支2 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支3 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支4 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支5 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支6 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支7 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
表38.来自指环病毒的示例性5’UTR序列
鉴定5’UTR序列
在一些实施例中,可以在指环病毒基因组内鉴别指环病毒5’UTR序列(例如,推定的指环病毒基因组,例如,通过核酸测序技术如深度测序技术来鉴定)。在一些实施例中,通过以下步骤之一或二者鉴定指环病毒5’UTR序列:
(i)鉴定环化接合点:在一些实施例中,5’UTR将位于全长、环化指环病毒基因组的环化接合点附近。例如,可以通过鉴定序列的重叠区域来鉴定环化接合点。在一些实施例中,可以从序列中剪切掉序列的重叠区域以产生已环化的全长指环病毒基因组序列。在一些实施例中,使用软件以这种方式环化基因组序列。不希望受到理论的束缚,在计算上环化基因组可能导致序列的起始位置以非生物性方式定向。序列内的标记可用于将序列重新定向到正确的方向。例如,标记序列可以包括与如本文所述的指环病毒基因组内一个或多个元件(例如,指环病毒,例如,如本文所述的指环病毒的TATA盒、加帽位点、起始元件、转录起始位点、5’UTR保守结构域、ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3、三个开放阅读框区域、多(A)信号或GC富集区中一种或多种)具有基本同源性的序列。
(ii)鉴定5’UTR序列:一旦获得推定的指环病毒基因组序列,就可以将该序列(或其位置,例如,其长度为约40-50、50-60、60-70、70-80、80-90或90-100个核苷酸)与一个或多个指环病毒5'UTR序列(例如,如本文所述)进行比较,以鉴定与其具有实质同源性的序列。在一些实施例中,推定的指环病毒5’UTR区域与如本文所述的指环病毒5’UTR序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
GC富集区
在一些实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的核酸序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的GC富集序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与如表39中所示的36个核苷酸的GC富集序列(例如,36个核苷酸的共有GC富集区序列1、36个核苷酸的共有GC富集区序列2、TTV分支1 36个核苷酸的区域、TTV分支3 36个核苷酸的区域、TTV分支3分离株GH1 36个核苷酸的区域、TTV分支3sle1932 36个核苷酸的区域、TTV分支4ctdc002 36个核苷酸的区域、TTV分支5 36个核苷酸的区域、TTV分支6 36个核苷酸的区域或TTV分支7 36个核苷酸的区域)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含核酸序列,该核酸序列包含如表39中所示的36个核苷酸的GC富集序列(例如,36个核苷酸的共有GC富集区序列1、36个核苷酸的共有GC富集区序列2、TTV分支1 36个核苷酸的区域、TTV分支3 36个核苷酸的区域、TTV分支3分离株GH1 36个核苷酸的区域、TTV分支3sle1932 36个核苷酸的区域、TTV分支4ctdc002 36个核苷酸的区域、TTV分支5 36个核苷酸区域、TTV分支6 36个核苷酸区域或TTV分支7 36个核苷酸的区域)的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸。
在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与甲型细环病毒GC富集区序列(例如,选自TTV-CT30F、TTV-P13-1、TTV-tth8、TTV-HD20a、TTV-16、TTV-TJN02或TTV-HD16d,例如,如表39中所列的)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含核酸序列,该核酸序列包含甲型细环病毒GC富集区序列(例如,选自TTV-CT30F、TTV-P13-1、TTV-tth8、TTV-HD20a、TTV-16、TTV-TJN02或TTV-HD16d,例如,如表39中所列的)的至少10、15、20、25、30、35、40、45、50、60、70、80、90、100、104、105、108、110、111、115、120、122、130、140、145、150、155或156个连续核苷酸。
在实施例中,36个核苷酸的GC富集序列选自:
(i)CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO:160),
(ii)GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO:164),其中X1选自T、G或A;
(iii)GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO:165);
(iv)GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO:166);
(v)GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO:167);
(vi)GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO:168);
(vii)GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO:169);
(viii)GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO:170);
(ix)GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO:171);或
(x)GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO:172)。
在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含核酸序列CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO:160)。
在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含表39中所示的共有GC富集序列的核酸序列,其中X1、X4、X5、X6、X7、X12、X13、X14、X15、X20、X21、X22、X26、X29、X30和X33各自独立地是任何核苷酸,并且其中X2、X3、X8、X9、X10、X11、X16、X17、X18、X19、X23、X24、X25、X27、X28、X31、X32和X34各自独立地是不存在的或任何核苷酸。在一些实施例中,X1至X34中的一个或多个(例如,全部)各自独立地是表39中指定的核苷酸(或不存在)。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的示例性TTV GC富集序列(例如,全序列、片段1、片段2、片段3、或其任何组合,例如按顺序排列的片段1-3)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的TTV-CT30F GC富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8、或其任何组合,例如按顺序排列的片段1-7)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的TTV-HD23a GC富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、或其任何组合,例如按顺序排列的片段1-6)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的TTV-JA20GC富集序列(例如,全序列、片段1、片段2、或其任何组合,例如按顺序排列的片段1和2)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的TTV-TJN02GC富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8、或其任何组合,例如按顺序排列的片段1-8)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的TTV-tth8 GC富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8、片段9、或其任何组合,例如按顺序排列的片段1-6)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的片段7具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的片段8具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的片段9具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
表39.来自指环病毒的示例性GC富集序列
效应物
在一些实施例中,遗传元件可包括一个或多个作为效应物或编码效应物的序列,这些效应物是例如,功能性效应物,例如内源性效应物或外源性效应物,例如治疗性多肽或核酸,例如细胞毒性或细胞溶解性RNA或蛋白质。在一些实施例中,功能性核酸是非编码RNA。在一些实施例中,功能性核酸是编码RNA。效应物可以调节生物活性,例如增加或降低酶活性、基因表达、细胞信号传导以及细胞或器官功能。效应物活性还可包括结合调节性蛋白以调节调节子的活性,例如转录或翻译。效应物活性还可以包括激活或抑制功能。例如,效应物可通过触发酶中底物亲和力的增加来诱导酶活性,例如,果糖2,6-二磷酸激活磷酸果糖激酶1并增加糖酵解响应于胰岛素的速率。在另一实例中,效应物可以抑制底物与受体的结合并抑制其激活,例如,纳曲酮和纳洛酮结合阿片受体而不激活它们,并阻断受体结合阿片类物质的能力。效应物活性还可以包括调节蛋白质的稳定性/降解和/或转录本的稳定性/降解。例如,多肽辅因子(即泛素)可以将蛋白质定向到蛋白质上用于降解,从而标志它们进行降解。在另一实例中,效应物通过阻断酶的活性位点来抑制酶活性,例如,甲氨蝶呤是四氢叶酸(一种二氢叶酸还原酶的辅酶)的结构类似物,其与二氢叶酸还原酶的结合力比天然底物高1000倍,并抑制核苷酸碱基合成。
在一些实施例中,编码效应物的序列包括100-2000、100-1000、100-500、100-200、200-2000、200-1000、200-500、500-1000、500-2000或1000-2000个核苷酸。在一些实施例中,效应物是核酸或蛋白有效载荷,例如,如本文所述的核酸或蛋白有效载荷。
调节性核酸
在一些实施例中,效应物是调节性核酸。调节性核酸修饰内源性基因和/或外源性基因的表达。在一个实施例中,调节性核酸靶向宿主基因。调节性核酸可包括但不限于与内源性基因杂交的核酸(例如,如本文别处所述的miRNA、siRNA、mRNA、lncRNA、RNA、DNA、反义RNA、gRNA)、与外源性核酸(例如病毒DNA或RNA)杂交的核酸、与RNA杂交的核酸、干扰基因转录的核酸、干扰RNA翻译的核酸、稳定RNA或去稳定RNA的核酸(例如通过靶向降解的方式),以及调节DNA或RNA结合因子的核酸。在实施例中,调节性核酸编码miRNA。在一些实施例中,针对野生型指环病毒而言,调节性核酸是内源性的。在一些实施例中,针对野生型指环病毒而言,调节性核酸是外源性的。
在一些实施例中,调节性核酸包含通常含有5-500个碱基对的RNA或RNA样结构(取决于特定的RNA结构,例如miRNA 5-30bp、lncRNA 200-500bp)并且可以具有与细胞内表达的靶基因中的编码序列或编码细胞内表达的靶基因的序列相同(或互补)或几乎相同(或基本上互补)的核碱基序列。
在一些实施例中,调节性核酸包含核酸序列,例如,引导RNA(gRNA)。在一些实施例中,DNA靶向部分包含引导RNA或编码引导RNA的核酸。gRNA,即一种短的合成RNA,可以由结合不完整效应部分所必需的“支架”序列和用户定义的用于基因组靶标的约20个核苷酸靶向序列组成。在实践中,通常将引导RNA序列设计为具有17-24个核苷酸(例如,19、20或21个核苷酸)的长度,并且与靶核酸序列互补。定制gRNA生成器和算法可通过商业途径获得,用于设计有效的引导RNA。使用嵌合性“单引导RNA”(“sgRNA”)也可以实现基因编辑,这是一种工程化(合成)的单一RNA分子,模拟天然存在的crRNA-tracrRNA复合物,并同时含有tracrRNA(用于结合核酸酶)和至少一个crRNA(以将核酸酶引导至被靶向序列进行编辑)。也已证明在基因组编辑中,经化学修饰的sgRNA是有效的;参见,例如,Hendel等人(2015)Nature Biotechnol[自然生物技术].,985-991。
调节性核酸包含识别特定DNA序列(例如,与基因的启动子、增强子、沉默子或阻遏子相邻或在其内的序列)的gRNA。
某些调节性核酸可以通过RNA干扰(RNAi)的生物学过程抑制基因表达。RNAi分子包含RNA或RNA样结构,其通常包含15-50个碱基对(例如约18-25个碱基对)并且具有与细胞内表达的靶基因中的编码序列相同(互补)或几乎相同(基本上互补)的核碱基序列。RNAi分子包括但不限于:短干扰RNA(siRNA)、双链RNA(dsRNA)、微小RNA(miRNA)、短发夹RNA(shRNA)、部分双链体和dicer底物(美国专利号8,084,599、8,349,809和8,513,207)。
长非编码RNA(lncRNA)被定义为长于100个核苷酸的非蛋白质编码转录物。这种有些武断的限制将lncRNA与小型调节性RNA(例如微小RNA(miRNA)、短干扰RNA(siRNA)及其他短RNA)区分开来。通常,大多数(约78%)的lncRNA的特征为组织特异性的。以与附近蛋白质编码基因相反的方向转录的发散lncRNA(占哺乳动物基因组中总lncRNA的约20%大比例)可能会调节附近基因的转录。
遗传元件可以编码具有与内源基因或基因产物(例如,mRNA)的全部或片段基本上互补或完全互补的序列的调节性核酸。调节性核酸可以与内含子和外显子之间的边界处的序列互补,从而防止特异性基因的新生成的核RNA转录物成熟为用于转录的mRNA。与特定基因互补的调节性核酸可与该基因的mRNA杂交并阻止其翻译。反义调节性核酸可以是DNA、RNA或其衍生物或杂合体。
与目的转录物杂交的调节性核酸的长度可以在5至30个核苷酸之间,在约10至30个核苷酸之间,或约11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个核苷酸。调节性核酸与靶向转录物的同一性程度应为至少75%、至少80%、至少85%、至少90%或至少95%。
遗传元件可以编码调节性核酸,例如与靶基因的约5至约25个连续核苷酸相同的微小RNA(miRNA)分子。在一些实施例中,miRNA序列靶向mRNA并从二核苷酸AA开始,其GC含量为约30%-70%(约30%-60%、约40%-60%或约45%-55%),并且例如,如通过标准BLAST搜索所确定的,与要引入其中的哺乳动物基因组中的靶标以外的任何核苷酸序列不具有高百分比同一性。
siRNA和shRNA类似于内源性微小RNA(miRNA)基因的处理途径中的中间体(Bartel,Cell[细胞]116:281-297,2004)。在一些实施例中,siRNA可以用作miRNA,反之亦然(Zeng等人,Mol Cell[分子细胞学]9:1327-1333,2002;Doench等人,Genes Dev[基因与发育]17:438-442,2003)。像siRNA一样,微小RNA使用RISC来下调靶基因,但与siRNA不同,大多数动物性miRNA都不切割mRNA。相反,miRNA通过翻译抑制或多A(多腺苷酸)去除和mRNA降解降低蛋白质输出(Wu等人,Proc Natl Acad Sci USA[美国国家科学院院刊]103:4034-4039,2006)。已知的miRNA结合位点位于mRNA 3'UTR内;miRNA似乎靶向与miRNA 5'端的2-8个核苷酸几乎完全互补的位点(Rajewsky,Nat Genet[自然-遗传学]38增刊:S8-13,2006;Lim等人,Nature[自然]433:769-773,2005)。此区被称为种子区。由于siRNA和miRNA是可互换的,因此外源性siRNA下调与siRNA具有种子互补性的mRNA(Birmingham等人,NatMethods[自然-方法]3:199-204,2006)。3'UTR内的多个靶位点会产生更强的下调(Doench等人,Genes Dev[基因与发育]17:438-442,2003)。
已知miRNA序列的列表可在研究组织维护的数据库中找到,这些组织如维康信托基金会桑格研究院(Wellcome Trust Sanger Institute)、宾夕法尼亚生物信息学中心(Penn Center for Bioinformatics)、斯隆凯特灵癌症中心(Memorial Sloan KetteringCancer Center)和欧洲分子生物学实验室(European Molecule Biology Laboratory)等。已知的有效的siRNA序列和同源结合位点也很好地呈现在相关文献中。通过本领域已知的技术,RNAi分子易于设计及产生。另外,有一些计算工具可以增加找到有效和特异性序列基序的机会(Lagana等人,Methods Mol.Bio.[分子生物学方法],2015,1269:393-412)。
调节性核酸可以调节基因编码的RNA的表达。因为多个基因可以彼此共有一定程度的序列同源性,所以在一些实施例中,可以将调节性核酸设计为靶向具有足够序列同源性的一类基因。在一些实施例中,调节性核酸可含有与在不同基因靶之间共享的序列互补的或特定基因靶所特有的序列。在一些实施例中,可以将调节性核酸设计为靶向在几个基因之间具有同源性的RNA序列的保守区,从而靶向基因家族中的几个基因(例如,不同的基因同工型、剪接变体、突变基因等)。在一些实施例中,可以将调节性核酸设计为靶向单一基因的特定RNA序列所特有的序列。
在一些实施例中,遗传元件可以包括一个或多个编码调节一个或多个基因表达的调节性核酸的序列。
在一个实施例中,将本文别处描述的gRNA用作CRISPR系统的一部分,用于基因编辑。出于基因编辑的目的,可以将指环载体设计为包括一个或多个与所期望的靶DNA序列相对应的引导RNA序列;参见,例如,Cong等人(2013)Science[科学],339:819-823;Ran等人(2013)Nature Protocols[自然协议],8:2281-2308。至少约16或17个核苷酸的gRNA序列通常允许发生Cas9介导的DNA切割;对于Cpf1,需要至少约16个核苷酸的gRNA序列来实现可检测的DNA切割。
治疗性效应物(例如,肽或多肽)
在一些实施例中,遗传元件包含治疗性表达序列,例如,编码治疗性肽或多肽的序列,该肽或多肽是例如细胞内肽或细胞内多肽、分泌型多肽或蛋白质替代治疗剂。在一些实施例中,遗传元件包括编码蛋白质,例如治疗性蛋白质的序列。治疗性蛋白质的一些实例可以包括但不限于激素、细胞因子、酶、抗体(例如,一种或多种编码至少重链或轻链的多肽)、转录因子、受体(例如,膜受体)、配体、膜转运蛋白、分泌型蛋白质、肽、载体蛋白、结构蛋白、核酸酶或其组分。
在一些实施例中,遗传元件包括编码肽,例如治疗性肽的序列。肽可以是直链或支链的。该肽的长度为约5至约500个氨基酸、约15至约400个氨基酸、约20至约325个氨基酸、约25至约250个氨基酸、约50至约200个氨基酸或其间的任何范围。
在一些实施例中,由治疗性表达序列编码的多肽可以是上述任一种的功能性变体或其片段,例如,与本文表中通过参考其UniProt ID披露的蛋白序列具有至少80%、85%、90%、95%、967%、98%、99%同一性的蛋白质。
在一些实施例中,治疗性表达序列可以编码结合上述任一种的抗体或抗体片段,例如,针对蛋白质的抗体,该蛋白质与本文表中通过参考其UniProt ID披露的蛋白序列具有至少80%、85%、90%、95%、967%、98%、99%同一性。本文中的术语“抗体”在最广义上使用,并且涵盖各种抗体结构,包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如,双特异性抗体)和抗体片段,只要它们表现出所期望的抗原结合活性。“抗体片段”是指包含至少一条重链或轻链并结合抗原的分子。抗体片段的实例包括但不限于Fv、Fab、Fab'、Fab'-SH、F(ab')2;双抗体;线性抗体;单链抗体分子(例如scFv);以及由抗体片段形成的多特异性抗体。
示例性细胞内多肽效应物
在一些实施例中,效应物包含胞质多肽或胞质肽。在一些实施例中,包含胞质肽的效应物是DPP-4抑制剂、GLP-1信号传导激活剂或中性粒细胞弹性蛋白酶抑制剂。在一些实施例中,效应物提高生长因子或其受体(例如FGF受体,例如FGFR3)的水平或活性。在一些实施例中,效应物包括n-myc相互作用蛋白活性抑制剂(例如,n-myc相互作用蛋白抑制剂);EGFR活性抑制剂(例如,EGFR抑制剂);IDH1和/或IDH2活性抑制剂(例如,IDH1抑制剂和/或IDH2抑制剂);LRP5和/或DKK2活性抑制剂(例如,LRP5和/或DKK2抑制剂);KRAS活性抑制剂;HTT活性激活剂;或DPP-4活性抑制剂(例如,DPP-4抑制剂)。
在一些实施例中,效应物包含调节性细胞内多肽。在一些实施例中,调节性细胞内多肽结合靶细胞内源的一种或多种分子(例如,蛋白质或核酸)。在一些实施例中,调节性细胞内多肽增加靶细胞内源的一种或多种分子(例如蛋白质或核酸)的水平或活性。在一些实施例中,调节性细胞内多肽降低靶细胞内源的一种或多种分子(例如蛋白质或核酸)的水平或活性。
示例性分泌型多肽效应物
示例性的分泌型治疗剂在本文中描述,例如在下表中。
表50.示例性细胞因子和细胞因子受体
在一些实施例中,本文所述的效应物包括表50的细胞因子或其功能性变体,例如,其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表50中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,功能性变体与相应细胞因子受体结合,在相同条件下,对于相同受体,其Kd比相应野生型细胞因子的Kd高或低不超过10%、20%、30%、40%或50%。在一些实施例中,效应物包括融合蛋白,该融合蛋白包含第一区域(例如,表50的细胞因子多肽或者其功能性变体或片段)和第二异源区域。在一些实施例中,第一区域是表50的第一细胞因子多肽。在一些实施例中,第二区域是表50的第二细胞因子多肽,其中第一和第二细胞因子多肽在野生型细胞中彼此形成细胞因子异二聚体。在一些实施例中,表50的多肽或其功能性变体包含信号序列,例如,对于效应物而言内源性的信号序列,或异源信号序列。在一些实施例中,编码表50的细胞因子或其功能性变体的指环载体用于治疗本文所述的疾病或障碍。
在一些实施例中,本文所述的效应物包含与表50的细胞因子结合的抗体分子(例如,scFv)。在一些实施例中,本文所述的效应物包含与表50的细胞因子受体结合的抗体分子(例如,scFv)。在一些实施例中,抗体分子包含信号序列。
例如,在以下文献中描述了示例性细胞因子和细胞因子受体:Akdis等人,“Interleukins(from IL-1to IL-38),interferons,transforming growth factorβ,andTNF-α:Receptors,functions,and roles in diseases[白细胞介素(从IL-1到IL-38)、干扰素、转化生长因子β和TNF-α:受体、功能和在疾病中的作用]”2016年10月第138卷,第4期,第984-1010页,其通过引用以其全文并入本文,包括其中的表I。
表51.示例性多肽激素和受体
在一些实施例中,本文所述的效应物包括表51的激素或其功能性变体,例如,其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表51中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,功能性变体与相应受体结合,在相同条件下,对于相同受体,其Kd比相应野生型激素的Kd高不超过10%、20%、30%、40%或50%。在一些实施例中,表51的多肽或其功能性变体包含信号序列,例如,对于效应物而言具有内源性的信号序列,或异源信号序列。在一些实施例中,编码表51的激素或其功能性变体的指环载体用于治疗本文所述的疾病或障碍。
在一些实施例中,本文所述的效应物包含与表51的激素结合的抗体分子(例如,scFv)。在一些实施例中,本文所述的效应物包含与表51的激素受体结合的抗体分子(例如,scFv)。在一些实施例中,抗体分子包含信号序列。
表52.示例性生长因子
在一些实施例中,本文所述的效应物包括表52的生长因子或其功能性变体,例如,其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表52中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,功能性变体与相应受体结合,在相同条件下,对于相同受体,其Kd比相应野生型生长因子的Kd高不超过10%、20%、30%、40%或50%。在一些实施例中,表52的多肽或其功能性变体包含信号序列,例如,对于效应物而言具有内源性的信号序列,或异源信号序列。在一些实施例中,编码表52的生长因子或其功能性变体的指环载体用于治疗本文所述的疾病或障碍。
在一些实施例中,本文所述的效应物包含与表52的生长因子结合的抗体分子(例如,scFv)。在一些实施例中,本文所述的效应物包含与表52的生长因子受体结合的抗体分子(例如,scFv)。在一些实施例中,抗体分子包含信号序列。
在以下文献中描述了示例性的生长因子和生长因子受体:例如,Bafico等人,“Classification of Growth Factors and Their Receptors[生长因子及其受体的分类]”Holland-Frei Cancer Medicine.[荷兰弗雷癌症医学]第6版,其通过引用以其全文并入本文。
表53.凝血相关因子
在一些实施例中,本文所述的效应物包括表53的多肽或其功能性变体,例如其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表53中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,功能性变体催化与相应野生型蛋白质相同的反应,例如,催化速率比野生型蛋白低不少于10%、20%、30%、40%或50%。在一些实施例中,表53的多肽或其功能性变体包含信号序列,例如,对于效应物而言具有内源性的信号序列,或异源信号序列。在一些实施例中,编码表53的多肽或其功能性变体的指环载体用于治疗表53的疾病或障碍。
示例性蛋白质替代治疗剂
本文例如在下表中描述了示例性蛋白质替代治疗剂。
表54.示例性酶促效应物和相应适应症
在一些实施例中,本文所述的效应物包括表54的酶或其功能性变体,例如其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表54中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,功能性变体催化与相应野生型蛋白质相同的反应,例如,催化速率比野生型蛋白低不少于10%、20%、30%、40%或50%。在一些实施例中,编码表54的酶或其功能性变体的指环载体用于治疗表54的疾病或障碍。在一些实施例中,指环载体用于将尿苷二磷酸葡糖醛酸转移酶或其功能变体递送至靶细胞,例如肝细胞。在一些实施例中,指环载体用于将OCA1或其功能变体递送至靶细胞,例如视网膜细胞。
表55.示例性非酶效应物和相应适应症
在一些实施例中,本文所述的效应物包括促红细胞生成素(EPO),例如人促红细胞生成素(hEPO)或其功能性变体。在一些实施例中,编码促红细胞生成素或其功能性变体的指环载体用于刺激红细胞生成。在一些实施例中,编码促红细胞生成素或其功能性变体的指环载体用于治疗疾病或障碍,例如贫血。在一些实施例中,使用指环载体将EPO或其功能性变体递送至靶细胞,例如红细胞。
在一些实施例中,本文所述的效应物包括表55的多肽或其功能性变体,例如其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表55中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,编码表55的多肽或其功能性变体的指环载体用于治疗表55的疾病或障碍。在一些实施例中,指环载体用于将SMN或其功能性变体递送至靶细胞,例如,脊髓和/或运动神经元的细胞。在一些实施例中,使用指环载体将微小抗肌萎缩蛋白递送至靶细胞,例如,肌细胞。
在以下文献中描述了示例性微小抗肌萎缩蛋白:Duan,“Systemic AAV Micro-dystrophin Gene Therapy for Duchenne Muscular Dystrophy[杜兴氏肌肉萎缩症的全身性AAV微小抗肌萎缩蛋白基因治疗]”Mol Ther.[分子治疗]2018年10月3日;26(10):2337-2356.doi:10.1016/j.ymthe.2018.07.011.电子出版于2018年7月17日。
在一些实施例中,本文所述的效应物包含凝血因子,例如本文表54或表55中所列的凝血因子。在一些实施例中,本文所述的效应物包括蛋白质,该蛋白质在发生突变时会导致溶酶体贮积症,例如本文表54或表55中列出的蛋白质。在一些实施例中,本文所述的效应物包括转运蛋白,例如本文表55中所列的转运蛋白。
在一些实施例中,野生型蛋白的功能性变体包括具有野生型蛋白的一种或多种活性的蛋白质,例如,功能性变体催化与相应野生型蛋白相同的反应,例如,其催化速率比野生型蛋白低不少于10%、20%、30%、40%或50%。在一些实施例中,功能性变体与野生型蛋白结合的相同结合配偶体结合,例如,在相同条件下,对于相同的结合配偶体,其Kd比相应野生型蛋白的Kd高不超过10%、20%、30%、40%或50%。在一些实施例中,功能性变体具有与野生型多肽的多肽序列存在至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的多肽序列。在一些实施例中,功能性变体包括相应野生型蛋白的同源物(例如直系同源物或旁系同源物)。在一些实施例中,功能性变体是融合蛋白。在一些实施例中,融合体包含与相应野生型蛋白具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的第一区域,和第二异源区域。在一些实施例中,功能性变体包含相应野生型蛋白的片段或由其组成。
再生因子、修复因子和纤维化因子
本文所述的治疗性多肽还包括生长因子(例如,如在表56中所披露的)或者其功能性变体,例如,与表56中通过参考其UniProt ID所披露的蛋白序列具有至少80%、85%、90%、95%、967%、98%、99%同一性的蛋白质。还包括针对这样的生长因子的抗体或其片段,或者促进再生及修复的miRNA。
表56.示例性再生因子、修复因子和纤维化因子
转化因子
本文所述的治疗性多肽还包括转化因子,例如,将成纤维细胞转化为分化细胞的蛋白质因子,例如,表57中披露的因子或其功能性变体,例如,与表57中通过参考其UniProtID所披露的蛋白序列具有至少80%、85%、90%、95%、967%、98%、99%同一性的蛋白质。
表57.示例性转化因子
刺激细胞再生的蛋白质
本文所述的治疗性多肽还包括刺激细胞再生的蛋白质,例如,表58中披露的蛋白质或其功能性变体,例如,与表58中通过参考其UniProt ID所披露的蛋白序列具有至少80%、85%、90%、95%、967%、98%、99%同一性的蛋白质。
表58.示例性的刺激细胞再生的蛋白质
STING调节效应物
在一些实施例中,本文所述的分泌型效应物调节STING/cGAS信号传导。在一些实施例中,STING调节剂是多肽,例如病毒多肽或其功能性变体。例如,效应物可以包括在以下文献中描述的STING调节剂(例如,抑制剂):Maringer等人,“Message in a bottle:lessons learned from antagonism of STING signalling during RNA virusinfection[瓶中的信息:从RNA病毒感染期间STING信号传导的拮抗作用中吸取的教训]”Cytokine&Growth Factor Reviews[细胞因子与生长因子综述]第25卷,第6期,2014年12月,第669-679页,其通过引用以其全文并入本文。在以下文献中描述了其他STING调节剂(例如,激活剂):例如,Wang等人“STING activator c-di-GMP enhances the anti-tumoreffects of peptide vaccines in melanoma-bearing mice[STING激活剂c-di-GMP在荷黑色素瘤小鼠中增强肽疫苗的抗肿瘤作用]”Cancer Immunol Immunother.[癌症免疫学与免疫治疗]2015年8月;64(8):1057-66.doi:10.1007/s00262-015-1713-5.电子出版于2015年5月19日;Bose“cGAS/STING Pathway in Cancer:Jekyll and Hyde Story of CancerImmune Response[癌症中的cGAS/STING通路:癌症免疫应答的双重人格故事]”Int J MolSci.[国际分子科学杂志]2017年11月;18(11):2456;和Fu等人“STING agonistformulated cancer vaccines can cure established tumors resistant to PD-1blockade[STING激动剂配制的癌症疫苗可治愈对PD-1阻断有抗性的既定肿瘤]”SciTransl Med.[科学转化医学]2015年4月15日;7(283):283ra52,其各自通过引用以其全文并入本文。
肽的一些实例包括但不限于荧光标签或标志、抗原、肽治疗剂、天然生物活性肽的合成肽或肽类似物、激动肽或拮抗肽、抗微生物肽、靶向肽或细胞毒性肽、降解肽或自毁肽、以及多种降解肽或自毁肽。本文所述的可用于本发明的肽还包括抗原结合肽,例如抗原结合抗体或抗体样片段,例如单链抗体、纳米抗体(参见,例如,Steeland等人2016.Nanobodies as therapeutics:big opportunities for small antibodies[纳米抗体作为治疗剂:小抗体的巨大机遇].Drug Discov Today[当代药物发现]:21(7):1076-113)。这样的抗原结合肽可以结合细胞质抗原、核抗原或细胞器内抗原。
在一些实施例中,遗传元件包含编码小肽、肽模拟物(例如类肽)、氨基酸和氨基酸类似物的序列。这样的治疗剂通常具有小于约5,000克/摩尔的分子量、小于约2,000克/摩尔的分子量、小于约1,000克/摩尔的分子量、小于约500克/摩尔的分子量以及这样的化合物的盐类、酯类和其他药学上可接受的形式。这样的治疗剂可以包括但不限于神经递质、激素、药物、毒素、病毒或微生物颗粒、合成分子及其激动剂或拮抗剂。
在一些实施例中,本文所述的组合物或指环载体包括与能够靶向特定位置、组织或细胞的配体连接的多肽。
基因编辑组分
指环载体的遗传元件可以包括一个或多个编码基因编辑系统的组分的基因。示例性的基因编辑系统包括成簇规律间隔短回文重复序列(CRISPR)系统、锌指核酸酶(ZFN)和转录激活子样效应物核酸酶(TALEN)。在以下文献中描述了基于ZFN、TALEN和CRISPR的方法:例如,Gaj等人Trends Biotechnol.[生物技术趋势]31.7(2013):397-405;在以下文献中描述了基因编辑的CRISPR方法,例如,Guan等人,Application of CRISPR-Cas systemingene therapy:Pre-clinical progress in animal model.[CRISPR-Cas系统在基因治疗中的应用:动物模型的临床前进展]DNA Repair[DNA修复]2016年10月;46:1-8.doi:10.1016/j.dnarep.2016.07.004;Zheng等人,Precise gene deletion and replacementusing the CRISPR/Cas9 systemin human cells.[在人类细胞中使用CRISPR/Cas9系统进行精确的基因缺失和替换]BioTechniques[生物技术],第57卷,第3期,2014年9月,第115-124页。
CRISPR系统是最初在细菌和古细菌中发现的自适应防御系统。CRISPR系统使用称为CRISPR相关或“Cas”核酸内切酶的RNA引导性核酸酶(例如,Cas9或Cpf1)来切割外来DNA。在典型的CRISPR/Cas系统中,核酸内切酶通过靶向单链或双链DNA序列的序列特异性、非编码“引导RNA”定向到靶核苷酸序列(例如,基因组中要进行序列编辑的位点)。已经鉴定了三类(I-III)CRISPR系统。II类CRISPR系统使用单个Cas核酸内切酶(而不是多个Cas蛋白)。一种II类CRISPR系统包括II型Cas核酸内切酶,例如Cas9、CRISPR RNA(“crRNA”)和反式激活crRNA(“tracrRNA”)。crRNA含有“引导RNA”,即通常对应于靶DNA序列的约20个核苷酸的RNA序列。crRNA还含有与tracrRNA结合的区域,以形成被RNA酶III切割的部分双链结构,产生crRNA/tracrRNA杂合体。然后,crRNA/tracrRNA杂合体指导Cas9核酸内切酶识别并切割靶DNA序列。靶DNA序列通常必须邻近针对给定Cas核酸内切酶而言具有特异性的“前间隔序列邻近基序”(“PAM”);然而,PAM序列似乎遍布整个给定基因组。
在一些实施例中,指环载体包括CRISPR核酸内切酶的基因。例如,从不同原核物种中鉴定出的一些CRISPR核酸内切酶具有独特的PAM序列要求;PAM序列的实例包括5'-NGG(酿脓链球菌(Streptococcus pyogenes))、5’-NNAGAA(嗜热链球菌(Streptococcusthermophilus)CRISPR1)、5’-NGGNG(嗜热链球菌CRISPR3)和5’-NNNGATT(奈瑟氏脑膜炎双球菌(Neisseria meningiditis))。一些核酸内切酶例如Cas9核酸内切酶与富含G的PAM位点例如5'-NGG有关,并在距PAM位点上游(5')3个核苷酸处对靶DNA进行平末端切割。另一II类CRISPR系统包括V型核酸内切酶Cpf1,其小于Cas9;实例包括AsCpf1(来自氨基酸球菌属物种(Acidaminococcussp.))和LbCpf1(来自毛螺旋菌属物种(Lachnospiraceae sp.))。Cpf1核酸内切酶与富含T的PAM位点例如5'-TTN相关。Cpf1也可以识别5'-CTA PAM基序。Cpf1通过引入具有4或5个核苷酸的5'突出端的错位或交错的双链断裂来切割靶DNA,例如切割如下靶DNA,该靶DNA中的5个核苷酸的错位或交错的切割位于距离编码链上的PAM位点下游(3’)18个核苷酸的位置处和距离互补链上的PAM位点下游23个核苷酸的位置处;由这样的错位裂解产生的5个核苷酸突出端使得通过同源重组的DNA插入比在平末端切割的DNA的插入更精确地进行基因组编辑。参见,例如,Zetsche等人(2015)Cell[细胞],163:759-771。
在指环载体中可以包括多种CRISPR相关(Cas)基因。基因的具体实例是那些编码来自II类系统的Cas蛋白(包括Cas1、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cpf1、C2C1或C2C3)的基因。在一些实施例中,指环载体包括编码Cas蛋白例如Cas9蛋白的基因,该Cas蛋白可以来自多种原核物种中的任一种。在一些实施例中,指环载体包括编码特定Cas蛋白例如特定Cas9蛋白的基因,选择该Cas蛋白以识别特定的前间隔序列邻近基序(PAM)序列。在一些实施例中,指环载体包括编码两种或更多种不同Cas蛋白的核酸,或者可以将两种或更多种Cas蛋白引入细胞、受精卵、胚胎或动物中,例如,以允许识别和修饰包含相同、相似或不同PAM基序的位点。在一些实施例中,指环载体包括编码具有失活核酸酶(例如,核酸酶缺损型Cas9)的修饰型Cas蛋白的基因。
尽管野生型Cas9蛋白在由gRNA靶向的特定DNA序列处产生双链断裂(DSB),但已知许多具有改进功能的CRISPR核酸内切酶,例如:“切口酶”形式的Cas核酸内切酶(例如Cas9)仅产生单链断裂;无催化活性的Cas核酸内切酶,例如Cas9(“dCas9”)不切割靶DNA。可以将编码dCas9的基因与编码效应物结构域的基因融合,以抑制(CRISPRi)或激活(CRISPRa)靶基因的表达。例如,该基因可以编码Cas9与转录沉默子(例如KRAB结构域)或转录激活子的融合体(例如dCas9-VP64融合体)。可以包括编码与FokI核酸酶(“dCas9-FokI”)融合的无催化活性的Cas9(dCas9)的基因,以在与两个gRNA同源的靶序列处产生DSB。参见,例如,许多CRISPR/Cas9质粒在阿德基因资源库(Addgene repository)中披露并可公开获得(阿德基因组织,美国马萨诸塞州剑桥市西德尼大街75号550A室,邮政编码02139(Addgene,75Sidney St.,Suite 550A,Cambridge,MA 02139);addgene.org/crispr/)。Ran等人(2013)Cell[细胞],154:1380-1389将引入两个独立的双链断裂(每个断裂被独立的引导RNA来指导)的“双切口酶”Cas9描述为实现了更准确的基因组编辑。
在美国专利申请公开2016/0138008A1和US2015/0344912 A1以及美国专利8,697,359、8,771,945、8,945,839、8,999,641、8,993,233、8,895,308、8,865,406、8,889,418、8,871,445、8,889,356、8,932,814、8,795,965和8,906,616中披露了用于编辑真核生物基因的CRISPR技术。在美国专利申请公开2016/0208243A1中披露了Cpf1核酸内切酶和相应的引导RNA和PAM位点。
在一些实施例中,指环载体包含编码本文所述多肽(例如,靶向核酸酶,例如,Cas9,例如,野生型Cas9、切口酶型Cas9(例如Cas9 D10A)、催化失活Cas9(dCas9)、eSpCas9、Cpf1、C2C1或C2C3)和gRNA的基因。编码核酸酶和一种或多种gRNA的基因的选择取决于靶向突变是否是核苷酸的缺失、置换或添加,例如,对靶向序列的核苷酸的缺失、置换或添加。编码与(一个或多个)效应物结构域(例如VP64)的全部或一部分(例如,其具有生物活性部分)相连的无催化活性的核酸内切酶(例如,催化失活Cas9(dCas9,例如D10A;H840A))的基因会产生可调节一个或多个靶核酸序列的活性和/或表达的嵌合蛋白。
在一些实施例中,指环载体包括编码dCas9与一个或多个效应物结构域的全部或一部分(例如,全长野生型效应物结构域,或者其片段或变体,例如,其具有生物活性部分)的融合体的基因,以产生可用于本文所述方法的嵌合蛋白。因此,在一些实施例中,指环载体包括编码dCas9-甲基化酶融合体的基因。在其他一些实施例中,指环载体包括编码dCas9酶与位点特异性gRNA的融合体的基因,以靶向内源基因。
在其他方面,指环载体包括编码1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个与dCas9融合的效应物结构域(全部或具有生物活性部分)的基因。
调节性序列
在一些实施例中,遗传元件包含与编码效应物的序列可操作地连接的调节性序列,例如启动子或增强子。在一些实施例中,例如,其中遗传元件是mRNA,启动子可以不存在于遗传元件中。在一些实施例中,遗传元件构建体包括用于驱动RNA遗传元件产生的启动子。
在一些实施例中,启动子包括与编码表达产物的DNA序列相邻的DNA序列。启动子可以可操作地连接至相邻的DNA序列。与不存在启动子时表达的产物的量相比,启动子通常增加DNA序列表达的产物的量。来自一种生物体的启动子可用于增强来自另一生物体的DNA序列的产物表达。例如,脊椎动物启动子可用于在脊椎动物中表达水母GFP。因此,一种启动子元件可以增强一种或多种产物的表达。多个启动子元件是本领域普通技术人员众所周知的。
在一个实施例中,期望高水平的组成型表达。这样的启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)长末端重复(LTR)启动子/增强子、巨细胞病毒(CMV)立即早期启动子/增强子(参见,例如,Boshart等人,Cell[细胞],41:521-530(1985))、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子和磷酸甘油激酶(PGK)启动子。
在另一个实施例中,可能期望诱导型启动子。诱导型启动子是由外源添加的化合物调节的启动子,例如,以顺式或反式提供的启动子,包括但不限于锌诱导型绵羊金属硫蛋白(MT)启动子;地塞米松(Dex)诱导型小鼠乳腺瘤病毒(MMTV)启动子;T7聚合酶启动子系统(WO 98/10088);四环素阻遏系统(Gossen等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],89:5547-5551(1992));四环素诱导系统(Gossen等人,Science[科学],268:1766-1769(1995);还参见Harvey等人,Curr.Opin.Chem.Biol.[化学生物学的当前观点],2:512-518(1998));RU486诱导系统(Wang等人,Nat.Biotech.[自然生物技术],15:239-243(1997)和Wang等人,Gene Ther.[基因治疗],4:432-441(1997));和雷帕霉素诱导系统(Magari等人,J.Clin.Invest.[临床研究杂志],100:2865-2872(1997);Rivera等人,Nat.Medicine.[自然医学]2:1028-1032(1996))。可在这种情况下使用的其他类型的诱导型启动子是那些由特定的生理状态(例如温度、急性期或仅在复制细胞中)调节的启动子。
在一些实施例中,使用感兴趣基因或核酸序列的天然启动子。当期望基因或核酸序列的表达应模拟天然表达时,可以使用天然启动子。当基因或其他核酸序列的表达必须在时间或发育上,或者以组织特异性方式或响应于特定转录刺激而受到调节时,可以使用天然启动子。在另外的实施例中,也可以使用其他天然表达控制元件,如增强子元件、多腺苷酸化位点或Kozak共有序列来模拟天然表达。
在一些实施例中,遗传元件包含可操作地连接至组织特异性启动子的基因。例如,如果需要在骨骼肌中表达,则可以使用在肌肉中有活性的启动子。这些包括来自编码骨骼肌α-肌动蛋白、肌球蛋白轻链2A、抗肌萎缩蛋白、肌肉型肌酸激酶的基因的启动子,以及活性高于天然存在启动子的合成肌肉启动子。参见Li等人,Nat.Biotech.[自然-生物技术],17:241-245(1999)。已知具有组织特异性的启动子的实例如下所示:肝白蛋白,Miyatake等人J.Virol.[病毒学杂志],71:5124-32(1997);乙型肝炎病毒核心启动子,Sandig等人,Gene Ther[基因治疗].3:1002-9(1996);甲胎蛋白(AFP),Arbuthnot等人,Hum.Gene Ther[人类基因治疗].,7:1503-14(1996),骨(骨钙素,Stein等人,Mol.Biol.Rep[分子生物学报告].,24:185-96(1997);骨唾液酸蛋白,Chen等人,J.Bone Miner.Res.[骨与矿物质研究杂志]11:654-64(1996)),淋巴细胞(CD2,Hansal等人,J.Immunol.[免疫学杂志],161:1063-8(1998);免疫球蛋白重链;T细胞受体a链),神经元(神经元特异性烯醇化酶(NSE)启动子,Andersen等人Cell.Mol.Neurobiol.[细胞与分子神经生物杂志],13:503-15(1993);神经丝轻链基因,Piccioli等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],88:5611-5(1991);神经元特异性vgf基因,Piccioli等人,Neuron[神经元],15:373-84(1995));等等。
遗传元件构建体可包括增强子,例如与编码基因的DNA序列相邻的DNA序列。增强子元件通常位于启动子元件的上游,或者可以位于编码DNA序列(例如,转录或翻译成一种或多种产物的DNA序列)的下游或之内。因此,增强子元件可位于编码产物的DNA序列上游或下游的100个碱基对、200个碱基对或300个或更多个碱基对。增强子元件可以增加DNA序列表达的重组产物的量,超出由启动子元件提供的增加的表达。对于本领域普通技术人员而言,多个增强子元件是容易获得的。
在一些实施例中,遗传元件包括位于编码本文所述的表达产物的序列侧翼的一个或多个反向末端重复序列(ITR)。在一些实施例中,遗传元件包含位于编码本文所述的表达产物的序列侧翼的一个或多个长末端重复序列(LTR)。可以使用的启动子序列的实例包括但不限于猿猴病毒40(SV40)早期启动子、小鼠乳腺瘤病毒(MMTV)、人类免疫缺陷病毒(HIV)长末端重复序列(LTR)启动子、MoMuLV启动子、禽白血病病毒启动子、EB病毒(Epstein-Barrvirus)立即早期启动子和劳斯肉瘤病毒启动子。
其他序列
在一些实施例中,遗传元件进一步包括编码产物(例如核酶、编码蛋白质的治疗性mRNA、外源性基因)的核酸。
在一些实施例中,遗传元件包括一个或多个影响指环载体在宿主或宿主细胞中以下功能的序列:物种和/或组织和/或细胞嗜性(例如,衣壳蛋白序列)、感染性(例如,衣壳蛋白序列)、免疫抑制/激活(例如,调节性核酸)、病毒基因组结合和/或包装、免疫逃逸(非免疫原性和/或耐受性)、药代动力学、胞吞作用和/或细胞附着、核进入、细胞内调节和定位、胞吐作用调节、增殖和核酸保护。
在一些实施例中,遗传元件可以包含其他序列,其包括DNA、RNA或人工核酸。其他序列可包括但不限于基因组DNA,cDNA或编码tRNA、mRNA、rRNA、miRNA、gRNA、siRNA或其他RNAi分子的序列。在一个实施例中,遗传元件包括编码siRNA的序列,以靶向与调节性核酸相同的基因表达产物的不同基因座。在一个实施例中,遗传元件包括编码siRNA的序列,以靶向与调节性核酸不同的基因表达产物。
在一些实施例中,遗传元件进一步包括以下序列中的一个或多个:编码一个或多个miRNA的序列、编码一种或多种复制蛋白的序列、编码外源性基因的序列、编码治疗剂的序列、调节性序列(例如,启动子、增强子)、编码一个或多个靶向内源性基因(siRNA、lncRNA、shRNA)的调节性序列的序列和编码治疗性mRNA或蛋白的序列。
其他序列的长度可为约2nt至约5000nt、约10nt至约100nt、约50nt至约150nt、约100nt至约200nt、约150nt至约250nt、约200至约300nt、约250nt至约350nt、约300nt至约500nt、约10nt至约1000nt、约50nt至约1000nt、约100nt至约1000nt、约1000nt至约2000nt、约2000nt至约3000nt、约3000nt至约4000nt、约4000nt至约5000nt或其间的任何范围。
编码的基因
例如,遗传元件可以包括与信号传导生化通路相关的基因,例如与信号传导生化通路相关的基因或多核苷酸。实例包括与疾病相关的基因或多核苷酸。“与疾病相关的”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在患病组织衍生的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因或多核苷酸。它可能是会以异常高水平表达的基因;它可能是会以异常低水平表达的基因,其中表达的改变与疾病的发生和/或进展相关。疾病相关基因也指具有一个或多个突变或遗传变异的基因,这些突变或遗传变异直接导致疾病病因或与导致疾病病因的一个或多个基因连锁不平衡。
与疾病相关的基因和多核苷酸的实例可得自约翰·霍普金斯大学的麦考斯克-纳森斯遗传医学研究所(马里兰州巴尔的摩)(McKusick-Nathans Institute of GeneticMedicine,Johns Hopkins University(Baltimore,Md.))和国家医学图书馆的国家生物技术信息中心(马里兰州贝塞斯达)(National Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.))。与疾病相关的基因和多核苷酸的实例列于美国专利号:8,697,359的表A和B中,其通过引用以其全文并入本文。特定疾病信息可获自约翰·霍普金斯大学的麦考斯克-纳森斯遗传医学研究所(马里兰州巴尔的摩)(McKusick-Nathans Institute of Genetic Medicine,Johns Hopkins University(Baltimore,Md.))和国家医学图书馆的国家生物技术信息中心(马里兰州贝塞斯达)(National Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.))。与信号传导生化途径相关的基因和多核苷酸的实例列于美国专利号:8,697,359的表A-C中,其通过引用以其全文并入本文。
此外,如本文其他地方所述,遗传元件可以编码靶向部分。这可以例如通过插入编码糖、糖脂或蛋白质例如抗体的多核苷酸来实现。本领域技术人员知道用于生成靶向部分的其他方法。
病毒序列
在一些实施例中,遗传元件包含至少一个病毒序列。在一些实施例中,该序列与来自单链DNA病毒,例如指环病毒、比那病毒(Bidnavirus)、圆环病毒(Circovirus)、双生病毒、基诺病毒(Genomovirus)、丝状病毒、微小病毒、矮化病毒、细小病毒和斯派拉病毒(Spiravirus)的一个或多个序列具有同源性或同一性。在一些实施例中,该序列与来自双链DNA病毒,例如腺病毒、瓶状病毒、囊泡病毒、非洲猪瘟病毒、杆状病毒、微小纺锤形噬菌体、球状病毒、滴状病毒、唾液腺肥大病病毒、疱疹病毒、虹彩病毒、脂毛病毒、线头病毒和痘病毒的一个或多个序列具有同源性或同一性。在一些实施例中,序列与来自RNA病毒,例如甲病毒、真菌传杆状病毒、肝炎病毒、大麦病毒、烟草花叶病毒、烟草脆裂病毒、三角病毒(Tricornavirus)、风疹病毒、双RNA病毒、囊状病毒、分体病毒和呼肠病毒的一个或多个序列具有同源性或同一性。
在一些实施例中,遗传元件可包含来自非致病性病毒,例如共生病毒(symbioticvirus),例如共栖病毒(commensal virus),例如天然病毒,例如指环病毒的一个或多个序列。最近命名法的变化已将三种能够感染人类细胞的指环病毒划分为指环病毒科病毒的甲型细环病毒(TT)、乙型细环病毒(TTM)和丙型细环病毒(TTMD)属。在一些实施例中,遗传元件可以包含与细环病毒(TT)具有同源性或同一性的序列,该细环病毒(TT)是具有环状反义基因组的非包膜单链DNA病毒。在一些实施例中,遗传元件可包含与SEN病毒、岗哨病毒(Sentinel virus)、小TTV样病毒和TT病毒具有同源性或同一性的序列。已经描述了不同类型的TT病毒,包括TT病毒基因型6、TT病毒群、TTV样病毒DXL1和TTV样病毒DXL2。在一些实施例中,遗传元件可包含与较小病毒,即小细环样病毒(TTM)或基因组大小在TTV和TTMV之间的第三病毒(称为中细环样病毒(TTMD))具有同源性或同一性的序列。在一些实施例中,遗传元件可包含与本文所述核苷酸序列中任一个具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性的来自非致病性病毒的一个或多个序列或序列的片段。
在一些实施例中,遗传元件可包含与本文所述例如表41中核苷酸序列中任一个具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性的来自基本上非致病性病毒的一个或多个序列或序列的片段。
表41:指环病毒及其序列的实例。登录号和相关序列信息可在www.ncbi.nlm.nih.gov/genbank/上获得,以2018年12月11日作为参考。
在一些实施例中,遗传元件包含与来自一种或多种非指环病毒,例如腺病毒、疱疹病毒、pox病毒、痘苗病毒、SV40、乳头瘤病毒、RNA病毒(例如逆转录病毒、例如慢病毒)、单链RNA病毒(例如肝炎病毒)或双链RNA病毒(例如轮状病毒)的一个或多个序列具有同源性或同一性的一个或多个序列。在一些实施例中,由于重组逆转录病毒是有缺陷的,因此可以提供协助以产生感染性颗粒。可以提供这样的协助,例如,通过使用含有质粒的辅助细胞系,这些质粒编码在LTR内调节性序列的控制下的逆转录病毒的所有结构基因。用于复制本文所述的指环载体的合适细胞系包括本领域已知的细胞系,例如A549细胞,其可以如本文所述进行修饰。所述遗传元件可以另外含有编码选择性标志的基因,以便可以鉴定所期望的遗传元件。
在一些实施例中,遗传元件包括非沉默突变,例如导致编码的多肽中氨基酸差异的碱基置换、缺失或添加,只要序列与由第一核苷酸序列编码的多肽保持至少约70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性或以其他方式可用于实施本发明。在这方面,可以进行某些保守性氨基酸置换,通常认为这些置换不会使蛋白质的整体功能失活:例如对于带正电的氨基酸(反之亦然),赖氨酸、精氨酸和组氨酸;对于带负电的氨基酸(反之亦然),天冬氨酸和谷氨酸;对于某些电中性氨基酸的组(在所有情况下,反之亦然),(1)丙氨酸和丝氨酸,(2)天冬酰胺、谷氨酰胺和组氨酸,(3)半胱氨酸和丝氨酸,(4)甘氨酸和脯氨酸,(5)异亮氨酸、亮氨酸和缬氨酸,(6)蛋氨酸、亮氨酸和异亮氨酸,(7)苯丙氨酸、蛋氨酸、亮氨酸和酪氨酸,(8)丝氨酸和苏氨酸,(9)色氨酸和酪氨酸,(10)以及例如酪氨酸、色氨酸和苯丙氨酸。氨基酸可以根据物理特性以及对二级和三级蛋白质结构的贡献进行分类。保守性置换在本领域中被认为是一个氨基酸被具有相似特性的另一氨基酸置换。
具有相同或指定百分比的相同核苷酸或氨基酸残基的两个或更多个核酸或多肽序列的同一性(例如,当在比较窗口或指定区域内进行最大对应性比较和对齐时,在具体区域内约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性)可使用带有以下所述默认参数的BLAST或BLAST 2.0序列比较算法,或通过人工比对和目视检查(例如,参见NCBI网站www.ncbi.nlm.nih.gov/BLAST/或类似网站)进行测量。同一性也可以指或可以应用于测试序列的互补序列。同一性还包括具有缺失和/或添加的序列以及具有置换的序列。如本文所述,算法考虑了空位和类似情况。同一性可以在长度为至少约10个氨基酸或核苷酸、长度为约15个氨基酸或核苷酸、长度为约20个氨基酸或核苷酸、长度为约25个氨基酸或核苷酸、长度为约30个氨基酸或核苷酸、长度为约35个氨基酸或核苷酸、长度为约40个氨基酸或核苷酸、长度为约45个氨基酸或核苷酸、长度为约50个氨基酸或核苷酸、或更多的区域中存在。由于遗传密码是简并的,因此同源核苷酸序列可包括任何数目的“沉默”碱基改变,即仍然编码相同氨基酸的核苷酸置换。
蛋白质外壳
在一些实施例中,指环载体,例如合成指环载体包含包封遗传元件的蛋白质外壳。蛋白质外壳可以包含基本上非致病性外壳蛋白,其不能在哺乳动物中引发不必要的免疫应答。指环载体的蛋白质外壳通常包含基本上非致病性蛋白质,其可自组装成构成蛋白质外壳的二十面体构造。
在一些实施例中,蛋白质外壳蛋白质由指环载体的遗传元件的序列编码(例如,与遗传元件顺式)。在其他实施例中,蛋白质外壳蛋白质由独立于指环载体的遗传元件的核酸编码(例如,与遗传元件反式)。
在一些实施例中,蛋白质(例如基本上非致病性蛋白质和/或蛋白质外壳蛋白质)包含一个或多个糖基化氨基酸,例如2、3、4、5、6、7、8、9、10或更多个糖基化氨基酸。
在一些实施例中,蛋白质(例如基本上非致病性蛋白质和/或蛋白质外壳蛋白质)包含至少一个亲水性DNA结合区、精氨酸富集区、苏氨酸富集区、谷氨酰胺富集区、N-末端聚精氨酸序列、可变区、C-末端聚谷氨酰胺/谷氨酸序列和一个或多个二硫键。
在一些实施例中,蛋白质是衣壳蛋白,例如,具有与由编码本文所述的衣壳蛋白(例如,指环病毒ORF1分子和/或衣壳蛋白序列,例如,如本文所述)的任一核苷酸序列编码的蛋白质存在至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,蛋白质或衣壳蛋白的功能性片段由与指环病毒ORF1核酸(例如,如本文所述)具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列编码。
在一些实施例中,指环载体包含编码衣壳蛋白或衣壳蛋白的功能性片段或与如本文所述的指环病毒ORF1分子具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列的核苷酸序列。
在一些实施例中,序列同一性较低的氨基酸范围可以提供一种或多种本文所述的特性以及细胞/组织/物种特异性(例如,嗜性)的差异。
在一些实施例中,指环载体在蛋白质外壳中缺乏脂质。在一些实施例中,指环载体缺少脂质双层,例如病毒包膜。在一些实施例中,指环载体的内部完全由蛋白质外壳所覆盖(例如,100%覆盖率)。在一些实施例中,指环载体的内部低于100%由蛋白质外壳所覆盖,例如,95%、90%、85%、80%、70%、60%、50%或更低的覆盖率。在一些实施例中,蛋白质外壳包含缺口或间断,例如,允许对水、离子、肽或小分子具有渗透性,只要遗传元件还保留在指环载体中。
在一些实施例中,蛋白质外壳包含特异性识别和/或结合宿主细胞例如互补蛋白或多肽以介导遗传元件进入宿主细胞的一种或多种蛋白质或多肽。
在一些实施例中,蛋白质外壳包括以下中的一种或多种:例如ORF1分子(例如,如本文所述)的精氨酸富集区、胶冻卷区域、N22结构域、高变区和/或C-末端结构域。在一些实施例中,蛋白质外壳包括以下中的一种或多种:一种或多种糖基化蛋白、亲水性DNA结合区、精氨酸富集区、苏氨酸富集区、谷氨酰胺富集区、N-末端聚精氨酸序列、可变区、C-末端聚谷氨酰胺/谷氨酸序列、以及一个或多个二硫键。例如,蛋白质外壳包含由指环病毒ORF1核酸(例如,如本文所述)编码的蛋白质。
在一些实施例中,蛋白质外壳包括以下特征中的一种或多种:二十面体对称、识别和/或结合与一种或多种宿主细胞分子相互作用以介导进入宿主细胞的分子、缺乏脂质分子、缺乏碳水化合物、具有pH和温度稳定性、耐去垢剂、以及在宿主中基本上具有非免疫原性或非致病性。
III.使用方法
本文所述的指环载体和包含指环载体的组合物可用于例如在有需要的受试者(例如,哺乳动物受试者,例如,人类受试者)中治疗疾病、障碍或病症的方法中。本文所述的药物组合物的施用可以例如通过肠胃外(包括静脉内、肿瘤内、腹膜内、肌内、腔内和皮下)施用。指环载体可以单独施用或配制成药物组合物。
指环载体可以以单位剂量组合物,例如单位剂量肠胃外组合物的形式施用。这样的组合物通常通过混合来制备,并且可以适于肠胃外施用。这样的组合物可以是例如可注射和可输注的溶液剂或混悬剂或栓剂或气雾剂的形式。
在一些实施例中,施用指环载体或包含其的组合物,例如,如本文所述的指环载体或组合物可导致将指环载体所包含的遗传元件递送至(例如,受试者中的)靶细胞。
本文所述的指环载体或其组合物,例如,包含效应物(例如,内源性效应物或外源性效应物),可用于将效应物递送至细胞、组织或受试者。在一些实施例中,指环载体或其组合物用于将效应物递送至骨髓、血液、心脏、GI或皮肤。通过施用本文所述的指环载体组合物来递送效应物可以调节(例如,提高或降低)细胞、组织或受试者中非编码RNA或多肽的表达水平。以这种方式调节表达水平可能导致效应物所递送到的细胞中功能性活动的改变。在一些实施例中,调节的功能性活动本质上可以是酶促性、结构性或调节性。
在一些实施例中,指环载体或其拷贝在递送至细胞中后24小时(例如1天、2天、3天、4天、5天、6天、1周、2周、3周、4周、30天或1个月)可在细胞中检测到。在实施例中,指环载体或其组合物介导对靶细胞的作用,并且该作用持续至少1、2、3、4、5、6或7天、2、3或4周或1、2、3、6或12个月。在一些实施例中(例如,其中指环载体或其组合物包含编码外源性蛋白的遗传元件),该作用持续少于1、2、3、4、5、6或7天,2、3或4周,或者1、2、3、6或12个月。
可以用本文所述的指环载体或包含该指环载体的组合物治疗的疾病、障碍和病症的实例包括但不限于:免疫障碍、干扰素病(例如,I型干扰素病)、传染病、炎性障碍、自身免疫性病症、癌症(例如实体瘤,例如肺癌、非小细胞肺癌,例如,表达对mIR-625作出响应的基因(例如,胱天蛋白酶-3)的肿瘤)和胃肠道障碍。在一些实施例中,指环载体调节(例如,提高或降低)与指环载体接触的细胞中的活动或功能。在一些实施例中,指环载体调节(例如,提高或降低)与指环载体接触的细胞中分子(例如,核酸或蛋白质)的水平或活性。在一些实施例中,指环载体降低了与指环载体接触的细胞(例如,癌细胞)的活力,例如,降低了至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多。在一些实施例中,指环载体包含效应物,例如miRNA,如miR-625,其降低了与指环载体接触的细胞(例如癌细胞)的活力,例如,降低了至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多。在一些实施例中,指环载体例如通过提高胱天蛋白酶-3的活性增加与指环载体接触的细胞(例如,癌细胞)的凋亡,例如,增加了至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多。在一些实施例中,指环载体包含效应物,例如,miRNA,如miR-625,其例如通过提高胱天蛋白酶-3活性增加了与指环载体接触的细胞(例如癌细胞)的凋亡,例如,增加了至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多。
IV.施用/递送
可以将组合物(例如,包含如本文所述的指环载体的药物组合物)配制成包括药学上可接受的赋形剂。药物组合物可任选地包含一种或多种另外的活性物质,例如治疗性和/或预防性活性物质。本发明的药物组合物可以是无菌的和/或无热原的。可在以下文献中找到药剂的配制和/或生产中的总体考虑:例如,Remington:The Science and Practice ofPharmacy[雷明顿:药物科学与实践]第21版,Lippincott Williams&Wilkins[利平科特·威廉斯和威尔金斯出版公司],2005(通过引用并入本文)。
尽管本文提供的药物组合物的描述主要针对适合于施用至人的药物组合物,但是本领域技术人员应理解,这样的组合物通常适合于施用至任何其他动物,例如非人动物,例如非人哺乳动物。为了使组合物适合于施用于各种动物而对适合于施用于人的药物组合物的修饰是熟知的,并且普通兽医药理师可仅通过普通实验(如果有的话)来设计和/或进行此种修饰。考虑施用药物组合物的受试者包括但不限于人类和/或其他灵长类动物;哺乳动物,包括商业相关的哺乳动物,如牛、猪、马、羊、猫、狗、小鼠和/或大鼠;和/或鸟类,包括商业相关的鸟类,如家禽、鸡、鸭、鹅和/或火鸡。
本文所述的药物组合物的配制品可通过药理学领域中已知的或以后开发的任何方法来制备。通常,这样的制备方法包括以下步骤:使活性成分与赋形剂和/或一种或多种其他辅助成分结合,并且然后,如果必要和/或期望的话,将产品分开、成形和/或包装。
在一个方面中,本发明的特征在于向受试者递送指环载体的方法。该方法包括向受试者施用包含如本文所述指环载体的药物组合物。在一些实施例中,所施用的指环载体在受试者中复制(例如,成为受试者病毒组的一部分)。
药物组合物可以包含野生型或天然病毒元件和/或修饰的病毒元件。指环载体可以包括一个或多个指环病毒序列(例如,核酸序列或编码其氨基酸序列的核酸序列)或与其具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性的序列。指环载体可包含核酸分子,该核酸分子包含与一种或多种指环病毒序列(例如,指环病毒ORF1核酸序列)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%序列同一性的核酸序列。指环载体可以包含编码氨基酸序列的核酸分子,该氨基酸序列与指环病毒氨基酸序列(例如,指环病毒ORF1分子的氨基酸序列)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%序列同一性。指环载体可以包含多肽,该多肽包含与指环病毒氨基酸序列(例如,指环病毒ORF1分子的氨基酸序列)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%序列同一性的氨基酸序列。
在一些实施例中,指环载体足以增加(刺激)内源性基因和蛋白的表达,例如,与参考(例如健康对照)相比,增加(刺激)了至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。在某些实施例中,指环载体足以减少(抑制)内源性基因和蛋白的表达,例如,与参考(例如健康对照)相比,减少(抑制)了至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。
在一些实施例中,指环载体在宿主或宿主细胞中抑制/增强一种或多种病毒特性,例如,嗜性、感染性、免疫抑制/激活,例如,与参考(例如健康对照)相比,抑制/增强了至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。
在一些实施例中,向受试者施用的药物组合物,该药物组合物进一步包含一种或多种在病毒遗传信息中未表示的病毒株。
在一些实施例中,以足以调节病毒感染的剂量和时间施用包含本文所述的指环载体的药物组合物。病毒感染的一些非限制性实例包括腺相关病毒、爱知病毒(Aichivirus)、澳大利亚蝙蝠狂犬病病毒、BK多瘤病毒、版纳病毒(Banna virus)、巴马森林病毒(Barmah forest virus)、布尼亚韦拉病毒(Bunyamwera virus)、布尼亚病毒属拉克罗斯病毒(Bunyavirus La Crosse)、布尼亚病毒属雪鞋野兔病毒(Bunyavirus snowshoe hare)、猕猴疱疹病毒(Cercopithecine herpesvirus)、钱迪普拉病毒(Chandipura virus)、基孔肯雅病毒(Chikungunya virus)、库赛病毒(Cosavirus)A种、牛痘病毒、柯萨奇病毒(Coxsackievirus)、克里米亚-刚果出血热病毒、登革热病毒、多里病毒(Dhori virus)、杜贝病毒(Dugbe virus)、杜文海病毒(Duvenhage virus)、东部马脑炎病毒(Eastern equineencephalitis virus)、伊波拉病毒(Ebolavirus)、埃可病毒(Echovirus)、脑心肌炎病毒、EB病毒(Epstein-Barr virus)、欧洲蝙蝠狂犬病病毒、GB病毒C型/庚型肝炎病毒、汉坦病毒(Hantaan virus)、亨德拉病毒(Hendra virus)、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、戊型肝炎病毒、丁型肝炎病毒、马痘病毒、人腺病毒、人星状病毒、人冠状病毒、人巨细胞病毒、人肠病毒68型、人肠病毒70型、人疱疹病毒1型、人疱疹病毒2型、人疱疹病毒6型、人疱疹病毒7型、人疱疹病毒8型、人类免疫缺陷病毒、人乳头瘤病毒1型、人乳头瘤病毒2型、人乳头瘤病毒16型、人乳头瘤病毒18型、人副流感病毒、人细小病毒B19型、人呼吸道合胞病毒、人鼻病毒、人SARS冠状病毒、人泡沫逆转录病毒(spumaretrovirus)、人嗜T淋巴细胞病毒、人环曲病毒(torovirus)、甲型流感病毒、乙型流感病毒、丙型流感病毒、伊斯法罕病毒(Isfahan virus)、JC多瘤病毒、日本脑炎病毒、呼宁砂粒病毒(Junin arenavirus)、KI多瘤病毒、昆津病毒(Kunjin virus)、拉各斯蝙蝠病毒、维多利亚湖马尔堡病毒(Lake Victoriamarburgvirus)、兰加特病毒(Langat virus)、拉沙病毒(Lassa virus)、洛兹达雷病毒(Lordsdale virus)、跳跃病病毒、淋巴细胞性脉络丛脑膜炎病毒、马秋波病毒(Machupovirus)、马亚罗病毒(Mayaro virus)、MERS冠状病毒、麻疹病毒、门戈脑心肌炎病毒(Mengoencephalomyocarditis virus)、默克尔细胞多瘤病毒、莫科拉病毒(Mokola virus)、传染性软疣病毒(Molluscum contagiosum virus)、猴痘病毒、腮腺炎病毒、墨累谷脑炎病毒(Murray valley encephalitis virus)、纽约病毒、尼帕病毒(Nipah virus)、诺瓦克病毒(Norwalk virus)、阿尼昂-尼昂病毒(O’nyong-nyong virus)、羊口疮病毒(Orf virus)、奥罗普切病毒(Oropouche virus)、皮钦德病毒(Pichinde virus)、脊髓灰质炎病毒、庞塔托鲁静脉病毒(Punta toro phlebovirus)、普马拉病毒(Puumala virus)、狂犬病病毒、裂谷热病毒、玫瑰病毒(Rosavirus)A种、罗斯河病毒、轮状病毒A种、轮状病毒B种、轮状病毒C种、风疹病毒、鹭山病毒(Sagiyama virus)、萨里病毒(Salivirus)A种、白蛉热西西里病毒、札幌病毒、塞姆利基森林病毒(Semliki forest virus)、汉城病毒、猴泡沫病毒、猿猴病毒5型、辛德毕斯病毒(Sindbis virus)、南安普顿病毒、圣路易斯脑炎病毒、蜱传波瓦桑病毒(Tick-borne powassan virus)、细环病毒、托斯卡纳病毒(Toscana virus)、乌库涅米病毒(Uukuniemi virus)、痘苗病毒、水痘-带状疱疹病毒、天花病毒、委内瑞拉马脑炎病毒、水疱性口炎病毒、西部马脑炎病毒、WU多瘤病毒、西尼罗河病毒、亚巴猴肿瘤病毒、亚巴样病病毒、黄热病毒和寨卡病毒(Zika Virus)。在某些实施例中,指环载体足以胜过和/或替换已经存在于受试者中的病毒,例如,与参考相比,胜过和/或替换了至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。在某些实施例中,指环载体足以与慢性或急性病毒感染竞争。在某些实施例中,可预防性施用指环载体以保护免受病毒感染(例如,益生病毒(provirotic))。在一些实施例中,指环载体的量足以调节(例如,表型、病毒水平、基因表达、与其他病毒竞争、疾病状态等至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更高)。在一些实施例中,治疗(treatment)、进行治疗(treating)及其同源词包括对受试者的医疗管理(例如,通过施用指环载体,例如,如本文所述制备的指环载体),例如,旨在改善、缓解、稳定、预防或治愈疾病、病理状况或障碍。在一些实施例中,治疗包括积极治疗(旨在改善疾病、病理状况或障碍的治疗)、因果治疗(针对相关疾病、病理状况或障碍的原因的治疗)、姑息治疗(旨在缓解症状的治疗)、预防性治疗(旨在预防、最小化或者部分或完全抑制相关疾病、病理状况或障碍的发生的治疗)和/或支持性治疗(用来补充另一种疗法的治疗)。
本文引用的所有参考文献和出版物都特此通过引用并入。
提供以下实例是为了进一步说明本发明的一些实施例,但不用于限制本发明的范围;通过其示例性性质可以理解,可以替代性地使用本领域技术人员已知的其他程序、方法或技术。
实例
目录
实例1:使用杆状病毒产生的ORF1体外组装指环载体
实例2:体外组装包封mRNA的基于Ring2 ORF1的指环载体
实例3:使用修饰的ORF1蛋白体外组装包封mRNA的指环载体
实例4:使用修饰的mRNA体外组装包封mRNA的指环载体
实例5:指环病毒ORF1衣壳蛋白的结构分析
实例1:使用杆状病毒产生的ORF1体外组装指环载体
在本实例中,通过体外组装产生适用于表达指环病毒蛋白(例如,ORF1)的杆状病毒构建体。
在第一个实例中,将编码与N-末端HIS6标签融合的Ring2 ORF1(HIS-ORF1)的DNA针对昆虫表达进行密码子优化,并克隆到杆状病毒表达载体pFASTbac系统中(根据制造商的说明(赛默飞世尔科技公司(ThermoFisher Scientific)))。将10升昆虫细胞培养物(Sf9)用Ring2 HIS-ORF1杆状病毒感染,并在感染后3天通过离心收获细胞。将细胞裂解,并将裂解物使用螯合树脂柱使用本领域标准方法纯化。对含有HIS-ORF1的洗脱级分进行透析,并且用DNA酶处理以酶切宿主细胞DNA。将所得材料使用螯合树脂柱再次纯化,并且保留含有ORF1的级分以进行核酸衣壳化和病毒载体纯化。还通过负染色电子显微镜分析含ORF1的级分。
在第二个实例中,将编码与N-末端HIS6标签融合的Ring10 ORF1(HIS-ORF1)的DNA针对昆虫表达进行密码子优化,并且根据制造商的说明(赛默飞世尔科技公司)克隆到杆状病毒表达载体pFASTbac系统中。将昆虫细胞(Sf9)用Ring HIS-ORF1杆状病毒感染,并且在感染后3天通过离心收获细胞。将细胞裂解,并且将蛋白质使用螯合树脂亲和柱(HisTrap,通用电气医疗集团(GE Healthcare))使用本领域标准方法进行纯化。使用肝素亲和柱(Heparin HiTrap,通用电气医疗集团)再次纯化所得材料,并通过负染色电子显微镜分析含有ORF1的级分。
在第三个实例中,将编码与N-末端HIS6-Flag标签融合的鸡贫血病毒(CAV)衣壳蛋白(Vp1)(HIS-Flag-Vp1)和辅助蛋白(Vp2)的DNA针对哺乳动物表达进行密码子优化,并且使用CMV启动子克隆到哺乳动物表达载体中。用CAV Vp1和Vp2表达载体转染哺乳动物细胞(293expi)。感染后3天通过离心收获细胞。裂解细胞并使用螯合和肝素纯化方法纯化裂解物。通过负染色电子显微镜分析含有鸡贫血病毒(CAV)Vp1的洗脱级分。
如图1所示,Ring 2ORF1和Ring 10ORF1均显示出形成约35nm病毒样颗粒的倾向。
核酸衣壳化和病毒载体纯化:将Ring ORF1(野生型蛋白、嵌合蛋白或其片段)用足以使VLP或病毒衣壳解离的条件处理以便能够与核酸货物重组装。核酸货物可以被定义为例如编码人们想要将其作为治疗剂递送的目的基因的RNA。将确定浓度的核酸货物与确定浓度的Ring ORF1结合,并用足以允许核酸包封的条件进行处理,随后将所得颗粒(定义为病毒载体)使用标准病毒纯化程序纯化。
实例2:体外组装包封mRNA的基于Ring2 ORF1的指环载体
Ring2 ORF1通过尺寸排阻色谱法(SEC)利用流动相来纯化,这些流动相包括具有500mM NaCl的Tris pH 8.0、具有500mM NaCl和0.1%SDS的Tris pH 8.0、具有150mM NaCl的CAPS缓冲液pH 10.5、具有500mM NaCl的CAPS缓冲剂pH 10.5、或具有500mM NaCl和0.1%SDS的CAPS缓冲液pH 10.5,以将病毒颗粒或VLP解离成分散的蛋白质或壳体蛋白。
在第一个实例中,将ORF1与mRNA、荧光标记的mRNA或与实例1所示的ssDNA片段化学缀合的mRNA转基因混合,以能够诱导载体形成。通过透析和SEC纯化(使用Tris pH 8.0缓冲液)形成病毒载体,以分离包封RNA的指环载体(例如,如通过保留荧光吸收测量的)。通过生物物理评估(如DLS或电子显微镜)进一步评估指环载体组装。
在第二个实例中,将纯化的ORF1用含有0.1%SDS解离低聚物或VLP的1M NaCl处理成分散的蛋白质或壳体蛋白。然后将ORF1与mRNA(例如翻译目的基因(例如,报告基因,例如GFP、mCherry;或目的效应物,例如EPO)的mRNA)混合,并用含有150mM NaCl的Tris pH 8.0透析以允许VLP形成。随后的复合物通过SEC使用Tris pH 8.0缓冲液纯化,以分离包封mRNA的AV载体。指环载体载体组装可以通过体外或体内读数进一步评估,例如,通过转导细胞并观察报告基因(例如,mCherry或GFP)的表达或通过表达目的效应物(例如,使用ELISA来检测基因的表达,例如EPO)。
体外组装包封GFP mRNA的基于Ring2 ORF1的指环载体
在另一个实例中,Ring2 ORF1蛋白在昆虫细胞中表达为全长蛋白,组装的VLP通过肝素亲和柱随后尺寸排阻色谱法(SEC)(使用Tris缓冲液流动相)进行纯化。用负染色电子显微镜(EM)观察由分离的Ring2 ORF1蛋白形成的VLP,估计颗粒滴度为1010个颗粒/ml(pts/ml;图4A)。用2摩尔(2M)尿素处理VLP以分解VLP。通过EM的再成像显示未观察到VLP(图4B)。然后在不存在mRNA(图4C)或存在约10倍过量的编码GFP的mRNA(图4D和图4E)的情况下透析尿素处理的VLP以去除尿素。对于用尿素处理并在不存在mRNA的情况下透析的VLP样品,通过EM观察到很少的颗粒(小于108个颗粒/ml;图4C)。相反,在存在过量mRNA的情况下进行透析导致通过EM观察到显著更高滴度的颗粒(约109-1010个颗粒/ml;图4D和图eE)。这些数据表明,在mRNA存在下,VLP的分解和重组更有效,并表明指环病毒ORF1蛋白可用于体外包封mRNA以形成指环载体。
实例3:使用修饰的ORF1蛋白体外组装包封mRNA的指环载体
在本实例中,通过修饰ORF1蛋白以携带结合mRNA的接触残基来改善mRNA遗传元件的包装。在本实例中,接触ssDNA和/或N-末端富含精氨酸的基序(ARM)的ssDNA接触残基和/或胶冻卷β链可以用mRNA结合病毒蛋白或其他mRNA结合蛋白的组分替代,以允许mRNA的有效结合和包装。然后用含有0.1%SDS的1M NaCl处理该mRNA结合的嵌合ORF1,以将低聚物或VLP解离成分散的蛋白质或壳体蛋白。然后将嵌合ORF1与mRNA(例如编码目的基因(例如,报告基因,例如GFP、mCherry;或目的效应物,例如EPO)的mRNA)混合,并用含有150mM NaCl的Tris pH 8.0透析以允许VLP形成。随后的复合物通过SEC使用Tris pH 8.0缓冲液纯化,以分离包封mRNA的指环载体。指环载体组装可以通过体外或体内读数进一步评估,例如,通过转导细胞和观察报告基因的表达(例如,mCherry或GFP)或通过表达目的效应物(例如,使用ELISA来检测基因的表达,例如EPO)。
对ORF1分子的示例性修饰:可在本文所述方法中使用的Ring ORF1分子包括,例如,几种野生型指环病毒ORF1蛋白;CAV衣壳蛋白(VP1)变体;携带突变以改善组装效率、产量或稳定性的环病毒ORF1蛋白;和嵌合ORF1菌株或其功能片段。在一些情况下,亲和标签例如在N末端连接到ORF1分子(SEQ ID NO:561-562)。在一些情况下,ORF1分子是未标记的蛋白质。Ring ORF1分子可以单独表达或与任意数量的辅助蛋白一起表达,这些辅助蛋白包括但不限于指环病毒ORF2和/或ORF3蛋白。
携带突变以改善组装效率的Ring ORF1蛋白可能包括但不限于ORF1蛋白,其携带引入到N-末端富含精氨酸的基序(ARM)的突变,例如,以改变ARG臂的pI,这可能允许pH敏感性核酸结合以触发颗粒组装(SEQ ID NO:563-565)。改善稳定性的ORF1突变可能包括例如,对接触典型胶冻卷β桶的β链F和G(F和Gβ链)的原体间的突变,例如,以改变原体表面的疏水状态和/或使衣壳形成在热力学上更有利。
嵌合ORF1蛋白可以包括但不限于ORF1蛋白,其序列的一部分或多部分被来自另一种衣壳蛋白(例如,BFDV衣壳蛋白、戊型肝炎衣壳蛋白)的可比部分(例如,ARG臂和/或F和Gβ链,或其可比组分)替代。嵌合ORF1蛋白还可以包括ORF1蛋白,其序列的一部分或多部分被另一种指环病毒ORF1蛋白的可比部分替代(例如,Ring 2ORF1的胶冻卷片段或C-末端部分被Ring 9ORF1的可比部分替代;参见,例如,SEQ ID NO:568-575)。
通常,ORF1分子可以使用纯化技术进行纯化,这些纯化技术包括但不限于螯合纯化、肝素纯化、梯度沉降纯化和/或SEC纯化。
实例4:使用修饰的mRNA体外组装包封mRNA的指环载体
在本实例中,通过将mRNA分子与ssDNA结合或通过以这样的方式修饰mRNA转基因,使得骨架的一部分将允许结合至野生型ORF1的ssDNA接触残基,来优化基于mRNA的遗传元件的包封。mRNA通常编码目的基因,例如报告基因(例如GFP或mCherry)和/或效应物基因(例如EPO)。
在一个实例中,将修饰的ssDNA(其可通过其糖链骨架结合ORF1,但也可与mRNA非共价配对)与目的mRNA混合以产生mRNA/DNA复合物。然后可以使用Ring ORF1包封该mRNA/DNA复合物以形成指环载体,例如,如下文所述。
在另一个实例中,mRNA分子用mRNA分子的一个或多个片段合成,该一个或多个片段携带允许与ORF1结合和用其包封的DNA骨架,同时保留编码要递送的基因(例如,报告基因或效应物基因)的mRNA部分。然后可以使用Ring ORF1包封该mRNA/DNA杂交分子以形成指环载体,例如,如下文所述。
通过体外组装包封:然后将上述mRNA/DNA遗传元件通过体外组装包封。简而言之,然后用含有0.1%SDS的1M NaCl处理指环载体ORF1,以将低聚物或VLP解离成分散的蛋白质或壳体蛋白。然后将ORF1与合成的mRNA复合物或杂交分子混合,并用含有150mM NaCl的Tris pH 8.0透析以允许VLP形成。随后的颗粒通过SEC使用Tris pH 8.0缓冲液纯化,以分离包封mRNA的指环载体。指环载体组装可以通过体外或体内读数通过转导细胞和观察报告基因或效应物基因的表达来进一步评估,例如,如本文所述。
实例5:指环病毒ORF1衣壳蛋白的结构分析
指环病毒与其他特征明确的病毒(例如禽病原体喙羽病病毒(BFDV)或鸡贫血病毒(CAV))共享预测的结构特征。
指环病毒ORF1衣壳蛋白含有类似于BFDV的N-末端ARM序列。二级结构预测表明,ORF1的前约250个残基(取决于菌株)包括8个预测的β链(图3)。当ORF1的8个预测的β链(按照胶冻卷结构域命名惯例命名为B至I)在二级结构预测的指导下与BFDV和Hep E的衣壳蛋白对齐时,ORF1中的保守赖氨酸和精氨酸残基与BFDV和Hep E衣壳蛋白的已知ssDNA接触残基对齐(图3,用星号表示)。
序列
下文列出的序列注释如下。粗体和加下划线的文本表示包含用于螯合纯化的His6标签(HHHHHH)和flag标签(DYKDDDDK)的序列,该flag标签是例如用于低表达蛋白的蛋白质印迹检测的强表位。粗体和斜体序列表示Ring9 ORF1序列或其部分。未加粗、未加下划线的序列是Ring2序列或其部分。未加粗、加下划线的序列来自喙羽病病毒(BFDV)。灰色突出显示表示赖氨酸突变成组氨酸的位置,例如,在Ring 9ORF1的富含精氨酸的区域和第一β链中。
SEQ ID NO:561:
Ring 2 N-末端HIS-FLAG-3C蛋白酶-ORF1:
SEQ ID NO:562:
Ring 9 N-末端HIS-FLAG-3C蛋白酶-ORF1:
SEQ ID NO:563:
具有Ring 9的ARG臂的Ring 2 ORF1(Ring 291)
SEQ ID NO:564:
具有Ring 9的ARG臂和β链1+2 722表位的Ring 2 ORF1(Ring 292)
SEQ ID NO:565:
在ARG臂和第一β链中具有LYS/HIS突变的Ring 9
SEQ ID NO:566:
具有BFDV的ARG臂的Ring 9:
SEQ ID NO:567:
具有BFDV衣壳蛋白的β链F和G的Ring 9
SEQ ID NO:568:
具有Ring 9的βC的Ring 2:
SEQ ID NO:569:
具有Ring 9的接头1的Ring 2:
SEQ ID NO:570:
具有Ring 9的β链D的Ring 2:
SEQ ID NO:571:
具有Ring 9的接头2的Ring 2:
SEQ ID NO:572:
具有Ring 9的β链G DNA的Ring 2:
SEQ ID NO:573:
具有Ring 9的β链F原体间接触的Ring 2:
SEQ ID NO:574:
具有Ring 9的链H和I以及C-末端片段的Ring 2 ORF1:
SEQ ID NO:575:
具有Ring 9的链I和C-末端片段的Ring 2 ORF1:
序列表
<110> 旗舰先锋创新V股份有限公司
<120> 包封RNA的指环病毒衣壳的体外组装
<130> V2057-7017WO
<140>
<141>
<150> 63/147,064
<151> 2021-02-08
<150> 63/130,360
<151> 2020-12-23
<160> 968
<170> PatentIn 3.5版
<210> 1
<211> 699
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 1
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro
35 40 45
Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe
50 55 60
Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys
65 70 75 80
Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp
85 90 95
Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met
100 105 110
Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe
115 120 125
Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu
130 135 140
Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg
145 150 155 160
Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr
165 170 175
Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr
180 185 190
Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His
195 200 205
Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys
210 215 220
Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala
225 230 235 240
Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys
245 250 255
Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val
260 265 270
Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser
275 280 285
Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser
290 295 300
Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr
305 310 315 320
Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn
325 330 335
Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr
340 345 350
Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe
355 360 365
Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys
370 375 380
Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp
385 390 395 400
Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu
405 410 415
Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu
420 425 430
Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp
435 440 445
Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu
450 455 460
Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr
465 470 475 480
Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln
485 490 495
Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu
500 505 510
Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys
515 520 525
Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu
530 535 540
Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn
545 550 555 560
Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro
565 570 575
Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile
580 585 590
Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala
595 600 605
Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr
610 615 620
Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr
625 630 635 640
Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala
645 650 655
Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys
660 665 670
Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr
675 680 685
Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
690 695
<210> 2
<211> 688
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 2
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg
35 40 45
Pro Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp
50 55 60
Arg Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Val
65 70 75 80
Arg Lys Arg Phe Tyr Lys Arg Lys Leu Lys Lys Ile Val Leu Lys Gln
85 90 95
Phe Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys
100 105 110
Leu Phe Gln Gly Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln Thr
115 120 125
Ile Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp Thr
130 135 140
Leu Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His Leu
145 150 155 160
Lys Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg Tyr
165 170 175
Gly Gly Val Thr Leu Tyr Phe Tyr Gln Ser Ala Tyr Thr Asp Tyr Ile
180 185 190
Ala Gln Val Phe Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr His
195 200 205
Ala Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Val Ile Arg
210 215 220
Val Pro Ser Arg Glu Thr Arg Lys Lys Arg Lys Pro Tyr Lys Arg Val
225 230 235 240
Arg Val Gly Pro Pro Ser Gln Met Gln Asn Lys Trp Tyr Phe Gln Arg
245 250 255
Asp Ile Cys Glu Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val Asp
260 265 270
Phe Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu Thr
275 280 285
Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp His
290 295 300
Pro Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu Tyr
305 310 315 320
Ser Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr Leu
325 330 335
Gly Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu Met
340 345 350
Thr Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp His
355 360 365
Tyr Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro Pro
370 375 380
Ser Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala Glu
385 390 395 400
Pro Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly Gln
405 410 415
Gly Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp Asp
420 425 430
Pro Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr Asp
435 440 445
Met Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr Glu
450 455 460
Asn Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe Asn
465 470 475 480
Glu Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr Gly
485 490 495
Phe Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His Trp
500 505 510
His Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys Leu
515 520 525
Thr Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln Ala
530 535 540
Lys Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys Thr
545 550 555 560
Tyr Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile Pro
565 570 575
His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys Pro
580 585 590
Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr Lys
595 600 605
Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr Leu
610 615 620
Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln Thr
625 630 635 640
Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp Gln
645 650 655
Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln Gln
660 665 670
His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile Glu
675 680 685
<210> 3
<211> 714
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 3
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg
35 40 45
Pro Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp
50 55 60
Arg Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Val
65 70 75 80
Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln
85 90 95
Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys
100 105 110
Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr
115 120 125
Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser
130 135 140
Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys
145 150 155 160
Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr
165 170 175
Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile
180 185 190
Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr
195 200 205
Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile
210 215 220
Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile
225 230 235 240
Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr
245 250 255
Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn
260 265 270
Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr
275 280 285
Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val
290 295 300
Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe
305 310 315 320
Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln
325 330 335
Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg
340 345 350
Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe
355 360 365
Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn
370 375 380
Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser
385 390 395 400
Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn
405 410 415
Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro
420 425 430
Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp
435 440 445
Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro
450 455 460
Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile
465 470 475 480
Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn
485 490 495
Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys
500 505 510
Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly
515 520 525
Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp
530 535 540
Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln
545 550 555 560
Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile
565 570 575
Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys
580 585 590
Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro
595 600 605
Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro
610 615 620
Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr
625 630 635 640
Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val
645 650 655
Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu
660 665 670
Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu
675 680 685
Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg
690 695 700
Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
705 710
<210> 4
<211> 714
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 4
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg
35 40 45
Pro Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp
50 55 60
Arg Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Val
65 70 75 80
Arg Lys Arg Phe Tyr Lys Arg Lys Leu Lys Lys Ile Val Leu Lys Gln
85 90 95
Phe Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys
100 105 110
Leu Phe Gln Gly Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr
115 120 125
Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser
130 135 140
Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys
145 150 155 160
Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr
165 170 175
Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile
180 185 190
Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr
195 200 205
Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile
210 215 220
Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile
225 230 235 240
Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr
245 250 255
Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn
260 265 270
Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr
275 280 285
Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val
290 295 300
Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe
305 310 315 320
Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln
325 330 335
Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg
340 345 350
Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe
355 360 365
Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn
370 375 380
Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser
385 390 395 400
Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn
405 410 415
Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro
420 425 430
Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp
435 440 445
Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro
450 455 460
Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile
465 470 475 480
Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn
485 490 495
Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys
500 505 510
Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly
515 520 525
Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp
530 535 540
Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln
545 550 555 560
Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile
565 570 575
Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys
580 585 590
Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro
595 600 605
Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro
610 615 620
Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr
625 630 635 640
Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val
645 650 655
Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu
660 665 670
Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu
675 680 685
Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg
690 695 700
Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
705 710
<210> 5
<211> 688
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 5
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg
35 40 45
Pro Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg His Arg Trp
50 55 60
Arg Tyr Arg Lys Pro Arg His Thr Tyr Trp Arg Arg His Leu Arg Val
65 70 75 80
Arg His Arg Phe Tyr His Arg His Leu His His Ile Val Leu Lys Gln
85 90 95
Phe Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys
100 105 110
Leu Phe Gln Gly Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln Thr
115 120 125
Ile Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp Thr
130 135 140
Leu Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His Leu
145 150 155 160
Lys Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg Tyr
165 170 175
Gly Gly Val Thr Leu Tyr Phe Tyr Gln Ser Ala Tyr Thr Asp Tyr Ile
180 185 190
Ala Gln Val Phe Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr His
195 200 205
Ala Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Val Ile Arg
210 215 220
Val Pro Ser Arg Glu Thr Arg Lys Lys Arg Lys Pro Tyr Lys Arg Val
225 230 235 240
Arg Val Gly Pro Pro Ser Gln Met Gln Asn Lys Trp Tyr Phe Gln Arg
245 250 255
Asp Ile Cys Glu Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val Asp
260 265 270
Phe Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu Thr
275 280 285
Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp His
290 295 300
Pro Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu Tyr
305 310 315 320
Ser Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr Leu
325 330 335
Gly Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu Met
340 345 350
Thr Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp His
355 360 365
Tyr Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro Pro
370 375 380
Ser Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala Glu
385 390 395 400
Pro Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly Gln
405 410 415
Gly Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp Asp
420 425 430
Pro Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr Asp
435 440 445
Met Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr Glu
450 455 460
Asn Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe Asn
465 470 475 480
Glu Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr Gly
485 490 495
Phe Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His Trp
500 505 510
His Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys Leu
515 520 525
Thr Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln Ala
530 535 540
Lys Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys Thr
545 550 555 560
Tyr Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile Pro
565 570 575
His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys Pro
580 585 590
Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr Lys
595 600 605
Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr Leu
610 615 620
Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln Thr
625 630 635 640
Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp Gln
645 650 655
Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln Gln
660 665 670
His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile Glu
675 680 685
<210> 6
<211> 687
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 6
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Trp Gly Thr Ser Asn Cys Ala Cys Ala Lys Phe Gln Ile Arg
35 40 45
Arg Arg Tyr Ala Arg Pro Tyr Arg Arg Arg His Ile Arg Arg Tyr Arg
50 55 60
Arg Arg Arg Arg His Phe Arg Arg Arg Arg Phe Thr Thr Asn Arg Arg
65 70 75 80
Lys Arg Phe Tyr Lys Arg Lys Leu Lys Lys Ile Val Leu Lys Gln Phe
85 90 95
Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys Leu
100 105 110
Phe Gln Gly Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln Thr Ile
115 120 125
Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp Thr Leu
130 135 140
Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His Leu Lys
145 150 155 160
Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg Tyr Gly
165 170 175
Gly Val Thr Leu Tyr Phe Tyr Gln Ser Ala Tyr Thr Asp Tyr Ile Ala
180 185 190
Gln Val Phe Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr His Ala
195 200 205
Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Val Ile Arg Val
210 215 220
Pro Ser Arg Glu Thr Arg Lys Lys Arg Lys Pro Tyr Lys Arg Val Arg
225 230 235 240
Val Gly Pro Pro Ser Gln Met Gln Asn Lys Trp Tyr Phe Gln Arg Asp
245 250 255
Ile Cys Glu Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val Asp Phe
260 265 270
Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu Thr Leu
275 280 285
Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp His Pro
290 295 300
Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu Tyr Ser
305 310 315 320
Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr Leu Gly
325 330 335
Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu Met Thr
340 345 350
Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp His Tyr
355 360 365
Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro Pro Ser
370 375 380
Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala Glu Pro
385 390 395 400
Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly Gln Gly
405 410 415
Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp Asp Pro
420 425 430
Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr Asp Met
435 440 445
Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr Glu Asn
450 455 460
Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe Asn Glu
465 470 475 480
Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr Gly Phe
485 490 495
Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His Trp His
500 505 510
Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys Leu Thr
515 520 525
Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln Ala Lys
530 535 540
Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys Thr Tyr
545 550 555 560
Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile Pro His
565 570 575
Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys Pro Gln
580 585 590
Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr Lys Lys
595 600 605
Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr Leu Gln
610 615 620
Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln Thr Ser
625 630 635 640
Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp Gln Thr
645 650 655
Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln Gln His
660 665 670
Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile Glu
675 680 685
<210> 7
<211> 688
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 7
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg
35 40 45
Pro Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp
50 55 60
Arg Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Val
65 70 75 80
Arg Lys Arg Phe Tyr Lys Arg Lys Leu Lys Lys Ile Val Leu Lys Gln
85 90 95
Phe Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys
100 105 110
Leu Phe Gln Gly Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln Thr
115 120 125
Ile Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp Thr
130 135 140
Leu Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His Leu
145 150 155 160
Lys Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg Tyr
165 170 175
Gly Gly Val Thr Leu Tyr Phe Tyr Gln Ser Ala Tyr Thr Asp Tyr Ile
180 185 190
Ala Gln Val Phe Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr His
195 200 205
Ala Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Ala Lys Lys
210 215 220
Trp Phe Ser Arg Glu Thr Arg Lys Lys Arg Lys Pro Gly Phe Lys Arg
225 230 235 240
Leu Leu Gly Pro Pro Ser Gln Met Gln Asn Lys Trp Tyr Phe Gln Arg
245 250 255
Asp Ile Cys Glu Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val Asp
260 265 270
Phe Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu Thr
275 280 285
Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp His
290 295 300
Pro Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu Tyr
305 310 315 320
Ser Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr Leu
325 330 335
Gly Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu Met
340 345 350
Thr Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp His
355 360 365
Tyr Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro Pro
370 375 380
Ser Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala Glu
385 390 395 400
Pro Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly Gln
405 410 415
Gly Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp Asp
420 425 430
Pro Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr Asp
435 440 445
Met Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr Glu
450 455 460
Asn Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe Asn
465 470 475 480
Glu Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr Gly
485 490 495
Phe Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His Trp
500 505 510
His Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys Leu
515 520 525
Thr Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln Ala
530 535 540
Lys Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys Thr
545 550 555 560
Tyr Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile Pro
565 570 575
His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys Pro
580 585 590
Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr Lys
595 600 605
Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr Leu
610 615 620
Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln Thr
625 630 635 640
Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp Gln
645 650 655
Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln Gln
660 665 670
His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile Glu
675 680 685
<210> 8
<211> 699
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 8
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro
35 40 45
Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe
50 55 60
Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys
65 70 75 80
Gln Trp Gln Pro Pro Tyr Lys Arg Arg Cys Thr Ile Phe Gly Thr Ile
85 90 95
Cys Leu Phe Gln Gly Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met
100 105 110
Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe
115 120 125
Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu
130 135 140
Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg
145 150 155 160
Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr
165 170 175
Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr
180 185 190
Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His
195 200 205
Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys
210 215 220
Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala
225 230 235 240
Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys
245 250 255
Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val
260 265 270
Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser
275 280 285
Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser
290 295 300
Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr
305 310 315 320
Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn
325 330 335
Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr
340 345 350
Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe
355 360 365
Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys
370 375 380
Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp
385 390 395 400
Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu
405 410 415
Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu
420 425 430
Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp
435 440 445
Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu
450 455 460
Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr
465 470 475 480
Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln
485 490 495
Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu
500 505 510
Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys
515 520 525
Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu
530 535 540
Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn
545 550 555 560
Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro
565 570 575
Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile
580 585 590
Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala
595 600 605
Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr
610 615 620
Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr
625 630 635 640
Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala
645 650 655
Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys
660 665 670
Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr
675 680 685
Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
690 695
<210> 9
<211> 699
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 9
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro
35 40 45
Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe
50 55 60
Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys
65 70 75 80
Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp
85 90 95
Cys Leu Ile Tyr Tyr Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln
100 105 110
Thr Ile Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp
115 120 125
Thr Leu Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His
130 135 140
Leu Lys Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg
145 150 155 160
Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr
165 170 175
Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr
180 185 190
Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His
195 200 205
Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys
210 215 220
Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala
225 230 235 240
Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys
245 250 255
Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val
260 265 270
Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser
275 280 285
Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser
290 295 300
Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr
305 310 315 320
Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn
325 330 335
Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr
340 345 350
Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe
355 360 365
Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys
370 375 380
Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp
385 390 395 400
Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu
405 410 415
Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu
420 425 430
Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp
435 440 445
Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu
450 455 460
Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr
465 470 475 480
Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln
485 490 495
Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu
500 505 510
Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys
515 520 525
Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu
530 535 540
Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn
545 550 555 560
Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro
565 570 575
Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile
580 585 590
Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala
595 600 605
Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr
610 615 620
Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr
625 630 635 640
Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala
645 650 655
Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys
660 665 670
Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr
675 680 685
Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
690 695
<210> 10
<211> 699
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 10
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro
35 40 45
Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe
50 55 60
Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys
65 70 75 80
Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp
85 90 95
Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met
100 105 110
Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe
115 120 125
Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu
130 135 140
Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg
145 150 155 160
Tyr Gly Gly Val Thr Leu Tyr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr
165 170 175
Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr
180 185 190
Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His
195 200 205
Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys
210 215 220
Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala
225 230 235 240
Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys
245 250 255
Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val
260 265 270
Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser
275 280 285
Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser
290 295 300
Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr
305 310 315 320
Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn
325 330 335
Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr
340 345 350
Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe
355 360 365
Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys
370 375 380
Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp
385 390 395 400
Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu
405 410 415
Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu
420 425 430
Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp
435 440 445
Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu
450 455 460
Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr
465 470 475 480
Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln
485 490 495
Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu
500 505 510
Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys
515 520 525
Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu
530 535 540
Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn
545 550 555 560
Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro
565 570 575
Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile
580 585 590
Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala
595 600 605
Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr
610 615 620
Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr
625 630 635 640
Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala
645 650 655
Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys
660 665 670
Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr
675 680 685
Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
690 695
<210> 11
<211> 699
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 11
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro
35 40 45
Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe
50 55 60
Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys
65 70 75 80
Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp
85 90 95
Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met
100 105 110
Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe
115 120 125
Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu
130 135 140
Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg
145 150 155 160
Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr
165 170 175
Ile Val Arg Ile His Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr
180 185 190
His Ala Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Lys His
195 200 205
Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys
210 215 220
Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala
225 230 235 240
Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys
245 250 255
Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val
260 265 270
Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser
275 280 285
Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser
290 295 300
Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr
305 310 315 320
Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn
325 330 335
Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr
340 345 350
Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe
355 360 365
Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys
370 375 380
Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp
385 390 395 400
Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu
405 410 415
Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu
420 425 430
Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp
435 440 445
Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu
450 455 460
Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr
465 470 475 480
Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln
485 490 495
Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu
500 505 510
Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys
515 520 525
Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu
530 535 540
Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn
545 550 555 560
Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro
565 570 575
Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile
580 585 590
Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala
595 600 605
Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr
610 615 620
Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr
625 630 635 640
Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala
645 650 655
Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys
660 665 670
Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr
675 680 685
Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
690 695
<210> 12
<211> 699
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 12
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro
35 40 45
Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe
50 55 60
Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys
65 70 75 80
Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp
85 90 95
Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met
100 105 110
Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe
115 120 125
Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu
130 135 140
Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg
145 150 155 160
Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr
165 170 175
Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr
180 185 190
Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His
195 200 205
Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Lys Arg
210 215 220
Val Arg Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala
225 230 235 240
Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys
245 250 255
Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val
260 265 270
Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser
275 280 285
Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser
290 295 300
Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr
305 310 315 320
Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn
325 330 335
Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr
340 345 350
Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe
355 360 365
Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys
370 375 380
Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp
385 390 395 400
Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu
405 410 415
Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu
420 425 430
Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp
435 440 445
Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu
450 455 460
Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr
465 470 475 480
Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln
485 490 495
Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu
500 505 510
Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys
515 520 525
Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu
530 535 540
Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn
545 550 555 560
Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro
565 570 575
Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile
580 585 590
Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala
595 600 605
Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr
610 615 620
Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr
625 630 635 640
Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala
645 650 655
Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys
660 665 670
Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr
675 680 685
Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
690 695
<210> 13
<211> 699
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 13
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro
35 40 45
Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe
50 55 60
Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys
65 70 75 80
Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp
85 90 95
Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met
100 105 110
Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe
115 120 125
Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu
130 135 140
Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg
145 150 155 160
Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr
165 170 175
Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr
180 185 190
Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys His Val Ile
195 200 205
Arg Val Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys
210 215 220
Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala
225 230 235 240
Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys
245 250 255
Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val
260 265 270
Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser
275 280 285
Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser
290 295 300
Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr
305 310 315 320
Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn
325 330 335
Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr
340 345 350
Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe
355 360 365
Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys
370 375 380
Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp
385 390 395 400
Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu
405 410 415
Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu
420 425 430
Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp
435 440 445
Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu
450 455 460
Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr
465 470 475 480
Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln
485 490 495
Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu
500 505 510
Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys
515 520 525
Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu
530 535 540
Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn
545 550 555 560
Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro
565 570 575
Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile
580 585 590
Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala
595 600 605
Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr
610 615 620
Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr
625 630 635 640
Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala
645 650 655
Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys
660 665 670
Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr
675 680 685
Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
690 695
<210> 14
<211> 673
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 14
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro
35 40 45
Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe
50 55 60
Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys
65 70 75 80
Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp
85 90 95
Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met
100 105 110
Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe
115 120 125
Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu
130 135 140
Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg
145 150 155 160
Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr
165 170 175
Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr
180 185 190
Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His
195 200 205
Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys
210 215 220
Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala
225 230 235 240
Thr Asp Leu Tyr Lys Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val
245 250 255
Asp Phe Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu
260 265 270
Thr Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp
275 280 285
His Pro Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu
290 295 300
Tyr Ser Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr
305 310 315 320
Leu Gly Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu
325 330 335
Met Thr Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp
340 345 350
His Tyr Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro
355 360 365
Pro Ser Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala
370 375 380
Glu Pro Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly
385 390 395 400
Gln Gly Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp
405 410 415
Asp Pro Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr
420 425 430
Asp Met Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr
435 440 445
Glu Asn Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe
450 455 460
Asn Glu Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr
465 470 475 480
Gly Phe Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His
485 490 495
Trp His Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys
500 505 510
Leu Thr Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln
515 520 525
Ala Lys Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys
530 535 540
Thr Tyr Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile
545 550 555 560
Pro His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys
565 570 575
Pro Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr
580 585 590
Lys Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr
595 600 605
Leu Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln
610 615 620
Thr Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp
625 630 635 640
Gln Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln
645 650 655
Gln His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile
660 665 670
Glu
<210> 15
<211> 673
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成多肽
<400> 15
Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp
1 5 10 15
Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser
20 25 30
Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro
35 40 45
Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe
50 55 60
Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys
65 70 75 80
Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp
85 90 95
Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met
100 105 110
Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe
115 120 125
Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu
130 135 140
Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg
145 150 155 160
Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr
165 170 175
Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr
180 185 190
Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His
195 200 205
Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys
210 215 220
Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala
225 230 235 240
Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys
245 250 255
Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Leu
260 265 270
Thr Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp
275 280 285
His Pro Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu
290 295 300
Tyr Ser Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr
305 310 315 320
Leu Gly Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu
325 330 335
Met Thr Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp
340 345 350
His Tyr Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro
355 360 365
Pro Ser Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala
370 375 380
Glu Pro Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly
385 390 395 400
Gln Gly Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp
405 410 415
Asp Pro Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr
420 425 430
Asp Met Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr
435 440 445
Glu Asn Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe
450 455 460
Asn Glu Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr
465 470 475 480
Gly Phe Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His
485 490 495
Trp His Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys
500 505 510
Leu Thr Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln
515 520 525
Ala Lys Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys
530 535 540
Thr Tyr Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile
545 550 555 560
Pro His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys
565 570 575
Pro Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr
580 585 590
Lys Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr
595 600 605
Leu Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln
610 615 620
Thr Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp
625 630 635 640
Gln Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln
645 650 655
Gln His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile
660 665 670
Glu
<210> 16
<211> 3753
<212> DNA
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 16
tgctacgtca ctaacccacg tgtcctctac aggccaatcg cagtctatgt cgtgcacttc 60
ctgggcatgg tctacataat tatataaatg cttgcacttc cgaatggctg agtttttgct 120
gcccgtccgc ggagaggagc cacggcaggg gatccgaacg tcctgagggc gggtgccgga 180
ggtgagttta cacaccgaag tcaaggggca attcgggctc aggactggcc gggctttggg 240
caaggctctt aaaaatgcac ttttctcgaa taagcagaaa gaaaaggaaa gtgctactgc 300
tttgcgtgcc agcagctaag aaaaaaccaa ctgctatgag cttctggaaa cctccggtac 360
acaatgtcac ggggatccaa cgcatgtggt atgagtcctt tcaccgtggc cacgcttctt 420
tttgtggttg tgggaatcct atacttcaca ttactgcact tgctgaaaca tatggccatc 480
caacaggccc gagaccttct gggccaccgg gagtagaccc caacccccac atccgtagag 540
ccaggcctgc cccggccgct ccggagccct cacaggttga ttcgagacca gccctgacat 600
ggcatgggga tggtggaagc gacggaggcg ctggtggttc cggaagcggt ggacccgtgg 660
cagacttcgc agacgatggc ctcgatcagc tcgtcgccgc cctagacgac gaagagtaag 720
gaggcgcaga cggtggagga gggggagacg aaaaacaagg acttacagac gcaggagacg 780
ctttagacgc aggggacgaa aagcaaaact tataataaaa ctgtggcaac ctgcagtaat 840
taaaagatgc agaataaagg gatacatacc actgattata agtgggaacg gtacctttgc 900
cacaaacttt accagtcaca taaatgacag aataatgaaa ggccccttcg ggggaggaca 960
cagcactatg aggttcagcc tctacatttt gtttgaggag cacctcagac acatgaactt 1020
ctggaccaga agcaacgata acctagagct aaccagatac ttgggggctt cagtaaaaat 1080
atacaggcac ccagaccaag actttatagt aatatacaac agaagaaccc ctctaggagg 1140
caacatctac acagcaccct ctctacaccc aggcaatgcc attttagcaa aacacaaaat 1200
attagtacca agtttacaga caagaccaaa gggtagaaaa gcaattagac taagaatagc 1260
accccccaca ctctttacag acaagtggta ctttcaaaag gacatagccg acctcaccct 1320
tttcaacatc atggcagttg aggctgactt gcggtttccg ttctgctcac cacaaactga 1380
caacacttgc atcagcttcc aggtccttag ttccgtttac aacaactacc tcagtattaa 1440
tacctttaat aatgacaact cagactcaaa gttaaaagaa tttttaaata aagcatttcc 1500
aacaacaggc acaaaaggaa caagtttaaa tgcactaaat acatttagaa cagaaggatg 1560
cataagtcac ccacaactaa aaaaaccaaa cccacaaata aacaaaccat tagagtcaca 1620
atactttgca cctttagatg ccctctgggg agaccccata tactataatg atctaaatga 1680
aaacaaaagt ttgaacgata tcattgagaa aatactaata aaaaacatga ttacatacca 1740
tgcaaaacta agagaatttc caaattcata ccaaggaaac aaggcctttt gccacctaac 1800
aggcatatac agcccaccat acctaaacca aggcagaata tctccagaaa tatttggact 1860
gtacacagaa ataatttaca acccttacac agacaaagga actggaaaca aagtatggat 1920
ggacccacta actaaagaga acaacatata taaagaagga cagagcaaat gcctactgac 1980
tgacatgccc ctatggactt tactttttgg atatacagac tggtgtaaaa aggacactaa 2040
taactgggac ttaccactaa actacagact agtactaata tgcccttata cctttccaaa 2100
attgtacaat gaaaaagtaa aagactatgg gtacatcccg tactcctaca aattcggagc 2160
gggtcagatg ccagacggca gcaactacat accctttcag tttagagcaa agtggtaccc 2220
cacagtacta caccagcaac aggtaatgga ggacataagc aggagcgggc cctttgcacc 2280
taaggtagaa aaaccaagca ctcagctggt aatgaagtac tgttttaact ttaactgggg 2340
cggtaaccct atcattgaac agattgttaa agaccccagc ttccagccca cctatgaaat 2400
acccggtacc ggtaacatcc ctagaagaat acaagtcatc gacccgcggg tcctgggacc 2460
gcactactcg ttccggtcat gggacatgcg cagacacaca tttagcagag caagtattaa 2520
gagagtgtca gaacaacaag aaacttctga ccttgtattc tcaggcccaa aaaagcctcg 2580
ggtcgacatc ccaaaacaag aaacccaaga agaaagctca cattcactcc aaagagaatc 2640
gagaccgtgg gagaccgagg aagaaagcga gacagaagcc ctctcgcaag agagccaaga 2700
ggtccccttc caacagcagt tgcagcagca gtaccaagag cagctcaagc tcagacaggg 2760
aatcaaagtc ctcttcgagc agctcataag gacccaacaa ggggtccatg taaacccatg 2820
cctacggtag gtcccaggca gtggctgttt ccagagagaa agccagcccc agctcctagc 2880
agtggagact gggccatgga gtttctcgca gcaaaaatat ttgataggcc agttagaagc 2940
aaccttaaag atacccctta ctacccatat gttaaaaacc aatacaatgt ctactttgac 3000
cttaaatttg aataaacagc agcttcaaac ttgcaaggcc gtgggagttt cactggtcgg 3060
tgtctacctc taaaggtcac taagcactcc gagcgtaagc gaggagtgcg accctccccc 3120
ctggaacaac ttcttcggag tccggcgcta cgccttcggc tgcgccggac acctcagacc 3180
ccccctccac ccgaaacgct tgcgcgtttc ggaccttcgg cgtcgggggg gtcgggagct 3240
ttattaaacg gactccgaag tgctcttgga cactgagggg gtgaacagca acgaaagtga 3300
gtggggccag acttcgccat aaggccttta tcttcttgcc atttgtcagt gtccggggtc 3360
gccataggct tcgggctcgt ttttaggcct tccggactac aaaaatcgcc attttggtga 3420
cgtcacggcc gccatcttaa gtagttgagg cggacggtgg cgtgagttca aaggtcacca 3480
tcagccacac ctactcaaaa tggtggacaa tttcttccgg gtcaaaggtt acagccgcca 3540
tgttaaaaca cgtgacgtat gacgtcacgg ccgccatttt gtgacacaag atggccgact 3600
tccttcctct ttttcaaaaa aaagcggaag tgccgccgcg gcggcggggg gcggcgcgct 3660
gcgcgcgccg cccagtaggg ggagccatgc gccccccccc gcgcatgcgc ggggcccccc 3720
cccgcggggg gctccgcccc ccggcccccc ccg 3753
<210> 17
<211> 127
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 17
Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg
1 5 10 15
Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys
20 25 30
Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His
35 40 45
Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro
50 55 60
His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln
65 70 75 80
Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp
85 90 95
Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala
100 105 110
Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu
115 120 125
<210> 18
<211> 268
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 18
Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg
1 5 10 15
Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys
20 25 30
Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His
35 40 45
Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro
50 55 60
His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln
65 70 75 80
Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp
85 90 95
Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala
100 105 110
Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu Leu
115 120 125
Leu Lys Thr Pro Ala Ser Ser Pro Pro Met Lys Tyr Pro Val Pro Val
130 135 140
Thr Ser Leu Glu Glu Tyr Lys Ser Ser Thr Arg Gly Ser Trp Asp Arg
145 150 155 160
Thr Thr Arg Ser Gly His Gly Thr Cys Ala Asp Thr His Leu Ala Glu
165 170 175
Gln Val Leu Arg Glu Cys Gln Asn Asn Lys Lys Leu Leu Thr Leu Tyr
180 185 190
Ser Gln Ala Gln Lys Ser Leu Gly Ser Thr Ser Gln Asn Lys Lys Pro
195 200 205
Lys Lys Lys Ala His Ile His Ser Lys Glu Asn Arg Asp Arg Gly Arg
210 215 220
Pro Arg Lys Lys Ala Arg Gln Lys Pro Ser Arg Lys Arg Ala Lys Arg
225 230 235 240
Ser Pro Ser Asn Ser Ser Cys Ser Ser Ser Thr Lys Ser Ser Ser Ser
245 250 255
Ser Asp Arg Glu Ser Lys Ser Ser Ser Ser Ser Ser
260 265
<210> 19
<211> 276
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 19
Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg
1 5 10 15
Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys
20 25 30
Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His
35 40 45
Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro
50 55 60
His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln
65 70 75 80
Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp
85 90 95
Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala
100 105 110
Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu Pro
115 120 125
Lys Lys Ala Ser Gly Arg His Pro Lys Thr Arg Asn Pro Arg Arg Lys
130 135 140
Leu Thr Phe Thr Pro Lys Arg Ile Glu Thr Val Gly Asp Arg Gly Arg
145 150 155 160
Lys Arg Asp Arg Ser Pro Leu Ala Arg Glu Pro Arg Gly Pro Leu Pro
165 170 175
Thr Ala Val Ala Ala Ala Val Pro Arg Ala Ala Gln Ala Gln Thr Gly
180 185 190
Asn Gln Ser Pro Leu Arg Ala Ala His Lys Asp Pro Thr Arg Gly Pro
195 200 205
Cys Lys Pro Met Pro Thr Val Gly Pro Arg Gln Trp Leu Phe Pro Glu
210 215 220
Arg Lys Pro Ala Pro Ala Pro Ser Ser Gly Asp Trp Ala Met Glu Phe
225 230 235 240
Leu Ala Ala Lys Ile Phe Asp Arg Pro Val Arg Ser Asn Leu Lys Asp
245 250 255
Thr Pro Tyr Tyr Pro Tyr Val Lys Asn Gln Tyr Asn Val Tyr Phe Asp
260 265 270
Leu Lys Phe Glu
275
<210> 20
<211> 167
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 20
Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg
1 5 10 15
Met Trp Pro Lys Lys Ala Ser Gly Arg His Pro Lys Thr Arg Asn Pro
20 25 30
Arg Arg Lys Leu Thr Phe Thr Pro Lys Arg Ile Glu Thr Val Gly Asp
35 40 45
Arg Gly Arg Lys Arg Asp Arg Ser Pro Leu Ala Arg Glu Pro Arg Gly
50 55 60
Pro Leu Pro Thr Ala Val Ala Ala Ala Val Pro Arg Ala Ala Gln Ala
65 70 75 80
Gln Thr Gly Asn Gln Ser Pro Leu Arg Ala Ala His Lys Asp Pro Thr
85 90 95
Arg Gly Pro Cys Lys Pro Met Pro Thr Val Gly Pro Arg Gln Trp Leu
100 105 110
Phe Pro Glu Arg Lys Pro Ala Pro Ala Pro Ser Ser Gly Asp Trp Ala
115 120 125
Met Glu Phe Leu Ala Ala Lys Ile Phe Asp Arg Pro Val Arg Ser Asn
130 135 140
Leu Lys Asp Thr Pro Tyr Tyr Pro Tyr Val Lys Asn Gln Tyr Asn Val
145 150 155 160
Tyr Phe Asp Leu Lys Phe Glu
165
<210> 21
<211> 743
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 21
Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys
1 5 10 15
Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg
20 25 30
Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg
35 40 45
Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg
50 55 60
Arg Gly Arg Lys Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val
65 70 75 80
Ile Lys Arg Cys Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly
85 90 95
Asn Gly Thr Phe Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile
100 105 110
Met Lys Gly Pro Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu
115 120 125
Tyr Ile Leu Phe Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg
130 135 140
Ser Asn Asp Asn Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys
145 150 155 160
Ile Tyr Arg His Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg
165 170 175
Thr Pro Leu Gly Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly
180 185 190
Asn Ala Ile Leu Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr
195 200 205
Arg Pro Lys Gly Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr
210 215 220
Leu Phe Thr Asp Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr
225 230 235 240
Leu Phe Asn Ile Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys
245 250 255
Ser Pro Gln Thr Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser
260 265 270
Val Tyr Asn Asn Tyr Leu Ser Ile Asn Thr Phe Asn Asn Asp Asn Ser
275 280 285
Asp Ser Lys Leu Lys Glu Phe Leu Asn Lys Ala Phe Pro Thr Thr Gly
290 295 300
Thr Lys Gly Thr Ser Leu Asn Ala Leu Asn Thr Phe Arg Thr Glu Gly
305 310 315 320
Cys Ile Ser His Pro Gln Leu Lys Lys Pro Asn Pro Gln Ile Asn Lys
325 330 335
Pro Leu Glu Ser Gln Tyr Phe Ala Pro Leu Asp Ala Leu Trp Gly Asp
340 345 350
Pro Ile Tyr Tyr Asn Asp Leu Asn Glu Asn Lys Ser Leu Asn Asp Ile
355 360 365
Ile Glu Lys Ile Leu Ile Lys Asn Met Ile Thr Tyr His Ala Lys Leu
370 375 380
Arg Glu Phe Pro Asn Ser Tyr Gln Gly Asn Lys Ala Phe Cys His Leu
385 390 395 400
Thr Gly Ile Tyr Ser Pro Pro Tyr Leu Asn Gln Gly Arg Ile Ser Pro
405 410 415
Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp
420 425 430
Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr Lys Glu Asn
435 440 445
Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr Asp Met Pro
450 455 460
Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys Lys Asp Thr
465 470 475 480
Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu Ile Cys Pro
485 490 495
Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp Tyr Gly Tyr
500 505 510
Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro Asp Gly Ser
515 520 525
Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro Thr Val Leu
530 535 540
His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly Pro Phe Ala
545 550 555 560
Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys Tyr Cys Phe
565 570 575
Asn Phe Asn Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp
580 585 590
Pro Ser Phe Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro
595 600 605
Arg Arg Ile Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser
610 615 620
Phe Arg Ser Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile
625 630 635 640
Lys Arg Val Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly
645 650 655
Pro Lys Lys Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu
660 665 670
Ser Ser His Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu
675 680 685
Glu Ser Glu Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe
690 695 700
Gln Gln Gln Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln
705 710 715 720
Gly Ile Lys Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val
725 730 735
His Val Asn Pro Cys Leu Arg
740
<210> 22
<211> 194
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 22
Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys
1 5 10 15
Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg
20 25 30
Arg Arg Pro Arg Arg Arg Arg Ile Val Lys Asp Pro Ser Phe Gln Pro
35 40 45
Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro Arg Arg Ile Gln Val
50 55 60
Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser Phe Arg Ser Trp Asp
65 70 75 80
Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile Lys Arg Val Ser Glu
85 90 95
Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly Pro Lys Lys Pro Arg
100 105 110
Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu Ser Ser His Ser Leu
115 120 125
Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu Glu Ser Glu Thr Glu
130 135 140
Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe Gln Gln Gln Leu Gln
145 150 155 160
Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln Gly Ile Lys Val Leu
165 170 175
Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val His Val Asn Pro Cys
180 185 190
Leu Arg
<210> 23
<211> 113
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 23
Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys
1 5 10 15
Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg
20 25 30
Arg Arg Pro Arg Arg Arg Arg Ala Gln Lys Ser Leu Gly Ser Thr Ser
35 40 45
Gln Asn Lys Lys Pro Lys Lys Lys Ala His Ile His Ser Lys Glu Asn
50 55 60
Arg Asp Arg Gly Arg Pro Arg Lys Lys Ala Arg Gln Lys Pro Ser Arg
65 70 75 80
Lys Arg Ala Lys Arg Ser Pro Ser Asn Ser Ser Cys Ser Ser Ser Thr
85 90 95
Lys Ser Ser Ser Ser Ser Asp Arg Glu Ser Lys Ser Ser Ser Ser Ser
100 105 110
Ser
<210> 24
<400> 24
000
<210> 25
<400> 25
000
<210> 26
<400> 26
000
<210> 27
<400> 27
000
<210> 28
<400> 28
000
<210> 29
<400> 29
000
<210> 30
<400> 30
000
<210> 31
<400> 31
000
<210> 32
<400> 32
000
<210> 33
<400> 33
000
<210> 34
<400> 34
000
<210> 35
<400> 35
000
<210> 36
<400> 36
000
<210> 37
<400> 37
000
<210> 38
<400> 38
000
<210> 39
<400> 39
000
<210> 40
<400> 40
000
<210> 41
<400> 41
000
<210> 42
<400> 42
000
<210> 43
<400> 43
000
<210> 44
<400> 44
000
<210> 45
<400> 45
000
<210> 46
<400> 46
000
<210> 47
<400> 47
000
<210> 48
<400> 48
000
<210> 49
<400> 49
000
<210> 50
<400> 50
000
<210> 51
<400> 51
000
<210> 52
<400> 52
000
<210> 53
<400> 53
000
<210> 54
<211> 2979
<212> DNA
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 54
taataaatat tcaacaggaa aaccacctaa tttaaattgc cgaccacaaa ccgtcactta 60
gttccccttt ttgcaacaac ttctgctttt ttccaactgc cggaaaacca cataatttgc 120
atggctaacc acaaactgat atgctaatta acttccacaa aacaacttcc ccttttaaaa 180
ccacacctac aaattaatta ttaaacacag tcacatcctg ggaggtacta ccacactata 240
ataccaagtg cacttccgaa tggctgagtt tatgccgcta gacggagaac gcatcagtta 300
ctgactgcgg actgaacttg ggcgggtgcc gaaggtgagt gaaaccaccg aagtcaaggg 360
gcaattcggg ctagttcagt ctagcggaac gggcaagaaa cttaaaatta ttttattttt 420
cagatgagcg actgctttaa accaacatgc tacaacaaca aaacaaagca aactcactgg 480
attaataacc tgcatttaac ccacgacctg atctgcttct gcccaacacc aactagacac 540
ttattactag ctttagcaga acaacaagaa acaattgaag tgtctaaaca agaaaaagaa 600
aaaataacaa gatgccttat tactacagaa gaagacggta caactacaga cgtcctagat 660
ggtatggacg aggttggatt agacgccctt ttcgcagaag atttcgaaga aaaagaaggg 720
taagacctac ttatactact attcctctaa agcaatggca accgccatat aaaagaacat 780
gctatataaa aggacaagac tgtttaatat actatagcaa cttaagactg ggaatgaata 840
gtacaatgta tgaaaaaagt attgtacctg tacattggcc gggagggggt tctttttctg 900
taagcatgtt aactttagat gccttgtatg atatacataa actttgtaga aactggtgga 960
catccacaaa ccaagactta ccactagtaa gatataaagg atgcaaaata acattttatc 1020
aaagcacatt tacagactac atagtaagaa tacatacaga actaccagct aacagtaaca 1080
aactaacata cccaaacaca catccactaa tgatgatgat gtctaagtac aaacacatta 1140
tacctagtag acaaacaaga agaaaaaaga aaccatacac aaaaatattt gtaaaaccac 1200
ctccgcaatt tgaaaacaaa tggtactttg ctacagacct ctacaaaatt ccattactac 1260
aaatacactg cacagcatgc aacttacaaa acccatttgt aaaaccagac aaattatcaa 1320
acaatgttac attatggtca ctaaacacca taagcataca aaatagaaac atgtcagtgg 1380
atcaaggaca atcatggcca tttaaaatac taggaacaca aagcttttat ttttactttt 1440
acaccggagc aaacctacca ggtgacacaa cacaaatacc agtagcagac ctattaccac 1500
taacaaaccc aagaataaac agaccaggac aatcactaaa tgaggcaaaa attacagacc 1560
atattacttt cacagaatac aaaaacaaat ttacaaatta ttggggtaac ccatttaata 1620
aacacattca agaacaccta gatatgatac tatactcact aaaaagtcca gaagcaataa 1680
aaaacgaatg gacaacagaa aacatgaaat ggaaccaatt aaacaatgca ggaacaatgg 1740
cattaacacc atttaacgag ccaatattca cacaaataca atataaccca gatagagaca 1800
caggagaaga cactcaatta tacctactct ctaacgctac aggaacagga tgggacccac 1860
caggaattcc agaattaata ctagaaggat ttccactatg gttaatatat tggggatttg 1920
cagactttca aaaaaaccta aaaaaagtaa caaacataga cacaaattac atgttagtag 1980
caaaaacaaa atttacacaa aaacctggca cattctactt agtaatacta aatgacacct 2040
ttgtagaagg caatagccca tatgaaaaac aacctttacc tgaagacaac attaaatggt 2100
acccacaagt acaataccaa ttagaagcac aaaacaaact actacaaact gggccattta 2160
caccaaacat acaaggacaa ctatcagaca atatatcaat gttttataaa ttttacttta 2220
aatggggagg aagcccacca aaagcaatta atgttgaaaa tcctgcccac cagattcaat 2280
atcccatacc ccgtaacgag catgaaacaa cttcgttaca gagtccaggg gaagccccag 2340
aatccatctt atactccttc gactatagac acgggaacta cacaacaaca gctttgtcac 2400
gaattagcca agactgggca cttaaagaca ctgtttctaa aattacagag ccagatcgac 2460
agcaactgct caaacaagcc ctcgaatgcc tgcaaatctc ggaagaaacg caggagaaaa 2520
aagaaaaaga agtacagcag ctcatcagca acctcagaca gcagcagcag ctgtacagag 2580
agcgaataat atcattatta aaggaccaat aacttttaac tgtgtaaaaa aggtgaaatt 2640
gtttgatgat aaaccaaaaa accgtagatt tacacctgag gaatttgaaa ctgagttaca 2700
aatagcaaaa tggttaaaga gacccccaag atcctttgta aatgatcctc ccttttaccc 2760
atggttacca cctgaacctg ttgtaaactt taagcttaat tttactgaat aaaggccagc 2820
attaattcac ttaaggagtc tgtttattta agttaaacct taataaacgg tcaccgcctc 2880
cctaatacgc aggcgcagaa agggggctcc gcccccttta acccccaggg ggctccgccc 2940
cctgaaaccc ccaagggggc tacgccccct tacaccccc 2979
<210> 55
<211> 99
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 55
Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln
1 5 10 15
Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe
20 25 30
Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln
35 40 45
Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys
50 55 60
Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly
65 70 75 80
Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu
85 90 95
Lys Glu Gly
<210> 56
<211> 203
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 56
Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln
1 5 10 15
Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe
20 25 30
Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln
35 40 45
Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys
50 55 60
Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly
65 70 75 80
Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu
85 90 95
Lys Glu Gly Phe Asn Ile Pro Tyr Pro Val Thr Ser Met Lys Gln Leu
100 105 110
Arg Tyr Arg Val Gln Gly Lys Pro Gln Asn Pro Ser Tyr Thr Pro Ser
115 120 125
Thr Ile Asp Thr Gly Thr Thr Gln Gln Gln Leu Cys His Glu Leu Ala
130 135 140
Lys Thr Gly His Leu Lys Thr Leu Phe Leu Lys Leu Gln Ser Gln Ile
145 150 155 160
Asp Ser Asn Cys Ser Asn Lys Pro Ser Asn Ala Cys Lys Ser Arg Lys
165 170 175
Lys Arg Arg Arg Lys Lys Lys Lys Lys Tyr Ser Ser Ser Ser Ala Thr
180 185 190
Ser Asp Ser Ser Ser Ser Cys Thr Glu Ser Glu
195 200
<210> 57
<211> 219
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 57
Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln
1 5 10 15
Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe
20 25 30
Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln
35 40 45
Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys
50 55 60
Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly
65 70 75 80
Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu
85 90 95
Lys Glu Gly Ala Arg Ser Thr Ala Thr Ala Gln Thr Ser Pro Arg Met
100 105 110
Pro Ala Asn Leu Gly Arg Asn Ala Gly Glu Lys Arg Lys Arg Ser Thr
115 120 125
Ala Ala His Gln Gln Pro Gln Thr Ala Ala Ala Ala Val Gln Arg Ala
130 135 140
Asn Asn Ile Ile Ile Lys Gly Pro Ile Thr Phe Asn Cys Val Lys Lys
145 150 155 160
Val Lys Leu Phe Asp Asp Lys Pro Lys Asn Arg Arg Phe Thr Pro Glu
165 170 175
Glu Phe Glu Thr Glu Leu Gln Ile Ala Lys Trp Leu Lys Arg Pro Pro
180 185 190
Arg Ser Phe Val Asn Asp Pro Pro Phe Tyr Pro Trp Leu Pro Pro Glu
195 200 205
Pro Val Val Asn Phe Lys Leu Asn Phe Thr Glu
210 215
<210> 58
<211> 666
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 58
Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg
1 5 10 15
Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg
20 25 30
Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln
35 40 45
Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys
50 55 60
Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr
65 70 75 80
Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser
85 90 95
Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys
100 105 110
Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr
115 120 125
Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile
130 135 140
Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr
145 150 155 160
Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile
165 170 175
Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile
180 185 190
Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr
195 200 205
Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn
210 215 220
Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr
225 230 235 240
Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val
245 250 255
Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe
260 265 270
Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln
275 280 285
Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg
290 295 300
Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe
305 310 315 320
Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn
325 330 335
Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser
340 345 350
Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn
355 360 365
Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro
370 375 380
Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp
385 390 395 400
Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro
405 410 415
Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile
420 425 430
Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn
435 440 445
Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys
450 455 460
Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly
465 470 475 480
Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp
485 490 495
Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln
500 505 510
Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile
515 520 525
Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys
530 535 540
Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro
545 550 555 560
Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro
565 570 575
Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr
580 585 590
Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val
595 600 605
Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu
610 615 620
Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu
625 630 635 640
Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg
645 650 655
Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
660 665
<210> 59
<211> 148
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 59
Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg
1 5 10 15
Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg
20 25 30
Arg Lys Arg Arg Ile Gln Tyr Pro Ile Pro Arg Asn Glu His Glu Thr
35 40 45
Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro Glu Ser Ile Leu Tyr Ser
50 55 60
Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr Thr Ala Leu Ser Arg Ile
65 70 75 80
Ser Gln Asp Trp Ala Leu Lys Asp Thr Val Ser Lys Ile Thr Glu Pro
85 90 95
Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu Glu Cys Leu Gln Ile Ser
100 105 110
Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu Val Gln Gln Leu Ile Ser
115 120 125
Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg Glu Arg Ile Ile Ser Leu
130 135 140
Leu Lys Asp Gln
145
<210> 60
<211> 82
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 60
Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg
1 5 10 15
Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg
20 25 30
Arg Lys Arg Arg Ser Gln Ile Asp Ser Asn Cys Ser Asn Lys Pro Ser
35 40 45
Asn Ala Cys Lys Ser Arg Lys Lys Arg Arg Arg Lys Lys Lys Lys Lys
50 55 60
Tyr Ser Ser Ser Ser Ala Thr Ser Asp Ser Ser Ser Ser Cys Thr Glu
65 70 75 80
Ser Glu
<210> 61
<400> 61
000
<210> 62
<400> 62
000
<210> 63
<400> 63
000
<210> 64
<400> 64
000
<210> 65
<400> 65
000
<210> 66
<400> 66
000
<210> 67
<400> 67
000
<210> 68
<400> 68
000
<210> 69
<400> 69
000
<210> 70
<400> 70
000
<210> 71
<400> 71
000
<210> 72
<400> 72
000
<210> 73
<400> 73
000
<210> 74
<400> 74
000
<210> 75
<400> 75
000
<210> 76
<400> 76
000
<210> 77
<400> 77
000
<210> 78
<400> 78
000
<210> 79
<400> 79
000
<210> 80
<400> 80
000
<210> 81
<400> 81
000
<210> 82
<400> 82
000
<210> 83
<400> 83
000
<210> 84
<400> 84
000
<210> 85
<400> 85
000
<210> 86
<400> 86
000
<210> 87
<400> 87
000
<210> 88
<400> 88
000
<210> 89
<400> 89
000
<210> 90
<400> 90
000
<210> 91
<400> 91
000
<210> 92
<400> 92
000
<210> 93
<400> 93
000
<210> 94
<400> 94
000
<210> 95
<400> 95
000
<210> 96
<400> 96
000
<210> 97
<400> 97
000
<210> 98
<400> 98
000
<210> 99
<400> 99
000
<210> 100
<400> 100
000
<210> 101
<400> 101
000
<210> 102
<400> 102
000
<210> 103
<400> 103
000
<210> 104
<400> 104
000
<210> 105
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 105
cgggtgccgk aggtgagttt acacaccgma gtcaaggggc aattcgggct crggactggc 60
cgggcyhtgg g 71
<210> 106
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 106
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctwtgg g 71
<210> 107
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 107
cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctatgg g 71
<210> 108
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 108
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggccctgg g 71
<210> 109
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 109
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctttgg g 71
<210> 110
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 110
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctatgg g 71
<210> 111
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 111
cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60
cgggctttgg g 71
<210> 112
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 112
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggcyhtgg g 71
<210> 113
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 113
cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctatgg g 71
<210> 114
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 114
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggcccggg 70
<210> 115
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 115
cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60
cgggctttgg g 71
<210> 116
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 116
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggaggccg 60
ggccatggg 69
<210> 117
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 117
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggccccgg g 71
<210> 118
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 118
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctatgg g 71
<210> 119
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 119
cgggtgccga aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctatgg g 71
<210> 120
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<221> 尚未归类的特征
<222> (10)..(10)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (12)..(12)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (30)..(32)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (34)..(34)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (43)..(46)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (52)..(54)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (70)..(71)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (89)..(90)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (103)..(103)
<223> 可能存在或可能不存在
<400> 120
cggcggsggs gcsscgcgct dcgcgcgcsg cccrsyrggg grdssmmwgc skcscccccc 60
cscgcgcatg cgcrcgggkc ccccccccyv sggggggctc cgcccccccg gcccccc 117
<210> 121
<211> 169
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<220>
<221> 修饰的碱基
<222> (20)..(20)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (22)..(22)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (40)..(42)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (53)..(56)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (62)..(62)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (64)..(64)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (97)..(98)
<223> a、c、t、g、未知或其他
<400> 121
gccgccgcgg cggcggsggn gnsgcgcgct dcgcgcgcsn nncrccrggg ggnnnncwgc 60
sncncccccc cccgcgcatg cgcgggkccc ccccccnncg gggggctccg ccccccggcc 120
cccccccgtg ctaaacccac cgcgcatgcg cgaccacgcc cccgccgcc 169
<210> 122
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (20)..(20)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (22)..(22)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (40)..(42)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (53)..(56)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (62)..(62)
<223> a、c、t、g、未知或其他
<220>
<221> 修饰的碱基
<222> (64)..(64)
<223> a、c、t、g、未知或其他
<400> 122
gccgccgcgg cggcggsggn gnsgcgcgct dcgcgcgcsn nncrccrggg ggnnnncwgc 60
sncncccccc cccgcgcat 79
<210> 123
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 修饰的碱基
<222> (18)..(19)
<223> a、c、t、g、未知或其他
<400> 123
gcgcgggkcc cccccccnnc ggggggctcc g 31
<210> 124
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 124
ccccccggcc cccccccgtg ctaaacccac cgcgcatgcg cgaccacgcc cccgccgcc 59
<210> 125
<211> 156
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 125
gcggcggggg ggcggccgcg ttcgcgcgcc gcccaccagg gggtgctgcg cgcccccccc 60
cgcgcatgcg cggggccccc ccccgggggg gctccgcccc cccggccccc ccccgtgcta 120
aacccaccgc gcatgcgcga ccacgccccc gccgcc 156
<210> 126
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 126
gcggcgg 7
<210> 127
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 127
gggggcg 7
<210> 128
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 128
gccgcg 6
<210> 129
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 129
ttcgcgcgcc gcccaccagg gggtg 25
<210> 130
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 130
ctgcg 5
<210> 131
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 131
cgcccccccc cgcgcat 17
<210> 132
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 132
gcgcggggcc ccccccc 17
<210> 133
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 133
gggggggctc cgcccccccg gccccccccc gtgctaaacc caccgcgcat gcgcgaccac 60
gcccccgccg cc 72
<210> 134
<211> 115
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 134
cggcggcggc ggcgcgcgcg ctgcgcgcgc gcgccggggg ggcgccagcg cccccccccc 60
cgcgcatgca cgggtccccc cccccacggg gggctccgcc ccccggcccc ccccc 115
<210> 135
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 135
cggcggcggc ggcg 14
<210> 136
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 136
cgcgcgctgc gcgcgcg 17
<210> 137
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 137
cgccgggggg gcgccagcg 19
<210> 138
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 138
cccccccccc cgcgcat 17
<210> 139
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 139
gcacgggtcc ccccccccac ggggggctcc g 31
<210> 140
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 140
ccccccggcc ccccccc 17
<210> 141
<211> 121
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 141
ccgtcggcgg gggggccgcg cgctgcgcgc gcggcccccg ggggaggcac agcctccccc 60
ccccgcgcgc atgcgcgcgg gtcccccccc ctccgggggg ctccgccccc cggccccccc 120
c 121
<210> 142
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 142
ccgtcggcgg gggggccgcg cgctgcgcgc gcggccc 37
<210> 143
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 143
ccgggggagg cacagcctcc cccccccgcg cgcatgcgcg cgggtccccc cccctccggg 60
gggctccgcc ccccggcccc cccc 84
<210> 144
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 144
cggcggcggc gcgcgcgcta cgcgcgcgcg ccggggggct gccgcccccc ccccgcgcat 60
gcgcggggcc cccccccgcg gggggctccg ccccccggcc cccc 104
<210> 145
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 145
cggcggcggc g 11
<210> 146
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 146
cgcgcgctac gcgcgcg 17
<210> 147
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 147
cgccgggggg 10
<210> 148
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 148
ctgccgc 7
<210> 149
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 149
cccccccccg cgcat 15
<210> 150
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 150
gcgcggggcc ccccccc 17
<210> 151
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 151
gcggggggct ccg 13
<210> 152
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 152
ccccccggcc cccc 14
<210> 153
<211> 122
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 153
gccgccgcgg cggcgggggg cggcgcgctg cgcgcgccgc ccagtagggg gagccatgcg 60
cccccccccg cgcatgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc 120
cg 122
<210> 154
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 154
gccgccgcgg cggcggggg 19
<210> 155
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 155
gcggcgcgct gcgcgcgccg cccagtaggg ggagccatgc g 41
<210> 156
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 156
cccccccccg cgcat 15
<210> 157
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 157
gcgcggggcc ccccccc 17
<210> 158
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 158
gcggggggct ccg 13
<210> 159
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 159
ccccccggcc ccccccg 17
<210> 160
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 160
cgcgctgcgc gcgccgccca gtagggggag ccatgc 36
<210> 161
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 161
ccgccatctt aagtagttga ggcggacggt ggcgtgagtt caaaggtcac catcagccac 60
acctactcaa aatggtgg 78
<210> 162
<211> 172
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 162
cttaagtagt tgaggcggac ggtggcgtga gttcaaaggt caccatcagc cacacctact 60
caaaatggtg gacaatttct tccgggtcaa aggttacagc cgccatgtta aaacacgtga 120
cgtatgacgt cacggccgcc attttgtgac acaagatggc cgacttcctt cc 172
<210> 163
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 163
cgcgctgcgc gcgccgccca gtagggggag ccatgc 36
<210> 164
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 164
gcgctdcgcg cgcgcgccgg ggggctgcgc cccccc 36
<210> 165
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 165
gcgcttcgcg cgccgcccac tagggggcgt tgcgcg 36
<210> 166
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 166
gcgctgcgcg cgccgcccag tagggggcgc aatgcg 36
<210> 167
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 167
gcgctgcgcg cgcggccccc gggggaggca ttgcct 36
<210> 168
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 168
gcgctgcgcg cgcgcgccgg gggggcgcca gcgccc 36
<210> 169
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 169
gcgcttcgcg cgcgcgccgg ggggctccgc cccccc 36
<210> 170
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 170
gcgcttcgcg cgcgcgccgg ggggctgcgc cccccc 36
<210> 171
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 171
gcgctacgcg cgcgcgccgg ggggctgcgc cccccc 36
<210> 172
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<400> 172
gcgctacgcg cgcgcgccgg ggggctctgc cccccc 36
<210> 173
<400> 173
000
<210> 174
<400> 174
000
<210> 175
<400> 175
000
<210> 176
<400> 176
000
<210> 177
<400> 177
000
<210> 178
<400> 178
000
<210> 179
<400> 179
000
<210> 180
<400> 180
000
<210> 181
<400> 181
000
<210> 182
<400> 182
000
<210> 183
<400> 183
000
<210> 184
<400> 184
000
<210> 185
<211> 743
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 185
Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys
1 5 10 15
Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg
20 25 30
Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg
35 40 45
Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg
50 55 60
Arg Gly Arg Lys Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val
65 70 75 80
Ile Lys Arg Cys Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly
85 90 95
Asn Gly Thr Phe Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile
100 105 110
Met Lys Gly Pro Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu
115 120 125
Tyr Ile Leu Phe Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg
130 135 140
Ser Asn Asp Asn Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys
145 150 155 160
Ile Tyr Arg His Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg
165 170 175
Thr Pro Leu Gly Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly
180 185 190
Asn Ala Ile Leu Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr
195 200 205
Arg Pro Lys Gly Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr
210 215 220
Leu Phe Thr Asp Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr
225 230 235 240
Leu Phe Asn Ile Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys
245 250 255
Ser Pro Gln Thr Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser
260 265 270
Val Tyr Asn Asn Tyr Leu Ser Ile Asn Thr Phe Asn Asn Asp Asn Ser
275 280 285
Asp Ser Lys Leu Lys Glu Phe Leu Asn Lys Ala Phe Pro Thr Thr Gly
290 295 300
Thr Lys Gly Thr Ser Leu Asn Ala Leu Asn Thr Phe Arg Thr Glu Gly
305 310 315 320
Cys Ile Ser His Pro Gln Leu Lys Lys Pro Asn Pro Gln Ile Asn Lys
325 330 335
Pro Leu Glu Ser Gln Tyr Phe Ala Pro Leu Asp Ala Leu Trp Gly Asp
340 345 350
Pro Ile Tyr Tyr Asn Asp Leu Asn Glu Asn Lys Ser Leu Asn Asp Ile
355 360 365
Ile Glu Lys Ile Leu Ile Lys Asn Met Ile Thr Tyr His Ala Lys Leu
370 375 380
Arg Glu Phe Pro Asn Ser Tyr Gln Gly Asn Lys Ala Phe Cys His Leu
385 390 395 400
Thr Gly Ile Tyr Ser Pro Pro Tyr Leu Asn Gln Gly Arg Ile Ser Pro
405 410 415
Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp
420 425 430
Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr Lys Glu Asn
435 440 445
Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr Asp Met Pro
450 455 460
Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys Lys Asp Thr
465 470 475 480
Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu Ile Cys Pro
485 490 495
Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp Tyr Gly Tyr
500 505 510
Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro Asp Gly Ser
515 520 525
Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro Thr Val Leu
530 535 540
His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly Pro Phe Ala
545 550 555 560
Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys Tyr Cys Phe
565 570 575
Asn Phe Asn Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp
580 585 590
Pro Ser Phe Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro
595 600 605
Arg Arg Ile Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser
610 615 620
Phe Arg Ser Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile
625 630 635 640
Lys Arg Val Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly
645 650 655
Pro Lys Lys Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu
660 665 670
Ser Ser His Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu
675 680 685
Glu Ser Glu Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe
690 695 700
Gln Gln Gln Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln
705 710 715 720
Gly Ile Lys Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val
725 730 735
His Val Asn Pro Cys Leu Arg
740
<210> 186
<211> 68
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 186
Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys
1 5 10 15
Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg
20 25 30
Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg
35 40 45
Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg
50 55 60
Arg Gly Arg Lys
65
<210> 187
<211> 212
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 187
Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val Ile Lys Arg Cys
1 5 10 15
Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly Asn Gly Thr Phe
20 25 30
Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile Met Lys Gly Pro
35 40 45
Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu Tyr Ile Leu Phe
50 55 60
Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg Ser Asn Asp Asn
65 70 75 80
Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys Ile Tyr Arg His
85 90 95
Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg Thr Pro Leu Gly
100 105 110
Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly Asn Ala Ile Leu
115 120 125
Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr Arg Pro Lys Gly
130 135 140
Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr Leu Phe Thr Asp
145 150 155 160
Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr Leu Phe Asn Ile
165 170 175
Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys Ser Pro Gln Thr
180 185 190
Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser Val Tyr Asn Asn
195 200 205
Tyr Leu Ser Ile
210
<210> 188
<211> 133
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 188
Asn Thr Phe Asn Asn Asp Asn Ser Asp Ser Lys Leu Lys Glu Phe Leu
1 5 10 15
Asn Lys Ala Phe Pro Thr Thr Gly Thr Lys Gly Thr Ser Leu Asn Ala
20 25 30
Leu Asn Thr Phe Arg Thr Glu Gly Cys Ile Ser His Pro Gln Leu Lys
35 40 45
Lys Pro Asn Pro Gln Ile Asn Lys Pro Leu Glu Ser Gln Tyr Phe Ala
50 55 60
Pro Leu Asp Ala Leu Trp Gly Asp Pro Ile Tyr Tyr Asn Asp Leu Asn
65 70 75 80
Glu Asn Lys Ser Leu Asn Asp Ile Ile Glu Lys Ile Leu Ile Lys Asn
85 90 95
Met Ile Thr Tyr His Ala Lys Leu Arg Glu Phe Pro Asn Ser Tyr Gln
100 105 110
Gly Asn Lys Ala Phe Cys His Leu Thr Gly Ile Tyr Ser Pro Pro Tyr
115 120 125
Leu Asn Gln Gly Arg
130
<210> 189
<211> 166
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 189
Ile Ser Pro Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro
1 5 10 15
Tyr Thr Asp Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr
20 25 30
Lys Glu Asn Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr
35 40 45
Asp Met Pro Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys
50 55 60
Lys Asp Thr Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu
65 70 75 80
Ile Cys Pro Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp
85 90 95
Tyr Gly Tyr Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro
100 105 110
Asp Gly Ser Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro
115 120 125
Thr Val Leu His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly
130 135 140
Pro Phe Ala Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys
145 150 155 160
Tyr Cys Phe Asn Phe Asn
165
<210> 190
<211> 164
<212> PRT
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 190
Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp Pro Ser Phe
1 5 10 15
Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro Arg Arg Ile
20 25 30
Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser Phe Arg Ser
35 40 45
Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile Lys Arg Val
50 55 60
Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly Pro Lys Lys
65 70 75 80
Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu Ser Ser His
85 90 95
Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu Glu Ser Glu
100 105 110
Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe Gln Gln Gln
115 120 125
Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln Gly Ile Lys
130 135 140
Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val His Val Asn
145 150 155 160
Pro Cys Leu Arg
<210> 191
<400> 191
000
<210> 192
<400> 192
000
<210> 193
<400> 193
000
<210> 194
<400> 194
000
<210> 195
<400> 195
000
<210> 196
<400> 196
000
<210> 197
<400> 197
000
<210> 198
<400> 198
000
<210> 199
<400> 199
000
<210> 200
<400> 200
000
<210> 201
<400> 201
000
<210> 202
<400> 202
000
<210> 203
<400> 203
000
<210> 204
<400> 204
000
<210> 205
<400> 205
000
<210> 206
<400> 206
000
<210> 207
<400> 207
000
<210> 208
<400> 208
000
<210> 209
<400> 209
000
<210> 210
<400> 210
000
<210> 211
<400> 211
000
<210> 212
<400> 212
000
<210> 213
<400> 213
000
<210> 214
<400> 214
000
<210> 215
<211> 666
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 215
Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg
1 5 10 15
Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg
20 25 30
Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln
35 40 45
Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys
50 55 60
Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr
65 70 75 80
Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser
85 90 95
Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys
100 105 110
Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr
115 120 125
Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile
130 135 140
Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr
145 150 155 160
Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile
165 170 175
Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile
180 185 190
Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr
195 200 205
Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn
210 215 220
Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr
225 230 235 240
Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val
245 250 255
Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe
260 265 270
Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln
275 280 285
Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg
290 295 300
Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe
305 310 315 320
Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn
325 330 335
Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser
340 345 350
Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn
355 360 365
Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro
370 375 380
Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp
385 390 395 400
Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro
405 410 415
Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile
420 425 430
Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn
435 440 445
Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys
450 455 460
Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly
465 470 475 480
Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp
485 490 495
Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln
500 505 510
Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile
515 520 525
Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys
530 535 540
Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro
545 550 555 560
Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro
565 570 575
Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr
580 585 590
Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val
595 600 605
Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu
610 615 620
Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu
625 630 635 640
Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg
645 650 655
Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
660 665
<210> 216
<211> 38
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 216
Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg
1 5 10 15
Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg
20 25 30
Arg Lys Arg Arg Val Arg
35
<210> 217
<211> 208
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 217
Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln Trp Gln Pro Pro Tyr Lys
1 5 10 15
Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys Leu Ile Tyr Tyr Ser Asn
20 25 30
Leu Arg Leu Gly Met Asn Ser Thr Met Tyr Glu Lys Ser Ile Val Pro
35 40 45
Val His Trp Pro Gly Gly Gly Ser Phe Ser Val Ser Met Leu Thr Leu
50 55 60
Asp Ala Leu Tyr Asp Ile His Lys Leu Cys Arg Asn Trp Trp Thr Ser
65 70 75 80
Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr Lys Gly Cys Lys Ile Thr
85 90 95
Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile Val Arg Ile His Thr Glu
100 105 110
Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr Pro Asn Thr His Pro Leu
115 120 125
Met Met Met Met Ser Lys Tyr Lys His Ile Ile Pro Ser Arg Gln Thr
130 135 140
Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile Phe Val Lys Pro Pro Pro
145 150 155 160
Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr Asp Leu Tyr Lys Ile Pro
165 170 175
Leu Leu Gln Ile His Cys Thr Ala Cys Asn Leu Gln Asn Pro Phe Val
180 185 190
Lys Pro Asp Lys Leu Ser Asn Asn Val Thr Leu Trp Ser Leu Asn Thr
195 200 205
<210> 218
<211> 128
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 218
Ile Ser Ile Gln Asn Arg Asn Met Ser Val Asp Gln Gly Gln Ser Trp
1 5 10 15
Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe Tyr Phe Tyr Phe Tyr Thr
20 25 30
Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln Ile Pro Val Ala Asp Leu
35 40 45
Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg Pro Gly Gln Ser Leu Asn
50 55 60
Glu Ala Lys Ile Thr Asp His Ile Thr Phe Thr Glu Tyr Lys Asn Lys
65 70 75 80
Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn Lys His Ile Gln Glu His
85 90 95
Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser Pro Glu Ala Ile Lys Asn
100 105 110
Glu Trp Thr Thr Glu Asn Met Lys Trp Asn Gln Leu Asn Asn Ala Gly
115 120 125
<210> 219
<211> 163
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 219
Thr Met Ala Leu Thr Pro Phe Asn Glu Pro Ile Phe Thr Gln Ile Gln
1 5 10 15
Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp Thr Gln Leu Tyr Leu Leu
20 25 30
Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro Pro Gly Ile Pro Glu Leu
35 40 45
Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile Tyr Trp Gly Phe Ala Asp
50 55 60
Phe Gln Lys Asn Leu Lys Lys Val Thr Asn Ile Asp Thr Asn Tyr Met
65 70 75 80
Leu Val Ala Lys Thr Lys Phe Thr Gln Lys Pro Gly Thr Phe Tyr Leu
85 90 95
Val Ile Leu Asn Asp Thr Phe Val Glu Gly Asn Ser Pro Tyr Glu Lys
100 105 110
Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp Tyr Pro Gln Val Gln Tyr
115 120 125
Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln Thr Gly Pro Phe Thr Pro
130 135 140
Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile Ser Met Phe Tyr Lys Phe
145 150 155 160
Tyr Phe Lys
<210> 220
<211> 129
<212> PRT
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 220
Trp Gly Gly Ser Pro Pro Lys Ala Ile Asn Val Glu Asn Pro Ala His
1 5 10 15
Gln Ile Gln Tyr Pro Ile Pro Arg Asn Glu His Glu Thr Thr Ser Leu
20 25 30
Gln Ser Pro Gly Glu Ala Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr
35 40 45
Arg His Gly Asn Tyr Thr Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp
50 55 60
Trp Ala Leu Lys Asp Thr Val Ser Lys Ile Thr Glu Pro Asp Arg Gln
65 70 75 80
Gln Leu Leu Lys Gln Ala Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr
85 90 95
Gln Glu Lys Lys Glu Lys Glu Val Gln Gln Leu Ile Ser Asn Leu Arg
100 105 110
Gln Gln Gln Gln Leu Tyr Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp
115 120 125
Gln
<210> 221
<400> 221
000
<210> 222
<400> 222
000
<210> 223
<400> 223
000
<210> 224
<400> 224
000
<210> 225
<400> 225
000
<210> 226
<400> 226
000
<210> 227
<211> 220
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<221> 经修饰的残基
<222> (29)..(31)
<223> 任何氨基酸
<220>
<221> 位点
<222> (29)..(31)
<223> 该区域可包含0-3个残基
<220>
<221> 经修饰的残基
<222> (100)..(100)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (125)..(129)
<223> 任何氨基酸
<220>
<221> 位点
<222> (125)..(129)
<223> 该区域可包含1-5个残基
<220>
<221> 经修饰的残基
<222> (181)..(181)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (211)..(211)
<223> 任何氨基酸
<400> 227
Leu Val Leu Thr Gln Trp Gln Pro Asn Thr Val Arg Arg Cys Tyr Ile
1 5 10 15
Arg Gly Tyr Leu Pro Leu Ile Ile Cys Gly Glu Asn Xaa Xaa Xaa Thr
20 25 30
Thr Ser Arg Asn Tyr Ala Thr His Ser Asp Asp Thr Ile Gln Lys Gly
35 40 45
Pro Phe Gly Gly Gly Met Ser Thr Thr Thr Phe Ser Leu Arg Val Leu
50 55 60
Tyr Asp Glu Tyr Gln Arg Phe Met Asn Arg Trp Thr Tyr Ser Asn Glu
65 70 75 80
Asp Leu Asp Leu Ala Arg Tyr Leu Gly Cys Lys Phe Thr Phe Tyr Arg
85 90 95
His Pro Asp Xaa Asp Phe Ile Val Gln Tyr Asn Thr Asn Pro Pro Phe
100 105 110
Lys Asp Thr Lys Leu Thr Ala Pro Ser Ile His Pro Xaa Xaa Xaa Xaa
115 120 125
Xaa Gly Met Leu Met Leu Ser Lys Arg Lys Ile Leu Ile Pro Ser Leu
130 135 140
Lys Thr Arg Pro Lys Gly Lys His Tyr Val Lys Val Arg Ile Gly Pro
145 150 155 160
Pro Lys Leu Phe Glu Asp Lys Trp Tyr Thr Gln Ser Asp Leu Cys Asp
165 170 175
Val Pro Leu Val Xaa Leu Tyr Ala Thr Ala Ala Asp Leu Gln His Pro
180 185 190
Phe Gly Ser Pro Gln Thr Asp Asn Pro Cys Val Thr Phe Gln Val Leu
195 200 205
Gly Ser Xaa Tyr Asn Lys His Leu Ser Ile Ser Pro
210 215 220
<210> 228
<211> 172
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<221> 经修饰的残基
<222> (38)..(38)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (44)..(46)
<223> 任何氨基酸
<220>
<221> 位点
<222> (44)..(46)
<223> 该区域可包含0-3个残基
<220>
<221> 经修饰的残基
<222> (77)..(77)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (79)..(79)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (98)..(101)
<223> 任何氨基酸
<220>
<221> 位点
<222> (98)..(101)
<223> 该区域可包含0-4个残基
<400> 228
Ser Asn Phe Glu Phe Pro Gly Ala Tyr Thr Asp Ile Thr Tyr Asn Pro
1 5 10 15
Leu Thr Asp Lys Gly Val Gly Asn Met Val Trp Ile Gln Tyr Leu Thr
20 25 30
Lys Pro Asp Thr Ile Xaa Asp Lys Thr Gln Ser Xaa Xaa Xaa Lys Cys
35 40 45
Leu Ile Glu Asp Leu Pro Leu Trp Ala Ala Leu Tyr Gly Tyr Val Asp
50 55 60
Phe Cys Glu Lys Glu Thr Gly Asp Ser Ala Ile Ile Xaa Asn Xaa Gly
65 70 75 80
Arg Val Leu Ile Arg Cys Pro Tyr Thr Lys Pro Pro Leu Tyr Asp Lys
85 90 95
Thr Xaa Xaa Xaa Xaa Asn Lys Gly Phe Val Pro Tyr Ser Thr Asn Phe
100 105 110
Gly Asn Gly Lys Met Pro Gly Gly Ser Gly Tyr Val Pro Ile Tyr Trp
115 120 125
Arg Ala Arg Trp Tyr Pro Thr Leu Phe His Gln Lys Glu Val Leu Glu
130 135 140
Asp Ile Val Gln Ser Gly Pro Phe Ala Tyr Lys Asp Glu Lys Pro Ser
145 150 155 160
Thr Gln Leu Val Met Lys Tyr Cys Phe Asn Phe Asn
165 170
<210> 229
<211> 258
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<221> 经修饰的残基
<222> (20)..(22)
<223> 任何氨基酸
<220>
<221> 位点
<222> (20)..(22)
<223> 该区域可包含0-3个残基
<220>
<221> 经修饰的残基
<222> (25)..(25)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (78)..(78)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (89)..(89)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (91)..(91)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (95)..(98)
<223> 任何氨基酸
<220>
<221> 位点
<222> (95)..(98)
<223> 该区域可包含1-4个残基
<220>
<221> 经修饰的残基
<222> (107)..(120)
<223> 任何氨基酸
<220>
<221> 位点
<222> (107)..(120)
<223> 该区域可包含2-14个残基
<220>
<221> 经修饰的残基
<222> (129)..(129)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (139)..(168)
<223> 任何氨基酸
<220>
<221> 位点
<222> (139)..(168)
<223> 该区域可包含0-30 个残基
<220>
<221> 经修饰的残基
<222> (201)..(204)
<223> 任何氨基酸
<220>
<221> 位点
<222> (201)..(204)
<223> 该区域可包含0-4 个残基
<220>
<221> 经修饰的残基
<222> (219)..(258)
<223> 任何氨基酸
<220>
<221> 位点
<222> (219)..(258)
<223> 该区域可包含0-40 个残基
<400> 229
Trp Gly Gly Asn Pro Ile Ser Gln Gln Val Val Arg Asn Pro Cys Lys
1 5 10 15
Asp Ser Gly Xaa Xaa Xaa Ser Gly Xaa Gly Arg Gln Pro Arg Ser Val
20 25 30
Gln Val Val Asp Pro Lys Tyr Met Gly Pro Glu Tyr Thr Phe His Ser
35 40 45
Trp Asp Trp Arg Arg Gly Leu Phe Gly Glu Lys Ala Ile Lys Arg Met
50 55 60
Ser Glu Gln Pro Thr Asp Asp Glu Ile Phe Thr Gly Gly Xaa Pro Lys
65 70 75 80
Arg Pro Arg Arg Asp Pro Pro Thr Xaa Gln Xaa Pro Glu Glu Xaa Xaa
85 90 95
Xaa Xaa Gln Lys Glu Ser Ser Ser Phe Arg Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Trp Glu Ser Ser Ser Gln Glu
115 120 125
Xaa Glu Ser Glu Ser Gln Glu Glu Glu Glu Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Glu Gln Thr Val Gln Gln Gln Leu
165 170 175
Arg Gln Gln Leu Arg Glu Gln Arg Arg Leu Arg Val Gln Leu Gln Leu
180 185 190
Leu Phe Gln Gln Leu Leu Lys Thr Xaa Xaa Xaa Xaa Gln Ala Gly Leu
195 200 205
His Ile Asn Pro Leu Leu Leu Ser Gln Ala Xaa Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
225 230 235 240
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
245 250 255
Xaa Xaa
<210> 230
<211> 214
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<221> 经修饰的残基
<222> (136)..(136)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (138)..(141)
<223> 任何氨基酸
<220>
<221> 位点
<222> (138)..(141)
<223> 该区域可包含1-4个残基
<220>
<221> 经修饰的残基
<222> (179)..(179)
<223> 任何氨基酸
<400> 230
Leu Lys Gln Trp Gln Pro Ser Thr Ile Arg Lys Cys Lys Ile Lys Gly
1 5 10 15
Tyr Leu Pro Leu Phe Gln Cys Gly Lys Gly Arg Ile Ser Asn Asn Tyr
20 25 30
Thr Gln Tyr Lys Glu Ser Ile Val Pro His His Glu Pro Gly Gly Gly
35 40 45
Gly Trp Ser Ile Gln Gln Phe Thr Leu Gly Ala Leu Tyr Glu Glu His
50 55 60
Leu Lys Leu Arg Asn Trp Trp Thr Lys Ser Asn Asp Gly Leu Pro Leu
65 70 75 80
Val Arg Tyr Leu Gly Cys Thr Ile Lys Leu Tyr Arg Ser Glu Asp Thr
85 90 95
Asp Tyr Ile Val Thr Tyr Gln Arg Cys Tyr Pro Met Thr Ala Thr Lys
100 105 110
Leu Thr Tyr Leu Ser Thr Gln Pro Ser Arg Met Leu Met Asn Lys His
115 120 125
Lys Ile Ile Val Pro Ser Lys Xaa Thr Xaa Xaa Xaa Xaa Asn Lys Lys
130 135 140
Lys Lys Pro Tyr Lys Lys Ile Phe Ile Lys Pro Pro Ser Gln Met Gln
145 150 155 160
Asn Lys Trp Tyr Phe Gln Gln Asp Ile Ala Asn Thr Pro Leu Leu Gln
165 170 175
Leu Thr Xaa Thr Ala Cys Ser Leu Asp Arg Met Tyr Leu Ser Ser Asp
180 185 190
Ser Ile Ser Asn Asn Ile Thr Phe Thr Ser Leu Asn Thr Asn Phe Phe
195 200 205
Gln Asn Pro Asn Phe Gln
210
<210> 231
<211> 187
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<221> 经修饰的残基
<222> (1)..(10)
<223> 任何氨基酸
<220>
<221> 位点
<222> (1)..(10)
<223> 该区域可包含4-10个残基
<220>
<221> 经修饰的残基
<222> (38)..(45)
<223> 任何氨基酸
<220>
<221> 位点
<222> (38)..(45)
<223> 该区域可包含1-8个残基
<220>
<221> 经修饰的残基
<222> (94)..(94)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (100)..(102)
<223> 任何氨基酸
<220>
<221> 位点
<222> (100)..(102)
<223> 该区域可包含1-3个残基
<220>
<221> 经修饰的残基
<222> (112)..(112)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (114)..(115)
<223> 任何氨基酸
<220>
<221> 位点
<222> (114)..(115)
<223> 该区域可包含0-2个残基
<220>
<221> 经修饰的残基
<222> (124)..(139)
<223> 任何氨基酸
<220>
<221> 位点
<222> (124)..(139)
<223> 该区域可包含3-16个残基
<220>
<221> 经修饰的残基
<222> (154)..(154)
<223> 任何氨基酸
<400> 231
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Pro Leu Tyr Phe Glu
1 5 10 15
Cys Arg Tyr Asn Pro Phe Lys Asp Lys Gly Thr Gly Asn Lys Val Tyr
20 25 30
Leu Val Ser Asn Asn Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Gly Trp
35 40 45
Asp Pro Pro Thr Asp Pro Asp Leu Ile Ile Glu Gly Phe Pro Leu Trp
50 55 60
Leu Leu Leu Trp Gly Trp Leu Asp Trp Gln Lys Lys Leu Gly Lys Ile
65 70 75 80
Gln Asn Ile Asp Thr Asp Tyr Ile Leu Val Ile Gln Ser Xaa Tyr Tyr
85 90 95
Ile Pro Pro Xaa Xaa Xaa Lys Leu Pro Tyr Tyr Val Pro Leu Asp Xaa
100 105 110
Asp Xaa Xaa Phe Leu His Gly Arg Ser Pro Tyr Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Ser Asp Lys Gln
130 135 140
His Trp His Pro Lys Val Arg Phe Gln Xaa Glu Thr Ile Asn Asn Ile
145 150 155 160
Ala Leu Thr Gly Pro Gly Thr Pro Lys Leu Pro Asn Gln Lys Ser Ile
165 170 175
Gln Ala His Met Lys Tyr Lys Phe Tyr Phe Lys
180 185
<210> 232
<211> 163
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<221> 经修饰的残基
<222> (34)..(34)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (65)..(65)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (77)..(78)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (86)..(87)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (96)..(96)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (102)..(106)
<223> 任何氨基酸
<220>
<221> 位点
<222> (102)..(106)
<223> 该区域可包含0-5个残基
<220>
<221> 经修饰的残基
<222> (125)..(125)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (135)..(135)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (138)..(163)
<223> 任何氨基酸
<220>
<221> 位点
<222> (138)..(163)
<223> 该区域可包含0-26个残基
<400> 232
Trp Gly Gly Cys Pro Ala Pro Met Glu Thr Ile Thr Asp Pro Cys Lys
1 5 10 15
Gln Pro Lys Tyr Pro Ile Pro Asn Asn Leu Leu Gln Thr Thr Ser Leu
20 25 30
Gln Xaa Pro Thr Thr Pro Ile Glu Thr Tyr Leu Tyr Lys Phe Asp Glu
35 40 45
Arg Arg Gly Leu Leu Thr Lys Lys Ala Ala Lys Arg Ile Lys Lys Asp
50 55 60
Xaa Thr Thr Glu Thr Thr Leu Phe Thr Asp Thr Gly Xaa Xaa Thr Ser
65 70 75 80
Thr Thr Leu Pro Thr Xaa Xaa Gln Thr Glu Thr Thr Gln Glu Glu Xaa
85 90 95
Thr Ser Glu Glu Glu Xaa Xaa Xaa Xaa Xaa Glu Thr Leu Leu Gln Gln
100 105 110
Leu Gln Gln Leu Arg Arg Lys Gln Lys Gln Leu Arg Xaa Arg Ile Leu
115 120 125
Gln Leu Leu Gln Leu Leu Xaa Leu Leu Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa Xaa
<210> 233
<211> 203
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<221> 经修饰的残基
<222> (79)..(79)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (104)..(104)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (116)..(116)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (120)..(121)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (125)..(125)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (170)..(170)
<223> 任何氨基酸
<400> 233
Thr Ile Pro Leu Lys Gln Trp Gln Pro Glu Ser Ile Arg Lys Cys Lys
1 5 10 15
Ile Lys Gly Tyr Gly Thr Leu Val Leu Gly Ala Glu Gly Arg Gln Phe
20 25 30
Tyr Cys Tyr Thr Asn Glu Lys Asp Glu Tyr Thr Pro Pro Lys Ala Pro
35 40 45
Gly Gly Gly Gly Phe Gly Val Glu Leu Phe Ser Leu Glu Tyr Leu Tyr
50 55 60
Glu Gln Trp Lys Ala Arg Asn Asn Ile Trp Thr Lys Ser Asn Xaa Tyr
65 70 75 80
Lys Asp Leu Cys Arg Tyr Thr Gly Cys Lys Ile Thr Phe Tyr Arg His
85 90 95
Pro Thr Thr Asp Phe Ile Val Xaa Tyr Ser Arg Gln Pro Pro Phe Glu
100 105 110
Ile Asp Lys Xaa Thr Tyr Met Xaa Xaa His Pro Gln Xaa Leu Leu Leu
115 120 125
Arg Lys His Lys Lys Ile Ile Leu Ser Lys Ala Thr Asn Pro Lys Gly
130 135 140
Lys Leu Lys Lys Lys Ile Lys Ile Lys Pro Pro Lys Gln Met Leu Asn
145 150 155 160
Lys Trp Phe Phe Gln Lys Gln Phe Ala Xaa Tyr Gly Leu Val Gln Leu
165 170 175
Gln Ala Ala Ala Cys Asx Leu Arg Tyr Pro Arg Leu Gly Cys Cys Asn
180 185 190
Glu Asn Arg Leu Ile Thr Leu Tyr Tyr Leu Asn
195 200
<210> 234
<211> 162
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<221> 经修饰的残基
<222> (12)..(12)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (20)..(20)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (23)..(23)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (30)..(30)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (58)..(58)
<223> I或L
<220>
<221> 经修饰的残基
<222> (84)..(84)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (90)..(90)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (95)..(95)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (105)..(105)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (111)..(111)
<223> I或L
<220>
<221> 经修饰的残基
<222> (113)..(113)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (154)..(154)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (156)..(156)
<223> 任何氨基酸
<400> 234
Leu Pro Ile Val Val Ala Arg Tyr Asn Pro Ala Xaa Asp Thr Gly Lys
1 5 10 15
Gly Asn Lys Xaa Trp Leu Xaa Ser Thr Leu Asn Gly Ser Xaa Trp Ala
20 25 30
Pro Pro Thr Thr Asp Lys Asp Leu Ile Ile Glu Gly Leu Pro Leu Trp
35 40 45
Leu Ala Leu Tyr Gly Tyr Trp Ser Tyr Xaa Lys Lys Val Lys Lys Asp
50 55 60
Lys Gly Ile Leu Gln Ser His Met Phe Val Val Lys Ser Pro Ala Ile
65 70 75 80
Gln Pro Leu Xaa Thr Ala Thr Thr Gln Xaa Thr Phe Tyr Pro Xaa Ile
85 90 95
Asp Asn Ser Phe Ile Gln Gly Lys Xaa Pro Tyr Asp Glu Pro Xaa Thr
100 105 110
Xaa Asn Gln Lys Lys Leu Trp Tyr Pro Thr Leu Glu His Gln Gln Glu
115 120 125
Thr Ile Asn Ala Ile Val Glu Ser Gly Pro Tyr Val Pro Lys Leu Asp
130 135 140
Asn Gln Lys Asn Ser Thr Trp Glu Leu Xaa Tyr Xaa Tyr Thr Phe Tyr
145 150 155 160
Phe Lys
<210> 235
<211> 177
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多肽
<220>
<221> 经修饰的残基
<222> (16)..(16)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (26)..(26)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (33)..(33)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (73)..(73)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (81)..(82)
<223> 任何氨基酸
<220>
<221> 位点
<222> (81)..(82)
<223> 该区域可包含0-2个残基
<220>
<221> 经修饰的残基
<222> (90)..(90)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (94)..(94)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (119)..(124)
<223> 任何氨基酸
<220>
<221> 位点
<222> (119)..(124)
<223> 该区域可包含1-6个残基
<220>
<221> 经修饰的残基
<222> (168)..(177)
<223> 任何氨基酸
<220>
<221> 位点
<222> (168)..(177)
<223> 该区域可包含1-10个残基
<400> 235
Trp Gly Gly Pro Gln Ile Pro Asp Gln Pro Val Glu Asp Pro Lys Xaa
1 5 10 15
Gln Gly Thr Tyr Pro Val Pro Asp Thr Xaa Gln Gln Thr Ile Gln Ile
20 25 30
Xaa Asn Pro Leu Lys Gln Lys Pro Glu Thr Met Phe His Asp Trp Asp
35 40 45
Tyr Arg Arg Gly Ile Ile Thr Ser Thr Ala Leu Lys Arg Met Gln Glu
50 55 60
Asn Leu Glu Thr Asp Ser Ser Phe Xaa Ser Asp Ser Glu Glu Thr Pro
65 70 75 80
Xaa Xaa Lys Lys Lys Lys Arg Leu Thr Xaa Glu Leu Pro Xaa Pro Gln
85 90 95
Glu Glu Thr Glu Glu Ile Gln Ser Cys Leu Leu Ser Leu Cys Glu Glu
100 105 110
Ser Thr Cys Gln Glu Glu Xaa Xaa Xaa Xaa Xaa Xaa Glu Asn Leu Gln
115 120 125
Gln Leu Ile His Gln Gln Gln Gln Gln Gln Gln Gln Leu Lys His Asn
130 135 140
Ile Leu Lys Leu Leu Ser Asp Leu Lys Glx Lys Gln Arg Leu Leu Gln
145 150 155 160
Leu Gln Thr Gly Ile Leu Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
165 170 175
Xaa
<210> 236
<400> 236
000
<210> 237
<400> 237
000
<210> 238
<400> 238
000
<210> 239
<400> 239
000
<210> 240
<400> 240
000
<210> 241
<400> 241
000
<210> 242
<400> 242
000
<210> 243
<400> 243
000
<210> 244
<400> 244
000
<210> 245
<400> 245
000
<210> 246
<400> 246
000
<210> 247
<400> 247
000
<210> 248
<400> 248
000
<210> 249
<400> 249
000
<210> 250
<400> 250
000
<210> 251
<400> 251
000
<210> 252
<400> 252
000
<210> 253
<400> 253
000
<210> 254
<400> 254
000
<210> 255
<400> 255
000
<210> 256
<400> 256
000
<210> 257
<400> 257
000
<210> 258
<400> 258
000
<210> 259
<400> 259
000
<210> 260
<400> 260
000
<210> 261
<400> 261
000
<210> 262
<400> 262
000
<210> 263
<400> 263
000
<210> 264
<400> 264
000
<210> 265
<400> 265
000
<210> 266
<400> 266
000
<210> 267
<400> 267
000
<210> 268
<400> 268
000
<210> 269
<400> 269
000
<210> 270
<400> 270
000
<210> 271
<400> 271
000
<210> 272
<400> 272
000
<210> 273
<400> 273
000
<210> 274
<400> 274
000
<210> 275
<400> 275
000
<210> 276
<400> 276
000
<210> 277
<400> 277
000
<210> 278
<400> 278
000
<210> 279
<400> 279
000
<210> 280
<400> 280
000
<210> 281
<400> 281
000
<210> 282
<400> 282
000
<210> 283
<400> 283
000
<210> 284
<400> 284
000
<210> 285
<400> 285
000
<210> 286
<400> 286
000
<210> 287
<400> 287
000
<210> 288
<400> 288
000
<210> 289
<400> 289
000
<210> 290
<400> 290
000
<210> 291
<400> 291
000
<210> 292
<400> 292
000
<210> 293
<400> 293
000
<210> 294
<400> 294
000
<210> 295
<400> 295
000
<210> 296
<400> 296
000
<210> 297
<400> 297
000
<210> 298
<400> 298
000
<210> 299
<400> 299
000
<210> 300
<400> 300
000
<210> 301
<400> 301
000
<210> 302
<400> 302
000
<210> 303
<400> 303
000
<210> 304
<400> 304
000
<210> 305
<400> 305
000
<210> 306
<400> 306
000
<210> 307
<400> 307
000
<210> 308
<400> 308
000
<210> 309
<400> 309
000
<210> 310
<400> 310
000
<210> 311
<400> 311
000
<210> 312
<400> 312
000
<210> 313
<400> 313
000
<210> 314
<400> 314
000
<210> 315
<400> 315
000
<210> 316
<400> 316
000
<210> 317
<400> 317
000
<210> 318
<400> 318
000
<210> 319
<400> 319
000
<210> 320
<400> 320
000
<210> 321
<400> 321
000
<210> 322
<400> 322
000
<210> 323
<400> 323
000
<210> 324
<400> 324
000
<210> 325
<400> 325
000
<210> 326
<400> 326
000
<210> 327
<400> 327
000
<210> 328
<400> 328
000
<210> 329
<400> 329
000
<210> 330
<400> 330
000
<210> 331
<400> 331
000
<210> 332
<400> 332
000
<210> 333
<400> 333
000
<210> 334
<400> 334
000
<210> 335
<400> 335
000
<210> 336
<400> 336
000
<210> 337
<400> 337
000
<210> 338
<400> 338
000
<210> 339
<400> 339
000
<210> 340
<400> 340
000
<210> 341
<400> 341
000
<210> 342
<400> 342
000
<210> 343
<400> 343
000
<210> 344
<400> 344
000
<210> 345
<400> 345
000
<210> 346
<400> 346
000
<210> 347
<400> 347
000
<210> 348
<400> 348
000
<210> 349
<400> 349
000
<210> 350
<400> 350
000
<210> 351
<400> 351
000
<210> 352
<400> 352
000
<210> 353
<400> 353
000
<210> 354
<400> 354
000
<210> 355
<400> 355
000
<210> 356
<400> 356
000
<210> 357
<400> 357
000
<210> 358
<400> 358
000
<210> 359
<400> 359
000
<210> 360
<400> 360
000
<210> 361
<400> 361
000
<210> 362
<400> 362
000
<210> 363
<400> 363
000
<210> 364
<400> 364
000
<210> 365
<400> 365
000
<210> 366
<400> 366
000
<210> 367
<400> 367
000
<210> 368
<400> 368
000
<210> 369
<400> 369
000
<210> 370
<400> 370
000
<210> 371
<400> 371
000
<210> 372
<400> 372
000
<210> 373
<400> 373
000
<210> 374
<400> 374
000
<210> 375
<400> 375
000
<210> 376
<400> 376
000
<210> 377
<400> 377
000
<210> 378
<400> 378
000
<210> 379
<400> 379
000
<210> 380
<400> 380
000
<210> 381
<400> 381
000
<210> 382
<400> 382
000
<210> 383
<400> 383
000
<210> 384
<400> 384
000
<210> 385
<400> 385
000
<210> 386
<400> 386
000
<210> 387
<400> 387
000
<210> 388
<400> 388
000
<210> 389
<400> 389
000
<210> 390
<400> 390
000
<210> 391
<400> 391
000
<210> 392
<400> 392
000
<210> 393
<400> 393
000
<210> 394
<400> 394
000
<210> 395
<400> 395
000
<210> 396
<400> 396
000
<210> 397
<400> 397
000
<210> 398
<400> 398
000
<210> 399
<400> 399
000
<210> 400
<400> 400
000
<210> 401
<400> 401
000
<210> 402
<400> 402
000
<210> 403
<400> 403
000
<210> 404
<400> 404
000
<210> 405
<400> 405
000
<210> 406
<400> 406
000
<210> 407
<400> 407
000
<210> 408
<400> 408
000
<210> 409
<400> 409
000
<210> 410
<400> 410
000
<210> 411
<400> 411
000
<210> 412
<400> 412
000
<210> 413
<400> 413
000
<210> 414
<400> 414
000
<210> 415
<400> 415
000
<210> 416
<400> 416
000
<210> 417
<400> 417
000
<210> 418
<400> 418
000
<210> 419
<400> 419
000
<210> 420
<400> 420
000
<210> 421
<400> 421
000
<210> 422
<400> 422
000
<210> 423
<400> 423
000
<210> 424
<400> 424
000
<210> 425
<400> 425
000
<210> 426
<400> 426
000
<210> 427
<400> 427
000
<210> 428
<400> 428
000
<210> 429
<400> 429
000
<210> 430
<400> 430
000
<210> 431
<400> 431
000
<210> 432
<400> 432
000
<210> 433
<400> 433
000
<210> 434
<400> 434
000
<210> 435
<400> 435
000
<210> 436
<400> 436
000
<210> 437
<400> 437
000
<210> 438
<400> 438
000
<210> 439
<400> 439
000
<210> 440
<400> 440
000
<210> 441
<400> 441
000
<210> 442
<400> 442
000
<210> 443
<400> 443
000
<210> 444
<400> 444
000
<210> 445
<400> 445
000
<210> 446
<400> 446
000
<210> 447
<400> 447
000
<210> 448
<400> 448
000
<210> 449
<400> 449
000
<210> 450
<400> 450
000
<210> 451
<400> 451
000
<210> 452
<400> 452
000
<210> 453
<400> 453
000
<210> 454
<400> 454
000
<210> 455
<400> 455
000
<210> 456
<400> 456
000
<210> 457
<400> 457
000
<210> 458
<400> 458
000
<210> 459
<400> 459
000
<210> 460
<400> 460
000
<210> 461
<400> 461
000
<210> 462
<400> 462
000
<210> 463
<400> 463
000
<210> 464
<400> 464
000
<210> 465
<400> 465
000
<210> 466
<400> 466
000
<210> 467
<400> 467
000
<210> 468
<400> 468
000
<210> 469
<400> 469
000
<210> 470
<400> 470
000
<210> 471
<400> 471
000
<210> 472
<400> 472
000
<210> 473
<400> 473
000
<210> 474
<400> 474
000
<210> 475
<400> 475
000
<210> 476
<400> 476
000
<210> 477
<400> 477
000
<210> 478
<400> 478
000
<210> 479
<400> 479
000
<210> 480
<400> 480
000
<210> 481
<400> 481
000
<210> 482
<400> 482
000
<210> 483
<400> 483
000
<210> 484
<400> 484
000
<210> 485
<400> 485
000
<210> 486
<400> 486
000
<210> 487
<400> 487
000
<210> 488
<400> 488
000
<210> 489
<400> 489
000
<210> 490
<400> 490
000
<210> 491
<400> 491
000
<210> 492
<400> 492
000
<210> 493
<400> 493
000
<210> 494
<400> 494
000
<210> 495
<400> 495
000
<210> 496
<400> 496
000
<210> 497
<400> 497
000
<210> 498
<400> 498
000
<210> 499
<400> 499
000
<210> 500
<400> 500
000
<210> 501
<400> 501
000
<210> 502
<400> 502
000
<210> 503
<400> 503
000
<210> 504
<400> 504
000
<210> 505
<400> 505
000
<210> 506
<400> 506
000
<210> 507
<400> 507
000
<210> 508
<400> 508
000
<210> 509
<400> 509
000
<210> 510
<400> 510
000
<210> 511
<400> 511
000
<210> 512
<400> 512
000
<210> 513
<400> 513
000
<210> 514
<400> 514
000
<210> 515
<400> 515
000
<210> 516
<400> 516
000
<210> 517
<400> 517
000
<210> 518
<400> 518
000
<210> 519
<400> 519
000
<210> 520
<400> 520
000
<210> 521
<400> 521
000
<210> 522
<400> 522
000
<210> 523
<400> 523
000
<210> 524
<400> 524
000
<210> 525
<400> 525
000
<210> 526
<400> 526
000
<210> 527
<400> 527
000
<210> 528
<400> 528
000
<210> 529
<400> 529
000
<210> 530
<400> 530
000
<210> 531
<400> 531
000
<210> 532
<400> 532
000
<210> 533
<400> 533
000
<210> 534
<400> 534
000
<210> 535
<400> 535
000
<210> 536
<400> 536
000
<210> 537
<400> 537
000
<210> 538
<400> 538
000
<210> 539
<400> 539
000
<210> 540
<400> 540
000
<210> 541
<400> 541
000
<210> 542
<400> 542
000
<210> 543
<400> 543
000
<210> 544
<400> 544
000
<210> 545
<400> 545
000
<210> 546
<400> 546
000
<210> 547
<400> 547
000
<210> 548
<400> 548
000
<210> 549
<400> 549
000
<210> 550
<400> 550
000
<210> 551
<400> 551
000
<210> 552
<400> 552
000
<210> 553
<400> 553
000
<210> 554
<400> 554
000
<210> 555
<400> 555
000
<210> 556
<400> 556
000
<210> 557
<400> 557
000
<210> 558
<400> 558
000
<210> 559
<400> 559
000
<210> 560
<400> 560
000
<210> 561
<400> 561
000
<210> 562
<400> 562
000
<210> 563
<400> 563
000
<210> 564
<400> 564
000
<210> 565
<400> 565
000
<210> 566
<400> 566
000
<210> 567
<400> 567
000
<210> 568
<400> 568
000
<210> 569
<400> 569
000
<210> 570
<400> 570
000
<210> 571
<400> 571
000
<210> 572
<400> 572
000
<210> 573
<400> 573
000
<210> 574
<400> 574
000
<210> 575
<400> 575
000
<210> 576
<400> 576
000
<210> 577
<400> 577
000
<210> 578
<400> 578
000
<210> 579
<400> 579
000
<210> 580
<400> 580
000
<210> 581
<400> 581
000
<210> 582
<400> 582
000
<210> 583
<400> 583
000
<210> 584
<400> 584
000
<210> 585
<400> 585
000
<210> 586
<400> 586
000
<210> 587
<400> 587
000
<210> 588
<400> 588
000
<210> 589
<400> 589
000
<210> 590
<400> 590
000
<210> 591
<400> 591
000
<210> 592
<400> 592
000
<210> 593
<400> 593
000
<210> 594
<400> 594
000
<210> 595
<400> 595
000
<210> 596
<400> 596
000
<210> 597
<400> 597
000
<210> 598
<400> 598
000
<210> 599
<400> 599
000
<210> 600
<400> 600
000
<210> 601
<400> 601
000
<210> 602
<400> 602
000
<210> 603
<400> 603
000
<210> 604
<400> 604
000
<210> 605
<400> 605
000
<210> 606
<400> 606
000
<210> 607
<400> 607
000
<210> 608
<400> 608
000
<210> 609
<400> 609
000
<210> 610
<400> 610
000
<210> 611
<400> 611
000
<210> 612
<400> 612
000
<210> 613
<400> 613
000
<210> 614
<400> 614
000
<210> 615
<400> 615
000
<210> 616
<400> 616
000
<210> 617
<400> 617
000
<210> 618
<400> 618
000
<210> 619
<400> 619
000
<210> 620
<400> 620
000
<210> 621
<400> 621
000
<210> 622
<400> 622
000
<210> 623
<400> 623
000
<210> 624
<400> 624
000
<210> 625
<400> 625
000
<210> 626
<400> 626
000
<210> 627
<400> 627
000
<210> 628
<400> 628
000
<210> 629
<400> 629
000
<210> 630
<400> 630
000
<210> 631
<400> 631
000
<210> 632
<400> 632
000
<210> 633
<400> 633
000
<210> 634
<400> 634
000
<210> 635
<400> 635
000
<210> 636
<400> 636
000
<210> 637
<400> 637
000
<210> 638
<400> 638
000
<210> 639
<400> 639
000
<210> 640
<400> 640
000
<210> 641
<400> 641
000
<210> 642
<400> 642
000
<210> 643
<400> 643
000
<210> 644
<400> 644
000
<210> 645
<400> 645
000
<210> 646
<400> 646
000
<210> 647
<400> 647
000
<210> 648
<400> 648
000
<210> 649
<400> 649
000
<210> 650
<400> 650
000
<210> 651
<400> 651
000
<210> 652
<400> 652
000
<210> 653
<400> 653
000
<210> 654
<400> 654
000
<210> 655
<400> 655
000
<210> 656
<400> 656
000
<210> 657
<400> 657
000
<210> 658
<400> 658
000
<210> 659
<400> 659
000
<210> 660
<400> 660
000
<210> 661
<400> 661
000
<210> 662
<400> 662
000
<210> 663
<400> 663
000
<210> 664
<400> 664
000
<210> 665
<400> 665
000
<210> 666
<400> 666
000
<210> 667
<400> 667
000
<210> 668
<400> 668
000
<210> 669
<400> 669
000
<210> 670
<400> 670
000
<210> 671
<400> 671
000
<210> 672
<400> 672
000
<210> 673
<400> 673
000
<210> 674
<400> 674
000
<210> 675
<400> 675
000
<210> 676
<400> 676
000
<210> 677
<400> 677
000
<210> 678
<400> 678
000
<210> 679
<400> 679
000
<210> 680
<400> 680
000
<210> 681
<400> 681
000
<210> 682
<400> 682
000
<210> 683
<400> 683
000
<210> 684
<400> 684
000
<210> 685
<400> 685
000
<210> 686
<400> 686
000
<210> 687
<400> 687
000
<210> 688
<400> 688
000
<210> 689
<400> 689
000
<210> 690
<400> 690
000
<210> 691
<400> 691
000
<210> 692
<400> 692
000
<210> 693
<400> 693
000
<210> 694
<400> 694
000
<210> 695
<400> 695
000
<210> 696
<400> 696
000
<210> 697
<400> 697
000
<210> 698
<400> 698
000
<210> 699
<400> 699
000
<210> 700
<400> 700
000
<210> 701
<400> 701
000
<210> 702
<400> 702
000
<210> 703
<400> 703
000
<210> 704
<400> 704
000
<210> 705
<400> 705
000
<210> 706
<400> 706
000
<210> 707
<400> 707
000
<210> 708
<400> 708
000
<210> 709
<400> 709
000
<210> 710
<400> 710
000
<210> 711
<400> 711
000
<210> 712
<400> 712
000
<210> 713
<400> 713
000
<210> 714
<400> 714
000
<210> 715
<400> 715
000
<210> 716
<400> 716
000
<210> 717
<400> 717
000
<210> 718
<400> 718
000
<210> 719
<400> 719
000
<210> 720
<400> 720
000
<210> 721
<400> 721
000
<210> 722
<400> 722
000
<210> 723
<400> 723
000
<210> 724
<400> 724
000
<210> 725
<400> 725
000
<210> 726
<400> 726
000
<210> 727
<400> 727
000
<210> 728
<400> 728
000
<210> 729
<400> 729
000
<210> 730
<400> 730
000
<210> 731
<400> 731
000
<210> 732
<400> 732
000
<210> 733
<400> 733
000
<210> 734
<400> 734
000
<210> 735
<400> 735
000
<210> 736
<400> 736
000
<210> 737
<400> 737
000
<210> 738
<400> 738
000
<210> 739
<400> 739
000
<210> 740
<400> 740
000
<210> 741
<400> 741
000
<210> 742
<400> 742
000
<210> 743
<400> 743
000
<210> 744
<400> 744
000
<210> 745
<400> 745
000
<210> 746
<400> 746
000
<210> 747
<400> 747
000
<210> 748
<400> 748
000
<210> 749
<400> 749
000
<210> 750
<400> 750
000
<210> 751
<400> 751
000
<210> 752
<400> 752
000
<210> 753
<400> 753
000
<210> 754
<400> 754
000
<210> 755
<400> 755
000
<210> 756
<400> 756
000
<210> 757
<400> 757
000
<210> 758
<400> 758
000
<210> 759
<400> 759
000
<210> 760
<400> 760
000
<210> 761
<400> 761
000
<210> 762
<400> 762
000
<210> 763
<400> 763
000
<210> 764
<400> 764
000
<210> 765
<400> 765
000
<210> 766
<400> 766
000
<210> 767
<400> 767
000
<210> 768
<400> 768
000
<210> 769
<400> 769
000
<210> 770
<400> 770
000
<210> 771
<400> 771
000
<210> 772
<400> 772
000
<210> 773
<400> 773
000
<210> 774
<400> 774
000
<210> 775
<400> 775
000
<210> 776
<400> 776
000
<210> 777
<400> 777
000
<210> 778
<400> 778
000
<210> 779
<400> 779
000
<210> 780
<400> 780
000
<210> 781
<400> 781
000
<210> 782
<400> 782
000
<210> 783
<400> 783
000
<210> 784
<400> 784
000
<210> 785
<400> 785
000
<210> 786
<400> 786
000
<210> 787
<400> 787
000
<210> 788
<400> 788
000
<210> 789
<400> 789
000
<210> 790
<400> 790
000
<210> 791
<400> 791
000
<210> 792
<400> 792
000
<210> 793
<400> 793
000
<210> 794
<400> 794
000
<210> 795
<400> 795
000
<210> 796
<400> 796
000
<210> 797
<400> 797
000
<210> 798
<400> 798
000
<210> 799
<400> 799
000
<210> 800
<400> 800
000
<210> 801
<211> 156
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 801
gcggcggggg ggcggccgcg ttcgcgcgcc gcccaccagg gggtgctgcg cgcccccccc 60
cgcgcatgcg cggggccccc ccccgggggg gctccgcccc cccggccccc ccccgtgcta 120
aacccaccgc gcatgcgcga ccacgccccc gccgcc 156
<210> 802
<211> 150
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 802
ccgagcgtta gcgaggagtg cgaccctacc ccctgggccc acttcttcgg agccgcgcgc 60
tacgccttcg gctgcgcgcg gcacctcaga cccccgctcg tgctgacacg cttgcgcgtg 120
tcagaccact tcgggctcgc gggggtcggg 150
<210> 803
<211> 122
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 803
gccgccgcgg cggcgggggg cggcgcgctg cgcgcgccgc ccagtagggg gagccatgcg 60
cccccccccg cgcatgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc 120
cg 122
<210> 804
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 804
cggcccagcg gcggcgcgcg cgcttcgcgc gcgcgccggg gggctccgcc cccccccgcg 60
catgcgcggg gccccccccc gcggggggct ccgccccccg gtcccccccc g 111
<210> 805
<211> 115
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 805
cggccgtgcg gcggcgcgcg cgcttcgcgc gcgcgccggg ggctgccgcc cccccccgcg 60
catgcgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc ccccg 115
<210> 806
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 806
cggcggcggc gcgcgcgcta cgcgcgcgcg ccggggggct gccgcccccc ccccgcgcat 60
gcgcggggcc cccccccgcg gggggctccg ccccccggcc cccc 104
<210> 807
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的多核苷酸
<400> 807
ggcggcggcg cgcgcgctac gcgcgcgcgc cggggagctc tgcccccccc cgcgcatgcg 60
cgcgggtccc ccccccgcgg ggggctccgc cccccggtcc cccccccg 108
<210> 808
<400> 808
000
<210> 809
<400> 809
000
<210> 810
<400> 810
000
<210> 811
<400> 811
000
<210> 812
<400> 812
000
<210> 813
<400> 813
000
<210> 814
<400> 814
000
<210> 815
<400> 815
000
<210> 816
<400> 816
000
<210> 817
<400> 817
000
<210> 818
<400> 818
000
<210> 819
<400> 819
000
<210> 820
<400> 820
000
<210> 821
<400> 821
000
<210> 822
<400> 822
000
<210> 823
<400> 823
000
<210> 824
<400> 824
000
<210> 825
<400> 825
000
<210> 826
<400> 826
000
<210> 827
<400> 827
000
<210> 828
<400> 828
000
<210> 829
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的肽
<220>
<221> 经修饰的残基
<222> (4)..(5)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (7)..(7)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (9)..(10)
<223> 任何氨基酸
<400> 829
Tyr Asn Pro Xaa Xaa Asp Xaa Gly Xaa Xaa Asn
1 5 10
<210> 830
<400> 830
000
<210> 831
<400> 831
000
<210> 832
<400> 832
000
<210> 833
<400> 833
000
<210> 834
<400> 834
000
<210> 835
<400> 835
000
<210> 836
<400> 836
000
<210> 837
<400> 837
000
<210> 838
<400> 838
000
<210> 839
<400> 839
000
<210> 840
<400> 840
000
<210> 841
<400> 841
000
<210> 842
<400> 842
000
<210> 843
<400> 843
000
<210> 844
<400> 844
000
<210> 845
<400> 845
000
<210> 846
<400> 846
000
<210> 847
<400> 847
000
<210> 848
<400> 848
000
<210> 849
<400> 849
000
<210> 850
<400> 850
000
<210> 851
<400> 851
000
<210> 852
<400> 852
000
<210> 853
<400> 853
000
<210> 854
<400> 854
000
<210> 855
<400> 855
000
<210> 856
<400> 856
000
<210> 857
<400> 857
000
<210> 858
<400> 858
000
<210> 859
<400> 859
000
<210> 860
<400> 860
000
<210> 861
<400> 861
000
<210> 862
<400> 862
000
<210> 863
<400> 863
000
<210> 864
<400> 864
000
<210> 865
<400> 865
000
<210> 866
<400> 866
000
<210> 867
<400> 867
000
<210> 868
<400> 868
000
<210> 869
<400> 869
000
<210> 870
<400> 870
000
<210> 871
<400> 871
000
<210> 872
<400> 872
000
<210> 873
<400> 873
000
<210> 874
<400> 874
000
<210> 875
<400> 875
000
<210> 876
<400> 876
000
<210> 877
<400> 877
000
<210> 878
<400> 878
000
<210> 879
<400> 879
000
<210> 880
<400> 880
000
<210> 881
<400> 881
000
<210> 882
<400> 882
000
<210> 883
<400> 883
000
<210> 884
<400> 884
000
<210> 885
<400> 885
000
<210> 886
<211> 3176
<212> DNA
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 886
taaaatggcg ggagccaatc attttatact ttcactttcc aattaaaaat ggccacgtca 60
caaacaaggg gtggagccat ttaaactata taactaagtg gggtggcgaa tggctgagtt 120
taccccgcta gacggtgcag ggaccggatc gagcgcagcg aggaggtccc cggctgccca 180
tgggcgggag ccgaggtgag tgaaaccacc gaggtctagg ggcaattcgg gctagggcag 240
tctagcggaa cgggcaagaa acttaaaaca atatttgttt tacagatggt tagtatatcc 300
tcaagtgatt tttttaagaa aacgaaattt aatgaggaga cgcagaacca agtatggatg 360
tctcaaattg ctgactctca tgataatatc tgcagttgct ggcatccatt tgctcacctt 420
cttgcttcca tatttcctcc tggccacaaa gatcgtgatc ttactattaa ccaaattctt 480
ctaagagatt ataaagaaaa atgccattct ggtggagaag aaggagaaaa ttctggacca 540
acaacaggtt taattacacc aaaagaagaa gatatagaaa aagatggccc agaaggcgcc 600
gcagaagaag accatacaga cgccctgttc gccgccgccg tagaaaactt cgaaaggtaa 660
agagaaaaaa aaaatcttta attgttagac aatggcaacc agacagtata agaacttgta 720
aaattatagg acagtcagct atagttgttg gggctgaagg aaagcaaatg tactgttata 780
ctgtcaataa gttaattaat gtgcccccaa aaacaccata tgggggaggc tttggagtag 840
accaatacac actgaaatac ttatatgaag aatacagatt tgcacaaaac atttggacac 900
aatctaatgt actgaaagac ttatgcagat acataaatgt taagctaata ttctacagag 960
acaacaaaac agactttgtc ctttcctatg acagaaaccc accttttcaa ctaacaaaat 1020
ttacataccc aggagcacac ccacaacaaa tcatgcttca aaaacaccac aaattcatac 1080
tatcacaaat gacaaagcct aatggaagac taacaaaaaa actcaaaatt aaacctccta 1140
aacaaatgct ttctaaatgg ttcttttcaa aacaattctg taaataccct ttactatctc 1200
ttaaagcttc tgcactagac cttaggcact cttacctagg ctgctgtaat gaaaatccac 1260
aggtattttt ttattattta aaccatggat actacacaat aacaaactgg ggagcacaat 1320
cctcaacagc atacagacct aactccaagg tgacagacac aacatactac agatacaaaa 1380
atgacagaaa aaatattaac attaaaagcc atgaatacga aaaaagtata tcatatgaaa 1440
acggttattt tcaatctagt ttcttacaaa cacagtgcat atataccagt gagcgtggtg 1500
aagcctgtat agcagaaaaa ccactaggaa tagctattta caatccagta aaagacaatg 1560
gagatggtaa tatgatatac cttgtaagca ctctagcaaa cacttgggac cagcctccaa 1620
aagacagtgc tattttaata caaggagtac ccatatggct aggcttattt ggatatttag 1680
actactgtag acaaattaaa gctgacaaaa catggctaga cagtcatgta ctagtaattc 1740
aaagtcctgc tatttttact tacccaaatc caggagcagg caaatggtat tgtccactat 1800
cacaaagttt tataaatggc aatggtccgt ttaatcaacc acctacactg ctacaaaaag 1860
caaagtggtt tccacaaata caataccaac aagaaattat taatagcttt gtagaatcag 1920
gaccatttgt tcccaaatat gcaaatcaaa ctgaaagcaa ctgggaacta aaatataaat 1980
atgtttttac atttaagtgg ggtggaccac aattccatga accagaaatt gctgacccta 2040
gcaaacaaga gcagtatgat gtccccgata ctttctacca aacaatacaa attgaagatc 2100
cagaaggaca agaccccaga tctctcatcc atgattggga ctacagacga ggctttatta 2160
aagaaagatc tcttaaaaga atgtcaactt acttctcaac tcatacagat cagcaagcaa 2220
cttcagagga agacattccc aaaaagaaaa agagaattgg accccaactc acagtcccac 2280
aacaaaaaga agaggagaca ctgtcatgtc tcctctctct ctgcaaaaaa gataccttcc 2340
aagaaacaga gacacaagaa gacctccagc agctcatcaa gcagcagcag gagcagcagc 2400
tcctcctcaa gagaaacatc ctccagctca tccacaaact aaaagagaat caacaaatgc 2460
ttcagcttca cacaggcatg ttaccttaac cagatttaaa cctggatttg aagagcaaac 2520
agagagagaa ttagcaatta tatttcatag gccccctaga acctacaaag aggaccttcc 2580
attctatccc tggctaccac ctgcacccct tgtacaattt aaccttaact tcaaaggcta 2640
ggccaacaat gtacacttag taaagcatgt ttattaaagc acaaccccca aaataaatgt 2700
aaaaataaaa aaaaaaaaaa aaaaataaaa aattgcaaaa attcggcgct cgcgcgcatg 2760
tgcgcctctg gcgcaaatca cgcaacgctc gcgcgcccgc gtatgtctct ttaccacgca 2820
cctagattgg ggtgcgcgcg ctagcgcgcg caccccaatg cgccccgccc tcgttccgac 2880
ccgcttgcgc gggtcggacc acttcgggct cgggggggcg cgcctgcggc gcttttttac 2940
taaacagact ccgagccgcc atttggcccc ctaagctccg cccccctcat gaatattcat 3000
aaaggaaacc acataattag aattgccgac cacaaactgc catatgctaa ttagttcccc 3060
ttttacaaag taaaagggga agtgaacata gccccacacc cgcaggggca aggccccgca 3120
cccctacgtc actaaccacg cccccgccgc catcttgggt gcggcagggc gggggc 3176
<210> 887
<211> 124
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 887
Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn
1 5 10 15
Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His
20 25 30
Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser
35 40 45
Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile
50 55 60
Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly
65 70 75 80
Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp
85 90 95
Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp
100 105 110
Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Arg
115 120
<210> 888
<211> 271
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 888
Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn
1 5 10 15
Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His
20 25 30
Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser
35 40 45
Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile
50 55 60
Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly
65 70 75 80
Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp
85 90 95
Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp
100 105 110
Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Ser Gly Val Asp His
115 120 125
Asn Ser Met Asn Gln Lys Leu Leu Thr Leu Ala Asn Lys Ser Ser Met
130 135 140
Met Ser Pro Ile Leu Ser Thr Lys Gln Tyr Lys Leu Lys Ile Gln Lys
145 150 155 160
Asp Lys Thr Pro Asp Leu Ser Ser Met Ile Gly Thr Thr Asp Glu Ala
165 170 175
Leu Leu Lys Lys Asp Leu Leu Lys Glu Cys Gln Leu Thr Ser Gln Leu
180 185 190
Ile Gln Ile Ser Lys Gln Leu Gln Arg Lys Thr Phe Pro Lys Arg Lys
195 200 205
Arg Glu Leu Asp Pro Asn Ser Gln Ser His Asn Lys Lys Lys Arg Arg
210 215 220
His Cys His Val Ser Ser Leu Ser Ala Lys Lys Ile Pro Ser Lys Lys
225 230 235 240
Gln Arg His Lys Lys Thr Ser Ser Ser Ser Ser Ser Ser Ser Arg Ser
245 250 255
Ser Ser Ser Ser Ser Arg Glu Thr Ser Ser Ser Ser Ser Thr Asn
260 265 270
<210> 889
<211> 267
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 889
Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn
1 5 10 15
Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His
20 25 30
Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser
35 40 45
Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile
50 55 60
Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly
65 70 75 80
Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp
85 90 95
Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp
100 105 110
Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Arg Ser Ala Ser Asn
115 120 125
Phe Arg Gly Arg His Ser Gln Lys Glu Lys Glu Asn Trp Thr Pro Thr
130 135 140
His Ser Pro Thr Thr Lys Arg Arg Gly Asp Thr Val Met Ser Pro Leu
145 150 155 160
Ser Leu Gln Lys Arg Tyr Leu Pro Arg Asn Arg Asp Thr Arg Arg Pro
165 170 175
Pro Ala Ala His Gln Ala Ala Ala Gly Ala Ala Ala Pro Pro Gln Glu
180 185 190
Lys His Pro Pro Ala His Pro Gln Thr Lys Arg Glu Ser Thr Asn Ala
195 200 205
Ser Ala Ser His Arg His Val Thr Leu Thr Arg Phe Lys Pro Gly Phe
210 215 220
Glu Glu Gln Thr Glu Arg Glu Leu Ala Ile Ile Phe His Arg Pro Pro
225 230 235 240
Arg Thr Tyr Lys Glu Asp Leu Pro Phe Tyr Pro Trp Leu Pro Pro Ala
245 250 255
Pro Leu Val Gln Phe Asn Leu Asn Phe Lys Gly
260 265
<210> 890
<211> 50
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 890
Met Arg Arg Arg Arg Thr Lys Tyr Gly Cys Leu Lys Leu Leu Thr Leu
1 5 10 15
Met Ile Ile Ser Ala Val Ala Gly Ile His Leu Leu Thr Phe Leu Leu
20 25 30
Pro Tyr Phe Leu Leu Ala Thr Lys Ile Val Ile Leu Leu Leu Thr Lys
35 40 45
Phe Phe
50
<210> 891
<211> 662
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 891
Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg
1 5 10 15
Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg
20 25 30
Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg
35 40 45
Lys Leu Arg Lys Val Lys Arg Lys Lys Lys Ser Leu Ile Val Arg Gln
50 55 60
Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys Ile Ile Gly Gln Ser Ala
65 70 75 80
Ile Val Val Gly Ala Glu Gly Lys Gln Met Tyr Cys Tyr Thr Val Asn
85 90 95
Lys Leu Ile Asn Val Pro Pro Lys Thr Pro Tyr Gly Gly Gly Phe Gly
100 105 110
Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala
115 120 125
Gln Asn Ile Trp Thr Gln Ser Asn Val Leu Lys Asp Leu Cys Arg Tyr
130 135 140
Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp Asn Lys Thr Asp Phe Val
145 150 155 160
Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln Leu Thr Lys Phe Thr Tyr
165 170 175
Pro Gly Ala His Pro Gln Gln Ile Met Leu Gln Lys His His Lys Phe
180 185 190
Ile Leu Ser Gln Met Thr Lys Pro Asn Gly Arg Leu Thr Lys Lys Leu
195 200 205
Lys Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Ser Lys
210 215 220
Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu Lys Ala Ser Ala Leu Asp
225 230 235 240
Leu Arg His Ser Tyr Leu Gly Cys Cys Asn Glu Asn Pro Gln Val Phe
245 250 255
Phe Tyr Tyr Leu Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala
260 265 270
Gln Ser Ser Thr Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr
275 280 285
Tyr Tyr Arg Tyr Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His
290 295 300
Glu Tyr Glu Lys Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser
305 310 315 320
Phe Leu Gln Thr Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys
325 330 335
Ile Ala Glu Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp
340 345 350
Asn Gly Asp Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr
355 360 365
Trp Asp Gln Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro
370 375 380
Ile Trp Leu Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys
385 390 395 400
Ala Asp Lys Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro
405 410 415
Ala Ile Phe Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro
420 425 430
Leu Ser Gln Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro
435 440 445
Thr Leu Leu Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln
450 455 460
Glu Ile Ile Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr
465 470 475 480
Ala Asn Gln Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe
485 490 495
Thr Phe Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp
500 505 510
Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr
515 520 525
Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His
530 535 540
Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg
545 550 555 560
Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu
565 570 575
Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val
580 585 590
Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys
595 600 605
Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln
610 615 620
Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile
625 630 635 640
Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu
645 650 655
His Thr Gly Met Leu Pro
660
<210> 892
<211> 215
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 892
Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg
1 5 10 15
Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg
20 25 30
Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg
35 40 45
Lys Leu Arg Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala
50 55 60
Asp Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln
65 70 75 80
Thr Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile
85 90 95
His Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys
100 105 110
Arg Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser
115 120 125
Glu Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr
130 135 140
Val Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu
145 150 155 160
Cys Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln
165 170 175
Gln Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn
180 185 190
Ile Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln
195 200 205
Leu His Thr Gly Met Leu Pro
210 215
<210> 893
<211> 129
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 893
Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg
1 5 10 15
Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg
20 25 30
Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg
35 40 45
Lys Leu Arg Lys Ile Ser Lys Gln Leu Gln Arg Lys Thr Phe Pro Lys
50 55 60
Arg Lys Arg Glu Leu Asp Pro Asn Ser Gln Ser His Asn Lys Lys Lys
65 70 75 80
Arg Arg His Cys His Val Ser Ser Leu Ser Ala Lys Lys Ile Pro Ser
85 90 95
Lys Lys Gln Arg His Lys Lys Thr Ser Ser Ser Ser Ser Ser Ser Ser
100 105 110
Arg Ser Ser Ser Ser Ser Ser Arg Glu Thr Ser Ser Ser Ser Ser Thr
115 120 125
Asn
<210> 894
<400> 894
000
<210> 895
<400> 895
000
<210> 896
<400> 896
000
<210> 897
<400> 897
000
<210> 898
<400> 898
000
<210> 899
<400> 899
000
<210> 900
<400> 900
000
<210> 901
<400> 901
000
<210> 902
<400> 902
000
<210> 903
<400> 903
000
<210> 904
<400> 904
000
<210> 905
<400> 905
000
<210> 906
<400> 906
000
<210> 907
<400> 907
000
<210> 908
<400> 908
000
<210> 909
<400> 909
000
<210> 910
<400> 910
000
<210> 911
<400> 911
000
<210> 912
<400> 912
000
<210> 913
<400> 913
000
<210> 914
<400> 914
000
<210> 915
<400> 915
000
<210> 916
<400> 916
000
<210> 917
<400> 917
000
<210> 918
<400> 918
000
<210> 919
<400> 919
000
<210> 920
<400> 920
000
<210> 921
<400> 921
000
<210> 922
<400> 922
000
<210> 923
<400> 923
000
<210> 924
<400> 924
000
<210> 925
<211> 662
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 925
Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg
1 5 10 15
Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg
20 25 30
Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg
35 40 45
Lys Leu Arg Lys Val Lys Arg Lys Lys Lys Ser Leu Ile Val Arg Gln
50 55 60
Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys Ile Ile Gly Gln Ser Ala
65 70 75 80
Ile Val Val Gly Ala Glu Gly Lys Gln Met Tyr Cys Tyr Thr Val Asn
85 90 95
Lys Leu Ile Asn Val Pro Pro Lys Thr Pro Tyr Gly Gly Gly Phe Gly
100 105 110
Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala
115 120 125
Gln Asn Ile Trp Thr Gln Ser Asn Val Leu Lys Asp Leu Cys Arg Tyr
130 135 140
Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp Asn Lys Thr Asp Phe Val
145 150 155 160
Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln Leu Thr Lys Phe Thr Tyr
165 170 175
Pro Gly Ala His Pro Gln Gln Ile Met Leu Gln Lys His His Lys Phe
180 185 190
Ile Leu Ser Gln Met Thr Lys Pro Asn Gly Arg Leu Thr Lys Lys Leu
195 200 205
Lys Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Ser Lys
210 215 220
Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu Lys Ala Ser Ala Leu Asp
225 230 235 240
Leu Arg His Ser Tyr Leu Gly Cys Cys Asn Glu Asn Pro Gln Val Phe
245 250 255
Phe Tyr Tyr Leu Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala
260 265 270
Gln Ser Ser Thr Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr
275 280 285
Tyr Tyr Arg Tyr Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His
290 295 300
Glu Tyr Glu Lys Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser
305 310 315 320
Phe Leu Gln Thr Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys
325 330 335
Ile Ala Glu Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp
340 345 350
Asn Gly Asp Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr
355 360 365
Trp Asp Gln Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro
370 375 380
Ile Trp Leu Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys
385 390 395 400
Ala Asp Lys Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro
405 410 415
Ala Ile Phe Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro
420 425 430
Leu Ser Gln Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro
435 440 445
Thr Leu Leu Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln
450 455 460
Glu Ile Ile Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr
465 470 475 480
Ala Asn Gln Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe
485 490 495
Thr Phe Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp
500 505 510
Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr
515 520 525
Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His
530 535 540
Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg
545 550 555 560
Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu
565 570 575
Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val
580 585 590
Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys
595 600 605
Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln
610 615 620
Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile
625 630 635 640
Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu
645 650 655
His Thr Gly Met Leu Pro
660
<210> 926
<211> 58
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 926
Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg
1 5 10 15
Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg
20 25 30
Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg
35 40 45
Lys Leu Arg Lys Val Lys Arg Lys Lys Lys
50 55
<210> 927
<211> 202
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 927
Ser Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys
1 5 10 15
Ile Ile Gly Gln Ser Ala Ile Val Val Gly Ala Glu Gly Lys Gln Met
20 25 30
Tyr Cys Tyr Thr Val Asn Lys Leu Ile Asn Val Pro Pro Lys Thr Pro
35 40 45
Tyr Gly Gly Gly Phe Gly Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr
50 55 60
Glu Glu Tyr Arg Phe Ala Gln Asn Ile Trp Thr Gln Ser Asn Val Leu
65 70 75 80
Lys Asp Leu Cys Arg Tyr Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp
85 90 95
Asn Lys Thr Asp Phe Val Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln
100 105 110
Leu Thr Lys Phe Thr Tyr Pro Gly Ala His Pro Gln Gln Ile Met Leu
115 120 125
Gln Lys His His Lys Phe Ile Leu Ser Gln Met Thr Lys Pro Asn Gly
130 135 140
Arg Leu Thr Lys Lys Leu Lys Ile Lys Pro Pro Lys Gln Met Leu Ser
145 150 155 160
Lys Trp Phe Phe Ser Lys Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu
165 170 175
Lys Ala Ser Ala Leu Asp Leu Arg His Ser Tyr Leu Gly Cys Cys Asn
180 185 190
Glu Asn Pro Gln Val Phe Phe Tyr Tyr Leu
195 200
<210> 928
<211> 79
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 928
Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala Gln Ser Ser Thr
1 5 10 15
Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr Tyr Tyr Arg Tyr
20 25 30
Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His Glu Tyr Glu Lys
35 40 45
Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser Phe Leu Gln Thr
50 55 60
Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys Ile Ala Glu
65 70 75
<210> 929
<211> 160
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 929
Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp Asn Gly Asp
1 5 10 15
Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr Trp Asp Gln
20 25 30
Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro Ile Trp Leu
35 40 45
Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys Ala Asp Lys
50 55 60
Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro Ala Ile Phe
65 70 75 80
Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro Leu Ser Gln
85 90 95
Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro Thr Leu Leu
100 105 110
Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln Glu Ile Ile
115 120 125
Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr Ala Asn Gln
130 135 140
Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe Thr Phe Lys
145 150 155 160
<210> 930
<211> 163
<212> PRT
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 930
Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp Pro Ser Lys
1 5 10 15
Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr Ile Gln Ile
20 25 30
Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His Asp Trp Asp
35 40 45
Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg Met Ser Thr
50 55 60
Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu Glu Asp Ile
65 70 75 80
Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val Pro Gln Gln
85 90 95
Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys Lys Lys Asp
100 105 110
Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln Leu Ile Lys
115 120 125
Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile Leu Gln Leu
130 135 140
Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu His Thr Gly
145 150 155 160
Met Leu Pro
<210> 931
<400> 931
000
<210> 932
<400> 932
000
<210> 933
<400> 933
000
<210> 934
<400> 934
000
<210> 935
<400> 935
000
<210> 936
<400> 936
000
<210> 937
<400> 937
000
<210> 938
<400> 938
000
<210> 939
<400> 939
000
<210> 940
<400> 940
000
<210> 941
<400> 941
000
<210> 942
<400> 942
000
<210> 943
<400> 943
000
<210> 944
<400> 944
000
<210> 945
<400> 945
000
<210> 946
<400> 946
000
<210> 947
<400> 947
000
<210> 948
<400> 948
000
<210> 949
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<220>
<221> 经修饰的残基
<222> (1)..(1)
<223> W或F
<220>
<221> 经修饰的残基
<222> (2)..(8)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (10)..(12)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (14)..(14)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (16)..(20)
<223> 任何氨基酸
<400> 949
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa
1 5 10 15
Xaa Xaa Xaa Xaa His
20
<210> 950
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成肽
<220>
<221> 经修饰的残基
<222> (6)..(7)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (9)..(9)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (15)..(16)
<223> 任何氨基酸
<400> 950
Tyr Asn Cys Ser Pro Xaa Xaa Asp Xaa Gly Ala Ser Lys Arg Xaa Xaa
1 5 10 15
Asn Thr Ser Val Ala Lys
20
<210> 951
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成的寡核苷酸
<220>
<221> 经修饰的碱基
<222> (45)..(45)
<223> a、c、 t、g、未知或其他
<400> 951
aggtgagtga aaccaccgaa gtcaaggggc aattcgggct agggncagtc t 51
<210> 952
<211> 50
<212> DNA
<213> 甲型细环病毒属物种(Alphatorquevirus sp.)
<400> 952
aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 50
<210> 953
<211> 50
<212> DNA
<213> 乙型细环病毒属物种(Betatorquevirus sp.)
<400> 953
aggtgagtga aaccaccgaa gtcaaggggc aattcgggct agatcagtct 50
<210> 954
<211> 50
<212> DNA
<213> 丙型细环病毒属物种(Gammatorquevirus sp.)
<400> 954
aggtgagtga aaccaccgag gtctaggggc aattcgggct agggcagtct 50
<210> 955
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成的6xHis标签
<400> 955
His His His His His His
1 5
<210> 956
<211> 237
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 956
Arg Arg Lys Leu Arg Val Arg Lys Arg Phe Tyr Lys Arg Lys Leu Lys
1 5 10 15
Lys Ile Val Leu Lys Gln Phe Gln Pro Lys Ile Ile Arg Arg Cys Thr
20 25 30
Ile Phe Gly Thr Ile Cys Leu Phe Gln Gly Ser Pro Glu Arg Ala Asn
35 40 45
Asn Asn Tyr Ile Gln Thr Ile Tyr Ser Tyr Val Pro Asp Lys Glu Pro
50 55 60
Gly Gly Gly Gly Trp Thr Leu Ile Thr Glu Ser Leu Ser Ser Leu Trp
65 70 75 80
Glu Asp Trp Glu His Leu Lys Asn Val Trp Thr Gln Ser Asn Ala Gly
85 90 95
Leu Pro Leu Val Arg Tyr Gly Gly Val Thr Leu Tyr Phe Tyr Gln Ser
100 105 110
Ala Tyr Thr Asp Tyr Ile Ala Gln Val Phe Asn Cys Tyr Pro Met Thr
115 120 125
Asp Thr Lys Tyr Thr His Ala Asp Ser Ala Pro Asn Arg Met Leu Leu
130 135 140
Lys Lys His Val Ile Arg Val Pro Ser Arg Glu Thr Arg Lys Lys Arg
145 150 155 160
Lys Pro Tyr Lys Arg Val Arg Val Gly Pro Pro Ser Gln Met Gln Asn
165 170 175
Lys Trp Tyr Phe Gln Arg Asp Ile Cys Glu Ile Pro Leu Ile Met Ile
180 185 190
Ala Ala Thr Ala Val Asp Phe Arg Tyr Pro Phe Cys Ala Ser Asp Cys
195 200 205
Ala Ser Asn Asn Leu Thr Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln
210 215 220
Asn Gln Asp Phe Asp His Pro Ser Asp Thr Gln Gly Tyr
225 230 235
<210> 957
<211> 232
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 957
Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys
1 5 10 15
Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp
20 25 30
Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met
35 40 45
Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe
50 55 60
Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu
65 70 75 80
Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg
85 90 95
Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr
100 105 110
Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr
115 120 125
Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His
130 135 140
Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys
145 150 155 160
Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala
165 170 175
Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys
180 185 190
Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val
195 200 205
Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser
210 215 220
Val Asp Gln Gly Gln Ser Trp Pro
225 230
<210> 958
<211> 238
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 958
Arg Arg Arg Arg Arg Trp Arg Lys Arg Pro Thr Val Arg Arg Lys Leu
1 5 10 15
Lys Lys Leu Thr Ile Gln Gln Trp Gln Pro Lys Thr Ile Arg Lys Cys
20 25 30
Cys Ile Gln Gly Leu His Cys Leu Phe Leu Val Thr Glu Asp Thr Ile
35 40 45
Ser Arg Asn Tyr Arg Met Tyr Glu His Ser Tyr Thr Gly Glu Tyr Tyr
50 55 60
Pro Gly Gly Gly Gly Phe Ser Ile Thr Arg Tyr Ser Leu Asp Gly Leu
65 70 75 80
Tyr Glu Gln His Gln Leu Asp Arg Asn Trp Trp Thr Asn Ser Asn Thr
85 90 95
Asn Leu Pro Leu Val Arg Tyr Thr Gly Cys Lys Ile Lys Phe Tyr Gln
100 105 110
Ser Trp Ser Val Asp Tyr Ile Cys Asn Tyr Ser Leu Thr Trp Pro Met
115 120 125
Val Ala Thr Gln Leu Leu Tyr Gln Ser Cys Gln Pro Ser Phe Met Met
130 135 140
Met Asn Lys Asn Ser Ile Met Ile Pro Ser Lys Leu Thr Lys Pro Ile
145 150 155 160
Lys Lys Gly Tyr Lys Thr Ile Lys Glu Lys Pro Pro His Glu Met Leu
165 170 175
Asn Arg Trp Tyr Phe Ala Lys Asp Leu Ser Lys Val Gly Leu Leu Met
180 185 190
Leu Thr Ala Ala Ser Ala Ser Phe Asp His Tyr Tyr Gln Ala Thr Asp
195 200 205
Ser Leu Ser Asn Asn Cys Thr Phe Glu Ser Leu Asn Pro Tyr Phe Tyr
210 215 220
Met Arg His Asp Phe Ile Leu Phe Pro Val Thr Gly Tyr Val
225 230 235
<210> 959
<211> 238
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 959
Arg Arg Arg Arg Arg Trp Val Arg Arg Lys Pro Phe Tyr Lys Arg Lys
1 5 10 15
Ile Lys Arg Leu Asn Ile Val Glu Trp Gln Pro Lys Ser Ile Arg Lys
20 25 30
Cys Arg Ile Lys Gly Met Leu Cys Leu Phe Gln Thr Thr Glu Asp Arg
35 40 45
Leu Ser Tyr Asn Phe Asp Met Tyr Glu Glu Ser Ile Ile Pro Glu Lys
50 55 60
Leu Pro Gly Gly Gly Gly Phe Ser Ile Lys Asn Ile Ser Leu Tyr Ala
65 70 75 80
Leu Tyr Gln Glu His Ile His Ala His Asn Ile Phe Thr His Thr Asn
85 90 95
Thr Asp Arg Pro Leu Ala Arg Tyr Thr Gly Cys Ser Leu Lys Phe Tyr
100 105 110
Gln Ser Lys Asp Ile Asp Tyr Val Val Thr Tyr Ser Thr Ser Leu Pro
115 120 125
Leu Arg Ser Ser Met Gly Met Tyr Asn Ser Met Gln Pro Ser Ile His
130 135 140
Leu Met Gln Gln Asn Lys Leu Ile Val Pro Ser Lys Gln Thr Gln Lys
145 150 155 160
Arg Arg Lys Pro Tyr Ile Lys Lys His Ile Ser Pro Pro Thr Gln Met
165 170 175
Lys Ser Gln Trp Tyr Phe Gln His Asn Ile Ala Asn Ile Pro Leu Leu
180 185 190
Met Ile Arg Thr Thr Ala Leu Thr Leu Asp Asn Tyr Tyr Ile Gly Ser
195 200 205
Arg Gln Leu Ser Thr Asn Val Thr Ile His Thr Leu Asn Thr Thr Tyr
210 215 220
Ile Gln Asn Arg Asp Trp Gly Asp Arg Asn Lys Thr Tyr Tyr
225 230 235
<210> 960
<211> 240
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 960
Arg Arg Pro Val Arg Arg Arg Arg Arg Lys Leu Arg Lys Val Lys Arg
1 5 10 15
Lys Lys Lys Ser Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Arg
20 25 30
Thr Cys Lys Ile Ile Gly Gln Ser Ala Ile Val Val Gly Ala Glu Gly
35 40 45
Lys Gln Met Tyr Cys Tyr Thr Val Asn Lys Leu Ile Asn Val Pro Pro
50 55 60
Lys Thr Pro Tyr Gly Gly Gly Phe Gly Val Asp Gln Tyr Thr Leu Lys
65 70 75 80
Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala Gln Asn Ile Trp Thr Gln Ser
85 90 95
Asn Val Leu Lys Asp Leu Cys Arg Tyr Ile Asn Val Lys Leu Ile Phe
100 105 110
Tyr Arg Asp Asn Lys Thr Asp Phe Val Leu Ser Tyr Asp Arg Asn Pro
115 120 125
Pro Phe Gln Leu Thr Lys Phe Thr Tyr Pro Gly Ala His Pro Gln Gln
130 135 140
Ile Met Leu Gln Lys His His Lys Phe Ile Leu Ser Gln Met Thr Lys
145 150 155 160
Pro Asn Gly Arg Leu Thr Lys Lys Leu Lys Ile Lys Pro Pro Lys Gln
165 170 175
Met Leu Ser Lys Trp Phe Phe Ser Lys Gln Phe Cys Lys Tyr Pro Leu
180 185 190
Leu Ser Leu Lys Ala Ser Ala Leu Asp Leu Arg His Ser Tyr Leu Gly
195 200 205
Cys Cys Asn Glu Asn Pro Gln Val Phe Phe Tyr Tyr Leu Asn His Gly
210 215 220
Tyr Tyr Thr Ile Thr Asn Trp Gly Ala Gln Ser Ser Thr Ala Tyr Arg
225 230 235 240
<210> 961
<211> 240
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 961
Arg Phe Thr Lys Thr Arg Arg Arg Arg Lys Arg Lys Lys Val Arg Arg
1 5 10 15
Lys Leu Lys Lys Ile Thr Ile Lys Gln Trp Gln Pro Asp Ser Val Lys
20 25 30
Lys Cys Lys Ile Lys Gly Tyr Ser Thr Leu Val Met Gly Ala Gln Gly
35 40 45
Lys Gln Tyr Asn Cys Tyr Thr Asn Gln Ala Ser Asp Tyr Val Gln Pro
50 55 60
Lys Ala Pro Gln Gly Gly Gly Phe Gly Cys Glu Val Phe Asn Leu Lys
65 70 75 80
Trp Leu Tyr Gln Glu Tyr Thr Ala His Arg Asn Ile Trp Thr Lys Thr
85 90 95
Asn Glu Tyr Thr Asp Leu Cys Arg Tyr Thr Gly Ala Gln Ile Ile Leu
100 105 110
Tyr Arg His Pro Asp Val Asp Phe Ile Val Ser Trp Asp Asn Gln Pro
115 120 125
Pro Phe Leu Leu Asn Lys Tyr Thr Tyr Pro Glu Leu Gln Pro Gln Asn
130 135 140
Leu Leu Leu Ala Arg Arg Lys Arg Ile Ile Leu Ser Gln Lys Ser Asn
145 150 155 160
Pro Lys Gly Lys Leu Arg Ile Lys Leu Arg Ile Pro Pro Pro Lys Gln
165 170 175
Met Ile Thr Lys Trp Phe Phe Gln Arg Asp Phe Cys Asp Val Asn Leu
180 185 190
Phe Lys Leu Cys Ala Ser Ala Ala Ser Phe Arg Tyr Pro Gly Ile Ser
195 200 205
His Gly Ala Gln Ser Thr Ile Phe Ser Ala Tyr Ala Leu Asn Thr Asp
210 215 220
Phe Tyr Gln Cys Ser Asp Trp Cys Gln Thr Asn Thr Glu Thr Gly Tyr
225 230 235 240
<210> 962
<211> 239
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 962
Gly Arg Arg Thr Tyr Thr Arg Arg Ala Val Arg Arg Arg Arg Arg Pro
1 5 10 15
Arg Lys Arg Leu Val Leu Thr Gln Trp Ser Pro Gln Thr Val Arg Asn
20 25 30
Cys Ser Ile Arg Gly Ile Val Pro Met Val Ile Cys Gly His Thr Lys
35 40 45
Ala Gly Arg Asn Tyr Ala Ile His Ser Glu Asp Phe Thr Thr Gln Ile
50 55 60
Gln Pro Phe Gly Gly Ser Phe Ser Thr Thr Thr Trp Ser Leu Lys Val
65 70 75 80
Leu Trp Asp Glu His Gln Lys Phe Gln Asn Arg Trp Ser Tyr Pro Asn
85 90 95
Thr Gln Leu Asp Leu Ala Arg Tyr Arg Gly Val Thr Phe Trp Phe Tyr
100 105 110
Arg Asp Gln Lys Thr Asp Tyr Ile Val Gln Trp Ser Arg Asn Pro Pro
115 120 125
Phe Lys Leu Asn Lys Tyr Ser Ser Ala Met Tyr His Pro Gly Met Met
130 135 140
Met Gln Ala Lys Arg Lys Leu Val Val Pro Ser Phe Gln Thr Arg Pro
145 150 155 160
Lys Gly Lys Lys Arg Tyr Arg Val Thr Ile Lys Pro Pro Asn Met Phe
165 170 175
Ala Asp Lys Trp Tyr Thr Gln Glu Asp Leu Cys Pro Val Pro Leu Val
180 185 190
Gln Ile Val Val Ser Ala Ala Ser Leu Leu His Pro Phe Cys Pro Pro
195 200 205
Gln Thr Asn Asn Pro Cys Ile Thr Phe Gln Val Leu Lys Asp Ile Tyr
210 215 220
Asp Glu Cys Ile Gly Val Asn Glu Thr Met Lys Asp Lys Tyr Lys
225 230 235
<210> 963
<211> 240
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 963
Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg
1 5 10 15
His Lys Pro Thr Leu Ile Leu Arg Gln Trp Gln Pro Asp Cys Ile Arg
20 25 30
His Cys Lys Ile Thr Gly Trp Met Pro Leu Ile Ile Cys Gly Lys Gly
35 40 45
Ser Thr Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg
50 55 60
Gly Ala Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu
65 70 75 80
Ala Ile Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser
85 90 95
Asn His Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu
100 105 110
Tyr Arg His Pro Glu Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly
115 120 125
Pro Phe Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Met Leu
130 135 140
Met Leu Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys
145 150 155 160
Pro Arg Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu
165 170 175
Met Asn Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu
180 185 190
Phe Gln Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg
195 200 205
Met Ser Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser
210 215 220
Ile Tyr Thr Asn Leu Ser Asn Leu Pro Gln Tyr Lys Asn Glu Arg Leu
225 230 235 240
<210> 964
<211> 233
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 964
Arg Arg Arg Arg Arg Phe Arg Arg Arg Gly Arg Lys Ala Lys Leu Ile
1 5 10 15
Ile Lys Leu Trp Gln Pro Ala Val Ile Lys Arg Cys Arg Ile Lys Gly
20 25 30
Tyr Ile Pro Leu Ile Ile Ser Gly Asn Gly Thr Phe Ala Thr Asn Phe
35 40 45
Thr Ser His Ile Asn Asp Arg Ile Met Lys Gly Pro Phe Gly Gly Gly
50 55 60
His Ser Thr Met Arg Phe Ser Leu Tyr Ile Leu Phe Glu Glu His Leu
65 70 75 80
Arg His Met Asn Phe Trp Thr Arg Ser Asn Asp Asn Leu Glu Leu Thr
85 90 95
Arg Tyr Leu Gly Ala Ser Val Lys Ile Tyr Arg His Pro Asp Gln Asp
100 105 110
Phe Ile Val Ile Tyr Asn Arg Arg Thr Pro Leu Gly Gly Asn Ile Tyr
115 120 125
Thr Ala Pro Ser Leu His Pro Gly Asn Ala Ile Leu Ala Lys His Lys
130 135 140
Ile Leu Val Pro Ser Leu Gln Thr Arg Pro Lys Gly Arg Lys Ala Ile
145 150 155 160
Arg Leu Arg Ile Ala Pro Pro Thr Leu Phe Thr Asp Lys Trp Tyr Phe
165 170 175
Gln Lys Asp Ile Ala Asp Leu Thr Leu Phe Asn Ile Met Ala Val Glu
180 185 190
Ala Asp Leu Arg Phe Pro Phe Cys Ser Pro Gln Thr Asp Asn Thr Cys
195 200 205
Ile Ser Phe Gln Val Leu Ser Ser Val Tyr Asn Asn Tyr Leu Ser Ile
210 215 220
Asn Thr Phe Asn Asn Asp Asn Ser Asp
225 230
<210> 965
<211> 233
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 965
Arg Arg Trp Arg Arg Lys Gly Lys Arg Ser Arg Lys Lys Lys Ile Ile
1 5 10 15
Ile Arg Gln Trp Gln Pro Asn Tyr Thr Arg Arg Cys Asn Ile Val Gly
20 25 30
Tyr Met Pro Leu Leu Ile Cys Gly Glu Asn Thr Val Ala Thr Asn Tyr
35 40 45
Ala Thr His Ser Asp Asp Ser Tyr Tyr Pro Gly Pro Phe Gly Gly Gly
50 55 60
Met Thr Thr Asp Lys Phe Thr Leu Arg Ile Leu Tyr Asp Glu Tyr Lys
65 70 75 80
Arg Phe Met Asn Tyr Trp Thr Ser Ser Asn Glu Asp Leu Asp Leu Cys
85 90 95
Arg Tyr Leu Gly Cys Thr Leu Tyr Val Phe Arg His Pro Glu Val Asp
100 105 110
Phe Ile Ile Ile Ile Asn Thr Ser Pro Pro Phe Leu Asp Thr Glu Ile
115 120 125
Thr Gly Pro Ser Ile His Pro Gly Met Met Ala Leu Asn Lys Arg Ser
130 135 140
Arg Trp Ile Pro Ser Ile Lys Asn Arg Pro Gly Arg Lys His Tyr Ile
145 150 155 160
Lys Ile Lys Val Gly Ala Pro Arg Met Phe Thr Asp Lys Trp Tyr Pro
165 170 175
Gln Thr Asp Leu Cys Asp Met Thr Leu Leu Thr Ile Phe Ala Ser Ala
180 185 190
Ala Asp Met Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp Thr Ile Val
195 200 205
Val Ser Phe Gln Val Leu Gln Ser Met Tyr Asn Asp Cys Leu Ser Val
210 215 220
Leu Pro Asp Asn Phe Ala Glu Thr Ser
225 230
<210> 966
<211> 232
<212> PRT
<213> 未知
<220>
<223> 未知的描述:指环病毒(Anelloviridae)科序列
<400> 966
Arg Arg Trp Lys Arg Lys Gly Arg Arg Arg Arg Lys Ala Lys Ile Ile
1 5 10 15
Ile Arg Gln Trp Gln Pro Asn Tyr Arg Arg Arg Cys Asn Ile Val Gly
20 25 30
Tyr Leu Pro Ile Leu Ile Cys Gly Gly Asn Thr Val Ser Arg Asn Tyr
35 40 45
Ala Thr His Ser Asp Asp Thr Asn Tyr Pro Gly Pro Phe Gly Gly Gly
50 55 60
Met Thr Thr Asp Lys Phe Ser Leu Arg Ile Leu Tyr Asp Glu Tyr Lys
65 70 75 80
Arg Phe Met Asn Tyr Trp Thr Ala Ser Asn Glu Asp Leu Asp Leu Cys
85 90 95
Arg Tyr Leu Gly Cys Thr Phe Tyr Phe Phe Arg His Pro Glu Val Asp
100 105 110
Phe Ile Ile Lys Ile Asn Thr Met Pro Pro Phe Leu Asp Thr Thr Ile
115 120 125
Thr Ala Pro Ser Ile His Pro Gly Leu Met Ala Leu Asp Lys Arg Ala
130 135 140
Arg Trp Ile Pro Ser Leu Lys Asn Arg Pro Gly Lys Lys His Tyr Ile
145 150 155 160
Lys Ile Arg Val Gly Ala Pro Lys Met Phe Thr Asp Lys Trp Tyr Pro
165 170 175
Gln Thr Asp Leu Cys Asp Met Thr Leu Leu Thr Ile Tyr Ala Thr Ala
180 185 190
Ala Asp Met Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp Thr Val Val
195 200 205
Val Asn Ser Gln Val Leu Gln Ser Met Tyr Asp Glu Thr Ile Ser Ile
210 215 220
Leu Pro Asp Glu Lys Thr Lys Arg
225 230
<210> 967
<211> 170
<212> PRT
<213> 喙羽病病毒(Beak and feather disease virus)
<400> 967
Arg Arg Arg Arg Arg Arg Phe Ser Thr Asn Arg Ile Tyr Thr Leu Arg
1 5 10 15
Leu Thr Arg Gln Phe Gln Phe Lys Ile Asn Lys Gln Leu Ile Phe Asn
20 25 30
Ala Asp Tyr Ile Thr Phe Ala Leu Asp Asp Phe Leu Gln Ala Val Pro
35 40 45
Asn Pro His Thr Leu Asn Phe Glu Asp Tyr Arg Ile Lys Leu Ala Lys
50 55 60
Met Glu Met Arg Pro Thr Gly Gly His Tyr Thr Gly Phe Gly His Thr
65 70 75 80
Ala Val Ile Gln Asp Ser Arg Ile Thr Arg Phe Lys Thr Thr Ala Asp
85 90 95
Pro Leu Ala Pro Phe Asp Gly Ala Lys Lys Trp Phe Val Ser Arg Gly
100 105 110
Phe Lys Arg Leu Leu Arg Pro Lys Pro Gln Ile Thr Ile Glu Gly Pro
115 120 125
Asn Ser Ala Gly Thr Lys Val Arg His Tyr Gly Ile Ala Phe Ser Phe
130 135 140
Pro Gln Pro Glu Gln Thr Val Thr Lys Leu Thr Leu Tyr Val Gln Phe
145 150 155 160
Arg Gln Phe Ala Pro Asn Asn Pro Ser Thr
165 170
<210> 968
<211> 179
<212> PRT
<213> 戊型肝炎病毒A(Orthohepevirus A)
<400> 968
Gly Ala Ile Leu Arg Arg Gln Tyr Asn Leu Ser Thr Ser Pro Leu Thr
1 5 10 15
Ser Ser Val Ala Ser Gly Thr Asn Leu Val Leu Tyr Ala Ala Pro Leu
20 25 30
Asn Pro Leu Leu Pro Leu Gln Asp Gly Thr Asn Thr His Ile Met Ala
35 40 45
Thr Glu Ala Ser Asn Tyr Ala Gln Tyr Arg Val Val Arg Ala Thr Ile
50 55 60
Arg Tyr Arg Pro Leu Val Pro Asn Ala Val Ser Ile Ser Phe Trp Pro
65 70 75 80
Gln Thr Thr Thr Thr Pro Thr Ser Val Asp Met Asn Ser Ile Thr Ser
85 90 95
Thr Asp Val Arg Ile Leu Val Gln Pro Gly Ile Ala Ser Glu Leu Val
100 105 110
Ile Pro Ser Glu Arg Leu His Tyr Arg Thr Arg Thr Gly Val Ala Glu
115 120 125
Glu Glu Ala Thr Ser Gly Leu Val Met Leu Cys Ile His Gly Ser Pro
130 135 140
Val Asn Ser Ala Leu Gly Leu Leu Asp Phe Ala Leu Glu Leu Glu Phe
145 150 155 160
Arg Asn Leu Thr Pro Gly Asn Thr Asn Thr Arg Val Ser Arg Tyr Thr
165 170 175
Ser Thr Ala
Claims (9)
1.一种指环载体,其含有:
a)包含ORF1分子的蛋白质外壳;
b)包含RNA的遗传元件,
其中该遗传元件被包封在该蛋白质外壳内。
2.根据权利要求1所述的指环载体,其中该遗传元件由至少10%、20%、25%、30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%RNA组成。
3.根据权利要求1或2所述的指环载体,其中该RNA包含一个或多个化学修饰。
4.根据前述权利要求中任一项所述的指环载体,其中该遗传元件由RNA组成或基本上由RNA组成。
5.根据前述权利要求中任一项所述的指环载体,其中该遗传元件包含DNA区域。
6.根据前述权利要求中任一项所述的指环载体,其中该DNA区域的至少一部分与该遗传元件的RNA的至少一部分杂交。
7.根据前述权利要求中任一项所述的指环载体,其中该遗传元件是环状的。
8.一种制备指环载体的方法,该方法包括:
(a)提供混合物,该混合物含有:
(i)包含RNA的遗传元件,和
(ii)ORF1分子;以及
(b)在适用于将该遗传元件包封在包含该ORF1分子的蛋白质外壳内的条件下孵育该混合物,从而制备指环载体;
任选地,其中该混合物不包含在细胞中。
9.一种将遗传元件递送至细胞的方法,该方法包括使根据权利要求1-7中任一项所述的指环载体与细胞,例如真核细胞,例如哺乳动物细胞,例如人类细胞接触。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/130,360 | 2020-12-23 | ||
US202163147064P | 2021-02-08 | 2021-02-08 | |
US63/147,064 | 2021-02-08 | ||
PCT/US2021/064887 WO2022140560A1 (en) | 2020-12-23 | 2021-12-22 | In vitro assembly of anellovirus capsids enclosing rna |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116887865A true CN116887865A (zh) | 2023-10-13 |
Family
ID=88270369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180093903.7A Pending CN116887865A (zh) | 2020-12-23 | 2021-12-22 | 包封rna的指环病毒衣壳的体外组装 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116887865A (zh) |
-
2021
- 2021-12-22 CN CN202180093903.7A patent/CN116887865A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12060567B2 (en) | Engineered untranslated regions (UTR) for AAV production | |
KR20220155981A (ko) | 미성숙 종결 코돈-매개 장애를 치료하기 위한 방법 및 조성물 | |
KR20210125990A (ko) | 단백질 대체 치료 양식을 운반하기 위한 아넬로좀 | |
KR20210131310A (ko) | 아넬로좀 및 사용 방법 | |
CA3116701A1 (en) | Expression vectors for large-scale production of raav in the baculovirus/sf9 system | |
KR20210131309A (ko) | 분비형 치료 양식을 운반하기 위한 아넬로좀 | |
KR20240025507A (ko) | 미성숙 종결 코돈-매개 장애를 치료하기 위한 방법 및 조성물 | |
KR20230124682A (ko) | Rna를 봉입하는 아넬로바이러스 캡시드의 시험관 내어셈블리 | |
KR20210131308A (ko) | 세포내 치료 양식을 운반하기 위한 아넬로좀 | |
US20230340527A1 (en) | Baculovirus expression systems | |
CN116887865A (zh) | 包封rna的指环病毒衣壳的体外组装 | |
CN117279669A (zh) | 杂合aav-指环载体 | |
US20240254512A1 (en) | Anellovectors and methods of use | |
KR20230041686A (ko) | 아넬로바이러스를 확인 및 특징화하는 방법 및 이의 용도 | |
EP4447945A2 (en) | Surface-modified viral particles and modular viral particles | |
KR20230036110A (ko) | 탠덤 아넬로바이러스 구축물 | |
AU2023272105A1 (en) | Compositions comprising modified anellovirus capsid proteins and uses thereof | |
CN118647725A (zh) | 表面修饰的病毒颗粒和模块化病毒颗粒 | |
CN115160410A (zh) | 新型肌肉高效亲和腺相关病毒血清型及相关应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |