CN117279669A - 杂合aav-指环载体 - Google Patents

杂合aav-指环载体 Download PDF

Info

Publication number
CN117279669A
CN117279669A CN202280019539.4A CN202280019539A CN117279669A CN 117279669 A CN117279669 A CN 117279669A CN 202280019539 A CN202280019539 A CN 202280019539A CN 117279669 A CN117279669 A CN 117279669A
Authority
CN
China
Prior art keywords
nucleic acid
genetic element
sequence
cell
orf1
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280019539.4A
Other languages
English (en)
Inventor
S·德拉格拉夫
K·J·勒博
M·J·迪比亚西奥-怀特
D·M·纳万达尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Flagship Pioneering Innovations V Inc
Original Assignee
Flagship Pioneering Innovations V Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Flagship Pioneering Innovations V Inc filed Critical Flagship Pioneering Innovations V Inc
Publication of CN117279669A publication Critical patent/CN117279669A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/61Growth hormone [GH], i.e. somatotropin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00041Use of virus, viral particle or viral elements as a vector
    • C12N2750/00043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/00041Use of virus, viral particle or viral elements as a vector
    • C12N2750/00044Chimeric viral vector comprising heterologous viral elements for production of another viral vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14144Chimeric viral vector comprising heterologous viral elements for production of another viral vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Virology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Endocrinology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Immunology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)
  • Nitrogen And Oxygen Or Sulfur-Condensed Heterocyclic Ring Systems (AREA)

Abstract

本发明总体上涉及用于制备和施用指环载体的组合物及其用途。

Description

杂合AAV-指环载体
相关申请的交叉引用
本申请要求于2021年2月8日提交的美国临时申请号63/147,102的权益。上述申请的内容特此通过引用以其全文并入。
背景技术
一直需要开发用于制备合适的病毒载体的组合物和方法,以将治疗性效应物递送至患者。
发明内容
本披露提供了一种指环载体(例如合成的指环载体),该指环载体可用作递送媒介物,例如用于向真核细胞(例如人细胞或人组织中的细胞)递送遗传物质、递送效应物(例如有效载荷)、或者递送治疗剂或治疗性效应物。通常,指环载体包含含有指环病毒ORF1分子的蛋白质外壳(例如,与指环病毒ORF1蛋白具有至少30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的衣壳蛋白,例如,如本文所述)和包封在蛋白质外壳内的遗传元件,其中该遗传元件包含来自除指环病毒之外的病毒的至少一个核酸序列(例如,长度为至少10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500或4000个核苷酸的连续核酸序列),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,来自除指环病毒之外的病毒的核酸序列来自腺相关病毒(AAV)(例如,如本文所述)。在一些实施例中,效应物(例如,有效载荷)或编码该效应物的序列与非指环病毒序列是分开的。在一些实施例中,蛋白质外壳能够将遗传元件引入靶细胞(例如,哺乳动物细胞,例如,人细胞)中。本披露进一步提供了用于施用例如如本文所述的指环载体(例如合成的指环载体)的组合物和方法,该指环载体可以用作递送媒介物,例如,用于向真核细胞(例如人细胞或人组织)递送遗传物质、递送效应物(例如有效载荷)、或者递送治疗剂或治疗性效应物。
可以在用于递送本文所述的效应物的方法中使用的指环载体及其组分(例如,使用如本文所述的组合物或方法产生)通常包含封装在蛋白质外壳(例如,包含以下的蛋白质外壳:指环病毒衣壳蛋白,例如指环病毒ORF1分子,例如指环病毒ORF1蛋白或由指环病毒ORF1核酸编码的多肽,例如如本文所述,或与其具有至少30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的多肽)中的遗传元件(例如,包含或编码效应物(例如外源性或内源性效应物,例如治疗性效应物)的遗传元件),能够将该遗传元件引入细胞(例如,哺乳动物细胞,例如人细胞)中。遗传元件通常包含来自除指环病毒之外的病毒(例如来自AAV,例如AAV1、AAV2或AAV5)的至少一个核酸序列(例如,长度为至少10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500或4000个核苷酸的连续核酸序列),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,非指环病毒序列包含非指环病毒复制起点,例如,衍生自单DNA病毒(Monodnavirus),例如,称德病毒(Shotokuvirus)(例如,单环编码病毒门(Cressdnaviricota)[例如,雷东多病毒(redondovirus)、圆环病毒(circovirus){例如,猪圆环病毒(porcine circovirus),例如,PCV-1或PCV-2;或者喙羽症病毒(beak-and-feather disease virus)}、双生病毒(geminivirus){例如,番茄金花叶病毒(tomatogolden mosaic virus)}或矮缩病毒(nanovirus){例如,BBTV、MDV1、SCSVF或FBNYV}]),或细小病毒(Parvovirus)(例如,依赖性细小病毒(dependoparavirus),例如,博卡病毒(bocavirus)或腺相关病毒(AAV))。在一些实施例中,非指环病毒复制起点衍生自AAV(例如,AAV1、AAV2或AAV5)。在一些实施例中,非指环病毒复制起点包含AAV Rep-结合基序(RBM)(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,非指环病毒复制起点包含AAV末端解离位点(TRS)(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,非指环病毒复制起点包含在反向末端重复(ITR)中,例如AAV ITR,例如,如本文所述。
在一些实施例中,指环载体是感染性媒介物或颗粒,其包含蛋白质外壳(例如衣壳),该蛋白质外壳包含由指环病毒ORF1核酸(例如,甲型细环病毒、乙型细环病毒或丙型细环病毒的ORF1核酸,例如甲型细环病毒分支1、甲型细环病毒分支2、甲型细环病毒分支3、甲型细环病毒分支4、甲型细环病毒分支5、甲型细环病毒分支6或甲型细环病毒分支7的ORF1,例如,如本文所述)编码的多肽,或与其具有至少30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的多肽。在实施例中,本文所述的指环载体包含由指环病毒ORF1核酸(例如,具有如表A1、B1、B3、C1、E1、F1、F3或F5中任一个所述的序列,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列)编码的多肽。在实施例中,本文所述的指环载体包含具有ORF1蛋白的序列(例如,具有如表A2、B2、B4、C2、E2、F2、F4或F6中任一个所述序列)的多肽,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%序列同一性的多肽。在实施例中,本文所述的指环载体是感染性媒介物或颗粒,例如,包含封装非指环病毒基因组的指环病毒衣壳。指环病毒衣壳的产生可包括指环病毒ORF1分子(例如,如本文所述)的体外产生或宿主细胞表达。
在一些实施例中,本披露的指环载体的遗传元件是环状和/或单链DNA分子(例如,环状和单链的)。在一些实施例中,本披露的指环载体的遗传元件是线性和/或单链DNA分子(例如,线性和单链的)。在一些实施例中,遗传元件包括与包封它的蛋白质外壳结合的蛋白结合序列,或与之相连的多肽,这可能有助于将遗传元件包封在蛋白质外壳内,和/或相对于其他核酸而言,将遗传元件富集在蛋白质外壳内。在一些实施例中,指环载体的遗传元件使用如本文所述的组合物或方法产生。
在一些情况下,可用于递送本文所述的效应物的方法的指环载体包含遗传元件,该遗传元件包含或编码效应物(例如,核酸效应物如非编码RNA,或多肽效应物如蛋白质),例如,可以在细胞中表达的效应物。在一些实施例中,效应物是治疗剂或治疗性效应物,例如,如本文所述的。在一些实施例中,效应物是内源性效应物或外源性效应物,例如针对野生型指环病毒或靶细胞而言的内源性效应物或外源性效应物。在一些实施例中,效应物针对野生型指环病毒或靶细胞而言是外源性的。在一些实施例中,指环载体可以通过接触细胞并将编码效应物的遗传元件引入细胞中,从而将效应物递送到细胞内,使得效应物由细胞产生或表达。在某些情况下,效应物是内源性效应物(例如,针对靶细胞而言是内源性的,但是,例如由指环载体以更大的量提供的内源性效应物)。在其他情况下,效应物是外源性效应物。在一些情况下,效应物可以调节细胞的功能或者调节细胞中靶分子的活性或水平。例如,效应物可以降低细胞中靶蛋白的水平。在另一实例中,指环载体可以在体内递送和表达效应物,例如外源性蛋白。例如,指环载体可用于将遗传物质递送至靶细胞、组织或受试者;将效应物递送至靶细胞、组织或受试者;调节生物应答,例如细胞或分子应答;或者用于治疗病症(如疾病和障碍),例如通过将可作为调节剂和/或治疗剂起作用的效应物递送至所期望的细胞、组织或受试者。
在一些实施例中,本文所述的组合物和方法可用于例如在宿主细胞中产生合成指环载体的遗传元件,该遗传元件要被用于如本文所述的施用指环载体的方法。合成指环载体与野生型病毒(例如,野生型指环病毒,例如,如本文所述)相比具有至少一种结构差异,例如,相对于野生型病毒的缺失、插入、置换、修饰(例如,酶促修饰)。在一些实施例中,结构差异包含遗传元件的非指环病毒序列,例如,如本文所述。通常,合成指环载体包括包封在蛋白质外壳内的外源性遗传元件,其可用于将遗传元件或在其中编码的(例如,多肽或核酸效应物)效应物(例如,外源性效应物或内源性效应物)递送至真核(例如,人类)细胞中。在实施例中,指环载体不会造成可检测的和/或不必要的免疫或炎症反应,例如,不会造成一种或多种炎症分子标志如TNF-α、IL-6、IL-12、IFN增加超过1%、5%、10%、15%,以及不会造成B细胞应答,如反应性或中和性抗体,例如,指环载体对靶细胞、组织或受试者是基本上非免疫原性的。
在一些实施例中,本文所述的组合物和方法可用于产生指环载体的遗传元件,该指环载体是例如可用于递送本文所述的效应物的方法的指环载体,该指环载体包含:(i)遗传元件,其包含启动子元件和编码效应物(例如内源性或外源性效应物)的序列,和蛋白结合序列(例如,外壳蛋白结合序列,如包装信号);以及(ii)蛋白质外壳;其中将遗传元件被包封在蛋白质外壳(例如,衣壳)内;并且其中指环载体能够将遗传元件递送到真核(例如,哺乳动物,例如人)细胞中。在一些实施例中,遗传元件是单链和/或环状DNA。可替代地或组合地,遗传元件具有以下特性中的一种、两种、三种或所有:是环状的,是单链的,它整合到细胞基因组中的频率低于进入细胞的遗传元件的约0.0001%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%,和/或它以少于1、2、3、4、5、6、7、8、9、10、15、20、25或30个拷贝/基因组整合到靶细胞的基因组中。在一些实施例中,整合频率是通过对从游离载体中分离出来的基因组DNA进行定量凝胶纯化测定来确定的,例如,如Wang等人(2004,Gene Therapy[基因治疗],11:711-721,其通过引用以其全文并入本文)中所述。在一些实施例中,将遗传元件包封在蛋白质外壳内。在一些实施例中,指环载体能够将遗传元件递送到真核细胞中。在一些实施例中,遗传元件包含与野生型指环病毒序列(例如,野生型细环病毒(TTV)、小细环病毒(TTMV)或TTMDV序列,例如,如本文所述的野生型指环病毒序列)具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性的核酸序列(例如,300-4000个核苷酸的核酸序列,如300-3500个核苷酸、300-3000个核苷酸、300-2500个核苷酸、300-2000个核苷酸、300-1500个核苷酸的核酸序列)。在一些实施例中,遗传元件包含与野生型指环病毒序列(例如,如本文所述的野生型指环病毒序列)具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性的核酸序列(例如,至少300个核苷酸、500个核苷酸、1000个核苷酸、1500个核苷酸、2000个核苷酸、2500个核苷酸、3000个核苷酸或更多个核苷酸的核酸序列)。在一些实施例中,核酸序列经过密码子优化,例如,用于在哺乳动物(如,人)细胞中表达。在一些实施例中,核酸序列中至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的密码子经过密码子优化,例如,用于在哺乳动物(如,人)细胞中表达。
在一些实施例中,本文所述的组合物和方法可用于产生包含衣壳(例如,包含指环病毒ORF如ORF1、多肽的衣壳)的感染性(例如,对人细胞具有感染性)指环载体、媒介物或颗粒的遗传元件,该衣壳封装遗传元件,该遗传元件包含与衣壳结合的蛋白结合序列和编码治疗性效应物(该治疗性效应物可用于本文所述的施用指环载体的方法)的异源(针对指环病毒而言)序列。在实施例中,指环载体能够将遗传元件递送至哺乳动物(例如,人)细胞中。在一些实施例中,遗传元件与野生型指环病毒基因组序列具有小于约6%(例如,小于10%、9.5%、9%、8%、7%、6%、5.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%或更小)的同一性。在一些实施例中,遗传元件与野生型指环病毒基因组序列具有不超过1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%或6%的同一性。在一些实施例中,遗传元件与野生型指环病毒具有至少约2%到至少约5.5%(例如,2%至5%、3%至5%、4%至5%)的同一性。在一些实施例中,遗传元件具有大于约2000、3000、4000、4500或5000个核苷酸的非病毒序列(例如,非指环病毒基因组序列)。在一些实施例中,遗传元件具有大于约2000至5000、2500至4500、3000至4500、2500至4500、3500或4000、4500(例如,约3000至4500)个核苷酸的非病毒序列(例如,非指环病毒基因组序列)。在一些实施例中,遗传元件是单链环状DNA。可替代地或组合地,遗传元件具有以下特性中的一种、两种或三种:是环状的,是单链的,它以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%、或2%的频率整合进入细胞的基因组中,它以小于1、2、3、4、5、6、7、8、9、10、15、20、25或30个拷贝/基因组整合进入靶细胞的基因组中或以少于进入细胞的遗传元件的约0.0001%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合(例如,相对于来自细胞裂解物的遗传元件序列比较进入基因组DNA的整合频率)。在一些实施例中,整合频率是通过对从游离载体中分离出来的基因组DNA进行定量凝胶纯化测定来确定的,例如,如Wang等人(2004,Gene Therapy[基因治疗],11:711-721,其通过引用以其全文并入本文)中所述。
在一些实施例中,根据本文所述的方法施用的指环病毒或指环载体可用作有效递送媒介物,用于将作用剂如本文所述的效应物引入靶细胞中,例如,待接受治疗性或预防性治疗的受试者中的靶细胞。
在一些实施例中,本文所述的组合物和方法可用于产生包含蛋白质外壳的指环载体(该指环载体可用于本文所述的施用方法的)的遗传元件,该蛋白质外壳包含多肽(例如合成多肽,如ORF1分子),该多肽包含(例如,以串联方式):
(i)第一区,其包含精氨酸富集区,例如,包含至少60%、70%或80%碱性残基(例如,精氨酸、赖氨酸或其组合)的至少约40个氨基酸的序列,
(ii)第二区域,其包含胶冻卷结构域,例如,包含至少6个β链的序列,
(iii)第三区域,其包含本文所述的N22结构域序列,
(iv)第四区域,其包含本文所述的指环病毒ORF1 C-末端结构域(CTD)序列,以及
(v)任选地,其中该多肽具有与例如本文所述的野生型指环病毒ORF1蛋白存在小于100%、99%、98%、95%、90%、85%、80%序列同一性的氨基酸序列。
在一方面,本发明的特征在于包含遗传元件序列的分离的核酸分子(例如,核酸构建体),该遗传元件序列包含与编码效应物例如有效载荷的序列可操作地连接的启动子元件,以及外壳蛋白结合序列。在一些实施例中,外壳蛋白结合序列包括与例如本文披露的指环病毒的5’UTR序列存在至少75%(至少80%、85%、90%、95%、97%、100%)同一性的序列。在实施例中,遗传元件是单链DNA,是环状的,以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%、或2%的频率整合,和/或以小于1、2、3、4、5、6、7、8、9、10、15、20、25或30个拷贝/基因组整合进入靶细胞的基因组中或以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合。在一些实施例中,整合频率是通过对从游离载体中分离出来的基因组DNA进行定量凝胶纯化测定来确定的,例如,如Wang等人(2004,Gene Therapy[基因治疗],11:711-721,其通过引用以其全文并入本文)中所述。在实施例中,效应物并非源自TTV,也不是SV40-miR-S1。在实施例中,核酸分子不包含TTMV-LY2的多核苷酸序列。在实施例中,启动子元件能够指导效应物在真核(例如哺乳动物,例如人类)细胞中的表达。
在一些实施例中,核酸分子是环状的。在一些实施例中,核酸分子是线性的。在一些实施例中,本文所述的核酸分子包含一个或多个经修饰的核苷酸(例如碱基修饰、糖修饰或骨架修饰)。
在一些实施例中,核酸分子包含编码ORF1分子(例如,指环病毒ORF1蛋白,例如,如本文所述)的序列。在一些实施例中,核酸分子包含编码ORF2分子(例如,指环病毒ORF2蛋白,例如,如本文所述)的序列。在一些实施例中,核酸分子包含编码ORF3分子(例如,指环病毒ORF3蛋白,例如,如本文所述)的序列。在一方面,本发明的特征在于遗传元件,其包含以下中的一种、两种或三种:(i)启动子元件和编码效应物(例如,外源性或内源性效应物)的序列;(ii)至少72个连续核苷酸(例如,至少72、73、74、75、76、77、78、79、80、90、100或150个核苷酸),其与野生型指环病毒序列具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;或至少100(例如,至少300、500、1000、1500)个连续核苷酸,其与野生型指环病毒序列具有至少72%(例如,至少72%、73%、74%、75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;以及(iii)蛋白结合序列,例如外壳蛋白结合序列,并且其中核酸构建体是单链DNA;并且其中核酸构建体是环状的,以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合,和/或以小于1、2、3、4、5、6、7、8、9、10、15、20、25或30个拷贝/基因组整合进入靶细胞的基因组中。在一些实施例中,编码效应物(例如,外源性或内源性效应物,例如,如本文所述)的遗传元件经过密码子优化。在一些实施例中,遗传元件是环状的。在一些实施例中,遗传元件是线性的。在一些实施例中,本文所述的遗传元件包含一个或多个经修饰的核苷酸(例如碱基修饰、糖修饰或骨架修饰)。在一些实施例中,遗传元件包含编码ORF1分子(例如,指环病毒ORF1蛋白,例如,如本文所述)的序列。在一些实施例中,遗传元件包含编码ORF2分子(例如,指环病毒ORF2蛋白,例如,如本文所述)的序列。在一些实施例中,遗传元件包含编码ORF3分子(例如,指环病毒ORF3蛋白,例如,如本文所述)的序列。
在一方面,本发明的特征在于宿主细胞,其包含:(a)一种或多种核酸分子,其包含编码ORF1分子、ORF2分子或ORF3分子中的一种或多种的序列(例如,编码本文所述的指环病毒ORF1多肽的序列),例如,其中核酸分子是质粒、是病毒核酸、或整合到染色体中;以及(b)遗传元件,其中遗传元件包含(i)与编码效应物(例如,外源性效应物或内源性效应物)的核酸序列(例如,DNA序列)可操作地连接的启动子元件,和(ii)结合(a)的ORF1分子的蛋白结合序列,其中(b)的遗传元件不编码ORF1多肽(例如,ORF1蛋白)、ORF2多肽(例如,ORF2蛋白)和/或ORF3多肽(例如,ORF3蛋白)中的一种或多种。例如,宿主细胞包含以顺式(均是同一核酸分子的一部分)或反式(各自是不同核酸分子的一部分)存在的(a)和(b)。在实施例中,(a)的一种或多种核酸可以是环状、单链DNA;在其他实施例中,(a)的一种或多种核酸可以是线性DNA。在实施例中,(b)的遗传元件是环状单链DNA。在一些实施例中,宿主细胞是生产细胞系,例如,如本文所述的。在一些实施例中,宿主细胞是贴壁的或悬浮的,或者二者兼有。在一些实施例中,宿主细胞或辅助细胞在微载剂中生长。在一些实施例中,宿主细胞或辅助细胞符合cGMP生产规范。在一些实施例中,宿主细胞或辅助细胞在适合促进细胞生长的培养基中生长。在某些实施例中,一旦宿主细胞或辅助细胞已经充分生长(例如,达到适当的细胞密度),就可以将培养基更换为适于宿主细胞或辅助细胞产生指环载体的培养基。
在一方面,本发明的特征在于药物组合物,该药物组合物包含指环载体(例如,合成指环载体),例如,可以通过本文所述的方法施用的指环载体。在实施例中,药物组合物进一步包含药学上可接受的载剂或赋形剂。在实施例中,药物组合物包含单位剂量,该单位剂量包含每千克目标受试者约105-1014(例如,约106-1013、107-1012、108-1011或109-1010)个基因组当量的指环载体。在一些实施例中,包含制剂的药物组合物在可接受的期限和温度范围内是稳定的,和/或与所期望的施用途径和/或该施用途径所需的任何装置(例如,针头或注射器)相容。在一些实施例中,将药物组合物配制用于作为单剂量或多剂量施用。在一些实施例中,将药物组合物在施用场所配制,例如由医疗保健专业人员配制。在一些实施例中,药物组合物包含所期望的浓度的指环载体基因组或基因组当量(例如,由每体积的基因组数量来定义)。
在一方面,本发明的特征在于治疗受试者中疾病或障碍的方法,该方法包括向该受试者施用指环载体,例如,合成指环载体,例如,如本文所述的。
在一方面,本发明的特征在于将效应物或有效载荷(例如,内源性或外源性效应物)递送至细胞、组织或受试者的方法,该方法包括向该受试者施用指环载体,例如合成指环载体,例如,如本文所述的,其中该指环载体包含编码该效应物的核酸序列。在实施例中,有效载荷是核酸。在实施例中,有效载荷是多肽。
在一方面,本发明的特征在于将指环载体递送至细胞的方法,该方法包括使该指环载体(例如合成指环载体,例如,如本文所述)与细胞(例如真核细胞,如哺乳动物细胞)进行接触,例如,在体内或离体条件下进行接触。
在一方面,本发明的特征在于制备指环载体的方法,该指环载体是例如可用于本文所述的施用指环载体的方法的合成指环载体。该方法包括:
(a)提供宿主细胞,其包含:
(i)第一核酸分子,其包含指环载体,例如如本文所述的指环载体的遗传元件的核酸序列;和
(ii)第二核酸分子,其编码指环病毒ORF1多肽,或者选自ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2的氨基酸序列中的一种或多种,例如,如本文所述的,或与其具有至少70%(例如,至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列;以及
(b)在适于遗传元件的核酸序列复制(例如,滚环式复制)的条件下孵育宿主细胞,从而产生遗传元件;以及
任选地,(c)在适于将遗传元件包封在蛋白质外壳(例如,包含由第二核酸分子编码的多肽)中的条件下孵育宿主细胞。
在另一方面,本发明的特征在于生产指环载体组合物(例如,可用于本文所述的施用方法的指环载体组合物)的方法,该组合物包括(a)、(b)和(c)中的一项或多项(例如,全部):
a)提供宿主细胞,该宿主细胞包含,例如表达指环载体,例如合成指环载体,例如本文所述的合成指环载体的一种或多种组分(例如,所有组分);
b)在适合从该宿主细胞产生指环载体制剂的条件下培养该宿主细胞,其中该制剂的指环载体包含封装该遗传元件(例如,如本文所述)的蛋白质外壳(例如,包含指环载体ORF1多肽),从而制备指环载体的制剂;以及
任选地,c)配制指环载体制剂,例如,作为适于向受试者施用的药物组合物。
例如,在该生产方法中提供的宿主细胞包含(a)核酸,该核酸包含编码本文所述的指环病毒ORF1多肽的序列,其中该核酸是质粒、病毒核酸或基因组,或者整合到辅助细胞染色体中;以及(b)核酸构建体,该核酸构建体能够产生遗传元件(例如,该遗传元件包含遗传元件序列和/或遗传元件区域,例如,如本文所述),例如,其中该遗传元件包含(i)与编码效应物(例如,外源性效应物或内源性效应物)的核酸序列(例如,DNA序列)可操作地连接的启动子元件和(i)结合(a)的多肽的蛋白结合序列(例如包装序列),其中该宿主细胞包括以顺式或以反式的(a)和(b)。在实施例中,(b)的遗传元件是环状单链DNA。在一些实施例中,宿主细胞是生产细胞系。
在一些实施例中,将指环载体的组分在产生时引入宿主细胞中(例如,通过瞬时转染)。在一些实施例中,宿主细胞稳定表达指环载体的组分(例如,其中将编码指环载体组分的一种或多种核酸引入宿主细胞或其祖细胞中,例如,通过稳定转染)。
在一方面,本发明的特征在于一种生产指环载体组合物的方法,该方法包括:a)提供多个本文所述的指环载体,或本文所述的指环载体的制剂;以及b)将这些指环载体或其制剂配制成例如适合施用于受试者的药物组合物。
在一方面,本发明的特征在于制备包含指环载体的宿主细胞的方法,该宿主细胞是例如第一宿主细胞或生产细胞(例如,如PCT/US19/65995的图12所示),例如第一宿主细胞群,该方法包括将能够产生遗传元件的核酸构建体(例如,如本文所述)引入宿主细胞中并在适于产生指环载体的条件下培养该宿主细胞。在实施例中,该方法进一步包括将辅助物,例如辅助病毒引入宿主细胞中。在实施例中,引入包括用指环载体对宿主细胞进行转染(例如,化学转染)或电穿孔。
在一方面,本发明的特征在于制备指环载体的方法,该方法包括提供包含指环载体(例如本文所述的指环载体)的宿主细胞,例如第一宿主细胞或生产细胞(例如,如PCT/US19/65995的图12所示),并从该宿主细胞中纯化该指环载体。在一些实施例中,该方法进一步包括,在提供步骤之前,使宿主细胞与核酸构建体或指环载体,例如本文所述的核酸构建体或指环载体进行接触,并在适于产生指环载体的条件下孵育宿主细胞。在实施例中,宿主细胞是上述制备宿主细胞的方法中描述的第一宿主细胞或生产细胞。在实施例中,从宿主细胞中纯化指环载体包括裂解宿主细胞。
在一些实施例中,该方法进一步包括使由第一宿主细胞或生产细胞产生的指环载体与第二宿主细胞进行接触的第二步骤,该第二宿主细胞是例如允许细胞(例如,如PCT/US19/65995的图12所示),例如,第二宿主细胞群。在一些实施例中,该方法进一步包括在适于产生指环载体的条件下孵育第二宿主细胞。在一些实施例中,该方法进一步包括从第二宿主细胞中纯化指环载体,例如,从而产生指环载体种子群。在实施例中,从第二宿主细胞群中产生的指环载体比从第一宿主细胞群中产生的指环载体多出至少约2-100倍。在实施例中,从第二宿主细胞中纯化指环载体包括裂解第二宿主细胞。在一些实施例中,该方法进一步包括使由第二宿主细胞产生的指环载体与第三宿主细胞进行接触的第三步骤,该第三宿主细胞是例如允许细胞(例如,如PCT/US19/65995的图12所示),例如,第三宿主细胞群。在一些实施例中,该方法进一步包括在适于产生指环载体的条件下孵育第三宿主细胞。在一些实施例中,该方法进一步包括从第三宿主细胞中纯化指环载体,例如,从而产生指环载体储备群。在实施例中,从第三宿主细胞中纯化指环载体包括裂解第三宿主细胞。在实施例中,从第三宿主细胞群中产生的指环载体比从第二宿主细胞群中产生的指环载体多出至少约2-100倍。
在一些实施例中,宿主细胞在适合促进细胞生长的培养基中生长。在某些实施例中,一旦宿主细胞已经充分生长(例如,达到适当的细胞密度),就可以将培养基更换为适于宿主细胞产生指环载体的培养基。在一些实施例中,在与第二宿主细胞接触之前,将由宿主细胞产生的指环载体从宿主细胞中分离出来(例如,通过裂解宿主细胞)。在一些实施例中,使由宿主细胞产生的指环载体与第二宿主细胞进行接触,而无需中间的纯化步骤。
在一方面,本发明的特征在于制备药物指环载体制剂(例如,要被用于本文所述的施用方法的制剂)的方法。该方法包括(a)制备如本文所述的指环载体制剂,(b)针对以下一种或多种药物质量控制参数评估该制剂(例如,药物指环载体制剂、指环载体种子群体或指环载体储备物群体):同一性、纯度、滴度、效力(例如,以每个指环载体颗粒的基因组当量)和/或例如来自指环载体所包含的遗传元件的核酸序列,和(c)配制用于评估的药物用途的制剂满足预定标准,例如,满足药物规范。在一些实施例中,评价鉴别包括评价(例如,确认)指环载体遗传元件的序列,例如,编码效应物的序列。在一些实施例中,评价纯度包括评价杂质的量,例如,支原体、内毒素、宿主细胞核酸(例如,宿主细胞DNA和/或宿主细胞RNA)、动物源性的工艺杂质(例如,血清白蛋白或胰蛋白酶)、可复制型因子(RCA),例如可复制型病毒或不必要的指环载体(例如,除了所期望的指环载体,例如本文所述合成指环载体之外的指环载体)、游离病毒衣壳蛋白、外源因子和聚集体。在一些实施例中,评价效价包括评价制剂中功能性与非功能性(例如,感染性与非感染性)指环载体的比率(例如,通过HPLC进行评价)。在一些实施例中,评价效力包括评价制剂中可检测到的指环载体功能(例如,其中编码的效应物或基因组当量的表达和/或功能)水平。
在实施例中,配制的制剂基本上不含病原体、宿主细胞污染物或杂质;具有预定水平的非感染性颗粒或预定比率的颗粒:感染单位(例如,<300:1、<200:1、<100:1或<50:1)。在一些实施例中,可以在单个批次中产生多种指环载体。在实施例中,可以评价在该批次中产生的指环载体的水平(例如,单独或一起评价)。
在一方面,本发明的特征在于宿主细胞,其包含:
(i)第一核酸分子,其包含如本文所述的核酸构建体,和
(ii)任选地,第二核酸分子,其编码选自ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2的氨基酸序列中的一种或多种,例如,如本文所述的,或与其具有至少约70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性的氨基酸序列。
在一方面,本发明的特征在于一种反应混合物,其包含本文所述的指环载体和可用于本文所述施用方法的辅助病毒,其中该辅助病毒包含编码外壳蛋白的多核苷酸(例如,能够结合外壳蛋白结合序列和任选的脂质包膜的外壳蛋白),编码复制蛋白(例如聚合酶)的多核苷酸或其任何组合。
在一些实施例中,指环载体(例如,合成指环载体)是分离出来的,例如,从宿主细胞中分离出来和/或从溶液的其他成分(例如,上清液)中分离出来。在一些实施例中,指环载体(例如,合成指环载体)是经纯化的,例如,从溶液(例如,上清液)中纯化。在一些实施例中,相对于溶液中的其他成分,指环载体在溶液中是经富集的。
在任何前述指环载体、组合物或方法的一些实施例中,提供指环载体包括从组合物中分离(例如,收获)指环载体,该组合物包含指环载体产生细胞,例如,如本文所述的。在其他实施例中,提供指环载体包括获得指环载体或其制剂,例如,从第三方获得。
在实施例中,遗传元件不能进行自我复制和/或自我扩增。在实施例中,遗传元件能够以反式进行复制和/或被扩增,例如,在辅助物存在的情况下,如在辅助病毒存在的情况下。
任何前述指环载体、组合物或方法的其他特征包括以下列举的实施例中的一个或多个。
本领域技术人员将会认识到,或者仅使用常规实验就能够确定本文所述本发明的具体实施例的许多等同形式。这样的等同形式意在由以下列举的实施例所涵盖。
列举的实施例
1.一种包含环状DNA的病毒颗粒,该环状DNA包含(i)AAV复制起点,(ii)与编码治疗性RNA或多肽的序列可操作地连接的启动子,以及(iii)结合指环病毒ORF1分子的序列,该环状DNA被包含指环病毒ORF1分子的衣壳包裹。
2.一种包含环状DNA的病毒颗粒,该环状DNA包含(i)AAV复制起点,以及(ii)与编码治疗性RNA或多肽的序列可操作地连接的启动子,其中该环状DNA被包含指环病毒ORF1分子的衣壳包裹。
3.一种载体,其包含:
a)包含指环病毒ORF1分子的蛋白质外壳;以及
b)包含非指环病毒复制起点的遗传元件;
任选地,其中该遗传元件进一步包含:(i)编码外源性效应物的核酸序列,和/或(ii)与编码该外源性效应物的该核酸序列可操作地连接的启动子元件。
4.如实施例3所述的载体,其中该非指环病毒复制起点衍生自DNA病毒,例如单链DNA(ssDNA)病毒,例如线性ssDNA病毒。
5.如实施例3或4所述的载体,其中该非指环病毒复制起点衍生自单DNA病毒,例如,称德病毒(例如,单环编码病毒门[例如,雷东多病毒、圆环病毒{例如,猪圆环病毒,例如,PCV-1或PCV-2;或者喙羽症病毒}、双生病毒{例如,番茄金花叶病毒}或矮缩病毒{例如,BBTV、MDV1、SCSVF或FBNYV}]),或者细小病毒(例如,依赖性细小病毒,例如博卡病毒或AAV)。
6.如实施例5所述的载体,其中该非指环病毒复制起点衍生自单DNA病毒,例如称德病毒,例如单环编码病毒门,例如第五病毒纲(Quintoviricetes),例如小病毒目(Piccovirales),例如细小病毒科(Parvoviridae),例如细小病毒亚科(Parvovirinae),例如依赖性细小病毒属(Dependoparvovirus),例如腺相关病毒(AAV)。
7.如实施例5所述的载体,其中该非指环病毒复制起点是AAV(例如,AAV1、AAV2或AAV5)复制起点。
8.如实施例5所述的载体,其中该非指环病毒复制起点衍生自通过滚环式复制进行复制的病毒。
9.如实施例5所述的载体,其中该非指环病毒复制起点衍生自通过滚卡复制进行复制的病毒。
10.如实施例5所述的载体,其中该非指环病毒复制起点衍生自感染动物(例如,哺乳动物,例如人)、植物、真菌或细菌的病毒。
11.如前述实施例中任一项所述的载体,其中该非指环病毒复制起点包含AAVRep-结合基序(RBM)或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。
12.如前述实施例中任一项所述的载体,其中该非指环病毒复制起点包含AAV末端解离位点(TRS),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。
13.如前述实施例中任一项所述的载体,其中该非指环病毒复制起点包含反向末端重复(ITR)。
14.如前述实施例中任一项所述的载体,其中该非指环病毒复制起点不包含指环病毒复制起点,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。
15.如前述实施例中任一项所述的载体,其中该非指环病毒复制起点基本上不通过滚环式复制进行复制(例如,不能复制)。
16.如前述实施例中任一项所述的载体,其中该非指环病毒复制起点不包含来自指环病毒基因组(例如,如本文所述)的至少10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200个核苷酸的连续序列。
17.一种遗传元件,其包含:
特异性结合指环病毒ORF1分子的蛋白结合序列(例如,5’UTR);和
AAV复制起点,例如,包含在第一AAV反向末端重复(ITR)中;
任选地,编码外源性效应物(例如,治疗性外源性效应物)的核酸序列;以及
任选地,与编码该外源性效应物的该核酸序列可操作地连接的启动子元件。
18.一种遗传元件构建体,其包含:
特异性结合指环病毒ORF1分子的蛋白结合序列(例如,5’UTR);和
AAV复制起点,例如,包含在第一AAV反向末端重复(ITR)中;
任选地,编码外源性效应物(例如,治疗性外源性效应物)的核酸序列;以及
任选地,与编码该外源性效应物的该核酸序列可操作地连接的启动子元件。
19.一种系统,其包含:
a)第一核酸,其中该第一核酸是遗传元件或遗传元件构建体,该第一核酸包含:
AAV复制起点,例如,包含在第一AAV反向末端重复(ITR)中;
任选地,编码外源性效应物(例如,治疗性外源性效应物)的核酸序列;以及
任选地,与编码该外源性效应物的该核酸序列可操作地连接的启动子元件;
b)编码指环病毒ORF1分子的第二核酸。
20.如实施例19所述的系统,其中该第一核酸进一步包含特异性结合指环病毒ORF1分子的蛋白结合序列(例如,指环病毒的5’UTR或GC富集区)。
21.如实施例19或20所述的系统,其进一步包含编码指环病毒ORF2分子的核酸序列。
22.如实施例21所述的系统,其中该编码指环病毒ORF2分子的核酸序列位于第三核酸上。
23.如实施例19-22中任一项所述的系统,其进一步包含编码AAV Rep2分子(例如,AAV Rep2多肽,例如,AAV Rep2蛋白)的核酸序列。
24.如实施例23所述的系统,其中该编码AAV REP2分子的核酸序列位于第四核酸上。
25.如实施例19-24中任一项所述的系统,其进一步包含编码腺病毒E2A分子、腺病毒E4分子和腺病毒VARNA分子中的一种或多种(例如,全部)的一种或多种核酸序列。
26.如实施例25所述的系统,其中该编码腺病毒E2A分子、腺病毒E4分子和腺病毒VARNA分子的核酸序列位于第五核酸上。
27.如实施例19-26中任一项所述的系统,其中该第一、第二、第三、第四和第五核酸中的一个或多个(例如,全部)是质粒。
28.如实施例19-27中任一项所述的系统,其中该核酸是混合的或在分开的体积中。
29.如实施例19-28中任一项所述的系统,其中该核酸在细胞,例如人细胞,例如293细胞或MOLT4细胞中。
30.一种DNA酶保护的蛋白质复合物,其包含:
a)包含指环病毒ORF1分子的蛋白质外壳;以及
b)包含AAV复制起点(例如,包含在第一AAV反向末端重复(ITR)中)的遗传元件;
任选地,其中该遗传元件进一步包含:(i)编码外源性效应物的核酸序列,和/或(ii)与编码该外源性效应物的该核酸序列可操作地连接的启动子元件。
31.如实施例30所述的DNA酶保护的蛋白质复合物,其中:
该遗传元件基本上不含指环病毒序列,
该遗传元件不包含超过100个与野生型指环病毒基因组的任何100个核苷酸序列具有超过50%的同一性的核苷酸,或
该遗传元件不包含指环病毒5’UTR。
32.一种DNA酶保护的蛋白质复合物,其包含:
a)包含指环病毒ORF1分子的蛋白质外壳;以及
b)遗传元件;
其中:
该遗传元件基本上不含指环病毒序列,
该遗传元件不包含超过10、20、30、40、50、60、70、80、90或100个与野生型指环病毒基因组的相同长度的任何序列具有超过50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的连续核苷酸,和/或
该遗传元件不包含指环病毒5’UTR;
任选地,其中该遗传元件进一步包含:(i)编码外源性效应物的核酸序列,和/或(ii)与编码该外源性效应物的该核酸序列可操作地连接的启动子元件。
33.如实施例32所述的DNA酶保护的蛋白质复合物,其中该遗传元件进一步包含(iii)第一ITR,例如第一AAV ITR。
34.一种混合物,其包含:
指环病毒ORF1分子,和
包含AAV复制起点(例如,包含在第一AAV反向末端重复(ITR)中)的核酸。
35.一种混合物,其包含:
指环病毒ORF1分子,和
核酸(例如,遗传元件);
其中:
该核酸基本上不含指环病毒序列,
该核酸不包含超过100个与野生型指环病毒基因组的任何100个核苷酸序列具有超过50%的同一性的核苷酸,或
该核酸不包含指环病毒5’UTR;
36.如实施例34或35所述的混合物,其中该指环病毒ORF1分子与包含第一AAV ITR的核酸结合。
37.如实施例34-36中任一项所述的混合物,其中包含第一AAV复制起点的核酸是遗传元件,例如根据前述实施例中任一项所述的遗传元件。
38.一种复合物,其包含:
前述实施例中任一项所述的遗传元件,和
与该遗传元件结合的衣壳蛋白(例如ORF1分子)。
39.如实施例34-38中任一项所述的混合物或复合物,其在无细胞系统或基本上无细胞的组合物中。
40.如实施例38或39所述的复合物,其中该复合物在细胞(例如,宿主细胞,例如辅助细胞)中。
41.一种细胞,其包含如前述实施例中任一项所述的遗传元件或遗传元件构建体。
42.如实施例41所述的细胞,其是人细胞,例如293细胞、Expi293细胞、Expi293F细胞或MOLT-4细胞。
43.一种将外源性效应物递送至靶细胞(例如脊椎动物细胞,例如哺乳动物细胞,例如人细胞)的方法,该方法包括将如前述实施例中任一项所述的载体引入该细胞中。
44.一种在有需要的受试者中调节生物活性的方法,该方法包括向该受试者中引入如前述实施例中任一项所述的载体。
45.一种在有需要的受试者中治疗或预防疾病或障碍的方法,该方法包括向该受试者中引入如前述实施例中任一项所述的载体。
46.一种对有需要的受试者接种疫苗的方法,该方法包括向该受试者中引入如前述实施例中任一项所述的载体,其中该外源性效应物包含来自感染原(例如,病毒或细菌)的抗原。
47.如实施例43-46中任一项所述的方法,其中该靶细胞是人细胞,例如,293细胞、Expi293细胞、Expi293F细胞或MOLT-4细胞。
48.如实施例43-46中任一项所述的方法,其中该靶细胞是来自动物(例如农业动物,例如牛、绵羊、猪、山羊、马、野牛或骆驼)的细胞。
49.如实施例48所述的方法,其中该动物是鸟类动物(例如,火鸡、鸡、鹌鹑、鸸鹋或鸵鸟)。
50.如实施例43-49中任一项所述的方法,其中该靶细胞是在体内或体外。
51.如实施例43-50中任一项所述的方法,其中该载体在体外、离体或体内与细胞接触。
52.如前述实施例中任一项所述的载体,其中该遗传元件基本上被保护免受DNA酶I的酶切。
53.如前述实施例中任一项所述的载体,其中如果该外源性效应物用mKate替代,则该载体可在体外将mKate递送至多个靶细胞(例如,MOLT4细胞)中,导致至少约10%、20%、30%、40%、50%或60%的与该载体接触的细胞具有高于背景水平的荧光,其中该背景水平是与缺乏ORF1的其它类似载体接触的所有细胞中荧光最强的1%、2%、3%、4%、5%、6%、7%、8%、9%或10%的细胞的水平,例如,在实例5的流式细胞术测定中。
54.如前述实施例中任一项所述的载体,其中如果该外源性效应物用纳米荧光素酶替代,则该载体可在体外将纳米荧光素酶递送至多个靶细胞(例如,Vero细胞或MCF7细胞)中,导致与该载体接触的细胞群显示出至少约2、3、4、5、6、7、8、9、10或15倍背景水平的发光,其中该背景水平是未与该载体接触的其他类似细胞的发光,例如,在实例4或8的发光测定中。
55.如前述实施例中任一项所述的载体,其以约1.2-1.4g/ml的密度沉积在CsCl梯度上,例如根据实例5。
56.一种制备载体的方法,该方法包括:
(a)提供包含如前述实施例中任一项所述的遗传元件的宿主细胞,以及
(b)在适合将该遗传元件包封在蛋白质外壳(例如,包含指环病毒ORF1分子的蛋白质外壳)的条件下孵育该宿主细胞,
从而制备该载体。
57.一种制备载体的方法,该方法包括:
(a)提供包含如前述实施例中任一项所述的系统的宿主细胞,以及
(b)在适合将该遗传元件包封在蛋白质外壳(例如,包含指环病毒ORF1分子的蛋白质外壳)的条件下孵育该宿主细胞,
从而制备该载体。
58.如实施例56或57所述的方法,其包括宿主细胞的裂解。
59.如实施例56-58中任一项所述的方法,其包括从该宿主细胞的上清液收获该载体。
60.如实施例56-59中任一项所述的方法,其该宿主细胞进一步包含编码指环病毒ORF2分子、AAV REP2分子、腺病毒E2A分子、腺病毒E4分子和腺病毒VARNA分子中的一种或多种(例如,全部)的一种或多种另外的核酸。
61.一种制备治疗性组合物的方法,该方法包括:
(a)提供一种或多种包含外源性DNA的宿主细胞,该外源性DNA包含:
(i)AAV复制起点,
(ii)与编码治疗性效应物(例如,治疗性RNA或多肽)的序列可操作地连接的启动子,
(iii)任选地编码指环病毒ORF1分子的序列,
(iv)任选地编码指环病毒ORF2分子的序列,
(v)任选地编码Rep蛋白(例如,AAV Rep蛋白,例如AAV Rep2蛋白)的序列,以及
(vi)任选地编码一种或多种辅助蛋白例如腺病毒辅助蛋白,例如E2A分子、腺病毒E4分子和/或腺病毒VARNA分子的序列;
(b)在适合于形成载体(例如,指环载体,例如病毒颗粒)的条件下培养该一种或多种宿主细胞,该载体包含蛋白质外壳(例如,衣壳),该蛋白质外壳包含足够数量的ORF1分子以包封(例如,包裹)遗传元件,该遗传元件包含与编码治疗性效应物的序列可操作地连接的启动子;任选地,其中遗传元件是环状的或线性的;
(c)从细胞培养物中富集,例如纯化步骤(b)中产生的载体,
从而制备治疗性组合物。
62.如实施例61所述的方法,该方法进一步包括:
(d)评价纯化的病毒颗粒的一种或多种选自以下的杂质:内毒素、支原体、宿主细胞核酸(例如,宿主细胞DNA和/或宿主细胞RNA)、动物衍生的加工杂质(例如,血清白蛋白或胰蛋白酶)、可复制型颗粒、游离病毒衣壳蛋白、外源因子和聚集体;
(e)如果在步骤(d)中检测到,则任选地从这些病毒颗粒中减少或去除该一种或多种杂质;以及
(f)任选地配制用于施用于人的纯化病毒颗粒,从而制备治疗性组合物。
63.如实施例61或62所述的方法,其中(a)(i)-(vi)所述的外源性DNA在一种宿主细胞中提供。
64.如实施例61-63中任一项所述的方法,其中(a)(i)-(vi)所述的外源性DNA在多种宿主细胞中提供。
65.如实施例61-64中任一项所述的方法,其中(a)(i)和(ii)所述的外源性DNA在一种宿主细胞中提供,并且(a)(iii)-(vi)所述的外源性DNA在第二宿主细胞中提供。
66.如实施例61-65中任一项所述的方法,其中(a)(i)-(ii)所述的外源性DNA不是宿主细胞染色体的一部分。
67.如实施例61-66中任一项所述的方法,其中(a)(i)-(ii)所述的外源性DNA是相同核酸的一部分,例如环状DNA或线性DNA。
68.如实施例61-67中任一项所述的方法,其中(a)(i)-(ii)所述的外源性DNA是根据前述实施例中任一项所述的遗传元件。
69.如实施例61-68中任一项所述的方法,其中将(a)(iii)所述的一种或多种外源性DNA整合到宿主细胞染色体中。
70.如实施例61-69中任一项所述的方法,其中(a)(iv)-(vi)中任一项所述的一种或多种外源性DNA,如果存在,则被整合到宿主细胞染色体中。
71.如实施例61-70中任一项所述的方法,其中(a)(iii)所述的一种或多种外源性DNA是质粒的一部分。
72.如实施例61-71中任一项所述的方法,其中(a)(iv)-(vi)中任一项所述的一种或多种外源性DNA,如果存在,则是质粒的一部分。
73.如实施例61-72中任一项所述的方法,其中该宿主细胞是哺乳动物细胞(例如,人细胞,例如HEK293细胞)。
74.如实施例61-73中任一项所述的方法,其中该宿主细胞是永生化细胞。
75.一种制备治疗性组合物的方法,该方法包括:
(a)提供包含以下的溶液:
(i)包含AAV复制起点和启动子的遗传元件,该启动子与编码治疗性效应物(例如,治疗性RNA或多肽)的序列可操作地连接,以及
(ii)多个ORF1分子(例如,同一ORF1分子的多个拷贝);
(b)在适于形成包含蛋白质外壳(例如,衣壳)的载体(例如,指环载体,例如病毒颗粒)的条件下孵育该溶液,该蛋白质外壳包含足够数量的ORF1分子以包封(例如,包裹)遗传元件;以及
(c)任选地从该溶液中富集,例如纯化步骤(b)中产生的载体,从而制备治疗性组合物。
76.如实施例75所述的方法,其中该遗传元件使用以下制备:
(iii)任选地编码指环病毒ORF1分子的序列,
(iv)任选地编码指环病毒ORF2分子的序列,
(v)任选地编码AAV REP2序列的序列
(vi)任选地编码一种或多种辅助蛋白例如腺病毒辅助蛋白,例如E2A分子、腺病毒E4分子和/或腺病毒VARNA分子的序列。
77.如实施例61-76中任一项所述的方法,其中步骤(b)中产生的载体是前述实施例中任一项所述的载体。
78.一种宿主细胞(例如脊椎动物细胞,例如哺乳动物细胞,例如人细胞),其包含如前述实施例中任一项所述的遗传元件或遗传元件构建体。
79.如实施例78所述的宿主细胞,其进一步包含指环病毒ORF1分子或编码该指环病毒ORF1分子的核酸。
80.如实施例78或79所述的宿主细胞,其进一步包含指环病毒ORF2分子、AAV REP2分子、腺病毒E2A分子、腺病毒E4分子和腺病毒VARNA分子中的一种或多种(例如,全部)。
81.如实施例78-80中任一项所述的宿主细胞,其进一步包含编码指环病毒ORF2分子、AAV REP2分子、腺病毒E2A分子、腺病毒E4分子和腺病毒VARNA分子中的一种或多种(例如,全部)的一种或多种核酸。
82.一种宿主细胞,其包含如前述实施例中任一项所述的载体。
83.一种制备如实施例78-82中任一项所述的宿主细胞的方法,该方法包括将遗传元件引入细胞中,例如,其中引入该遗传元件包括在允许产生该遗传元件的条件下将遗传元件构建体引入该细胞中。
84.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件进一步包含第二AAV复制起点,例如,包含在第二AAV反向末端重复(ITR)中。
85.如实施例84所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该第二ITR与该第一ITR具有相反取向。
86.如实施例84所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该第二ITR相对于该第一ITR具有相同取向。
87.如实施例84-86中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该第二ITR具有与该第一ITR相同的序列。
88.如实施例84-86中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该第二ITR相对于该第一ITR具有一个或多个序列差异。
89.如实施例84-88中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中编码该外源性效应物的核酸序列位于该第一ITR和该第二ITR之间。
90.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该第一AAV ITR包含SEQ ID NO:1051-1059中任一个的序列,或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。
91.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件是线性的。
92.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件是环状的。
93.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件构建体是环状的。
94.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件构建体是线性的。
95.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件具有约500-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-3500、3500-4000、4000-4100、4100-4200、4200-4300、4300-4400、4400-4500、4500-4600、4600-4700、4700-4800、4800-4900、4900-5000、5000-5500、5500-6000或6000-7000个核苷酸长度。
96.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件具有至少500、1000、1500、2000、2500、3000、3500、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500或6000个核苷酸长度。
97.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件包含DNA。
98.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件由DNA组成。
99.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件由至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的DNA组成。
100.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件是单链DNA或双链DNA。
101.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件构建体是单链DNA或双链DNA。
102.如前述实施例中任一项所述的遗传元件,其使用环化的双链DNA产生,例如,其中该环化的DNA通过体外环化产生。
103.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该启动子元件对于指环病毒而言是内源的。
104.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该启动子元件对于AAV而言是内源的。
105.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该启动子元件对于指环病毒而言是外源的。
106.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该启动子元件对于AAV而言是外源的。
107.如前述实施例中任一项所述的遗传元件构建体,其包含适于该遗传元件构建体复制(例如,适于在细菌细胞中复制)的骨架区。
108.如前述实施例中任一项所述的遗传元件构建体,其中该骨架区包含复制起点和选择性标志之一或二者。
109.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件进一步包含指环病毒5’UTR、指环病毒GC富集区和指环病毒3’UTR或其任意组合。
110.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件进一步包含表A1、B1、B3、C1、E1、F1、F3或F5中任一项所述的指环病毒5’UTR。
111.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件进一步包含表A1、B1、B3、C1、E1、F1、F3或F5中任一项所述的指环病毒GC富集区。
112.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中该遗传元件进一步包含表A1、B1、B3、C1、E1、F1、F3或F5中任一项所述的指环病毒3’UTR。
113.如前述实施例中任一项所述的遗传元件、遗传元件构建体、系统、细胞、方法或载体,其中编码外源性效应物的核酸序列为约20-50、50-100、100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900或900-1,000个核苷酸长度。
114.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中该效应物包含miRNA。
115.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中该效应物例如miRNA靶向宿主基因,例如调节该基因的表达,例如增加或减少该基因的表达。
116.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中该效应物包含miRNA,并且减少宿主基因的表达。
117.如前述实施例中任一项所述的遗传元件、核酸构建体、CA载体、复合物、方法或宿主细胞,其中该效应物包含长度为约20-200、30-180、40-160、50-140或60-120个核苷酸的核酸序列。
118.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中编码该效应物的核酸序列的长度为约20-200、30-180、40-160、50-140或60-120个核苷酸。
119.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中编码该效应物的序列大小为至少约100个核苷酸。
120.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中编码该效应物的序列的大小为约100至约5000个核苷酸。
121.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中编码该效应物的序列的大小为约100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-1500或1500-2000个核苷酸。
122.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中该遗传元件是DNA。
123.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中该载体是复制缺陷型的。
124.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中:
(i)该遗传元件基本上不含指环病毒序列,
(ii)该遗传元件不包含超过10、20、30、40、50、60、70、80、90或100个与野生型指环病毒基因组的相同长度的任何序列具有超过50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%同一性的连续核苷酸,和/或
(iii)该遗传元件不包含指环病毒5’UTR;
125.如前述实施例中任一项所述的遗传元件、遗传元件构建体、载体、混合物、复合物、方法或宿主细胞,其中该载体是病毒颗粒。
126.一种药物组合物,其包括如前述实施例中任一项所述的载体,以及药学上可接受的载剂和/或赋形剂。
根据说明书和附图并且根据权利要求,本发明的其他特征、目的和优点将是显而易见的。
除非另外定义,否则本文所用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同含义。本文提及的所有出版物、专利申请、专利和其他参考文献均通过引用以其全文并入。另外,材料、方法和实例仅是说明性的,而并非意在进行限制。
附图说明
图1是展示N-末端3xFlag标记的指环病毒ORF1蛋白表达的免疫印迹。上图,甲型细环病毒Ring1 ORF1(91kda)。中间图,乙型细环病毒Ring2 ORF1(79kda)。下图,丙型细环病毒Ring4 ORF1(82kda)。
图2中一系列图展示通过无Cap的AAV-Rep表达构建体复制ITR侧翼的有效载荷。描述的是针对hrGFP和pHelper探测的DNA印迹。泳道1-3包含未转染的对照DNA,泳道4-6包含来自用不同Rep构建体转染的细胞的总DNA。箭头指示pHelper质粒、pITR-hrGFP质粒和复制的ITR-hrGFP DNA的条带位置。
图3A-3B中一系列图显示来自CsCl线性梯度的涵盖nLuc转基因的R2指环载体的纯化。载体通过qPCR针对nLuc报告基因进行定量。(A)载体是通过反式表达指环病毒ORF1、ORF2蛋白和含有nLuc转基因的颗粒二者产生的。(B)当指环病毒ORF1和ORF2不反式表达时,nLuc转基因的定量。
图4是显示用R2-nLuc指环载体转导非人灵长类动物细胞的图。将Vero细胞以每孔1e5个细胞接种于24孔板中。通过添加MOI为0.4(基于qPCR滴度)的载体进行转导。2天后进行荧光素酶测定。
图5是显示用R2-nLuc指环载体转导人细胞的图。将IGR-OV1细胞以每孔1e5个细胞接种于24孔板中。通过添加MOI为0.4(基于qPCR滴度)的载体进行转导。2天后进行荧光素酶测定。
图6中一系列图显示指环病毒/AAV载体的产生和在MOLT4细胞中的成功转导。上小图显示了产生改变Expi-293细胞中mKate有效载荷的指环病毒/AAV杂合载体和将载体转导到MOLT4细胞中,随后进行mKate荧光的流式细胞术分析的示例性工作流程。左下小图显示了包含ORF1蛋白衣壳的指环病毒/AAV杂合载体的图,该ORF1蛋白衣壳包封包含位于反向末端重复(ITR)侧翼的编码mKate的基因的遗传元件。右下小图显示了使用所示质粒产生的载体转导的MOLT4细胞的流式细胞术分析的结果。
图7A-7B中一系列图显示通过AAV Rep蛋白的工程化的Ring2指环病毒DNA复制。(A)显示并入了AAV复制所需最小区域(包括Rep结合基序(RBM)和末端解离位点(TRS))的Ring2 dsDNA基因组的图。(B)显示来自DNA样品的线性质粒和Dpn1酶切产物的DNA印迹,该DNA样品获自用AAV-Rep质粒和WT Ring2基因组或Ring2+RBM/TRSDNA的所示组合转染的Expi-293细胞(如图7A中所示)。
图8A-8B中一系列图显示通过指环载体(编码有效载荷人生长激素(hGH))转导哺乳动物细胞系。(A)将IGR-OV1细胞用AAV Rep载体、pHelper载体和下列之一转染:(i)编码hGH的Ring2衣壳指环载体,(ii)编码hGH的Ring9衣壳指环载体,(iii)编码hGH的AAV2衣壳病毒载体(阳性对照),或者(iv)无衣壳阴性对照。在第0天、第2天和第3天通过ELISA对hGH水平进行定量。(A)将Vero细胞用AAV Rep载体、pHelper载体和下列之一转染:(i)编码hGH的Ring2衣壳指环载体,(ii)编码hGH的Ring9衣壳指环载体,(iii)编码hGH的AAV2衣壳病毒载体(阳性对照),或者(iv)无衣壳阴性对照。在第0天、第2天和第3天通过ELISA对hGH水平进行定量。
图9是显示来自用在AAV Rep存在或不存在(分别为+AAV Rep或-AAV Rep)的情况下产生的Ring2-AAV ITR-nLuc指环载体转染的293F细胞的细胞裂解物中的纳米荧光素酶发光的图。
图10A-10L中一系列图显示示例性遗传元件构建体示意图,该遗传元件构建体可用于产生如本文所述的指环载体的遗传元件。单独的示意图对应于下表61中所示的质粒。黑色=Ring2基因组序列(例如,如本文所述);绿色=外源性效应物序列;蓝色=AAV复制起点。
当结合附图阅读时,将会更好地理解以下对本发明实施例的详细描述。出于说明本发明的目的,在附图中示出了现在举例说明的实施例。然而,应该理解的是,本发明不限于附图中所示实施例的精确布置及手段。本专利或申请文件包含至少一个彩色附图。应请求并且支付必要的费用后,具有彩色附图的本专利或专利申请公开的副本将由专利局提供。
具体实施方式
定义
本发明将针对特定实施例并参考某些附图进行描述,但是本发明不限于此,而是仅由权利要求来限定。除非另有说明,否则通常应以其通常意义来理解下文中所阐述的术语。
在本说明书和权利要求书中使用术语“包含”时,它并不排除其他要素。出于本发明的目的,术语“由......组成”被认为是术语“包含......”的优选实施例。如果在下文中将组定义为包含至少一定数量的实施例,则这应理解为优选地还披露了仅由这些实施例组成的组。
当提及单数名词时,如果使用了不定冠词或定冠词,例如“一种/一个(a)”、“一种/一个(an)”或“该(the)”,这包括该名词的复数,除非另有明确说明。
词语“用于治疗、调节等的化合物、组合物、产物等”应理解为是指本身适合于所指定的治疗、调节等目的的化合物、组合物、产物等。词语“用于治疗、调节等的化合物、组合物、产物等”另外作为实施例披露了这样的化合物、组合物、产物等用于治疗、调节等。
词语“用于......的化合物、组合物、产物等”、“化合物、组合物、产物等在生产用于......的药物、药物组合物、兽用组合物、诊断组合物等中的用途”或“用作药物......的化合物、组合物、产物等”表示这些化合物、组合物、产物等将用于可在人体或动物体上实施的治疗方法中。它们被认为是关于治疗方法等的实施例和权利要求的等同披露。因此,如果实施例或权利要求是指“用于治疗疑似患有某种疾病的人或动物的化合物”,则这也被认为是披露了“化合物在生产用于治疗疑似患有某种疾病的人或动物的药物中的用途”或“通过向疑似患有某种疾病的人或动物施用化合物的治疗方法”。词语“用于治疗、调节等的化合物、组合物、产物等”应理解为是指本身适合于所指定的治疗、调节等目的的化合物、组合物、产物等。
如果在下文的括号中提供了术语、值、数量等的实例,则这应理解为表示在括号中提及的实例可以构成实施例。例如,如果指出“在实施例中,核酸分子包含与表1的指环病毒ORF1编码核苷酸序列(例如,表1的核酸序列中571-2613位核苷酸)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列”,则一些实施例涉及包含与表1的核酸序列的571-2613位核苷酸具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列的核酸分子。
如本文所用的术语“扩增”,指的是核酸分子或其部分的复制,以产生一个或多个另外拷贝的该核酸分子或其部分(例如,遗传元件或遗传元件区)。在一些实施例中,扩增导致核酸序列的部分复制。在一些实施例中,扩增经由滚环式复制进行。
如本文所用的,术语“指环载体”指的是包含遗传元件,例如包封在蛋白质外壳中的环状DNA的媒介物,例如,该遗传元件基本上受到蛋白质外壳保护,使其免受DNA酶I的酶切。如本文所用的“合成指环载体”通常指的是非天然存在的指环载体,例如,其具有与野生型病毒(例如,如本文所述的野生型指环病毒)不同的序列。在一些实施例中,合成指环载体是工程化的或重组的,例如,其包含遗传元件,该遗传元件包含相对于野生型病毒基因组(例如,如本文所述的野生型指环病毒基因组)的差异或修饰。在一些实施例中,包封在蛋白质外壳内涵盖100%的蛋白质外壳覆盖率,以及小于100%的覆盖,例如95%、90%、85%、80%、70%、60%、50%或更少。例如,蛋白质外壳可能存在缺口或间断(例如,这使得蛋白质外壳对水、离子、肽或小分子具有可渗透性),只要遗传元件保留在蛋白质外壳中或免受DNA酶I的酶切,例如,在进入宿主细胞之前。在一些实施例中,将指环载体纯化,例如,将其从其原始来源中分离和/或基本上不含(>50%、>60%、>70%、>80%、>90%)其他组分。在一些实施例中,指环载体能够将遗传元件引入靶细胞中(例如,经由感染)。在一些实施例中,指环载体是感染性合成指环病毒病毒颗粒。
如本文所用的,术语“抗体分子”是指包含至少一个免疫球蛋白可变结构域序列的蛋白质,例如免疫球蛋白链或其片段。术语“抗体分子”涵盖全长抗体和抗体片段(例如,scFv)。在一些实施例中,抗体分子是多特异性抗体分子,例如,该抗体分子包含多个免疫球蛋白可变结构域序列,其中该多个中第一免疫球蛋白可变结构域序列对第一表位具有结合特异性,而该多个中第二免疫球蛋白可变结构域序列对第二表位具有结合特异性。在实施例中,多特异性抗体分子是双特异性抗体分子。双特异性抗体分子的特征通常在于对第一表位具有结合特异性的第一免疫球蛋白可变结构域序列和对第二表位具有结合特异性的第二免疫球蛋白可变结构域序列。
如本文所用的,“编码……”的核酸是指编码氨基酸序列或者多核苷酸例如mRNA或功能性多核苷酸(例如非编码RNA,例如siRNA或miRNA)的核酸序列。
如本文所用的“外源性”作用剂(例如,效应物、核酸(例如,RNA)、基因、有效载荷、蛋白质)是指不由相应的野生型病毒,例如,如本文所述的指环病毒包含或编码的作用剂。在一些实施例中,外源性作用剂不是天然存在的,例如具有相对于天然存在的蛋白质或核酸而言发生改变(例如,通过插入、缺失或置换)的序列的蛋白质或核酸。在一些实施例中,外源性作用剂不天然存在于宿主细胞中。在一些实施例中,外源性作用剂天然存在于宿主细胞中,但是对于病毒而言是外源的。在一些实施例中,外源性作用剂天然存在于宿主细胞中,但是不以期望的水平或在期望的时间存在。
如本文中针对另一种作用剂或元件(例如,效应物、核酸序列、氨基酸序列)所用的“异源”作用剂或元件(例如,效应物、核酸序列、氨基酸序列),指的是并非天然存在于一起的作用剂或元件,例如,在野生型病毒,如指环病毒中。在一些实施例中,异源核酸序列可以与天然存在的核酸序列(例如,天然存在于指环病毒中的序列)存在于同一核酸中。在一些实施例中,相对于指环载体的其他(例如,其余的)元件所基于的指环病毒而言,异源作用剂或元件是外源性的。
如本文所用的,术语“遗传元件”指的是核酸分子,其包封在或可以包封在蛋白质外壳内(例如,蛋白质外壳保护其免受DNA酶I的酶切),例如,以形成如本文所述的指环载体。应当理解的是,遗传元件可以作为裸DNA产生,并且任选地进一步组装到蛋白质外壳中。还应理解的是,指环载体可将其遗传元件插入细胞中,其结果是遗传元件存在于细胞中,而蛋白质外壳不一定进入细胞。
如本文所用的,“遗传元件构建体”指的是包含至少一个(例如,两个)遗传元件序列或其片段的核酸构建体(例如,质粒、杆粒、粘粒或微环)。在一些实施例中,遗传元件构建体包含至少一个全长遗传元件序列。在一些实施例中,遗传元件包括全长遗传元件序列和部分遗传元件序列。在一些实施例中,遗传元件包含两个或更多个部分遗传元件序列(例如,按照5’至3’的顺序,5’-截短型遗传元件序列与3’-截短型遗传元件序列串联排列,例如,如图27C所示)。
如本文所用的术语“遗传元件区域”指的是包含遗传元件序列的构建体区域。在一些实施例中,遗传元件区域包含与野生型指环病毒序列或其片段具有足够同一性的序列,由蛋白质外壳包封,从而形成指环载体(例如,与野生型指环病毒序列或其片段具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列)。在实施例中,遗传元件区包含蛋白结合序列,例如,如本文所述的(例如,如本文所述的5’UTR、3’UTR和/或GC富集区,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列)。在一些实施例中,遗传元件区可以进行滚环式复制。在一些实施例中,遗传元件包含Rep蛋白结合位点。在一些实施例中,遗传元件包含Rep蛋白移位位点。在一些实施例中,包含遗传元件区域的构建体没有包封在蛋白质外壳中,但是由构建体产生的遗传元件可以包封在蛋白质外壳中。在一些实施例中,包含遗传元件区的构建体进一步包含载体主链。
如本文所用的,术语“反向末端重复”(“ITR”)是指核酸序列,其包含适于由病毒Rep分子(例如,非指环病毒Rep分子,例如,AAV Rep蛋白)或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%、或100%的序列同一性的多肽复制周围核酸序列(或其一部分)的复制起点。通常,ITR(或衍生出ITR的病毒序列)包含连续的核苷酸序列,随后(例如,与约1、2、3、4、5、10、15、20、25、30、40、50、60、70、80、90或100个核苷酸直接相邻或由其隔开)是其反向互补。在一些情况下,ITR的拷贝可包含在单链病毒基因组(例如,非指环病毒的基因组,例如,如本文所述,例如,AAV)的基因组的一个或两个末端。ITR序列可能够形成发夹。ITR可包含Rep-结合基序(RBM)和/或末端解离位点(TRS),例如,如本文所述。在一些情况下,ITR序列存在于指环载体的遗传元件中,例如,如本文所述。在一些情况下,存在于指环载体的遗传元件中的ITR可位于遗传元件的末端(例如,5’末端或3’末端)。在一些情况下,存在于指环载体的遗传元件中的ITR可不位于遗传元件的末端(例如,5’末端或3’末端),例如,可在其5’和3’端的核酸序列侧翼(例如,在环状遗传元件或线性遗传元件中)。
如本文所用的,当用于基因组(例如,指环病毒基因组)或其片段时,术语“突变体”指的是相对于相应的野生型指环病毒序列具有至少一处变化的序列。在一些实施例中,相对于相应的野生型指环病毒序列,突变体基因组或其片段包含至少一个单核苷酸多态性、添加、缺失或移码。在一些实施例中,相对于相应的野生型指环病毒序列,突变体基因组或其片段包含至少一种指环病毒ORF(例如,ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2中一种或多种)的缺失。在一些实施例中,相对于相应的野生型指环病毒序列,突变体基因组或其片段包含所有指环病毒ORF(例如,所有ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和ORF1/2)的缺失。在一些实施例中,相对于相应的野生型指环病毒序列,突变体基因组或其片段包含至少一种指环病毒非编码区(例如,5’UTR、3’UTR和/或GC富集区中一种或多种)的缺失。在一些实施例中,突变体基因组或其片段包含或者编码外源性效应物。
如本文所用的,术语“非指环病毒”序列是指来自没有分类在指环病毒科的病毒的序列。非指环病毒序列通常:(i)不包含与分类在指环病毒科的病毒(例如,甲型细环病毒、乙型细环病毒或丙型细环病毒,例如,如本文所述)的基因组、基因或非编码功能元件(例如,复制起点)相同的核酸序列;和/或不编码一种或多种来自未被分类在指环病毒科的病毒的蛋白质(例如,衣壳蛋白或Rep蛋白)。在一些情况下,非指环病毒序列与分类在指环病毒科的任何病毒(例如,甲型细环病毒、乙型细环病毒或丙型细环病毒,例如,如本文所述)的基因组、基因或非编码功能元件(例如,复制起点)具有不超过30%、40%、50%、60%、70%、75%、80%、85%或90%的序列同一性。在一些实施例中,非指环病毒序列是来自未分类在指环病毒科中的病毒的野生型序列。在其他实施例中,来自未被分类在指环病毒科的病毒的非指环病毒序列包含来自病毒基因组的一个或多个非天然存在的突变。在一些情况下,非指环病毒序列来自感染非人生物体(例如,非人灵长类动物、非人哺乳动物或鸟类)的病毒。在一些情况下,非指环病毒序列来自感染人的病毒。在一些情况下,非指环病毒序列来自选自由以下组成的组的病毒:单DNA病毒,例如,称德病毒(例如,单环编码病毒门[例如,雷东多病毒、圆环病毒{例如,猪圆环病毒,例如,PCV-1或PCV-2;或者喙羽症病毒}、双生病毒{例如,番茄金花叶病毒}或矮缩病毒{例如,BBTV、MDV1、SCSVF或FBNYV}]),以及细小病毒(例如,依赖性细小病毒,例如,博卡病毒或AAV)。
术语“ORF分子”是指具有指环病毒ORF蛋白(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2蛋白)或其功能性片段的活性和/或结构特征的多肽。当一般使用(即,“ORF分子”)时,多肽可以包含本文所述的任何指环病毒ORF(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2)或其功能性片段的活性和/或结构特征。当与修饰词一起使用以说明特定的开放阅读框(例如,“ORF1分子”、“ORF2分子”、“ORF2/2分子”、“ORF2/3分子”、“ORF1/1分子”或“ORF1/2分子”)时,通常表示多肽包含相应的指环病毒ORF蛋白或其功能性片段(例如,如下文针对“ORF1分子”所定义)的活性和/或结构特征。例如,“ORF2分子”包含指环病毒ORF2蛋白或其功能性片段的活性和/或结构特征。
如本文所用的,术语“ORF1分子”是指具有指环病毒ORF1蛋白(例如,如本文所述的指环病毒ORF1蛋白或其功能性片段)的活性和/或结构特征的多肽。在一些情况下,ORF1分子可包含以下中的一种或多种(例如,1、2、3或4种):包含至少60%碱性残基(例如,至少60%精氨酸残基)的第一区域、包含至少约六个β链(例如,至少4、5、6、7、8、9、10、11或12个β链)的第二区域、包含指环病毒N22结构域(例如,如本文所述的,例如来自如本文所述的指环病毒ORF1蛋白的N22结构域)的结构或活性的第三区域和/或包含指环病毒C-末端结构域(CTD)(例如,如本文所述的,例如来自如本文所述的指环病毒ORF1蛋白的CTD)的结构或活性的第四区域。在一些情况下,ORF1分子按照从N-末端到C-末端的顺序包含该第一、第二、第三和第四区域。在一些情况下,指环载体包含ORF1分子,该分子按照从N-末端到C-末端的顺序包含该第一、第二、第三和第四区域。在一些情况下,ORF1分子可以包含由指环病毒ORF1核酸编码的多肽。在一些情况下,ORF1分子可进一步包含异源序列,例如高变区(HVR),例如来自指环病毒ORF1蛋白的HVR,例如,如本文所述的。如本文所用的“指环病毒ORF1蛋白”指的是由指环病毒基因组(例如,野生型指环病毒基因组,例如,如本文所述)编码的ORF1蛋白。
如本文所用的,术语“ORF2分子”指的是具有指环病毒ORF2蛋白(例如,如本文所述的指环病毒ORF2蛋白)的活性和/或结构特征的多肽或其功能性片段。如本文所用的“指环病毒ORF2蛋白”指的是由指环病毒基因组(例如,野生型指环病毒基因组,例如,如本文所述)编码的ORF2蛋白。
如本文所用的“复制起点”是指包含以下序列的核酸序列,该序列在Rep分子(例如,病毒Rep蛋白,例如,非指环病毒Rep蛋白,例如,AAV Rep蛋白,例如,如本文所述)存在下促进DNA复制。在一些情况下,在Rep分子存在下,位于核酸分子(例如,如本文所述的遗传元件)内的复制起点比缺乏复制起点的其它类似核酸分子更大程度地促进遗传元件或其部分的复制。在一些情况下,复制起点包含在反向末端重复(ITR)序列中,例如,非指环病毒基因组(例如,AAV基因组,例如,如本文所述)的反向末端重复序列中。在一些情况下,复制起点包含Rep-结合基序(RBM)和/或末端解离位点(TRS)(例如,来自非指环病毒(例如,AAV),例如,如本文所述)中的一者或二者。在其他情况下,复制起点包括指环病毒复制起点。如本文所用的,“AAV复制起点”是指包含以下序列的核酸序列,该序列在AAV Rep分子(例如AAVRep蛋白)存在下促进DNA复制。在一些情况下,AAV复制起点被AAV Rep分子(例如,AAV Rep蛋白)识别和结合。在一些情况下,AAV复制起点包含末端解离位点(TRS)(例如,AAV TRS,例如,如本文所述)和/或Rep-结合基序(RBM)(例如,AAV RBM,例如,如本文所述)。在一些实施例中,AAV复制起点位于AAV ITR中。
如本文所用的,术语“蛋白质外壳”是指主要(例如,>50%、>60%、>70%、>80%、>90%、>95%、>96%、>97%、>98%或>99%)是蛋白质的外壳组分。
如本文所用的,术语“调节性核酸”是指修饰编码表达产物的DNA序列的表达,例如转录和/或翻译的核酸序列。在实施例中,表达产物包括RNA或蛋白质。
如本文所用的,术语“调节性序列”是指修饰靶基因产物的转录的核酸序列。在一些实施例中,调节性序列是启动子或增强子。
如本文所用的,术语“Rep分子”是指促进病毒基因组复制的蛋白质,例如,病毒蛋白。在一些实施例中,Rep分子是非指环病毒Rep蛋白(例如,AAV Rep蛋白),例如,如本文所述。在一些实施例中,Rep分子是指环病毒Rep分子,例如指环病毒ORF2分子,例如,如本文所述。如本文所用的“AAV Rep分子”通常是指具有野生型AAV Rep蛋白功能(例如,具有结合AAV RBM(例如,野生型AAV RBM,例如,如本文所述,或具有如本文所述的RBM共有序列的RBM)和诱导包含AAV RBM的核酸分子复制的能力)的蛋白质。
如本文所用的,术语“Rep-结合基序”(“RBM”)是指结合Rep分子的来自病毒基因组(例如,非指环病毒基因组,例如,AAV基因组)的核酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。通常,RBM与如本文所述的RBM序列(例如,如本文所述的AAV RBM序列)具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。在一些情况下,RBM包含在复制起点中,例如,包含在指环载体的遗传元件中。在一些情况下,RBM位于末端解离位点(TRS)(例如,如本文所述)的约1、2、3、4、5、10、15、20、25或30个核苷酸内。在一些情况下,RBM位于距离TRS约13个核苷酸处。在一些情况下,RBM相对于TRS位于3’方向。在一些情况下,RBM将Rep分子募集至复制起点。
如本文所用的,“基本上非致病性”生物体、颗粒或组分是指不会导致或诱发不可接受的疾病或致病性状况的生物体、颗粒(例如,病毒或指环载体,例如,如本文所述)或其组分,例如,在宿主生物体,例如哺乳动物,如人类中。在一些实施例中,向受试者施用指环载体可导致轻微的反应或副作用,作为标准治疗的一部分,这些反应或副反应是可以接受的。
如本文所用的,术语“非致病性”是指不会导致或诱发不可接受的疾病或致病性状况的生物体或其组分,例如,在宿主生物体,例如,哺乳动物,如人类中。
如本文所用的,“基本上非整合的”遗传元件是指遗传元件,例如,病毒或指环载体中的遗传元件,例如,如本文所述的,其中进入宿主细胞(例如,真核细胞)或生物体(例如,哺乳动物,如人类)的遗传元件中低于约0.01%、0.05%、0.1%、0.5%或1%整合到基因组中。在一些实施例中,遗传元件没有可检测地整合到例如宿主细胞的基因组中。在一些实施例中,可以使用本文所述的技术,例如核酸测序、PCR检测和/或核酸杂交,检测遗传元件整合到基因组中。在一些实施例中,整合频率是通过对从游离载体中分离出来的基因组DNA进行定量凝胶纯化测定来确定的,例如,如Wang等人(2004,Gene Therapy[基因治疗],11:711-721,其通过引用以其全文并入本文)中所述。
如本文所用的,“基本上非免疫原性”生物体、颗粒或组分是指不会导致或诱发不期望的或非靶向的免疫应答的生物体、颗粒(例如,病毒或指环载体,例如,如本文所述)或其组分,例如,在宿主组织或生物体(例如,哺乳动物,如人类)中。在实施例中,基本上非免疫原性生物体、颗粒或组分不会产生具有临床意义的免疫应答。在实施例中,基本上非免疫原性指环载体不会产生针对包含氨基酸序列或者由指环病毒或指环载体遗传元件的核酸序列编码的蛋白质的具有临床意义的免疫应答。在实施例中,通过测定受试者中抗体(例如,中和性抗体)的存在或水平(例如,抗指环载体抗体的存在或水平,例如,针对如本文所述的指环载体的抗体的存在或水平),来检测免疫应答(例如,不期望的或非靶向的免疫应答),例如,根据在Tsuda等人(1999;J.Virol.Methods[病毒学方法杂志]77:199-206;其通过引用并入本文)中描述的抗TTV抗体检测方法和/或根据在Kakkola等人(2008;Virology[病毒学]382:182-189;其通过引用并入本文)中描述的用于测定抗TTV IgG水平的方法。还可以通过本领域用于检测抗病毒抗体的方法来检测针对指环病毒或基于指环病毒的指环载体的抗体(例如,中和性抗体),这些方法是例如检测抗AAV抗体的方法,例如,如Calcedo等人(2013;Front.Immunol.[免疫学前沿]4(341):1-7;其通过引用并入本文)中所述。
如本文所用的“子序列”是指分别包含在较大核酸序列或氨基酸序列中的核酸序列或氨基酸序列。在一些情况下,子序列可以包含较大序列的结构域或功能性片段。在一些情况下,子序列可以包含较大序列的片段,当从较大序列中分离出来时,该片段能够形成二级和/或三级结构,类似于当与较大序列的其余部分一起存在时由该子序列形成的二级和/或三级结构。在一些情况下,子序列可以替换为另一序列(例如,包含外源性序列或对较大序列的其余部分而言异源的序列的子序列,例如,来自不同指环病毒的相应子序列)。
如本文所用的,术语“末端解离位点”(“TRS”)是指与病毒基因组的TRS序列(例如,如本文所述)(例如,如本文所述的AAV TRS序列)具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在一些情况下,TRS被Rep分子(例如,通过Rep分子的核酸内切酶活性)切割。在一些情况下,通过Rep分子对TRS的切割产生用于复制包含TRS的核酸分子的3’羟基末端。在一些情况下,TRS包含在复制起点中,例如,包含在指环载体的遗传元件中。在一些情况下,TRS位于Rep-结合基序(RBM)(例如,如本文所述)的约1、2、3、4、5、10、15、20、25或30个核苷酸内。在一些情况下,TRS位于距离RBM约13个核苷酸处。在一些情况下,TRS相对于RBM位于5’方向。
如本文所用的,“治疗(treatment)”、“进行治疗(treating)”及其同源词是指对受试者的医疗管理,旨在改善、缓解、稳定、预防或治愈疾病、病理状况或障碍。该术语包括积极治疗(旨在改善疾病、病理状况或障碍的治疗)、因果治疗(针对相关疾病、病理状况或障碍的原因的治疗)、姑息治疗(旨在缓解症状的治疗)、预防性治疗(旨在预防、最小化或者部分或完全抑制相关疾病、病理状况或障碍的发生的治疗)和支持性治疗(用来补充另一种疗法的治疗)。
本发明总体上涉及指环载体,例如,合成指环载体,指环载体的施用方法及其用途。本披露提供指环载体、包含指环载体的组合物,以及制备或使用指环载体的方法。指环载体通常用作递送媒介物,例如用于将治疗剂递送至真核细胞。通常,指环载体将包括遗传元件,该遗传元件包含封闭在蛋白质外壳内的核酸序列(例如,编码效应物,例如外源性效应物或内源性效应物)。相对于指环病毒序列(例如,如本文所述),指环载体可包括序列(例如,如本文所述的区域或结构域)的一个或多个缺失。指环载体可以用作基本上非免疫原性媒介物,用于将遗传元件或其中编码的效应物(例如,多肽或核酸效应物,例如,如本文所述)递送到真核细胞中,例如,用以治疗包含这些细胞的受试者中的疾病或障碍。
目录
I.用于制备指环载体的组合物和方法
A.指环载体的组分和组装
i.用于组装指环载体的ORF1分子
ii.用于组装指环载体的ORF2分子iii.蛋白质组分的产生
B.遗传元件构建体
i.非指环病毒序列(例如,AAV序列)
ii.质粒
iii.环状核酸构建体
iv.体外环化
v.串联构建体
vi.顺式/反式构建体vii.表达盒
viii.遗传元件构建体的设计和产生
C.效应物
D.宿主细胞
i.将遗传元件引入宿主细胞中
ii.用于以顺式或反式提供一个或多个蛋白的方法
iii.辅助物,例如非指环病毒辅助物
iv.示例性细胞类型
E.培养条件
F.收获
G.体外组装方法
H.富集和纯化
II.指环载体
A.指环病毒
B.ORF1分子
C.ORF2分子
D.遗传元件,例如,包括非指环病毒序列的遗传元件
E.蛋白结合序列
F.5'UTR区域
G.GC富集区
H.效应物
I.调节性序列
J.复制蛋白
K.其他序列
L.蛋白质外壳
III.核酸构建体
IV.组合物
V.使用方法
VI.施用/递送
I.用于制备指环载体的组合物和方法
在一些方面,本披露提供了指环载体及其用于递送效应物的方法。在一些实施例中,指环载体或其组分可以如下文描述制备。在一些实施例中,本文所述的组合物和方法可以用于产生遗传元件或遗传元件构建体。在一些实施例中,本文所述的组合物和方法可以用于产生一个或多个指环病毒ORF分子(例如,ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2分子或其功能性片段或剪接变体)。在一些实施例中,本文所述的组合物和方法可以用于在例如宿主细胞中产生蛋白质外壳或其组分(例如,ORF1分子)。在一些实施例中,指环载体或其组分可以使用串联构建体制备,例如,如美国临时申请63/038,483所述的,其通过引用以其全文并入本文。在一些实施例中,指环载体或其组分可以使用杆粒/昆虫细胞系统制备,例如,如美国临时申请号63/038,603所述的,其通过引用以其全文并入本文。
不希望受到理论的束缚,滚环式扩增可能经由与相对于遗传元件区域位于5’方向(或位于其5’区域内)的Rep结合位点(例如,包含5’UTR,例如,包含发夹环和/或复制起点,例如,如本文所述)结合的Rep蛋白来进行。然后,Rep蛋白可以继续通过遗传元件区,引起遗传元件的合成。然后,可以将遗传元件环化,随后将其包封在蛋白质外壳内,以形成指环载体。
指环载体的组分和组装
本文的组合物和方法可用于产生指环载体。如本文所述的,指环载体通常包含包封在蛋白质外壳(例如,包含由指环病毒ORF1核酸编码的多肽,例如,如本文所述)内的遗传元件(例如,单链环状DNA分子,例如,包含如本文所述的5’UTR区域)。在一些实施例中,遗传元件包含一个或多个编码指环病毒ORF(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2中的一种或多种)的序列。如本文所用的,指环病毒ORF或ORF分子(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2)包括包含与相应指环病毒ORF序列,例如,如PCT/US2018/037379或PCT/US19/65995(其各自通过引用以其全文并入本文)中所述的ORF序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列的多肽。在实施例中,遗传元件包含编码指环病毒ORF1或者其剪接变体或功能性片段(例如,胶冻卷区域,例如,如本文所述)的序列。在一些实施例中,蛋白质外壳包含由指环病毒ORF1核酸编码的多肽(例如,指环病毒ORF1分子或者其剪接变体或功能性片段)。
在一些实施例中,通过将遗传元件(例如,如本文所述)包封在蛋白质外壳(例如,如本文所述)内来组装指环载体。在一些实施例中,将遗传元件包封在宿主细胞(例如,如本文所述)的蛋白质外壳内。在一些实施例中,宿主细胞表达蛋白质外壳中包含的一种或多种多肽(例如,由指环病毒ORF1核酸编码的多肽,如ORF1分子)。例如,在一些实施例中,宿主细胞包含编码指环病毒ORF1分子,例如,指环病毒ORF1多肽(例如,野生型指环病毒ORF1蛋白或由野生型指环病毒ORF1核酸编码的多肽,例如,如本文所述)的剪接变体或功能性片段的核酸序列。在实施例中,编码指环病毒ORF1分子的核酸序列包含在宿主细胞中包含的核酸构建体(例如,质粒、病毒载体、病毒、微环、杆粒或人工染色体)中。在实施例中,编码指环病毒ORF1分子的核酸序列被整合到宿主细胞的基因组中。
在一些实施例中,宿主细胞包含遗传元件和/或包含遗传元件序列的核酸构建体。在一些实施例中,核酸构建体选自质粒、病毒核酸、微环、杆粒或人工染色体。在一些实施例中,将遗传元件从核酸构建体上切离,并且任选地,从双链形式转化为单链形式(例如,通过变性)。在一些实施例中,遗传元件是通过聚合酶根据核酸构建体中的模板序列生成的。在一些实施例中,聚合酶产生遗传元件序列的单链拷贝,其可以任选地进行环化以形成如本文所述的遗传元件。在其他实施例中,核酸构建体是通过在体外将遗传元件的核酸序列环化而产生的双链微环。在实施例中,将体外环化的(IVC)微环引入宿主细胞中,在那里它转化成适于包封在蛋白质外壳中的单链遗传元件,如本文所述。
ORF1分子,例如用于组装指环载体的ORF1分子
例如,可以通过将遗传元件包封在蛋白质外壳内来制备指环载体。指环载体的蛋白质外壳通常包含由指环病毒ORF1核酸编码的多肽(例如,指环病毒ORF1分子或者其剪接变体或功能性片段,例如,如本文所述)。在一些实施例中,ORF1分子可包含以下中的一种或多种:包含精氨酸富集区的第一区域,例如具有至少60%的碱性残基(例如,至少60%、65%、70%、75%、80%、85%、90%、95%或100%碱性残基;例如,60%-90%、60%-80%、70%-90%或70-80%的碱性残基)的区域,以及包含胶冻卷结构域的第二区域,例如至少六个β链(例如,4、5、6、7、8、9、10、11或12个β链)。在实施例中,蛋白质外壳包含指环病毒ORF1精氨酸富集区、胶冻卷区域、N22结构域、高变区和/或C-末端结构域中的一种或多种(例如,1、2、3、4种或全部5种)。在一些实施例中,蛋白质外壳包含指环病毒ORF1胶冻卷区域(例如,如本文所述)。在一些实施例中,蛋白质外壳包含指环病毒ORF1精氨酸富集区(例如,如本文所述)。在一些实施例中,蛋白质外壳包含指环病毒ORF1 N22结构域(例如,如本文所述)。在一些实施例中,蛋白质外壳包含指环病毒高变区(例如,如本文所述)。在一些实施例中,蛋白质外壳包含指环病毒ORF1 C-末端结构域(例如,如本文所述)。
在一些实施例中,指环载体包含ORF1分子和/或编码ORF1分子的核酸。通常,ORF1分子包括具有指环病毒ORF1蛋白(例如,如本文所述的指环病毒ORF1蛋白)的结构特征和/或活性的多肽或其功能性片段。在一些实施例中,ORF1分子包含相对于指环病毒ORF1蛋白(例如,如本文所述的指环病毒ORF1蛋白)的截短。在一些实施例中,ORF1分子是截短了至少10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650或700个氨基酸的指环病毒ORF1蛋白。在一些实施例中,ORF1分子包含与甲型细环病毒、乙型细环病毒或丙型细环病毒ORF1蛋白(例如,如本文所述)具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。ORF1分子通常可以结合核酸分子,例如DNA(例如,遗传元件,例如,如本文所述)。在一些实施例中,ORF1分子定位于细胞核。在某些实施例中,ORF1分子定位于细胞的核仁。
不希望受到理论的束缚,ORF1分子可能能够与其他ORF1分子结合,例如,以形成蛋白质外壳(例如,如本文所述)。可以将这样的ORF1分子描述为具有形成衣壳的能力。在一些实施例中,蛋白质外壳可以包封核酸分子(例如,如本文所述的遗传元件,例如,使用如本文所述的组合物或构建体产生的遗传元件)。在一些实施例中,多个ORF1分子可形成多聚体,例如,以产生蛋白质外壳。在一些实施例中,多聚体可以是同型多聚体。在其他实施例中,多聚体可以是异型多聚体。
在一些实施例中,将如本文所述的包含ORF1分子的第一多个指环载体施用于受试者。在一些实施例中,随后在施用第一多个之后向受试者施用本文所述的包含ORF1分子的第二多个指环载体。在一些实施例中,第二多个指环载体包含ORF1分子,该分子具有与第一多个指环载体包含的ORF1分子相同的氨基酸序列。在一些实施例中,第二多个指环载体包含ORF1分子,该分子与第一多个指环载体包含的ORF1分子具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%氨基酸序列同一性。
ORF2分子,例如用于组装指环载体的ORF2分子
使用本文所述的组合物或方法产生指环载体可能涉及表达指环病毒ORF2分子(例如,如本文所述)或者其剪接变体或功能性片段。在一些实施例中,指环载体包含ORF2分子或者其剪接变体或功能性片段,和/或编码ORF2分子或者其剪接变体或功能性片段的核酸。在一些实施例中,指环载体不包含ORF2分子或者其剪接变体或功能性片段,和/或编码ORF2分子或者其剪接变体或功能性片段的核酸。在一些实施例中,产生指环载体包括ORF2分子或者其剪接变体或功能性片段的表达,但是该ORF2分子未并入指环载体中。
蛋白质组分的产生
指环载体的蛋白质组分(例如ORF1)可以以多种方式(例如,如本文所述)产生。在一些实施例中,指环载体的蛋白质组分(包括例如,蛋白质外壳)在将遗传元件包装到蛋白质外壳的同一宿主细胞中产生,从而产生指环载体。在一些实施例中,在不包含遗传元件和/或遗传元件构建体(例如,如本文所述)的细胞中产生指环载体的蛋白质组分(包括例如,蛋白质外壳)。
杆状病毒表达系统
病毒表达系统(例如,杆状病毒表达系统)可以用于表达蛋白质(例如,用于产生指环载体),例如,如本文所述。杆状病毒为具有环状、超螺旋的双链DNA基因组的杆状的病毒。杆状病毒属包括:甲型杆状病毒(核型多角体病毒(nucleopolyhedrovirus,NPV),从鳞翅目分离)、乙型杆状病毒(颗粒体病毒(GV),从鳞翅目分离)、丙型杆状病毒(NPV,从膜翅目(Hymenoptera)分离)和丁型杆状病毒(NPV,从双翅目(Diptera)分离)。GV通常每个包膜仅含有一个核衣壳,而NPV通常每个包膜含有单个(SNPV)或多个(MNPV)核衣壳。有包膜的病毒体被进一步包含在GV的颗粒蛋白基质中和NPV的多角体蛋白中。杆状病毒通常具有裂解和包含的生命周期。在一些实施例中,裂解和包含的生命周期在病毒复制的三个阶段中独立出现:早期、晚期和极晚期。在一些实施例中,在早期期间,病毒DNA复制在病毒进入宿主细胞、早期病毒基因表达和宿主基因表达机构切断之后发生。在一些实施例中,在晚期,编码病毒DNA复制的晚期基因被表达,病毒颗粒被组装,并且细胞外病毒(EV)由宿主细胞产生。在一些实施例中,在极晚期,多角体蛋白和p10基因被表达,宿主细胞产生包含病毒(OV),并且宿主细胞被裂解。由于杆状病毒感染昆虫物种,它们可以用作生物制剂,在杆状病毒允许性昆虫细胞或幼虫中产生外源性蛋白。杆状病毒的不同分离株,例如苜蓿银纹夜蛾(Autographa californica)多核多角体病毒(AcMNPV)和家蚕(Bombyx mori)(桑蚕)核多角体病毒(BmNPV)可以用于外源性蛋白表达。各种杆状病毒表达系统是市售的,例如,购自赛默飞世尔公司(ThermoFisher)。
在一些实施例中,本文所述的蛋白质(例如,指环病毒ORF分子,例如,ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2或其功能性片段或剪接变体)可以使用包含本文所述的一种或多种组分的杆状病毒表达载体(例如,杆粒)表达。例如,杆状病毒表达载体可以包含选择性标志(例如,kanR)、复制起点(例如,细菌复制起点和昆虫细胞复制起点中的一种或两种)、重组酶识别位点(例如,att位点)和启动子中的一种或多种(例如,所有)。在一些实施例中,可以通过用编码本文所述蛋白质的基因替换天然存在的编码杆状病毒包含体的野生型多角体蛋白基因来产生杆状病毒表达载体(例如,如本文所述的杆粒)。在一些实施例中,将编码本文所述蛋白质的基因克隆到含有杆状病毒启动子的杆状病毒表达载体(例如,如本文所述的杆粒)。在一些实施例中,杆状病毒载体包含一个或多个非杆状病毒启动子,例如,哺乳动物启动子或指环病毒启动子。在一些实施例中,将编码本文所述蛋白质的基因克隆到供体载体(例如,如本文所述)中,随后将该载体与空杆状病毒表达载体(例如,空杆粒)接触,使得编码本文所述蛋白质的基因从供体载体转移(例如,通过同源重组或转座酶活性)至杆状病毒表达载体(例如,杆粒)中。在一些实施例中,杆状病毒启动子的侧翼是来自非必要多角体蛋白基因座的杆状病毒DNA。在一些实施例中,本文所述的蛋白质在病毒复制的极晚期处于AcNPV多角体蛋白启动子的转录控制下。在一些实施例中,适合用于昆虫细胞中的杆状病毒表达的强启动子包括但不限于杆状病毒p10启动子、多角体蛋白(polh)启动子、p6.9启动子和衣壳蛋白启动子。适合用于昆虫细胞中的杆状病毒表达的弱启动子包括杆状病毒的ie1、ie2、ie0、et1、39K(aka pp31)和gp64启动子。
在一些实施例中,通过杆状病毒基因组(例如,野生型或突变型杆状病毒基因组)与转移载体之间的同源重组来产生重组杆状病毒。在一些实施例中,将一个或多个编码本文所述蛋白质的基因克隆到转移载体中。在一些实施例中,转移载体进一步含有杆状病毒启动子,该启动子的侧翼是来自非必要基因座例如多角体蛋白基因的DNA。在一些实施例中,通过杆状病毒基因组与转移载体之间的同源重组将一个或多个编码本文所述蛋白质的基因插入杆状病毒基因组中。在一些实施例中,将杆状病毒基因组在一个或多个独特位点处线性化。在一些实施例中,线性化的位点位于靶位点附近,该靶位点用于将编码本文所述蛋白质的基因插入杆状病毒基因组中。在一些实施例中,可以使用缺失基因(例如多角体蛋白基因)下游的杆状病毒基因组的线性化杆状病毒基因组进行同源重组。在一些实施例中,将杆状病毒基因组和转移载体共转染到昆虫细胞中。在一些实施例中,产生重组杆状病毒的方法包括以下步骤:制备用于与含有编码一种或多种本文所述蛋白质的基因的转移载体进行同源重组的杆状病毒基因组,并且将该转移载体与杆状病毒基因组DNA共转染到昆虫细胞中。在一些实施例中,杆状病毒基因组包含与转移载体的区域同源的区域。这些同源区域可以增强杆状病毒基因组与转移载体之间重组的可能性。在一些实施例中,转移载体中的同源区域位于启动子上游或下游。在一些实施例中,为诱导同源重组,将杆状病毒基因组与转移载体以约1:1至10:1的重量比混合。
在一些实施例中,通过以下方法产生重组杆状病毒:该方法包括用Tn7进行位点特异性转座,例如,从而将编码本文所述蛋白质的基因插入杆粒DNA中,例如,在细菌中繁殖,这些细菌是例如大肠杆菌(例如,DH 10Bac细胞)。在一些实施例中,将编码本文所述蛋白质的基因克隆到载体中并且转化到感受态细胞例如感受态细胞(含有具有最小attTn7靶位点的杆粒DNA)中。在一些实施例中,杆状病毒表达载体(例如,载体)可以具有启动子,例如双启动子(例如,多角体蛋白启动子、p10启动子)。市售的供体质粒包括:pFASTBAC 1、pFASTBAC HT和pFASTBAC DUAL。在一些实施例中,鉴定含有重组杆粒DNA的集落并且分离杆粒DNA以转染昆虫细胞。
在一些实施例中,将杆状病毒载体与辅助核酸一起引入昆虫细胞中。引入可以为同时进行或依次进行。在一些实施例中,辅助核酸提供了一种或多种杆状病毒蛋白,例如,以促进杆状病毒载体的包装。
在一些实施例中,在昆虫细胞中产生(例如,通过同源重组)的重组杆状病毒被扩增并用于感染昆虫细胞(例如,在中对数生长期)以进行重组蛋白表达。在一些实施例中,通过在细菌例如大肠杆菌中的位点特异性转座产生的重组杆粒DNA用于使用转染剂(例如II)来转染昆虫细胞。关于杆状病毒表达系统的其他信息在美国专利申请号14/447,341、14/277,892和12/278,916中讨论,以上申请通过引用特此并入。
昆虫细胞系统
本文所述的蛋白质可以在用重组杆状病毒或杆粒DNA(例如,如上所述)感染或转染的昆虫细胞中表达。在一些实施例中,昆虫细胞包括:衍生自草地贪夜蛾(Spodopterafrugiperda)的Sf9和Sf21细胞以及衍生自粉纹夜蛾(Trichoplusia ni)的Tn-368和HighFiveTMBTI-TN-5B1-4细胞(也称为Hi5细胞)。在一些实施例中,衍生自蛹期草地贪夜蛾(Spodoptera frugiperda,fall army worm)卵巢的昆虫细胞系Sf21和Sf9可以用于使用杆状病毒表达系统表达重组蛋白。在一些实施例中,Sf21和Sf9昆虫细胞可以在市售的补充血清的培养基或无血清培养基中培养。用于培养昆虫细胞的合适培养基包括:格雷斯补充培养基(Grace’s Supplemented,TNM-FH)、IPL-41、TC-100、施耐德果蝇培养基(Schneider’sDrosophila,)、SF-900II SFM和EXPRESS-FIVETMSFM。在一些实施例中,一些无血清培养基配制品利用磷酸盐缓冲系统将培养物pH维持在6.0-6.4范围内(Licari等人,Insect cellhosts for baculovirus expression vectors contain endogenous exoglycosidaseactivity[用于杆状病毒表达载体的昆虫细胞宿主含有内源性外切糖苷酶活性].Biotechnology Progress[生物技术进展]9:146-152(1993)和Drugmand等人.Insectcells as factories for biomanufacturing[作为生物制造工厂的昆虫细胞].Biotechnology Advances[生物技术进展]30:1140-1157(2012)),用于培养和重组蛋白产生。在一些实施例中,对于培养不同昆虫细胞系而言,可以使用6.0-6.8的pH。在一些实施例中,昆虫细胞在25℃至30℃的温度在通气情况下在悬浮液中培养或作为单层培养。关于昆虫细胞的其他信息在例如美国专利申请号14/564,512和14/775,154中讨论,以上每篇申请均通过引用特此并入。
哺乳动物细胞系统
在一些实施例中,本文所述的蛋白质可以在用编码蛋白质(例如,如本文所述)的载体感染或转染的动物细胞系中体外表达。在本披露的背景下设想的动物细胞系包括猪细胞系,例如,永生化猪细胞系,如但不限于猪肾上皮细胞系PK-15和SK、单核髓系细胞系3D4/31和睾丸细胞系ST。此外,还包括其他哺乳动物细胞系,如CHO细胞(中国仓鼠卵巢)、MARC-145、MDBK、RK-13、EEL。另外地或替代地,本发明方法的特定实施例利用了动物细胞系,其是上皮细胞系,即上皮谱系细胞的细胞系。适合于表达本文所述蛋白质的细胞系包括但不限于人或灵长类动物来源的细胞系,例如人或灵长类动物肾癌细胞系。
遗传元件构建体,例如,用于组装指环载体的遗传元件构建体
如本文所述的指环载体的遗传元件可以从包含遗传元件区域和任选的其他序列如载体骨架的遗传元件构建体产生。通常,遗传元件构建体包含指环病毒5’UTR(例如,如本文所述)。遗传元件构建体可以是适于将遗传元件序列递送到宿主细胞中的任何核酸构建体,其中该遗传元件可以包封在蛋白质外壳内。在一些实施例中,遗传元件构建体包含启动子。在一些实施例中,遗传元件构建体是线性核酸分子。在一些实施例中,遗传元件构建体是环状核酸分子(例如,质粒、杆粒或微环,例如,如本文所述)。在一些实施例中,遗传元件构建体可以是双链的。在其他实施例中,遗传元件是单链的。在一些实施例中,遗传元件构建体包含DNA。在一些实施例中,遗传元件构建体包含RNA。在一些实施例中,遗传元件构建体包含一个或多个经修饰的核苷酸。
在一些方面,本披露提供了用于复制和繁殖如本文所述的指环载体的方法(例如,在细胞培养系统中),该方法可以包括以下步骤中的一个或多个:(a)将遗传元件(例如,线性化遗传元件)引入(例如,转染入)对指环载体感染敏感的细胞系中;(b)收获这些细胞,并任选地分离出显示存在遗传元件的细胞;(c)根据实验条件和基因表达,培养在步骤(b)中获得的细胞(例如,持续至少三天,如至少一周或更长时间);以及(d)收获步骤(c)的细胞,例如,如本文所述。
非指环病毒序列
如本文所述的遗传元件构建体可包含来自非指环病毒病毒基因组的核酸序列(例如,长度为至少10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500或4000个核苷酸的序列),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。可以衍生出非指环病毒序列的病毒的实例包括但不限于,单DNA病毒,例如,称德病毒(例如,单环编码病毒门[例如,雷东多病毒、圆环病毒{例如,猪圆环病毒,例如,PCV-1或PCV-2;或者喙羽症病毒}、双生病毒{例如,番茄金花叶病毒}或矮缩病毒{例如,BBTV、MDV1、SCSVF或FBNYV}]),或者细小病毒(例如,依赖性细小病毒,例如,博卡病毒或腺相关病毒(AAV))。在一些情况下,遗传元件构建体包含来自以下的序列:单DNA病毒,例如称德病毒,例如单环编码病毒门,例如第五病毒纲,例如小病毒目,例如细小病毒科,例如细小病毒亚科,例如依赖性细小病毒属,例如,AAV。在一些情况下,遗传元件包含来自AAV的序列(例如,AAV1、AAV2或AAV5)。
在一些情况下,遗传元件构建体包含非指环病毒复制起点,例如,如本文所述。在一些情况下,非指环病毒复制起点可包含在来自非指环病毒的ITR中,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列中。在一些情况下,非指环病毒复制起点可包含非指环病毒的Rep-结合基序(RBM),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些情况下,非指环病毒复制起点可包含非指环病毒的末端解离位点(TRS),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
质粒
在一些实施例中,遗传元件构建体是质粒。质粒通常包含如本文所述的遗传元件序列以及适于在宿主细胞中复制的复制起点(例如,用于在细菌细胞中复制的细菌复制起点)和选择性标志(例如,抗生素抗性基因)。在一些实施例中,可以将遗传元件序列从质粒上切离。在一些实施例中,质粒能够在细菌细胞中复制。在一些实施例中,质粒能够在哺乳动物细胞(例如,人细胞)中复制。在一些实施例中,质粒的长度为至少300、400、500、600、700、800、900、1000、2000、3000、4000或5000bp。在一些实施例中,质粒的长度小于600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10,000bp。在一些实施例中,质粒的长度为300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-4000或4000-5000bp。在一些实施例中,例如,可以将遗传元件从质粒上切离(例如,通过体外环化),以形成微环,例如,如本文所述的微环。在实施例中,遗传元件的切离将遗传元件序列从质粒骨架中分离出来(例如,将遗传元件从细菌骨架中分离出来)。
小型环状核酸构建体
在一些实施例中,遗传元件构建体是环状核酸构建体,例如,缺少骨架(例如,缺少细菌复制起点和/或选择性标志)。在实施例中,遗传元件是双链环状核酸构建体。在实施例中,通过体外环化(IVC),例如,如本文所述的体外环化(IVC)来产生双链环状核酸构建体。在实施例中,可以将双链环状核酸构建体引入宿主细胞中,在宿主细胞中它可以转化为单链环状遗传元件或用作生成单链环状遗传元件的模板,例如,如本文所述的。在一些实施例中,环状核酸构建体不包含质粒骨架或其功能性片段。在一些实施例中,环状核酸构建体的长度为至少2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400或4500bp。在一些实施例中,环状核酸构建体的长度小于2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5500或6000bp。在一些实施例中,环状核酸构建体的长度介于2000-2100、2100-2200、2200-2300、2300-2400、2400-2500、2500-2600、2600-2700、2700-2800、2800-2900、2900-3000、3000-3100、3100-3200、3200-3300、3300-3400、3400-3500、3500-3600、3600-3700、3700-3800、3800-3900、3900-4000、4000-4100、4100-4200、4200-4300、4300-4400或4400-4500bp之间。在一些实施例中,环状核酸构建体是微环。
体外环化
在一些情况下,要包装到蛋白质外壳内的遗传元件是单链环状DNA。在一些情况下,可以经由具有不同于单链环状DNA的形式的遗传元件构建体将遗传元件引入宿主细胞中。例如,遗传元件构建体可以是双链环状DNA。然后,双链环状DNA可以在宿主细胞(例如,包含用于滚环式复制的合适酶的宿主细胞,例如,指环病毒Rep蛋白,例如,Rep68/78、Rep60、RepA、RepB、Pre、MobM、TraX、TrwC、Mob02281、Mob02282、NikB、ORF50240、NikK、TecH、OrfJ或TraI,例如,如在以下文献中描述的:Wawrzyniak等人,2017,Front.Microbiol.[微生物学前沿]8:2353;就所列出的酶而言,通过引用并入本文)中转化为单链环状DNA。在一些实施例中,通过体外环化(IVC),例如,如在实例15中所述的体外环化(IVC),来产生双链环状DNA。
通常,体外环化的DNA构建体可以通过酶切待包装的遗传元件构建体(例如,包含遗传元件序列的质粒)的质粒来产生,使得将遗传元件序列作为线性DNA分子而切离。然后,可以连接由此产生的线性DNA,例如,使用DNA连接酶,以形成双链环状DNA。在一些情况下,由体外环化产生的双链环状DNA可以进行滚环式复制,例如,如本文所述的。不希望受到理论的束缚,设想体外环化产生双链DNA构建体,该构建体可以进行滚环式复制而无需进一步修饰,从而能够产生合适大小的单链环状DNA以包装到指环载体,例如,如本文所述的指环载体中。在一些实施例中,双链DNA构建体比质粒(例如,细菌质粒)小。在一些实施例中,将双链DNA构建体从质粒(例如,细菌质粒)上切离,然后进行环化,例如,通过体外环化。
串联构建体
在一些实施例中,遗传元件构建体包含以串联排列的遗传元件序列的第一拷贝(例如,遗传元件的核酸序列,例如,如本文所述)和遗传元件序列的第二拷贝的至少一部分(例如,相同遗传元件的核酸序列,或不同遗传元件的核酸序列)。具有这样的结构的遗传元件构建体在本文中通常称为串联构建体。这样的串联构建体用于产生指环载体遗传元件。在一些情况下,遗传元件序列的第一拷贝和遗传元件序列的第二拷贝可以在遗传酸构建体上彼此紧邻。在其他情况下,遗传元件序列的第一拷贝和遗传元件序列的第二拷贝可以隔开,例如,由间隔序列隔开。在一些实施例中,遗传元件序列的第二拷贝或其部分包含上游复制促进序列(uRFS),例如,如本文所述的。在一些实施例中,遗传元件序列的第二拷贝或其部分包含下游复制促进序列(dRFS),例如,如本文所述的。在一些实施例中,uRFS和/或dRFS包含复制起点(例如,哺乳动物复制起点、昆虫复制起点或病毒复制起点,例如,非指环病毒复制起点,例如,如本文所述)或其部分。在一些实施例中,uRFS和/或dRFS不包含复制起点。在一些实施例中,uRFS和/或dRFS包含发夹环(例如,在5’UTR中)。在一些实施例中,与缺乏遗传元件的第二拷贝或其部分但在其他方面类似的构建体相比,串联构建体产生更高水平的遗传元件。在不受理论束缚的情况下,在一些实施例中,本文所述的串联构建体可以通过滚环式复制进行复制。在一些实施例中,串联构建体是质粒。在一些实施例中,串联构建体是环状的。在一些实施例中,串联构建体是线性的。在一些实施例中,串联构建体是单链的。在一些实施例中,串联构建体是双链的。在一些实施例中,串联构建体是DNA。
在一些情况下,串联构建体可以包括遗传元件序列的第一拷贝和遗传元件序列的第二拷贝,或其部分。应当理解的是,第二拷贝可以是第一拷贝的相同拷贝或其部分,或者可以包含一个或多个序列差异,例如置换、添加或缺失。在一些情况下,遗传元件序列的第二拷贝或其部分相对于遗传元件序列的第一拷贝位于5’方向。在一些情况下,遗传元件序列的第二拷贝或其部分相对于遗传元件序列的第一拷贝位于3’方向。在一些情况下,遗传元件序列的第二拷贝或其部分和遗传元件序列的第一拷贝在串联构建体中彼此相邻。在一些情况下,遗传元件序列的第二拷贝或其部分和遗传元件序列的第一拷贝可以隔开,例如,由间隔序列隔开。
在一些实施例中,本文所述的串联构建体可用于产生包含衣壳(例如,包含指环病毒ORF(例如,ORF1分子)的衣壳,例如,如本文所述)的载体(例如,指环载体)、媒介物或颗粒(例如,病毒颗粒)的遗传元件,该衣壳封装遗传元件,该遗传元件包含与衣壳结合的蛋白结合序列和编码治疗性效应物的异源(例如,相对于衍生出ORF1分子的指环病毒)序列。在实施例中,载体能够将遗传元件递送至哺乳动物(例如,人)细胞中。在一些实施例中,遗传元件与野生型指环病毒基因组序列具有小于约50%(例如,小于50%、40%、30%、25%、20%、15%、10%、9%、8%、7%、6%、5.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%或更小)的同一性。在一些实施例中,遗传元件与野生型指环病毒基因组序列具有不超过1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%或80%的同一性。在一些实施例中,遗传元件具有大于约2000、3000、4000、4500或5000个连续核苷酸的非指环病毒基因组序列。在一些实施例中,遗传元件具有大于约2000至5000、2500至4500、3000至4500、2500至4500、3500或4000、4500(例如,约3000至4500)个核苷酸的非指环病毒基因组序列的核苷酸。
在本文的系统和方法的一些实施例中,通过将作为遗传元件或遗传元件构建体(例如,串联构建体)的第一核酸分子和编码一种或多种另外的蛋白质(例如,Rep分子和/或衣壳蛋白)的第二核酸分子(例如,如本文所述)引入细胞来制备载体(例如,指环载体)。在一些实施例中,第一核酸分子和第二核酸分子相互连接(例如,在本文所述的遗传元件构建体中,例如,以顺式相互连接)。在一些实施例中,第一核酸分子和第二核酸分子是分开的(例如,以反式分开)。在一些实施例中,第一核酸分子是质粒、粘粒、杆粒、微环或人工染色体。在一些实施例中,第二核酸分子是质粒、粘粒、杆粒、微环或人工染色体。在一些实施例中,第二核酸分子整合到宿主细胞的基因组中。
在一些实施例中,该方法进一步包括,将第一核酸分子和/或第二核酸分子引入宿主细胞中。在一些实施例中,在引入第一核酸分子之前、同时或之后,将第二核酸分子引入宿主细胞中。在其他实施例中,第二核酸分子整合到宿主细胞的基因组中。在一些实施例中,第二核酸分子是或包含辅助构建体、辅助病毒或其他辅助载体(例如,如本文所述)或者是其部分。
顺式/反式构建体
在一些实施例中,如本文所述的遗传元件构建体包含一个或多个编码一种或多种指环病毒ORF,例如,蛋白质外壳组分(例如,由指环病毒ORF1核酸编码的多肽,例如,如本文所述)的序列。例如,遗传元件构建体可以包含编码指环病毒ORF1分子的核酸序列。这样的遗传元件构建体可适于将遗传元件和一种或多种指环病毒ORF以顺式引入宿主细胞中。在其他实施例中,如本文所述的遗传元件构建体不包含编码一种或多种指环病毒ORF,例如,蛋白质外壳组分(例如,由指环病毒ORF1核酸编码的多肽,例如,如本文所述)的序列。例如,遗传元件构建体可以不包含编码指环病毒ORF1分子的核酸序列。这样的遗传元件构建体可适用于将遗传元件引入宿主细胞中,其中一种或多种指环病毒ORF以反式提供(例如,经由引入编码一种或多种指环病毒ORF的第二核酸构建体,或者经由整合到宿主细胞基因组中的指环病毒ORF盒)。在一些实施例中,ORF1分子以反式提供,例如,如本文所述。在一些实施例中,ORF2分子以反式提供,例如,如本文所述。在一些实施例中,ORF1分子和ORF1分子二者均以反式提供,例如,如本文所述。
在一些实施例中,遗传元件构建体包含编码指环病毒ORF1分子或者其剪接变体或功能性片段(例如,胶冻卷区域,例如,如本文所述)的序列。在实施例中,不包含遗传元件序列的遗传元件部分包含编码指环病毒ORF1分子或者其剪接变体或功能性片段的序列(例如,在包含启动子和编码指环病毒ORF1分子或者其剪接变体或功能性片段的序列的盒中)。在另外的实施例中,包含遗传元件序列的构建体部分包含编码指环病毒ORF1分子或者其剪接变体或功能性片段(例如,胶冻卷区域,例如,如本文所述)的序列。在实施例中,将这样的遗传元件包封在蛋白质外壳中(例如,如本文所述)产生了可复制型组分指环载体(例如,指环载体在感染细胞后,使细胞能够产生另外拷贝的指环载体,而无需将另外的核酸构建体,例如,编码一种或多种如本文所述的指环病毒ORF的核酸构建体引入细胞中)。
在其他实施例中,遗传元件不包含编码指环病毒ORF1分子或者其剪接变体或功能性片段(例如,胶冻卷区域,例如,如本文所述)的序列。在实施例中,将这样的遗传元件包封在蛋白质外壳中(例如,如本文所述)产生了非复制型指环载体(例如,指环载体在感染细胞后,不能使受感染细胞产生另外的指环载体,例如,在缺乏一种或多种另外构建体(例如,编码一种或多种如本文所述的指环病毒ORF)的情况下)。
表达盒
在一些实施例中,遗传元件构建体包含一个或多个用于表达多肽或非编码RNA(例如,miRNA或siRNA)的盒。在一些实施例中,遗传元件构建体包含用于表达效应物(例如,外源性或内源性效应物),例如,如本文所述的多肽或非编码RNA的盒。在一些实施例中,遗传元件构建体包含用于表达指环病毒蛋白(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2,或者其功能性片段)的盒。在一些实施例中,表达盒可以位于遗传元件序列内。在实施例中,效应物的表达盒位于遗传元件序列内。在实施例中,指环病毒蛋白的表达盒位于遗传元件序列内。在其他实施例中,表达盒位于遗传元件序列之外的遗传元件构建体内的某个位置(例如,在主链中)。在实施例中,指环病毒蛋白的表达盒位于遗传元件序列之外的遗传元件构建体内的某个位置(例如,在骨架中)。
多肽表达盒通常包含启动子和编码多肽的编码序列(例如,编码指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2或者其功能性片段的序列),该多肽例如是效应物(例如,如本文所述的外源性或内源性效应物)或指环病毒蛋白。可以包含在多肽表达盒中的示例性启动子(例如,以驱动多肽的表达)包括但不限于组成型启动子(例如,CMV、RSV、PGK、EF1a或SV40启动子)、细胞或组织特异性启动子(例如,骨骼肌α-肌动蛋白启动子、肌球蛋白轻链2A启动子、抗肌萎缩蛋白启动子、肌肉型肌酸激酶启动子、肝白蛋白启动子、乙型肝炎病毒核心启动子、骨钙素启动子、骨唾液酸蛋白启动子、CD2启动子、免疫球蛋白重链启动子、T细胞受体α链启动子、神经元特异性烯醇化酶(NSE)启动子或神经丝蛋白轻链启动子)以及诱导型启动子(例如,锌诱导型绵羊金属硫蛋白(MT)启动子、地塞米松(Dex)诱导型小鼠乳腺瘤病毒(MMTV)启动子;T7聚合酶启动子系统、四环素阻遏系统、四环素诱导系统、RU486诱导系统、雷帕霉素诱导系统),例如,如本文所述。在一些实施例中,表达盒进一步包含增强子,例如,如本文所述的增强子。
遗传元件构建体的设计和产生
有多种方法可用于合成遗传元件构建体。例如,可以将遗传元件构建体序列分成更容易合成的更小的重叠片段(例如,范围为约100bp至约10kb的区段或单个ORF)。这些DNA区段由一组重叠的单链寡核苷酸合成。然后,将所得重叠合成子组装成较大的DNA片段,例如,遗传元件构建体。可以将区段或ORF组装成遗传元件构建体,例如,通过体外重组或在5’和3’端的独特限制性位点来实现连接。
可以用设计算法来合成遗传元件构建体,该设计算法将构建体序列解析为寡核苷酸长度的片段,考虑到序列空间的复杂性,从而为合成创造合适的设计条件。然后,在基于半导体的高密度芯片上以化学方式合成寡核苷酸,其中每个芯片上合成超过200,000个单独的寡核苷酸。通过组装技术,如来组装这些寡核苷酸,以由较小的寡核苷酸构建更长的DNA区段。这是以并行方式完成的,因此一次构建成百上千个合成的DNA区段。
可以对每个遗传元件构建体或遗传元件构建体的区段进行序列验证。在一些实施例中,可以使用AnyDot.chips(德国Genovoxx公司)对RNA或DNA进行高通量测序,其允许监测生物学过程(例如,miRNA表达或等位基因变异性(SNP检测))。其他高通量测序系统包括在以下文献中披露的系统:Venter,J.,等人.Science[科学]2001年2月16日;Adams,M.等人,Science[科学]2000年3月24日和M.J,Levene,等人.Science[科学]299:682-686,2003年1月;以及美国申请公布号20030044781和2006/0078937。总体而言,这样的系统涉及对具有多个碱基的靶核酸分子进行测序,方法是经由在核酸分子上测量的聚合反应临时添加碱基,即实时跟踪待测序的模板核酸分子上的核酸聚合酶的活性。在一些实施例中,进行鸟枪法测序。
可以设计遗传元件构建体,使得可以相对于遗传元件,以顺式或反式提供用于复制或包装的因子。例如,当以顺式提供时,遗传元件可以包含一种或多种编码指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3或ORF2t/3,例如,如本文所述的这些蛋白的基因。在一些实施例中,复制和/或包装信号可以并入遗传元件中,例如,以诱导扩增和/或封装。在一些实施例中,可以将效应物插入基因组中的特定位点。在一些实施例中,将一种或多种病毒ORF替换为效应物。
在另一实例中,当复制或包装因子以反式提供时,遗传元件可能缺少编码指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3或ORF2t/3中一种或多种,例如,如本文所述的这些蛋白质的基因;该一种或多种蛋白质可以例如,由另一核酸,例如,辅助核酸提供。在一些实施例中,遗传元件中存在极小的顺式信号(例如,5’UTR和/或GC富集区)。在一些实施例中,遗传元件不编码复制或包装因子(例如,复制酶和/或衣壳蛋白)。在一些实施例中,这样的因子可由一种或多种辅助核酸(例如,辅助病毒核酸、辅助质粒或整合到宿主细胞基因组中的辅助核酸)提供。在一些实施例中,辅助核酸表达足以诱导扩增和/或包装的蛋白质和/或RNA,但可能缺乏它们自身的包装信号。在一些实施例中,将遗传元件和辅助核酸引入宿主细胞中(例如,同时进行或分别进行),结果是遗传元件而非辅助核酸的扩增和/或包装。
在一些实施例中,可以使用计算机辅助设计工具来设计遗传元件构建体。
在以下文献中描述了制备构建体的通用方法:例如,Khudyakov和Fields,Artificial DNA:Methods and Applications[人工DNA:方法与应用],CRC出版社(2002);Zhao,Synthetic Biology:Tools and Applications[合成生物学:工具和应用],(第一版),Academic Press[美国学术出版社](2013);以及Egli和Herdewijn,Chemistry andBiology of Artificial Nucleic Acids[人工核酸的化学与生物学],(第一版),Wiley-VCH[威利出版集团](2012)。
效应物
本文所述的组合物和方法可用于产生包含编码效应物(例如,外源性效应物或内源性效应物),例如,如本文所述的效应物的序列的指环载体的遗传元件。在一些情况下,效应物可以是内源性效应物或外源性效应物。在一些实施例中,效应物是治疗性效应物。在一些实施例中,效应物包括多肽(例如,治疗性多肽或肽,例如,如本文所述)。在一些实施例中,效应物包括非编码RNA(例如,miRNA、siRNA、shRNA、mRNA、lncRNA、RNA、DNA、反义RNA或gRNA)。在一些实施例中,效应物包括调节性核酸,例如,如本文所述的调节性核酸。
在一些实施例中,可以将效应物编码序列插入遗传元件中,例如,在非编码区,例如,位于开放阅读框的3'方向和遗传元件GC富集区的5'方向的非编码区、在TATA盒上游的5'非编码区中、在5’UTR中、在多A信号下游或GC富集区上游的3’非编码区中。在一些实施例中,可以将效应物编码序列插入遗传元件中,例如,在编码序列中(例如,在编码例如,如本文所述的指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3的序列中)。在一些实施例中,效应物编码序列替换开放阅读框的全部或一部分。在一些实施例中,遗传元件包含与效应物编码序列可操作地连接的调节性序列(例如,启动子或增强子,例如,如本文所述)。
宿主细胞
本文所述的指环载体可以例如在宿主细胞中产生。通常,提供了宿主细胞,其包含指环载体遗传元件和指环载体蛋白质外壳的组分(例如,由指环病毒ORF1核酸编码的多肽或指环病毒ORF1分子)。然后,在适于将遗传元件包封在蛋白质外壳内的条件(例如,如本文所述的培养条件)下孵育宿主细胞。在一些实施例中,在适于从宿主细胞中释放指环载体,例如,释放到周围上清液中的条件下进一步孵育宿主细胞。在一些实施例中,裂解宿主细胞以从细胞裂解物中收获指环载体。在一些实施例中,可以将指环载体引入生长至高细胞密度的宿主细胞系。在一些实施例中,宿主细胞是Expi-293细胞。
将遗传元件引入宿主细胞中
可以将遗传元件或包含遗传元件序列的核酸构建体引入到宿主细胞中。在一些实施例中,将遗传元件本身引入到宿主细胞中。在一些实施例中,将包含遗传元件序列的遗传元件构建体(例如,如本文所述)引入宿主细胞中。遗传元件或遗传元件构建体可以例如使用本领域已知的方法引入宿主细胞中。例如,可以通过转染(例如,稳定转染或瞬时转染)将遗传元件或遗传元件构建体引入宿主细胞中。在实施例中,通过阳离子脂质体转染将遗传元件或遗传元件构建体引入宿主细胞中。在实施例中,通过磷酸钙转染将遗传元件或遗传元件构建体引入宿主细胞中。在一些实施例中,通过电穿孔将遗传元件或遗传元件构建体引入宿主细胞中。在一些实施例中,使用基因枪将遗传元件或遗传元件构建体引入宿主细胞中。在一些实施例中,通过核转染将遗传元件或遗传元件构建体引入宿主细胞中。在一些实施例中,通过PEI转染将遗传元件或遗传元件构建体引入宿主细胞中。在一些实施例中,通过使宿主细胞与包含遗传元件的指环载体接触,将遗传元件引入宿主细胞中。
在实施例中,一旦引入宿主细胞中,遗传元件构建体就能够复制。在实施例中,一旦引入宿主细胞中,遗传元件就可以由遗传元件构建体产生。在一些实施例中,遗传元件通过聚合酶在宿主细胞中产生,例如,使用遗传元件构建体作为模板。
在一些实施例中,将遗传元件或包含遗传元件的载体引入(例如,转染入)表达病毒聚合酶蛋白的细胞系中,以实现指环载体的表达。为此,可以将表达指环载体聚合酶蛋白的细胞系用作合适的宿主细胞。可以对宿主细胞进行类似地工程化,以提供其他病毒功能或其他功能。
为了制备本文披露的指环载体,可以使用遗传元件构建体来转染提供复制和产生所需的指环载体蛋白和功能的细胞。可替代地,可以在由本文披露的遗传元件或包含遗传元件的载体转染之前、期间或之后,用提供指环载体蛋白质和功能的第二构建体(例如,病毒)转染细胞。在一些实施例中,第二构建体可用于补充不完整病毒颗粒的产生。第二构建体(例如,病毒)可能具有条件性生长缺陷,如宿主范围局限性或温度敏感性,例如,这允许随后对转染子病毒进行选择。在一些实施例中,第二构建体可以提供一种或多种由宿主细胞利用的复制蛋白,以实现指环载体的表达。在一些实施例中,可以用编码病毒蛋白例如一种或多种复制蛋白的载体转染宿主细胞。在一些实施例中,第二构建体具有抗病毒敏感性。
在一些情况下,可以使用本领域已知的技术将本文披露的遗传元件或包含遗传元件的载体复制并产生到指环载体中。例如,在以下文献中描述了多种病毒培养方法:例如,美国专利号4,650,764;美国专利号5,166,057;美国专利号5,854,037;欧洲专利公开EP0702085A1;美国专利申请系列号09/152,845;国际专利公开PCT WO 97/12032;WO 96/34625;欧洲专利公开EP-A780475;WO 99/02657;WO 98/53078;WO 98/02530;WO 99/15672;WO 98/13501;WO 97/06270和EPO 780 47SA1,其各自通过引用以其全文并入本文。
用于以顺式或反式提供一个或多个蛋白的方法
在一些实施例(例如,本文所述的顺式实施例)中,遗传元件构建体进一步包含一个或多个表达盒,这些表达盒包含指环病毒ORF(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2或者其功能性片段)的编码序列。在实施例中,遗传元件构建体包含表达盒,该表达盒包含指环病毒ORF1或者其剪接变体或功能性片段的编码序列。可以将包含效应物以及一种或多种指环病毒ORF表达盒的这样的遗传元件构建体引入宿主细胞中。在一些情况下,包含这样的遗传元件构建体的宿主细胞能够产生用于蛋白质外壳的遗传元件和组分,以及用于将遗传元件包封在蛋白质外壳内的遗传元件和组分,而无需另外的核酸构建体或将表达盒整合到宿主细胞基因组中。换言之,这样的遗传元件构建体可用于在宿主细胞,例如,如本文所述的宿主细胞中的顺式指环载体产生方法。
在一些实施例(例如,本文所述的反式实施例)中,遗传元件不包含表达盒,该表达盒包含一种或多种指环病毒ORF(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2或者其功能性片段)的编码序列。在实施例中,遗传元件构建体不包含表达盒,该表达盒包含指环病毒ORF1或者其剪接变体或功能性片段的编码序列。可以将包含效应物表达盒但缺少一种或多种指环病毒ORF(例如,指环病毒ORF1或者其剪接变体或功能性片段)表达盒的这样的遗传元件构建体引入宿主细胞中。在一些情况下,包含这样的遗传元件构建体的宿主细胞可能需要另外的核酸构建体或将表达盒整合到宿主细胞基因组中,以产生指环载体的一种或多种组分(例如,蛋白质外壳蛋白质)。在一些实施例中,在缺乏编码指环病毒ORF1分子的另外核酸构建体的情况下,包含这样的遗传元件构建体的宿主细胞不能将遗传元件包封在蛋白质外壳内。换言之,这样的遗传元件构建体可用于在宿主细胞,例如,如本文所述的宿主细胞中的反式指环载体产生方法。
在一些实施例(例如,本文所述的顺式实施例)中,遗传元件构建体进一步包含一个或多个表达盒,这些表达盒包含一种或多种非指环病毒ORF(例如,非指环病毒Rep分子,例如AAV Rep分子,例如AAV-Rep蛋白,例如AAV Rep2蛋白)的编码序列。可以将包含效应物以及一种或多种非指环病毒ORF表达盒的这样的遗传元件构建体引入宿主细胞中。在一些情况下,包含这样的遗传元件构建体的宿主细胞能够产生用于蛋白质外壳的遗传元件和组分,以及用于将遗传元件包封在蛋白质外壳内的遗传元件和组分,而无需另外的核酸构建体或将表达盒整合到宿主细胞基因组中。换言之,这样的遗传元件构建体可用于在宿主细胞,例如,如本文所述的宿主细胞中的顺式指环载体产生方法。
在一些实施例(例如,本文所述的反式实施例)中,遗传元件不包含表达盒,该表达盒包含一种或多种非指环病毒ORF(例如,非指环病毒Rep分子,例如AAV Rep分子,例如AAVRep蛋白,例如AAV Rep2蛋白)的编码序列。可以将包含效应物表达盒但缺少一种或多种非指环病毒ORF(例如非指环病毒Rep分子,例如AAV Rep分子,例如AAV Rep蛋白,例如AAVRep2蛋白)表达盒的这样的遗传元件构建体引入宿主细胞中。在一些情况下,包含这样的遗传元件构建体的宿主细胞可能需要另外的核酸构建体或将表达盒整合到宿主细胞基因组中,以产生指环载体的一种或多种组分(例如,用于遗传元件的复制)。在一些实施例中,包含这种遗传元件构建体的宿主细胞在不存在另外的核酸构建体(例如编码非指环病毒Rep分子,例如AAV Rep分子、例如AAV Rep蛋白,例如AAV Rep2蛋白的核酸构建体)的情况下不能复制遗传元件。换言之,这样的遗传元件构建体可用于在宿主细胞,例如,如本文所述的宿主细胞中的反式指环载体产生方法。
辅助物和非指环病毒分子
在一些实施例中,来自非指环病毒病毒的分子(例如,核酸分子或多肽)或基于其的分子存在于宿主细胞中。在一些实施例中,来自非指环病毒病毒的分子或基于其的分子可有助于产生如本文所述的指环载体。例如,来自非指环病毒病毒的分子或基于其的分子可包含非指环病毒Rep分子(例如,AAV Rep分子),其促进包含同源复制起点(例如,AAV复制起点)的指环载体遗传元件的复制。
在一些实施例中,AAV Rep蛋白包含如下表60中所列的氨基酸序列,或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施例中,AAV Rep蛋白包含SEQ ID NO:1030-1042中任一个的氨基酸序列,或与其具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。
表60.示例性AAV Rep蛋白序列
在一些实施例中,通过辅助构建体将来自非指环病毒病毒的分子或基于其的分子引入宿主细胞中。在一些实施例中,本文所述的方法包括将辅助构建体引入宿主细胞(例如,包含遗传元件构建体或如本文所述的遗传元件的宿主细胞)中。在一些实施例中,在引入遗传元件构建体之前,将辅助构建体引入宿主细胞中。在一些实施例中,在引入遗传元件构建体的同时,将辅助构建体引入宿主细胞中。在一些实施例中,在引入遗传元件构建体之后,将辅助构建体引入宿主细胞中。
在一些实施例中,辅助构建体包含编码非指环病毒ORF的序列。在一些实施例中,辅助构建体包含编码非指环病毒Rep分子(例如AAV Rep分子,例如AAV Rep蛋白)的序列。在一些实施例中,辅助构建体包含编码AAV REP2分子的序列。在一些实施例中,一种或多种辅助构建体包含编码腺病毒E2A分子、腺病毒E4分子和腺病毒VARNA分子中的一种或多种(例如,1、2或全部3种)的序列。在实施例中,AAV Rep分子、腺病毒E2A分子、腺病毒E4分子和腺病毒VARNA分子在同一构建体上编码。在实施例中,AAV Rep分子、腺病毒E2A分子、腺病毒E4分子和腺病毒VARNA分子在不同的构建体(例如,至少2、3或4个单独的构建体)上编码。
在一些实施例中,辅助构建体包含编码指环病毒ORF(例如,指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2中的一种或多种)的序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
示例性细胞类型
适于产生指环载体的示例性宿主细胞包括但不限于哺乳动物细胞(例如,人细胞)和昆虫细胞。在一些实施例中,宿主细胞是人细胞或细胞系。在一些实施例中,细胞是免疫细胞或细胞系,例如,T细胞或细胞系、癌细胞系、肝细胞或细胞系、神经细胞、神经胶质细胞、皮肤细胞、上皮细胞、间充质细胞、血细胞、内皮细胞、眼细胞、胃肠道细胞、祖细胞、前体细胞、干细胞、肺细胞、心肌细胞或肌肉细胞。在一些实施例中,宿主细胞是动物细胞(例如,小鼠细胞、大鼠细胞、兔细胞、或仓鼠细胞、或昆虫细胞)。
在一些实施例中,宿主细胞是淋巴样细胞。在一些实施例中,宿主细胞是T细胞或永生化T细胞。在实施例中,宿主细胞是Jurkat细胞。在实施例中,宿主细胞是MOLT细胞(例如,MOLT-4或MOLT-3细胞)。在实施例中,宿主细胞是MOLT-4细胞。在实施例中,宿主细胞是MOLT-3细胞。在一些实施例中,宿主细胞是急性淋巴母细胞白血病(ALL)细胞,例如,MOLT细胞,如MOLT-4或MOLT-3细胞。在一些实施例中,宿主细胞是B细胞或永生化B细胞。在一些实施例中,宿主细胞包含遗传元件构建体(例如,如本文所述)。
在一些实施例中,宿主细胞是MOLT细胞(例如,MOLT-4或MOLT-3细胞)。
在一些实施例中,宿主细胞是急性淋巴母细胞白血病(ALL)细胞,例如,MOLT细胞,如MOLT-4或MOLT-3细胞。
在一些实施例中,宿主细胞是Expi-293细胞。在一些实施例中,宿主细胞是Expi-293F细胞。
在一方面,本披露提供了生产包含包封在蛋白质外壳中的遗传元件的指环载体的方法,该方法包括提供包含指环载体遗传元件的MOLT-4细胞,并在允许指环载体遗传元件成为包封在MOLT-4细胞的蛋白质外壳中的条件下孵育MOLT-4细胞。在一些实施例中,MOLT-4细胞进一步包含一种或多种形成部分或全部蛋白质外壳的指环病毒蛋白(例如,指环病毒ORF1分子)。在一些实施例中,指环载体遗传元件是在MOLT-4细胞中产生的,例如,用以形成遗传元件构建体(例如,如本文所述的遗传元件构建体)。在一些实施例中,该方法进一步包括将指环载体遗传元件构建体引入MOLT-4细胞中。
在一方面,本披露提供了生产包含包封在蛋白质外壳中的遗传元件的指环载体的方法,该方法包括提供包含指环载体遗传元件的MOLT-3细胞,并在允许指环载体遗传元件成为包封在MOLT-3细胞的蛋白质外壳中的条件下孵育MOLT-3细胞。在一些实施例中,MOLT-3细胞进一步包含一种或多种形成部分或全部蛋白质外壳的指环病毒蛋白(例如,指环病毒ORF1分子)。在一些实施例中,指环载体遗传元件是在MOLT-3细胞中产生的,例如,用以形成遗传元件构建体(例如,如本文所述的遗传元件构建体)。在一些实施例中,该方法进一步包括将指环载体遗传元件构建体引入MOLT-3细胞中。
在一些实施例中,宿主细胞是人细胞。在实施例中,宿主细胞是HEK293T细胞、HEK293F细胞、A549细胞、Jurkat细胞、Raji细胞、Chang细胞、HeLa细胞Phoenix细胞、MRC-5细胞、NCI-H292细胞或Wi38细胞。在一些实施例中,宿主细胞是非人灵长类动物细胞(例如,Vero细胞、CV-1细胞或LLCMK2细胞)。在一些实施例中,宿主细胞是鼠类细胞(例如,McCoy细胞)。在一些实施例中,宿主细胞是仓鼠细胞(例如,CHO细胞或BHK 21细胞)。在一些实施例中,宿主细胞是MARC-145、MDBK、RK-13或EEL细胞。在一些实施例中,宿主细胞是上皮细胞(例如,上皮谱系的细胞系)。
在一些实施例中,将指环载体在连续动物细胞系(例如,可以连续传代的永生化细胞系)中培养。根据本发明的一个实施例,细胞系可以包括猪细胞系。在本发明的背景下设想的细胞系包括永生化猪细胞系,如但不限于猪肾上皮细胞系PK-15和SK、单核髓系细胞系3D4/31和睾丸细胞系ST。
培养条件
可以在适于将遗传元件包封在蛋白质外壳内的条件下,孵育包含遗传元件和蛋白质外壳组分的宿主细胞,从而产生指环载体。合适的培养条件包括例如在实例4、5、7、8、9、10、11或15中任一个中所述的那些条件。在一些实施例中,将宿主细胞在液体培养基(例如,格雷斯补充培养基(TNM-FH)、IPL-41、TC-100、施耐德果蝇培养基、SF-900II SFM或和EXPRESS-FIVETMSFM)中孵育。在一些实施例中,将宿主细胞以贴壁培养形式孵育。在一些实施例中,将宿主细胞以悬浮培养形式孵育。在一些实施例中,将宿主细胞在试管、瓶子、微载剂或烧瓶中孵育。在一些实施例中,将宿主细胞在培养皿或孔(例如,板上的孔)中孵育。在一些实施例中,在适于宿主细胞增殖的条件下孵育宿主细胞。在一些实施例中,在适于宿主细胞将其中产生的指环载体释放到周围上清液中的条件下孵育宿主细胞。
根据本发明的含指环载体的细胞培养物的产生可以以不同的规模进行(例如,在烧瓶、滚瓶或生物反应器中)。用于培养待感染细胞的培养基通常包含细胞存活所需的标准营养物质,但根据细胞类型还可以包含其他营养物质。任选地,培养基可以不含蛋白质和/或不含血清。根据细胞类型,可以将细胞悬浮培养或在基质上培养。在一些实施例中,不同的培养基用于宿主细胞的生长和产生指环载体。
收获
可以收获由宿主细胞产生的指环载体,例如,根据本领域已知的方法。例如,由培养中的宿主细胞释放到周围上清液中的指环载体可以从上清液中收获(例如,如实例4中所述)。在一些实施例中,从宿主细胞中分离出上清液以获得指环载体。在一些实施例中,在收获之前或收获期间裂解宿主细胞。在一些实施例中,指环载体是从宿主细胞裂解物中收获的(例如,如实例10中所述)。在一些实施例中,从宿主细胞裂解物和上清液中收获指环载体。在一些实施例中,根据已知的病毒生产方法来纯化和分离指环载体,例如,如在以下文献中描述的方法:Rinaldi等人,DNA Vaccines:Methods and Protocols(Methods inMolecular Biology)[DNA疫苗:方法和方案(分子生物学方法)],第3版2014,Humana Press[胡马纳出版社](其通过引用以其全文并入本文)。在一些实施例中,在与药用赋形剂一起配制之前,可以通过基于生物物理学特性的溶质分离,例如,离子交换层析或切向流过滤,来收获和/或纯化指环载体。
体外组装方法
指环载体例如,可通过体外(例如在无细胞悬浮液或上清液中)组装产生。在一些实施例中,遗传元件在体外(例如,在允许组装的条件下)与ORF1分子接触。
在一些实施例中,杆状病毒构建体用于产生指环病毒蛋白。然后,这些蛋白质可用于例如在体外组装以包裹遗传元件,例如包含RNA的遗传元件。在一些实施例中,编码一种或多种指环病毒蛋白的多核苷酸与用于在宿主细胞(例如,昆虫或动物细胞)中表达的启动子融合。在一些实施例中,多核苷酸被克隆到杆状病毒表达系统中。在一些实施例中,将宿主细胞(例如,昆虫细胞)用杆状病毒表达系统感染并孵育一段时间。在一些实施例中,将受感染的细胞孵育约1、2、3、4、5、10、15或20天。在一些实施例中,裂解受感染的细胞以回收指环病毒蛋白。
在一些实施例中,将分离的指环病毒蛋白纯化。在一些实施例中,使用纯化技术(包括但不限于螯合纯化、肝素纯化、梯度沉降纯化和/或SEC纯化)来纯化指环病毒蛋白。在一些实施例中,将纯化的指环病毒蛋白与遗传元件混合以包裹遗传元件,例如,包含RNA的遗传元件。在一些实施例中,使用ORF1蛋白、ORF2蛋白或其修饰形式来衣壳化遗传元件。在一些实施例中,两个核酸被包裹。例如,第一核酸可以是mRNA,例如化学修饰的mRNA,并且第二核酸可以是DNA。
在一些实施例中,编码指环病毒(AV)ORF1(例如,野生型ORF1蛋白、含有突变的ORF1蛋白(例如,为了提高组装效率、产率或稳定性)、嵌合ORF1蛋白或其片段)的DNA在昆虫细胞系(例如,Sf9和/或HighFive)、动物细胞系(例如,鸡细胞系(MDCC))、细菌细胞(例如,大肠杆菌)和/或哺乳动物细胞系(例如,293expi和/或MOLT4)中表达。在一些实施例中,编码AV ORF1的DNA可以是未标记的。在一些实施例中,编码AV ORF1的DNA可含有N-末端和/或C-末端融合的标签。在一些实施例中,编码AV ORF1的DNA可在ORF1蛋白内含有突变、插入或缺失以引入标签,例如,以帮助纯化和/或例如通过免疫染色测定(包括但不限于ELISA或免疫印迹)确定身份。在一些实施例中,编码AV ORF1的DNA可单独表达或与任何数量的辅助蛋白组合表达。在一些实施例中,编码AV ORF1的DNA与AV ORF2和/或ORF3蛋白组合表达。
在一些实施例中,含有突变以提高组装效率的ORF1蛋白可包括但不限于含有突变的ORF1蛋白,该突变被引入N-末端精氨酸臂(ARG臂)以改变ARG臂的pI,允许pH敏感性核酸结合以触发颗粒组装(SEQ ID 3-5)。在一些实施例中,含有提高稳定性的突变的ORF1蛋白可包括对接触规范果冻卷β-桶的β链F和G的原聚体间的突变,以改变原聚体表面的疏水状态并改善衣壳形成的热力学有利性。
在一些实施例中,嵌合ORF1蛋白可包括但不限于以下ORF1蛋白,其序列的一部分或多部分用来自另一种衣壳蛋白(例如,喙羽病病毒(BFDV)衣壳蛋白,或戊型肝炎衣壳蛋白)的可比部分替换,例如,Ring 9ORF1的ARG臂或F和Gβ链用来自BFDV衣壳蛋白的可比组分替换。在一些实施例中,嵌合ORF1蛋白还可包括以下ORF1蛋白,其序列的一部分或多部分用另一AV ORF1蛋白的可比部分替换(例如,Ring 2ORF1的果冻卷片段或C-末端部分用Ring9ORF1的可比部分替换)。
在一些实施例中,本披露描述了制备指环载体的方法,该方法包括:(a)提供包含以下的混合物:(i)包含RNA的遗传元件,和(ii)ORF1分子;以及(b)在适合于将遗传元件封闭在包含ORF1分子的蛋白质外壳的条件下孵育该混合物,从而制备指环载体;任选地,其中该混合物不包含在细胞中。在一些实施例中,该方法进一步包括,在提供(a)之前,表达ORF1分子(例如,在宿主细胞(例如,昆虫细胞或哺乳动物细胞)中)。在一些实施例中,表达包括在适合于产生ORF1分子的条件下孵育包含编码ORF1分子的核酸分子(例如,杆状病毒表达载体)的宿主细胞(例如,昆虫细胞或哺乳动物细胞)。在一些实施例中,该方法进一步包括,在提供(a)之前,纯化由宿主细胞表达的ORF1分子。在一些实施例中,该方法在无细胞系统中进行。在一些实施例中,本披露描述了生产指环载体组合物的方法,该方法包括:(a)提供多个根据前述实施例中任一项所述的指环载体或组合物;(b)任选地评价以下多个中的一个或多个:本文所述的污染物、光密度测量(例如,OD 260)、颗粒数(例如,通过HPLC)、感染性(例如,颗粒:感染单位比率,例如,如通过荧光和/或ELISA确定的);以及(c)例如,如果(b)的一个或多个参数满足特定的阈值,则配制多个指环载体,例如,作为适合于向受试者施用的药物组合物。
富集和纯化
可以纯化和/或富集收获的指环载体,例如,以产生指环载体制剂。在一些实施例中,从收获溶液中存在的其他成分或污染物中分离出收获的指环载体,例如,使用本领域已知的纯化病毒颗粒的方法(例如,通过沉降、层析和/或超滤进行纯化)。在一些实施例中,纯化步骤包括从制剂中去除血清、宿主细胞DNA、宿主细胞蛋白质、缺少遗传元件的颗粒和/或酚红中的一种或多种。在一些实施例中,相对于收获溶液中存在的其他成分或污染物,富集收获的指环载体,例如,使用本领域已知的富集病毒颗粒的方法。
在一些实施例中,由此产生的制剂或包含该制剂的药物组合物在可接受的期限和温度范围内是稳定的,和/或与所期望的施用途径和/或该施用途径所期望的任何装置,例如,针头或注射器相容。
II.指环载体
在一些方面,本文所述的本发明包括使用和制备指环载体、指环载体制剂和治疗性组合物的组合物和方法。在一些实施例中,使用如本文所述的组合物和方法制备指环载体。在一些实施例中,指环载体包含一种或多种核酸或多肽,这些核酸或多肽包含基于指环病毒(例如,如本文所述的指环病毒)或者其片段或部分或者其他基本上非致病性病毒(例如,共生病毒(symbiotic virus)、共栖病毒(commensal virus)、原生病毒)的序列、结构和/或功能。在一些实施例中,基于指环病毒的指环载体包含至少一个对该指环病毒而言具有外源性的元件,例如,外源性效应物或编码位于指环载体的遗传元件内的外源性效应物的核酸序列和/或来自除指环病毒以外的病毒(例如,单DNA病毒,例如,称德病毒(例如,单环编码病毒门[例如,雷东多病毒、圆环病毒{例如,猪圆环病毒,例如,PCV-1或PCV-2;或者喙羽症病毒}、双生病毒{例如,番茄金花叶病毒}或矮缩病毒{例如,BBTV、MDV1、SCSVF或FBNYV}]),或者细小病毒(例如,依赖性细小病毒,例如,博卡病毒或AAV))的外源核酸序列。在一些实施例中,基于指环病毒的指环载体包含至少一个针对来自该指环病毒的另一元件具有异源性的元件,例如,效应物编码核酸序列,其针对另一相连的核酸序列,如启动子元件,具有异源性。在一些实施例中,指环载体包含遗传元件(例如,环状DNA,例如,单链DNA),其包含至少一个相对于该遗传元件的其余部分和/或蛋白质外壳而言具有异源性的元件(例如,编码效应物的外源性元件,例如,如本文所述)。指环载体可以是用于使有效载荷进入宿主,例如人类中的递送媒介物(例如,基本上非致病性递送媒介物)。在一些实施例中,指环载体能够在真核细胞例如哺乳动物细胞例如人细胞中复制。在一些实施例中,指环载体在哺乳动物(例如人)细胞中是基本上非致病性的和/或基本上非整合的。在一些实施例中,指环载体在哺乳动物例如人中是基本上非免疫原性的。在一些实施例中,指环载体是复制缺陷型的。在一些实施例中,指环载体是可复制型。
在一些实施例中,指环载体包含愈合子(curon)或其组分(例如,遗传元件,例如,包含编码效应物和/或蛋白质外壳的序列),例如,如PCT申请号PCT/US2018/037379中所述的,其通过引用以其全文并入本文。在一些实施例中,指环载体包含指环载体或其组分(例如,遗传元件,例如,包含编码效应物和/或蛋白质外壳的序列),例如,如PCT申请号PCT/US19/65995中所述的,其通过引用以其全文并入本文。
在一方面,本发明包括指环载体,该指环载体包含(i)包含启动子元件的遗传元件、编码效应物的序列(例如内源性效应物或外源性效应物,例如有效载荷)和蛋白结合序列(例如,外壳蛋白结合序列,例如包装信号),其中该遗传元件是单链DNA,并且具有以下性质中一种或两种:是环状的和/或以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合到真核细胞的基因组中;以及(ii)蛋白质外壳;其中该遗传元件被包封在蛋白质外壳内;并且其中该指环载体能够将遗传元件递送到真核细胞中。
在本文描述的指环载体的一些实施例中,遗传元件以少于进入细胞的遗传元件的约0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、1.5%或2%的频率整合。在一些实施例中,施用给受试者的多个指环载体的少于约0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%或5%的遗传元件将整合到受试者的一个或多个宿主细胞的基因组中。在一些实施例中,指环载体,例如,如本文所述的指环载体群体的遗传元件整合到宿主细胞基因组中的频率低于同类的AAV病毒群体的频率,例如,其频率比同类的AAV病毒群体低约50%、60%、70%、75%、80%、85%、90%、95%、100%或更多。
在一方面,本发明包括指环载体,该指环载体包含:(i)遗传元件,其包含启动子元件和编码效应物(例如,内源性效应物或外源性效应物,例如,有效载荷)的序列,以及蛋白结合序列(例如,外壳蛋白结合序列),其中该遗传元件与野生型指环病毒序列(例如,野生型细环病毒(TTV)、小细环病毒(TTMV)或TTMDV序列,例如,如本文所述的野生型指环病毒序列)具有至少75%(例如,至少75%、76%、77%、78%、79%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)序列同一性;以及(ii)蛋白质外壳;其中该遗传元件被包封在蛋白质外壳内;并且其中该指环载体能够将遗传元件递送到真核细胞中。
在一个方面中,本发明包括指环载体,该指环载体包含:
a)遗传元件,其包含(i)编码外壳蛋白(例如,非致病性外壳蛋白)的序列,(ii)使该遗传元件与该非致病性外壳蛋白结合的外壳蛋白结合序列,和(iii)编码效应物(例如,内源性效应物或外源性效应物)的序列;以及
b)蛋白质外壳,其与该遗传元件相关联,例如,包裹或包封该遗传元件。
在一些实施例中,指环载体包括来自非包膜环状单链DNA病毒的序列或表达产物(或与其具有>70%、75%、80%、85%、90%、95%、97%、98%、99%、100%同源性)。动物性环状单链DNA病毒通常是指感染真核非植物宿主并具有环状基因组的单链DNA(ssDNA)病毒亚群。因此,动物性环状ssDNA病毒可区别于感染原核生物的ssDNA病毒(即,微小噬菌体科和丝状噬菌体科)和感染植物的ssDNA病毒(即,双生病毒科和矮化病毒科)。它们也可区别于感染非植物真核生物的线性ssDNA病毒(即,细小病毒科)。
在一些实施例中,指环载体调节宿主细胞功能,例如,短暂或长期调节。在某些实施例中,细胞功能发生稳定改变,例如持续存在以下时间的调节:至少约1小时至约30天,或至少约2小时、6小时、12小时、18小时、24小时、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、16天、17天、18天、19天、20天、21天、22天、23天、24天、25天、26天、27天、28天、29天、30天、60天或更长时间或者其间的任何时间。在某些实施例中,细胞功能发生短暂改变,例如持续存在以下时间的调节:不超过约30分钟至约7天,或不超过约1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、24小时、36小时、48小时、60小时、72小时、4天、5天、6天、7天或其间的任何时间。
在一些实施例中,遗传元件包括启动子元件。在实施例中,启动子元件选自RNA聚合酶II依赖性启动子、RNA聚合酶III依赖性启动子、PGK启动子、CMV启动子、EF-1α启动子、SV40启动子、CAGG启动子或UBC启动子、TTV病毒启动子、组织特异性启动子、U6(pollIII)、具有活化蛋白(TetR-VP16、Gal4-VP16、dCas9-VP16等)的上游DNA结合位点的最小CMV启动子。在实施例中,启动子元件包含TATA盒。在实施例中,启动子元件对于野生型指环病毒,例如,如本文所述的野生型指环病毒而言是内源性的。
在一些实施例中,遗传元件包括以下特征中的一种或多种:单链、环状、负链和/或DNA。在实施例中,遗传元件包括附加体。在一些实施例中,除效应物之外的遗传元件部分的组合大小为约2.5kb-5kb(例如,约2.8kb-4kb、约2.8kb-3.2kb、约3.6kb-3.9kb或约2.8kb-2.9kb)、小于约5kb(例如,小于约2.9kb、3.2kb、3.6kb、3.9kb或4kb)或至少100个核苷酸(例如,至少1kb)。
在一些情况下,如本文所述的指环载体、包含指环载体的组合物、使用这样的指环载体的方法等部分基于实例,这些实例说明了不同的效应物(例如,miRNA(例如,针对IFN或miR-625)、shRNA等)和蛋白结合序列(例如,与衣壳蛋白如Q99153结合的DNA序列)如何与蛋白质外壳(例如,在Arch Virol[病毒学档案](2007)152:1961-1975中披露的衣壳)组合,以产生随后可用于将效应物递送至细胞(例如,动物细胞,例如,人细胞或非人动物细胞,如猪或小鼠细胞)的指环载体。在实施例中,效应物可以沉默某种因子如干扰素的表达。实例进一步描述了如何通过可以将效应物插入序列,例如,衍生自指环病毒的序列中来制备指环载体。正是基于这些实例,下文中的描述设想了实例中所考虑的具体发现和组合的各种变型。例如,技术人员将从实例中理解的是,特定miRNA仅用作效应物的实例,而其他效应物可以是例如其他调节性核酸或治疗性肽。类似地,实例中使用的特定衣壳可以替换为下文所述的基本上非致病性蛋白质。在实例中描述的特定指环病毒序列也可以替换为下文描述的指环病毒序列。这些考虑同样适用于蛋白结合序列、调节性序列如启动子等。独立于此,本领域技术人员将特别考虑与实例紧密相关的这些实施例。
在一些实施例中,将指环载体或指环载体中包含的遗传元件引入细胞(例如,人细胞)中。在一些实施例中,例如由指环载体的遗传元件编码的效应物(例如,RNA,例如miRNA)在细胞(例如,人细胞)中表达,例如,一旦将指环载体或遗传元件引入细胞中。在实施例中,将指环载体或其中包含的遗传元件引入细胞中例如通过改变细胞中靶分子的表达水平,来调节(例如,增加或减少)靶分子(例如,靶核酸,例如RNA,或靶多肽)在细胞中的水平。在实施例中,引入指环载体或其中包含的遗传元件降低了细胞产生的干扰素的水平。在实施例中,将指环载体或其中包含的遗传元件引入细胞中调节(例如,增加或减少)细胞的功能。在实施例中,将指环载体或其中包含的遗传元件引入细胞中调节(例如,增加或降低)细胞的活力。在实施例中,将指环载体或其中包含的遗传元件引入细胞中降低了细胞(例如癌细胞)的活力。
在一些实施例中,本文所述的指环载体(例如,合成指环载体)诱发的抗体阳性率低于70%(例如,低于约60%、50%、40%、30%、20%或10%的抗体阳性率)。在实施例中,根据本领域已知的方法确定抗体阳性率。在实施例中,通过检测生物样品中针对指环病毒(例如,如本文所述)或基于其的指环载体的抗体来测抗体阳性率,例如,根据Tsuda等人(1999;J.Virol.Methods[病毒学方法杂志]77:199-206;其通过引用并入本文)中描述的抗TTV抗体检测方法和/或Kakkola等人(2008;Virology[病毒学]382:182-189;其通过引用并入本文)中描述的用于测定抗TTV IgG血清阳性率的方法。还可以通过本领域用于检测抗病毒抗体的方法来检测针对指环病毒或基于指环病毒的指环载体的抗体,这些方法是例如检测抗AAV抗体的方法,例如,如Calcedo等人(2013;Front.Immunol.[免疫学前沿]4(341):1-7;其通过引用并入本文)中所述。
在一些实施例中,复制缺损型、复制缺陷型或非复制型遗传元件不编码遗传元件复制所需的所有必要机构或组分。在一些实施例中,复制缺陷型遗传元件不编码复制因子。在一些实施例中,复制缺陷型遗传元件不编码一种或多种ORF(例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3,例如,如本文所述)。在一些实施例中,可以以反式提供不由遗传元件编码的机构或组分(例如,使用辅助物,例如辅助病毒或辅助质粒,或者在由宿主细胞包含的核酸中编码,例如整合到宿主细胞的基因组中),例如,使得遗传元件可以在以反式提供的机构或组分存在的情况下进行复制。
在一些实施例中,包装缺损型、包装缺陷型或非包装型遗传元件不能被包装到蛋白质外壳(例如,其中蛋白质外壳包含衣壳或其部分,例如,包含由ORF1核酸编码的多肽,例如,如本文所述)中。在一些实施例中,与野生型指环病毒(例如,如本文所述)相比,包装缺损型遗传元件被包装到蛋白质外壳中的效率低于10%(例如,低于10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%或0.001%)。在一些实施例中,即使在存在允许包装野生型指环病毒遗传元件(例如,如本文所述)的因子(例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、或ORF2t/3)的情况下,包装缺陷型遗传元件也不能被包装到蛋白质外壳中。在一些实施例中,即使在存在允许包装野生型指环病毒遗传元件(例如,如本文所述)的因子(例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3或ORF2t/3)的情况下,与野生型指环病毒(例如,如本文所述)相比,包装缺损型遗传元件被包装到蛋白质外壳中的效率也低于10%(例如,低于10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.1%、0.01%或0.001%)。
在一些实施例中,可包装型遗传元件可被包装到蛋白质外壳(例如,其中蛋白质外壳包含衣壳或其部分,例如,包含由ORF1核酸编码的多肽,例如,如本文所述)中。在一些实施例中,与野生型指环病毒(例如,如本文所述)相比,可包装型遗传元件被包装到蛋白质外壳中的效率为至少20%(例如,至少20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%或更高)。在一些实施例中,在存在允许包装野生型指环病毒遗传元件(例如,如本文所述)的因子(例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、或ORF2t/3)的情况下,可包装型遗传元件可以被包装到蛋白质外壳中。在一些实施例中,在存在允许包装野生型指环病毒遗传元件(例如,如本文所述)的因子(例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3或ORF2t/3)的情况下,与野生型指环病毒(例如,如本文所述)相比,可包装型遗传元件被包装到蛋白质外壳中的效率为至少20%(例如,至少20%、30%、40%、50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%或更高)。
指环病毒
在一些实施例中,指环载体,例如,如本文所述的指环载体包含衍生自指环病毒的序列或表达产物。在一些实施例中,指环载体包括一个或多个相对于指环病毒而言具有外源性的序列或表达产物。在一些实施例中,指环载体包括一个或多个相对于指环病毒而言具有内源性的序列或表达产物。在一些实施例中,指环载体包括一个或多个相对于指环载体中一个或多个其他序列或表达产物而言具有异源性的序列或表达产物。指环病毒通常具有负极性的单链环状DNA基因组。指环病毒通常与任何人类疾病都无关联。然而,试图将指环病毒感染与人类疾病联系起来的努力受到以下因素的妨碍:在一个或多个对照队列群体中无症状指环病毒病毒血症的高发生率、指环病毒病毒家族内显著的基因组多样性、历史上无法在体外繁殖该病原体以及缺乏指环病毒疾病的一种或多种动物模型(Yzebe等人,Panminerva Med.[意大利医学会志](2002)44:167-177;Biagini,P.,Vet.Microbiol[兽医微生物学](2004)98:95-101)。
指环病毒通常是通过口鼻或粪口感染、母婴传播和/或子宫内传播而传播的(Gerner等人,Ped.Infect.Dis.J.[儿科传染病杂志](2000)19:1074-1077)。在一些情况下,感染者的特征可能是长期(数月至数年)的指环病毒病毒血症。人可以共同感染一种以上的基因群或株(Saback,等人,Scad.J.Infect.Dis.[斯堪的纳维亚感染病杂志](2001)33:121-125)。有建议认为这些基因群可以在感染的人内重组(Rey等人,Infect.[感染](2003)31:226-233)。双链同工型(可复制)中间体已在多种组织中发现,如肝脏、外周血单个核细胞和骨髓(Kikuchi等人,J.Med.Virol.[医学病毒学杂志](2000)61:165-170;Okamoto等人,Biochem.Biophys.Res.Commun.[生物化学与生物物理研究通讯](2002)270:657-662;Rodriguez-lnigo等人,Am.J.Pathol.[美国病理学杂志](2000)156:1227-1234)。
在一些实施例中,遗传元件包含编码以下的核苷酸序列:氨基酸序列或其功能性片段或与本文所述的氨基酸序列中任一个(例如,指环病毒氨基酸序列)具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,如本文所述的指环载体包含一种或多种核酸分子(例如,如本文所述的遗传元件),这些核酸分子包含与指环病毒序列,例如,如本文所述的指环病毒序列或者其片段具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,如本文所述的指环载体包含一种或多种核酸分子(例如,如本文所述的遗传元件),这些核酸分子包含与指环病毒(例如,如本文所述的指环病毒)的TATA盒、加帽位点、起始元件、转录起始位点、5’UTR保守结构域、ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3、三个开放阅读框区域、多(A)信号、GC富集区或其任何组合中的一种或多种具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,核酸分子包含编码衣壳蛋白,例如,本文所述任一指环病毒的ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3的序列。在实施例中,核酸分子包含编码衣壳蛋白的序列,该衣壳蛋白包含与指环病毒ORF1蛋白(或者其剪接变体或功能性片段)或由指环病毒ORF1核酸编码的多肽具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在实施例中,核酸分子包含与表A1的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒ORF2t/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表A1的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表B1的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B1的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表B3的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表B3的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表C1的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒TAIP核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表C1的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表E1的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表E1的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表F1的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F1的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表F3的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F3的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在实施例中,核酸分子包含与表F5的指环病毒ORF1核酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒ORF1/1核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒ORF1/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒ORF2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒ORF2/2核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒ORF2/3核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒TATA盒核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒起始元件核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒转录起始位点核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒5’UTR保守结构域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒三个开放阅读框区域核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒多(A)信号核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。在实施例中,核酸分子包含与表F5的指环病毒GC富集核苷酸序列具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列。
在一些实施例中,遗传元件包含编码以下的核苷酸序列:氨基酸序列或其功能性片段或与本文所述的氨基酸序列中任一个(例如,指环病毒氨基酸序列)具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,如本文所述的指环载体包含一种或多种核酸分子(例如,如本文所述的遗传元件),这些核酸分子包含与指环病毒序列,例如,如本文所述的指环病毒序列或者其片段具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,指环载体包含选自如表A1-M2中任一个所示的序列或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列的核酸序列。在实施例中,指环载体包含多肽,该多肽包含表A2-M2中任一个所示的序列,或与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,如本文所述的指环载体包含一种或多种核酸分子(例如,如本文所述的遗传元件),这些核酸分子包含与本文所述的指环病毒中任一个的TATA盒、加帽位点、起始元件、转录起始位点、5’UTR保守结构域、ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3、三个开放阅读框区域、多(A)信号、GC富集区或其任何组合中的一种或多种具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列(例如,表A-M中任一个所注释的指环病毒序列或表A-M中任一个所列序列编码的指环病毒序列)。在一些实施例中,核酸分子包含编码衣壳蛋白,例如,本文所述任一指环病毒的ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3序列(例如,表A-M中任一个所注释的指环病毒序列或表A-M中任一个所列序列编码的指环病毒序列)。在实施例中,核酸分子包含编码衣壳蛋白的序列,该衣壳蛋白包含与指环病毒ORF1或ORF2蛋白(例如,表A2-M2中任一个所示的ORF1或ORF2氨基酸序列,或者由表A1-M1中任一个所示的核酸序列编码的ORF1或ORF2氨基酸序列)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在实施例中,核酸分子包含编码衣壳蛋白的序列,该衣壳蛋白包含与指环病毒ORF1蛋白(例如,表A2-M2中任一个所示的ORF1氨基酸序列,或者由表A1-M1中任一个所示的核酸序列编码的ORF1氨基酸序列)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一些实施例中,如本文所述的指环载体是嵌合指环载体。在一些实施例中,嵌合指环载体进一步包含一种或多种来自除指环病毒以外的病毒的元件、多肽或核酸。
在实施例中,嵌合指环载体包含多种多肽(例如,指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3),这些多肽包含来自多种不同指环病毒(例如,如本文所述的指环病毒)的序列。例如,嵌合指环载体可以包含来自一种指环病毒的ORF1分子(例如,Ring1 ORF1分子,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1分子);和来自不同指环病毒的ORF2分子(例如,Ring2 ORF2分子,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2分子)。在另一实例中,嵌合指环载体可以包含来自一种指环病毒的第一ORF1分子(例如,Ring1 ORF1分子,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1分子)和来自不同指环病毒的第二ORF1分子(例如,Ring2 ORF1分子,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1分子)。
在一些实施例中,指环载体包含嵌合多肽(例如,指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3),例如,该嵌合多肽包含至少一个来自一种指环病毒(例如,如本文所述)的部分和至少一个来自不同病毒(例如,如本文所述)的部分。
在一些实施例中,指环载体包含嵌合多肽(例如,指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3),例如,该嵌合多肽包含至少一个来自一种指环病毒(例如,如本文所述)的部分和至少一个来自不同指环病毒(例如,如本文所述)的部分。在实施例中,指环载体包含嵌合ORF1分子,其包含来自一种指环病毒(例如,如本文所述)的ORF1分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF1分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1分子的至少一个部分。在实施例中,嵌合ORF1分子包含来自一种指环病毒的ORF1胶冻卷结构域,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列;和来自不同指环病毒的ORF1氨基酸子序列(例如,如本文所述)或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,嵌合ORF1分子包含来自一种指环病毒的ORF1精氨酸富集区,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列;和来自不同指环病毒的ORF1氨基酸子序列(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,嵌合ORF1分子包含来自一种指环病毒的ORF1高变结构域,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列;和来自不同指环病毒的ORF1氨基酸子序列(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,嵌合ORF1分子包含来自一种指环病毒的ORF1N22结构域,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列;和来自不同指环病毒的ORF1氨基酸子序列(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,嵌合ORF1分子包含来自一种指环病毒的ORF1 C-末端结构域,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列;和来自不同指环病毒的ORF1氨基酸子序列(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。
在实施例中,指环载体包含嵌合ORF1/1分子,其包含来自一种指环病毒(例如,如本文所述)的ORF1/1分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1/1分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF1/1分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1/1分子的至少一个部分。在实施例中,指环载体包含嵌合ORF1/2分子,其包含来自一种指环病毒(例如,如本文所述)的ORF1/2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1/2分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF1/2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF1/2分子的至少一个部分。在实施例中,指环载体包含嵌合ORF2分子,其包含来自一种指环病毒(例如,如本文所述)的ORF2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2分子的至少一个部分。在实施例中,指环载体包含嵌合ORF2/2分子,其包含来自一种指环病毒(例如,如本文所述)的ORF2/2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2/2分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF2/2分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2/2分子的至少一个部分。在实施例中,指环载体包含嵌合ORF2/3分子,其包含来自一种指环病毒(例如,如本文所述)的ORF2/3分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2/3分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF2/3分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2/3分子的至少一个部分。在实施例中,指环载体包含嵌合ORF2T/3分子,其包含来自一种指环病毒(例如,如本文所述)的ORF2T/3分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2T/3分子的至少一个部分,和来自不同指环病毒(例如,如本文所述)的ORF2T/3分子或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%氨基酸序列同一性的ORF2T/3分子的至少一个部分。
例如,在PCT申请号PCT/US2018/037379和PCT/US19/65995(其通过引用以其全文并入本文)中描述了其他示例性指环病毒基因组,其中包含的序列或子序列可用于本文所述的组合物和方法中(例如,以形成指环载体的遗传元件,例如,如本文所述)。在一些实施例中,示例性指环病毒序列包含如PCT/US19/65995(其通过引用并入本文)的表A1、A3、A5、A7、A9、A11、B1-B5、1、3、5、7、9、11、13、15或17中任一个所列的核酸序列。在一些实施例中,示例性指环病毒序列包含如PCT/US19/65995(其通过引用并入本文)的表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中任一个所列的氨基酸序列。在一些实施例中,示例性指环病毒序列包含ORF1分子序列或编码其的核酸序列,例如,如PCT/US19/65995(其通过引用并入本文)的表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10或37A-37C中任一个所列。
表A1.示例性指环病毒核酸序列(甲型细环病毒,分支3)
注释:
表A2.示例性指环病毒氨基酸序列(甲型细环病毒,分支3)
表B1.示例性指环病毒核酸序列(乙型细环病毒)
注释:
表B2.示例性指环病毒氨基酸序列(乙型细环病毒)
表B3.示例性指环病毒核酸序列(丙型细环病毒)
注释:
表B4.示例性指环病毒氨基酸序列(丙型细环病毒)
表C1.示例性指环病毒核酸序列(丙型细环病毒)
注释:
表C2.示例性指环病毒氨基酸序列(丙型细环病毒)
表E1:示例性指环病毒核酸序列(甲型细环病毒)-分支1
注释:
表D2.示例性指环病毒氨基酸序列(甲型细环病毒)分支1
表F1.示例性指环病毒核酸序列(乙型细环病毒)
注释:
表F2:示例性指环病毒氨基酸序列(乙型细环病毒)
表F3:示例性指环病毒核酸序列(乙型细环病毒)
注释:
表F4:示例性指环病毒氨基酸序列(乙型细环病毒)
表F5:示例性指环病毒核酸序列(甲型细环病毒,分支4)
注释:
表F6:示例性指环病毒氨基酸序列(甲型细环病毒)
在一些实施例中,指环载体包含核酸,该核酸包含在PCT申请号PCT/US 2018/037379(其通过引用以其全文并入本文)中列出的序列。在一些实施例中,指环载体包含多肽,该多肽包含在PCT申请号PCT/US2018/037379(其通过引用以其全文并入本文)中列出的序列。在一些实施例中,指环载体包含核酸,该核酸包含在PCT申请号PCT/US19/65995(其通过引用以其全文并入本文)中列出的序列。在一些实施例中,指环载体包含多肽,该多肽包含在PCT申请号PCT/US19/65995(其通过引用以其全文并入本文)中列出的序列。
ORF1分子
在一些实施例中,指环载体包含ORF1分子和/或编码ORF1分子的核酸。通常,ORF1分子包括具有指环病毒ORF1蛋白(例如,如本文所述的指环病毒ORF1蛋白)的结构特征和/或活性的多肽。在一些实施例中,ORF1分子包含相对于指环病毒ORF1蛋白(例如,如本文所述的指环病毒ORF1蛋白)的截短。ORF1分子可能能够与其他ORF1分子结合,例如,以形成蛋白质外壳(例如,如本文所述的蛋白质外壳),例如,衣壳。在一些实施例中,蛋白质外壳可以包封核酸分子(例如,如本文所述的遗传元件)。在一些实施例中,多个ORF1分子可形成多聚体,例如,以形成蛋白质外壳。在一些实施例中,多聚体可以是同型多聚体。在其他实施例中,多聚体可以是异型多聚体。
在一些实施例中,ORF1分子可包含以下中的一种或多种:包含精氨酸富集区的第一区域,例如具有至少60%的碱性残基(例如,至少60%、65%、70%、75%、80%、85%、90%、95%或100%碱性残基;例如,60%-90%、60%-80%、70%-90%或70-80%的碱性残基)的区域,以及包含胶冻卷结构域的第二区域,例如至少六个β链(例如,4、5、6、7、8、9、10、11或12个β链)。
精氨酸富集区
精氨酸富集区与本文所述的精氨酸富集区序列或者包含至少60%、70%或80%碱性残基(例如,精氨酸、赖氨酸或其组合)的至少约40个氨基酸的序列具有至少70%(例如,至少约70%、80%、90%、95%、96%、97%、98%、99%或100%)序列同一性。
胶冻卷结构域
胶冻卷结构域或区域包含(例如,由其组成)具有以下特征中一种或多种(例如,1、2或3种)的多肽(例如,较大多肽中包含的结构域或区域):
(i)胶冻卷结构域的至少30%(例如,至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、90%或更多)的氨基酸是一个或多个β-折叠的部分;
(ii)胶冻卷结构域的二级结构包含至少四个(例如,至少4、5、6、7、8、9、10、11或12个)个β-链;和/或
(iii)胶冻卷结构域的三级结构包含至少两个(例如,至少2、3或4个)β-折叠;和/或
(iv)胶冻卷结构域包含β-折叠与α-螺旋的比例为至少2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。
在某些实施例中,胶冻卷结构域包含两个β-折叠。
在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含约八个(例如,4、5、6、7、8、9、10、11或12个)β-链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含八个β-链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含七个β-链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含六个β-链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含五个β-链。在某些实施例中,一个或多个(例如,1、2、3、4、5、6、7、8、9或10个)β-折叠包含四个β-链。
在一些实施例中,胶冻卷结构域包含与第二β-折叠反向平行取向的第一β-折叠。在某些实施例中,第一β-折叠包含约四个(例如,3、4、5或6个)β-链。在某些实施例中,第二β-折叠包含约四个(例如,3、4、5或6个)β-链。在实施例中,第一和第二β-折叠总共包含约八个(例如,6、7、8、9、10、11或12个)β-链。
在某些实施例中,胶冻卷结构域是衣壳蛋白(例如,如本文所述的ORF1分子)的组分。在某些实施例中,胶冻卷结构域具有自组装活性。在一些实施例中,包含胶冻卷结构域的多肽与另一拷贝的包含胶冻卷结构域的多肽结合。在一些实施例中,第一多肽的胶冻卷结构域与该多肽的第二拷贝的胶冻卷结构域结合。
N22结构域
ORF1分子还可包括包含指环病毒N22结构域(例如,如本文所述的,例如,来自如本文所述的指环病毒ORF1蛋白的N22结构域)的结构或活性的第三区域,和/或包含指环病毒C-末端结构域(CTD)(例如,如本文所述的,例如,来自如本文所述的指环病毒ORF1蛋白的CTD)的结构或活性的第四区域。在一些实施例中,ORF1分子按照N-末端到C-末端的顺序包含该第一、第二、第三和第四区域。
高变区(HVR)
在一些实施例中,ORF1分子可以进一步包含高变区(HVR),例如来自指环病毒ORF1蛋白(例如,如本文所述)的HVR。在一些实施例中,HVR位于该第二区域和该第三区域之间。在一些实施例中,HVR包含至少约55个(例如,至少约45、50、51、52、53、54、55、56、57、58、59、60或65个)氨基酸(例如,约45-160、50-160、55-160、60-160、45-150、50-150、55-150、60-150、45-140、50-140、55-140或60-140个氨基酸)。
示例性ORF1序列
下表中提供了示例性指环病毒ORF1氨基酸序列和示例性ORF1结构域的序列。在一些实施例中,本文所述的多肽(例如,ORF1分子)包含与一个或多个指环病毒ORF1子序列(例如,如表N-Z中任一个所述)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,本文所述的指环载体包含ORF1分子,该分子包含与一种或多种指环病毒ORF1子序列(例如,如表N-Z中任一个所述)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,本文所述的指环载体包含编码ORF1分子的核酸分子(例如,遗传元件),该分子包含与一种或多种指环病毒ORF1子序列(例如,如表N-Z中任一个所述)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一些实施例中,一个或多个指环病毒ORF1子序列包含精氨酸(Arg)富集结构域、胶冻卷结构域、高变区(HVR)、N22结构域或C-末端结构域(CTD)中的一种或多种(例如,如表N-Z中任一个所列的),或与其具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,ORF1分子包含来自不同指环病毒的多个子序列(例如,选自表N-Z中所列的甲型细环病毒分支1-7子序列中ORF1子序列的任何组合)。在实施例中,ORF1分子包含来自一种指环病毒的Arg富集结构域、胶冻卷结构域、N22结构域和CTD中的一种或多种,以及来自另一种指环病毒的HVR。在实施例中,ORF1分子包含来自一种指环病毒的胶冻卷结构域、HVR、N22结构域和CTD中的一种或多种,以及来自另一种指环病毒的Arg富集结构域。在实施例中,ORF1分子包含来自一种指环病毒的Arg富集结构域、HVR、N22结构域和CTD中的一种或多种,以及来自另一种指环病毒的胶冻卷结构域。在实施例中,ORF1分子包含来自一种指环病毒的Arg富集结构域、胶冻卷结构域、HVR和CTD中的一种或多种,以及来自另一种指环病毒的N22结构域。在实施例中,ORF1分子包含来自一种指环病毒的Arg富集结构域、胶冻卷结构域、HVR和N22结构域中的一种或多种,以及来自另一种指环病毒的CTD。
例如,在PCT申请号PCT/US2018/037379和PCT/US19/65995(其通过引用以其全文并入本文)中描述了其他示例性指环病毒,这些指环病毒的ORF1分子或者其剪接变体或功能性片段可用于本文所述组合物和方法中,例如,以形成指环载体的蛋白质外壳,例如,通过包封遗传元件。
表N.示例性指环病毒ORF1氨基酸子序列(甲型细环病毒,分支3)
注释:
表O.示例性指环病毒ORF1氨基酸子序列(甲型细环病毒,分支3)
表P.示例性指环病毒ORF1氨基酸子序列(乙型细环病毒)
注释:
表Q.示例性指环病毒ORF1氨基酸子序列(乙型细环病毒)
表D1.示例性指环病毒ORF1氨基酸子序列(丙型细环病毒)
注释:
表D2.示例性指环病毒ORF1氨基酸子序列(丙型细环病毒)
表R.示例性指环病毒ORF1氨基酸子序列(丙型细环病毒)
注释:
表S.示例性指环病毒ORF1氨基酸子序列(丙型细环病毒)
表D5.示例性指环病毒ORF1氨基酸子序列(甲型细环病毒)分支1
注释:
表D6.示例性指环病毒ORF1氨基酸子序列(甲型细环病毒)分支1
在一些实施例中,第一区域可以结合核酸分子(例如,DNA)。在一些实施例中,碱性残基选自精氨酸、组氨酸或赖氨酸,或其组合。在一些实施例中,第一区域包含至少60%、65%、70%、75%、80%、85%、90%、95%或100%的精氨酸残基(例如,60%-90%、60%-80%、70%-90%或70%-80%精氨酸残基)。在一些实施例中,第一区域包含约30-120个氨基酸(例如,约40-120、40-100、40-90、40-80、40-70、50-100、50-90、50-80、50-70、60-100、60-90或60-80个氨基酸)。在一些实施例中,第一区域包含病毒ORF1精氨酸富集区(例如,来自指环病毒ORF1蛋白的精氨酸富集区,例如,如本文所述)的结构或活性。在一些实施例中,第一区域包含核定位信号。
在一些实施例中,第二区域包含胶冻卷结构域,例如,病毒ORF1胶冻卷结构域的结构或活性(例如,来自指环病毒ORF1蛋白的胶冻卷结构域,例如,如本文所述)。在一些实施例中,第二区域能够与另一ORF1分子的第二区域结合,例如,以形成蛋白质外壳(例如,衣壳)或其部分。
在一些实施例中,第四区域暴露在蛋白质外壳(例如,包含ORF1分子的多聚体的蛋白质外壳,例如,如本文所述)的表面上。
在一些实施例中,第一区域、第二区域、第三区域、第四区域和/或HVR各自包含少于四个(例如,0、1、2或3个)个β折叠。
在一些实施例中,第一区域、第二区域、第三区域、第四区域和/或HVR中的一个或多个可以由异源氨基酸序列(例如,来自异源ORF1分子的相应区域)替换。在一些实施例中,异源氨基酸序列具有所期望的功能,例如,如本文所述的。
在一些实施例中,ORF1分子包含多个保守基序(例如,包含约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100个或更多个氨基酸的基序)(例如,如PCT/US19/65995的图34所示)。在一些实施例中,保守基序可以显示出与一种或多种野生型指环病毒分支(例如,甲型细环病毒,分支1;甲型细环病毒,分支2;甲型细环病毒,分支3;甲型细环病毒,分支4;甲型细环病毒,分支5;甲型细环病毒,分支6;甲型细环病毒,分支7;乙型细环病毒;和/或丙型细环病毒)的ORF1蛋白存在60%、70%、80%、85%、90%、95%或100%序列同一性。在实施例中,每个保守基序的长度为1-1000个(例如,5-10、5-15、5-20、10-15、10-20、15-20、5-50、5-100、10-50、10-100、10-1000、50-100、50-1000或100-1000个)氨基酸。在某些实施例中,保守基序由约2%-4%(例如,约1%-8%、1%-6%、1%-5%、1%-4%、2%-8%、2%-6%、2%-5%或2%-4%)的ORF1分子序列组成,并且每个都显示出与野生型指环病毒分支的ORF1蛋白中相应基序存在100%序列同一性。在某些实施例中,保守基序由约5%-10%(例如,约1%-20%、1%-10%、5%-20%或5%-10%)的ORF1分子序列组成,并且每个都显示出与野生型指环病毒分支的ORF1蛋白中相应基序存在80%序列同一性。在某些实施例中,保守基序由约10%-50%(例如,约10%-20%、10%-30%、10%-40%、10%-50%、20%-40%、20%-50%或30%-50%)的ORF1分子序列组成,并且每个都显示出与野生型指环病毒分支的ORF1蛋白中相应基序存在60%序列同一性。在一些实施例中,保守基序包含一个或多个如表19中所列的氨基酸序列。
在一些实施例中,ORF1分子包含相对于野生型ORF1蛋白(例如,如本文所述)的至少一个差异(例如,突变、化学修饰或表观遗传改变)。
N22结构域中的保守ORF1基序
在一些实施例中,本文所述的多肽(例如,ORF1分子)包含氨基酸序列YNPX2DXGX2N(SEQ ID NO:829),其中Xn是任何n个氨基酸的连续序列。例如,X2表示任何两个氨基酸的连续序列。在一些实施例中,YNPX2DXGX2N(SEQ ID NO:829)包含在ORF1分子的N22结构域(例如,如本文所述)内。在一些实施例中,本文所述的遗传元件包含编码氨基酸序列YNPX2DXGX2N(SEQ ID NO:829)的核酸序列(例如,编码ORF1分子的核酸序列,例如,如本文所述),其中Xn是任何n个氨基酸的连续序列。
在一些实施例中,多肽(例如,ORF1分子)包含保守的二级结构,例如,侧接和/或包含YNPX2DXGX2N(SEQ ID NO:829)基序的一部分,例如,在N22结构域中。在一些实施例中,保守二级结构包含第一β链和/或第二β链。在一些实施例中,第一β链的长度为约5-6个(例如,3、4、5、6、7或8个)氨基酸。在一些实施例中,第一β链包含位于YNPX2DXGX2N(SEQ ID NO:829)基序的N-末端的酪氨酸(Y)残基。在一些实施例中,YNPX2DXGX2N(SEQ ID NO:829)基序包含无规则卷曲(例如,约8-9个氨基酸的无规则卷曲)。在一些实施例中,第二β链的长度为约7-8个(例如,5、6、7、8、9或10个)氨基酸。在一些实施例中,第二β链包含位于YNPX2DXGX2N(SEQID NO:829)基序的C-末端的天冬酰胺(N)残基。
PCT/US19/65995的实例47和图48中描述了示例性YNPX2DXGX2N(SEQ ID NO:829)基序侧翼二级结构;其通过引用以其全文并入本文。在一些实施例中,ORF1分子包含如下区域,该区域包含PCT/US19/65995的图48中所示的一个或多个(例如,1、2、3、4、5、6、7、8、9、10个或全部)二级结构元件(例如,β链)。在一些实施例中,ORF1分子包含如下区域,该区域包含PCT/US19/65995的图48中所示的一个或多个(例如,1、2、3、4、5、6、7、8、9、10个或全部)二级结构元件(例如,β链),位于YNPX2DXGX2N(SEQ ID NO:829)基序(例如,如本文所述)的侧翼。
ORF1胶冻卷结构域中的保守二级结构基序
在一些实施例中,本文所述的多肽(例如,ORF1分子)包含一个或多个由指环病毒ORF1蛋白(例如,如本文所述)所包含的二级结构元件。在一些实施例中,ORF1分子包含一个或多个由指环病毒ORF1蛋白(例如,如本文所述)的胶冻卷结构域所包含的二级结构元件。通常,ORF1胶冻卷结构域包含二级结构,该二级结构按照从N-末端到C-末端的方向依次包含第一β链、第二β链、第一α螺旋、第三β链、第四β链、第五β链、第二α螺旋、第六β链、第七β链、第八β链和第九β链。在一些实施例中,ORF1分子包含二级结构,该二级结构按照从N-末端到C-末端的方向依次包含第一β链、第二β链、第一α螺旋、第三β链、第四β链、第五β链、第二α螺旋、第六β链、第七β链、第八β链和/或第九β链。
在一些实施例中,一对保守的二级结构元件(即,β链和/或α螺旋)由间隙氨基酸序列隔开,例如,包含无规则卷曲序列、β链或α螺旋,或其组合。保守二级结构元件之间的间隙氨基酸序列可包含例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个氨基酸。在一些实施例中,ORF1分子可进一步包含一个或多个另外的β链和/或α螺旋(例如,在胶冻卷结构域中)。在一些实施例中,可以组合连续的β链或连续的α螺旋。在一些实施例中,第一β链和第二β链包含在更大的β链中。在一些实施例中,第三β链和第四β链包含在更大的β链中。在一些实施例中,第四β链和第五β链包含在更大的β链中。在一些实施例中,第六β链和第七β链包含在更大的β链中。在一些实施例中,第七条β链和第八条β链包含在更大的β链中。在一些实施例中,第八β链和第九β链包含在更大的β链中。
在一些实施例中,第一β链的长度为约5-7个(例如,3、4、5、6、7、8、9或10个)氨基酸。在一些实施例中,第二β链的长度为约15-16个(例如,13、14、15、16、17、18或19个)氨基酸。在一些实施例中,第一α螺旋的长度为约15-17个(例如,13、14、15、16、17、18、19或20个)氨基酸。在一些实施例中,第三β链的长度为约3-4个(例如,1、2、3、4、5或6个)氨基酸。在一些实施例中,第四β链的长度为约10-11个(例如,8、9、10、11、12或13个)氨基酸。在一些实施例中,第五β链的长度为约6-7个(例如,4、5、6、7、8、9或10个)氨基酸。在一些实施例中,第二α螺旋的长度为约8-14个(例如,5、6、7、8、9、10、11、12、13、14、15、16或17个)氨基酸。在一些实施例中,第二α螺旋可以分解成两个较小的α螺旋(例如,由无规则卷曲序列隔开)。在一些实施例中,两个较小的α螺旋中的每一个的长度为约4-6个(例如,2、3、4、5、6、7或8个)氨基酸。在一些实施例中,第六β链的长度为约4-5个(例如,2、3、4、5、6或7个)氨基酸。在一些实施例中,第七β链的长度为约5-6个(例如,3、4、5、6、7、8或9个)氨基酸。在一些实施例中,第八β链的长度为约7-9个(例如,5、6、7、8、9、10、11、12或13个)氨基酸。在一些实施例中,第九β链的长度为约5-7个(例如,3、4、5、6、7、8、9或10个)氨基酸。
示例性胶冻卷结构域二级结构在PCT/US19/65995的实例47和本文的图25中所述。在一些实施例中,ORF1分子包含如下区域,该区域包含本文的图25中所示的任何胶冻卷结构域二级结构的一个或多个(例如,1、2、3、4、5、6、7、8、9、10个或全部)二级结构元件(例如,β链和/或α螺旋)。
共有ORF1结构域序列
在一些实施例中,ORF1分子(例如,如本文所述)包含胶冻卷结构域、N22结构域和/或C-末端结构域(CTD)中的一个或多个。在一些实施例中,胶冻卷结构域包含具有如本文所述的胶冻卷结构域共有序列的氨基酸序列(例如,如表37A-37C中任一个所列)。在一些实施例中,N22结构域包含具有如本文所述的N22结构域共有序列的氨基酸序列(例如,如表37A-37C中任一个所列)。在一些实施例中,CTD结构域包含具有如本文所述的CTD结构域共有序列的氨基酸序列(例如,如表37A-37C中任一个所列)。在一些实施例中,表37A-37C的任一中以“(Xa-b)”格式列出的氨基酸包含一系列连续氨基酸,其中该系列包含至少a个和至多b个氨基酸。在某些实施例中,该系列中的所有氨基酸都是相同的。在其他实施例中,该系列包括至少两个(例如,至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或21个)不同的氨基酸。
表37A.甲型细环病毒ORF1结构域共有序列
表37B.乙型细环病毒ORF1结构域共有序列
表37C.丙型细环病毒ORF1结构域共有序列
在一些实施例中,胶冻卷结构域包含如表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10、或37A-37C中任一个所列的胶冻卷结构域氨基酸序列,或与其具有至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,N22结构域包含如表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10、或37A-37C中任一个所列的N22结构域氨基酸序列,或与其具有至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。在一些实施例中,CTD结构域包含如表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10、或37A-37C中任一个所列的CTD结构域氨基酸序列,或与其具有至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
ORF1蛋白序列的鉴定
在一些实施例中,可以从指环病毒的基因组中鉴定指环病毒ORF1蛋白序列或编码ORF1蛋白的核酸序列(例如,推定的指环病毒基因组,例如,通过核酸测序技术如深度测序技术来鉴定)。在一些实施例中,通过以下一种或多种(例如,1、2或全部3种)选择标准来鉴定ORF1蛋白序列:
(i)长度选择:针对大于约600个氨基酸残基的那些序列,可以对蛋白序列(例如,符合下文(ii)或(iii)中描述的标准的推定的指环病毒ORF1序列)进行大小选择,以鉴定推定的指环病毒ORF1蛋白。在一些实施例中,指环病毒ORF1蛋白序列的长度为至少约600、650、700、750、800、850、900、950或1000个氨基酸残基。在一些实施例中,甲型细环病毒ORF1蛋白序列的长度为至少约700、710、720、730、740、750、760、770、780、790、800、900或1000个氨基酸残基。在一些实施例中,乙型细环病毒ORF1蛋白序列的长度为至少约650、660、670、680、690、700、750、800、900或1000个氨基酸残基。在一些实施例中,丙型细环病毒ORF1蛋白序列的长度为至少约650、660、670、680、690、700、750、800、900或1000个氨基酸残基。在一些实施例中,编码指环病毒ORF1蛋白的核酸序列的长度为至少约1800、1900、2000、2100、2200、2300、2400或2500个核苷酸。在一些实施例中,编码甲型细环病毒ORF1蛋白序列的核酸序列的长度为至少约2100、2150、2200、2250、2300、2400或2500个核苷酸。在一些实施例中,编码乙型细环病毒ORF1蛋白序列的核酸序列的长度为至少约1900、1950、2000、2500、2100、2150、2200、2250、2300、2400或2500或1000个核苷酸。在一些实施例中,编码丙型细环病毒ORF1蛋白序列的核酸序列的长度为至少约1900、1950、2000、2500、2100、2150、2200、2250、2300、2400或2500或1000个核苷酸。
(ii)存在ORF1基序:可以对蛋白序列(例如,符合上文(i)或下文(iii)中描述的标准的推定的指环病毒ORF1序列)进行过滤,以鉴定在上述N22结构域中含有保守ORF1基序的那些序列。在一些实施例中,推定的指环病毒ORF1序列包含序列YNPXXDXGXXN。在一些实施例中,推定的指环病毒ORF1序列包含序列Y[NCS]PXXDX[GASKR]XX[NTSVAK]。
(iii)存在精氨酸富集区:针对包括精氨酸富集区(例如,如本文所述)的那些序列,可以对蛋白序列(例如,符合上文(i)和/或(ii)中描述的标准的推定的指环病毒ORF1序列)进行过滤。在一些实施例中,推定的指环病毒ORF1序列包含至少约30、35、40、45、50、55、60、65或70个氨基酸的连续序列,其包含至少30%(例如,至少约20%、25%、30%、35%、40%、45%或50%)的精氨酸残基。在一些实施例中,推定的指环病毒ORF1序列包含约35-40、40-45、45-50、50-55、55-60、60-65或65-70个氨基酸的连续序列,其包含至少30%(例如,至少约20%、25%、30%、35%、40%、45%或50%)的精氨酸残基。在一些实施例中,精氨酸富集区位于推定的指环病毒ORF1蛋白起始密码子下游至少约30、40、50、60、70或80个氨基酸处。在一些实施例中,精氨酸富集区位于推定的指环病毒ORF1蛋白起始密码子下游至少约50个氨基酸处。
ORF2分子
在一些实施例中,指环载体包含ORF2分子和/或编码ORF2分子的核酸。通常,ORF2分子包括具有指环病毒ORF2蛋白(例如,如本文所述的指环病毒ORF2蛋白,例如,如表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中的任一个所列的)的结构特征和/或活性的多肽,或其功能性片段。在一些实施例中,ORF2分子包含与如表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中任一个所示的指环病毒ORF2蛋白序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一些实施例中,ORF2分子包含与甲型细环病毒、乙型细环病毒或丙型细环病毒ORF2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。在一些实施例中,ORF2分子(例如,与甲型细环病毒ORF2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的ORF2分子)的长度为250个或更少个氨基酸(例如,约150-200个氨基酸)。在一些实施例中,ORF2分子(例如,与乙型细环病毒ORF2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的ORF2分子)的长度约为50-150个氨基酸。在一些实施例中,ORF2分子(例如,与丙型细环病毒ORF2蛋白具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的ORF2分子)的长度为约100-200个氨基酸(例如,约100-150个氨基酸)。在一些实施例中,ORF2分子包含螺旋-转角-螺旋基序(例如,包含位于转角区侧翼的两个α螺旋的螺旋-转角-螺旋基序)。在一些实施例中,ORF2分子不包含TTV分离株TA278或TTV分离株SANBAN的ORF2蛋白的氨基酸序列。在一些实施例中,ORF2分子具有蛋白磷酸酶活性。在一些实施例中,ORF2分子包含相对于例如如本文所述的野生型ORF2蛋白(例如,如表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中的任一个中所示)的至少一个差异(例如,突变、化学修饰或表观遗传改变)。
保守的ORF2基序
在一些实施例中,本文所述的多肽(例如,ORF2分子)包含氨基酸序列[W/F]X7HX3CX1CX5H(SEQ ID NO:949),其中Xn是任何n个氨基酸的连续序列。在实施例中,X7表示任何七个氨基酸的连续序列。在实施例中,X3表示任何三个氨基酸的连续序列。在实施例中,X1表示任何单个氨基酸。在实施例中,X5表示任何五个氨基酸的连续序列。在一些实施例中,[W/F]可以是色氨酸或苯丙氨酸。在一些实施例中,[W/F]X7HX3CX1CX5H(SEQ ID NO:949)包含在ORF2分子的N22结构域(例如,如本文所述)内。在一些实施例中,本文所述的遗传元件包含编码氨基酸序列[W/F]X7HX3CX1CX5H(SEQ ID NO:949)的核酸序列(例如,编码ORF2分子的核酸序列,例如,如本文所述),其中Xn是任何n个氨基酸的连续序列。
遗传元件,例如,包括非指环病毒序列的遗传元件
在一些实施例中,指环载体包含遗传元件。在一些实施例中,遗传元件包含来自除指环病毒之外的病毒的核酸序列(例如,长度为至少10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500或4000个核苷酸的连续核酸序列),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,除指环病毒之外的病毒是单DNA病毒,例如,称德病毒(例如,单环编码病毒门[例如,雷东多病毒、圆环病毒{例如,猪圆环病毒,例如,PCV-1或PCV-2;或者喙羽症病毒}、双生病毒{例如,番茄金花叶病毒}或矮缩病毒{例如,BBTV、MDV1、SCSVF或FBNYV}]),或者细小病毒(例如,依赖性细小病毒,例如,博卡病毒或AAV)。在一些实施例中,除指环病毒之外的病毒是AAV(例如,AAV1、AAV2或AAV5)。在一些实施例中,来自除指环病毒之外的病毒的核酸序列包含非指环病毒复制起点(例如,衍生自AAV(例如,AAV1、AAV2或AAV5)的复制起点)。在一些实施例中,非指环病毒复制起点包含AAV Rep-结合基序(RBM)(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,非指环病毒复制起点包含AAV末端解离位点(TRS)(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,非指环病毒复制起点衍生自通过滚环式复制进行复制的病毒。在一些实施例中,该非指环病毒复制起点衍生自通过滚卡复制进行复制的病毒。
在一些实施例中,遗传元件包含一个或多个反向末端重复(ITR)。在一些实施例中,遗传元件包括一个ITR。在一些实施例中,遗传元件包含相对于如本文所述的效应物或效应物编码序列位于5’方向的ITR。在一些实施例中,遗传元件包含相对于如本文所述的效应物或效应物编码序列位于3’方向的ITR。在一些实施例中,遗传元件包含两个ITR,例如,位于如本文所述的效应物或效应物编码序列的侧翼。在一些实施例中,非指环病毒复制起点包含在ITR(例如,AAV ITR,例如,如本文所述)中。
在一些实施例中,遗传元件包含来自AAV(例如,AAV1、AAV2、AAV3、AAV4、AAV5或AAV6)的ITR序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,AAV ITR具有序列,例如,如在Grimm等人.(2005,J.Virol.[病毒学杂志],DOI:10.1128/JVI.80.1.426-439.2006;其通过引用以其全文并入本文)中所述的,例如,如Grimm等人同上的图1A中所示。在实施例中,AAV ITR具有如本文Chiorini等人.(1999,J.Virol[病毒学杂志]73(5):4293-4298;其通过引用以其全文并入本文)所述的序列。
在一些实施例中,遗传元件包含ITR序列(例如,来自AAV,例如,如本文所述)的子序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,遗传元件包含AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCC(SEQ ID NO:1051)的序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,遗传元件包含CGGGCGGGTGGTGGCGGCGGTTGGGGCTCGGCGCTCGCTCGCTCGCT GGGCGGGCGGGCGGT(SEQ ID NO:1052)的序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,遗传元件包含RBM序列(例如,来自AAV,例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,遗传元件包含(GMGY)x4(SEQ ID NO:1053)的序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,遗传元件包含(GMGY)x5(SEQ ID NO:1054)的序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,遗传元件包含GCGCGCTCGCTCGCTC(SEQ ID NO:1055)的序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,遗传元件包含GCTCGCTCGCTCGCTG(SEQ ID NO:1056)的序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,遗传元件包含TRS序列(例如,来自AAV,例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,遗传元件包含XGTTGG(SEQ ID NO:1057)(其中X选自G、C、T或A)的序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,遗传元件包含AGTTGG(SEQ ID NO:1058)的序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在实施例中,遗传元件包含GGTTGG(SEQ ID NO:1059)的序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。
在一些实施例中,遗传元件构建体(例如,如本文所述)包含具有如下表61中所示或如图10中所图解的结构的核酸序列。
在一些实施例中,遗传元件(例如,如本文所述)包含具有如下表61中所示或如图10中所图解的结构的核酸序列。在实施例中,遗传元件包含以下中的1个、2个或所有:(i)一个或多个(例如一个或两个)非指环病毒(例如,AAV)ITR序列;(ii)编码外源性效应物的序列;和/或(iii)来自指环病毒基因组的序列(例如,连续或非连续序列)(或与其具有至少30%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列),或长度为至少10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500或4000个核苷酸的其连续部分。
在实施例中,遗传元件包含位于指环病毒基因组或其部分内的非指环病毒(例如,AAV)ITR序列。在一个实施例中,与指环病毒基因组序列或其部分的3’端相比,非指环病毒ITR序列位于更靠近指环病毒基因组序列或其部分的5’端。在一个实施例中,与指环病毒基因组序列或其部分的5’端相比,非指环病毒ITR序列位于更靠近指环病毒基因组序列或其部分的3’端。
在实施例中,遗传元件包含位于指环病毒基因组序列或其部分的5’端处的非指环病毒(例如,AAV)ITR序列。在实施例中,遗传元件包含位于指环病毒基因组序列或其部分的3’端处的非指环病毒(例如,AAV)ITR序列。
在实施例中,非指环病毒ITR序列与指环病毒基因组序列或其部分具有相同取向。在实施例中,非指环病毒ITR序列与指环病毒基因组序列或其部分具有反向取向。
在实施例中,遗传元件包含编码效应物(例如,内源性效应物或外源性效应物)的序列。在实施例中,编码效应的序列位于非指环病毒ITR序列的上游。在实施例中,编码效应的序列位于非指环病毒ITR序列的下游。
在实施例中,遗传元件包含多个(例如,两个)非指环病毒ITR序列。在实施例中,多个非指环病毒ITR序列具有相同的序列。在实施例中,多个非指环病毒ITR序列具有不同的序列。在实施例中,多个非指环病毒ITR序列具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%的核酸序列同一性。在实施例中,遗传元件包含两个具有相同取向的非指环病毒ITR序列。在实施例中,遗传元件包含两个具有相反取向的非指环病毒ITR序列。在实施例中,遗传元件包含编码效应物(例如,内源性效应物或外源性效应物)的序列,其中编码该效应物的序列与一个或多个非指环病毒ITR序列具有相同取向。在实施例中,遗传元件包含编码效应物(例如,内源性效应物或外源性效应物)的序列,其中编码该效应物的序列与一个或多个非指环病毒ITR序列处于相反的取向。
表61.示例性AAV指环病毒遗传元件结构
在一些实施例中,遗传元件能够在非指环病毒Rep分子存在下进行复制,该非指环病毒Rep分子例如,来自单DNA病毒,例如,称德病毒(例如,单环编码病毒门[例如,雷东多病毒、圆环病毒{例如,猪圆环病毒,例如,PCV-1或PCV-2;或者喙羽症病毒}、双生病毒{例如,番茄金花叶病毒}或矮缩病毒{例如,BBTV、MDV1、SCSVF或FBNYV}]),或细小病毒(例如,依赖性细小病毒,例如,博卡病毒或AAV)的Rep蛋白,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的多肽。在一些实施例中,遗传元件能够在AAVRep分子存在下进行复制,该AAV Rep分子例如,AAV-Rep蛋白(例如,AAV1、AAV2或AAV5 Rep蛋白),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的多肽。
在一些实施例中,遗传元件是线性的。在一些实施例中,遗传元件是环状的。在一些实施例中,遗传元件是单链的。在一些实施例中,遗传元件是双链的。在一些实施例中,遗传元件由至少75%、80%、85%、90%、95%、96%、97%、98%、99%、或100%的DNA组成。在一些实施例中,遗传元件是100% DNA。
在一些实施例中,遗传元件具有以下特征中的一个或多个:基本上不与宿主细胞的基因组整合,是游离核酸,是单链DNA,是环状的,大约1至10kb,存在于细胞核内,可以与内源性蛋白质结合,产生效应物,例如靶向宿主或靶细胞的基因、活性或功能的多肽或核酸(例如,RNA、iRNA、微小RNA)。在一个实施例中,遗传元件是基本上非整合的DNA。在一些实施例中,遗传元件包含包装信号,例如,结合衣壳蛋白的序列。在一些实施例中,在包装或衣壳结合序列之外,遗传元件与野生型指环病毒核酸序列具有小于70%、60%、50%、40%、30%、20%、10%、5%序列同一性,例如,与指环病毒核酸序列,例如,如本文所述的指环病毒核酸序列具有小于70%、60%、50%、40%、30%、20%、10%、5%序列同一性。在一些实施例中,在包装或衣壳结合序列之外,遗传元件具有与指环病毒核酸序列至少70%、75%、80%、8%、90%、95%、96%、97%、98%、99%或100%同一性的少于500、450、400、350、300、250、200、150或100个连续核苷酸。在某些实施例中,遗传元件是包含启动子序列、编码治疗性效应物和衣壳结合蛋白的序列的环状单链DNA。
在一些实施例中,遗传元件的长度小于20kb(例如,小于约19kb、18kb、17kb、16kb、15kb、14kb、13kb、12kb、11kb、10kb、9kb、8kb、7kb、6kb、5kb、4kb、3kb、2kb、1kb或更小)。在一些实施例中,独立地或附加地,遗传元件的长度大于1000b(例如,至少约1.1kb、1.2kb、1.3kb、1.4kb、1.5kb、1.6kb、1.7kb、1.8kb、1.9kb、2kb、2.1kb、2.2kb、2.3kb、2.4kb、2.5kb、2.6kb、2.7kb、2.8kb、2.9kb、3kb、3.1kb、3.2kb、3.3kb、3.4kb、3.5kb、3.6kb、3.7kb、3.8kb、3.9kb、4kb、4.1kb、4.2kb、4.3kb、4.4kb、4.5kb、4.6kb、4.7kb、4.8kb、4.9kb、5kb或更大)。在一些实施例中,遗传元件的长度为约2.5kb-4.6kb、2.8kb-4.0kb、3.0kb-3.8kb或3.2kb-3.7kb。在一些实施例中,遗传元件的长度为约1.5kb-2.0kb、1.5kb-2.5kb、1.5kb-3.0kb、1.5kb-3.5kb、1.5kb-3.8kb、1.5kb-3.9kb、1.5kb-4.0kb、1.5kb-4.5kb或1.5kb-5.0kb。在一些实施例中,遗传元件的长度为约2.0kb-2.5kb、2.0kb-3.0kb、2.0kb-3.5kb、2.0kb-3.8kb、2.0kb-3.9kb、2.0kb-4.0kb、2.0kb-4.5kb或2.0kb-5.0kb。在一些实施例中,遗传元件的长度为约2.5kb-3.0kb、2.5kb-3.5kb、2.5kb-3.8kb、2.5kb-3.9kb、2.5kb-4.0kb、2.5kb-4.5kb或2.5kb-5.0kb。在一些实施例中,遗传元件的长度为约3.0kb-5.0kb、3.5kb-5.0kb、4.0kb-5.0kb或4.5kb-5.0kb。在一些实施例中,遗传元件的长度为约1.5kb-2.0kb、2.0kb-2.5kb、2.5kb-3.0kb、3.0kb-3.5kb、3.1kb-3.6kb、3.2kb-3.7kb、3.3kb-3.8kb、3.4kb-3.9kb、3.5kb-4.0kb、4.0kb-4.5kb或4.5kb-5.0kb。在一些实施例中,遗传元件的长度为约3.6-3.9kb。在一些实施例中,遗传元件的长度为约2.8-2.9kb。在一些实施例中,遗传元件的长度为约2.0-3.2kb。
在一些实施例中,遗传元件包含本文所述的一种或多种特征,例如,编码基本上非致病性蛋白的序列、蛋白结合序列、编码调节性核酸的一个或多个序列、一个或多个调节性序列、编码复制蛋白的一个或多个序列,以及其他序列。
在实施例中,遗传元件是由双链环状DNA产生的(例如,通过体外环化产生)。在一些实施例中,遗传元件是由双链环状DNA通过滚环式复制产生的。在实施例中,滚环式复制发生在细胞(例如,宿主细胞,例如哺乳动物细胞,例如人细胞,如HEK293T细胞、A549细胞或Jurkat细胞)中。在实施例中,遗传元件可以通过细胞中的滚环式复制以指数扩增。在实施例中,遗传元件可以通过细胞中的滚环式复制以线性扩增。在实施例中,双链环状DNA或遗传元件能够通过细胞中的滚环式复制产生原始量的至少2、4、8、16、32、64、128、256、518、1024倍或更多倍。在实施例中,将例如如本文所述的双链环状DNA引入细胞中。
在一些实施例中,双链环状DNA和/或遗传元件不包含一种或多种细菌质粒元件(例如,细菌复制起点或选择性标志,如细菌抗性基因)。在一些实施例中,双链环状DNA和/或遗传元件不包含细菌质粒主链。
在一个实施例中,本发明包括遗传元件,该遗传元件包含编码(i)基本上非致病性外壳蛋白,(ii)使该遗传元件结合至该基本上非致病性外壳蛋白的外壳蛋白结合序列,以及(iii)调节性核酸的核酸序列(例如,DNA序列)。在这样的实施例中,遗传元件可包含一个或多个与天然病毒序列(例如,天然指环病毒序列,例如,如本文所述)的任一个核苷酸序列具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性的序列。
蛋白结合序列
许多病毒采用的策略是病毒衣壳蛋白识别其基因组中的特定蛋白结合序列。例如,在具有不分节段基因组的病毒(例如酵母的L-A病毒)中,在基因组的5'端存在二级结构(茎环)和特异性序列,它们都用于结合病毒衣壳蛋白。然而,具有分节段基因组的病毒,如呼肠孤病毒科(Reoviridae)、正粘病毒科(Orthomyxoviridae)(流感病毒)、布尼亚病毒(Bunyaviruses)和沙粒病毒(Arenaviruses),需要包装每个基因组节段。一些病毒利用节段的互补区来协助病毒包括每个基因组分子中的一个。其他病毒对于每个不同的节段都具有特定的结合位点。参见例如,Curr Opin Struct Biol.[当代结构生物学观点]2010年2月;20(1):114-120和Journal of Virology[病毒学杂志](2003),77(24),13036-13041。
在一些实施例中,遗传元件编码与基本上非致病性蛋白质结合的蛋白结合序列。在一些实施例中,蛋白结合序列有助于将遗传元件包装到蛋白质外壳中。在一些实施例中,蛋白结合序列特异性结合基本上非致病性蛋白质的精氨酸富集区。在一些实施例中,遗传元件包含如PCT/US19/65995的实例8中所述的蛋白结合序列。
在一些实施例中,遗传元件包含与指环病毒序列的5’UTR保守结构域或GC富集结构域(例如,如本文所述)具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的蛋白结合序列。
在实施例中,蛋白结合序列与指环病毒5’UTR保守结构域核苷酸序列(例如,如本文所述)具有至少约70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
5’UTR区
在一些实施例中,如本文所述的核酸分子(例如,遗传元件、遗传元件构建体或遗传元件区域)包含5’UTR序列,例如,如本文所述的5’UTR保守结构域序列(例如,在表A1、表B1或表C1的任一中)或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。
在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGGGX1CAGTCT,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGGGX1CAGTCT,或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如,置换、缺失或添加)的核酸序列。在实施例中,X1是A。在实施例中,X1不存在。
在一些实施例中,5’UTR序列包含甲型细环病毒(例如,Ring1)5’UTR的核酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,5’UTR序列包含表A1中列出的5’UTR保守结构域的核酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,核酸分子包含与表A1中列出的5’UTR保守结构域具有至少95%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表A1中列出的5’UTR保守结构域具有至少95.775%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表A1中列出的5’UTR保守结构域具有至少97%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表A1中列出的5’UTR保守结构域具有至少97.183%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGCTCGGGACT GGC,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGCTCGGGACT GGC,或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如,置换、缺失或添加)的核酸序列。
在一些实施例中,5’UTR序列包含乙型细环病毒(例如,Ring2)5’UTR的核酸序列,或与其具有至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,5’UTR序列包含表B1中列出的5’UTR保守结构域的核酸序列,或与其具有至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少85%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少87%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少87.324%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少88%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少88.732%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少91%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少91.549%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少92%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少92.958%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少94%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少94.366%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少95%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少95.775%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少97%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表B1中列出的5’UTR保守结构域具有至少97.183%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGATCAG TCT,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGATCAG TCT,或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如,置换、缺失或添加)的核酸序列。
在一些实施例中,5’UTR序列包含丙型细环病毒(例如,Ring4)5’UTR的核酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在实施例中,5’UTR序列包含表C1中列出的5’UTR保守结构域的核酸序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的序列。在一些实施例中,核酸分子包含与表C1中列出的5’UTR保守结构域具有至少97%序列同一性的核酸序列。在一些实施例中,核酸分子包含与表C1中列出的5’UTR保守结构域具有至少97.183%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAGGTCTAGGGGCAATTCGGGCTAGGGCAG TCT,或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的核酸序列。在一些实施例中,5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAGGTCTAGGGGCAATTCGGGCTAGGGCAG TCT,或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如,置换、缺失或添加)的核酸序列。
在一些实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与指环病毒5’UTR序列,例如表38中所示的核酸序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在一些实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含表38所示的共有5'UTR序列的核酸序列,其中X1、X2、X3、X4和X5各自独立地是任何核苷酸,例如其中X1=G或T,X2=C或A,X3=G或A,X4=T或C,并且X5=A、C或T)。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的共有5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的示例性TTV 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的TTV-CT30F 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的TTV-HD23a 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的TTV-JA20 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的TTV-TJN02 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的TTV-tth8 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒共有5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支1 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支2 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支3 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支4 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支5 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支6 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支7 5’UTR序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
表38.来自指环病毒的示例性5’UTR序列
鉴定5’UTR序列
在一些实施例中,可以在指环病毒基因组内鉴别指环病毒5’UTR序列(例如,推定的指环病毒基因组,例如,通过核酸测序技术如深度测序技术来鉴定)。在一些实施例中,通过以下步骤之一或二者鉴定指环病毒5’UTR序列:
(i)鉴定环化接合点:在一些实施例中,5’UTR将位于全长、环化指环病毒基因组的环化接合点附近。例如,可以通过鉴定序列的重叠区域来鉴定环化接合点。在一些实施例中,可以从序列中剪切掉序列的重叠区域以产生已环化的全长指环病毒基因组序列。在一些实施例中,使用软件以这种方式环化基因组序列。不希望受到理论的束缚,在计算上环化基因组可能导致序列的起始位置以非生物性方式定向。序列内的标记可用于将序列重新定向到正确的方向。例如,标记序列可以包括与如本文所述的指环病毒基因组内一个或多个元件(例如,指环病毒,例如,如本文所述的指环病毒的TATA盒、加帽位点、起始元件、转录起始位点、5’UTR保守结构域、ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3、三个开放阅读框区域、多(A)信号或GC富集区中一种或多种)具有基本同源性的序列。
(ii)鉴定5’UTR序列:一旦获得推定的指环病毒基因组序列,就可以将该序列(或其位置,例如,其长度为约40-50、50-60、60-70、70-80、80-90或90-100个核苷酸)与一个或多个指环病毒5'UTR序列(例如,如本文所述)进行比较,以鉴定与其具有实质同源性的序列。在一些实施例中,推定的指环病毒5’UTR区域与如本文所述的指环病毒5’UTR序列具有至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。
GC富集区
在一些实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的核酸序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的GC富集序列具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与如表39中所示的36个核苷酸的GC富集序列(例如,36个核苷酸的共有GC富集区序列1、36个核苷酸的共有GC富集区序列2、TTV分支1 36个核苷酸的区域、TTV分支3 36个核苷酸的区域、TTV分支3分离株GH1 36个核苷酸的区域、TTV分支3sle1932 36个核苷酸的区域、TTV分支4ctdc002 36个核苷酸的区域、TTV分支5 36个核苷酸的区域、TTV分支6 36个核苷酸的区域或TTV分支7 36个核苷酸的区域)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含核酸序列,该核酸序列包含如表39中所示的36个核苷酸的GC富集序列(例如,36个核苷酸的共有GC富集区序列1、36个核苷酸的共有GC富集区序列2、TTV分支1 36个核苷酸的区域、TTV分支3 36个核苷酸的区域、TTV分支3分离株GH1 36个核苷酸的区域、TTV分支3sle1932 36个核苷酸的区域、TTV分支4ctdc002 36个核苷酸的区域、TTV分支5 36个核苷酸区域、TTV分支6 36个核苷酸区域或TTV分支7 36个核苷酸的区域)的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸。
在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与甲型细环病毒GC富集区序列(例如,选自TTV-CT30F、TTV-P13-1、TTV-tth8、TTV-HD20a、TTV-16、TTV-TJN02或TTV-HD16d,例如,如表39中所列的)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含核酸序列,该核酸序列包含甲型细环病毒GC富集区序列(例如,选自TTV-CT30F、TTV-P13-1、TTV-tth8、TTV-HD20a、TTV-16、TTV-TJN02或TTV-HD16d,例如,如表39中所列的)的至少10、15、20、25、30、35、40、45、50、60、70、80、90、100、104、105、108、110、111、115、120、122、130、140、145、150、155或156个连续核苷酸。
在实施例中,36个核苷酸的GC富集序列选自:
(i)CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO:160);
(ii)GCGCTX1CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO:164),其中X1选自T、G或A;
(iii)GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO:165);
(iv)GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO:166);
(v)GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO:167);
(vi)GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO:168);
(vii)GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO:169);
(viii)GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO:170);
(ix)GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO:171);或
(x)GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO:172)。
在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含核酸序列CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO:160)。
在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含表39中所示的共有GC富集序列的核酸序列,其中X1、X4、X5、X6、X7、X12、X13、X14、X15、X20、X21、X22、X26、X29、X30和X33各自独立地是任何核苷酸,并且其中X2、X3、X8、X9、X10、X11、X16、X17、X18、X19、X23、X24、X25、X27、X28、X31、X32和X34各自独立地是不存在的或任何核苷酸。在一些实施例中,X1至X34中的一个或多个(例如,全部)各自独立地是表39中指定的核苷酸(或不存在)。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的示例性TTV GC富集序列(例如,全序列、片段1、片段2、片段3、或其任何组合,例如按顺序排列的片段1-3)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的TTV-CT30F GC富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8、或其任何组合,例如按顺序排列的片段1-7)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的TTV-HD23a GC富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、或其任何组合,例如按顺序排列的片段1-6)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的TTV-JA20GC富集序列(例如,全序列、片段1、片段2、或其任何组合,例如按顺序排列的片段1和2)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的TTV-TJN02GC富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8、或其任何组合,例如按顺序排列的片段1-8)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的TTV-tth8 GC富集序列(例如,全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8、片段9、或其任何组合,例如按顺序排列的片段1-6)具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的片段7具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的片段8具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。在实施例中,遗传元件(例如,遗传元件的蛋白结合序列)包含与表39中所示的片段9具有至少约75%(例如,至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%)同一性的核酸序列。
表39.来自指环病毒的示例性GC富集序列
效应物
在一些实施例中,遗传元件可包括一个或多个编码效应物的序列,这些效应物是例如,功能性效应物,例如内源性效应物或外源性效应物,例如治疗性多肽或核酸,例如细胞毒性或细胞溶解性RNA或蛋白质。在一些实施例中,功能性核酸是非编码RNA。在一些实施例中,功能性核酸是编码RNA。效应物可以调节生物活性,例如增加或降低酶活性、基因表达、细胞信号传导以及细胞或器官功能。效应物活性还可包括结合调节性蛋白以调节调节子的活性,例如转录或翻译。效应物活性还可以包括激活或抑制功能。例如,效应物可通过触发酶中底物亲和力的增加来诱导酶活性,例如,果糖2,6-二磷酸激活磷酸果糖激酶1并增加糖酵解响应于胰岛素的速率。在另一实例中,效应物可以抑制底物与受体的结合并抑制其激活,例如,纳曲酮和纳洛酮结合阿片受体而不激活它们,并阻断受体结合阿片类物质的能力。效应物活性还可以包括调节蛋白质的稳定性/降解和/或转录本的稳定性/降解。例如,多肽辅因子(即泛素)可以将蛋白质定向到蛋白质上用于降解,从而标志它们进行降解。在另一实例中,效应物通过阻断酶的活性位点来抑制酶活性,例如,甲氨蝶呤是四氢叶酸(一种二氢叶酸还原酶的辅酶)的结构类似物,其与二氢叶酸还原酶的结合力比天然底物高1000倍,并抑制核苷酸碱基合成。
在一些实施例中,编码效应物的序列是遗传元件的一部分,例如,它可以在如本文所述的插入位点处插入。在实施例中,在非编码区处将编码效应物的序列插入遗传元件中,例如,位于开放阅读框的3'和遗传元件的GC富集区的5'的非编码区,在TATA盒上游的5'非编码区中,在5’UTR中,在多A信号下游或GC富集区上游的3'非编码区中。在实施例中,在例如本文所述的TTV-tth8质粒的约核苷酸3588处或在例如本文所述的TTMV-LY2质粒的约核苷酸2843处将编码效应物的序列插入遗传元件中。在实施例中,在例如本文所述的TTV-tth8质粒的核苷酸336-3015处或之内或在例如本文所述的TTV-LY2质粒的核苷酸242-2812处或之内将编码效应物的序列插入遗传元件中。在一些实施例中,编码效应物的序列替换了部分或全部开放阅读框(例如,如本文所述的ORF,例如,ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3)。
在一些实施例中,编码效应物的序列包括100-2000、100-1000、100-500、100-200、200-2000、200-1000、200-500、500-1000、500-2000或1000-2000个核苷酸。在一些实施例中,效应物是核酸或蛋白有效载荷,例如,如本文所述的核酸或蛋白有效载荷。
调节性核酸
在一些实施例中,效应物是调节性核酸。调节性核酸修饰内源性基因和/或外源性基因的表达。在一个实施例中,调节性核酸靶向宿主基因。调节性核酸可包括但不限于与内源性基因杂交的核酸(例如,如本文别处所述的miRNA、siRNA、mRNA、lncRNA、RNA、DNA、反义RNA、gRNA)、与外源性核酸(例如病毒DNA或RNA)杂交的核酸、与RNA杂交的核酸、干扰基因转录的核酸、干扰RNA翻译的核酸、稳定RNA或去稳定RNA的核酸(例如通过靶向降解的方式),以及调节DNA或RNA结合因子的核酸。在实施例中,调节性核酸编码miRNA。在一些实施例中,针对野生型指环病毒而言,调节性核酸是内源性的。在一些实施例中,针对野生型指环病毒而言,调节性核酸是外源性的。
在一些实施例中,调节性核酸包含通常含有5-500个碱基对的RNA或RNA样结构(取决于特定的RNA结构,例如miRNA 5-30bp、lncRNA 200-500bp)并且可以具有与细胞内表达的靶基因中的编码序列或编码细胞内表达的靶基因的序列相同(或互补)或几乎相同(或基本上互补)的核碱基序列。
在一些实施例中,调节性核酸包含核酸序列,例如,引导RNA(gRNA)。在一些实施例中,DNA靶向部分包含指导RNA或编码指导RNA的核酸。gRNA,即一种短的合成RNA,可以由结合不完整效应部分所必需的“支架”序列和用户定义的用于基因组靶标的约20个核苷酸靶向序列组成。在实践中,通常将引导RNA序列设计为具有17-24个核苷酸(例如,19、20或21个核苷酸)的长度,并且与靶核酸序列互补。定制gRNA生成器和算法可通过商业途径获得,用于设计有效的指导RNA。使用嵌合性“单指导RNA”(“sgRNA”)也可以实现基因编辑,这是一种工程化(合成)的单一RNA分子,模拟天然存在的crRNA-tracrRNA复合物,并同时含有tracrRNA(用于结合核酸酶)和至少一个crRNA(以将核酸酶引导至被靶向序列进行编辑)。人们也已证明,在基因组编辑中,经化学修饰的sgRNA是有效的;参见例如,Hendel等人.(2015)Nature Biotechnol.[自然生物技术],985-991。
调节性核酸包含识别特定DNA序列(例如,与基因的启动子、增强子、沉默子或阻遏子相邻或在其内的序列)的gRNA。
某些调节性核酸可以通过RNA干扰(RNAi)的生物学过程抑制基因表达。RNAi分子包含RNA或RNA样结构,其通常包含15-50个碱基对(例如约18-25个碱基对)并且具有与细胞内表达的靶基因中的编码序列相同(互补)或几乎相同(基本上互补)的核碱基序列。RNAi分子包括但不限于:短干扰RNA(siRNA)、双链RNA(dsRNA)、微RNA(miRNA)、短发夹RNA(shRNA)、部分双链体和dicer底物(美国专利号8,084,599、8,349,809和8,513,207)。
长非编码RNA(lncRNA)被定义为长于100个核苷酸的非蛋白质编码转录物。这种有些武断的限制将lncRNA与小型调节性RNA(例如微RNA(miRNA)、短干扰RNA(siRNA)及其他短RNA)区分开来。通常,大多数(约78%)的lncRNA的特征为组织特异性的。以与附近蛋白质编码基因相反的方向转录的发散lncRNA(占哺乳动物基因组中总lncRNA的约20%大比例)可能会调节附近基因的转录。
遗传元件可以编码具有与内源性基因或基因产物(例如,mRNA)的全部或片段基本上互补或完全互补的序列的调节性核酸。调节性核酸可以与内含子和外显子之间的边界处的序列互补,从而防止特异性基因的新生成的核RNA转录物成熟为用于转录的mRNA。与特定基因互补的调节性核酸可与该基因的mRNA杂交并阻止其翻译。反义调节性核酸可以是DNA、RNA或其衍生物或杂合体。
与感兴趣的转录物杂交的调节性核酸的长度可以在5至30个核苷酸之间,在约10至30个核苷酸之间,或约11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个核苷酸。调节性核酸与靶向转录物的同一性程度应为至少75%、至少80%、至少85%、至少90%或至少95%。
遗传元件可以编码调节性核酸,例如与靶基因的约5至约25个连续核苷酸相同的微小RNA(miRNA)分子。在一些实施例中,miRNA序列靶向mRNA并从二核苷酸AA开始,其GC含量为约30%-70%(约30%-60%、约40%-60%或约45%-55%),并且例如,如通过标准BLAST搜索所确定的,与要引入其中的哺乳动物基因组中的靶标以外的任何核苷酸序列不具有高百分比同一性。
在一些实施例中,调节性核酸是至少一种miRNA,例如2、3、4、5、6种或更多种。在一些实施例中,遗传元件包含编码miRNA的序列,该miRNA与核苷酸序列中的任一个或者与本文中例如在表40中所述的序列互补的序列具有至少约75%、80%、85%、90%、95%、96%、97%、98%、99%或100%核苷酸序列同一性。
表40:调节性核酸例如miRNA的实例。
siRNA和shRNA类似于内源微RNA(miRNA)基因的处理途径中的中间体(Bartel,Cell[细胞]116:281-297,2004)。在一些实施例中,siRNA可以用作miRNA,反之亦然(Zeng等人,Mol Cell[分子细胞学]9:1327-1333,2002;Doench等人,Genes Dev[基因与发育]17:438-442,2003)。像siRNA一样,微RNA使用RISC来下调靶基因,但与siRNA不同,大多数动物性miRNA都不切割mRNA。相反,miRNA通过翻译抑制或多A(多腺苷酸)去除和mRNA降解降低蛋白质输出(Wu等人,Proc Natl Acad Sci USA[美国国家科学院院刊]103:4034-4039,2006)。已知的miRNA结合位点在mRNA 3’UTR内;miRNA似乎靶向与miRNA5'端的2-8个核苷酸几乎完全互补的位点(Rajewsky,Nat Genet[自然遗传学]38增刊:S8-13,2006;Lim等人,Nature[自然]433:769-773,2005)。此区被称为种子区。由于siRNA和miRNA是可互换的,因此外源性siRNA下调与siRNA具有种子互补性的mRNA(Birmingham等人,Nat Methods[自然-方法]3:199-204,2006。3'UTR内的多个靶位点会产生更强的下调(Doench等人,Genes Dev[基因与发育]17:438-442,2003)。
已知miRNA序列的列表可在研究组织维护的数据库中找到,这些组织如维康信托基金会桑格研究院(Wellcome Trust Sanger Institute)、宾夕法尼亚生物信息学中心(Penn Center for Bioinformatics)、斯隆凯特灵癌症中心(Memorial Sloan KetteringCancer Center)和欧洲分子生物学实验室(European Molecule Biology Laboratory)等。已知的有效的siRNA序列和同源结合位点也很好地呈现在相关文献中。通过本领域已知的技术,RNAi分子易于设计及产生。另外,有一些计算工具可以增加找到有效和特异性序列基序的机会(Lagana等人,Methods Mol.Bio.[分子生物学方法],2015,1269:393-412)。
调节性核酸可以调节基因编码的RNA的表达。因为多个基因可以彼此共有一定程度的序列同源性,所以在一些实施例中,可以将调节性核酸设计为靶向具有足够序列同源性的一类基因。在一些实施例中,调节性核酸可含有与在不同基因靶之间共享的序列互补的或特定基因靶所特有的序列。在一些实施例中,可以将调节性核酸设计为靶向在几个基因之间具有同源性的RNA序列的保守区,从而靶向基因家族中的几个基因(例如,不同的基因同工型、剪接变体、突变基因等)。在一些实施例中,可以将调节性核酸设计为靶向单一基因的特定RNA序列所特有的序列。
在一些实施例中,遗传元件可以包括一个或多个编码调节一个或多个基因表达的调节性核酸的序列。
在一个实施例中,将本文别处描述的gRNA用作CRISPR系统的一部分,用于基因编辑。出于基因编辑的目的,可以将指环载体设计为包括一个或多个与所期望的靶DNA序列相对应的引导RNA序列;参见,例如Cong等人.(2013)Science[科学],339:819-823;Ran等人.(2013)Nature Protocols[自然实验手册],8:2281-2308。gRNA序列的至少约16或17个核苷酸通常允许Cas9介导的DNA切割发生;对于Cpf1,需要gRNA序列的至少约16个核苷酸来实现可检测的DNA切割。
治疗性效应物(例如,肽或多肽)
在一些实施例中,遗传元件包含治疗性表达序列,例如,编码治疗性肽或多肽的序列,该肽或多肽是例如细胞内肽或细胞内多肽、分泌型多肽或蛋白质替代治疗剂。在一些实施例中,遗传元件包括编码蛋白质,例如治疗性蛋白质的序列。治疗性蛋白质的一些实例可以包括但不限于激素、细胞因子、酶、抗体(例如,一种或多种编码至少重链或轻链的多肽)、转录因子、受体(例如,膜受体)、配体、膜转运蛋白、分泌型蛋白质、肽、载体蛋白、结构蛋白、核酸酶或其组分。
在一些实施例中,遗传元件包括编码肽,例如治疗性肽的序列。肽可以是直链或支链的。该肽的长度为约5至约500个氨基酸、约15至约400个氨基酸、约20至约325个氨基酸、约25至约250个氨基酸、约50至约200个氨基酸或其间的任何范围。
在一些实施例中,由治疗性表达序列编码的多肽可以是上述任一种的功能性变体或其片段,例如,与本文表中通过参考其UniProt ID披露的蛋白序列具有至少80%、85%、90%、95%、967%、98%、99%同一性的蛋白质。
在一些实施例中,治疗性表达序列可以编码结合上述任一种的抗体或抗体片段,例如,针对蛋白质的抗体,该蛋白质与本文表中通过参考其UniProt ID披露的蛋白序列具有至少80%、85%、90%、95%、967%、98%、99%同一性。本文中的术语“抗体”在最广义上使用,并且涵盖各种抗体结构,包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如,双特异性抗体)和抗体片段,只要它们表现出所期望的抗原结合活性。“抗体片段”是指包含至少一条重链或轻链并结合抗原的分子。抗体片段的实例包括但不限于Fv、Fab、Fab'、Fab'-SH、F(ab')2;双体;线性抗体;单链抗体分子(例如,scFv);以及由抗体片段形成的多特异性抗体。
示例性细胞内多肽效应物
在一些实施例中,效应物包含胞质多肽或胞质肽。在一些实施例中,包含胞质肽的效应物是DPP-4抑制剂、GLP-1信号传导激活剂或中性粒细胞弹性蛋白酶抑制剂。在一些实施例中,效应物提高生长因子或其受体(例如FGF受体,例如FGFR3)的水平或活性。在一些实施例中,效应物包含n-myc相互作用蛋白活性的抑制剂(例如,n-myc相互作用蛋白抑制剂);EGFR活性的抑制剂(例如,EGFR抑制剂);IDH1和/或IDH2活性的抑制剂(例如,IDH1抑制剂和/或IDH2抑制剂);LRP5和/或DKK2活性的抑制剂(例如,LRP5和/或DKK2抑制剂);KRAS活性的抑制剂;HTT活性的激活剂;或DPP-4活性的抑制剂(例如,DPP-4抑制剂)。
在一些实施例中,效应物包含调节性细胞内多肽。在一些实施例中,调节性细胞内多肽结合靶细胞内源的一种或多种分子(例如,蛋白质或核酸)。在一些实施例中,调节性细胞内多肽增加靶细胞内源的一种或多种分子(例如蛋白质或核酸)的水平或活性。在一些实施例中,调节性细胞内多肽降低靶细胞内源的一种或多种分子(例如蛋白质或核酸)的水平或活性。
示例性分泌型多肽效应物
示例性的分泌型治疗剂在本文中描述,例如在下表中。
表50.示例性细胞因子和细胞因子受体
在一些实施例中,本文所述的效应物包括表50的细胞因子或其功能性变体,例如,其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表50中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,功能性变体与相应细胞因子受体结合,在相同条件下,对于相同受体,其Kd比相应野生型细胞因子的Kd高或低不超过10%、20%、30%、40%或50%。在一些实施例中,效应物包括融合蛋白,该融合蛋白包含第一区域(例如,表50的细胞因子多肽或者其功能性变体或片段)和第二异源区域。在一些实施例中,第一区域是表50的第一细胞因子多肽。在一些实施例中,第二区域是表50的第二细胞因子多肽,其中该第一和第二细胞因子多肽在野生型细胞中彼此形成细胞因子异二聚体。在一些实施例中,表50的多肽或其功能性变体包含信号序列,例如,对于效应物而言具有内源性的信号序列,或异源信号序列。在一些实施例中,编码表50的细胞因子或其功能性变体的指环载体用于治疗本文所述的疾病或障碍。
在一些实施例中,本文所述的效应物包含与表50的细胞因子结合的抗体分子(例如,scFv)。在一些实施例中,本文所述的效应物包含与表50的细胞因子受体结合的抗体分子(例如,scFv)。在一些实施例中,抗体分子包含信号序列。
示例性细胞因子和细胞因子受体在以下文献中描述:例如,Akdis等人,“Interleukins(from IL-1to IL-38),interferons,transforming growth factorβ,andTNF-α:Receptors,functions,and roles in diseases[白细胞介素(从IL-1到IL-38)、干扰素、转化生长因子β和TNF-α:受体、功能和在疾病中的作用]”,2016年10月,第138卷,第4期,第984-1010页,该文献通过引用以其整体并入本文,包括其中的表I。
表51.示例性多肽激素和受体
在一些实施例中,本文所述的效应物包括表51的激素或其功能性变体,例如,其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表51中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,功能性变体与相应受体结合,在相同条件下,对于相同受体,其Kd比相应野生型激素的Kd高不超过10%、20%、30%、40%或50%。在一些实施例中,表51的多肽或其功能性变体包含信号序列,例如,对于效应物而言具有内源性的信号序列,或异源信号序列。在一些实施例中,编码表51的激素或其功能性变体的指环载体用于治疗本文所述的疾病或障碍。
在一些实施例中,本文所述的效应物包含与表51的激素结合的抗体分子(例如,scFv)。在一些实施例中,本文所述的效应物包含与表51的激素受体结合的抗体分子(例如,scFv)。在一些实施例中,抗体分子包含信号序列。
表52.示例性生长因子
在一些实施例中,本文所述的效应物包括表52的生长因子或其功能性变体,例如,其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表52中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,功能性变体与相应受体结合,在相同条件下,对于相同受体,其Kd比相应野生型生长因子的Kd高不超过10%、20%、30%、40%或50%。在一些实施例中,表52的多肽或其功能性变体包含信号序列,例如,对于效应物而言具有内源性的信号序列,或异源信号序列。在一些实施例中,编码表52的生长因子或其功能性变体的指环载体用于治疗本文所述的疾病或障碍。
在一些实施例中,本文所述的效应物包含与表52的生长因子结合的抗体分子(例如,scFv)。在一些实施例中,本文所述的效应物包含与表52的生长因子受体结合的抗体分子(例如,scFv)。在一些实施例中,抗体分子包含信号序列。
示例性生长因子和生长因子受体在以下文献中描述:例如,Bafico等人,“Classification of Growth Factors and Their Receptors[生长因子及其受体的分类]”Holland-Frei Cancer Medicine.[Holland-Frei癌症医学]第6版,该文献通过引用以其全文并入本文。
表53.凝血相关因子
在一些实施例中,本文所述的效应物包括表53的多肽或其功能性变体,例如其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表53中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,功能性变体催化与相应野生型蛋白质相同的反应,例如,催化速率比野生型蛋白低不少于10%、20%、30%、40%或50%。在一些实施例中,表53的多肽或其功能性变体包含信号序列,例如,对于效应物而言具有内源性的信号序列,或异源信号序列。在一些实施例中,编码表53的多肽或其功能性变体的指环载体用于治疗表53的疾病或障碍。
示例性蛋白质替代治疗剂
本文例如在下表中描述了示例性蛋白质替代治疗剂。
表54.示例性酶促效应物和相应适应症
在一些实施例中,本文所述的效应物包括表54的酶或其功能性变体,例如其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表54中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,功能性变体催化与相应野生型蛋白质相同的反应,例如,催化速率比野生型蛋白低不少于10%、20%、30%、40%或50%。在一些实施例中,编码表54的酶或其功能性变体的指环载体用于治疗表54的疾病或障碍。在一些实施例中,指环载体用于递送尿苷二磷酸葡萄糖醛酸基转移酶或其功能变体至靶细胞,例如肝细胞。在一些实施例中,使用指环载体将OCA1或其功能变体递送至靶细胞,例如视网膜细胞。
表55.示例性非酶效应物和相应适应症
在一些实施例中,本文所述的效应物包括促红细胞生成素(EPO),例如人促红细胞生成素(hEPO)或其功能性变体。在一些实施例中,编码促红细胞生成素或其功能性变体的指环载体用于刺激红细胞生成。在一些实施例中,编码促红细胞生成素或其功能性变体的指环载体用于治疗疾病或障碍,例如贫血。在一些实施例中,使用指环载体将EPO或其功能性变体递送至靶细胞,例如红细胞。
在一些实施例中,本文所述的效应物包括表55的多肽或其功能性变体,例如其同源物(例如,直系同源物或旁系同源物)或片段。在一些实施例中,本文所述的效应物包括与表55中通过参考其UniProt ID列出的氨基酸序列具有至少80%、85%、90%、95%、967%、98%、99%序列同一性的蛋白质。在一些实施例中,编码表55的多肽或其功能性变体的指环载体用于治疗表55的疾病或障碍。在一些实施例中,指环载体用于将SMN或其功能性变体递送至靶细胞,例如,脊髓和/或运动神经元的细胞。在一些实施例中,使用指环载体将微小抗肌萎缩蛋白递送至靶细胞,例如,肌细胞。
示例性微型抗肌营养不良蛋白在以下文献中描述:Duan,“Systemic AAV Micro-dystrophin Gene Therapy for Duchenne Muscular Dystrophy.[系统性AAV微型抗肌营养不良蛋白基因疗法用于治疗杜氏肌营养不良症]”Mol Ther.[分子疗法]2018年10月3日;26(10):2337-2356.doi:10.1016/j.ymthe.2018.07.011.电子公开于2018年7月17日。
在一些实施例中,本文所述的效应物包含凝血因子,例如本文表54或表55中所列的凝血因子。在一些实施例中,本文所述的效应物包括蛋白质,该蛋白质在发生突变时会导致溶酶体贮积症,例如本文表54或表55中列出的蛋白质。在一些实施例中,本文所述的效应物包括转运蛋白,例如本文表55中所列的转运蛋白。
在一些实施例中,野生型蛋白的功能性变体包括具有野生型蛋白的一种或多种活性的蛋白质,例如,功能性变体催化与相应野生型蛋白相同的反应,例如,其催化速率比野生型蛋白低不少于10%、20%、30%、40%或50%。在一些实施例中,功能性变体与野生型蛋白结合的相同结合配偶体结合,例如,在相同条件下,对于相同的结合配偶体,其Kd比相应野生型蛋白的Kd高不超过10%、20%、30%、40%或50%。在一些实施例中,功能性变体具有与野生型多肽的多肽序列存在至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的多肽序列。在一些实施例中,功能性变体包括相应野生型蛋白的同源物(例如直系同源物或旁系同源物)。在一些实施例中,功能性变体是融合蛋白。在一些实施例中,融合体包含与相应野生型蛋白具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的第一区域,和第二异源区域。在一些实施例中,功能性变体包含相应野生型蛋白的片段或由其组成。
再生因子、修复因子和纤维化因子
本文所述的治疗性多肽还包括生长因子(例如,如在表56中所披露的)或者其功能性变体,例如,与表56中通过参考其UniProt ID所披露的蛋白序列具有至少80%、85%、90%、95%、967%、98%、99%同一性的蛋白质。还包括针对这样的生长因子的抗体或其片段,或者促进再生及修复的miRNA。
表56.示例性再生因子、修复因子和纤维化因子
转化因子
本文所述的治疗性多肽还包括转化因子,例如,将成纤维细胞转化为分化细胞的蛋白质因子,例如,表57中披露的因子或其功能性变体,例如,与表57中通过参考其UniProtID所披露的蛋白序列具有至少80%、85%、90%、95%、967%、98%、99%同一性的蛋白质。
表57.示例性转化因子
刺激细胞再生的蛋白质
本文所述的治疗性多肽还包括刺激细胞再生的蛋白质,例如,表58中披露的蛋白质或其功能性变体,例如,与表58中通过参考其UniProt ID所披露的蛋白序列具有至少80%、85%、90%、95%、967%、98%、99%同一性的蛋白质。
表58.示例性的刺激细胞再生的蛋白质
靶标 基因登录号 蛋白质登录号
MST1 NG_016454 NP_066278
STK30 基因ID:26448 NP_036103
MST2 基因ID:6788 NP_006272
SAV1 基因ID:60485 NP_068590
LATS1 基因ID:9113 NP_004681
LATS2 基因ID:26524 NP_055387
YAP1 NG_029530 NP_001123617
CDKN2b NG_023297 NP_004927
CDKN2a NG_007485 NP_478102
STING调节效应物
在一些实施例中,本文所述的分泌型效应物调节STING/cGAS信号传导。在一些实施例中,STING调节剂是多肽,例如病毒多肽或其功能性变体。例如,效应物可以包括在以下文献中描述的STING调节剂(例如,抑制剂):Maringer等人,“Message in a bottle:lessons learned from antagonism of STING signalling during RNAvirus infection[瓶中的信息:从RNA病毒感染期间STING信号传导的拮抗作用中吸取的教训]”Cytokine&Growth Factor Reviews[细胞因子与生长因子综述]第25卷,第6期,2014年12月,第669-679页,其通过引用以其全文并入本文。另外的STING调节剂(例如,激活剂)在以下文献中描述:例如,Wang等人“STING activator c-di-GMP enhances the anti-tumor effects ofpeptide vaccines in melanoma-bearing mice.[STING激活剂c-di-GMP增强肽疫苗对携带黑色素瘤的小鼠的抗肿瘤作用]”Cancer Immunol Immunother.[癌症免疫学与免疫疗法]2015年8月;64(8):1057-66.doi:10.1007/s00262-015-1713-5.电子出版于2015年5月19日;Bose“cGAS/STING Pathway in Cancer:Jekyll and Hyde Story of Cancer ImmuneResponse[癌症中的cGAS/STING通路:癌症免疫应答的双重人格故事]”Int J Mol Sci.[国际分子科学杂志]2017年11月;18(11):2456;和Fu等人“STING agonist formulatedcancer vaccines can cure established tumors resistant to PD-1blockade[STING激动剂配制的癌症疫苗可治愈对PD-1阻断有抗性的既定肿瘤]”Sci Transl Med.[科学转化医学]2015年4月15日;7(283):283ra52,其各自通过引用以其全文并入本文。
肽的一些实例包括但不限于荧光标签或标志、抗原、肽治疗剂、天然生物活性肽的合成肽或肽类似物、激动肽或拮抗肽、抗微生物肽、靶向肽或细胞毒性肽、降解肽或自毁肽、以及多种降解肽或自毁肽。本文所述的可用于本发明的肽还包括抗原结合肽,例如抗原结合抗体或抗体样片段,例如单链抗体、纳米抗体(参见,例如,Steeland等人2016.Nanobodies as therapeutics:big opportunities for small antibodies.[作为治疗剂的纳米抗体:小分子抗体的巨大机会]Drug Discov Today[当代药物发现]:21(7):1076-113)。这样的抗原结合肽可以结合细胞质抗原、核抗原或细胞器内抗原。
在一些实施例中,遗传元件包含编码小肽、肽模拟物(例如类肽)、氨基酸和氨基酸类似物的序列。这样的治疗剂通常具有小于约5,000克/摩尔的分子量、小于约2,000克/摩尔的分子量、小于约1,000克/摩尔的分子量、小于约500克/摩尔的分子量以及这样的化合物的盐类、酯类和其他药学上可接受的形式。这样的治疗剂可以包括但不限于神经递质、激素、药物、毒素、病毒或微生物颗粒、合成分子及其激动剂或拮抗剂。
在一些实施例中,本文所述的组合物或指环载体包括与能够靶向特定位置、组织或细胞的配体连接的多肽。
基因编辑组分
指环载体的遗传元件可以包括一个或多个编码基因编辑系统的组分的基因。示例性的基因编辑系统包括成簇规律间隔短回文重复序列(CRISPR)系统、锌指核酸酶(ZFN)和转录激活子样效应物核酸酶(TALEN)。基于ZFN、TALEN和CRISPR的方法例如在Gaj等人Trends Biotechnol.[生物技术动向]31.7(2013):397-405中描述;CRISPR基因编辑方法例如在Guan等人,Application of CRISPR-Cas systemin gene therapy:Pre-clinicalprogress in animal model.[CRISPR-Cas系统在基因治疗中的应用:动物模型中的临床前进展]DNARepair[DNA修复]2016年10月;46:1-8.doi:10.1016/j.dnarep.2016.07.004;Zheng等人,Precise gene deletion and replacement using the CRISPR/Cas9systemin human cells[使用CRISPR/Cas9系统在人细胞中进行精确基因缺失和替换].BioTechniques[生物技术],第57卷,第3号,2014年9月,第115-124页中描述。
CRISPR系统是最初在细菌和古细菌中发现的自适应防御系统。CRISPR系统使用称为CRISPR相关或“Cas”核酸内切酶的RNA引导性核酸酶(例如,Cas9或Cpf1)来切割外来DNA。在典型的CRISPR/Cas系统中,核酸内切酶通过靶向单链或双链DNA序列的序列特异性、非编码“引导RNA”定向到靶核苷酸序列(例如,基因组中要进行序列编辑的位点)。已经鉴定了三类(I-III)CRISPR系统。II类CRISPR系统使用单个Cas核酸内切酶(而不是多个Cas蛋白)。一种II类CRISPR系统包括II型Cas核酸内切酶,例如Cas9、CRISPR RNA(“crRNA”)和反式激活crRNA(“tracrRNA”)。crRNA含有“引导RNA”,即通常对应于靶DNA序列的约20个核苷酸的RNA序列。crRNA还含有与tracrRNA结合的区,以形成被RNA酶III切割的部分双链结构,产生crRNA/tracrRNA杂合体。然后,crRNA/tracrRNA杂合体指导Cas9核酸内切酶识别并切割靶DNA序列。靶DNA序列通常必须邻近针对给定Cas核酸内切酶而言具有特异性的“前间隔序列邻近基序”(“PAM”);然而,PAM序列似乎遍布整个给定基因组。
在一些实施例中,指环载体包括CRISPR核酸内切酶的基因。例如,从各种原核物种鉴定的一些CRISPR核酸内切酶具有独特的PAM序列要求;PAM序列的实例包括5’-NGG(化脓性链球菌)、5’-NNAGAA(嗜热链球菌(Streptococcus thermophilus)CRISPR1)、5’-NGGNG(嗜热链球菌CRISPR3)、和5’-NNNGATT(奈瑟氏脑膜炎双球菌(Neisseria meningiditis))。一些核酸内切酶例如Cas9核酸内切酶与富含G的PAM位点例如5'-NGG有关,并在距PAM位点上游(5')3个核苷酸处对靶DNA进行平末端切割。另一个II类CRISPR系统包括小于Cas9的V型核酸内切酶Cpf1;实例包括AsCpf1(来自氨基酸球菌属物种(Acidaminococcus sp.))和LbCpf1(来自毛螺菌科物种(Lachnospiraceae sp.))Cpf1核酸内切酶与富含T的PAM位点例如5'-TTN相关。Cpf1也可以识别5'-CTA PAM基序。Cpf1通过引入具有4或5个核苷酸的5'突出端的错位或交错的双链断裂来切割靶DNA,例如切割如下靶DNA,该靶DNA中的5个核苷酸的错位或交错的切割位于距离编码链上的PAM位点下游(3’)18个核苷酸的位置处和距离互补链上的PAM位点下游23个核苷酸的位置处;由这样的错位切割产生的5个核苷酸突出端使得通过同源重组的DNA插入比在平末端切割的DNA的插入更精确地进行基因组编辑。参见,例如,Zetsche等人.(2015)Cell[细胞],163:759-771。
在指环载体中可以包括多种CRISPR相关(Cas)基因。基因的具体实例是那些编码来自II类系统的Cas蛋白(包括Cas1、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cpf1、C2C1或C2C3)的基因。在一些实施例中,指环载体包括编码Cas蛋白例如Cas9蛋白的基因,该Cas蛋白可以来自多种原核物种中的任一种。在一些实施例中,指环载体包括编码特定Cas蛋白例如特定Cas9蛋白的基因,选择该Cas蛋白以识别特定的前间隔序列邻近基序(PAM)序列。在一些实施例中,指环载体包括编码两种或更多种不同Cas蛋白的核酸,或者可以将两种或更多种Cas蛋白引入细胞、受精卵、胚胎或动物中,例如,以允许识别和修饰包含相同、相似或不同PAM基序的位点。在一些实施例中,指环载体包括编码具有失活核酸酶(例如,核酸酶缺损型Cas9)的修饰型Cas蛋白的基因。
尽管野生型Cas9蛋白在由gRNA靶向的特定DNA序列处产生双链断裂(DSB),但已知许多具有改进功能的CRISPR核酸内切酶,例如:“切口酶”形式的Cas核酸内切酶(例如,Cas9)仅产生单链断裂;无催化活性的Cas核酸内切酶(例如,Cas9(“dCas9”))不切割靶DNA。可以将编码dCas9的基因与编码效应物结构域的基因融合,以抑制(CRISPRi)或激活(CRISPRa)靶基因的表达。例如,该基因可以编码Cas9与转录沉默子(例如KRAB结构域)或转录激活子的融合体(例如dCas9-VP64融合体)。可以包括编码与FokI核酸酶(“dCas9-FokI”)融合的无催化活性的Cas9(dCas9)的基因,以在与两个gRNA同源的靶序列处产生DSB。参见,例如,许多CRISPR/Cas9质粒在阿德基因资源库(Addgene repository)中披露并可公开获得(阿德基因组织,美国马萨诸塞州剑桥市西德尼大街75号550A室,邮政编码02139(Addgene,75Sidney St.,Suite 550A,Cambridge,MA 02139);addgene.org/crispr/)。Ran等人(2013)Cell[细胞],154:1380-1389将引入两个独立的双链断裂(每个断裂被独立的指导RNA来指导)的“双切口酶”Cas9描述为实现了更准确的基因组编辑。
在美国专利申请公开2016/0138008A1和US2015/0344912A1以及美国专利8,697,359、8,771,945、8,945,839、8,999,641、8,993,233、8,895,308、8,865,406、8,889,418、8,871,445、8,889,356、8,932,814、8,795,965和8,906,616中披露了用于编辑真核生物基因的CRISPR技术。在美国专利申请公开2016/0208243A1中披露了Cpf1核酸内切酶和相应的引导RNA和PAM位点。
在一些实施例中,指环载体包含编码本文所述多肽(例如,靶向核酸酶,例如,Cas9,例如,野生型Cas9、切口酶型Cas9(例如Cas9 D10A)、催化失活Cas9(dCas9)、eSpCas9、Cpf1、C2C1或C2C3)和gRNA的基因。编码核酸酶和一种或多种gRNA的基因的选择取决于靶向突变是否是核苷酸的缺失、置换或添加,例如,对靶向序列的核苷酸的缺失、置换或添加。编码与(一个或多个)效应物结构域(例如VP64)的全部或一部分(例如,其具有生物活性部分)相连的无催化活性的核酸内切酶(例如,催化失活Cas9(dCas9,例如D10A;H840A))的基因会产生可调节一个或多个靶核酸序列的活性和/或表达的嵌合蛋白。
在一些实施例中,指环载体包括编码dCas9与一个或多个效应物结构域的全部或一部分(例如,全长野生型效应物结构域,或者其片段或变体,例如,其具有生物活性部分)的融合体的基因,以产生可用于本文所述方法的嵌合蛋白。因此,在一些实施例中,指环载体包括编码dCas9-甲基化酶融合体的基因。在其他一些实施例中,指环载体包括编码dCas9酶与位点特异性gRNA的融合体的基因,以靶向内源性基因。
在其他方面,指环载体包括编码1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个与dCas9融合的效应物结构域(全部或具有生物活性部分)的基因。
调节性序列
在一些实施例中,遗传元件包含与编码效应物的序列可操作地连接的调节性序列,例如启动子或增强子。
在一些实施例中,启动子包括与编码表达产物的DNA序列相邻的DNA序列。启动子可以可操作地连接至相邻的DNA序列。与不存在启动子时表达的产物的量相比,启动子通常增加DNA序列表达的产物的量。来自一种生物体的启动子可用于增强来自另一生物体的DNA序列的产物表达。例如,脊椎动物启动子可用于在脊椎动物中表达水母GFP。因此,一种启动子元件可以增强一种或多种产物的表达。多个启动子元件是本领域普通技术人员众所周知的。
在一个实施例中,期望高水平的组成型表达。这样的启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)长末端重复(LTR)启动子/增强子、巨细胞病毒(CMV)立即早期启动子/增强子(参见,例如,Boshart等人,Cell[细胞],41:521-530(1985))、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子和磷酸甘油激酶(PGK)启动子。
在另一个实施例中,可能期望诱导型启动子。诱导型启动子是由外源添加的化合物调节的启动子,例如,以顺式或反式提供的启动子,包括但不限于锌诱导型绵羊金属硫蛋白(MT)启动子;地塞米松(Dex)诱导型小鼠乳腺瘤病毒(MMTV)启动子;T7聚合酶启动子系统(WO 98/10088);四环素阻遏系统(Gossen等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],89:5547-5551(1992));四环素诱导系统(Gossen等人,Science[科学],268:1766-1769(1995);还参见Harvey等人,Curr.Opin.Chem.Biol.[当代化学生物学观点],2:512-518(1998));RU486诱导系统(Wang等人,Nat.Biotech.[自然-生物技术],15:239-243(1997)和Wang等人,Gene Ther.[基因治疗],4:432-441(1997));和雷帕霉素诱导系统(Magari等人,J.Clin.Invest.[临床研究杂志],100:2865-2872(1997);Rivera等人,Nat.Medicine.[自然-医学]2:1028-1032(1996))。可在这种情况下使用的其他类型的诱导型启动子是那些由特定的生理状态(例如温度、急性期或仅在复制细胞中)调节的启动子。
在一些实施例中,使用感兴趣基因或核酸序列的天然启动子。当期望基因或核酸序列的表达应模拟天然表达时,可以使用天然启动子。当基因或其他核酸序列的表达必须在时间或发育上,或者以组织特异性方式或响应于特定转录刺激而受到调节时,可以使用天然启动子。在另一个实施例中,也可以使用其他天然表达控制元件,例如增强子元件、多腺苷酸化位点或Kozak共有序列来模拟天然表达。
在一些实施例中,遗传元件包含可操作地连接至组织特异性启动子的基因。例如,如果需要在骨骼肌中表达,则可以使用在肌肉中有活性的启动子。这些包括来自编码骨骼肌α-肌动蛋白、肌球蛋白轻链2A、抗肌萎缩蛋白、肌肉型肌酸激酶的基因的启动子,以及活性高于天然存在启动子的合成肌肉启动子。参见Li等人,Nat.Biotech.[自然-生物技术],17:241-245(1999)。已知的具有组织特异性的启动子的实例如下所示:肝白蛋白,Miyatake等人J.Virol.[病毒学杂志],71:5124-32(1997);乙型肝炎病毒核心启动子,Sandig等人,Gene Ther.[基因治疗]3:1002-9(1996);甲胎蛋白(AFP),Arbuthnot等人,Hum.Gene Ther.[人基因治疗],7:1503-14(1996),骨骼(骨钙素,Stein等人,Mol.Biol.Rep.[分子生物学报告],24:185-96(1997);骨唾液酸蛋白,Chen等人,J.Bone Miner.Res.[骨与矿物质研究杂志]11:654-64(1996)),淋巴细胞(CD2,Hansal等人,J.Immunol.[免疫学杂志],161:1063-8(1998);免疫球蛋白重链;T细胞受体α链),神经元(神经元特异性烯醇化酶(NSE)启动子,Andersen等人Cell.Mol.Neurobiol.[细胞与分子神经生物学],13:503-15(1993);神经丝蛋白轻链基因,Piccioli等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],88:5611-5(1991);神经元特异性vgf基因,Piccioli等人,Neuron[神经元],15:373-84(1995)];等。
遗传元件可包括增强子,例如与编码基因的DNA序列相邻的DNA序列。增强子元件通常位于启动子元件的上游,或者可以位于编码DNA序列(例如,转录或翻译成一种或多种产物的DNA序列)的下游或之内。因此,增强子元件可位于编码产物的DNA序列上游或下游的100个碱基对、200个碱基对或300个或更多个碱基对。增强子元件可以增加DNA序列表达的重组产物的量,超出由启动子元件提供的增加的表达。对于本领域普通技术人员而言,多个增强子元件是容易获得的。
在一些实施例中,遗传元件包括位于编码本文所述的表达产物的序列侧翼的一个或多个反向末端重复序列(ITR)。在一些实施例中,遗传元件包含位于编码本文所述的表达产物的序列侧翼的一个或多个长末端重复序列(LTR)。可以使用的启动子序列的实例包括但不限于猿猴病毒40(SV40)早期启动子、小鼠乳腺瘤病毒(MMTV)、人类免疫缺陷病毒(HIV)长末端重复序列(LTR)启动子、MoMuLV启动子、禽白血病病毒启动子、EB病毒(Epstein-Barrvirus)立即早期启动子和劳斯肉瘤病毒启动子。
复制蛋白
在一些实施例中,指环载体,例如合成指环载体的遗传元件可包括编码一种或多种复制蛋白的序列。在一些实施例中,指环载体可以通过滚环式复制法进行复制,例如,前导链和后随链的合成是非偶联的。在这样的实施例中,指环载体包含三个另外的元件:i)编码起始蛋白的基因,ii)双链起点,和iii)单链起点。包含复制蛋白的滚环式复制(RCR)蛋白复合物与前导链结合并使复制起点去稳定。RCR复合物切割基因组以产生游离的3'OH末端。细胞DNA聚合酶从游离的3'OH末端开始病毒DNA复制。复制基因组后,RCR复合物共价地闭合环。这导致释放出正的环状单链亲本DNA分子和由负的亲本链和新合成的正链组成的环状双链DNA分子。单链DNA分子可以被包裹或参与第二轮复制。参见例如Virology Journal[病毒学杂志]2009,6:60doi:10.1186/1743-422X-6-60。
遗传元件可包含编码聚合酶,例如RNA聚合酶或DNA聚合酶的序列。
其他序列
在一些实施例中,遗传元件还包括编码产物(例如核酶、编码蛋白质的治疗性mRNA、外源性基因)的核酸。
在一些实施例中,遗传元件包括一个或多个影响指环载体在宿主或宿主细胞中以下功能的序列:物种和/或组织和/或细胞嗜性(例如,衣壳蛋白序列)、感染性(例如,衣壳蛋白序列)、免疫抑制/激活(例如,调节性核酸)、病毒基因组结合和/或包装、免疫逃逸(非免疫原性和/或耐受性)、药代动力学、胞吞作用和/或细胞附着、核进入、细胞内调节和定位、胞吐作用调节、增殖和核酸保护。
在一些实施例中,遗传元件可以包含其他序列,其包括DNA、RNA或人工核酸。其他序列可包括但不限于基因组DNA,cDNA或编码tRNA、mRNA、rRNA、miRNA、gRNA、siRNA或其他RNAi分子的序列。在一个实施例中,遗传元件包括编码siRNA的序列,以靶向与调节性核酸相同的基因表达产物的不同基因座。在一个实施例中,遗传元件包括编码siRNA的序列,以靶向与调节性核酸不同的基因表达产物。
在一些实施例中,遗传元件进一步包括以下序列中的一个或多个:编码一个或多个miRNA的序列、编码一种或多种复制蛋白的序列、编码外源性基因的序列、编码治疗剂的序列、调节性序列(例如,启动子、增强子)、编码一个或多个靶向内源性基因(siRNA、lncRNA、shRNA)的调节性序列的序列和编码治疗性mRNA或蛋白的序列。
其他序列的长度可为约2nt至约5000nt、约10nt至约100nt、约50nt至约150nt、约100nt至约200nt、约150nt至约250nt、约200至约300nt、约250nt至约350nt、约300nt至约500nt、约10nt至约1000nt、约50nt至约1000nt、约100nt至约1000nt、约1000nt至约2000nt、约2000nt至约3000nt、约3000nt至约4000nt、约4000nt至约5000nt或其间的任何范围。
编码的基因
例如,遗传元件可以包括与信号传导生化通路相关的基因,例如与信号传导生化通路相关的基因或多核苷酸。实例包括与疾病相关的基因或多核苷酸。“与疾病相关的”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在患病组织衍生的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因或多核苷酸。它可能是会以异常高水平表达的基因;它可能是会以异常低水平表达的基因,其中表达的改变与疾病的发生和/或进展相关。疾病相关基因也指具有一个或多个突变或遗传变异的基因,这些突变或遗传变异直接导致疾病病因或与导致疾病病因的一个或多个基因连锁不平衡。
与疾病相关的基因和多核苷酸的实例可得自约翰·霍普金斯大学的麦考斯克-纳森斯遗传医学研究所(马里兰州巴尔的摩)(McKusick-Nathans Institute of GeneticMedicine,Johns Hopkins University(Baltimore,Md.))和国家医学图书馆的国家生物技术信息中心(马里兰州贝塞斯达)(National Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.))。与疾病相关的基因和多核苷酸的实例列于美国专利号:8,697,359的表A和表B中,其通过引用以其全文并入本文。特定疾病信息可获自约翰·霍普金斯大学的麦考斯克-纳森斯遗传医学研究所(马里兰州巴尔的摩)(McKusick-Nathans Institute of Genetic Medicine,Johns Hopkins University(Baltimore,Md.))和国家医学图书馆的国家生物技术信息中心(马里兰州贝塞斯达)(National Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.))。与信号传导生化途径相关的基因和多核苷酸的实例列于美国专利号:8,697,359的表A-C中,其通过引用以其全文并入本文。
此外,如本文其他地方所述,遗传元件可以编码靶向部分。这可以例如通过插入编码糖、糖脂或蛋白质例如抗体的多核苷酸来实现。本领域技术人员知道用于生成靶向部分的其他方法。
病毒序列
在一些实施例中,遗传元件包含至少一个病毒序列。在一些实施例中,该序列与来自以下的一个或多个序列,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列具有同源性或同一性:单DNA病毒,例如,称德病毒(例如,单环编码病毒门[例如,雷东多病毒、圆环病毒{例如,猪圆环病毒,例如,PCV-1或PCV-2;或者喙羽症病毒}、双生病毒{例如,番茄金花叶病毒}或矮缩病毒{例如,BBTV、MDV1、SCSVF或FBNYV}]),或细小病毒(例如,依赖性细小病毒,例如,博卡病毒或AAV)(例如,如本文所述)。在实施例中,遗传元件区包含来自指环病毒基因组的序列(例如,如本文所述),或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,该序列来自如下表41中所列的指环病毒基因组。
表41:指环病毒及其序列的实例。登录号和相关序列信息可在www.ncbi.nlm.nih.gov/genbank/上获得,以2018年12月11日作为参考。
在一些实施例中,遗传元件包含一个或多个与来自一种或多种非指环病毒(例如,单DNA病毒,例如,称德病毒(例如,单环编码病毒门[例如,雷东多病毒、圆环病毒{例如,猪圆环病毒,例如,PCV-1或PCV-2;或者喙羽症病毒}、双生病毒{例如,番茄金花叶病毒}或矮缩病毒{例如,BBTV、MDV1、SCSVF或FBNYV}]),或细小病毒(例如,依赖性细小病毒,例如,博卡病毒或AAV))的一个或更多个序列具有同源性或同一性的序列。在一些实施例中,由于重组病毒是有缺陷的,因此可以提供协助以产生感染性颗粒。可以提供这样的协助,例如,通过使用含有质粒的辅助细胞系,这些质粒编码在例如LTR内的调控序列控制下的一种或多种病毒基因(例如,Rep基因和/或结构基因)。用于复制本文所述的指环载体的合适细胞系包括如本文所述的宿主细胞系,其可以被修饰,例如,如本文所述。所述遗传元件可以另外含有编码选择性标志的基因,以便可以鉴定所期望的遗传元件。
在一些实施例中,遗传元件包括非沉默突变,例如导致编码的多肽中氨基酸差异的碱基置换、缺失或添加,只要序列与由第一核苷酸序列编码的多肽保持至少约70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性或以其他方式可用于实施本发明。在这方面,可以进行某些保守性氨基酸置换,通常认为这些置换不会使蛋白质的整体功能失活:例如对于带正电的氨基酸(反之亦然),赖氨酸、精氨酸和组氨酸;对于带负电的氨基酸(反之亦然),天冬氨酸和谷氨酸;对于某些电中性氨基酸的组(在所有情况下,反之亦然),(1)丙氨酸和丝氨酸,(2)天冬酰胺、谷氨酰胺和组氨酸,(3)半胱氨酸和丝氨酸,(4)甘氨酸和脯氨酸,(5)异亮氨酸、亮氨酸和缬氨酸,(6)蛋氨酸、亮氨酸和异亮氨酸,(7)苯丙氨酸、蛋氨酸、亮氨酸和酪氨酸,(8)丝氨酸和苏氨酸,(9)色氨酸和酪氨酸,(10)以及例如酪氨酸、色氨酸和苯丙氨酸。氨基酸可以根据物理特性以及对二级和三级蛋白质结构的贡献进行分类。保守性置换在本领域中被认为是一个氨基酸被具有相似特性的另一氨基酸置换。
具有相同或指定百分比的相同核苷酸或氨基酸残基的两个或更多个核酸或多肽序列的同一性(例如,当在比较窗口或指定区域内进行最大对应性比较和对齐时,在具体区域内约60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性)可使用带有以下所述默认参数的BLAST或BLAST 2.0序列比较算法,或通过人工比对和目视检查(例如,参见NCBI网站www.ncbi.nlm.nih.gov/BLAST/或类似网站)进行测量。同一性也可以指或可以应用于测试序列的互补序列。同一性还包括具有缺失和/或添加的序列以及具有置换的序列。如本文所述,算法考虑了空位和类似情况。同一性可以在长度为至少约10个氨基酸或核苷酸、长度为约15个氨基酸或核苷酸、长度为约20个氨基酸或核苷酸、长度为约25个氨基酸或核苷酸、长度为约30个氨基酸或核苷酸、长度为约35个氨基酸或核苷酸、长度为约40个氨基酸或核苷酸、长度为约45个氨基酸或核苷酸、长度为约50个氨基酸或核苷酸、或更多的区域中存在。由于遗传密码是简并的,因此同源核苷酸序列可包括任何数目的“沉默”碱基改变,即仍然编码相同氨基酸的核苷酸置换。
蛋白质外壳
在一些实施例中,指环载体,例如合成指环载体包含包封遗传元件的蛋白质外壳。蛋白质外壳可以包含基本上非致病性外壳蛋白,其不能在哺乳动物中引发不必要的免疫应答。指环载体的蛋白质外壳通常包含基本上非致病性蛋白质,其可自组装成构成蛋白质外壳的二十面体构造。
在一些实施例中,蛋白质外壳蛋白质由指环载体的遗传元件的序列编码(例如,与遗传元件顺式)。在其他实施例中,蛋白质外壳蛋白质由独立于指环载体的遗传元件的核酸编码(例如,与遗传元件反式)。
在一些实施例中,蛋白质(例如基本上非致病性蛋白质和/或蛋白质外壳蛋白质)包含一个或多个糖基化氨基酸,例如2、3、4、5、6、7、8、9、10或更多个糖基化氨基酸。
在一些实施例中,蛋白质(例如基本上非致病性蛋白质和/或蛋白质外壳蛋白质)包含至少一个亲水性DNA结合区、精氨酸富集区、苏氨酸富集区、谷氨酰胺富集区、N-末端聚精氨酸序列、可变区、C-末端聚谷氨酰胺/谷氨酸序列和一个或多个二硫键。
在一些实施例中,蛋白质是衣壳蛋白,例如,具有与由编码本文所述的衣壳蛋白(例如,指环病毒ORF1分子和/或衣壳蛋白序列,例如,如本文所述)的任一核苷酸序列编码的蛋白质存在至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列。在一些实施例中,蛋白质或衣壳蛋白的功能性片段由与指环病毒ORF1核酸(例如,如本文所述)具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列编码。
在一些实施例中,指环载体包含编码衣壳蛋白或衣壳蛋白的功能性片段或与如本文所述的指环病毒ORF1分子具有至少约60%、70%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的序列的核苷酸序列。
在一些实施例中,序列同一性较低的氨基酸范围可以提供一种或多种本文所述的特性以及细胞/组织/物种特异性(例如,嗜性)的差异。
在一些实施例中,指环载体在蛋白质外壳中缺乏脂质。在一些实施例中,指环载体缺少脂质双层,例如病毒包膜。在一些实施例中,指环载体的内部完全由蛋白质外壳所覆盖(例如,100%覆盖率)。在一些实施例中,指环载体的内部低于100%由蛋白质外壳所覆盖,例如,95%、90%、85%、80%、70%、60%、50%或更低的覆盖率。在一些实施例中,蛋白质外壳包含缺口或间断,例如,允许对水、离子、肽或小分子具有渗透性,只要遗传元件还保留在指环载体中。
在一些实施例中,蛋白质外壳包含特异性识别和/或结合宿主细胞例如互补蛋白或多肽以介导遗传元件进入宿主细胞的一种或多种蛋白质或多肽。
在一些实施例中,蛋白质外壳包含以下中的一种或多种:例如ORF1分子(例如,如本文所述)的精氨酸富集区、胶冻卷区域、N22结构域、高变区和/或C-末端结构域。在一些实施例中,蛋白质外壳包含以下中的一种或多种:一种或多种糖基化蛋白、亲水性DNA结合区、精氨酸富集区、苏氨酸富集区、谷氨酰胺富集区、N-末端聚精氨酸序列、可变区、C-末端聚谷氨酰胺/谷氨酸序列、以及一个或多个二硫键。例如,蛋白质外壳包含由指环病毒ORF1核酸(例如,如本文所述)编码的蛋白质。
在一些实施例中,蛋白质外壳包含以下特征中的一种或多种:二十面体对称、识别和/或结合与一种或多种宿主细胞分子相互作用以介导进入宿主细胞的分子、缺乏脂质分子、缺乏碳水化合物、具有pH和温度稳定性、耐去垢剂、以及在宿主中基本上具有非免疫原性或非致病性。
在一些实施例中,将如本文所述的包含蛋白质外壳的第一多个指环载体施用于受试者。在一些实施例中,随后在施用第一多个之后向受试者施用本文所述的包含蛋白质外壳的第二多个指环载体。在一些实施例中,第二多个指环载体包含与第一多个指环载体相同的蛋白质外壳。在一些实施例中,第二多个指环载体包含蛋白质外壳,该蛋白质外壳与第一多个指环载体的蛋白质外壳具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%氨基酸序列同一性。在一些实施例中,第二多个指环载体包含ORF1分子,该分子与第一多个指环载体的ORF1分子具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%氨基酸序列同一性。在一些实施例中,第二多个指环载体包含ORF1分子,该分子具有与第一多个指环载体包含的ORF1分子相同的氨基酸序列。在一些实施例中,第二多个指环载体的蛋白质外壳包含多肽(例如ORF1分子),该多肽与第一多个指环载体的蛋白质外壳中的多肽(例如ORF1分子)具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%氨基酸序列同一性。在一些实施例中,第二多个指环载体的蛋白质外壳包含多肽(例如,衣壳蛋白),该多肽与第一多个指环载体的蛋白质外壳中的多肽(例如,衣壳蛋白)具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%氨基酸序列同一性。在一些实施例中,第二多个指环载体包含与第一多个指环载体具有至少一个共同的表面表位的蛋白质外壳。在一些实施例中,第二多个指环载体包含与第一多个指环载体的ORF1具有至少一个共同的表面表位的ORF1分子。在一些实施例中,第二多个指环载体包含蛋白质外壳,该蛋白质外壳与第一多个指环载体的蛋白质外壳具有一个或多个氨基酸序列差异(例如,保守突变)。在一些实施例中,结合至第一多个指环载体的蛋白质外壳的抗体(例如,受试者体内的抗体)也结合至第二多个指环载体的蛋白质外壳。在一些实施例中,相对于第二多个指环载体的蛋白质外壳,抗体以大致相同的亲和力(例如,KD为约90%至110%,例如95%至105%)结合至第一多个指环载体的蛋白质外壳。
在一些实施例中,第一多个指环载体的蛋白质外壳包含与第二多个指环载体的蛋白质外壳相同的三级结构。在一些实施例中,第一和第二多个指环载体的蛋白质外壳的结构(例如,三级结构)可以使用冷冻电子显微术(cryo-EM)、X射线晶体学或核磁共振(NMR)来确定。在一些实施例中,使用结构比对和蛋白质结构中原子的原子坐标测量(例如,均方根误差(RMSD)测量)对第一多个指环载体的蛋白质外壳的结构与第二多个指环载体的蛋白质外壳的结构进行比较。在一些实施例中,可以计算被比较的结构的多肽链骨架、被比较的结构的多肽链的α碳或者被比较的结构的所有原子(例如,第一多个指环载体的蛋白质外壳和第二多个指环载体的蛋白质外壳)的RMSD。在一些实施例中,RMSD为较低值,例如,≤5埃,表明第一多个指环载体的蛋白质外壳和第二多个指环载体的蛋白质外壳之间的结构相似性。在一些实施例中,RMSD为较低值,例如,≤3埃,表明第一多个指环载体的蛋白质外壳和第二多个指环载体的蛋白质外壳之间的高结构相似性。在一些实施例中,RMSD为0埃表明两种蛋白质包含相同结构,例如,第一多个指环载体的蛋白质外壳的结构与第二多个指环载体的蛋白质外壳的结构相同。
III.核酸构建体
本文所述的遗传元件可以被包含在核酸构建体(例如,核酸遗传元件构建体,例如,如本文所述)中。
在一个方面中,本发明包括核酸遗传元件构建体,该构建体包含遗传元件,该遗传元件包含(i)编码外壳蛋白(例如,非致病性外壳蛋白,例如,指环病毒ORF1分子或者其剪接变体或功能性片段)的序列、(ii)使该遗传元件与非致病性外壳蛋白结合的外壳蛋白结合序列和(iii)编码效应物的序列。
在另一方面,本发明包括包含遗传元件的核酸遗传元件构建体,该遗传元件包含(i)将遗传元件结合至外壳蛋白(例如,非致病性外壳蛋白,例如,指环病毒ORF1分子或其剪接变体或功能性片段)的外壳蛋白结合序列,(ii)非指环病毒序列(例如,非指环病毒复制起点,例如,如本文所述)和(iii)编码效应物的序列。
遗传元件或遗传元件内的任何序列可以使用任何合适的方法获得。多种重组方法是本领域已知的,例如,使用标准技术,从含有病毒序列的细胞中筛选文库、从已知含有相同序列的核酸构建体中获得该序列、或者直接从含有相同序列的细胞和组织中分离出该序列。可替代地或组合地,遗传元件的部分或全部可以以合成方式产生,而不是进行克隆。
在一些实施例中,核酸构建体包括调节性元件、与靶基因同源的核酸序列、和/或各种报告构建体,用于在活细胞内和/或当细胞内分子存在于靶细胞内时引起报告分子的表达。
报告基因用于鉴定可能转染的细胞和评估调节性序列的功能。通常,报告基因是如下基因,该基因不存在于受体生物体或组织中或由其表达并且编码多肽,该多肽的表达通过一些可易于检测的特性(例如,酶活性)表现出来。在将DNA引入受体细胞后,在适当的时间测定报告基因的表达。合适的报告基因可包括编码荧光素酶、β-半乳糖苷酶、氯霉素乙酰转移酶、分泌型碱性磷酸酶的基因或绿色荧光蛋白基因(例如,Ui-Tei等人,2000FEBSLetters[欧洲生化学会联合会快报]479:79-82)。合适的表达系统是熟知的,可以使用已知技术制备或商业获得。通常,将具有显示报告基因最高表达水平的最少5’侧翼区的构建体鉴定为启动子。这样的启动子区可以连接至报告基因,并且用于评估药剂调节启动子驱动的转录的能力。
在一些实施例中,核酸构建体在宿主细胞中是基本上非致病性的和/或基本上非整合的,或者在宿主中是基本上非免疫原性的。
在一些实施例中,核酸构建体是双链的。在一些实施例中,核酸构建体是单链的。在一些实施例中,核酸构建体是环状的(例如,质粒或微环,例如,如本文所述)。在一些实施例中,核酸构建体是线性的。
在一些实施例中,遗传元件可以从核酸构建体(例如,在宿主细胞中,例如,如本文所述)产生。在一些实施例中,遗传元件可在Rep分子(例如非指环病毒Rep分子,例如AAVRep分子,例如AAV Rep蛋白,或与其具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性的多肽)的存在下从核酸构建体中产生。在一些实施例中,遗传元件不能通过指环病毒Rep蛋白(例如,如本文所述的ORF2分子)从核酸构建体中产生。
在一些实施例中,核酸构建体的量足以调节表型、病毒水平、基因表达、与其他病毒竞争、疾病状态等中的一种或多种至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更高。
IV.组合物
本文所述的指环载体也可与药用赋形剂(例如,如本文所述的药用赋形剂)一起包含在药物组合物中。在一些实施例中,药物组合物包含至少105、106、107、108、109、1010、1011、1012、1013、1014或1015个指环载体。在一些实施例中,药物组合物包含约105-1015、105-1010或1010-1015个指环载体。在一些实施例中,药物组合物包含约108(例如,约105、106、107、108、109或1010)个基因组当量/mL的指环载体。在一些实施例中,药物组合物包含105-1010、106-1010、107-1010、108-1010、109-1010、105-106、105-107、105-108、105-109、105-1011、105-1012、105-1013、105-1014、105-1015或1010-1015个基因组当量/mL的指环载体,例如,如根据PCT/US19/65995的实例18的方法所确定的。在一些实施例中,药物组合物包含足够的指环载体,以将包含在指环载体中的遗传元件的至少1、2、5或10、100、500、1000、2000、5000、8,000、1x104、1x105、1x106、1x107个或更多个拷贝/细胞递送至真核细胞群。在一些实施例中,药物组合物包含足够的指环载体,以将包含在指环载体中的遗传元件的至少约1x 104、1x 105、1x 106、1x 107、或约1x 104-1x 105、1x 104-1x 106、1x 104-1x 107、1x 105-1x 106、1x 105-1x 107、或1x106-1x 107个拷贝/细胞递送至真核细胞群。
在一些实施例中,药物组合物具有以下特征中的一种或多种:该药物组合物满足药物或良好生产规范(GMP)标准;该药物组合物是根据良好生产规范(GMP)制成的;该药物组合物具有低于预定参考值的病原体水平,例如基本上不含病原体;该药物组合物具有低于预定参考值的污染物水平,例如,基本上不含污染物;或该药物组合物具有低免疫原性或基本上是非免疫原性的,例如,如本文所述。
在一些实施例中,药物组合物包含低于阈值量的一种或多种污染物。在药物组合物中希望排除或降到最低限度的示例性污染物包括但不限于宿主细胞核酸(例如,宿主细胞DNA和/或宿主细胞RNA)、动物衍生的组分(例如,血清白蛋白或胰蛋白酶)、可复制型病毒、非感染性颗粒、游离病毒衣壳蛋白、外源因子和聚集体。在实施例中,污染物是宿主细胞DNA。在实施例中,该组合物每剂包含低于约10ng的宿主细胞DNA。在实施例中,通过对宿主细胞DNA进行过滤和/或酶促降解来降低组合物中宿主细胞DNA的水平。在实施例中,按重量计,该药物组合物含有低于10%(例如,低于约10%、5%、4%、3%、2%、1%、0.5%或0.1%)的污染物。
在一个方面中,本文所述的本发明包括药物组合物,其包含:
a)包含遗传元件的指环载体,该遗传元件包含(i)编码非致病性外壳蛋白的序列,(ii)使该遗传元件与该非致病性外壳蛋白结合的外壳蛋白结合序列,和(iii)编码调节性核酸的序列;和蛋白质外壳,其与该遗传元件相关联,例如,包裹或包封该遗传元件;以及
b)药用赋形剂。
囊泡
在一些实施例中,组合物进一步包含载剂组分,例如微粒、脂质体、囊泡或外泌体。在一些实施例中,脂质体包含球形囊泡结构,该球形囊泡结构由围绕内部水性隔室的单层或多层的脂质双层和相对不可渗透的外部亲脂性磷脂双层组成。脂质体可以是阴离子型、中性的或阳离子型。脂质体通常具有生物相容性、无毒,可以递送亲水性和亲脂性药物分子,保护其货物免受血浆酶类的降解,并跨生物膜运输其载荷(对于综述,参见,例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章编号469679,共12页,2011,doi:10.1155/2011/469679)。
囊泡可以由几种不同类型的脂质制成;然而,磷脂最常用于产生脂质体作为药物载剂。囊泡可包括但不限于DOTMA、DOTAP、DOTIM、DDAB,单独使用或与胆固醇一起产生DOTMA和胆固醇、DOTAP和胆固醇、DOTIM和胆固醇以及DDAB和胆固醇。用于制备多层囊泡脂质的方法在本领域中是已知的(参见例如美国专利号6,693,086,其关于多层囊泡脂质制剂的教导通过引用并入本文)。尽管当脂质膜与水溶液混合时,囊泡的形成是自发的,但也可以通过使用均质器、超声仪或挤压装置以振荡的形式施加力来加快囊泡的形成(对于综述,参见例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章编号469679,共12页,2011.doi:10.1155/2011/469679)。可以通过挤出通过具有减小尺寸的过滤器来制备挤出的脂质,如Templeton等人,Nature Biotech[自然生物技术],15:647-652,1997中所述,该文献关于挤出脂质制备的传授内容通过引用并入本文。
如本文所述,可将添加剂添加至囊泡以改变其结构和/或特性。例如,可以将胆固醇或鞘磷脂加入混合物中,以帮助稳定结构并防止内部货物泄漏。此外,可以由氢化的卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇和磷酸二鲸蜡酯制备囊泡。(对于综述,参见,例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章编号469679,共12页,2011.doi:10.1155/2011/469679)。同样,囊泡可以在合成期间或之后进行表面修饰以包括与受体细胞上的反应性基团互补的反应性基团。这样的反应性基团包括但不限于马来酰亚胺基团。例如,可以合成囊泡以包括马来酰亚胺缀合的磷脂,例如但不限于DSPE-MaL-PEG2000。
囊泡配制品可以主要由天然磷脂和脂质(例如1,2-二硬脂酰基-sn-甘油-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷脂)构成。仅由磷脂组成的配制品在血浆中不太稳定。然而,用胆固醇操纵脂质膜降低了封装的货物的快速释放,或者1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)增加了稳定性(对于综述,参见,例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章ID 469679,第12页,2011.doi:10.1155/2011/469679)。
在实施例中,脂质可用于形成脂质微粒。脂质包括但不限于DLin-KC2-DMA4、C12-200和可使用自发囊泡形成程序配制的共脂质二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG(参见例如Novobrantseva,Molecular Therapy-Nucleic Acids[分子治疗-核酸](2012)1,e4;doi:10.1038/mtna.2011.3)。组分摩尔比可以为约50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂酰磷脂酰胆碱/胆固醇/PEG-DMG)。Tekmira在美国和国外拥有约95个专利同族组合,涉及脂质微粒和脂质微粒配制品的各个方面(参见,例如,美国专利号7,982,027;7,799,565;8,058,069;8,283,333;7,901,708;7,745,651;7,803,397;8,101,741;8,188,263;7,915,399;8,236,943和7,838,658以及欧洲专利号1766035;1519714;1781593和1664316),所有这些都可以用于和/或适用于本发明。
在一些实施例中,微粒包含以随机方式排列的一种或多种固化聚合物。微粒可以是生物可降解型。生物可降解型微粒可以例如使用本领域已知的方法合成,包括但不限于溶剂蒸发、热熔微囊化、溶剂去除和喷雾干燥。Bershteyn等人,Soft Matter[软物质]4:1787-1787,2008和US2008/0014144A1中描述了用于合成微粒的示例性方法,其关于微粒合成的具体教导通过引用并入本文。
可用于形成生物可降解型微粒的示例性合成聚合物包括但不限于脂肪族聚酯、聚(乳酸)(PLA)、聚(乙醇酸)(PGA)、乳酸和乙醇酸的共聚物(PLGA)、聚己内酯(PCL)、聚酐、聚(原)酸酯、聚氨酯、聚(丁酸)、聚(丙酸)和聚(丙交酯-己内酯)以及天然聚合物,例如白蛋白、藻酸盐和其他多糖,包括葡聚糖和纤维素、胶原蛋白、其化学衍生物,包括化学基团的取代、添加,例如烷基、亚烷基、羟基化、氧化和本领域技术人员常规进行的其他修饰)、白蛋白和其他亲水蛋白、玉米蛋白和其他醇溶蛋白和疏水性蛋白质、共聚物及其混合物。通常,这些材料通过酶水解或暴露于水、通过表面或整体腐蚀而降解。
微粒的直径范围为0.1-1000微米(μm)。在一些实施例中,它们的直径的尺寸范围为1μm-750μm、或50μm-500μm、或100μm-250μm。在一些实施例中,它们的直径的尺寸范围为50μm-1000μm、50μm-750μm、50μm-500μm或50μm-250μm。在一些实施例中,它们的直径的尺寸范围是.05μm-1000μm、10μm-1000μm、100μm-1000μm或500μm-1000μm。在一些实施例中,它们的直径为约0.5μm、约10μm、约50μm、约100μm、约200μm、约300μm、约350μm、约400μm、约450μm、约500μm、约550μm、约600μm、约650μm、约700μm、约750μm、约800μm、约850μm、约900μm、约950μm或约1000μm。如微粒直径的上下文中所用,术语“约”是指所述绝对值的+/-5%。
在一些实施例中,配体经由存在于颗粒表面上并存在于待连接的配体上的官能化学基团(羧酸、醛、胺、巯基和羟基)与微粒表面缀合。可以通过例如在微粒的乳液制备期间,并入具有官能化学基团的稳定剂来将官能度引入微粒中。
将官能团引入微粒的另一实例是在微粒制备后,通过用均双官能或异双官能交联剂直接交联颗粒和配体。该程序可以使用合适的化学物质和一类交联剂(CDI、EDAC、戊二醛等,如下文更详细论述的)或在制备后经由对颗粒表面进行化学修饰将配体偶联至颗粒表面的任何其他交联剂。这还包括如下过程,通过该过程可以将两亲性分子(例如脂肪酸、脂质或功能性稳定剂)被动吸附并粘附到颗粒表面,从而引入官能性端基用于连接到配体上。
在一些实施例中,可以合成微粒以在其外表面上包含一个或多个靶向基团以靶向特定的细胞或组织类型(例如,心肌细胞)。这些靶向基团包括但不限于受体、配体、抗体等。这些靶向基团将其配偶体结合在细胞表面上。在一些实施例中,微粒将整合到构成细胞表面的脂质双层中,并且将线粒体递送至细胞中。
微粒还可在其最外表面上包含脂质双层。该双层可以由一个或多个相同或不同类型的脂质组成。实例包括但不限于磷脂,例如磷酸胆碱和磷酸肌醇。具体实例包括但不限于DMPC、DOPC、DSPC和各种其他脂质,例如本文针对脂质体所述的那些。
在一些实施例中,载剂包含例如本文所述的纳米颗粒。
在一些实施例中,本文所述的囊泡或微粒用诊断剂进行官能化。诊断剂的实例包括但不限于用于正电子发射断层扫描(PET)、计算机辅助断层扫描(CAT)、单光子发射计算机化断层扫描、x射线、荧光检查和磁共振成像(MRI)的市售成像剂;以及造影剂。在MRI中用作造影剂的合适材料的实例包括钆螯合物,以及铁、镁、锰、铜和铬。
载剂
本文所述的组合物(例如,药物组合物)可包含载剂、与载剂一起配制和/或在载剂中递送。在一个方面中,本发明包括组合物,例如药物组合物,其包含载剂(例如,囊泡、脂质体、脂质纳米颗粒、外泌体、红细胞、外泌体(例如哺乳动物或植物外泌体))、融合体),该载剂包含(例如,封装)本文所述的组合物(例如,本文所述的指环载体、指环病毒或遗传元件)。
在一些实施例中,本文所述的组合物和系统可以配制在脂质体或其他类似的囊泡中。通常,脂质体是球形囊泡结构,这些球形囊泡结构由围绕内部水性隔室的单层或多层的脂质双层和相对不可渗透的外部亲脂性磷脂双层构成。脂质体可以是阴离子型、中性的或阳离子型。脂质体通常具有以下特征中的一个或多个(例如,全部):生物相容性,无毒,可以递送亲水性和亲脂性药物分子,可以保护其货物免受血浆酶的降解,并可以将其负载运输穿过生物膜和血脑屏障(BBB)(参见,例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章ID 469679,第12页,2011.doi:10.1155/2011/469679;和Zylberberg&Matosevic.2016.Drug Delivery[药物递送],23:9,3319-3329,doi:10.1080/10717544.2016.1177136)。
囊泡可以由几种不同类型的脂质制成;然而,磷脂最常用于产生脂质体作为药物载剂。用于制备多层囊泡脂质的方法是已知的(参见例如美国专利号6,693,086,其关于多层囊泡脂质制剂的教导通过引用并入本文)。尽管当脂质膜与水溶液混合时,囊泡的形成是自发的,但也可以通过使用均质器、超声仪或挤压装置以振荡的形式施加力来加快囊泡的形成(对于综述,参见,例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章ID 469679,第12页,2011.doi:10.1155/2011/469679)。如empleton等人,Nature Biotech[自然生物技术],15:647-652,1997中所述,挤出的脂质可以通过例如通过用于减小尺寸的过滤器挤出来制备。
脂质纳米颗粒(LNP)是为本文所述的药物组合物提供生物相容性和可生物降解的递送系统的载剂的另一实例。参见例如,Gordillo-Galeano等人.European Journal ofPharmaceutics and Biopharmaceutics.[欧洲药剂学和生物药剂学杂志].第133卷,2018年12月,第285-308页。纳米结构化的脂质载剂(NLC)是经修饰的固体脂质纳米颗粒(SLN),这些经修饰的固体脂质纳米颗粒保留了SLN的特征、改善了药物稳定性和负载能力、并且防止了药物泄漏。聚合物纳米颗粒(PNP)是药物递送的重要部分。这些纳米颗粒可以有效地指导药物递送至特定靶标并且提高药物稳定性和药物可控释放。也可以采用脂质-聚合物纳米颗粒(PLN),即一种组合了脂质体和聚合物的新型载剂。这些纳米颗粒具有PNP和脂质体的互补优势。PLN由核-壳结构构成;聚合物核提供了稳定的结构,磷脂壳提供了良好的生物相容性。因此,这两种组分增加了药物封装率、促进了表面修饰、并且防止了水溶性药物的泄漏。对于综述,参见,例如,Li等人2017,Nanomaterials[纳米材料]7,122;doi:10.3390/nano7060122。
外泌体也可用作本文所述的组合物和系统的药物递送媒介物。对于综述,参见Ha等人.2016年7月.Acta Pharmaceutica Sinica B[药学学报]第6卷第4期,第287-296页;doi.org/10.1016/j.apsb.2016.02.001。
离体分化的红细胞也可用作本文所述组合物的载剂。参见,例如,WO 2015073587;WO 2017123646;WO 2017123644;WO 2018102740;WO 2016183482;WO 2015153102;WO2018151829;WO 2018009838;Shi等人2014.Proc Natl Acad Sci USA[美国国家科学院院刊].111(28):10131-10136;美国专利9,644,180;Huang等人2017.Nature Communications[自然通讯]8:423;Shi等人2014.Proc Natl Acad Sci USA[美国国家科学院院刊].111(28):10131-10136。
融合体组合物,例如,如WO 2018208728中所述,也可用作载剂以递送本文所述的组合物。
穿膜多肽
在一些实施例中,组合物进一步包含穿膜多肽(MPP),以将组分带入细胞中或跨过膜,例如细胞或核膜。能够促进物质跨膜运输的穿膜多肽包括但不限于细胞穿透肽(CPP)(参见,例如,美国专利号:8,603,966)、用于植物细胞内递送的融合肽(参见,例如,Ng等人,PLoS One[公共科学图书馆-综合],2016,11:e0154081)、蛋白质转导结构域、木马肽和膜转位信号(MTS)(参见,例如,Tung等人,Advanced Drug Delivery Reviews[高级药物递送综述]55:281-294(2003))。一些MPP富含氨基酸,例如精氨酸,带有带正电的侧链。
穿膜多肽具有诱导组分穿膜的能力,并且在全身性施用后允许大分子在体内多个组织的细胞内转位。穿膜多肽还可以指在适当条件下与细胞接触时,从外部环境移动到细胞内环境(包括细胞质,细胞器如线粒体或细胞核)中的肽,其量明显超过被动扩散所能达到的量。
跨膜运输的组分可以可逆地或不可逆地连接至穿膜多肽。接头可以是化学键,例如一个或多个共价键或非共价键。在一些实施例中,接头是肽接头。此种接头可介于2-30个氨基酸之间,或者更长。接头包括柔性、刚性或可切割的接头。
组合
在一个方面中,本文所述的指环载体或包含指环载体的组合物还可包括一个或多个异源部分。在一个方面中,本文所述的指环载体或包含指环载体的组合物还可以以融合方式包含一个或多个异源部分。在一些实施例中,异源部分可以与遗传元件连接。在一些实施例中,异源部分可以作为指环载体的一部分包封在蛋白质外壳中。在一些实施例中,异源部分可以与指环载体一起施用。
在一个方面中,本发明包括细胞或组织,其包含本文所述的任一种指环载体和异源部分。
在另一方面,本发明包括药物组合物,其包含本文所述的指环载体和异源部分。
在一些实施例中,异源部分可以是病毒(例如,效应物(例如,药物、小分子)、靶向剂(例如,DNA靶向剂、抗体、受体配体)、标签(例如,荧光团、光敏剂例如KillerRed)或本文所述的编辑或靶向部分。在一些实施例中,本文所述的膜移位多肽与一个或多个异源部分连接。在一个实施例中,异源部分是小分子(例如,肽模拟物或分子量小于2000道尔顿的有机小分子)、肽或多肽(例如,抗体或其抗原结合片段)、纳米颗粒、适体或药剂。
靶向部分
在一些实施例中,本文所述的组合物或指环载体可进一步包含靶向部分,例如与存在于靶细胞上的目的分子特异性结合的靶向部分。靶向部分可调节目的分子或细胞的特定功能,调节特定分子(例如酶、蛋白质或核酸),例如通路中目的分子下游的特定分子,或特异性结合靶标以定位指环载体或遗传元件。例如,靶向部分可以包括与感兴趣的特定分子相互作用以提高、降低或以其他方式调节其功能的治疗剂。
标签部分或监测部分
在一些实施例中,本文所述的组合物或指环载体可以进一步包含标记或监测本文所述指环载体或遗传元件的标签。标签部分或监测部分可以通过化学剂或酶促切割,例如蛋白水解或蛋白质内含子剪接而去除。亲和标签可用于使用亲和技术纯化标记的多肽。一些实例包括几丁质结合蛋白(CBP)、麦芽糖结合蛋白(MBP)、谷胱甘肽-S-转移酶(GST)和多聚His标签。增溶标签可能有助于在分子伴侣缺陷型物种(例如大肠杆菌)中表达的重组蛋白,以协助蛋白质正确折叠并防止它们沉淀。一些实例包括硫氧还蛋白(TRX)和多聚NANP。标签部分或监测部分可以包括光敏标签,例如荧光。荧光标签可用于可视化。GFP及其变体是常用作荧光标签的一些实例。蛋白质标签可允许发生特定的酶促修饰(例如通过生物素连接酶进行生物素化)或化学修饰(例如与FlAsH-EDT2反应进行荧光成像)。通常将标签部分或监测部分组合,以便将蛋白质连接到多个其他组分。标签部分或监测部分也可以通过特异性蛋白水解或酶促切割(例如通过TEV蛋白酶、凝血酶、凝血因子Xa或肠肽酶)而去除。
纳米颗粒
在一些实施例中,本文所述的组合物或指环载体可以进一步包含纳米颗粒。纳米颗粒包括无机材料,这些无机材料的尺寸为约1至约1000纳米、约1至约500纳米、约1至约100nm、约50nm至约300nm、约75nm至约200nm、约100nm至约200nm,以及其间的任何范围。纳米颗粒通常具有纳米级尺寸的复合结构。在一些实施例中,纳米颗粒通常是球形的,尽管根据纳米颗粒的组成可能有不同的形态。纳米颗粒与纳米颗粒外部环境接触的部分通常被确定为纳米颗粒的表面。在本文所述的纳米颗粒中,尺寸限制可以限制在两个维度上,因此纳米颗粒包括直径为约1至约1000nm的复合结构,其中特定直径取决于纳米颗粒的组成和根据实验设计的纳米颗粒的预期用途。例如,用于治疗应用的纳米颗粒通常具有约200nm或更小的尺寸。
纳米颗粒的其他理想的特性,如表面电荷和空间稳定性,也可以根据感兴趣的具体应用而变化。在以下文献中描述了临床应用,如癌症治疗中可能需要的示例性特性:Davis等人,Nature[自然]2008第7卷,第771-782页;Duncan,Nature[自然]2006第6卷,第688-701页;和Allen,Nature[自然]2002第2卷第750-763页,每个文献均通过引用以其全文并入本文。技术人员在阅读本披露后可识别出其他特性。纳米颗粒的尺寸和特性可以通过本领域已知的技术来检测。检测颗粒尺寸的示例性技术包括但不限于动态光散射(DLS)和各种显微术,例如透射电子显微术(TEM)和原子力显微术(AFM)。检测颗粒形态的示例性技术包括但不限于TEM和AFM。检测纳米颗粒表面电荷的示例性技术包括但不限于ζ电位方法。适用于检测其他化学特性的其他技术包括通过1H、11B、和13C和19F NMR、UV/Vis和红外/拉曼光谱和荧光光谱(当纳米颗粒与荧光标志组合使用时)和技术人员可以鉴定的其他技术。
小分子
在一些实施例中,本文所述的组合物或指环载体可以进一步包含小分子。小分子部分包括但不限于小肽、拟肽(例如类肽)、氨基酸、氨基酸类似物、合成多核苷酸、多核苷酸类似物、核苷酸、核苷酸类似物、通常具有小于约5,000克/摩尔的分子量的有机和无机化合物(包括杂有机和有机金属化合物),例如,具有小于约2,000克/摩尔的分子量的有机或无机化合物,例如,具有小于约1,000克/摩尔的分子量的有机或无机化合物,例如,具有小于约500克/摩尔的分子量的有机或无机化合物,以及这样的化合物的盐、酯和其他药学上可接受的形式。小分子可以包括但不限于神经递质、激素、药物、毒素、病毒或微生物颗粒、合成分子以及激动剂或拮抗剂。
合适的小分子的实例包括在以下中描述的那些:“The Pharmacological Basisof Therapeutics[治疗学的药理基础],”Goodman和Gilman,McGraw-Hill,纽约州纽约,(1996),第九版,在以下章节:Drugs Acting at Synaptic and NeuroeffectorJunctional Sites[药物作用于突触和神经效应连接点]Drugs Acting on the CentralNervous System[药物作用于中枢神经系统];Autacoids:Drug Therapy of Inflammation[自体活性物质:炎症的药物治疗];Water,Salts and Ions[水,盐和离子];DrugsAffecting Renal Function and Electrolyte Metabolism[药物影响肾功能和电解质代谢];Cardiovascular Drugs[心血管药物];Drugs Affecting GastrointestinalFunction[药物影响胃肠功能];Drugs Affecting Uterine Motility[药物影响子宫动力];Chemotherapy of Parasitic Infections[寄生虫感染的化学疗法];Chemotherapyof Microbial Diseases[微生物疾病的化学疗法];Chemotherapy of NeoplasticDiseases[肿瘤性疾病的化学疗法];Drugs Used for Immunosuppression[药物用于免疫抑制];Drugs Acting on Blood-Forming organs[药物作用于造血器官];Hormones andHormone Antagonists[激素和激素拮抗剂];Vitamins,Dermatology[维生素,皮肤病学];和Toxicology[毒理学],均通过引用并入本文。小分子的一些实例包括但不限于朊病毒药物,例如他克莫司、泛素连接酶或HECT连接酶抑制剂例如heclin、组蛋白修饰药物例如丁酸钠、酶抑制剂例如5-氮杂胞苷、蒽环类药物例如阿霉素、β-内酰胺类例如青霉素、抗菌剂、化学治疗剂、抗病毒剂、来自其他生物体的调节剂例如VP64、以及生物利用度不足的药物、例如药代动力学不足的化学治疗药。
在一些实施例中,小分子是表观遗传修饰剂,例如,如在de Groote等人.Nuc.Acids Res.[核酸研究](2012):1-18中描述的那些。示例性小分子表观遗传修饰剂描述于例如,Lu等人J.Biomolecular Screening[生物分子筛选杂志]17.5(2012):555-71,例如,在表1或2中,其通过引用并入本文。在一些实施例中,表观遗传修饰剂包括伏立诺他或罗米地辛。在一些实施例中,表观遗传修饰剂包含I、II、III和/或IV类组蛋白脱乙酰酶(HDAC)的抑制剂。在一些实施例中,表观遗传修饰剂包含SirTI的激活剂。在一些实施例中,表观遗传修饰剂包括山竹子素,Lys-CoA、C646、(+)-JQI、I-BET、BICI、MS120、DZNep、UNC0321、EPZ004777、AZ505、AMI-I、吡唑酰胺7b、苯并[d]咪唑17b、酰化氨苯砜衍生物(例如PRMTI)、methylstat、4,4'-二羧基-2,2'-联吡啶、SID 85736331、异羟肟酸酯类似物8、tanylcypromie、双胍和双胍多胺类似物、UNC669、维达扎、地西他滨、苯丁酸钠(SDB)、硫辛酸(LA)、槲皮素、丙戊酸、肼苯哒嗪、新诺明、绿茶提取物(例如表没食子儿茶素没食子酸酯(EGCG))、姜黄素、萝卜硫素和/或大蒜素/二烯丙基二硫化物。在一些实施例中,表观遗传修饰剂抑制DNA甲基化,例如DNA甲基转移酶的抑制剂(例如5-氮杂胞苷和/或地西他滨)。在一些实施例中,表观遗传修饰剂修饰组蛋白修饰,例如组蛋白乙酰化、组蛋白甲基化、组蛋白类泛素化和/或组蛋白磷酸化。在一些实施例中,表观遗传修饰剂是组蛋白脱乙酰酶的抑制剂(例如伏立诺他和/或曲古抑菌素A)。
在一些实施例中,小分子是药物活性剂。在一个实施例中,小分子是代谢活性或组分的抑制剂。有用的药物活性剂类别包括但不限于抗生素、抗炎药、血管生成剂或血管活性剂、生长因子和化学治疗(抗肿瘤)剂(例如肿瘤抑制剂)。可以使用来自本文所述的类别和实例或来自(Orme-Johnson 2007,Methods Cell Biol.[细胞生物学方法]2007;80:813-26)的分子的一种或组合。在一个实施例中,本发明包括组合物,该组合物包含抗生素、抗炎药物、血管生成剂或血管活性剂、生长因子或化学治疗剂。
肽或蛋白质
在一些实施例中,本文所述的组合物或指环载体可以进一步包含肽或蛋白质。肽部分可包括但不限于肽配体或抗体片段(例如,结合受体如细胞外受体的抗体片段)、神经肽、激素肽、肽药物、毒性肽、病毒或微生物肽、合成肽、以及激动肽或拮抗肽。
肽部分可以是直链或支链的。肽的长度为约5至约200个氨基酸、约15至约150个氨基酸、约20至约125个氨基酸、约25至约100个氨基酸或其间的任何范围。
肽的一些实例包括但不限于荧光标签或标志、抗原、抗体、抗体片段如单域抗体、配体和受体如胰高血糖素样肽-1(GLP-1)、GLP-2受体2、胆囊收缩素B(CCKB)和生长抑素受体、肽治疗剂如与特定细胞表面受体如G蛋白偶联受体(GPCR)或离子通道结合的那些肽、天然生物活性肽的合成肽或肽类似物、抗微生物肽、成孔肽、肿瘤靶向肽或细胞毒性肽、以及降解肽或自毁肽如凋亡诱导肽信号或光敏肽。
本文所述的可用于本发明的肽还包括小型抗原结合肽,例如,抗原结合抗体或抗体样片段,如单链抗体、纳米抗体(参见,例如,Steeland等人2016.Nanobodies astherapeutics:big opportunities for small antibodies.[作为治疗剂的纳米抗体:小分子抗体的巨大机会]Drug Discov Today[当代药物发现]:21(7):1076-113)。这样的小型抗原结合肽可以结合细胞质抗原、核抗原、细胞器内抗原。
在一些实施例中,本文所述的组合物或指环载体包括与能够靶向特定位置、组织或细胞的配体连接的多肽。
寡核苷酸适体
在一些实施例中,本文所述的组合物或指环载体可以进一步包含寡核苷酸适体。适体部分是寡核苷酸适体或肽适体。寡核苷酸适体是单链DNA或RNA(ssDNA或ssRNA)分子,其可以以高亲和力和特异性结合预先选择的靶标(包括蛋白质和肽)。
寡核苷酸适体是可以通过多轮重复的体外选择或等效地通过SELEX(指数富集的配体系统进化技术)进行工程化以结合到各种分子靶标(例如,小分子、蛋白质、核酸,甚至细胞、组织和生物体)的核酸种类。适体提供有分辨能力的分子识别,并且可以通过化学合成来产生。另外,适体可能具有理想的储存特性,并且在治疗应用中很少或不会引发免疫原性。
DNA和RNA适体均可显示出对各种靶标的稳健结合亲和力。例如,已经选择了DNA和RNA适体用于溶菌酶、凝血酶、人类免疫缺陷病毒反式作用应答元件(HIV TAR)(参见en.wikipedia.org/wiki/Aptamer-cite_note-10)、氯高铁血红素、干扰素γ、血管内皮生长因子(VEGF)、前列腺特异性抗原(PSA)、多巴胺和非经典癌基因、热休克因子1(HSF1)。
肽适体
在一些实施例中,本文所述的组合物或指环载体可以进一步包含肽适体。肽适体具有一个(或多个)短可变肽结构域,包括具有低分子量12-14kDa的肽。可以将肽适体设计为特异性结合并干扰细胞内部的蛋白质-蛋白质相互作用。
肽适体是经过选择或工程化以结合特定靶分子的人工蛋白质。这些蛋白质包括一个或多个可变序列的肽环。它们通常是从组合文库中分离出来的,并且常常随后通过定向突变或多轮的可变区诱变和选择而得到改进。在体内,肽适体可以结合细胞蛋白靶标并发挥生物学作用,包括干扰其靶向分子与其他蛋白的正常蛋白相互作用。特别地,针对附着于转录因子激活结构域的靶蛋白筛选附着于转录因子结合结构域的可变肽适体环。将肽适体经由该选择策略与其靶标的体内结合检测为下游酵母标志基因的表达。这样的实验鉴定了与适体结合的特定蛋白质,以及适体破坏的蛋白质相互作用以引起表型。另外,用适当的功能性部分衍生的肽适体可引起其靶蛋白的特异性翻译后修饰,或改变靶标的亚细胞定位。
肽适体还可以在体外识别靶标。已发现它们可代替生物传感器中的抗体,并用于从含有无活性和活性蛋白形式的群体中检测活性蛋白同工型。其中肽适体“头部”与独特的序列双链DNA“尾部”共价连接的称为蝌蚪的衍生物可通过其DNA尾部的PCR(例如,使用定量实时聚合酶链反应)定量混合物中的稀缺靶分子。
可以使用不同的系统进行肽适体选择,但目前使用最多的是酵母双杂交系统。肽适体还可以选自通过噬菌体展示和其他表面展示技术(例如mRNA展示、核糖体展示、细菌展示和酵母展示)构建的组合肽文库。这些实验程序也称为生物淘选。在从生物淘选获得的肽中,模拟表位可被认为是肽适体。从组合肽文库淘选的所有肽已存储在名为MimoDB的特殊数据库中。
VI.使用方法
本文所述的指环载体和包含指环载体的组合物可用于例如在有需要的受试者(例如,哺乳动物受试者,例如,人类受试者)中治疗疾病、障碍或病症的方法中。本文所述的药物组合物的施用可以例如通过肠胃外(包括静脉内、肿瘤内、腹膜内、肌内、腔内和皮下)施用。指环载体可以单独施用或配制成药物组合物。在一些实施例中,指环载体可以以单剂量施用,例如,以第一多个。在一些实施例中,指环载体可以以至少两个剂量施用,例如,以第一多个,随后是第二多个。在一些实施例中,指环载体可以以多个剂量施用,例如,以第一多个、第二多个、第三多个、任选地第四多个、任选地第五多个和/或任选地另外多个。
指环载体可以以单位剂量组合物,例如单位剂量肠胃外组合物的形式施用。这样的组合物通常通过混合来制备,并且可以适于肠胃外施用。这样的组合物可以是例如可注射和可输注的溶液剂或混悬剂或栓剂或气雾剂的形式。
在一些实施例中,施用指环载体或包含其的组合物,例如,如本文所述的指环载体或组合物可导致将指环载体所包含的遗传元件递送至(例如,受试者中的)靶细胞。
本文所述的指环载体或其组合物,例如,包含效应物(例如,内源性效应物或外源性效应物),可用于将效应物递送至细胞、组织或受试者。在一些实施例中,指环载体或其组合物用于将效应物递送至骨髓、血液、心脏、GI或皮肤。通过施用本文所述的指环载体组合物来递送效应物可以调节(例如,提高或降低)细胞、组织或受试者中非编码RNA或多肽的表达水平。以这种方式调节表达水平可能导致效应物所递送到的细胞中功能性活动的改变。在一些实施例中,调节的功能性活动本质上可以是酶促性、结构性或调节性。
在一些实施例中,指环载体或其拷贝在递送至细胞中后24小时(例如1天、2天、3天、4天、5天、6天、1周、2周、3周、4周、30天或1个月)可在细胞中检测到。在实施例中,指环载体或其组合物介导对靶细胞的作用,并且该作用持续至少1、2、3、4、5、6或7天、2、3或4周或1、2、3、6或12个月。在一些实施例中(例如,其中指环载体或其组合物包含编码外源性蛋白的遗传元件),该作用持续少于1、2、3、4、5、6或7天,2、3或4周,或者1、2、3、6或12个月。
可以用本文所述的指环载体或包含该指环载体的组合物治疗的疾病、障碍和病症的实例包括但不限于:免疫障碍、干扰素病(例如,I型干扰素病)、传染病、炎性障碍、自身免疫性病症、癌症(例如实体瘤,例如肺癌、非小细胞肺癌,例如,表达对mIR-625作出响应的基因(例如,胱天蛋白酶-3)的肿瘤)和胃肠道障碍。在一些实施例中,指环载体调节(例如,提高或降低)与指环载体接触的细胞中的活动或功能。在一些实施例中,指环载体调节(例如,提高或降低)与指环载体接触的细胞中分子(例如,核酸或蛋白质)的水平或活性。在一些实施例中,指环载体降低了与指环载体接触的细胞(例如,癌细胞)的活力,例如,降低了至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多。在一些实施例中,指环载体包含效应物,例如miRNA,如miR-625,其降低了与指环载体接触的细胞(例如癌细胞)的活力,例如,降低了至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多。在一些实施例中,指环载体例如通过提高胱天蛋白酶-3的活性增加与指环载体接触的细胞(例如,癌细胞)的凋亡,例如,增加了至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多。在一些实施例中,指环载体包含效应物,例如,miRNA,如miR-625,其例如通过提高胱天蛋白酶-3活性增加了与指环载体接触的细胞(例如癌细胞)的凋亡,例如,增加了至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%或更多。
VII.施用/递送
可以将组合物(例如,包含如本文所述的指环载体的药物组合物)配制成包括药学上可接受的赋形剂。药物组合物可任选地包含一种或多种另外的活性物质,例如治疗性和/或预防性活性物质。本发明的药物组合物可以是无菌的和/或无热原的。可在以下文献中找到药剂的配制和/或生产中的总体考虑:例如,Remington:The Science and Practice ofPharmacy[雷明顿:药物科学与实践]第21版,Lippincott Williams&Wilkins[利平科特·威廉斯和威尔金斯出版公司],2005(通过引用并入本文)。
尽管本文提供的药物组合物的描述主要针对适合于施用至人的药物组合物,但是本领域技术人员应理解,这样的组合物通常适合于施用至任何其他动物,例如非人动物,例如非人哺乳动物。为了使组合物适合于施用于各种动物而对适合于施用于人的药物组合物的修饰是熟知的,并且普通兽医药理师可仅通过普通实验(如果有的话)来设计和/或进行此种修饰。预期施用药物组合物的受试者包括但不限于人和/或其他灵长类动物;哺乳动物(包括商业上相关的哺乳动物,如牛、猪、马、绵羊、猫、狗、小鼠和/或大鼠);和/或鸟类(包括商业上相关的鸟类,如家禽、鸡、鸭、鹅和/或火鸡)。
在一些实施例中,设想对其施用药物组合物的受试者是人。在一些实施例中,受试者是新生儿,例如,0-4周龄。在一些实施例中,受试者是婴儿,例如,4周龄至1岁。在一些实施例中,受试者是儿童,例如,1岁至12岁。在一些实施例中,受试者小于18岁。在一些实施例中,受试者是青少年,例如,12岁至18岁。在一些实施例中,受试者大于18岁。在一些实施例中,受试者是青年人,例如,18岁至25岁。在一些实施例中,受试者是成年人,例如,25岁至50岁。在一些实施例中,受试者是老年人,例如,至少50岁或更大的成年人。
本文所述的药物组合物的配制品可通过药理学领域中已知的或以后开发的任何方法来制备。通常,这样的制备方法包括以下步骤:使活性成分与赋形剂和/或一种或多种其他辅助成分结合,并且然后,如果必要和/或期望的话,将产品分开、成形和/或包装。
在一个方面中,本发明的特征在于向受试者递送指环载体的方法。该方法包括向受试者施用包含如本文所述指环载体的药物组合物。在一些实施例中,所施用的指环载体在受试者中复制(例如,成为受试者病毒组的一部分)。
药物组合物可以包含野生型或天然病毒元件和/或修饰的病毒元件。指环载体可以包括一个或多个指环病毒序列(例如,核酸序列或编码其氨基酸序列的核酸序列)或与其具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%核苷酸序列同一性的序列。指环载体可包含核酸分子,该核酸分子包含与一种或多种指环病毒序列(例如,指环病毒ORF1核酸序列)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%序列同一性的核酸序列。指环载体可以包含编码氨基酸序列的核酸分子,该氨基酸序列与指环病毒氨基酸序列(例如,指环病毒ORF1分子的氨基酸序列)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%序列同一性。指环载体可以包含多肽,该多肽包含与指环病毒氨基酸序列(例如,指环病毒ORF1分子的氨基酸序列)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%和99%序列同一性的氨基酸序列。
在一些实施例中,指环载体足以增加(刺激)内源性基因和蛋白的表达,例如,与参考(例如健康对照)相比,增加(刺激)了至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。在某些实施例中,指环载体足以减少(抑制)内源性基因和蛋白的表达,例如,与参考(例如健康对照)相比,减少(抑制)了至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。
在一些实施例中,指环载体在宿主或宿主细胞中抑制/增强一种或多种病毒特性,例如,嗜性、感染性、免疫抑制/激活,例如,与参考(例如健康对照)相比,抑制/增强了至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。
在一个方面中,本发明的特征在于将效应物递送给受试者(例如人类受试者)的方法,该受试者先前已经施用过指环载体例如第一多个指环载体,该方法包括施用第二多个指环载体。在另一方面,本发明的特征在于将效应物递送给受试者(例如人类受试者)的方法,该方法包括向该受试者施用第一多个指环载体并且随后向该受试者施用第二多个指环载体。在一些实施例中,本文所述的方法进一步包括施用第三、第四、第五和/或另外多个指环载体。在一些实施例中,第一和第二多个经由相同的施用途径施用,例如,静脉内施用。在一些实施例中,第一和第二多个经由不同的施用途径施用。在一些实施例中,将第一多个指环载体作为第一药物组合物的一部分施用于受试者。在一些实施例中,将第二多个指环载体作为第二药物组合物的一部分施用于受试者。
在一些实施例中,第一多个和第二多个包含大致相同剂量的指环载体,例如,其中第一多个和第二多个指环载体包含大致相同的量和/或浓度的指环载体。在一些实施例中,第二多个包含第一多个中指环载体数量的90%至110%,例如,95%至105%。在一些实施例中,第一多个与第二多个相比包含更大剂量的指环载体,例如,其中该第一多个相对于该第二多个包含更大量和/或浓度的指环载体。在一些实施例中,第一多个与第二多个相比包含更低剂量的指环载体,例如,其中该第一多个相对于该第二多个包含更大量和/或浓度的指环载体。在一些实施例中,受试者接受重复剂量的指环载体,其中在至少1、2、3、4或5年的时间内施用重复剂量。在一些实施例中,约每1、2、3或4周或约每1、2、3、4、5、6、7、8、9、10、11或12个月施用重复剂量。
在一些实施例中,施用于受试者的第一多个指环载体包含的遗传元件在其施用后至少50、60、70、80、90、100、110、120、130、140或150天在受试者中是可以检测到的,例如,通过高分辨率熔解(HRM)测定,例如,如实例1所述的。在一些实施例中,施用于受试者的第二多个指环载体包含的遗传元件在其施用后至少50、60、70、80、90、100、110、120、130、140或150天在受试者中是可以检测到的,例如,通过高分辨率熔解(HRM)测定,例如,如实例1所述的。
在一些实施例中,施用于受试者的第一和/或第二多个指环载体包含效应物。在一些实施例中,第一和/或第二多个包含外源性效应物。在一些实施例中,第一和/或第二多个包含内源性效应物。在一些实施例中,第二多个指环载体的效应物与第一多个指环载体的效应物为相同的效应物。在一些实施例中,第二多个指环载体的效应物不同于第一多个指环载体的效应物。在一些实施例中,第二多个指环载体向受试者递送的效应物拷贝数与第一多个指环载体递送的效应物数量大致相同。在一些实施例中,第二多个指环载体向受试者递送效应物的水平为第一多个指环载体向受试者递送效应物拷贝的至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%(例如,其中该第一多个递送的效应物可以与该第二多个递送的效应物相同或不同)。在一些实施例中,第二多个指环载体与第一多个指环载体相比向受试者递送更多拷贝(例如,至少2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、500或1000倍拷贝)的效应物。在一些实施例中,第二多个指环载体对受试者具有生物学作用(例如,靶基因的敲减或生物标志的上调),该作用不低于施用第一多个指环载体的生物学作用。
在一些实施例中,基于已接受多个指环载体来鉴定或选择受试者包括对来自受试者的样品实施测定。在一些实施例中,基于已接受多个指环载体来鉴定或选择受试者包括从第三方(例如,实验室)获得信息,其中该第三方对来自受试者的样品实施测定。在一些实施例中,基于已接受多个指环载体来鉴定或选择受试者包括查阅受试者的病史。
在一些实施例中,向受试者施用的药物组合物,该药物组合物进一步包含一种或多种在病毒遗传信息中未表示的病毒株。
在一些实施例中,以足以调节病毒感染的剂量和时间施用包含本文所述的指环载体的药物组合物。病毒感染的一些非限制性实例包括腺相关病毒、爱知病毒(Aichivirus)、澳大利亚蝙蝠狂犬病病毒、BK多瘤病毒、版纳病毒(Banna virus)、巴马森林病毒(Barmah forest virus)、布尼亚韦拉病毒(Bunyamwera virus)、布尼亚病毒属拉克罗斯病毒(Bunyavirus La Crosse)、布尼亚病毒属雪鞋野兔病毒(Bunyavirus snowshoe hare)、猕猴疱疹病毒(Cercopithecine herpesvirus)、钱迪普拉病毒(Chandipura virus)、基孔肯雅病毒(Chikungunya virus)、库赛病毒(Cosavirus)A种、牛痘病毒、柯萨奇病毒(Coxsackievirus)、克里米亚-刚果出血热病毒、登革热病毒、多里病毒(Dhori virus)、杜贝病毒(Dugbe virus)、杜文海病毒(Duvenhage virus)、东部马脑炎病毒(Eastern equineencephalitis virus)、伊波拉病毒(Ebolavirus)、埃可病毒(Echovirus)、脑心肌炎病毒、EB病毒(Epstein-Barr virus)、欧洲蝙蝠狂犬病病毒、GB病毒C型/庚型肝炎病毒、汉坦病毒(Hantaan virus)、亨德拉病毒(Hendra virus)、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、戊型肝炎病毒、丁型肝炎病毒、马痘病毒、人腺病毒、人星状病毒、人冠状病毒、人巨细胞病毒、人肠病毒68型、人肠病毒70型、人疱疹病毒1型、人疱疹病毒2型、人疱疹病毒6型、人疱疹病毒7型、人疱疹病毒8型、人免疫缺陷病毒、人乳头瘤病毒1型、人乳头瘤病毒2型、人乳头瘤病毒16型、人乳头瘤病毒18型、人副流感病毒、人细小病毒B19型、人呼吸道合胞病毒、人鼻病毒、人SARS冠状病毒、人泡沫逆转录病毒(spumaretrovirus)、人嗜T淋巴细胞病毒、人环曲病毒(torovirus)、甲型流感病毒、乙型流感病毒、丙型流感病毒、伊斯法罕病毒(Isfahan virus)、JC多瘤病毒、日本脑炎病毒、呼宁砂粒病毒(Junin arenavirus)、KI多瘤病毒、昆津病毒(Kunjin virus)、拉各斯蝙蝠病毒、维多利亚湖马尔堡病毒(Lake Victoriamarburgvirus)、兰加特病毒(Langat virus)、拉沙病毒(Lassa virus)、洛兹达雷病毒(Lordsdale virus)、跳跃病病毒、淋巴细胞性脉络丛脑膜炎病毒、马秋波病毒(Machupovirus)、马亚罗病毒(Mayaro virus)、MERS冠状病毒、麻疹病毒、门戈脑心肌炎病毒(Mengoencephalomyocarditis virus)、默克尔细胞多瘤病毒、莫科拉病毒(Mokola virus)、传染性软疣病毒(Molluscum contagiosum virus)、猴痘病毒、腮腺炎病毒、墨累谷脑炎病毒(Murray valley encephalitis virus)、纽约病毒、尼帕病毒(Nipah virus)、诺瓦克病毒(Norwalk virus)、阿尼昂-尼昂病毒(O’nyong-nyong virus)、羊口疮病毒(Orf virus)、奥罗普切病毒(Oropouche virus)、皮钦德病毒(Pichinde virus)、脊髓灰质炎病毒、庞塔托鲁静脉病毒(Punta toro phlebovirus)、普马拉病毒(Puumala virus)、狂犬病病毒、裂谷热病毒、玫瑰病毒(Rosavirus)A种、罗斯河病毒、轮状病毒A种、轮状病毒B种、轮状病毒C种、风疹病毒、鹭山病毒(Sagiyama virus)、萨里病毒(Salivirus)A种、白蛉热西西里病毒、札幌病毒、塞姆利基森林病毒(Semliki forest virus)、汉城病毒、猴泡沫病毒、猿猴病毒5型、辛德毕斯病毒(Sindbis virus)、南安普顿病毒、圣路易斯脑炎病毒、蜱传波瓦桑病毒(Tick-borne powassan virus)、细环病毒、托斯卡纳病毒(Toscana virus)、乌库涅米病毒(Uukuniemi virus)、痘苗病毒、水痘-带状疱疹病毒、天花病毒、委内瑞拉马脑炎病毒、水疱性口炎病毒、西部马脑炎病毒、WU多瘤病毒、西尼罗河病毒、亚巴猴肿瘤病毒、亚巴样病病毒、黄热病毒和寨卡病毒(Zika Virus)。在某些实施例中,指环载体足以胜过和/或替换已经存在于受试者中的病毒,例如,与参考相比,胜过和/或替换了至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更多。在某些实施例中,指环载体足以与慢性或急性病毒感染竞争。在某些实施例中,可预防性施用指环载体以保护免受病毒感染(例如,益生病毒(provirotic))。在一些实施例中,指环载体的量足以调节(例如,表型、病毒水平、基因表达、与其他病毒竞争、疾病状态等至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或更高)。在一些实施例中,治疗(treatment)、进行治疗(treating)及其同源词包括对受试者的医疗管理(例如,通过施用指环载体,例如,如本文所述制备的指环载体),例如,旨在改善、缓解、稳定、预防或治愈疾病、病理状况或障碍。在一些实施例中,治疗包括积极治疗(旨在改善疾病、病理状况或障碍的治疗)、因果治疗(针对相关疾病、病理状况或障碍的原因的治疗)、姑息治疗(旨在缓解症状的治疗)、预防性治疗(旨在预防、最小化或者部分或完全抑制相关疾病、病理状况或障碍的发生的治疗)和/或支持性治疗(用来补充另一种疗法的治疗)。
本文引用的所有参考文献和出版物都特此通过引用并入。
提供以下实例以进一步说明本发明的一些实施例,但并非意在限制本发明的范围;通过它们的示例性性质将理解,可以替代地使用本领域技术人员已知的其他程序、方法或技术。
实例
目录
实例1:一组全长指环病毒ORF1蛋白在哺乳动物细胞中的表达
实例2:在不存在AAV衣壳的情况下,通过AAV Rep复制AAV ITR侧翼的DNA
实例3:通过与AAV变体转基因报告构建体交叉包装产生指环载体
实例4:在不同来源的哺乳动物和非人灵长类动物细胞中经由指环载体转导递送报告构建体
实例5:指环病毒-AAV载体的产生和在MOLT4细胞中的成功转导
实例6:通过AAV Rep蛋白的工程化Ring2指环病毒DNA复制
实例7:通过编码人生长激素的不同指环载体对特定细胞系的有效转导
实例8:用于快速评估载体转导的Ring 2指环载体的纯化
实例1:一组全长指环病毒ORF1蛋白在哺乳动物细胞中的表达
在该实例中,在Expi-293细胞中表达来自一组指环病毒基因组的ORF1蛋白。鉴定了8种不同指环病毒的ORF1序列;即3种甲型细环病毒(Ring1、Ring5和Ring20)、3种乙型细环病毒(Ring2、Ring9和Ring10)和2种丙型细环病毒(Ring3和Ring4)。还使用IDT的密码子优化对每种核苷酸序列进行密码子优化以在人细胞中表达。密码子优化的序列从IDT订购为基因片段,亚克隆,然后克隆到具有hEF1a启动子和具有N-末端3xFlag标签的表达质粒中。
将含有hEF1a驱动的3xFlag-ORF1基因的每个质粒转染到Expi-293细胞中。简言之,将2.5μg质粒DNA与2.5μL PEI在100μL无血清培养基中混合。在孵育20分钟进行复合之后,将PEI-DNA混合物逐滴添加至1x106Expi-293细胞中。然后将细胞在37℃、8% CO2下孵育,以225rpm振荡2天。
将转染的细胞裂解物在免疫印迹上运行。简言之,收集100μL培养基中的5x105个细胞,并与25μL的4x LDS样品缓冲液和12.5μL的20% BME混合。在运行之前,将样品在95℃下煮沸5min。在190V下,将20μL的每个样品在1x MESSDS运行缓冲液中的NuPAGE 4%-12%Bis-Tris凝胶(英杰公司(Invitrogen))上运行。然后通过在90V下湿转移1小时将蛋白质转移至硝酸纤维素膜上。将印迹在20mM Tris、0.5M NaCl、0.1% Brij58 pH 7.5中封闭1小时。向印迹中添加1:2000稀释的小鼠抗-Flag抗体,并在室温下孵育过夜。洗涤印迹并将其浸泡在1:5000稀释的AP-兔抗小鼠二抗中2小时。然后洗涤印迹并将其浸泡在印迹显影剂溶液中直到出现条带。
观察到N-末端3xFlag标记的指环病毒ORF1蛋白的表达(图1)。每个都以3xFlag标记的ORF1的预期大小运行:91kda的甲型细环Ring1 ORF1、79kda的乙型细环Ring2 ORF1和82kda的丙型细环Ring4。还观察到来自其他指环病毒株的许多ORF1蛋白的表达(数据未显示)。
实例2:在不存在AAV衣壳的情况下,通过AAV Rep复制AAV ITR侧翼的DNA
在该实例中,通过不产生AAV衣壳蛋白的AAV-Rep表达质粒从质粒中复制ITR侧翼的报告基因构建体。构建了在天然AAV P5启动子控制下产生Rep78、Rep68、Rep52和Rep40的具有全AAV2 Rep基因的表达载体。另外,构建了在诱导型TRE紧密启动子控制下的具有全AAV2 Rep基因的表达载体。作为复制的阳性对照,使用AAV2 RepCap表达质粒(细胞生物实验室(Cell BioLabs)#VPK-422)。作为复制靶标,使用含有hrGFP报告基因的质粒,该质粒由CMV启动子驱动,并且侧翼为AAV ITR(细胞生物实验室#AAV-400)。每种条件包括AAVpHelper质粒(细胞生物实验室#340202),以及表达Ring2 ORF1和ORF2蛋白的质粒。使用PEI将质粒转染到Expi293细胞中。转染后四天,收集细胞沉淀。
然后将来自每个样品的总DNA进行DNA印迹。简言之,将总DNA从细胞沉淀中分离,用限制性核酸内切酶酶切,在琼脂糖凝胶上运行,并转移至尼龙膜上。在DNA印迹上包括三个未转染的DNA对照;即pITR-hrGFP质粒,通过经由限制酶从质粒中提取ITR-hrGFP DNA产生的ITR-hrGFP基因组DNA,以及pHelper质粒DNA。使用生物素化的DNA片段探测印迹的hrGFP和pHelper DNA序列,并使用链霉亲和素连接的IRDye800在LiCor Odyssey成像仪上检测(图2)。为了确定相对复制效率,使用ImageJ定量DNA印迹上的ITR-hrGFP基因组条带和pHelper条带的密度。将复制的ITR-hrGFP的量相对于pHelper质粒转染输入的量归一化,然后相对于pRepCap复制水平进行分析。
DNA印迹分析证明,无CAP的AAV Rep构建体成功地从质粒中复制了ITR-hrGFP基因组(图2)。在对条带强度进行量化并对转染输入进行归一化之后,P5驱动的Rep构建体复制了RepCap的60%的ITR-hrGFP基因组,而TRE紧密驱动的Rep与RepCap表现几乎相同。这些结果证明,含ITR的DNA构建体可以用无Cap的AAV-Rep表达载体有效复制。此外,TRE紧密启动子Rep构建体在不产生AAV Cap蛋白的情况下使DNA复制至与标准pRepCap质粒相同的水平。
实例3:通过与AAV变体转基因报告构建体交叉包装产生指环载体。
在该实例中,显示了通过与传统的AAV产生组件(AAV rep表达质粒和pHelper质粒)和涵盖报告纳米荧光素酶(nLuc)以及AAV2 ITR之间侧翼的指环病毒非编码序列的转基因质粒结合使用共表达指环病毒ORF蛋白(ORF1,ORF2)而产生指环载体。转基因的大小与相应的指环病毒基因组类似(加或减0.3kb)。在其他变体中,包括非编码指环病毒序列,因为在一些实验中,发现当包含指环病毒序列时,载体DNA包装更有效。这些指环载体作为封装了含有AAV2 ITR的报告构建体的指环病毒蛋白外壳产生。在该实例中,转基因的复制和扩增通过AAV Rep-介导的活性发生,而复制的转基因的封装所需的组分通过指环病毒ORF1和ORF2蛋白的反式表达发生。
简言之,使用PEI-Pro将以上列出的质粒以1:1的质粒与质粒的比率和1:1的DNA与PEI的摩尔比共转染到Expi-293F细胞中。在转染后4天(dpt)时,收获细胞并将其通过离心从条件培养基(CM)中沉淀出来。然后将细胞通过化学或机械手段裂解,在蛋白酶抑制剂存在下用DNA酶处理,然后用去污剂处理以去除脂质。然后通过两个超速离心步骤从细胞碎片和宿主蛋白中分离出指环载体颗粒。第一次旋转由2步CsCl密度梯度组成,其中提取密度为1.25g/ml至1.4g/ml的材料。在过夜透析之后,将该材料施加到线性CsCl梯度上。然后在1ml等分试样中提取级分,测量折光率,并将材料脱盐以使用定量实时PCR(qPCR)进行量化来检测DNA酶保护的转基因特异性基因组。将密度范围为1.27-1.35的级分汇集在一起,然后使用50kDa MWCO在含0.001% PS-80的缓冲液中透析过夜。然后将材料使用MWCO为100kDa的离心膜浓缩器浓缩。然后使用定量实时PCR(qPCR)对最终材料进行定量,以检测指环病毒核酸。
图3A显示了在线性梯度级分中通过对纳米荧光素酶转基因中的扩增子进行qPCR获得的载体基因组拷贝数。在1.31g/mL的级分密度下观察到载体拷贝中的明显的峰。相反,如图3B所示,如果从转染中省略了ORF1指环病毒基因,则没有观察到这样的峰。这些数据表明载体信号依赖于所表达的ORF1。总之,这些数据与所产生的指环载体相一致。
实例4:在不同来源的哺乳动物和非人灵长类动物细胞中经由指环载体转导递送报告构建体
在该实例中,通过与传统的AAV产生组件(AAV rep表达质粒和pHelper质粒)和涵盖报告基因以及AAV2-ITR之间侧翼的指环病毒非编码序列的转基因质粒结合使用共表达指环病毒ORF蛋白(ORF1,ORF2)而产生指环载体。在这些情况下,用表达荧光素酶报告基因(nLuc)或荧光报告基因(mCherry,GFP)的转基因制备指环载体。在该实例中,使用涵盖表达nLuc、mCherry或GFP的ITR侧翼转基因的R2-指环载体,证明了人(Vero)和非人灵长类动物(Vero)细胞系的成功转导。
将载体经线性密度梯度纯化,然后使用50kDa MWCO膜透析以减少转基因蛋白残留。通过在37℃下(该条件允许病毒在细胞中结合和内化)将载体材料在Vero和IGR-OV1细胞上孵育3小时来进行转导。在该孵育(用于nLuc转导)后立即收获第0天(D0)样品,并且将剩余样品在分析之前孵育2天。对于R2-nLuc载体,进行荧光素酶测定,该测定通过基于发光的读数测量nLuc蛋白的量。如图4-5所示,用指环载体转导使得从D0至D2增加1.5-log,而用不表达指环病毒ORF1和ORF2蛋白的材料转导从D0至D2减少。在IGR-OV1细胞中观察到3-log的增加(图5)。在两种细胞系中,使用相同的MOI(0.4)。这些结果通过以0.2的MOI用携带另外的报告基因(即GFP和mCherry)的指环载体转导Vero和IGR-OV1细胞而被进一步突出。显微术显示了Vero和IGR-OV1细胞二者通过这些指环载体的成功转导和各自的荧光报告基因的表达。用不表达指环病毒ORF1和ORF2蛋白的材料转导的对照细胞没有显示出任一种报告基因的明显的荧光。
实例5:指环病毒-AAV载体的产生和在MOLT4细胞中的成功转导
在该实例中,测试了指环病毒衣壳蛋白(ORF1)是否能在细胞内包装非同源复制的ssDNA。使用了几个可以产生编码由ORF1蛋白包装的红色荧光“mKate”报告基因的ssDNA的AAV组件(编码AAV Rep的质粒、报告转基因和pHelper质粒组件)。使用PEI在293F细胞中进行以下转染:
(1)AAV颗粒产生的主要组件减去AAV衣壳质粒(mKate质粒、AAV Rep和pHelper质粒),
(2)AAV系统的主要组件加上Ring2的ORF1和ORF2,或者
(3)AAV系统的主要组件与仅Ring2 ORF2。
在四天之后,将细胞裂解,然后在CsCl阶梯梯度上处理(图6)。收集密度范围1.2-1.4g/ml内的级分并将其透析,然后用于以每个细胞1个载体的MOI感染MOLT4细胞(人T淋巴母细胞细胞系)。在感染后3天(dpi),通过使用流式细胞术定量mKate表达细胞来测量阳性转导事件。仅含有AAV复制机制和mKate转基因的条件1无法得到表达mKate的阳性细胞群,而含有ORF1和2以及AAV复制机制的条件2产生35%表达mKate的细胞。
为了进一步证实这是否是真正的转导事件,引入了条件3,其中省略了指环病毒的衣壳蛋白(ORF1)。而这未产生可检测的转导事件,表明在条件2的情况下,我们能够转导MOLT4细胞,并且该转导是ORF1依赖性的。进一步的工作将这些转导扩展至另外的细胞类型和Ring 4.0指环病毒-AAV载体。有趣的是,当进行转导时,Raji细胞对于Ring2载体、和293T细胞对于Ring4似乎具有更高的转导效率。
实例6:通过AAV Rep蛋白的工程化Ring2指环病毒DNA复制
已证明Ring2指环病毒基因组(例如,如本文所述)能够在MOLT-4细胞中自然复制,但是迄今为止在HEK293细胞中复制不佳。为了在易处理的HEK293细胞系中驱动更稳健的基因组复制,Ring2的各形式被工程化以包含已知的用于AAV复制的顺式元件。在野生型AAV中,AAV Rep蛋白与AAV ITR内的DNA序列(顺式元件)结合并驱动DNA复制。该活性所需的最小序列在本文中被鉴定为“Rep结合基序”(RBM)和“末端解离位点”(TRS)。在该实例中,将含有这些位点的62bp的AAV ITR序列整合到Ring2基因组的3’非编码区(NCR)中(图7A)。
为了测试AAV Rep蛋白是否驱动Ring2+RBM/TRSDNA的复制,将含有包含AAV ITR元件(RBM和TRS)的工程化指环病毒基因组的质粒共转染到含或不含反式表达AAV Rep的Expi-293细胞中。在转染后四天收获总DNA,酶切以线性化质粒并用DpnI降解未复制的DNA,然后在DNA印迹上运行以探测Ring2基因组(图7B)。对于不含AAV-RBM/TRS的野生型Ring2基因组,观察到线性化的输入质粒DNA(泳道1和3),但在DpnI存在下降解(泳道2和4),这表明DNA不在细胞中复制。然而,在3’NCR中具有RBM/TRS的Ring2在AAV Rep存在下确实成功复制,如由DpnI抗性条带(泳道8,绿色箭头)所指示。在没有Rep的情况下,线性化的质粒(泳道5)被DpnI酶切(泳道6),这证实了复制是Rep依赖性的。
这些数据证明了在Expi-HEK293细胞中复制指环病毒DNA系统的成功工程化。不希望受理论所束缚,预期体外环化可用于从Ring2-3’NCR-RBM/TRS中除去质粒骨架,并且所得构建体可用AAV-Rep复制和/或使用反式表达的Ring2 ORF1蛋白包装。
实例7:通过编码人生长激素的不同指环载体对特定细胞系的有效转导
以上实例已经证明了通过利用Expi293细胞中的AAV复制机制来产生指环载体,包括编码能够在体外转导细胞系的荧光和发光有效载荷的指环载体。在该实例中,制备了编码人生长激素(hGH)(生物活性有效载荷)的指环载体,这些指环载体可适合于体内实验。简言之,将Expi293细胞用产生病毒载体(有效载荷、AAV Rep和pHelper)和AAV2衣壳(阳性对照)、RING2衣壳、RING9衣壳或无衣壳(阴性对照)所需的质粒转染。在转染之后四天,收获细胞,并将其在含0.5% Triton X-100的缓冲液中通过两轮冷冻-解冻来裂解。然后将裂解物用全能核酸酶(benzonase)处理,随后使用氯化铯阶梯梯度进行部分载体纯化。将阶梯梯度材料透析过夜以除去氯化铯,然后与人卵巢癌细胞系IGR-OV1或猴肾细胞系Vero一起孵育3小时。在该处理之后,将细胞用PBS洗涤三次以除去任何污染的DNA或蛋白质,包括从载体产生步骤中残留的hGH。将新鲜培养添加至转导的细胞中,并在37℃和5% O2下孵育。在30分钟(第0天时间点)、48小时(第2天时间点)和72小时(第3天时间点)之后收获培养基,以通过ELISA定量由转导细胞分泌的hGH的量。
如图8A-8B中所示,在用RING2或RING9载体转导的IGR-OV1细胞(图8A)和Vero细胞(图8B)的培养基中分泌的hGH的量增加。携带hGH的AAV2(阳性对照)在第2天和第3天也显示出hGH的分泌,尽管以较低的水平分泌。用阴性对照处理的样品没有显示出分泌的hGH量的类似增加。这些数据证明,成功产生了两种具有不同衣壳的具有转导能力的指环载体,每种载体编码生物活性有效载荷。
实例8:用于快速评估载体转导的Ring 2指环载体的纯化
由于由粗裂解物引起的高细胞死亡率,在没有部分纯化载体的情况下评估病毒转导历来是困难的。在该实例中,描述了一种快速方法,其允许直接分析裂解物,这绕过了目前2天的载体纯化过程,并且允许更快地做出关于载体产生或设计的改进的决定。在所有必需组件存在(+AAV Rep)或不存在(-AAV Rep)情况下产生来自用Ring2-ITR-纳米荧光素酶(nLuc)载体转染的293F细胞的裂解物。将样品澄清,然后在缓冲液中以1:1稀释,以调节至pH 9,并将电导率降至15mS/cm。然后将调节的裂解物装载到MustangQ柱上,并收集未结合的材料。使用含有中性pH的高盐的缓冲液洗脱结合材料。然后通过qPCR和转导测定来评估样品的载体回收。通过将100ul(约1/20)总洗脱样品添加到IGR细胞上并在第0天和第2天测量nLuc活性来进行转导测定。通过从D0至D2的发光增加来测量转导。
如图9中所示,只有共转染了所有必需质粒的样品才显示出阳性转导信号。此外,粗细胞裂解物在24h之后导致高细胞死亡率。这些结果证明了通过快速程序(30分钟的实际操作时间),我们可以从粗细胞裂解物中浓缩和部分纯化指环载体,以测量转导效率。这种方法可用作提高产生和设计优化的通量的筛选方法。
序列表
<110> 旗舰先锋创新V股份有限公司
<120> 杂合AAV-指环载体
<130> V2057-7015WO
<140>
<141>
<150> 63/147,102
<151> 2021-02-08
<160> 1067
<170> PatentIn 3.5版
<210> 1
<400> 1
000
<210> 2
<400> 2
000
<210> 3
<400> 3
000
<210> 4
<400> 4
000
<210> 5
<400> 5
000
<210> 6
<400> 6
000
<210> 7
<400> 7
000
<210> 8
<400> 8
000
<210> 9
<400> 9
000
<210> 10
<400> 10
000
<210> 11
<400> 11
000
<210> 12
<400> 12
000
<210> 13
<400> 13
000
<210> 14
<400> 14
000
<210> 15
<400> 15
000
<210> 16
<211> 3753
<212> DNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 16
tgctacgtca ctaacccacg tgtcctctac aggccaatcg cagtctatgt cgtgcacttc 60
ctgggcatgg tctacataat tatataaatg cttgcacttc cgaatggctg agtttttgct 120
gcccgtccgc ggagaggagc cacggcaggg gatccgaacg tcctgagggc gggtgccgga 180
ggtgagttta cacaccgaag tcaaggggca attcgggctc aggactggcc gggctttggg 240
caaggctctt aaaaatgcac ttttctcgaa taagcagaaa gaaaaggaaa gtgctactgc 300
tttgcgtgcc agcagctaag aaaaaaccaa ctgctatgag cttctggaaa cctccggtac 360
acaatgtcac ggggatccaa cgcatgtggt atgagtcctt tcaccgtggc cacgcttctt 420
tttgtggttg tgggaatcct atacttcaca ttactgcact tgctgaaaca tatggccatc 480
caacaggccc gagaccttct gggccaccgg gagtagaccc caacccccac atccgtagag 540
ccaggcctgc cccggccgct ccggagccct cacaggttga ttcgagacca gccctgacat 600
ggcatgggga tggtggaagc gacggaggcg ctggtggttc cggaagcggt ggacccgtgg 660
cagacttcgc agacgatggc ctcgatcagc tcgtcgccgc cctagacgac gaagagtaag 720
gaggcgcaga cggtggagga gggggagacg aaaaacaagg acttacagac gcaggagacg 780
ctttagacgc aggggacgaa aagcaaaact tataataaaa ctgtggcaac ctgcagtaat 840
taaaagatgc agaataaagg gatacatacc actgattata agtgggaacg gtacctttgc 900
cacaaacttt accagtcaca taaatgacag aataatgaaa ggccccttcg ggggaggaca 960
cagcactatg aggttcagcc tctacatttt gtttgaggag cacctcagac acatgaactt 1020
ctggaccaga agcaacgata acctagagct aaccagatac ttgggggctt cagtaaaaat 1080
atacaggcac ccagaccaag actttatagt aatatacaac agaagaaccc ctctaggagg 1140
caacatctac acagcaccct ctctacaccc aggcaatgcc attttagcaa aacacaaaat 1200
attagtacca agtttacaga caagaccaaa gggtagaaaa gcaattagac taagaatagc 1260
accccccaca ctctttacag acaagtggta ctttcaaaag gacatagccg acctcaccct 1320
tttcaacatc atggcagttg aggctgactt gcggtttccg ttctgctcac cacaaactga 1380
caacacttgc atcagcttcc aggtccttag ttccgtttac aacaactacc tcagtattaa 1440
tacctttaat aatgacaact cagactcaaa gttaaaagaa tttttaaata aagcatttcc 1500
aacaacaggc acaaaaggaa caagtttaaa tgcactaaat acatttagaa cagaaggatg 1560
cataagtcac ccacaactaa aaaaaccaaa cccacaaata aacaaaccat tagagtcaca 1620
atactttgca cctttagatg ccctctgggg agaccccata tactataatg atctaaatga 1680
aaacaaaagt ttgaacgata tcattgagaa aatactaata aaaaacatga ttacatacca 1740
tgcaaaacta agagaatttc caaattcata ccaaggaaac aaggcctttt gccacctaac 1800
aggcatatac agcccaccat acctaaacca aggcagaata tctccagaaa tatttggact 1860
gtacacagaa ataatttaca acccttacac agacaaagga actggaaaca aagtatggat 1920
ggacccacta actaaagaga acaacatata taaagaagga cagagcaaat gcctactgac 1980
tgacatgccc ctatggactt tactttttgg atatacagac tggtgtaaaa aggacactaa 2040
taactgggac ttaccactaa actacagact agtactaata tgcccttata cctttccaaa 2100
attgtacaat gaaaaagtaa aagactatgg gtacatcccg tactcctaca aattcggagc 2160
gggtcagatg ccagacggca gcaactacat accctttcag tttagagcaa agtggtaccc 2220
cacagtacta caccagcaac aggtaatgga ggacataagc aggagcgggc cctttgcacc 2280
taaggtagaa aaaccaagca ctcagctggt aatgaagtac tgttttaact ttaactgggg 2340
cggtaaccct atcattgaac agattgttaa agaccccagc ttccagccca cctatgaaat 2400
acccggtacc ggtaacatcc ctagaagaat acaagtcatc gacccgcggg tcctgggacc 2460
gcactactcg ttccggtcat gggacatgcg cagacacaca tttagcagag caagtattaa 2520
gagagtgtca gaacaacaag aaacttctga ccttgtattc tcaggcccaa aaaagcctcg 2580
ggtcgacatc ccaaaacaag aaacccaaga agaaagctca cattcactcc aaagagaatc 2640
gagaccgtgg gagaccgagg aagaaagcga gacagaagcc ctctcgcaag agagccaaga 2700
ggtccccttc caacagcagt tgcagcagca gtaccaagag cagctcaagc tcagacaggg 2760
aatcaaagtc ctcttcgagc agctcataag gacccaacaa ggggtccatg taaacccatg 2820
cctacggtag gtcccaggca gtggctgttt ccagagagaa agccagcccc agctcctagc 2880
agtggagact gggccatgga gtttctcgca gcaaaaatat ttgataggcc agttagaagc 2940
aaccttaaag atacccctta ctacccatat gttaaaaacc aatacaatgt ctactttgac 3000
cttaaatttg aataaacagc agcttcaaac ttgcaaggcc gtgggagttt cactggtcgg 3060
tgtctacctc taaaggtcac taagcactcc gagcgtaagc gaggagtgcg accctccccc 3120
ctggaacaac ttcttcggag tccggcgcta cgccttcggc tgcgccggac acctcagacc 3180
ccccctccac ccgaaacgct tgcgcgtttc ggaccttcgg cgtcgggggg gtcgggagct 3240
ttattaaacg gactccgaag tgctcttgga cactgagggg gtgaacagca acgaaagtga 3300
gtggggccag acttcgccat aaggccttta tcttcttgcc atttgtcagt gtccggggtc 3360
gccataggct tcgggctcgt ttttaggcct tccggactac aaaaatcgcc attttggtga 3420
cgtcacggcc gccatcttaa gtagttgagg cggacggtgg cgtgagttca aaggtcacca 3480
tcagccacac ctactcaaaa tggtggacaa tttcttccgg gtcaaaggtt acagccgcca 3540
tgttaaaaca cgtgacgtat gacgtcacgg ccgccatttt gtgacacaag atggccgact 3600
tccttcctct ttttcaaaaa aaagcggaag tgccgccgcg gcggcggggg gcggcgcgct 3660
gcgcgcgccg cccagtaggg ggagccatgc gccccccccc gcgcatgcgc ggggcccccc 3720
cccgcggggg gctccgcccc ccggcccccc ccg 3753
<210> 17
<211> 127
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 17
Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg
1 5 10 15
Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys
20 25 30
Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His
35 40 45
Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro
50 55 60
His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln
65 70 75 80
Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp
85 90 95
Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala
100 105 110
Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu
115 120 125
<210> 18
<211> 268
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 18
Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg
1 5 10 15
Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys
20 25 30
Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His
35 40 45
Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro
50 55 60
His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln
65 70 75 80
Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp
85 90 95
Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala
100 105 110
Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu Leu
115 120 125
Leu Lys Thr Pro Ala Ser Ser Pro Pro Met Lys Tyr Pro Val Pro Val
130 135 140
Thr Ser Leu Glu Glu Tyr Lys Ser Ser Thr Arg Gly Ser Trp Asp Arg
145 150 155 160
Thr Thr Arg Ser Gly His Gly Thr Cys Ala Asp Thr His Leu Ala Glu
165 170 175
Gln Val Leu Arg Glu Cys Gln Asn Asn Lys Lys Leu Leu Thr Leu Tyr
180 185 190
Ser Gln Ala Gln Lys Ser Leu Gly Ser Thr Ser Gln Asn Lys Lys Pro
195 200 205
Lys Lys Lys Ala His Ile His Ser Lys Glu Asn Arg Asp Arg Gly Arg
210 215 220
Pro Arg Lys Lys Ala Arg Gln Lys Pro Ser Arg Lys Arg Ala Lys Arg
225 230 235 240
Ser Pro Ser Asn Ser Ser Cys Ser Ser Ser Thr Lys Ser Ser Ser Ser
245 250 255
Ser Asp Arg Glu Ser Lys Ser Ser Ser Ser Ser Ser
260 265
<210> 19
<211> 276
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 19
Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg
1 5 10 15
Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys
20 25 30
Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His
35 40 45
Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro
50 55 60
His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln
65 70 75 80
Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp
85 90 95
Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala
100 105 110
Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu Pro
115 120 125
Lys Lys Ala Ser Gly Arg His Pro Lys Thr Arg Asn Pro Arg Arg Lys
130 135 140
Leu Thr Phe Thr Pro Lys Arg Ile Glu Thr Val Gly Asp Arg Gly Arg
145 150 155 160
Lys Arg Asp Arg Ser Pro Leu Ala Arg Glu Pro Arg Gly Pro Leu Pro
165 170 175
Thr Ala Val Ala Ala Ala Val Pro Arg Ala Ala Gln Ala Gln Thr Gly
180 185 190
Asn Gln Ser Pro Leu Arg Ala Ala His Lys Asp Pro Thr Arg Gly Pro
195 200 205
Cys Lys Pro Met Pro Thr Val Gly Pro Arg Gln Trp Leu Phe Pro Glu
210 215 220
Arg Lys Pro Ala Pro Ala Pro Ser Ser Gly Asp Trp Ala Met Glu Phe
225 230 235 240
Leu Ala Ala Lys Ile Phe Asp Arg Pro Val Arg Ser Asn Leu Lys Asp
245 250 255
Thr Pro Tyr Tyr Pro Tyr Val Lys Asn Gln Tyr Asn Val Tyr Phe Asp
260 265 270
Leu Lys Phe Glu
275
<210> 20
<211> 167
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 20
Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg
1 5 10 15
Met Trp Pro Lys Lys Ala Ser Gly Arg His Pro Lys Thr Arg Asn Pro
20 25 30
Arg Arg Lys Leu Thr Phe Thr Pro Lys Arg Ile Glu Thr Val Gly Asp
35 40 45
Arg Gly Arg Lys Arg Asp Arg Ser Pro Leu Ala Arg Glu Pro Arg Gly
50 55 60
Pro Leu Pro Thr Ala Val Ala Ala Ala Val Pro Arg Ala Ala Gln Ala
65 70 75 80
Gln Thr Gly Asn Gln Ser Pro Leu Arg Ala Ala His Lys Asp Pro Thr
85 90 95
Arg Gly Pro Cys Lys Pro Met Pro Thr Val Gly Pro Arg Gln Trp Leu
100 105 110
Phe Pro Glu Arg Lys Pro Ala Pro Ala Pro Ser Ser Gly Asp Trp Ala
115 120 125
Met Glu Phe Leu Ala Ala Lys Ile Phe Asp Arg Pro Val Arg Ser Asn
130 135 140
Leu Lys Asp Thr Pro Tyr Tyr Pro Tyr Val Lys Asn Gln Tyr Asn Val
145 150 155 160
Tyr Phe Asp Leu Lys Phe Glu
165
<210> 21
<211> 743
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 21
Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys
1 5 10 15
Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg
20 25 30
Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg
35 40 45
Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg
50 55 60
Arg Gly Arg Lys Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val
65 70 75 80
Ile Lys Arg Cys Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly
85 90 95
Asn Gly Thr Phe Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile
100 105 110
Met Lys Gly Pro Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu
115 120 125
Tyr Ile Leu Phe Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg
130 135 140
Ser Asn Asp Asn Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys
145 150 155 160
Ile Tyr Arg His Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg
165 170 175
Thr Pro Leu Gly Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly
180 185 190
Asn Ala Ile Leu Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr
195 200 205
Arg Pro Lys Gly Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr
210 215 220
Leu Phe Thr Asp Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr
225 230 235 240
Leu Phe Asn Ile Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys
245 250 255
Ser Pro Gln Thr Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser
260 265 270
Val Tyr Asn Asn Tyr Leu Ser Ile Asn Thr Phe Asn Asn Asp Asn Ser
275 280 285
Asp Ser Lys Leu Lys Glu Phe Leu Asn Lys Ala Phe Pro Thr Thr Gly
290 295 300
Thr Lys Gly Thr Ser Leu Asn Ala Leu Asn Thr Phe Arg Thr Glu Gly
305 310 315 320
Cys Ile Ser His Pro Gln Leu Lys Lys Pro Asn Pro Gln Ile Asn Lys
325 330 335
Pro Leu Glu Ser Gln Tyr Phe Ala Pro Leu Asp Ala Leu Trp Gly Asp
340 345 350
Pro Ile Tyr Tyr Asn Asp Leu Asn Glu Asn Lys Ser Leu Asn Asp Ile
355 360 365
Ile Glu Lys Ile Leu Ile Lys Asn Met Ile Thr Tyr His Ala Lys Leu
370 375 380
Arg Glu Phe Pro Asn Ser Tyr Gln Gly Asn Lys Ala Phe Cys His Leu
385 390 395 400
Thr Gly Ile Tyr Ser Pro Pro Tyr Leu Asn Gln Gly Arg Ile Ser Pro
405 410 415
Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp
420 425 430
Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr Lys Glu Asn
435 440 445
Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr Asp Met Pro
450 455 460
Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys Lys Asp Thr
465 470 475 480
Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu Ile Cys Pro
485 490 495
Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp Tyr Gly Tyr
500 505 510
Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro Asp Gly Ser
515 520 525
Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro Thr Val Leu
530 535 540
His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly Pro Phe Ala
545 550 555 560
Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys Tyr Cys Phe
565 570 575
Asn Phe Asn Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp
580 585 590
Pro Ser Phe Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro
595 600 605
Arg Arg Ile Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser
610 615 620
Phe Arg Ser Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile
625 630 635 640
Lys Arg Val Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly
645 650 655
Pro Lys Lys Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu
660 665 670
Ser Ser His Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu
675 680 685
Glu Ser Glu Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe
690 695 700
Gln Gln Gln Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln
705 710 715 720
Gly Ile Lys Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val
725 730 735
His Val Asn Pro Cys Leu Arg
740
<210> 22
<211> 194
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 22
Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys
1 5 10 15
Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg
20 25 30
Arg Arg Pro Arg Arg Arg Arg Ile Val Lys Asp Pro Ser Phe Gln Pro
35 40 45
Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro Arg Arg Ile Gln Val
50 55 60
Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser Phe Arg Ser Trp Asp
65 70 75 80
Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile Lys Arg Val Ser Glu
85 90 95
Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly Pro Lys Lys Pro Arg
100 105 110
Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu Ser Ser His Ser Leu
115 120 125
Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu Glu Ser Glu Thr Glu
130 135 140
Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe Gln Gln Gln Leu Gln
145 150 155 160
Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln Gly Ile Lys Val Leu
165 170 175
Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val His Val Asn Pro Cys
180 185 190
Leu Arg
<210> 23
<211> 113
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 23
Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys
1 5 10 15
Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg
20 25 30
Arg Arg Pro Arg Arg Arg Arg Ala Gln Lys Ser Leu Gly Ser Thr Ser
35 40 45
Gln Asn Lys Lys Pro Lys Lys Lys Ala His Ile His Ser Lys Glu Asn
50 55 60
Arg Asp Arg Gly Arg Pro Arg Lys Lys Ala Arg Gln Lys Pro Ser Arg
65 70 75 80
Lys Arg Ala Lys Arg Ser Pro Ser Asn Ser Ser Cys Ser Ser Ser Thr
85 90 95
Lys Ser Ser Ser Ser Ser Asp Arg Glu Ser Lys Ser Ser Ser Ser Ser
100 105 110
Ser
<210> 24
<400> 24
000
<210> 25
<400> 25
000
<210> 26
<400> 26
000
<210> 27
<400> 27
000
<210> 28
<400> 28
000
<210> 29
<400> 29
000
<210> 30
<400> 30
000
<210> 31
<400> 31
000
<210> 32
<400> 32
000
<210> 33
<400> 33
000
<210> 34
<400> 34
000
<210> 35
<400> 35
000
<210> 36
<400> 36
000
<210> 37
<400> 37
000
<210> 38
<400> 38
000
<210> 39
<400> 39
000
<210> 40
<400> 40
000
<210> 41
<400> 41
000
<210> 42
<400> 42
000
<210> 43
<400> 43
000
<210> 44
<400> 44
000
<210> 45
<400> 45
000
<210> 46
<400> 46
000
<210> 47
<400> 47
000
<210> 48
<400> 48
000
<210> 49
<400> 49
000
<210> 50
<400> 50
000
<210> 51
<400> 51
000
<210> 52
<400> 52
000
<210> 53
<400> 53
000
<210> 54
<211> 2979
<212> DNA
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 54
taataaatat tcaacaggaa aaccacctaa tttaaattgc cgaccacaaa ccgtcactta 60
gttccccttt ttgcaacaac ttctgctttt ttccaactgc cggaaaacca cataatttgc 120
atggctaacc acaaactgat atgctaatta acttccacaa aacaacttcc ccttttaaaa 180
ccacacctac aaattaatta ttaaacacag tcacatcctg ggaggtacta ccacactata 240
ataccaagtg cacttccgaa tggctgagtt tatgccgcta gacggagaac gcatcagtta 300
ctgactgcgg actgaacttg ggcgggtgcc gaaggtgagt gaaaccaccg aagtcaaggg 360
gcaattcggg ctagttcagt ctagcggaac gggcaagaaa cttaaaatta ttttattttt 420
cagatgagcg actgctttaa accaacatgc tacaacaaca aaacaaagca aactcactgg 480
attaataacc tgcatttaac ccacgacctg atctgcttct gcccaacacc aactagacac 540
ttattactag ctttagcaga acaacaagaa acaattgaag tgtctaaaca agaaaaagaa 600
aaaataacaa gatgccttat tactacagaa gaagacggta caactacaga cgtcctagat 660
ggtatggacg aggttggatt agacgccctt ttcgcagaag atttcgaaga aaaagaaggg 720
taagacctac ttatactact attcctctaa agcaatggca accgccatat aaaagaacat 780
gctatataaa aggacaagac tgtttaatat actatagcaa cttaagactg ggaatgaata 840
gtacaatgta tgaaaaaagt attgtacctg tacattggcc gggagggggt tctttttctg 900
taagcatgtt aactttagat gccttgtatg atatacataa actttgtaga aactggtgga 960
catccacaaa ccaagactta ccactagtaa gatataaagg atgcaaaata acattttatc 1020
aaagcacatt tacagactac atagtaagaa tacatacaga actaccagct aacagtaaca 1080
aactaacata cccaaacaca catccactaa tgatgatgat gtctaagtac aaacacatta 1140
tacctagtag acaaacaaga agaaaaaaga aaccatacac aaaaatattt gtaaaaccac 1200
ctccgcaatt tgaaaacaaa tggtactttg ctacagacct ctacaaaatt ccattactac 1260
aaatacactg cacagcatgc aacttacaaa acccatttgt aaaaccagac aaattatcaa 1320
acaatgttac attatggtca ctaaacacca taagcataca aaatagaaac atgtcagtgg 1380
atcaaggaca atcatggcca tttaaaatac taggaacaca aagcttttat ttttactttt 1440
acaccggagc aaacctacca ggtgacacaa cacaaatacc agtagcagac ctattaccac 1500
taacaaaccc aagaataaac agaccaggac aatcactaaa tgaggcaaaa attacagacc 1560
atattacttt cacagaatac aaaaacaaat ttacaaatta ttggggtaac ccatttaata 1620
aacacattca agaacaccta gatatgatac tatactcact aaaaagtcca gaagcaataa 1680
aaaacgaatg gacaacagaa aacatgaaat ggaaccaatt aaacaatgca ggaacaatgg 1740
cattaacacc atttaacgag ccaatattca cacaaataca atataaccca gatagagaca 1800
caggagaaga cactcaatta tacctactct ctaacgctac aggaacagga tgggacccac 1860
caggaattcc agaattaata ctagaaggat ttccactatg gttaatatat tggggatttg 1920
cagactttca aaaaaaccta aaaaaagtaa caaacataga cacaaattac atgttagtag 1980
caaaaacaaa atttacacaa aaacctggca cattctactt agtaatacta aatgacacct 2040
ttgtagaagg caatagccca tatgaaaaac aacctttacc tgaagacaac attaaatggt 2100
acccacaagt acaataccaa ttagaagcac aaaacaaact actacaaact gggccattta 2160
caccaaacat acaaggacaa ctatcagaca atatatcaat gttttataaa ttttacttta 2220
aatggggagg aagcccacca aaagcaatta atgttgaaaa tcctgcccac cagattcaat 2280
atcccatacc ccgtaacgag catgaaacaa cttcgttaca gagtccaggg gaagccccag 2340
aatccatctt atactccttc gactatagac acgggaacta cacaacaaca gctttgtcac 2400
gaattagcca agactgggca cttaaagaca ctgtttctaa aattacagag ccagatcgac 2460
agcaactgct caaacaagcc ctcgaatgcc tgcaaatctc ggaagaaacg caggagaaaa 2520
aagaaaaaga agtacagcag ctcatcagca acctcagaca gcagcagcag ctgtacagag 2580
agcgaataat atcattatta aaggaccaat aacttttaac tgtgtaaaaa aggtgaaatt 2640
gtttgatgat aaaccaaaaa accgtagatt tacacctgag gaatttgaaa ctgagttaca 2700
aatagcaaaa tggttaaaga gacccccaag atcctttgta aatgatcctc ccttttaccc 2760
atggttacca cctgaacctg ttgtaaactt taagcttaat tttactgaat aaaggccagc 2820
attaattcac ttaaggagtc tgtttattta agttaaacct taataaacgg tcaccgcctc 2880
cctaatacgc aggcgcagaa agggggctcc gcccccttta acccccaggg ggctccgccc 2940
cctgaaaccc ccaagggggc tacgccccct tacaccccc 2979
<210> 55
<211> 99
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 55
Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln
1 5 10 15
Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe
20 25 30
Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln
35 40 45
Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys
50 55 60
Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly
65 70 75 80
Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu
85 90 95
Lys Glu Gly
<210> 56
<211> 203
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 56
Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln
1 5 10 15
Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe
20 25 30
Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln
35 40 45
Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys
50 55 60
Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly
65 70 75 80
Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu
85 90 95
Lys Glu Gly Phe Asn Ile Pro Tyr Pro Val Thr Ser Met Lys Gln Leu
100 105 110
Arg Tyr Arg Val Gln Gly Lys Pro Gln Asn Pro Ser Tyr Thr Pro Ser
115 120 125
Thr Ile Asp Thr Gly Thr Thr Gln Gln Gln Leu Cys His Glu Leu Ala
130 135 140
Lys Thr Gly His Leu Lys Thr Leu Phe Leu Lys Leu Gln Ser Gln Ile
145 150 155 160
Asp Ser Asn Cys Ser Asn Lys Pro Ser Asn Ala Cys Lys Ser Arg Lys
165 170 175
Lys Arg Arg Arg Lys Lys Lys Lys Lys Tyr Ser Ser Ser Ser Ala Thr
180 185 190
Ser Asp Ser Ser Ser Ser Cys Thr Glu Ser Glu
195 200
<210> 57
<211> 219
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 57
Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln
1 5 10 15
Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe
20 25 30
Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln
35 40 45
Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys
50 55 60
Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly
65 70 75 80
Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu
85 90 95
Lys Glu Gly Ala Arg Ser Thr Ala Thr Ala Gln Thr Ser Pro Arg Met
100 105 110
Pro Ala Asn Leu Gly Arg Asn Ala Gly Glu Lys Arg Lys Arg Ser Thr
115 120 125
Ala Ala His Gln Gln Pro Gln Thr Ala Ala Ala Ala Val Gln Arg Ala
130 135 140
Asn Asn Ile Ile Ile Lys Gly Pro Ile Thr Phe Asn Cys Val Lys Lys
145 150 155 160
Val Lys Leu Phe Asp Asp Lys Pro Lys Asn Arg Arg Phe Thr Pro Glu
165 170 175
Glu Phe Glu Thr Glu Leu Gln Ile Ala Lys Trp Leu Lys Arg Pro Pro
180 185 190
Arg Ser Phe Val Asn Asp Pro Pro Phe Tyr Pro Trp Leu Pro Pro Glu
195 200 205
Pro Val Val Asn Phe Lys Leu Asn Phe Thr Glu
210 215
<210> 58
<211> 666
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 58
Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg
1 5 10 15
Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg
20 25 30
Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln
35 40 45
Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys
50 55 60
Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr
65 70 75 80
Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser
85 90 95
Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys
100 105 110
Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr
115 120 125
Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile
130 135 140
Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr
145 150 155 160
Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile
165 170 175
Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile
180 185 190
Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr
195 200 205
Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn
210 215 220
Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr
225 230 235 240
Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val
245 250 255
Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe
260 265 270
Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln
275 280 285
Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg
290 295 300
Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe
305 310 315 320
Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn
325 330 335
Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser
340 345 350
Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn
355 360 365
Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro
370 375 380
Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp
385 390 395 400
Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro
405 410 415
Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile
420 425 430
Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn
435 440 445
Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys
450 455 460
Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly
465 470 475 480
Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp
485 490 495
Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln
500 505 510
Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile
515 520 525
Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys
530 535 540
Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro
545 550 555 560
Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro
565 570 575
Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr
580 585 590
Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val
595 600 605
Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu
610 615 620
Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu
625 630 635 640
Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg
645 650 655
Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
660 665
<210> 59
<211> 148
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 59
Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg
1 5 10 15
Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg
20 25 30
Arg Lys Arg Arg Ile Gln Tyr Pro Ile Pro Arg Asn Glu His Glu Thr
35 40 45
Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro Glu Ser Ile Leu Tyr Ser
50 55 60
Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr Thr Ala Leu Ser Arg Ile
65 70 75 80
Ser Gln Asp Trp Ala Leu Lys Asp Thr Val Ser Lys Ile Thr Glu Pro
85 90 95
Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu Glu Cys Leu Gln Ile Ser
100 105 110
Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu Val Gln Gln Leu Ile Ser
115 120 125
Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg Glu Arg Ile Ile Ser Leu
130 135 140
Leu Lys Asp Gln
145
<210> 60
<211> 82
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 60
Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg
1 5 10 15
Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg
20 25 30
Arg Lys Arg Arg Ser Gln Ile Asp Ser Asn Cys Ser Asn Lys Pro Ser
35 40 45
Asn Ala Cys Lys Ser Arg Lys Lys Arg Arg Arg Lys Lys Lys Lys Lys
50 55 60
Tyr Ser Ser Ser Ser Ala Thr Ser Asp Ser Ser Ser Ser Cys Thr Glu
65 70 75 80
Ser Glu
<210> 61
<400> 61
000
<210> 62
<400> 62
000
<210> 63
<400> 63
000
<210> 64
<400> 64
000
<210> 65
<400> 65
000
<210> 66
<400> 66
000
<210> 67
<400> 67
000
<210> 68
<400> 68
000
<210> 69
<400> 69
000
<210> 70
<400> 70
000
<210> 71
<400> 71
000
<210> 72
<400> 72
000
<210> 73
<400> 73
000
<210> 74
<400> 74
000
<210> 75
<400> 75
000
<210> 76
<400> 76
000
<210> 77
<400> 77
000
<210> 78
<400> 78
000
<210> 79
<400> 79
000
<210> 80
<400> 80
000
<210> 81
<400> 81
000
<210> 82
<400> 82
000
<210> 83
<400> 83
000
<210> 84
<400> 84
000
<210> 85
<400> 85
000
<210> 86
<400> 86
000
<210> 87
<400> 87
000
<210> 88
<400> 88
000
<210> 89
<400> 89
000
<210> 90
<400> 90
000
<210> 91
<400> 91
000
<210> 92
<400> 92
000
<210> 93
<400> 93
000
<210> 94
<400> 94
000
<210> 95
<400> 95
000
<210> 96
<400> 96
000
<210> 97
<400> 97
000
<210> 98
<400> 98
000
<210> 99
<400> 99
000
<210> 100
<400> 100
000
<210> 101
<400> 101
000
<210> 102
<400> 102
000
<210> 103
<400> 103
000
<210> 104
<400> 104
000
<210> 105
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 105
cgggtgccgk aggtgagttt acacaccgma gtcaaggggc aattcgggct crggactggc 60
cgggcyhtgg g 71
<210> 106
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 106
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctwtgg g 71
<210> 107
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 107
cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctatgg g 71
<210> 108
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 108
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggccctgg g 71
<210> 109
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 109
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctttgg g 71
<210> 110
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 110
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctatgg g 71
<210> 111
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 111
cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60
cgggctttgg g 71
<210> 112
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 112
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggcyhtgg g 71
<210> 113
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 113
cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctatgg g 71
<210> 114
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 114
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggcccggg 70
<210> 115
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 115
cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60
cgggctttgg g 71
<210> 116
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 116
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggaggccg 60
ggccatggg 69
<210> 117
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 117
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggccccgg g 71
<210> 118
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 118
cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctatgg g 71
<210> 119
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 119
cgggtgccga aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60
cgggctatgg g 71
<210> 120
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<220>
<221> 尚未归类的特征
<222> (10)..(10)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (12)..(12)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (30)..(32)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (34)..(34)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (43)..(46)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (52)..(54)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (70)..(71)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (89)..(90)
<223> 可能存在或可能不存在
<220>
<221> 尚未归类的特征
<222> (103)..(103)
<223> 可能存在或可能不存在
<400> 120
cggcggsggs gcsscgcgct dcgcgcgcsg cccrsyrggg grdssmmwgc skcscccccc 60
cscgcgcatg cgcrcgggkc ccccccccyv sggggggctc cgcccccccg gcccccc 117
<210> 121
<211> 169
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<220>
<221> 经修饰的碱基
<222> (20)..(20)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (22)..(22)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (40)..(42)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (53)..(56)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (62)..(62)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (64)..(64)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (97)..(98)
<223> a、c、t、g,未知或其他
<400> 121
gccgccgcgg cggcggsggn gnsgcgcgct dcgcgcgcsn nncrccrggg ggnnnncwgc 60
sncncccccc cccgcgcatg cgcgggkccc ccccccnncg gggggctccg ccccccggcc 120
cccccccgtg ctaaacccac cgcgcatgcg cgaccacgcc cccgccgcc 169
<210> 122
<211> 79
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<220>
<221> 经修饰的碱基
<222> (20)..(20)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (22)..(22)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (40)..(42)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (53)..(56)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (62)..(62)
<223> a、c、t、g,未知或其他
<220>
<221> 经修饰的碱基
<222> (64)..(64)
<223> a、c、t、g,未知或其他
<400> 122
gccgccgcgg cggcggsggn gnsgcgcgct dcgcgcgcsn nncrccrggg ggnnnncwgc 60
sncncccccc cccgcgcat 79
<210> 123
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<220>
<221> 经修饰的碱基
<222> (18)..(19)
<223> a、c、t、g,未知或其他
<400> 123
gcgcgggkcc cccccccnnc ggggggctcc g 31
<210> 124
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 124
ccccccggcc cccccccgtg ctaaacccac cgcgcatgcg cgaccacgcc cccgccgcc 59
<210> 125
<211> 156
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 125
gcggcggggg ggcggccgcg ttcgcgcgcc gcccaccagg gggtgctgcg cgcccccccc 60
cgcgcatgcg cggggccccc ccccgggggg gctccgcccc cccggccccc ccccgtgcta 120
aacccaccgc gcatgcgcga ccacgccccc gccgcc 156
<210> 126
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 126
gcggcgg 7
<210> 127
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 127
gggggcg 7
<210> 128
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 128
gccgcg 6
<210> 129
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 129
ttcgcgcgcc gcccaccagg gggtg 25
<210> 130
<211> 5
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 130
ctgcg 5
<210> 131
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 131
cgcccccccc cgcgcat 17
<210> 132
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 132
gcgcggggcc ccccccc 17
<210> 133
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 133
gggggggctc cgcccccccg gccccccccc gtgctaaacc caccgcgcat gcgcgaccac 60
gcccccgccg cc 72
<210> 134
<211> 115
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 134
cggcggcggc ggcgcgcgcg ctgcgcgcgc gcgccggggg ggcgccagcg cccccccccc 60
cgcgcatgca cgggtccccc cccccacggg gggctccgcc ccccggcccc ccccc 115
<210> 135
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 135
cggcggcggc ggcg 14
<210> 136
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 136
cgcgcgctgc gcgcgcg 17
<210> 137
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 137
cgccgggggg gcgccagcg 19
<210> 138
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 138
cccccccccc cgcgcat 17
<210> 139
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 139
gcacgggtcc ccccccccac ggggggctcc g 31
<210> 140
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 140
ccccccggcc ccccccc 17
<210> 141
<211> 121
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 141
ccgtcggcgg gggggccgcg cgctgcgcgc gcggcccccg ggggaggcac agcctccccc 60
ccccgcgcgc atgcgcgcgg gtcccccccc ctccgggggg ctccgccccc cggccccccc 120
c 121
<210> 142
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 142
ccgtcggcgg gggggccgcg cgctgcgcgc gcggccc 37
<210> 143
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 143
ccgggggagg cacagcctcc cccccccgcg cgcatgcgcg cgggtccccc cccctccggg 60
gggctccgcc ccccggcccc cccc 84
<210> 144
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 144
cggcggcggc gcgcgcgcta cgcgcgcgcg ccggggggct gccgcccccc ccccgcgcat 60
gcgcggggcc cccccccgcg gggggctccg ccccccggcc cccc 104
<210> 145
<211> 11
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 145
cggcggcggc g 11
<210> 146
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 146
cgcgcgctac gcgcgcg 17
<210> 147
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 147
cgccgggggg 10
<210> 148
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 148
ctgccgc 7
<210> 149
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 149
cccccccccg cgcat 15
<210> 150
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 150
gcgcggggcc ccccccc 17
<210> 151
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 151
gcggggggct ccg 13
<210> 152
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 152
ccccccggcc cccc 14
<210> 153
<211> 122
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 153
gccgccgcgg cggcgggggg cggcgcgctg cgcgcgccgc ccagtagggg gagccatgcg 60
cccccccccg cgcatgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc 120
cg 122
<210> 154
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 154
gccgccgcgg cggcggggg 19
<210> 155
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 155
gcggcgcgct gcgcgcgccg cccagtaggg ggagccatgc g 41
<210> 156
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 156
cccccccccg cgcat 15
<210> 157
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 157
gcgcggggcc ccccccc 17
<210> 158
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 158
gcggggggct ccg 13
<210> 159
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 159
ccccccggcc ccccccg 17
<210> 160
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 160
cgcgctgcgc gcgccgccca gtagggggag ccatgc 36
<210> 161
<211> 78
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 161
ccgccatctt aagtagttga ggcggacggt ggcgtgagtt caaaggtcac catcagccac 60
acctactcaa aatggtgg 78
<210> 162
<211> 172
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 162
cttaagtagt tgaggcggac ggtggcgtga gttcaaaggt caccatcagc cacacctact 60
caaaatggtg gacaatttct tccgggtcaa aggttacagc cgccatgtta aaacacgtga 120
cgtatgacgt cacggccgcc attttgtgac acaagatggc cgacttcctt cc 172
<210> 163
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 163
cgcgctgcgc gcgccgccca gtagggggag ccatgc 36
<210> 164
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 164
gcgctdcgcg cgcgcgccgg ggggctgcgc cccccc 36
<210> 165
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 165
gcgcttcgcg cgccgcccac tagggggcgt tgcgcg 36
<210> 166
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 166
gcgctgcgcg cgccgcccag tagggggcgc aatgcg 36
<210> 167
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 167
gcgctgcgcg cgcggccccc gggggaggca ttgcct 36
<210> 168
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 168
gcgctgcgcg cgcgcgccgg gggggcgcca gcgccc 36
<210> 169
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 169
gcgcttcgcg cgcgcgccgg ggggctccgc cccccc 36
<210> 170
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 170
gcgcttcgcg cgcgcgccgg ggggctgcgc cccccc 36
<210> 171
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 171
gcgctacgcg cgcgcgccgg ggggctgcgc cccccc 36
<210> 172
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 172
gcgctacgcg cgcgcgccgg ggggctctgc cccccc 36
<210> 173
<400> 173
000
<210> 174
<400> 174
000
<210> 175
<400> 175
000
<210> 176
<400> 176
000
<210> 177
<400> 177
000
<210> 178
<400> 178
000
<210> 179
<400> 179
000
<210> 180
<400> 180
000
<210> 181
<400> 181
000
<210> 182
<400> 182
000
<210> 183
<400> 183
000
<210> 184
<400> 184
000
<210> 185
<211> 743
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 185
Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys
1 5 10 15
Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg
20 25 30
Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg
35 40 45
Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg
50 55 60
Arg Gly Arg Lys Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val
65 70 75 80
Ile Lys Arg Cys Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly
85 90 95
Asn Gly Thr Phe Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile
100 105 110
Met Lys Gly Pro Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu
115 120 125
Tyr Ile Leu Phe Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg
130 135 140
Ser Asn Asp Asn Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys
145 150 155 160
Ile Tyr Arg His Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg
165 170 175
Thr Pro Leu Gly Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly
180 185 190
Asn Ala Ile Leu Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr
195 200 205
Arg Pro Lys Gly Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr
210 215 220
Leu Phe Thr Asp Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr
225 230 235 240
Leu Phe Asn Ile Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys
245 250 255
Ser Pro Gln Thr Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser
260 265 270
Val Tyr Asn Asn Tyr Leu Ser Ile Asn Thr Phe Asn Asn Asp Asn Ser
275 280 285
Asp Ser Lys Leu Lys Glu Phe Leu Asn Lys Ala Phe Pro Thr Thr Gly
290 295 300
Thr Lys Gly Thr Ser Leu Asn Ala Leu Asn Thr Phe Arg Thr Glu Gly
305 310 315 320
Cys Ile Ser His Pro Gln Leu Lys Lys Pro Asn Pro Gln Ile Asn Lys
325 330 335
Pro Leu Glu Ser Gln Tyr Phe Ala Pro Leu Asp Ala Leu Trp Gly Asp
340 345 350
Pro Ile Tyr Tyr Asn Asp Leu Asn Glu Asn Lys Ser Leu Asn Asp Ile
355 360 365
Ile Glu Lys Ile Leu Ile Lys Asn Met Ile Thr Tyr His Ala Lys Leu
370 375 380
Arg Glu Phe Pro Asn Ser Tyr Gln Gly Asn Lys Ala Phe Cys His Leu
385 390 395 400
Thr Gly Ile Tyr Ser Pro Pro Tyr Leu Asn Gln Gly Arg Ile Ser Pro
405 410 415
Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp
420 425 430
Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr Lys Glu Asn
435 440 445
Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr Asp Met Pro
450 455 460
Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys Lys Asp Thr
465 470 475 480
Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu Ile Cys Pro
485 490 495
Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp Tyr Gly Tyr
500 505 510
Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro Asp Gly Ser
515 520 525
Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro Thr Val Leu
530 535 540
His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly Pro Phe Ala
545 550 555 560
Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys Tyr Cys Phe
565 570 575
Asn Phe Asn Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp
580 585 590
Pro Ser Phe Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro
595 600 605
Arg Arg Ile Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser
610 615 620
Phe Arg Ser Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile
625 630 635 640
Lys Arg Val Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly
645 650 655
Pro Lys Lys Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu
660 665 670
Ser Ser His Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu
675 680 685
Glu Ser Glu Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe
690 695 700
Gln Gln Gln Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln
705 710 715 720
Gly Ile Lys Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val
725 730 735
His Val Asn Pro Cys Leu Arg
740
<210> 186
<211> 68
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 186
Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys
1 5 10 15
Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg
20 25 30
Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg
35 40 45
Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg
50 55 60
Arg Gly Arg Lys
65
<210> 187
<211> 212
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 187
Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val Ile Lys Arg Cys
1 5 10 15
Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly Asn Gly Thr Phe
20 25 30
Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile Met Lys Gly Pro
35 40 45
Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu Tyr Ile Leu Phe
50 55 60
Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg Ser Asn Asp Asn
65 70 75 80
Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys Ile Tyr Arg His
85 90 95
Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg Thr Pro Leu Gly
100 105 110
Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly Asn Ala Ile Leu
115 120 125
Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr Arg Pro Lys Gly
130 135 140
Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr Leu Phe Thr Asp
145 150 155 160
Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr Leu Phe Asn Ile
165 170 175
Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys Ser Pro Gln Thr
180 185 190
Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser Val Tyr Asn Asn
195 200 205
Tyr Leu Ser Ile
210
<210> 188
<211> 133
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 188
Asn Thr Phe Asn Asn Asp Asn Ser Asp Ser Lys Leu Lys Glu Phe Leu
1 5 10 15
Asn Lys Ala Phe Pro Thr Thr Gly Thr Lys Gly Thr Ser Leu Asn Ala
20 25 30
Leu Asn Thr Phe Arg Thr Glu Gly Cys Ile Ser His Pro Gln Leu Lys
35 40 45
Lys Pro Asn Pro Gln Ile Asn Lys Pro Leu Glu Ser Gln Tyr Phe Ala
50 55 60
Pro Leu Asp Ala Leu Trp Gly Asp Pro Ile Tyr Tyr Asn Asp Leu Asn
65 70 75 80
Glu Asn Lys Ser Leu Asn Asp Ile Ile Glu Lys Ile Leu Ile Lys Asn
85 90 95
Met Ile Thr Tyr His Ala Lys Leu Arg Glu Phe Pro Asn Ser Tyr Gln
100 105 110
Gly Asn Lys Ala Phe Cys His Leu Thr Gly Ile Tyr Ser Pro Pro Tyr
115 120 125
Leu Asn Gln Gly Arg
130
<210> 189
<211> 166
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 189
Ile Ser Pro Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro
1 5 10 15
Tyr Thr Asp Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr
20 25 30
Lys Glu Asn Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr
35 40 45
Asp Met Pro Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys
50 55 60
Lys Asp Thr Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu
65 70 75 80
Ile Cys Pro Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp
85 90 95
Tyr Gly Tyr Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro
100 105 110
Asp Gly Ser Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro
115 120 125
Thr Val Leu His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly
130 135 140
Pro Phe Ala Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys
145 150 155 160
Tyr Cys Phe Asn Phe Asn
165
<210> 190
<211> 164
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 190
Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp Pro Ser Phe
1 5 10 15
Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro Arg Arg Ile
20 25 30
Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser Phe Arg Ser
35 40 45
Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile Lys Arg Val
50 55 60
Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly Pro Lys Lys
65 70 75 80
Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu Ser Ser His
85 90 95
Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu Glu Ser Glu
100 105 110
Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe Gln Gln Gln
115 120 125
Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln Gly Ile Lys
130 135 140
Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val His Val Asn
145 150 155 160
Pro Cys Leu Arg
<210> 191
<400> 191
000
<210> 192
<400> 192
000
<210> 193
<400> 193
000
<210> 194
<400> 194
000
<210> 195
<400> 195
000
<210> 196
<400> 196
000
<210> 197
<400> 197
000
<210> 198
<400> 198
000
<210> 199
<400> 199
000
<210> 200
<400> 200
000
<210> 201
<400> 201
000
<210> 202
<400> 202
000
<210> 203
<400> 203
000
<210> 204
<400> 204
000
<210> 205
<400> 205
000
<210> 206
<400> 206
000
<210> 207
<400> 207
000
<210> 208
<400> 208
000
<210> 209
<400> 209
000
<210> 210
<400> 210
000
<210> 211
<400> 211
000
<210> 212
<400> 212
000
<210> 213
<400> 213
000
<210> 214
<400> 214
000
<210> 215
<211> 666
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 215
Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg
1 5 10 15
Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg
20 25 30
Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln
35 40 45
Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys
50 55 60
Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr
65 70 75 80
Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser
85 90 95
Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys
100 105 110
Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr
115 120 125
Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile
130 135 140
Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr
145 150 155 160
Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile
165 170 175
Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile
180 185 190
Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr
195 200 205
Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn
210 215 220
Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr
225 230 235 240
Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val
245 250 255
Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe
260 265 270
Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln
275 280 285
Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg
290 295 300
Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe
305 310 315 320
Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn
325 330 335
Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser
340 345 350
Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn
355 360 365
Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro
370 375 380
Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp
385 390 395 400
Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro
405 410 415
Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile
420 425 430
Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn
435 440 445
Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys
450 455 460
Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly
465 470 475 480
Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp
485 490 495
Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln
500 505 510
Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile
515 520 525
Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys
530 535 540
Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro
545 550 555 560
Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro
565 570 575
Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr
580 585 590
Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val
595 600 605
Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu
610 615 620
Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu
625 630 635 640
Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg
645 650 655
Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln
660 665
<210> 216
<211> 38
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 216
Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg
1 5 10 15
Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg
20 25 30
Arg Lys Arg Arg Val Arg
35
<210> 217
<211> 208
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 217
Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln Trp Gln Pro Pro Tyr Lys
1 5 10 15
Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys Leu Ile Tyr Tyr Ser Asn
20 25 30
Leu Arg Leu Gly Met Asn Ser Thr Met Tyr Glu Lys Ser Ile Val Pro
35 40 45
Val His Trp Pro Gly Gly Gly Ser Phe Ser Val Ser Met Leu Thr Leu
50 55 60
Asp Ala Leu Tyr Asp Ile His Lys Leu Cys Arg Asn Trp Trp Thr Ser
65 70 75 80
Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr Lys Gly Cys Lys Ile Thr
85 90 95
Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile Val Arg Ile His Thr Glu
100 105 110
Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr Pro Asn Thr His Pro Leu
115 120 125
Met Met Met Met Ser Lys Tyr Lys His Ile Ile Pro Ser Arg Gln Thr
130 135 140
Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile Phe Val Lys Pro Pro Pro
145 150 155 160
Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr Asp Leu Tyr Lys Ile Pro
165 170 175
Leu Leu Gln Ile His Cys Thr Ala Cys Asn Leu Gln Asn Pro Phe Val
180 185 190
Lys Pro Asp Lys Leu Ser Asn Asn Val Thr Leu Trp Ser Leu Asn Thr
195 200 205
<210> 218
<211> 128
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 218
Ile Ser Ile Gln Asn Arg Asn Met Ser Val Asp Gln Gly Gln Ser Trp
1 5 10 15
Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe Tyr Phe Tyr Phe Tyr Thr
20 25 30
Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln Ile Pro Val Ala Asp Leu
35 40 45
Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg Pro Gly Gln Ser Leu Asn
50 55 60
Glu Ala Lys Ile Thr Asp His Ile Thr Phe Thr Glu Tyr Lys Asn Lys
65 70 75 80
Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn Lys His Ile Gln Glu His
85 90 95
Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser Pro Glu Ala Ile Lys Asn
100 105 110
Glu Trp Thr Thr Glu Asn Met Lys Trp Asn Gln Leu Asn Asn Ala Gly
115 120 125
<210> 219
<211> 163
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 219
Thr Met Ala Leu Thr Pro Phe Asn Glu Pro Ile Phe Thr Gln Ile Gln
1 5 10 15
Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp Thr Gln Leu Tyr Leu Leu
20 25 30
Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro Pro Gly Ile Pro Glu Leu
35 40 45
Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile Tyr Trp Gly Phe Ala Asp
50 55 60
Phe Gln Lys Asn Leu Lys Lys Val Thr Asn Ile Asp Thr Asn Tyr Met
65 70 75 80
Leu Val Ala Lys Thr Lys Phe Thr Gln Lys Pro Gly Thr Phe Tyr Leu
85 90 95
Val Ile Leu Asn Asp Thr Phe Val Glu Gly Asn Ser Pro Tyr Glu Lys
100 105 110
Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp Tyr Pro Gln Val Gln Tyr
115 120 125
Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln Thr Gly Pro Phe Thr Pro
130 135 140
Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile Ser Met Phe Tyr Lys Phe
145 150 155 160
Tyr Phe Lys
<210> 220
<211> 129
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 220
Trp Gly Gly Ser Pro Pro Lys Ala Ile Asn Val Glu Asn Pro Ala His
1 5 10 15
Gln Ile Gln Tyr Pro Ile Pro Arg Asn Glu His Glu Thr Thr Ser Leu
20 25 30
Gln Ser Pro Gly Glu Ala Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr
35 40 45
Arg His Gly Asn Tyr Thr Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp
50 55 60
Trp Ala Leu Lys Asp Thr Val Ser Lys Ile Thr Glu Pro Asp Arg Gln
65 70 75 80
Gln Leu Leu Lys Gln Ala Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr
85 90 95
Gln Glu Lys Lys Glu Lys Glu Val Gln Gln Leu Ile Ser Asn Leu Arg
100 105 110
Gln Gln Gln Gln Leu Tyr Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp
115 120 125
Gln
<210> 221
<400> 221
000
<210> 222
<400> 222
000
<210> 223
<400> 223
000
<210> 224
<400> 224
000
<210> 225
<400> 225
000
<210> 226
<400> 226
000
<210> 227
<211> 220
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多肽
<220>
<221> 经修饰的残基
<222> (29)..(31)
<223> 任何氨基酸
<220>
<221> 位点
<222> (29)..(31)
<223> 该区域可涵盖0-3个残基
<220>
<221> 经修饰的残基
<222> (100)..(100)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (125)..(129)
<223> 任何氨基酸
<220>
<221> 位点
<222> (125)..(129)
<223> 该区域可涵盖1-5个残基
<220>
<221> 经修饰的残基
<222> (181)..(181)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (211)..(211)
<223> 任何氨基酸
<400> 227
Leu Val Leu Thr Gln Trp Gln Pro Asn Thr Val Arg Arg Cys Tyr Ile
1 5 10 15
Arg Gly Tyr Leu Pro Leu Ile Ile Cys Gly Glu Asn Xaa Xaa Xaa Thr
20 25 30
Thr Ser Arg Asn Tyr Ala Thr His Ser Asp Asp Thr Ile Gln Lys Gly
35 40 45
Pro Phe Gly Gly Gly Met Ser Thr Thr Thr Phe Ser Leu Arg Val Leu
50 55 60
Tyr Asp Glu Tyr Gln Arg Phe Met Asn Arg Trp Thr Tyr Ser Asn Glu
65 70 75 80
Asp Leu Asp Leu Ala Arg Tyr Leu Gly Cys Lys Phe Thr Phe Tyr Arg
85 90 95
His Pro Asp Xaa Asp Phe Ile Val Gln Tyr Asn Thr Asn Pro Pro Phe
100 105 110
Lys Asp Thr Lys Leu Thr Ala Pro Ser Ile His Pro Xaa Xaa Xaa Xaa
115 120 125
Xaa Gly Met Leu Met Leu Ser Lys Arg Lys Ile Leu Ile Pro Ser Leu
130 135 140
Lys Thr Arg Pro Lys Gly Lys His Tyr Val Lys Val Arg Ile Gly Pro
145 150 155 160
Pro Lys Leu Phe Glu Asp Lys Trp Tyr Thr Gln Ser Asp Leu Cys Asp
165 170 175
Val Pro Leu Val Xaa Leu Tyr Ala Thr Ala Ala Asp Leu Gln His Pro
180 185 190
Phe Gly Ser Pro Gln Thr Asp Asn Pro Cys Val Thr Phe Gln Val Leu
195 200 205
Gly Ser Xaa Tyr Asn Lys His Leu Ser Ile Ser Pro
210 215 220
<210> 228
<211> 172
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多肽
<220>
<221> 经修饰的残基
<222> (38)..(38)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (44)..(46)
<223> 任何氨基酸
<220>
<221> 位点
<222> (44)..(46)
<223> 该区域可涵盖0-3个残基
<220>
<221> 经修饰的残基
<222> (77)..(77)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (79)..(79)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (98)..(101)
<223> 任何氨基酸
<220>
<221> 位点
<222> (98)..(101)
<223> 该区域可涵盖0-4个残基
<400> 228
Ser Asn Phe Glu Phe Pro Gly Ala Tyr Thr Asp Ile Thr Tyr Asn Pro
1 5 10 15
Leu Thr Asp Lys Gly Val Gly Asn Met Val Trp Ile Gln Tyr Leu Thr
20 25 30
Lys Pro Asp Thr Ile Xaa Asp Lys Thr Gln Ser Xaa Xaa Xaa Lys Cys
35 40 45
Leu Ile Glu Asp Leu Pro Leu Trp Ala Ala Leu Tyr Gly Tyr Val Asp
50 55 60
Phe Cys Glu Lys Glu Thr Gly Asp Ser Ala Ile Ile Xaa Asn Xaa Gly
65 70 75 80
Arg Val Leu Ile Arg Cys Pro Tyr Thr Lys Pro Pro Leu Tyr Asp Lys
85 90 95
Thr Xaa Xaa Xaa Xaa Asn Lys Gly Phe Val Pro Tyr Ser Thr Asn Phe
100 105 110
Gly Asn Gly Lys Met Pro Gly Gly Ser Gly Tyr Val Pro Ile Tyr Trp
115 120 125
Arg Ala Arg Trp Tyr Pro Thr Leu Phe His Gln Lys Glu Val Leu Glu
130 135 140
Asp Ile Val Gln Ser Gly Pro Phe Ala Tyr Lys Asp Glu Lys Pro Ser
145 150 155 160
Thr Gln Leu Val Met Lys Tyr Cys Phe Asn Phe Asn
165 170
<210> 229
<211> 258
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多肽
<220>
<221> 经修饰的残基
<222> (20)..(22)
<223> 任何氨基酸
<220>
<221> 位点
<222> (20)..(22)
<223> 该区域可涵盖0-3个残基
<220>
<221> 经修饰的残基
<222> (25)..(25)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (78)..(78)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (89)..(89)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (91)..(91)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (95)..(98)
<223> 任何氨基酸
<220>
<221> 位点
<222> (95)..(98)
<223> 该区域可涵盖1-4个残基
<220>
<221> 经修饰的残基
<222> (107)..(120)
<223> 任何氨基酸
<220>
<221> 位点
<222> (107)..(120)
<223> 该区域可涵盖2-14个残基
<220>
<221> 经修饰的残基
<222> (129)..(129)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (139)..(168)
<223> 任何氨基酸
<220>
<221> 位点
<222> (139)..(168)
<223> 该区域可涵盖0-30个残基
<220>
<221> 经修饰的残基
<222> (201)..(204)
<223> 任何氨基酸
<220>
<221> 位点
<222> (201)..(204)
<223> 该区域可涵盖0-4个残基
<220>
<221> 经修饰的残基
<222> (219)..(258)
<223> 任何氨基酸
<220>
<221> 位点
<222> (219)..(258)
<223> 该区域可涵盖0-40个残基
<400> 229
Trp Gly Gly Asn Pro Ile Ser Gln Gln Val Val Arg Asn Pro Cys Lys
1 5 10 15
Asp Ser Gly Xaa Xaa Xaa Ser Gly Xaa Gly Arg Gln Pro Arg Ser Val
20 25 30
Gln Val Val Asp Pro Lys Tyr Met Gly Pro Glu Tyr Thr Phe His Ser
35 40 45
Trp Asp Trp Arg Arg Gly Leu Phe Gly Glu Lys Ala Ile Lys Arg Met
50 55 60
Ser Glu Gln Pro Thr Asp Asp Glu Ile Phe Thr Gly Gly Xaa Pro Lys
65 70 75 80
Arg Pro Arg Arg Asp Pro Pro Thr Xaa Gln Xaa Pro Glu Glu Xaa Xaa
85 90 95
Xaa Xaa Gln Lys Glu Ser Ser Ser Phe Arg Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Trp Glu Ser Ser Ser Gln Glu
115 120 125
Xaa Glu Ser Glu Ser Gln Glu Glu Glu Glu Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Glu Gln Thr Val Gln Gln Gln Leu
165 170 175
Arg Gln Gln Leu Arg Glu Gln Arg Arg Leu Arg Val Gln Leu Gln Leu
180 185 190
Leu Phe Gln Gln Leu Leu Lys Thr Xaa Xaa Xaa Xaa Gln Ala Gly Leu
195 200 205
His Ile Asn Pro Leu Leu Leu Ser Gln Ala Xaa Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
225 230 235 240
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
245 250 255
Xaa Xaa
<210> 230
<211> 214
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多肽
<220>
<221> 经修饰的残基
<222> (136)..(136)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (138)..(141)
<223> 任何氨基酸
<220>
<221> 位点
<222> (138)..(141)
<223> 该区域可涵盖1-4个残基
<220>
<221> 经修饰的残基
<222> (179)..(179)
<223> 任何氨基酸
<400> 230
Leu Lys Gln Trp Gln Pro Ser Thr Ile Arg Lys Cys Lys Ile Lys Gly
1 5 10 15
Tyr Leu Pro Leu Phe Gln Cys Gly Lys Gly Arg Ile Ser Asn Asn Tyr
20 25 30
Thr Gln Tyr Lys Glu Ser Ile Val Pro His His Glu Pro Gly Gly Gly
35 40 45
Gly Trp Ser Ile Gln Gln Phe Thr Leu Gly Ala Leu Tyr Glu Glu His
50 55 60
Leu Lys Leu Arg Asn Trp Trp Thr Lys Ser Asn Asp Gly Leu Pro Leu
65 70 75 80
Val Arg Tyr Leu Gly Cys Thr Ile Lys Leu Tyr Arg Ser Glu Asp Thr
85 90 95
Asp Tyr Ile Val Thr Tyr Gln Arg Cys Tyr Pro Met Thr Ala Thr Lys
100 105 110
Leu Thr Tyr Leu Ser Thr Gln Pro Ser Arg Met Leu Met Asn Lys His
115 120 125
Lys Ile Ile Val Pro Ser Lys Xaa Thr Xaa Xaa Xaa Xaa Asn Lys Lys
130 135 140
Lys Lys Pro Tyr Lys Lys Ile Phe Ile Lys Pro Pro Ser Gln Met Gln
145 150 155 160
Asn Lys Trp Tyr Phe Gln Gln Asp Ile Ala Asn Thr Pro Leu Leu Gln
165 170 175
Leu Thr Xaa Thr Ala Cys Ser Leu Asp Arg Met Tyr Leu Ser Ser Asp
180 185 190
Ser Ile Ser Asn Asn Ile Thr Phe Thr Ser Leu Asn Thr Asn Phe Phe
195 200 205
Gln Asn Pro Asn Phe Gln
210
<210> 231
<211> 187
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多肽
<220>
<221> 经修饰的残基
<222> (1)..(10)
<223> 任何氨基酸
<220>
<221> 位点
<222> (1)..(10)
<223> 该区域可涵盖4-10个残基
<220>
<221> 经修饰的残基
<222> (38)..(45)
<223> 任何氨基酸
<220>
<221> 位点
<222> (38)..(45)
<223> 该区域可涵盖1-8个残基
<220>
<221> 经修饰的残基
<222> (94)..(94)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (100)..(102)
<223> 任何氨基酸
<220>
<221> 位点
<222> (100)..(102)
<223> 该区域可涵盖1-3个残基
<220>
<221> 经修饰的残基
<222> (112)..(112)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (114)..(115)
<223> 任何氨基酸
<220>
<221> 位点
<222> (114)..(115)
<223> 该区域可涵盖0-2个残基
<220>
<221> 经修饰的残基
<222> (124)..(139)
<223> 任何氨基酸
<220>
<221> 位点
<222> (124)..(139)
<223> 该区域可涵盖3-16个残基
<220>
<221> 经修饰的残基
<222> (154)..(154)
<223> 任何氨基酸
<400> 231
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Pro Leu Tyr Phe Glu
1 5 10 15
Cys Arg Tyr Asn Pro Phe Lys Asp Lys Gly Thr Gly Asn Lys Val Tyr
20 25 30
Leu Val Ser Asn Asn Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Gly Trp
35 40 45
Asp Pro Pro Thr Asp Pro Asp Leu Ile Ile Glu Gly Phe Pro Leu Trp
50 55 60
Leu Leu Leu Trp Gly Trp Leu Asp Trp Gln Lys Lys Leu Gly Lys Ile
65 70 75 80
Gln Asn Ile Asp Thr Asp Tyr Ile Leu Val Ile Gln Ser Xaa Tyr Tyr
85 90 95
Ile Pro Pro Xaa Xaa Xaa Lys Leu Pro Tyr Tyr Val Pro Leu Asp Xaa
100 105 110
Asp Xaa Xaa Phe Leu His Gly Arg Ser Pro Tyr Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Ser Asp Lys Gln
130 135 140
His Trp His Pro Lys Val Arg Phe Gln Xaa Glu Thr Ile Asn Asn Ile
145 150 155 160
Ala Leu Thr Gly Pro Gly Thr Pro Lys Leu Pro Asn Gln Lys Ser Ile
165 170 175
Gln Ala His Met Lys Tyr Lys Phe Tyr Phe Lys
180 185
<210> 232
<211> 163
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多肽
<220>
<221> 经修饰的残基
<222> (34)..(34)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (65)..(65)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (77)..(78)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (86)..(87)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (96)..(96)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (102)..(106)
<223> 任何氨基酸
<220>
<221> 位点
<222> (102)..(106)
<223> 该区域可涵盖0-5个残基
<220>
<221> 经修饰的残基
<222> (125)..(125)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (135)..(135)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (138)..(163)
<223> 任何氨基酸
<220>
<221> 位点
<222> (138)..(163)
<223> 该区域可涵盖0-26个残基
<400> 232
Trp Gly Gly Cys Pro Ala Pro Met Glu Thr Ile Thr Asp Pro Cys Lys
1 5 10 15
Gln Pro Lys Tyr Pro Ile Pro Asn Asn Leu Leu Gln Thr Thr Ser Leu
20 25 30
Gln Xaa Pro Thr Thr Pro Ile Glu Thr Tyr Leu Tyr Lys Phe Asp Glu
35 40 45
Arg Arg Gly Leu Leu Thr Lys Lys Ala Ala Lys Arg Ile Lys Lys Asp
50 55 60
Xaa Thr Thr Glu Thr Thr Leu Phe Thr Asp Thr Gly Xaa Xaa Thr Ser
65 70 75 80
Thr Thr Leu Pro Thr Xaa Xaa Gln Thr Glu Thr Thr Gln Glu Glu Xaa
85 90 95
Thr Ser Glu Glu Glu Xaa Xaa Xaa Xaa Xaa Glu Thr Leu Leu Gln Gln
100 105 110
Leu Gln Gln Leu Arg Arg Lys Gln Lys Gln Leu Arg Xaa Arg Ile Leu
115 120 125
Gln Leu Leu Gln Leu Leu Xaa Leu Leu Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
145 150 155 160
Xaa Xaa Xaa
<210> 233
<211> 203
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多肽
<220>
<221> 经修饰的残基
<222> (79)..(79)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (104)..(104)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (116)..(116)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (120)..(121)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (125)..(125)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (170)..(170)
<223> 任何氨基酸
<400> 233
Thr Ile Pro Leu Lys Gln Trp Gln Pro Glu Ser Ile Arg Lys Cys Lys
1 5 10 15
Ile Lys Gly Tyr Gly Thr Leu Val Leu Gly Ala Glu Gly Arg Gln Phe
20 25 30
Tyr Cys Tyr Thr Asn Glu Lys Asp Glu Tyr Thr Pro Pro Lys Ala Pro
35 40 45
Gly Gly Gly Gly Phe Gly Val Glu Leu Phe Ser Leu Glu Tyr Leu Tyr
50 55 60
Glu Gln Trp Lys Ala Arg Asn Asn Ile Trp Thr Lys Ser Asn Xaa Tyr
65 70 75 80
Lys Asp Leu Cys Arg Tyr Thr Gly Cys Lys Ile Thr Phe Tyr Arg His
85 90 95
Pro Thr Thr Asp Phe Ile Val Xaa Tyr Ser Arg Gln Pro Pro Phe Glu
100 105 110
Ile Asp Lys Xaa Thr Tyr Met Xaa Xaa His Pro Gln Xaa Leu Leu Leu
115 120 125
Arg Lys His Lys Lys Ile Ile Leu Ser Lys Ala Thr Asn Pro Lys Gly
130 135 140
Lys Leu Lys Lys Lys Ile Lys Ile Lys Pro Pro Lys Gln Met Leu Asn
145 150 155 160
Lys Trp Phe Phe Gln Lys Gln Phe Ala Xaa Tyr Gly Leu Val Gln Leu
165 170 175
Gln Ala Ala Ala Cys Asx Leu Arg Tyr Pro Arg Leu Gly Cys Cys Asn
180 185 190
Glu Asn Arg Leu Ile Thr Leu Tyr Tyr Leu Asn
195 200
<210> 234
<211> 162
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多肽
<220>
<221> 经修饰的残基
<222> (12)..(12)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (20)..(20)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (23)..(23)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (30)..(30)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (58)..(58)
<223> I或L
<220>
<221> 经修饰的残基
<222> (84)..(84)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (90)..(90)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (95)..(95)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (105)..(105)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (111)..(111)
<223> I或L
<220>
<221> 经修饰的残基
<222> (113)..(113)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (154)..(154)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (156)..(156)
<223> 任何氨基酸
<400> 234
Leu Pro Ile Val Val Ala Arg Tyr Asn Pro Ala Xaa Asp Thr Gly Lys
1 5 10 15
Gly Asn Lys Xaa Trp Leu Xaa Ser Thr Leu Asn Gly Ser Xaa Trp Ala
20 25 30
Pro Pro Thr Thr Asp Lys Asp Leu Ile Ile Glu Gly Leu Pro Leu Trp
35 40 45
Leu Ala Leu Tyr Gly Tyr Trp Ser Tyr Xaa Lys Lys Val Lys Lys Asp
50 55 60
Lys Gly Ile Leu Gln Ser His Met Phe Val Val Lys Ser Pro Ala Ile
65 70 75 80
Gln Pro Leu Xaa Thr Ala Thr Thr Gln Xaa Thr Phe Tyr Pro Xaa Ile
85 90 95
Asp Asn Ser Phe Ile Gln Gly Lys Xaa Pro Tyr Asp Glu Pro Xaa Thr
100 105 110
Xaa Asn Gln Lys Lys Leu Trp Tyr Pro Thr Leu Glu His Gln Gln Glu
115 120 125
Thr Ile Asn Ala Ile Val Glu Ser Gly Pro Tyr Val Pro Lys Leu Asp
130 135 140
Asn Gln Lys Asn Ser Thr Trp Glu Leu Xaa Tyr Xaa Tyr Thr Phe Tyr
145 150 155 160
Phe Lys
<210> 235
<211> 177
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多肽
<220>
<221> 经修饰的残基
<222> (16)..(16)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (26)..(26)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (33)..(33)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (73)..(73)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (81)..(82)
<223> 任何氨基酸
<220>
<221> 位点
<222> (81)..(82)
<223> 该区域可涵盖0-2个残基
<220>
<221> 经修饰的残基
<222> (90)..(90)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (94)..(94)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (119)..(124)
<223> 任何氨基酸
<220>
<221> 位点
<222> (119)..(124)
<223> 该区域可涵盖1-6个残基
<220>
<221> 经修饰的残基
<222> (168)..(177)
<223> 任何氨基酸
<220>
<221> 位点
<222> (168)..(177)
<223> 该区域可涵盖1-10个残基
<400> 235
Trp Gly Gly Pro Gln Ile Pro Asp Gln Pro Val Glu Asp Pro Lys Xaa
1 5 10 15
Gln Gly Thr Tyr Pro Val Pro Asp Thr Xaa Gln Gln Thr Ile Gln Ile
20 25 30
Xaa Asn Pro Leu Lys Gln Lys Pro Glu Thr Met Phe His Asp Trp Asp
35 40 45
Tyr Arg Arg Gly Ile Ile Thr Ser Thr Ala Leu Lys Arg Met Gln Glu
50 55 60
Asn Leu Glu Thr Asp Ser Ser Phe Xaa Ser Asp Ser Glu Glu Thr Pro
65 70 75 80
Xaa Xaa Lys Lys Lys Lys Arg Leu Thr Xaa Glu Leu Pro Xaa Pro Gln
85 90 95
Glu Glu Thr Glu Glu Ile Gln Ser Cys Leu Leu Ser Leu Cys Glu Glu
100 105 110
Ser Thr Cys Gln Glu Glu Xaa Xaa Xaa Xaa Xaa Xaa Glu Asn Leu Gln
115 120 125
Gln Leu Ile His Gln Gln Gln Gln Gln Gln Gln Gln Leu Lys His Asn
130 135 140
Ile Leu Lys Leu Leu Ser Asp Leu Lys Glx Lys Gln Arg Leu Leu Gln
145 150 155 160
Leu Gln Thr Gly Ile Leu Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
165 170 175
Xaa
<210> 236
<400> 236
000
<210> 237
<400> 237
000
<210> 238
<400> 238
000
<210> 239
<400> 239
000
<210> 240
<400> 240
000
<210> 241
<400> 241
000
<210> 242
<400> 242
000
<210> 243
<400> 243
000
<210> 244
<400> 244
000
<210> 245
<400> 245
000
<210> 246
<400> 246
000
<210> 247
<400> 247
000
<210> 248
<400> 248
000
<210> 249
<400> 249
000
<210> 250
<400> 250
000
<210> 251
<400> 251
000
<210> 252
<400> 252
000
<210> 253
<400> 253
000
<210> 254
<400> 254
000
<210> 255
<400> 255
000
<210> 256
<400> 256
000
<210> 257
<400> 257
000
<210> 258
<400> 258
000
<210> 259
<400> 259
000
<210> 260
<400> 260
000
<210> 261
<400> 261
000
<210> 262
<400> 262
000
<210> 263
<400> 263
000
<210> 264
<400> 264
000
<210> 265
<400> 265
000
<210> 266
<400> 266
000
<210> 267
<400> 267
000
<210> 268
<400> 268
000
<210> 269
<400> 269
000
<210> 270
<400> 270
000
<210> 271
<400> 271
000
<210> 272
<400> 272
000
<210> 273
<400> 273
000
<210> 274
<400> 274
000
<210> 275
<400> 275
000
<210> 276
<400> 276
000
<210> 277
<400> 277
000
<210> 278
<400> 278
000
<210> 279
<400> 279
000
<210> 280
<400> 280
000
<210> 281
<400> 281
000
<210> 282
<400> 282
000
<210> 283
<400> 283
000
<210> 284
<400> 284
000
<210> 285
<400> 285
000
<210> 286
<400> 286
000
<210> 287
<400> 287
000
<210> 288
<400> 288
000
<210> 289
<400> 289
000
<210> 290
<400> 290
000
<210> 291
<400> 291
000
<210> 292
<400> 292
000
<210> 293
<400> 293
000
<210> 294
<400> 294
000
<210> 295
<400> 295
000
<210> 296
<400> 296
000
<210> 297
<400> 297
000
<210> 298
<400> 298
000
<210> 299
<400> 299
000
<210> 300
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 300
gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60
agcuacacaa aauggu 76
<210> 301
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 301
gcguacguca caagucacgu ggaggggacc cgcuguaacc cggaaguagg ccccgucacg 60
ugacuuacca cgugugua 78
<210> 302
<211> 77
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 302
gccauuuuaa guagcugacg ucaaggauug acgugaaggu uaaaggucau ccucggcgga 60
agcuacacaa aauggug 77
<210> 303
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 303
gcacacguca uaagucacgu gguggggacc cgcuguaacc cggaaguagg ccccgucacg 60
ugauuuguca cgugugua 78
<210> 304
<211> 66
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 304
cuuccggguc auaggucaca ccuacgucac aagucacgug gggaggguug gcguauagcc 60
cggaag 66
<210> 305
<211> 68
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 305
gccggggggc ugccgccccc cccggggaaa ggggggggcc ccccccgggg ggggguuugc 60
cccccggc 68
<210> 306
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 306
auacgucauc agucacgugg gggaaggcgu gccuaaaccc ggaagcaucc ucguccacgu 60
gacugugacg uguguggc 78
<210> 307
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 307
cauuuuaagu aaggcggaag cagcucggcg uacacaaaau ggcggcggag cacuuccggc 60
uugcccaaaa ugg 73
<210> 308
<211> 71
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 308
gucacaaguc acguggggag gguuggcguu uaacccggaa gccaauccuc uuacguggcc 60
ugucacguga c 71
<210> 309
<211> 70
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 309
cgaccgcguc ccgaaggcgg guacccgagg ugaguuuaca caccgagguu aagggccaau 60
ucgggcuugg 70
<210> 310
<211> 59
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 310
cgcgguaucg uagccgacgc ggaccccguu uucggggccc ccgcggggcu cucggcgcg 59
<210> 311
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 311
cgccauuuug ugauacgcgc guccccuccc ggcuuccgua caacgucagg cggggcgugg 60
ccguaucaga aaauggcg 78
<210> 312
<211> 77
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 312
gcuacgucau aagucacgug acugggcagg uacuaaaccc ggaaguaucc ucggucacgu 60
ggccugucac guaguug 77
<210> 313
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 313
ggcusugacg ucaaagucac gugggraggg uggcguuaaa cccggaaguc auccucguca 60
cgugaccuga cgucacagcc 80
<210> 314
<211> 66
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 314
gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60
gaaggu 66
<210> 315
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 315
gguugugacg ucaaagucac guggggaggg cggcguuaaa cccggaaguc auccucguca 60
cgugaccuga cgucacggcc 80
<210> 316
<211> 67
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 316
gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60
guaggug 67
<210> 317
<211> 67
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 317
gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60
guaggug 67
<210> 318
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 318
ggcugugacg ucaaagucac guggggaggg cggcguuaaa cccggaaguc auccucguca 60
cgugaccuga cgucacggcc 80
<210> 319
<211> 79
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 319
agaccacgug guaagucacg ugggggcagc ugcuguaaac ccggaaguag cugacccgcg 60
ugacugguca cgugaccug 79
<210> 320
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 320
cgccauuuua uaauacgcgc guccccuccc ggcuuccgua cuacgucagg cggggcgugg 60
ccguauuaga aaauggug 78
<210> 321
<211> 72
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 321
uaaguaaggc ggaaccaggc ugucacccug ugucaaaggu caagggacag ccuuccggcu 60
ugcacaaaau gg 72
<210> 322
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 322
ugccuacguc auaagucacg uggggacggc ugcuguaaac acggaaguag cugacccgcg 60
ugacuuguca cgugagca 78
<210> 323
<211> 72
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 323
uuguguaagg cggaacaggc ugacaccccg ugucaaaggu caggggucag ccuccgcuuu 60
gcaccaaaug gu 72
<210> 324
<211> 79
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 324
uaccuacguc auaagucacg ugggaagagc ugcugugaac cuggaaguag cugacccgcg 60
uggcuuguca cgugagugc 79
<210> 325
<211> 75
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 325
uuuuccuggc ccguccgcgg cgagagcgcg agcgaagcga gcgaucgggc gucccgaggg 60
cgggugccgg aggug 75
<210> 326
<211> 68
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 326
aaagugagug gggccagacu ucgccauagg gccuuuaacu uccgggugcg ucugggggcc 60
gccauuuu 68
<210> 327
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 327
gugacguuac ucucacguga ugggggcgug cucuaacccg gaagcauccu cgaccacgug 60
acugugacgu cac 73
<210> 328
<211> 75
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 328
agcgucuacu acguacacuu ccuggggugu guccugccac uguauauaaa ccagaggggu 60
gacgaauggu agagu 75
<210> 329
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 329
gugacgucaa agucacgugg ugacggccau uuuaacccgg aaguggcugu ugucacguga 60
cuugacguca cgg 73
<210> 330
<211> 62
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 330
gcuuuagacg ccauuuuagg cccucgcggg cacccguagg cgcguuuuaa ugacgucacg 60
gc 62
<210> 331
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 331
cacccguagg cgcguuuuaa ugacgucacg gcagccauuu ugucgugacg uuugagacac 60
gugauggggg cgu 73
<210> 332
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 332
gucgugacgu uugagacacg ugaugggggc gugccuaaac ccggaagcau cccuggucac 60
gugacucuga cgucacggcg 80
<210> 333
<211> 77
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 333
cgaaagugag uggggccaga cuucgccaua aggccuuuaa cuuccgggug cguguggggg 60
ccgccauuuu agcuucg 77
<210> 334
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 334
cugugacguc aaagucacgu ggggagggcg gcguguaacc cggaagucau ccucgucacg 60
ugaccugacg ucacgg 76
<210> 335
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 335
cuguccgcca ucuugugacu uccuuccgcu uuuucaaaaa aaaagaggaa guaugacgua 60
gcggcggggg ggc 73
<210> 336
<211> 67
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 336
gguagaguuu uuuccgcccg uccgcagcga ggacgcgagc gcagcgagcg gccgagcgac 60
ccguggg 67
<210> 337
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 337
gcugugacgu uucagucacg uggggaggga acgccuaaac ccggaagcgu cccuggucac 60
gugauuguga cgucacggcc 80
<210> 338
<211> 63
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 338
ccgccauuuu gugacuuccu uccgcuuuuu caaaaaaaaa gaggaagugu gacguagcgg 60
cgg 63
<210> 339
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 339
gacugugacg ucaaagucac guggggaggg cggcguguaa cccggaaguc auccucguca 60
cgugaccuga cgucacgg 78
<210> 340
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 340
cuguccgcca ucuugugacu uccuuccgcu uuuucaaaaa aaaagaggaa guaugacgug 60
gcggcggggg ggc 73
<210> 341
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 341
gguugugacg ucaaagucac guggggaggg cggcguguaa cccggaaguc auccucguca 60
cgugaccuga cgucacggcc 80
<210> 342
<211> 65
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 342
cccgccaucu ugugacuucc uuccgcuuuu ucaaaaaaaa agaggaagug ugacguagcg 60
gcggg 65
<210> 343
<211> 67
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 343
gcccguccgc ggcgagagcg cgagcgaagc gagcgaucga gcgucccgug ggcgggugcc 60
guaggug 67
<210> 344
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 344
gacugugacg ucaaagucac guggggagga gggcguguaa cccggaaguc auccucguca 60
cgugaccuga cgucacgg 78
<210> 345
<211> 62
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 345
ucgcgucuua gugacgucac ggcagccauc uugguccuga cgucacuguc acguggggag 60
gg 62
<210> 346
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 346
ugacgucacu gucacguggg gagggaacac gugaacccgg aagugucccu ggucacguga 60
caugacguca cggccg 76
<210> 347
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 347
cgccauuuua aguaagcaug gcgggcggug augucaaaug uuaaagguca cagccgguca 60
ugcuugcaca aaauggcg 78
<210> 348
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 348
cgccauuuua aguaagcaug gcgggcggug acgugcaaug ucaaagguca cagccuguca 60
ugcuugcaca aaauggcg 78
<210> 349
<211> 72
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 349
ccaucuuaag uaguugaggc ggacgguggc gucgguucaa aggucaccau cagccacacc 60
uacucaaaau gg 72
<210> 350
<211> 67
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 350
gccugucaug cuugcacaaa auggcggacu uccgcuuccg ggucgccgcc auauuugguc 60
acgugac 67
<210> 351
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 351
gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60
agcuacacaa aauggu 76
<210> 352
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 352
gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60
agcuacacaa aauggu 76
<210> 353
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 353
gcauacguca caagucacgu gggggggacc cgcuguaacc cggaaguagg ccccgucacg 60
ugacuuacca cgugugua 78
<210> 354
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 354
gccauuuuaa guagcugacg ucaaggauug acgugaaggu uaaaggucau ccucggcgga 60
agcuacacaa aauggu 76
<210> 355
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 355
gcacacguca uaagucacgu gguggggacc cgcuguaacc cggaaguagg ccccgucacg 60
ugauuuguca cgugugua 78
<210> 356
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 356
gccauuuuaa gucagcucug gggaggcgug acuuccaguu caaaggucau ccucaccaua 60
acuggcacaa aauggc 76
<210> 357
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 357
gccauuuuaa guagcugacg ucaaggauug acguaaaggu uaaaggucau ccucggcgga 60
agcuacacaa aauggu 76
<210> 358
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 358
gcauacguca caagucacgu ggaggggaca cgcuguaacc cggaaguagg ccccgucacg 60
ugacuuacca cgugugua 78
<210> 359
<211> 79
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 359
gcgccauguu aaguggcugu cgccgaggau ugacgucaca guucaaaggu cauccucgac 60
gguaaccgca aacauggcg 79
<210> 360
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 360
caugcgucau aagucacaug acaggggucc acuuaaacac ggaaguaggc cccgacaugu 60
gacucgucac gugugu 76
<210> 361
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 361
uggcagcacu uccgaauggc ugaguuuucc acgcccgucc gcggagaggg agccacggag 60
gugaucccga acg 73
<210> 362
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 362
gccauuuuaa gucagcgcug gggaggcaug acuguaaguu caaaggucau ccucaccgga 60
acugacacaa aauggccg 78
<210> 363
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 363
gccaucuuaa guggcugucg ccgaggauug acgucacagu ucaaagguca uccucggcgg 60
uaaccgcaaa gauggcgguc 80
<210> 364
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 364
auacgucaua agucacaugu cuaggggucc acuuaaacac ggaaguaggc cccgacaugu 60
gacucgucac gugugu 76
<210> 365
<211> 77
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 365
ccauuuuaag uaaggcggaa gcagcugucc cuguaacaaa auggcggcga cagccuuccg 60
cuuugcacaa aauggag 77
<210> 366
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 366
gccaucuuaa guggcugucg cugaggauug acgucacagu ucaaagguca uccucggcgg 60
uaaccgcaaa gauggcgguc 80
<210> 367
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 367
cauacgucau aagucacaug acaggagucc acuuaaacac ggaaguaggc cccgacaugu 60
gacucgucac gugugu 76
<210> 368
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 368
cgccaucuua aguggcuguc gccgaggauu ggcgucacag uucaaagguc auccucggcg 60
guaaccgcaa agauggcggu 80
<210> 369
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 369
cauacgucau aagucacaug acaggggucc acuuaaacac ggaaguaggc cccgacaugu 60
gacucgucac gugugu 76
<210> 370
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 370
gcauacguca caagucacgu gggggggacc cgcuguaacc cggaaguagg ccccgucacg 60
ugacuuacca cguggugu 78
<210> 371
<211> 77
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 371
ccgccauuuu aggcuguugc cgggcguuug acuuccgugu uaaaggucaa acacccagcg 60
acaccaaaaa auggccg 77
<210> 372
<211> 77
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 372
cuacgucaua agucacguga cagggagggg cgacaaaccc ggaagucauc cucgcccacg 60
ugacuuacca cguggug 77
<210> 373
<211> 77
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 373
gccauuuuaa guaggugacg uccaggacug acguaaaguu caaaggucau ccucggcgga 60
accuauacaa aauggcg 77
<210> 374
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 374
cuacgucaua agucacgugg ggacggcugu acuuaaacac ggaaguaggc cccgucacgu 60
gauuuaccac guggug 76
<210> 375
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 375
gccauuuuaa guaaggcgga agagcucuag cuauacaaaa uggcggcgga gcacuuccgc 60
uuugcccaaa aug 73
<210> 376
<211> 77
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 376
gccauuuuaa guagcugacg ucaaggauug acguagaggu uaaaggucau ccucggcgga 60
agcuacacaa aauggug 77
<210> 377
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 377
gcauacguca caagucacgu gggggggacc cgcuguaacc cggaaguagg ccccgucacg 60
ugacuuacca cgugugua 78
<210> 378
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 378
ggcgccauuu uaaguaagca uggcgggcgg cgacgucaca ugucaaaggu caccgcacuu 60
ccgugcuugc acaaaauggc 80
<210> 379
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 379
ugcuacguca ucgagacacg uggugccagc agcuguaaac ccggaagucg cugacacacg 60
ugucuuguca cgu 73
<210> 380
<211> 78
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 380
gccauuuuaa guaagcaccg ccuagggaug acguauaagu ucaaagguca uccucagccg 60
gaacuuacac aaaauggu 78
<210> 381
<211> 72
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 381
acgucauaug ucacgugggg aggcccugcu gcgcaaacgc ggaaguaggc cccgucacgu 60
gucauaccac gu 72
<210> 382
<211> 77
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 382
ccauuuuaag uaaggcggaa gcagcuccac uuucucacaa aauggcggcg gggcacuucc 60
ggcuugccca aaauggc 77
<210> 383
<211> 72
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 383
ccauuuuaag uaaggcggaa guuucuccac uauacaaaau ggcggcggag cacuuccggc 60
uugcccaaaa ug 72
<210> 384
<211> 72
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 384
ccaucuuaag uaguugaggc ggacgguggc gugaguucaa aggucaccau cagccacacc 60
uacucaaaau gg 72
<210> 385
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 385
cgccaucuua aguaguugag gcggacggug gcgugaguuc aaaggucacc aucagccaca 60
ccuacucaaa auggug 76
<210> 386
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 386
uuucggaccu ucggcgucgg gggggucggg ggcuuuacua aacagacucc gagaugccau 60
uggacacuga ggg 73
<210> 387
<211> 76
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 387
ccauuuuaag uaggugccgu ccagcacugc uguuccgggu uaaagggcau ccucggcgga 60
accuauacaa aauggc 76
<210> 388
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 388
cuacgucauc gaugacgugg ggaggcguac uaugaaacgc ggaaguaggc cccgcuacgu 60
caucaucacg ugg 73
<210> 389
<211> 73
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 389
ccauuuuaag uaaggcggaa gagcugcucu auauacaaaa uggcggagga gcacuuccgg 60
cuugcccaaa aug 73
<210> 390
<211> 75
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 390
ugccuacgua acaagucacg uggggagggu uggcguauaa cccggaaguc aauccuccca 60
cguggccugu cacgu 75
<210> 391
<211> 72
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 391
uaaguaaggc ggaaccaggc ugucaccccg ugucaaaggu caggggucag ccuuccgcuu 60
uacacaaaau gg 72
<210> 392
<211> 72
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 392
uaaguaaggc ggaaccaggc ugucaccccg ugucaaaggu caggggucag ccuuccgcuu 60
uacacaaaau gg 72
<210> 393
<211> 80
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 393
gcagccauuu uaagucagcu ucggggaggg ucacgcaaag uucaaagguc auccucaccg 60
gaacugguac aaaauggccg 80
<210> 394
<211> 74
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 394
ugcuacguca uaagugacgu agcugguguc ugcuguaaac acggaaguag gccccgccac 60
gucacuuguc acgu 74
<210> 395
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 395
aguagcugac gucaaggauu gac 23
<210> 396
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 396
caagucacgu ggaggggacc cg 22
<210> 397
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 397
aaguagcuga cgucaaggau ugacg 25
<210> 398
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 398
auaagucacg ugguggggac ccg 23
<210> 399
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 399
uggggagggu uggcguauag cccgga 26
<210> 400
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 400
ccccccccgg ggggggguuu gccc 24
<210> 401
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 401
aucagucacg ugggggaagg cgugc 25
<210> 402
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 402
aaguaaggcg gaagcagcuc gg 22
<210> 403
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 403
agucacgugg ggaggguugg c 21
<210> 404
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 404
cccgaaggcg gguacccgag gu 22
<210> 405
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 405
uaucguagcc gacgcggacc ccg 23
<210> 406
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 406
auuuugugau acgcgcgucc ccuccc 26
<210> 407
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 407
aagucacgug acugggcagg u 21
<210> 408
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 408
ugacgucaaa gucacguggg ragggu 26
<210> 409
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 409
gaucgagcgu cccgugggcg ggu 23
<210> 410
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 410
ugacgucaaa gucacguggg gagggcgg 28
<210> 411
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 411
gaucgagcgu cccgugggcg ggu 23
<210> 412
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 412
gaucgagcgu cccgugggcg ggu 23
<210> 413
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 413
ugacgucaaa gucacguggg gagggcgg 28
<210> 414
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 414
acgugguaag ucacgugggg gcagcu 26
<210> 415
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 415
auuuuauaau acgcgcgucc ccucc 25
<210> 416
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 416
aagggacagc cuuccggcuu gc 22
<210> 417
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 417
cauaagucac guggggacgg cugcu 25
<210> 418
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 418
uaaggcggaa caggcugaca cccc 24
<210> 419
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 419
uacgucauaa gucacguggg aagagcug 28
<210> 420
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 420
ucgggcgucc cgagggcggg ug 22
<210> 421
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 421
aaagugagug gggccagacu ucgcc 25
<210> 422
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 422
cucucacgug augggggcgu gc 22
<210> 423
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 423
ucuacuacgu acacuuccug gggugugu 28
<210> 424
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 424
uggcuguugu cacgugacuu ga 22
<210> 425
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 425
agacgccauu uuaggcccuc gcgg 24
<210> 426
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 426
ugucgugacg uuugagacac gugau 25
<210> 427
<211> 30
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 427
ugacguuuga gacacgugau gggggcgugc 30
<210> 428
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 428
agugaguggg gccagacuuc gc 22
<210> 429
<211> 30
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 429
ugugacguca aagucacgug gggagggcgg 30
<210> 430
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 430
aaaagaggaa guaugacgua gcggcgg 27
<210> 431
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 431
agcgagcggc cgagcgaccc g 21
<210> 432
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 432
uucagucacg uggggaggga acgc 24
<210> 433
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 433
aaaagaggaa gugugacgua gcgg 24
<210> 434
<211> 30
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 434
ugugacguca aagucacgug gggagggcgg 30
<210> 435
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 435
aaaagaggaa guaugacgug gcgg 24
<210> 436
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 436
ugacgucaaa gucacguggg gagggcgg 28
<210> 437
<211> 29
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 437
aaaaaagagg aagugugacg uagcggcgg 29
<210> 438
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 438
gaucgagcgu cccgugggcg ggu 23
<210> 439
<211> 30
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 439
ugugacguca aagucacgug gggaggaggg 30
<210> 440
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 440
uugguccuga cgucacuguc a 21
<210> 441
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 441
cgucacuguc acguggggag ggaacac 27
<210> 442
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 442
uaaguaagca uggcgggcgg ugau 24
<210> 443
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 443
aaguaagcau ggcgggcggu ga 22
<210> 444
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 444
uaaguaguug aggcggacgg uggc 24
<210> 445
<211> 29
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 445
ucaugcuugc acaaaauggc ggacuuccg 29
<210> 446
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 446
aguagcugac gucaaggauu gac 23
<210> 447
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 447
aguagcugac gucaaggauu gac 23
<210> 448
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 448
acaagucacg ugggggggac ccg 23
<210> 449
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 449
aaguagcuga cgucaaggau ugacg 25
<210> 450
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 450
auaagucacg ugguggggac ccg 23
<210> 451
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 451
aagucagcuc uggggaggcg ugacuu 26
<210> 452
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 452
aguagcugac gucaaggauu gac 23
<210> 453
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 453
caagucacgu ggaggggaca cg 22
<210> 454
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 454
uguuaagugg cugucgccga ggauuga 27
<210> 455
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 455
uaagucacau gacagggguc ca 22
<210> 456
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 456
cggagaggga gccacggagg ug 22
<210> 457
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 457
aagucagcgc uggggaggca uga 23
<210> 458
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 458
ucuuaagugg cugucgccga ggauugac 28
<210> 459
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 459
aagucacaug ucuagggguc cacu 24
<210> 460
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 460
aaguaaggcg gaagcagcug ucc 23
<210> 461
<211> 29
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 461
aucuuaagug gcugucgcug aggauugac 29
<210> 462
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 462
uaagucacau gacaggaguc cacu 24
<210> 463
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 463
aaguggcugu cgccgaggau ug 22
<210> 464
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 464
uaagucacau gacagggguc ca 22
<210> 465
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 465
acaagucacg ugggggggac ccg 23
<210> 466
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 466
auuuuaggcu guugccgggc guuugacu 28
<210> 467
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 467
auaagucacg ugacagggag ggg 23
<210> 468
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 468
aaguagguga cguccaggac u 21
<210> 469
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 469
cauaagucac guggggacgg cugu 24
<210> 470
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 470
uaaguaaggc ggaagagcuc uagcua 26
<210> 471
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 471
aguagcugac gucaaggauu gac 23
<210> 472
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 472
acaagucacg ugggggggac ccg 23
<210> 473
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 473
uaaguaagca uggcgggcgg cgac 24
<210> 474
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 474
aucgagacac guggugccag cagcu 25
<210> 475
<211> 30
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 475
ucauccucag ccggaacuua cacaaaaugg 30
<210> 476
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 476
auaugucacg uggggaggcc cugcug 26
<210> 477
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 477
aaguaaggcg gaagcagcuc cacuuu 26
<210> 478
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 478
aaguaaggcg gaaguuucuc cacu 24
<210> 479
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 479
uaaguaguug aggcggacgg uggc 24
<210> 480
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 480
uaaguaguug aggcggacgg ugg 23
<210> 481
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 481
gaccuucggc gucggggggg ucggggg 27
<210> 482
<211> 19
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 482
auccucggcg gaaccuaua 19
<210> 483
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 483
aucgaugacg uggggaggcg uacuau 26
<210> 484
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 484
uggcggagga gcacuuccgg cuug 24
<210> 485
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 485
aacaagucac guggggaggg uuggc 25
<210> 486
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 486
aggggucagc cuuccgcuuu a 21
<210> 487
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 487
aggggucagc cuuccgcuuu a 21
<210> 488
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 488
uaagucagcu ucggggaggg ucac 24
<210> 489
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 489
ucauaaguga cguagcuggu gucugcu 27
<210> 490
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 490
cauccucggc ggaagcuaca caa 23
<210> 491
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 491
ggccccguca cgugacuuac cac 23
<210> 492
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 492
ucauccucgg cggaagcuac acaa 24
<210> 493
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 493
ggccccguca cgugauuugu cac 23
<210> 494
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 494
ccgggucaua ggucacaccu acgucac 27
<210> 495
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 495
ggcugccgcc ccccccgggg aaaggggg 28
<210> 496
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 496
auccucgucc acgugacugu ga 22
<210> 497
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 497
gagcacuucc ggcuugccca a 21
<210> 498
<211> 20
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 498
caauccucuu acguggccug 20
<210> 499
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 499
cgagguuaag ggccaauucg ggcu 24
<210> 500
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 500
gggcccccgc ggggcucucg gcg 23
<210> 501
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 501
gcggggcgug gccguaucag aaaaugg 27
<210> 502
<211> 19
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 502
ccucggucac guggccugu 19
<210> 503
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 503
ccucgucacg ugaccugacg ucacag 26
<210> 504
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 504
ccguccgcgg cgagagcgcg agcga 25
<210> 505
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 505
auccucguca cgugaccuga cgucacg 27
<210> 506
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 506
ccguccgcgg cgagagcgcg agcga 25
<210> 507
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 507
ccguccgcgg cgagagcgcg agcga 25
<210> 508
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 508
auccucguca cgugaccuga cgucacg 27
<210> 509
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 509
cugacccgcg ugacugguca cguga 25
<210> 510
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 510
cggggcgugg ccguauuaga aaaugg 26
<210> 511
<211> 29
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 511
aguaaggcgg aaccaggcug ucacccugu 29
<210> 512
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 512
uagcugaccc gcgugacuug ucac 24
<210> 513
<211> 19
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 513
ggucagccuc cgcuuugca 19
<210> 514
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 514
gcugacccgc guggcuuguc acgugagu 28
<210> 515
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 515
ggcccguccg cggcgagagc gcgag 25
<210> 516
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 516
uccgggugcg ucugggggcc gccauuu 27
<210> 517
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 517
auccucgacc acgugacugu g 21
<210> 518
<211> 30
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 518
auaaaccaga ggggugacga augguagagu 30
<210> 519
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 519
caaagucacg uggugacggc cau 23
<210> 520
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 520
guaggcgcgu uuuaaugacg ucacgg 26
<210> 521
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 521
uaggcgcguu uuaaugacgu cacggcag 28
<210> 522
<211> 29
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 522
aucccugguc acgugacucu gacgucacg 29
<210> 523
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 523
gcgugugggg gccgccauuu uagcuu 26
<210> 524
<211> 29
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 524
ucauccucgu cacgugaccu gacgucacg 29
<210> 525
<211> 29
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 525
cgccaucuug ugacuuccuu ccgcuuuuu 29
<210> 526
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 526
uagaguuuuu uccgcccguc cg 22
<210> 527
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 527
gucccugguc acgugauugu gac 23
<210> 528
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 528
cauuuuguga cuuccuuccg cuuuuu 26
<210> 529
<211> 29
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 529
ucauccucgu cacgugaccu gacgucacg 29
<210> 530
<211> 30
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 530
ccgccaucuu gugacuuccu uccgcuuuuu 30
<210> 531
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 531
auccucguca cgugaccuga cgucacg 27
<210> 532
<211> 30
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 532
cgccaucuug ugacuuccuu ccgcuuuuuc 30
<210> 533
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 533
ccguccgcgg cgagagcgcg agcga 25
<210> 534
<211> 29
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 534
ucauccucgu cacgugaccu gacgucacg 29
<210> 535
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 535
cuuagugacg ucacggcagc cau 23
<210> 536
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 536
gucccugguc acgugacaug acguc 25
<210> 537
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 537
cacagccggu caugcuugca caaa 24
<210> 538
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 538
acagccuguc augcuugcac aa 22
<210> 539
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 539
caccaucagc cacaccuacu caaa 24
<210> 540
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 540
cgggucgccg ccauauuugg ucacguga 28
<210> 541
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 541
cauccucggc ggaagcuaca caa 23
<210> 542
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 542
cauccucggc ggaagcuaca caa 23
<210> 543
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 543
ggccccguca cgugacuuac cac 23
<210> 544
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 544
ucauccucgg cggaagcuac acaa 24
<210> 545
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 545
ggccccguca cgugauuugu cac 23
<210> 546
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 546
gucauccuca ccauaacugg cacaa 25
<210> 547
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 547
cauccucggc ggaagcuaca caa 23
<210> 548
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 548
ggccccguca cgugacuuac cac 23
<210> 549
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 549
auccucgacg guaaccgcaa acaug 25
<210> 550
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 550
ggccccgaca ugugacucgu c 21
<210> 551
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 551
agcacuuccg aauggcugag uuuucca 27
<210> 552
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 552
auccucaccg gaacugacac aa 22
<210> 553
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 553
cauccucggc gguaaccgca aagaug 26
<210> 554
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 554
uaggccccga caugugacuc gu 22
<210> 555
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 555
acagccuucc gcuuugcaca a 21
<210> 556
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 556
cauccucggc gguaaccgca aagaugg 27
<210> 557
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 557
uaggccccga caugugacuc guc 23
<210> 558
<211> 20
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 558
uccucggcgg uaaccgcaaa 20
<210> 559
<211> 21
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 559
ggccccgaca ugugacucgu c 21
<210> 560
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 560
ggccccguca cgugacuuac cac 23
<210> 561
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 561
ucaaacaccc agcgacacca aaaaaugg 28
<210> 562
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 562
ccucgcccac gugacuuacc ac 22
<210> 563
<211> 20
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 563
ccucggcgga accuauacaa 20
<210> 564
<211> 22
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 564
gccccgucac gugauuuacc ac 22
<210> 565
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 565
gcggcggagc acuuccgcuu ugcccaaa 28
<210> 566
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 566
cauccucggc ggaagcuaca caa 23
<210> 567
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 567
ggccccguca cgugacuuac cac 23
<210> 568
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 568
caccgcacuu ccgugcuugc acaaa 25
<210> 569
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 569
ucgcugacac acgugucuug ucac 24
<210> 570
<211> 30
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 570
cauuuuaagu aagcaccgcc uagggaugac 30
<210> 571
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 571
guaggccccg ucacguguca uaccac 26
<210> 572
<211> 25
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 572
ggcggggcac uuccggcuug cccaa 25
<210> 573
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 573
cggcggagca cuuccggcuu gcccaa 26
<210> 574
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 574
caccaucagc cacaccuacu caaa 24
<210> 575
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 575
accaucagcc acaccuacuc aaa 23
<210> 576
<211> 28
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 576
gacuccgaga ugccauugga cacugagg 28
<210> 577
<211> 18
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 577
aguaggugcc guccagca 18
<210> 578
<211> 27
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 578
aaguaggccc cgcuacguca ucaucac 27
<210> 579
<211> 23
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 579
aaggcggaag agcugcucua uau 23
<210> 580
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 580
caauccuccc acguggccug ucac 24
<210> 581
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 581
aaggcggaac caggcuguca ccccgu 26
<210> 582
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 582
aaggcggaac caggcuguca ccccgu 26
<210> 583
<211> 24
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 583
cauccucacc ggaacuggua caaa 24
<210> 584
<211> 26
<212> RNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 584
uaggccccgc cacgucacuu gucacg 26
<210> 585
<400> 585
000
<210> 586
<400> 586
000
<210> 587
<400> 587
000
<210> 588
<400> 588
000
<210> 589
<400> 589
000
<210> 590
<400> 590
000
<210> 591
<400> 591
000
<210> 592
<400> 592
000
<210> 593
<400> 593
000
<210> 594
<400> 594
000
<210> 595
<400> 595
000
<210> 596
<400> 596
000
<210> 597
<400> 597
000
<210> 598
<400> 598
000
<210> 599
<400> 599
000
<210> 600
<400> 600
000
<210> 601
<400> 601
000
<210> 602
<400> 602
000
<210> 603
<400> 603
000
<210> 604
<400> 604
000
<210> 605
<400> 605
000
<210> 606
<400> 606
000
<210> 607
<400> 607
000
<210> 608
<400> 608
000
<210> 609
<400> 609
000
<210> 610
<400> 610
000
<210> 611
<400> 611
000
<210> 612
<400> 612
000
<210> 613
<400> 613
000
<210> 614
<400> 614
000
<210> 615
<400> 615
000
<210> 616
<400> 616
000
<210> 617
<400> 617
000
<210> 618
<400> 618
000
<210> 619
<400> 619
000
<210> 620
<400> 620
000
<210> 621
<400> 621
000
<210> 622
<400> 622
000
<210> 623
<400> 623
000
<210> 624
<400> 624
000
<210> 625
<400> 625
000
<210> 626
<400> 626
000
<210> 627
<400> 627
000
<210> 628
<400> 628
000
<210> 629
<400> 629
000
<210> 630
<400> 630
000
<210> 631
<400> 631
000
<210> 632
<400> 632
000
<210> 633
<400> 633
000
<210> 634
<400> 634
000
<210> 635
<400> 635
000
<210> 636
<400> 636
000
<210> 637
<400> 637
000
<210> 638
<400> 638
000
<210> 639
<400> 639
000
<210> 640
<400> 640
000
<210> 641
<400> 641
000
<210> 642
<400> 642
000
<210> 643
<400> 643
000
<210> 644
<400> 644
000
<210> 645
<400> 645
000
<210> 646
<400> 646
000
<210> 647
<400> 647
000
<210> 648
<400> 648
000
<210> 649
<400> 649
000
<210> 650
<400> 650
000
<210> 651
<400> 651
000
<210> 652
<400> 652
000
<210> 653
<400> 653
000
<210> 654
<400> 654
000
<210> 655
<400> 655
000
<210> 656
<400> 656
000
<210> 657
<400> 657
000
<210> 658
<400> 658
000
<210> 659
<400> 659
000
<210> 660
<400> 660
000
<210> 661
<400> 661
000
<210> 662
<400> 662
000
<210> 663
<400> 663
000
<210> 664
<400> 664
000
<210> 665
<400> 665
000
<210> 666
<400> 666
000
<210> 667
<400> 667
000
<210> 668
<400> 668
000
<210> 669
<400> 669
000
<210> 670
<400> 670
000
<210> 671
<400> 671
000
<210> 672
<400> 672
000
<210> 673
<400> 673
000
<210> 674
<400> 674
000
<210> 675
<400> 675
000
<210> 676
<400> 676
000
<210> 677
<400> 677
000
<210> 678
<400> 678
000
<210> 679
<400> 679
000
<210> 680
<400> 680
000
<210> 681
<400> 681
000
<210> 682
<400> 682
000
<210> 683
<400> 683
000
<210> 684
<400> 684
000
<210> 685
<400> 685
000
<210> 686
<400> 686
000
<210> 687
<400> 687
000
<210> 688
<400> 688
000
<210> 689
<400> 689
000
<210> 690
<400> 690
000
<210> 691
<400> 691
000
<210> 692
<400> 692
000
<210> 693
<400> 693
000
<210> 694
<400> 694
000
<210> 695
<400> 695
000
<210> 696
<400> 696
000
<210> 697
<400> 697
000
<210> 698
<400> 698
000
<210> 699
<400> 699
000
<210> 700
<400> 700
000
<210> 701
<400> 701
000
<210> 702
<400> 702
000
<210> 703
<400> 703
000
<210> 704
<400> 704
000
<210> 705
<400> 705
000
<210> 706
<400> 706
000
<210> 707
<400> 707
000
<210> 708
<400> 708
000
<210> 709
<400> 709
000
<210> 710
<400> 710
000
<210> 711
<400> 711
000
<210> 712
<400> 712
000
<210> 713
<400> 713
000
<210> 714
<400> 714
000
<210> 715
<400> 715
000
<210> 716
<400> 716
000
<210> 717
<400> 717
000
<210> 718
<400> 718
000
<210> 719
<400> 719
000
<210> 720
<400> 720
000
<210> 721
<400> 721
000
<210> 722
<400> 722
000
<210> 723
<400> 723
000
<210> 724
<400> 724
000
<210> 725
<400> 725
000
<210> 726
<400> 726
000
<210> 727
<400> 727
000
<210> 728
<400> 728
000
<210> 729
<400> 729
000
<210> 730
<400> 730
000
<210> 731
<400> 731
000
<210> 732
<400> 732
000
<210> 733
<400> 733
000
<210> 734
<400> 734
000
<210> 735
<400> 735
000
<210> 736
<400> 736
000
<210> 737
<400> 737
000
<210> 738
<400> 738
000
<210> 739
<400> 739
000
<210> 740
<400> 740
000
<210> 741
<400> 741
000
<210> 742
<400> 742
000
<210> 743
<400> 743
000
<210> 744
<400> 744
000
<210> 745
<400> 745
000
<210> 746
<400> 746
000
<210> 747
<400> 747
000
<210> 748
<400> 748
000
<210> 749
<400> 749
000
<210> 750
<400> 750
000
<210> 751
<400> 751
000
<210> 752
<400> 752
000
<210> 753
<400> 753
000
<210> 754
<400> 754
000
<210> 755
<400> 755
000
<210> 756
<400> 756
000
<210> 757
<400> 757
000
<210> 758
<400> 758
000
<210> 759
<400> 759
000
<210> 760
<400> 760
000
<210> 761
<400> 761
000
<210> 762
<400> 762
000
<210> 763
<400> 763
000
<210> 764
<400> 764
000
<210> 765
<400> 765
000
<210> 766
<400> 766
000
<210> 767
<400> 767
000
<210> 768
<400> 768
000
<210> 769
<400> 769
000
<210> 770
<400> 770
000
<210> 771
<400> 771
000
<210> 772
<400> 772
000
<210> 773
<400> 773
000
<210> 774
<400> 774
000
<210> 775
<400> 775
000
<210> 776
<400> 776
000
<210> 777
<400> 777
000
<210> 778
<400> 778
000
<210> 779
<400> 779
000
<210> 780
<400> 780
000
<210> 781
<400> 781
000
<210> 782
<400> 782
000
<210> 783
<400> 783
000
<210> 784
<400> 784
000
<210> 785
<400> 785
000
<210> 786
<400> 786
000
<210> 787
<400> 787
000
<210> 788
<400> 788
000
<210> 789
<400> 789
000
<210> 790
<400> 790
000
<210> 791
<400> 791
000
<210> 792
<400> 792
000
<210> 793
<400> 793
000
<210> 794
<400> 794
000
<210> 795
<400> 795
000
<210> 796
<400> 796
000
<210> 797
<400> 797
000
<210> 798
<400> 798
000
<210> 799
<400> 799
000
<210> 800
<400> 800
000
<210> 801
<211> 156
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 801
gcggcggggg ggcggccgcg ttcgcgcgcc gcccaccagg gggtgctgcg cgcccccccc 60
cgcgcatgcg cggggccccc ccccgggggg gctccgcccc cccggccccc ccccgtgcta 120
aacccaccgc gcatgcgcga ccacgccccc gccgcc 156
<210> 802
<211> 150
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 802
ccgagcgtta gcgaggagtg cgaccctacc ccctgggccc acttcttcgg agccgcgcgc 60
tacgccttcg gctgcgcgcg gcacctcaga cccccgctcg tgctgacacg cttgcgcgtg 120
tcagaccact tcgggctcgc gggggtcggg 150
<210> 803
<211> 122
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 803
gccgccgcgg cggcgggggg cggcgcgctg cgcgcgccgc ccagtagggg gagccatgcg 60
cccccccccg cgcatgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc 120
cg 122
<210> 804
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 804
cggcccagcg gcggcgcgcg cgcttcgcgc gcgcgccggg gggctccgcc cccccccgcg 60
catgcgcggg gccccccccc gcggggggct ccgccccccg gtcccccccc g 111
<210> 805
<211> 115
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 805
cggccgtgcg gcggcgcgcg cgcttcgcgc gcgcgccggg ggctgccgcc cccccccgcg 60
catgcgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc ccccg 115
<210> 806
<211> 104
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 806
cggcggcggc gcgcgcgcta cgcgcgcgcg ccggggggct gccgcccccc ccccgcgcat 60
gcgcggggcc cccccccgcg gggggctccg ccccccggcc cccc 104
<210> 807
<211> 108
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
多核苷酸
<400> 807
ggcggcggcg cgcgcgctac gcgcgcgcgc cggggagctc tgcccccccc cgcgcatgcg 60
cgcgggtccc ccccccgcgg ggggctccgc cccccggtcc cccccccg 108
<210> 808
<400> 808
000
<210> 809
<400> 809
000
<210> 810
<400> 810
000
<210> 811
<400> 811
000
<210> 812
<400> 812
000
<210> 813
<400> 813
000
<210> 814
<400> 814
000
<210> 815
<400> 815
000
<210> 816
<400> 816
000
<210> 817
<400> 817
000
<210> 818
<400> 818
000
<210> 819
<400> 819
000
<210> 820
<400> 820
000
<210> 821
<400> 821
000
<210> 822
<400> 822
000
<210> 823
<400> 823
000
<210> 824
<400> 824
000
<210> 825
<400> 825
000
<210> 826
<400> 826
000
<210> 827
<400> 827
000
<210> 828
<400> 828
000
<210> 829
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
<220>
<221> 经修饰的残基
<222> (4)..(5)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (7)..(7)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (9)..(10)
<223> 任何氨基酸
<400> 829
Tyr Asn Pro Xaa Xaa Asp Xaa Gly Xaa Xaa Asn
1 5 10
<210> 830
<400> 830
000
<210> 831
<400> 831
000
<210> 832
<400> 832
000
<210> 833
<400> 833
000
<210> 834
<400> 834
000
<210> 835
<400> 835
000
<210> 836
<400> 836
000
<210> 837
<400> 837
000
<210> 838
<400> 838
000
<210> 839
<400> 839
000
<210> 840
<400> 840
000
<210> 841
<400> 841
000
<210> 842
<400> 842
000
<210> 843
<400> 843
000
<210> 844
<400> 844
000
<210> 845
<400> 845
000
<210> 846
<400> 846
000
<210> 847
<400> 847
000
<210> 848
<400> 848
000
<210> 849
<400> 849
000
<210> 850
<400> 850
000
<210> 851
<400> 851
000
<210> 852
<400> 852
000
<210> 853
<400> 853
000
<210> 854
<400> 854
000
<210> 855
<400> 855
000
<210> 856
<400> 856
000
<210> 857
<400> 857
000
<210> 858
<400> 858
000
<210> 859
<400> 859
000
<210> 860
<400> 860
000
<210> 861
<400> 861
000
<210> 862
<400> 862
000
<210> 863
<400> 863
000
<210> 864
<400> 864
000
<210> 865
<400> 865
000
<210> 866
<400> 866
000
<210> 867
<400> 867
000
<210> 868
<400> 868
000
<210> 869
<400> 869
000
<210> 870
<400> 870
000
<210> 871
<400> 871
000
<210> 872
<400> 872
000
<210> 873
<400> 873
000
<210> 874
<400> 874
000
<210> 875
<400> 875
000
<210> 876
<400> 876
000
<210> 877
<400> 877
000
<210> 878
<211> 3264
<212> DNA
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 878
taaaatggcg gcaaccaatc attttatact ttcactttcc aattacaagc cgccacgtca 60
cagaacaggg gtggagactt taaaactata taaccaagtg atgtgacgaa tggctgagtt 120
taccccgcta gacggtgcag ggaccggatc gagcgcagcg aggaggtccc cggctgcccg 180
tgggcgggag cccgaggtga gtgaaaccac cgaggtctag gggcaattcg ggctagggca 240
gtctagcgga acgggcaaga aacttaaaat atgttttgtt tcagatgcag acacctgctt 300
cacagataag ctcagacgac ttctttgtac acactccatt taatgcagta actaaacagc 360
aaatatggat gtctcaaatt gctgatggac atgacaacat ttgtcactgc caccgtcctt 420
ttgctcacct gcttgctaat atttttcctc ctggtcataa agacagggat cttaccatta 480
atcaaatact tgctagagat cttacagaaa catgccattc tggtggagac gaaggaacaa 540
gcggtggtgg ggtcgccgct tccgctaccg ccgctacaac aaatataaaa ccagaaggag 600
acgcagaata cccagaagac gaaatagaag atttactaag acacgcagga gaagaaaaag 660
aaagaaggta agaagaaaac ttaaaaaaat tactattaaa caatggcagc cagattcagt 720
gaaaaaatgt aaaattaaag gatatagtac tttagttatg ggtgcacaag gaaaacaata 780
caactgttac acaaaccaag caagtgacta tgttcagcct aaagcaccac aaggtggggg 840
ctttggctgt gaagtattta atttaaaatg gctataccaa gaatatactg cacacagaaa 900
tatttggaca aaaacaaatg aatatacaga cctttgtaga tacactggag ctcaaataat 960
tttatacagg cacccagatg ttgattttat agtcagctgg gacaatcagc cacctttttt 1020
acttaacaaa tatacatatc cagaactgca accacaaaac cttttactag ctagaaggaa 1080
aagaattatt cttagtcaaa aatcaaaccc caaaggaaaa ctaagaatta aactaagaat 1140
accaccacca aaacaaatga taacaaaatg gttttttcaa agagactttt gtgatgtgaa 1200
tctgtttaaa ctatgtgctt ctgctgcttc tttccgctac ccaggtatca gtcatggagc 1260
tcaaagtact attttttctg catatgcttt aaacactgac ttttatcaat gcagtgactg 1320
gtgccaaact aacacagaaa ctggctacct aaacattaaa acacaacaaa tgccactatg 1380
gtttcattac agagagggtg gcaaagagaa atggtataaa tacaccaaca aagaacacag 1440
accatataca aatacatatc ttaaaagtat tagctataat gatggattgt tttctcctaa 1500
agccatgttt gcatttgaag taaaagcggg gggtgaagga acaacagaac caccacaagg 1560
cgcccaatta attgctaacc ttccactcat tgcactaaga tataatccac atgaagacac 1620
aggccatggc aatgaaattt accttacatc aacttttaaa ggtacatatg acaaacctaa 1680
agttactgat gctctatact ttaacaatgt acccctgtgg atgggatttt atggctactg 1740
ggactttata ttacaagaaa caaaaaacaa aggtgtcttt gatcaacata tgtttgttgt 1800
taaatgtcct gccttaaggc ccatatcaca agtcacaaaa caagtatact acccacttgt 1860
agacatggac ttttgttcag ggagactgcc atttgatgaa tatttatcca aagacattaa 1920
aagtcattgg tatcccactg cagaaagaca aacagttaca ataaataatt ttgttacagc 1980
aggtccatac atgcctaaat ttgaacccac agacaaagac agtacatggc aattaaacta 2040
tcactataaa ttttttttta agtggggtgg tccacaagtc acagacccaa ctgttgaaga 2100
cccatgcagc agaaacaaat atcctgtccc cgatacaatg caacaaacaa tacaaattaa 2160
aaaccctgaa aagctgcacc cagcaaccct cttccatgac tgggacctta gaaggggctt 2220
cattacacaa gcagctatta aaagaatgtc agaaaacctc caaattgatt catctttcga 2280
atctgatggc acagaatcac ccaaaaaaaa gaaaagatgc accaaagaaa tcccaacaca 2340
aaaccaaaag caagaagaga tccaagaatg tctcctctca ctctgcgaag agcctacatg 2400
ccaagaagaa acagaggacc tccagctctt catccagcag cagcagcagc agcagtacaa 2460
gctcagaaaa aacctcttca aactcctcac tcacctgaaa aaaggacaga gaataagtca 2520
actacaaacg ggacttttag agtaatacca tttaaaccag gttttgaaca agaaacagaa 2580
aaagaacttg ccatagcttt ctgcagacca cctagaaaat ataaaaatga tccccctttt 2640
tatccctggt taccatggac accccttgta cactttaacc ttaattacaa aggctaggcc 2700
aacactgttc acttagtggt gtatgtttaa taaagtttca cccccaaaaa aaaaaaaaaa 2760
aaaaaaaaaa aaaaaaaaaa taaaaaattg caaaaattcg gcgctcgcgc gcgctgcgcg 2820
cgcgcgagcg ccgtcacgcg ccggcgctcg cgcgccgcgc gtatgtgcta acacaccacg 2880
cacctagatt ggggtgcgcg cgctagcgcg cgcaccccaa tgcgccccgc cctcgttccg 2940
acccgcttgc gcgggtcgga ccacttcggg ctcggggggg cgcgcctgcg gcgctttttt 3000
actaaacaga ctccgagccg ccatttggcc ccccctaagc tccgcccccc tcatgaatat 3060
tcataaagga aaccacataa ttagaattgc cgaccacaaa ctgccatatg ctaattagtt 3120
ccccttttac acagtaaaaa ggggaagtgg gggggcatag cccccccaca ccccccgcgg 3180
ggggggcaga gccccccccc gcaccccccc cctacgtcac aatccacgcc cccgccgcca 3240
tcttgggtgc ggcagggcgg gggc 3264
<210> 879
<211> 128
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 879
Met Gln Thr Pro Ala Ser Gln Ile Ser Ser Asp Asp Phe Phe Val His
1 5 10 15
Thr Pro Phe Asn Ala Val Thr Lys Gln Gln Ile Trp Met Ser Gln Ile
20 25 30
Ala Asp Gly His Asp Asn Ile Cys His Cys His Arg Pro Phe Ala His
35 40 45
Leu Leu Ala Asn Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr
50 55 60
Ile Asn Gln Ile Leu Ala Arg Asp Leu Thr Glu Thr Cys His Ser Gly
65 70 75 80
Gly Asp Glu Gly Thr Ser Gly Gly Gly Val Ala Ala Ser Ala Thr Ala
85 90 95
Ala Thr Thr Asn Ile Lys Pro Glu Gly Asp Ala Glu Tyr Pro Glu Asp
100 105 110
Glu Ile Glu Asp Leu Leu Arg His Ala Gly Glu Glu Lys Glu Arg Arg
115 120 125
<210> 880
<211> 272
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 880
Met Gln Thr Pro Ala Ser Gln Ile Ser Ser Asp Asp Phe Phe Val His
1 5 10 15
Thr Pro Phe Asn Ala Val Thr Lys Gln Gln Ile Trp Met Ser Gln Ile
20 25 30
Ala Asp Gly His Asp Asn Ile Cys His Cys His Arg Pro Phe Ala His
35 40 45
Leu Leu Ala Asn Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr
50 55 60
Ile Asn Gln Ile Leu Ala Arg Asp Leu Thr Glu Thr Cys His Ser Gly
65 70 75 80
Gly Asp Glu Gly Thr Ser Gly Gly Gly Val Ala Ala Ser Ala Thr Ala
85 90 95
Ala Thr Thr Asn Ile Lys Pro Glu Gly Asp Ala Glu Tyr Pro Glu Asp
100 105 110
Glu Ile Glu Asp Leu Leu Arg His Ala Gly Glu Glu Lys Glu Arg Ser
115 120 125
Gly Val Val His Lys Ser Gln Thr Gln Leu Leu Lys Thr His Ala Ala
130 135 140
Glu Thr Asn Ile Leu Ser Pro Ile Gln Cys Asn Lys Gln Tyr Lys Leu
145 150 155 160
Lys Thr Leu Lys Ser Cys Thr Gln Gln Pro Ser Ser Met Thr Gly Thr
165 170 175
Leu Glu Gly Ala Ser Leu His Lys Gln Leu Leu Lys Glu Cys Gln Lys
180 185 190
Thr Ser Lys Leu Ile His Leu Ser Asn Leu Met Ala Gln Asn His Pro
195 200 205
Lys Lys Arg Lys Asp Ala Pro Lys Lys Ser Gln His Lys Thr Lys Ser
210 215 220
Lys Lys Arg Ser Lys Asn Val Ser Ser His Ser Ala Lys Ser Leu His
225 230 235 240
Ala Lys Lys Lys Gln Arg Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser
245 250 255
Ser Ser Ser Thr Ser Ser Glu Lys Thr Ser Ser Asn Ser Ser Leu Thr
260 265 270
<210> 881
<211> 261
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 881
Met Gln Thr Pro Ala Ser Gln Ile Ser Ser Asp Asp Phe Phe Val His
1 5 10 15
Thr Pro Phe Asn Ala Val Thr Lys Gln Gln Ile Trp Met Ser Gln Ile
20 25 30
Ala Asp Gly His Asp Asn Ile Cys His Cys His Arg Pro Phe Ala His
35 40 45
Leu Leu Ala Asn Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr
50 55 60
Ile Asn Gln Ile Leu Ala Arg Asp Leu Thr Glu Thr Cys His Ser Gly
65 70 75 80
Gly Asp Glu Gly Thr Ser Gly Gly Gly Val Ala Ala Ser Ala Thr Ala
85 90 95
Ala Thr Thr Asn Ile Lys Pro Glu Gly Asp Ala Glu Tyr Pro Glu Asp
100 105 110
Glu Ile Glu Asp Leu Leu Arg His Ala Gly Glu Glu Lys Glu Arg Arg
115 120 125
Ile Thr Gln Lys Lys Glu Lys Met His Gln Arg Asn Pro Asn Thr Lys
130 135 140
Pro Lys Ala Arg Arg Asp Pro Arg Met Ser Pro Leu Thr Leu Arg Arg
145 150 155 160
Ala Tyr Met Pro Arg Arg Asn Arg Gly Pro Pro Ala Leu His Pro Ala
165 170 175
Ala Ala Ala Ala Ala Val Gln Ala Gln Lys Lys Pro Leu Gln Thr Pro
180 185 190
His Ser Pro Glu Lys Arg Thr Glu Asn Lys Ser Thr Thr Asn Gly Thr
195 200 205
Phe Arg Val Ile Pro Phe Lys Pro Gly Phe Glu Gln Glu Thr Glu Lys
210 215 220
Glu Leu Ala Ile Ala Phe Cys Arg Pro Pro Arg Lys Tyr Lys Asn Asp
225 230 235 240
Pro Pro Phe Tyr Pro Trp Leu Pro Trp Thr Pro Leu Val His Phe Asn
245 250 255
Leu Asn Tyr Lys Gly
260
<210> 882
<211> 67
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 882
Met Asp Met Thr Thr Phe Val Thr Ala Thr Val Leu Leu Leu Thr Cys
1 5 10 15
Leu Leu Ile Phe Phe Leu Leu Val Ile Lys Thr Gly Ile Leu Pro Leu
20 25 30
Ile Lys Tyr Leu Leu Glu Ile Leu Gln Lys His Ala Ile Leu Val Glu
35 40 45
Thr Lys Glu Gln Ala Val Val Gly Ser Pro Leu Pro Leu Pro Pro Leu
50 55 60
Gln Gln Ile
65
<210> 883
<211> 677
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 883
Met Pro Phe Trp Trp Arg Arg Arg Asn Lys Arg Trp Trp Gly Arg Arg
1 5 10 15
Phe Arg Tyr Arg Arg Tyr Asn Lys Tyr Lys Thr Arg Arg Arg Arg Arg
20 25 30
Ile Pro Arg Arg Arg Asn Arg Arg Phe Thr Lys Thr Arg Arg Arg Arg
35 40 45
Lys Arg Lys Lys Val Arg Arg Lys Leu Lys Lys Ile Thr Ile Lys Gln
50 55 60
Trp Gln Pro Asp Ser Val Lys Lys Cys Lys Ile Lys Gly Tyr Ser Thr
65 70 75 80
Leu Val Met Gly Ala Gln Gly Lys Gln Tyr Asn Cys Tyr Thr Asn Gln
85 90 95
Ala Ser Asp Tyr Val Gln Pro Lys Ala Pro Gln Gly Gly Gly Phe Gly
100 105 110
Cys Glu Val Phe Asn Leu Lys Trp Leu Tyr Gln Glu Tyr Thr Ala His
115 120 125
Arg Asn Ile Trp Thr Lys Thr Asn Glu Tyr Thr Asp Leu Cys Arg Tyr
130 135 140
Thr Gly Ala Gln Ile Ile Leu Tyr Arg His Pro Asp Val Asp Phe Ile
145 150 155 160
Val Ser Trp Asp Asn Gln Pro Pro Phe Leu Leu Asn Lys Tyr Thr Tyr
165 170 175
Pro Glu Leu Gln Pro Gln Asn Leu Leu Leu Ala Arg Arg Lys Arg Ile
180 185 190
Ile Leu Ser Gln Lys Ser Asn Pro Lys Gly Lys Leu Arg Ile Lys Leu
195 200 205
Arg Ile Pro Pro Pro Lys Gln Met Ile Thr Lys Trp Phe Phe Gln Arg
210 215 220
Asp Phe Cys Asp Val Asn Leu Phe Lys Leu Cys Ala Ser Ala Ala Ser
225 230 235 240
Phe Arg Tyr Pro Gly Ile Ser His Gly Ala Gln Ser Thr Ile Phe Ser
245 250 255
Ala Tyr Ala Leu Asn Thr Asp Phe Tyr Gln Cys Ser Asp Trp Cys Gln
260 265 270
Thr Asn Thr Glu Thr Gly Tyr Leu Asn Ile Lys Thr Gln Gln Met Pro
275 280 285
Leu Trp Phe His Tyr Arg Glu Gly Gly Lys Glu Lys Trp Tyr Lys Tyr
290 295 300
Thr Asn Lys Glu His Arg Pro Tyr Thr Asn Thr Tyr Leu Lys Ser Ile
305 310 315 320
Ser Tyr Asn Asp Gly Leu Phe Ser Pro Lys Ala Met Phe Ala Phe Glu
325 330 335
Val Lys Ala Gly Gly Glu Gly Thr Thr Glu Pro Pro Gln Gly Ala Gln
340 345 350
Leu Ile Ala Asn Leu Pro Leu Ile Ala Leu Arg Tyr Asn Pro His Glu
355 360 365
Asp Thr Gly His Gly Asn Glu Ile Tyr Leu Thr Ser Thr Phe Lys Gly
370 375 380
Thr Tyr Asp Lys Pro Lys Val Thr Asp Ala Leu Tyr Phe Asn Asn Val
385 390 395 400
Pro Leu Trp Met Gly Phe Tyr Gly Tyr Trp Asp Phe Ile Leu Gln Glu
405 410 415
Thr Lys Asn Lys Gly Val Phe Asp Gln His Met Phe Val Val Lys Cys
420 425 430
Pro Ala Leu Arg Pro Ile Ser Gln Val Thr Lys Gln Val Tyr Tyr Pro
435 440 445
Leu Val Asp Met Asp Phe Cys Ser Gly Arg Leu Pro Phe Asp Glu Tyr
450 455 460
Leu Ser Lys Asp Ile Lys Ser His Trp Tyr Pro Thr Ala Glu Arg Gln
465 470 475 480
Thr Val Thr Ile Asn Asn Phe Val Thr Ala Gly Pro Tyr Met Pro Lys
485 490 495
Phe Glu Pro Thr Asp Lys Asp Ser Thr Trp Gln Leu Asn Tyr His Tyr
500 505 510
Lys Phe Phe Phe Lys Trp Gly Gly Pro Gln Val Thr Asp Pro Thr Val
515 520 525
Glu Asp Pro Cys Ser Arg Asn Lys Tyr Pro Val Pro Asp Thr Met Gln
530 535 540
Gln Thr Ile Gln Ile Lys Asn Pro Glu Lys Leu His Pro Ala Thr Leu
545 550 555 560
Phe His Asp Trp Asp Leu Arg Arg Gly Phe Ile Thr Gln Ala Ala Ile
565 570 575
Lys Arg Met Ser Glu Asn Leu Gln Ile Asp Ser Ser Phe Glu Ser Asp
580 585 590
Gly Thr Glu Ser Pro Lys Lys Lys Lys Arg Cys Thr Lys Glu Ile Pro
595 600 605
Thr Gln Asn Gln Lys Gln Glu Glu Ile Gln Glu Cys Leu Leu Ser Leu
610 615 620
Cys Glu Glu Pro Thr Cys Gln Glu Glu Thr Glu Asp Leu Gln Leu Phe
625 630 635 640
Ile Gln Gln Gln Gln Gln Gln Gln Tyr Lys Leu Arg Lys Asn Leu Phe
645 650 655
Lys Leu Leu Thr His Leu Lys Lys Gly Gln Arg Ile Ser Gln Leu Gln
660 665 670
Thr Gly Leu Leu Glu
675
<210> 884
<211> 212
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 884
Met Pro Phe Trp Trp Arg Arg Arg Asn Lys Arg Trp Trp Gly Arg Arg
1 5 10 15
Phe Arg Tyr Arg Arg Tyr Asn Lys Tyr Lys Thr Arg Arg Arg Arg Arg
20 25 30
Ile Pro Arg Arg Arg Asn Arg Arg Phe Thr Lys Thr Arg Arg Arg Arg
35 40 45
Lys Arg Lys Lys Trp Gly Gly Pro Gln Val Thr Asp Pro Thr Val Glu
50 55 60
Asp Pro Cys Ser Arg Asn Lys Tyr Pro Val Pro Asp Thr Met Gln Gln
65 70 75 80
Thr Ile Gln Ile Lys Asn Pro Glu Lys Leu His Pro Ala Thr Leu Phe
85 90 95
His Asp Trp Asp Leu Arg Arg Gly Phe Ile Thr Gln Ala Ala Ile Lys
100 105 110
Arg Met Ser Glu Asn Leu Gln Ile Asp Ser Ser Phe Glu Ser Asp Gly
115 120 125
Thr Glu Ser Pro Lys Lys Lys Lys Arg Cys Thr Lys Glu Ile Pro Thr
130 135 140
Gln Asn Gln Lys Gln Glu Glu Ile Gln Glu Cys Leu Leu Ser Leu Cys
145 150 155 160
Glu Glu Pro Thr Cys Gln Glu Glu Thr Glu Asp Leu Gln Leu Phe Ile
165 170 175
Gln Gln Gln Gln Gln Gln Gln Tyr Lys Leu Arg Lys Asn Leu Phe Lys
180 185 190
Leu Leu Thr His Leu Lys Lys Gly Gln Arg Ile Ser Gln Leu Gln Thr
195 200 205
Gly Leu Leu Glu
210
<210> 885
<211> 119
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 885
Met Pro Phe Trp Trp Arg Arg Arg Asn Lys Arg Trp Trp Gly Arg Arg
1 5 10 15
Phe Arg Tyr Arg Arg Tyr Asn Lys Tyr Lys Thr Arg Arg Arg Arg Arg
20 25 30
Ile Pro Arg Arg Arg Asn Arg Arg Phe Thr Lys Thr Arg Arg Arg Arg
35 40 45
Lys Arg Lys Lys Asn His Pro Lys Lys Arg Lys Asp Ala Pro Lys Lys
50 55 60
Ser Gln His Lys Thr Lys Ser Lys Lys Arg Ser Lys Asn Val Ser Ser
65 70 75 80
His Ser Ala Lys Ser Leu His Ala Lys Lys Lys Gln Arg Thr Ser Ser
85 90 95
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Thr Ser Ser Glu Lys Thr
100 105 110
Ser Ser Asn Ser Ser Leu Thr
115
<210> 886
<211> 3176
<212> DNA
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 886
taaaatggcg ggagccaatc attttatact ttcactttcc aattaaaaat ggccacgtca 60
caaacaaggg gtggagccat ttaaactata taactaagtg gggtggcgaa tggctgagtt 120
taccccgcta gacggtgcag ggaccggatc gagcgcagcg aggaggtccc cggctgccca 180
tgggcgggag ccgaggtgag tgaaaccacc gaggtctagg ggcaattcgg gctagggcag 240
tctagcggaa cgggcaagaa acttaaaaca atatttgttt tacagatggt tagtatatcc 300
tcaagtgatt tttttaagaa aacgaaattt aatgaggaga cgcagaacca agtatggatg 360
tctcaaattg ctgactctca tgataatatc tgcagttgct ggcatccatt tgctcacctt 420
cttgcttcca tatttcctcc tggccacaaa gatcgtgatc ttactattaa ccaaattctt 480
ctaagagatt ataaagaaaa atgccattct ggtggagaag aaggagaaaa ttctggacca 540
acaacaggtt taattacacc aaaagaagaa gatatagaaa aagatggccc agaaggcgcc 600
gcagaagaag accatacaga cgccctgttc gccgccgccg tagaaaactt cgaaaggtaa 660
agagaaaaaa aaaatcttta attgttagac aatggcaacc agacagtata agaacttgta 720
aaattatagg acagtcagct atagttgttg gggctgaagg aaagcaaatg tactgttata 780
ctgtcaataa gttaattaat gtgcccccaa aaacaccata tgggggaggc tttggagtag 840
accaatacac actgaaatac ttatatgaag aatacagatt tgcacaaaac atttggacac 900
aatctaatgt actgaaagac ttatgcagat acataaatgt taagctaata ttctacagag 960
acaacaaaac agactttgtc ctttcctatg acagaaaccc accttttcaa ctaacaaaat 1020
ttacataccc aggagcacac ccacaacaaa tcatgcttca aaaacaccac aaattcatac 1080
tatcacaaat gacaaagcct aatggaagac taacaaaaaa actcaaaatt aaacctccta 1140
aacaaatgct ttctaaatgg ttcttttcaa aacaattctg taaataccct ttactatctc 1200
ttaaagcttc tgcactagac cttaggcact cttacctagg ctgctgtaat gaaaatccac 1260
aggtattttt ttattattta aaccatggat actacacaat aacaaactgg ggagcacaat 1320
cctcaacagc atacagacct aactccaagg tgacagacac aacatactac agatacaaaa 1380
atgacagaaa aaatattaac attaaaagcc atgaatacga aaaaagtata tcatatgaaa 1440
acggttattt tcaatctagt ttcttacaaa cacagtgcat atataccagt gagcgtggtg 1500
aagcctgtat agcagaaaaa ccactaggaa tagctattta caatccagta aaagacaatg 1560
gagatggtaa tatgatatac cttgtaagca ctctagcaaa cacttgggac cagcctccaa 1620
aagacagtgc tattttaata caaggagtac ccatatggct aggcttattt ggatatttag 1680
actactgtag acaaattaaa gctgacaaaa catggctaga cagtcatgta ctagtaattc 1740
aaagtcctgc tatttttact tacccaaatc caggagcagg caaatggtat tgtccactat 1800
cacaaagttt tataaatggc aatggtccgt ttaatcaacc acctacactg ctacaaaaag 1860
caaagtggtt tccacaaata caataccaac aagaaattat taatagcttt gtagaatcag 1920
gaccatttgt tcccaaatat gcaaatcaaa ctgaaagcaa ctgggaacta aaatataaat 1980
atgtttttac atttaagtgg ggtggaccac aattccatga accagaaatt gctgacccta 2040
gcaaacaaga gcagtatgat gtccccgata ctttctacca aacaatacaa attgaagatc 2100
cagaaggaca agaccccaga tctctcatcc atgattggga ctacagacga ggctttatta 2160
aagaaagatc tcttaaaaga atgtcaactt acttctcaac tcatacagat cagcaagcaa 2220
cttcagagga agacattccc aaaaagaaaa agagaattgg accccaactc acagtcccac 2280
aacaaaaaga agaggagaca ctgtcatgtc tcctctctct ctgcaaaaaa gataccttcc 2340
aagaaacaga gacacaagaa gacctccagc agctcatcaa gcagcagcag gagcagcagc 2400
tcctcctcaa gagaaacatc ctccagctca tccacaaact aaaagagaat caacaaatgc 2460
ttcagcttca cacaggcatg ttaccttaac cagatttaaa cctggatttg aagagcaaac 2520
agagagagaa ttagcaatta tatttcatag gccccctaga acctacaaag aggaccttcc 2580
attctatccc tggctaccac ctgcacccct tgtacaattt aaccttaact tcaaaggcta 2640
ggccaacaat gtacacttag taaagcatgt ttattaaagc acaaccccca aaataaatgt 2700
aaaaataaaa aaaaaaaaaa aaaaataaaa aattgcaaaa attcggcgct cgcgcgcatg 2760
tgcgcctctg gcgcaaatca cgcaacgctc gcgcgcccgc gtatgtctct ttaccacgca 2820
cctagattgg ggtgcgcgcg ctagcgcgcg caccccaatg cgccccgccc tcgttccgac 2880
ccgcttgcgc gggtcggacc acttcgggct cgggggggcg cgcctgcggc gcttttttac 2940
taaacagact ccgagccgcc atttggcccc ctaagctccg cccccctcat gaatattcat 3000
aaaggaaacc acataattag aattgccgac cacaaactgc catatgctaa ttagttcccc 3060
ttttacaaag taaaagggga agtgaacata gccccacacc cgcaggggca aggccccgca 3120
cccctacgtc actaaccacg cccccgccgc catcttgggt gcggcagggc gggggc 3176
<210> 887
<211> 124
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 887
Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn
1 5 10 15
Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His
20 25 30
Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser
35 40 45
Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile
50 55 60
Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly
65 70 75 80
Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp
85 90 95
Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp
100 105 110
Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Arg
115 120
<210> 888
<211> 271
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 888
Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn
1 5 10 15
Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His
20 25 30
Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser
35 40 45
Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile
50 55 60
Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly
65 70 75 80
Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp
85 90 95
Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp
100 105 110
Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Ser Gly Val Asp His
115 120 125
Asn Ser Met Asn Gln Lys Leu Leu Thr Leu Ala Asn Lys Ser Ser Met
130 135 140
Met Ser Pro Ile Leu Ser Thr Lys Gln Tyr Lys Leu Lys Ile Gln Lys
145 150 155 160
Asp Lys Thr Pro Asp Leu Ser Ser Met Ile Gly Thr Thr Asp Glu Ala
165 170 175
Leu Leu Lys Lys Asp Leu Leu Lys Glu Cys Gln Leu Thr Ser Gln Leu
180 185 190
Ile Gln Ile Ser Lys Gln Leu Gln Arg Lys Thr Phe Pro Lys Arg Lys
195 200 205
Arg Glu Leu Asp Pro Asn Ser Gln Ser His Asn Lys Lys Lys Arg Arg
210 215 220
His Cys His Val Ser Ser Leu Ser Ala Lys Lys Ile Pro Ser Lys Lys
225 230 235 240
Gln Arg His Lys Lys Thr Ser Ser Ser Ser Ser Ser Ser Ser Arg Ser
245 250 255
Ser Ser Ser Ser Ser Arg Glu Thr Ser Ser Ser Ser Ser Thr Asn
260 265 270
<210> 889
<211> 267
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 889
Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn
1 5 10 15
Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His
20 25 30
Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser
35 40 45
Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile
50 55 60
Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly
65 70 75 80
Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp
85 90 95
Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp
100 105 110
Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Arg Ser Ala Ser Asn
115 120 125
Phe Arg Gly Arg His Ser Gln Lys Glu Lys Glu Asn Trp Thr Pro Thr
130 135 140
His Ser Pro Thr Thr Lys Arg Arg Gly Asp Thr Val Met Ser Pro Leu
145 150 155 160
Ser Leu Gln Lys Arg Tyr Leu Pro Arg Asn Arg Asp Thr Arg Arg Pro
165 170 175
Pro Ala Ala His Gln Ala Ala Ala Gly Ala Ala Ala Pro Pro Gln Glu
180 185 190
Lys His Pro Pro Ala His Pro Gln Thr Lys Arg Glu Ser Thr Asn Ala
195 200 205
Ser Ala Ser His Arg His Val Thr Leu Thr Arg Phe Lys Pro Gly Phe
210 215 220
Glu Glu Gln Thr Glu Arg Glu Leu Ala Ile Ile Phe His Arg Pro Pro
225 230 235 240
Arg Thr Tyr Lys Glu Asp Leu Pro Phe Tyr Pro Trp Leu Pro Pro Ala
245 250 255
Pro Leu Val Gln Phe Asn Leu Asn Phe Lys Gly
260 265
<210> 890
<211> 50
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 890
Met Arg Arg Arg Arg Thr Lys Tyr Gly Cys Leu Lys Leu Leu Thr Leu
1 5 10 15
Met Ile Ile Ser Ala Val Ala Gly Ile His Leu Leu Thr Phe Leu Leu
20 25 30
Pro Tyr Phe Leu Leu Ala Thr Lys Ile Val Ile Leu Leu Leu Thr Lys
35 40 45
Phe Phe
50
<210> 891
<211> 662
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 891
Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg
1 5 10 15
Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg
20 25 30
Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg
35 40 45
Lys Leu Arg Lys Val Lys Arg Lys Lys Lys Ser Leu Ile Val Arg Gln
50 55 60
Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys Ile Ile Gly Gln Ser Ala
65 70 75 80
Ile Val Val Gly Ala Glu Gly Lys Gln Met Tyr Cys Tyr Thr Val Asn
85 90 95
Lys Leu Ile Asn Val Pro Pro Lys Thr Pro Tyr Gly Gly Gly Phe Gly
100 105 110
Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala
115 120 125
Gln Asn Ile Trp Thr Gln Ser Asn Val Leu Lys Asp Leu Cys Arg Tyr
130 135 140
Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp Asn Lys Thr Asp Phe Val
145 150 155 160
Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln Leu Thr Lys Phe Thr Tyr
165 170 175
Pro Gly Ala His Pro Gln Gln Ile Met Leu Gln Lys His His Lys Phe
180 185 190
Ile Leu Ser Gln Met Thr Lys Pro Asn Gly Arg Leu Thr Lys Lys Leu
195 200 205
Lys Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Ser Lys
210 215 220
Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu Lys Ala Ser Ala Leu Asp
225 230 235 240
Leu Arg His Ser Tyr Leu Gly Cys Cys Asn Glu Asn Pro Gln Val Phe
245 250 255
Phe Tyr Tyr Leu Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala
260 265 270
Gln Ser Ser Thr Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr
275 280 285
Tyr Tyr Arg Tyr Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His
290 295 300
Glu Tyr Glu Lys Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser
305 310 315 320
Phe Leu Gln Thr Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys
325 330 335
Ile Ala Glu Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp
340 345 350
Asn Gly Asp Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr
355 360 365
Trp Asp Gln Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro
370 375 380
Ile Trp Leu Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys
385 390 395 400
Ala Asp Lys Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro
405 410 415
Ala Ile Phe Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro
420 425 430
Leu Ser Gln Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro
435 440 445
Thr Leu Leu Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln
450 455 460
Glu Ile Ile Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr
465 470 475 480
Ala Asn Gln Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe
485 490 495
Thr Phe Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp
500 505 510
Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr
515 520 525
Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His
530 535 540
Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg
545 550 555 560
Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu
565 570 575
Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val
580 585 590
Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys
595 600 605
Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln
610 615 620
Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile
625 630 635 640
Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu
645 650 655
His Thr Gly Met Leu Pro
660
<210> 892
<211> 215
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 892
Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg
1 5 10 15
Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg
20 25 30
Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg
35 40 45
Lys Leu Arg Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala
50 55 60
Asp Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln
65 70 75 80
Thr Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile
85 90 95
His Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys
100 105 110
Arg Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser
115 120 125
Glu Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr
130 135 140
Val Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu
145 150 155 160
Cys Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln
165 170 175
Gln Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn
180 185 190
Ile Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln
195 200 205
Leu His Thr Gly Met Leu Pro
210 215
<210> 893
<211> 129
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 893
Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg
1 5 10 15
Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg
20 25 30
Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg
35 40 45
Lys Leu Arg Lys Ile Ser Lys Gln Leu Gln Arg Lys Thr Phe Pro Lys
50 55 60
Arg Lys Arg Glu Leu Asp Pro Asn Ser Gln Ser His Asn Lys Lys Lys
65 70 75 80
Arg Arg His Cys His Val Ser Ser Leu Ser Ala Lys Lys Ile Pro Ser
85 90 95
Lys Lys Gln Arg His Lys Lys Thr Ser Ser Ser Ser Ser Ser Ser Ser
100 105 110
Arg Ser Ser Ser Ser Ser Ser Arg Glu Thr Ser Ser Ser Ser Ser Thr
115 120 125
Asn
<210> 894
<211> 3696
<212> DNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 894
attttgttca gcccgccaat ttctctttca aacaggccaa tcagctacta cttcgtgcac 60
ttcctggggc gtgtcctgcc gctctatata agcagaggcg gtgacgaatg gtagagtttt 120
tcttggcccg tccgcggcga gagcgcgagc gaagcgagcg atcgagcgtc ccgagggcgg 180
gtgccggagg tgagtttaca caccgcagtc aaggggcaat tcgggctcgg gactggccgg 240
gctatgggca agattcttaa aaaattcccc cgatcccttt gccgccagga cataaaaaca 300
tgccgtggag accgccggtc catagtgtcc aggggcgaga ggatcagtgg ttcgcaagct 360
tttttcacgg ccacgattcg ttttgcggct gcggtgaccc tcttggccat attaatagca 420
ttgctcatcg ctttcctcgc gccggtccac caaggccccc tccggggcta gatcagccta 480
acccccggga gcagggcccg gccggacccg gagggccgcc cgccatcttg gccctgccgg 540
ctccgcccgc ggagcctgac gacccgcagc cacggcgtgg tggtggggac ggtggcgccg 600
ccgctggcgc cgcagacgac catacacaac gagactacga cgaagaagag ctagacgagc 660
ttttccgcgc cgccgccgaa gacgatttgt aagtaggaga tggcgccggc cttacaggcg 720
caggaggaga cgcgggcgac gcagacgcag acgcagacgc agacataagc ccaccctaat 780
actcagacag tggcaacctg actgtatcag acactgtaaa ataacaggat ggatgcccct 840
cattatctgt ggaaaggggt ccacccagtt caactacatc acccacgcgg acgatatcac 900
ccccagggga gcctcctacg gaggcaattt cacaaacatg actttctccc tggaggccat 960
atatgaacag ttcctatacc acagaaacag gtggtcggcc tctaaccacg acctagaact 1020
gtgcagatac aaggggacca ccttaaaact ctacagacac ccagaagtag actacatagt 1080
tacctacagc agaacaggac cctttgaaat cagccacatg acctacctca gcactcaccc 1140
catgctaatg ctgctaaaca agcaccacat tgtggtgccc agcttaaaga ctaagcccag 1200
aggcagaaag gccataaaag tcaggataag gcccccaaaa ctcatgaaca acaagtggta 1260
cttcaccaga gacttctgta acataggcct cttccagctc tgggccacag gcttagaact 1320
cagaaacccc tggctcagaa tgagcaccct gagcccctgc ataggcttta atgtcctcaa 1380
aaacagcatt tacacaaacc tcagcaacct gccacaatac aaaaacgaaa gactaaacat 1440
cattaacaac atacttcacc cacaagaaat tacaggtaca aacaacaaaa agtggcagta 1500
cacatacacc aaactcatgg cccctattta ctattcagca aacagggcca gcacctatga 1560
ctgggaaaat tacagcaaag aaacaaacta caataataca tatgttaaat ttacccagaa 1620
aagacaggaa aaactaacta aaattagaaa agagtggcag atgctttatc cacaacaacc 1680
cacagcactg ccagactcct atgacctcct acaagagtat ggcctctaca gtccatacta 1740
cctaaacccc acaagaataa acctagactg gatgacccca tacacacacg tcagatacaa 1800
tcccctagta gacaagggct ttggaaacag aatatacatc cagtggtgct cagaagcaga 1860
tgttagctac aacaggacaa aatccaagtg tctgctacaa gacatgcccc tgtttttcat 1920
gtgctatggc tacatagact gggcaataaa aaacactgga gtgtcatctc tagtgaagga 1980
cgccagaatc tgcatcaggt gtccctacac agagccacaa ctagttggct ccacagaaga 2040
cataggcttt gtacccatct cagaaacctt catgaggggc gacatgccgg tacttgcacc 2100
atacataccg ttaagctggt tttgcaagtg gtatcccaac atagctcacc aaaaggaagt 2160
ccttgagtca atcatttcct gcagcccctt catgccccgt gaccaagaca tgaacggttg 2220
ggatatcaca atcggttaca aaatggactt cttatggggc ggttcccctc tcccctcaca 2280
gccaatcgac gacccctgcc agcagggaac ccacccgatt cccgaccccg ataaacaccc 2340
tcgcctccta caagtctcga acccgaaact actcggaccg aggacagtgt tccacaagtg 2400
ggacatcaga cgtgggcagt ttagcaaaag aagtattaag agagtgtcag aatactcaag 2460
cgatgatgaa tctcttgcgc caggtctccc atcaaagcga aacaagctcg actcggcgtt 2520
ccgaggagaa aatcgagagc aaaaagaatg ctattctctc ctcaaagcgc tcgaggaaga 2580
agagacccca gaagaagaag aaccagcacc ccaagaaaaa gcccagaaag aggagctact 2640
ccaccagctc cagctccaga gacgccacca gcgagtcctc agacgagggc tcaagctcgt 2700
ctttacagac atcctccgac tccgccaggg agtccactgg aacccggagc tcacatagcg 2760
cccccacctt acataccaga cctgcttttt cccaatactg gtaaaaaaaa aaaattctct 2820
cccttcgatt gggagacaga ggcgcaaata gcggggtgga tgcggcggcc catgcgcttc 2880
tatccctcag acacccctca ctacccgtgg ctaccccccg agcgagatat cccgaaaata 2940
tgtaacataa acttcaaaat aaagcttcaa gagtgagtga ttcgaggccc tcctctgttc 3000
acttagcggt gtctacctct taaggtcact aagcactccg agcgtaagcg aggagtgcga 3060
ccctctacca aggggcaact tcctcggggt ccggcgctac gcgcttcgcg ctgcgccgga 3120
catctcggac ccctcgaccc gaatcgcttg cgcgattcgg acctgcggcc tcgggggggt 3180
cgggggcttt actaaacaga ctccgaggtg ccattggaca ctgtaggggg tgaacagcaa 3240
cgaaagtgag tggggccaga cttcgccata aggcctttat cttcttgcca ttggatagtg 3300
acttccgggt ccgcctgggg gccgccattt tagcttcggc cgccatttta ggccctcgcg 3360
ggcctccgta ggcgcgcttt agtgacgtca cggcagccat tttgtcgtga cgtttgagac 3420
acgtgatggg ggcgtgccta aacccggaag catccctggt cacgtgactc tgacgtcacg 3480
gcggccatct tgtgctgtcc gccatcttgt aacttccttc cgctttttca aaaaaaaaga 3540
ggaagtgtga cgtagcggcg ggggggcggc gcgcttcgcg cgccgcccac cagggggcgc 3600
tgcgcgcccc ccgcgcatgc gcaggggcct ctcgaggggc tccgcccccc ccccgtgcta 3660
aatttaccgc gcatgcgcga ccacgccccc gccgcc 3696
<210> 895
<211> 130
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 895
Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln
1 5 10 15
Trp Phe Ala Ser Phe Phe His Gly His Asp Ser Phe Cys Gly Cys Gly
20 25 30
Asp Pro Leu Gly His Ile Asn Ser Ile Ala His Arg Phe Pro Arg Ala
35 40 45
Gly Pro Pro Arg Pro Pro Pro Gly Leu Asp Gln Pro Asn Pro Arg Glu
50 55 60
Gln Gly Pro Ala Gly Pro Gly Gly Pro Pro Ala Ile Leu Ala Leu Pro
65 70 75 80
Ala Pro Pro Ala Glu Pro Asp Asp Pro Gln Pro Arg Arg Gly Gly Gly
85 90 95
Asp Gly Gly Ala Ala Ala Gly Ala Ala Asp Asp His Thr Gln Arg Asp
100 105 110
Tyr Asp Glu Glu Glu Leu Asp Glu Leu Phe Arg Ala Ala Ala Glu Asp
115 120 125
Asp Leu
130
<210> 896
<211> 303
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 896
Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln
1 5 10 15
Trp Phe Ala Ser Phe Phe His Gly His Asp Ser Phe Cys Gly Cys Gly
20 25 30
Asp Pro Leu Gly His Ile Asn Ser Ile Ala His Arg Phe Pro Arg Ala
35 40 45
Gly Pro Pro Arg Pro Pro Pro Gly Leu Asp Gln Pro Asn Pro Arg Glu
50 55 60
Gln Gly Pro Ala Gly Pro Gly Gly Pro Pro Ala Ile Leu Ala Leu Pro
65 70 75 80
Ala Pro Pro Ala Glu Pro Asp Asp Pro Gln Pro Arg Arg Gly Gly Gly
85 90 95
Asp Gly Gly Ala Ala Ala Gly Ala Ala Asp Asp His Thr Gln Arg Asp
100 105 110
Tyr Asp Glu Glu Glu Leu Asp Glu Leu Phe Arg Ala Ala Ala Glu Asp
115 120 125
Asp Phe Gln Ser Thr Thr Pro Ala Ser Arg Glu Pro Thr Arg Phe Pro
130 135 140
Thr Pro Ile Asn Thr Leu Ala Ser Tyr Lys Ser Arg Thr Arg Asn Tyr
145 150 155 160
Ser Asp Arg Gly Gln Cys Ser Thr Ser Gly Thr Ser Asp Val Gly Ser
165 170 175
Leu Ala Lys Glu Val Leu Arg Glu Cys Gln Asn Thr Gln Ala Met Met
180 185 190
Asn Leu Leu Arg Gln Val Ser His Gln Ser Glu Thr Ser Ser Thr Arg
195 200 205
Arg Ser Glu Glu Lys Ile Glu Ser Lys Lys Asn Ala Ile Leu Ser Ser
210 215 220
Lys Arg Ser Arg Lys Lys Arg Pro Gln Lys Lys Lys Asn Gln His Pro
225 230 235 240
Lys Lys Lys Pro Arg Lys Arg Ser Tyr Ser Thr Ser Ser Ser Ser Arg
245 250 255
Asp Ala Thr Ser Glu Ser Ser Asp Glu Gly Ser Ser Ser Ser Leu Gln
260 265 270
Thr Ser Ser Asp Ser Ala Arg Glu Ser Thr Gly Thr Arg Ser Ser His
275 280 285
Ser Ala Pro Thr Leu His Thr Arg Pro Ala Phe Ser Gln Tyr Trp
290 295 300
<210> 897
<211> 292
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 897
Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln
1 5 10 15
Trp Phe Ala Ser Phe Phe His Gly His Asp Ser Phe Cys Gly Cys Gly
20 25 30
Asp Pro Leu Gly His Ile Asn Ser Ile Ala His Arg Phe Pro Arg Ala
35 40 45
Gly Pro Pro Arg Pro Pro Pro Gly Leu Asp Gln Pro Asn Pro Arg Glu
50 55 60
Gln Gly Pro Ala Gly Pro Gly Gly Pro Pro Ala Ile Leu Ala Leu Pro
65 70 75 80
Ala Pro Pro Ala Glu Pro Asp Asp Pro Gln Pro Arg Arg Gly Gly Gly
85 90 95
Asp Gly Gly Ala Ala Ala Gly Ala Ala Asp Asp His Thr Gln Arg Asp
100 105 110
Tyr Asp Glu Glu Glu Leu Asp Glu Leu Phe Arg Ala Ala Ala Glu Asp
115 120 125
Asp Leu Ser Pro Ile Lys Ala Lys Gln Ala Arg Leu Gly Val Pro Arg
130 135 140
Arg Lys Ser Arg Ala Lys Arg Met Leu Phe Ser Pro Gln Ser Ala Arg
145 150 155 160
Gly Arg Arg Asp Pro Arg Arg Arg Arg Thr Ser Thr Pro Arg Lys Ser
165 170 175
Pro Glu Arg Gly Ala Thr Pro Pro Ala Pro Ala Pro Glu Thr Pro Pro
180 185 190
Ala Ser Pro Gln Thr Arg Ala Gln Ala Arg Leu Tyr Arg His Pro Pro
195 200 205
Thr Pro Pro Gly Ser Pro Leu Glu Pro Gly Ala His Ile Ala Pro Pro
210 215 220
Pro Tyr Ile Pro Asp Leu Leu Phe Pro Asn Thr Gly Lys Lys Lys Lys
225 230 235 240
Phe Ser Pro Phe Asp Trp Glu Thr Glu Ala Gln Ile Ala Gly Trp Met
245 250 255
Arg Arg Pro Met Arg Phe Tyr Pro Ser Asp Thr Pro His Tyr Pro Trp
260 265 270
Leu Pro Pro Glu Arg Asp Ile Pro Lys Ile Cys Asn Ile Asn Phe Lys
275 280 285
Ile Lys Leu Gln
290
<210> 898
<211> 180
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 898
Met Pro Trp Arg Pro Pro Val His Ser Val Gln Gly Arg Glu Asp Gln
1 5 10 15
Trp Ser Pro Ile Lys Ala Lys Gln Ala Arg Leu Gly Val Pro Arg Arg
20 25 30
Lys Ser Arg Ala Lys Arg Met Leu Phe Ser Pro Gln Ser Ala Arg Gly
35 40 45
Arg Arg Asp Pro Arg Arg Arg Arg Thr Ser Thr Pro Arg Lys Ser Pro
50 55 60
Glu Arg Gly Ala Thr Pro Pro Ala Pro Ala Pro Glu Thr Pro Pro Ala
65 70 75 80
Ser Pro Gln Thr Arg Ala Gln Ala Arg Leu Tyr Arg His Pro Pro Thr
85 90 95
Pro Pro Gly Ser Pro Leu Glu Pro Gly Ala His Ile Ala Pro Pro Pro
100 105 110
Tyr Ile Pro Asp Leu Leu Phe Pro Asn Thr Gly Lys Lys Lys Lys Phe
115 120 125
Ser Pro Phe Asp Trp Glu Thr Glu Ala Gln Ile Ala Gly Trp Met Arg
130 135 140
Arg Pro Met Arg Phe Tyr Pro Ser Asp Thr Pro His Tyr Pro Trp Leu
145 150 155 160
Pro Pro Glu Arg Asp Ile Pro Lys Ile Cys Asn Ile Asn Phe Lys Ile
165 170 175
Lys Leu Gln Glu
180
<210> 899
<211> 49
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 899
Ile Val Ser Arg Gly Glu Arg Ile Ser Gly Ser Gln Ala Phe Phe Thr
1 5 10 15
Ala Thr Ile Arg Phe Ala Ala Ala Val Thr Leu Leu Ala Ile Leu Ile
20 25 30
Ala Leu Leu Ile Ala Phe Leu Ala Pro Val His Gln Gly Pro Leu Arg
35 40 45
Gly
<210> 900
<211> 728
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 900
Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg
1 5 10 15
Pro Tyr Thr Thr Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro
20 25 30
Arg Arg Arg Arg Arg Arg Phe Val Ser Arg Arg Trp Arg Arg Pro Tyr
35 40 45
Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg
50 55 60
His Lys Pro Thr Leu Ile Leu Arg Gln Trp Gln Pro Asp Cys Ile Arg
65 70 75 80
His Cys Lys Ile Thr Gly Trp Met Pro Leu Ile Ile Cys Gly Lys Gly
85 90 95
Ser Thr Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg
100 105 110
Gly Ala Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu
115 120 125
Ala Ile Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser
130 135 140
Asn His Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu
145 150 155 160
Tyr Arg His Pro Glu Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly
165 170 175
Pro Phe Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Met Leu
180 185 190
Met Leu Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys
195 200 205
Pro Arg Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu
210 215 220
Met Asn Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu
225 230 235 240
Phe Gln Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg
245 250 255
Met Ser Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser
260 265 270
Ile Tyr Thr Asn Leu Ser Asn Leu Pro Gln Tyr Lys Asn Glu Arg Leu
275 280 285
Asn Ile Ile Asn Asn Ile Leu His Pro Gln Glu Ile Thr Gly Thr Asn
290 295 300
Asn Lys Lys Trp Gln Tyr Thr Tyr Thr Lys Leu Met Ala Pro Ile Tyr
305 310 315 320
Tyr Ser Ala Asn Arg Ala Ser Thr Tyr Asp Trp Glu Asn Tyr Ser Lys
325 330 335
Glu Thr Asn Tyr Asn Asn Thr Tyr Val Lys Phe Thr Gln Lys Arg Gln
340 345 350
Glu Lys Leu Thr Lys Ile Arg Lys Glu Trp Gln Met Leu Tyr Pro Gln
355 360 365
Gln Pro Thr Ala Leu Pro Asp Ser Tyr Asp Leu Leu Gln Glu Tyr Gly
370 375 380
Leu Tyr Ser Pro Tyr Tyr Leu Asn Pro Thr Arg Ile Asn Leu Asp Trp
385 390 395 400
Met Thr Pro Tyr Thr His Val Arg Tyr Asn Pro Leu Val Asp Lys Gly
405 410 415
Phe Gly Asn Arg Ile Tyr Ile Gln Trp Cys Ser Glu Ala Asp Val Ser
420 425 430
Tyr Asn Arg Thr Lys Ser Lys Cys Leu Leu Gln Asp Met Pro Leu Phe
435 440 445
Phe Met Cys Tyr Gly Tyr Ile Asp Trp Ala Ile Lys Asn Thr Gly Val
450 455 460
Ser Ser Leu Val Lys Asp Ala Arg Ile Cys Ile Arg Cys Pro Tyr Thr
465 470 475 480
Glu Pro Gln Leu Val Gly Ser Thr Glu Asp Ile Gly Phe Val Pro Ile
485 490 495
Ser Glu Thr Phe Met Arg Gly Asp Met Pro Val Leu Ala Pro Tyr Ile
500 505 510
Pro Leu Ser Trp Phe Cys Lys Trp Tyr Pro Asn Ile Ala His Gln Lys
515 520 525
Glu Val Leu Glu Ser Ile Ile Ser Cys Ser Pro Phe Met Pro Arg Asp
530 535 540
Gln Asp Met Asn Gly Trp Asp Ile Thr Ile Gly Tyr Lys Met Asp Phe
545 550 555 560
Leu Trp Gly Gly Ser Pro Leu Pro Ser Gln Pro Ile Asp Asp Pro Cys
565 570 575
Gln Gln Gly Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu
580 585 590
Leu Gln Val Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His
595 600 605
Lys Trp Asp Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg
610 615 620
Val Ser Glu Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro
625 630 635 640
Ser Lys Arg Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Arg Glu
645 650 655
Gln Lys Glu Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr
660 665 670
Pro Glu Glu Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu
675 680 685
Leu Leu His Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg
690 695 700
Arg Gly Leu Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly
705 710 715 720
Val His Trp Asn Pro Glu Leu Thr
725
<210> 901
<211> 197
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 901
Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg
1 5 10 15
Pro Tyr Thr Thr Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro
20 25 30
Arg Arg Arg Arg Arg Arg Phe Pro Ile Asp Asp Pro Cys Gln Gln Gly
35 40 45
Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu Leu Gln Val
50 55 60
Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His Lys Trp Asp
65 70 75 80
Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg Val Ser Glu
85 90 95
Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro Ser Lys Arg
100 105 110
Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Arg Glu Gln Lys Glu
115 120 125
Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr Pro Glu Glu
130 135 140
Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu Leu Leu His
145 150 155 160
Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg Arg Gly Leu
165 170 175
Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly Val His Trp
180 185 190
Asn Pro Glu Leu Thr
195
<210> 902
<211> 145
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 902
Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg
1 5 10 15
Pro Tyr Thr Thr Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro
20 25 30
Arg Arg Arg Arg Arg Arg Phe Val Ser His Gln Ser Glu Thr Ser Ser
35 40 45
Thr Arg Arg Ser Glu Glu Lys Ile Glu Ser Lys Lys Asn Ala Ile Leu
50 55 60
Ser Ser Lys Arg Ser Arg Lys Lys Arg Pro Gln Lys Lys Lys Asn Gln
65 70 75 80
His Pro Lys Lys Lys Pro Arg Lys Arg Ser Tyr Ser Thr Ser Ser Ser
85 90 95
Ser Arg Asp Ala Thr Ser Glu Ser Ser Asp Glu Gly Ser Ser Ser Ser
100 105 110
Leu Gln Thr Ser Ser Asp Ser Ala Arg Glu Ser Thr Gly Thr Arg Ser
115 120 125
Ser His Ser Ala Pro Thr Leu His Thr Arg Pro Ala Phe Ser Gln Tyr
130 135 140
Trp
145
<210> 903
<400> 903
000
<210> 904
<400> 904
000
<210> 905
<400> 905
000
<210> 906
<400> 906
000
<210> 907
<400> 907
000
<210> 908
<400> 908
000
<210> 909
<400> 909
000
<210> 910
<400> 910
000
<210> 911
<400> 911
000
<210> 912
<400> 912
000
<210> 913
<400> 913
000
<210> 914
<400> 914
000
<210> 915
<400> 915
000
<210> 916
<400> 916
000
<210> 917
<400> 917
000
<210> 918
<400> 918
000
<210> 919
<211> 677
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 919
Met Pro Phe Trp Trp Arg Arg Arg Asn Lys Arg Trp Trp Gly Arg Arg
1 5 10 15
Phe Arg Tyr Arg Arg Tyr Asn Lys Tyr Lys Thr Arg Arg Arg Arg Arg
20 25 30
Ile Pro Arg Arg Arg Asn Arg Arg Phe Thr Lys Thr Arg Arg Arg Arg
35 40 45
Lys Arg Lys Lys Val Arg Arg Lys Leu Lys Lys Ile Thr Ile Lys Gln
50 55 60
Trp Gln Pro Asp Ser Val Lys Lys Cys Lys Ile Lys Gly Tyr Ser Thr
65 70 75 80
Leu Val Met Gly Ala Gln Gly Lys Gln Tyr Asn Cys Tyr Thr Asn Gln
85 90 95
Ala Ser Asp Tyr Val Gln Pro Lys Ala Pro Gln Gly Gly Gly Phe Gly
100 105 110
Cys Glu Val Phe Asn Leu Lys Trp Leu Tyr Gln Glu Tyr Thr Ala His
115 120 125
Arg Asn Ile Trp Thr Lys Thr Asn Glu Tyr Thr Asp Leu Cys Arg Tyr
130 135 140
Thr Gly Ala Gln Ile Ile Leu Tyr Arg His Pro Asp Val Asp Phe Ile
145 150 155 160
Val Ser Trp Asp Asn Gln Pro Pro Phe Leu Leu Asn Lys Tyr Thr Tyr
165 170 175
Pro Glu Leu Gln Pro Gln Asn Leu Leu Leu Ala Arg Arg Lys Arg Ile
180 185 190
Ile Leu Ser Gln Lys Ser Asn Pro Lys Gly Lys Leu Arg Ile Lys Leu
195 200 205
Arg Ile Pro Pro Pro Lys Gln Met Ile Thr Lys Trp Phe Phe Gln Arg
210 215 220
Asp Phe Cys Asp Val Asn Leu Phe Lys Leu Cys Ala Ser Ala Ala Ser
225 230 235 240
Phe Arg Tyr Pro Gly Ile Ser His Gly Ala Gln Ser Thr Ile Phe Ser
245 250 255
Ala Tyr Ala Leu Asn Thr Asp Phe Tyr Gln Cys Ser Asp Trp Cys Gln
260 265 270
Thr Asn Thr Glu Thr Gly Tyr Leu Asn Ile Lys Thr Gln Gln Met Pro
275 280 285
Leu Trp Phe His Tyr Arg Glu Gly Gly Lys Glu Lys Trp Tyr Lys Tyr
290 295 300
Thr Asn Lys Glu His Arg Pro Tyr Thr Asn Thr Tyr Leu Lys Ser Ile
305 310 315 320
Ser Tyr Asn Asp Gly Leu Phe Ser Pro Lys Ala Met Phe Ala Phe Glu
325 330 335
Val Lys Ala Gly Gly Glu Gly Thr Thr Glu Pro Pro Gln Gly Ala Gln
340 345 350
Leu Ile Ala Asn Leu Pro Leu Ile Ala Leu Arg Tyr Asn Pro His Glu
355 360 365
Asp Thr Gly His Gly Asn Glu Ile Tyr Leu Thr Ser Thr Phe Lys Gly
370 375 380
Thr Tyr Asp Lys Pro Lys Val Thr Asp Ala Leu Tyr Phe Asn Asn Val
385 390 395 400
Pro Leu Trp Met Gly Phe Tyr Gly Tyr Trp Asp Phe Ile Leu Gln Glu
405 410 415
Thr Lys Asn Lys Gly Val Phe Asp Gln His Met Phe Val Val Lys Cys
420 425 430
Pro Ala Leu Arg Pro Ile Ser Gln Val Thr Lys Gln Val Tyr Tyr Pro
435 440 445
Leu Val Asp Met Asp Phe Cys Ser Gly Arg Leu Pro Phe Asp Glu Tyr
450 455 460
Leu Ser Lys Asp Ile Lys Ser His Trp Tyr Pro Thr Ala Glu Arg Gln
465 470 475 480
Thr Val Thr Ile Asn Asn Phe Val Thr Ala Gly Pro Tyr Met Pro Lys
485 490 495
Phe Glu Pro Thr Asp Lys Asp Ser Thr Trp Gln Leu Asn Tyr His Tyr
500 505 510
Lys Phe Phe Phe Lys Trp Gly Gly Pro Gln Val Thr Asp Pro Thr Val
515 520 525
Glu Asp Pro Cys Ser Arg Asn Lys Tyr Pro Val Pro Asp Thr Met Gln
530 535 540
Gln Thr Ile Gln Ile Lys Asn Pro Glu Lys Leu His Pro Ala Thr Leu
545 550 555 560
Phe His Asp Trp Asp Leu Arg Arg Gly Phe Ile Thr Gln Ala Ala Ile
565 570 575
Lys Arg Met Ser Glu Asn Leu Gln Ile Asp Ser Ser Phe Glu Ser Asp
580 585 590
Gly Thr Glu Ser Pro Lys Lys Lys Lys Arg Cys Thr Lys Glu Ile Pro
595 600 605
Thr Gln Asn Gln Lys Gln Glu Glu Ile Gln Glu Cys Leu Leu Ser Leu
610 615 620
Cys Glu Glu Pro Thr Cys Gln Glu Glu Thr Glu Asp Leu Gln Leu Phe
625 630 635 640
Ile Gln Gln Gln Gln Gln Gln Gln Tyr Lys Leu Arg Lys Asn Leu Phe
645 650 655
Lys Leu Leu Thr His Leu Lys Lys Gly Gln Arg Ile Ser Gln Leu Gln
660 665 670
Thr Gly Leu Leu Glu
675
<210> 920
<211> 59
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 920
Met Pro Phe Trp Trp Arg Arg Arg Asn Lys Arg Trp Trp Gly Arg Arg
1 5 10 15
Phe Arg Tyr Arg Arg Tyr Asn Lys Tyr Lys Thr Arg Arg Arg Arg Arg
20 25 30
Ile Pro Arg Arg Arg Asn Arg Arg Phe Thr Lys Thr Arg Arg Arg Arg
35 40 45
Lys Arg Lys Lys Val Arg Arg Lys Leu Lys Lys
50 55
<210> 921
<211> 201
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 921
Ile Thr Ile Lys Gln Trp Gln Pro Asp Ser Val Lys Lys Cys Lys Ile
1 5 10 15
Lys Gly Tyr Ser Thr Leu Val Met Gly Ala Gln Gly Lys Gln Tyr Asn
20 25 30
Cys Tyr Thr Asn Gln Ala Ser Asp Tyr Val Gln Pro Lys Ala Pro Gln
35 40 45
Gly Gly Gly Phe Gly Cys Glu Val Phe Asn Leu Lys Trp Leu Tyr Gln
50 55 60
Glu Tyr Thr Ala His Arg Asn Ile Trp Thr Lys Thr Asn Glu Tyr Thr
65 70 75 80
Asp Leu Cys Arg Tyr Thr Gly Ala Gln Ile Ile Leu Tyr Arg His Pro
85 90 95
Asp Val Asp Phe Ile Val Ser Trp Asp Asn Gln Pro Pro Phe Leu Leu
100 105 110
Asn Lys Tyr Thr Tyr Pro Glu Leu Gln Pro Gln Asn Leu Leu Leu Ala
115 120 125
Arg Arg Lys Arg Ile Ile Leu Ser Gln Lys Ser Asn Pro Lys Gly Lys
130 135 140
Leu Arg Ile Lys Leu Arg Ile Pro Pro Pro Lys Gln Met Ile Thr Lys
145 150 155 160
Trp Phe Phe Gln Arg Asp Phe Cys Asp Val Asn Leu Phe Lys Leu Cys
165 170 175
Ala Ser Ala Ala Ser Phe Arg Tyr Pro Gly Ile Ser His Gly Ala Gln
180 185 190
Ser Thr Ile Phe Ser Ala Tyr Ala Leu
195 200
<210> 922
<211> 96
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 922
Asn Thr Asp Phe Tyr Gln Cys Ser Asp Trp Cys Gln Thr Asn Thr Glu
1 5 10 15
Thr Gly Tyr Leu Asn Ile Lys Thr Gln Gln Met Pro Leu Trp Phe His
20 25 30
Tyr Arg Glu Gly Gly Lys Glu Lys Trp Tyr Lys Tyr Thr Asn Lys Glu
35 40 45
His Arg Pro Tyr Thr Asn Thr Tyr Leu Lys Ser Ile Ser Tyr Asn Asp
50 55 60
Gly Leu Phe Ser Pro Lys Ala Met Phe Ala Phe Glu Val Lys Ala Gly
65 70 75 80
Gly Glu Gly Thr Thr Glu Pro Pro Gln Gly Ala Gln Leu Ile Ala Asn
85 90 95
<210> 923
<211> 161
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 923
Leu Pro Leu Ile Ala Leu Arg Tyr Asn Pro His Glu Asp Thr Gly His
1 5 10 15
Gly Asn Glu Ile Tyr Leu Thr Ser Thr Phe Lys Gly Thr Tyr Asp Lys
20 25 30
Pro Lys Val Thr Asp Ala Leu Tyr Phe Asn Asn Val Pro Leu Trp Met
35 40 45
Gly Phe Tyr Gly Tyr Trp Asp Phe Ile Leu Gln Glu Thr Lys Asn Lys
50 55 60
Gly Val Phe Asp Gln His Met Phe Val Val Lys Cys Pro Ala Leu Arg
65 70 75 80
Pro Ile Ser Gln Val Thr Lys Gln Val Tyr Tyr Pro Leu Val Asp Met
85 90 95
Asp Phe Cys Ser Gly Arg Leu Pro Phe Asp Glu Tyr Leu Ser Lys Asp
100 105 110
Ile Lys Ser His Trp Tyr Pro Thr Ala Glu Arg Gln Thr Val Thr Ile
115 120 125
Asn Asn Phe Val Thr Ala Gly Pro Tyr Met Pro Lys Phe Glu Pro Thr
130 135 140
Asp Lys Asp Ser Thr Trp Gln Leu Asn Tyr His Tyr Lys Phe Phe Phe
145 150 155 160
Lys
<210> 924
<211> 160
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 924
Trp Gly Gly Pro Gln Val Thr Asp Pro Thr Val Glu Asp Pro Cys Ser
1 5 10 15
Arg Asn Lys Tyr Pro Val Pro Asp Thr Met Gln Gln Thr Ile Gln Ile
20 25 30
Lys Asn Pro Glu Lys Leu His Pro Ala Thr Leu Phe His Asp Trp Asp
35 40 45
Leu Arg Arg Gly Phe Ile Thr Gln Ala Ala Ile Lys Arg Met Ser Glu
50 55 60
Asn Leu Gln Ile Asp Ser Ser Phe Glu Ser Asp Gly Thr Glu Ser Pro
65 70 75 80
Lys Lys Lys Lys Arg Cys Thr Lys Glu Ile Pro Thr Gln Asn Gln Lys
85 90 95
Gln Glu Glu Ile Gln Glu Cys Leu Leu Ser Leu Cys Glu Glu Pro Thr
100 105 110
Cys Gln Glu Glu Thr Glu Asp Leu Gln Leu Phe Ile Gln Gln Gln Gln
115 120 125
Gln Gln Gln Tyr Lys Leu Arg Lys Asn Leu Phe Lys Leu Leu Thr His
130 135 140
Leu Lys Lys Gly Gln Arg Ile Ser Gln Leu Gln Thr Gly Leu Leu Glu
145 150 155 160
<210> 925
<211> 662
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 925
Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg
1 5 10 15
Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg
20 25 30
Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg
35 40 45
Lys Leu Arg Lys Val Lys Arg Lys Lys Lys Ser Leu Ile Val Arg Gln
50 55 60
Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys Ile Ile Gly Gln Ser Ala
65 70 75 80
Ile Val Val Gly Ala Glu Gly Lys Gln Met Tyr Cys Tyr Thr Val Asn
85 90 95
Lys Leu Ile Asn Val Pro Pro Lys Thr Pro Tyr Gly Gly Gly Phe Gly
100 105 110
Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala
115 120 125
Gln Asn Ile Trp Thr Gln Ser Asn Val Leu Lys Asp Leu Cys Arg Tyr
130 135 140
Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp Asn Lys Thr Asp Phe Val
145 150 155 160
Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln Leu Thr Lys Phe Thr Tyr
165 170 175
Pro Gly Ala His Pro Gln Gln Ile Met Leu Gln Lys His His Lys Phe
180 185 190
Ile Leu Ser Gln Met Thr Lys Pro Asn Gly Arg Leu Thr Lys Lys Leu
195 200 205
Lys Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Ser Lys
210 215 220
Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu Lys Ala Ser Ala Leu Asp
225 230 235 240
Leu Arg His Ser Tyr Leu Gly Cys Cys Asn Glu Asn Pro Gln Val Phe
245 250 255
Phe Tyr Tyr Leu Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala
260 265 270
Gln Ser Ser Thr Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr
275 280 285
Tyr Tyr Arg Tyr Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His
290 295 300
Glu Tyr Glu Lys Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser
305 310 315 320
Phe Leu Gln Thr Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys
325 330 335
Ile Ala Glu Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp
340 345 350
Asn Gly Asp Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr
355 360 365
Trp Asp Gln Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro
370 375 380
Ile Trp Leu Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys
385 390 395 400
Ala Asp Lys Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro
405 410 415
Ala Ile Phe Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro
420 425 430
Leu Ser Gln Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro
435 440 445
Thr Leu Leu Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln
450 455 460
Glu Ile Ile Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr
465 470 475 480
Ala Asn Gln Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe
485 490 495
Thr Phe Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp
500 505 510
Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr
515 520 525
Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His
530 535 540
Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg
545 550 555 560
Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu
565 570 575
Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val
580 585 590
Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys
595 600 605
Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln
610 615 620
Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile
625 630 635 640
Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu
645 650 655
His Thr Gly Met Leu Pro
660
<210> 926
<211> 58
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 926
Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg
1 5 10 15
Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg
20 25 30
Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg
35 40 45
Lys Leu Arg Lys Val Lys Arg Lys Lys Lys
50 55
<210> 927
<211> 202
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 927
Ser Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys
1 5 10 15
Ile Ile Gly Gln Ser Ala Ile Val Val Gly Ala Glu Gly Lys Gln Met
20 25 30
Tyr Cys Tyr Thr Val Asn Lys Leu Ile Asn Val Pro Pro Lys Thr Pro
35 40 45
Tyr Gly Gly Gly Phe Gly Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr
50 55 60
Glu Glu Tyr Arg Phe Ala Gln Asn Ile Trp Thr Gln Ser Asn Val Leu
65 70 75 80
Lys Asp Leu Cys Arg Tyr Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp
85 90 95
Asn Lys Thr Asp Phe Val Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln
100 105 110
Leu Thr Lys Phe Thr Tyr Pro Gly Ala His Pro Gln Gln Ile Met Leu
115 120 125
Gln Lys His His Lys Phe Ile Leu Ser Gln Met Thr Lys Pro Asn Gly
130 135 140
Arg Leu Thr Lys Lys Leu Lys Ile Lys Pro Pro Lys Gln Met Leu Ser
145 150 155 160
Lys Trp Phe Phe Ser Lys Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu
165 170 175
Lys Ala Ser Ala Leu Asp Leu Arg His Ser Tyr Leu Gly Cys Cys Asn
180 185 190
Glu Asn Pro Gln Val Phe Phe Tyr Tyr Leu
195 200
<210> 928
<211> 79
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 928
Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala Gln Ser Ser Thr
1 5 10 15
Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr Tyr Tyr Arg Tyr
20 25 30
Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His Glu Tyr Glu Lys
35 40 45
Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser Phe Leu Gln Thr
50 55 60
Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys Ile Ala Glu
65 70 75
<210> 929
<211> 160
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 929
Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp Asn Gly Asp
1 5 10 15
Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr Trp Asp Gln
20 25 30
Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro Ile Trp Leu
35 40 45
Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys Ala Asp Lys
50 55 60
Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro Ala Ile Phe
65 70 75 80
Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro Leu Ser Gln
85 90 95
Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro Thr Leu Leu
100 105 110
Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln Glu Ile Ile
115 120 125
Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr Ala Asn Gln
130 135 140
Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe Thr Phe Lys
145 150 155 160
<210> 930
<211> 163
<212> PRT
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 930
Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp Pro Ser Lys
1 5 10 15
Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr Ile Gln Ile
20 25 30
Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His Asp Trp Asp
35 40 45
Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg Met Ser Thr
50 55 60
Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu Glu Asp Ile
65 70 75 80
Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val Pro Gln Gln
85 90 95
Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys Lys Lys Asp
100 105 110
Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln Leu Ile Lys
115 120 125
Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile Leu Gln Leu
130 135 140
Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu His Thr Gly
145 150 155 160
Met Leu Pro
<210> 931
<211> 728
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 931
Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg
1 5 10 15
Pro Tyr Thr Thr Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro
20 25 30
Arg Arg Arg Arg Arg Arg Phe Val Ser Arg Arg Trp Arg Arg Pro Tyr
35 40 45
Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg
50 55 60
His Lys Pro Thr Leu Ile Leu Arg Gln Trp Gln Pro Asp Cys Ile Arg
65 70 75 80
His Cys Lys Ile Thr Gly Trp Met Pro Leu Ile Ile Cys Gly Lys Gly
85 90 95
Ser Thr Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg
100 105 110
Gly Ala Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu
115 120 125
Ala Ile Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser
130 135 140
Asn His Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu
145 150 155 160
Tyr Arg His Pro Glu Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly
165 170 175
Pro Phe Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Met Leu
180 185 190
Met Leu Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys
195 200 205
Pro Arg Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu
210 215 220
Met Asn Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu
225 230 235 240
Phe Gln Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg
245 250 255
Met Ser Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser
260 265 270
Ile Tyr Thr Asn Leu Ser Asn Leu Pro Gln Tyr Lys Asn Glu Arg Leu
275 280 285
Asn Ile Ile Asn Asn Ile Leu His Pro Gln Glu Ile Thr Gly Thr Asn
290 295 300
Asn Lys Lys Trp Gln Tyr Thr Tyr Thr Lys Leu Met Ala Pro Ile Tyr
305 310 315 320
Tyr Ser Ala Asn Arg Ala Ser Thr Tyr Asp Trp Glu Asn Tyr Ser Lys
325 330 335
Glu Thr Asn Tyr Asn Asn Thr Tyr Val Lys Phe Thr Gln Lys Arg Gln
340 345 350
Glu Lys Leu Thr Lys Ile Arg Lys Glu Trp Gln Met Leu Tyr Pro Gln
355 360 365
Gln Pro Thr Ala Leu Pro Asp Ser Tyr Asp Leu Leu Gln Glu Tyr Gly
370 375 380
Leu Tyr Ser Pro Tyr Tyr Leu Asn Pro Thr Arg Ile Asn Leu Asp Trp
385 390 395 400
Met Thr Pro Tyr Thr His Val Arg Tyr Asn Pro Leu Val Asp Lys Gly
405 410 415
Phe Gly Asn Arg Ile Tyr Ile Gln Trp Cys Ser Glu Ala Asp Val Ser
420 425 430
Tyr Asn Arg Thr Lys Ser Lys Cys Leu Leu Gln Asp Met Pro Leu Phe
435 440 445
Phe Met Cys Tyr Gly Tyr Ile Asp Trp Ala Ile Lys Asn Thr Gly Val
450 455 460
Ser Ser Leu Val Lys Asp Ala Arg Ile Cys Ile Arg Cys Pro Tyr Thr
465 470 475 480
Glu Pro Gln Leu Val Gly Ser Thr Glu Asp Ile Gly Phe Val Pro Ile
485 490 495
Ser Glu Thr Phe Met Arg Gly Asp Met Pro Val Leu Ala Pro Tyr Ile
500 505 510
Pro Leu Ser Trp Phe Cys Lys Trp Tyr Pro Asn Ile Ala His Gln Lys
515 520 525
Glu Val Leu Glu Ser Ile Ile Ser Cys Ser Pro Phe Met Pro Arg Asp
530 535 540
Gln Asp Met Asn Gly Trp Asp Ile Thr Ile Gly Tyr Lys Met Asp Phe
545 550 555 560
Leu Trp Gly Gly Ser Pro Leu Pro Ser Gln Pro Ile Asp Asp Pro Cys
565 570 575
Gln Gln Gly Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu
580 585 590
Leu Gln Val Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His
595 600 605
Lys Trp Asp Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg
610 615 620
Val Ser Glu Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro
625 630 635 640
Ser Lys Arg Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Arg Glu
645 650 655
Gln Lys Glu Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr
660 665 670
Pro Glu Glu Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu
675 680 685
Leu Leu His Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg
690 695 700
Arg Gly Leu Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly
705 710 715 720
Val His Trp Asn Pro Glu Leu Thr
725
<210> 932
<211> 66
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 932
Thr Ala Trp Trp Trp Gly Arg Trp Arg Arg Arg Trp Arg Arg Arg Arg
1 5 10 15
Pro Tyr Thr Thr Arg Leu Arg Arg Arg Arg Ala Arg Arg Ala Phe Pro
20 25 30
Arg Arg Arg Arg Arg Arg Phe Val Ser Arg Arg Trp Arg Arg Pro Tyr
35 40 45
Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg
50 55 60
His Lys
65
<210> 933
<211> 211
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 933
Pro Thr Leu Ile Leu Arg Gln Trp Gln Pro Asp Cys Ile Arg His Cys
1 5 10 15
Lys Ile Thr Gly Trp Met Pro Leu Ile Ile Cys Gly Lys Gly Ser Thr
20 25 30
Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg Gly Ala
35 40 45
Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu Ala Ile
50 55 60
Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser Asn His
65 70 75 80
Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu Tyr Arg
85 90 95
His Pro Glu Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly Pro Phe
100 105 110
Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Met Leu Met Leu
115 120 125
Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys Pro Arg
130 135 140
Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu Met Asn
145 150 155 160
Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu Phe Gln
165 170 175
Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg Met Ser
180 185 190
Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser Ile Tyr
195 200 205
Thr Asn Leu
210
<210> 934
<211> 118
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 934
Ser Asn Leu Pro Gln Tyr Lys Asn Glu Arg Leu Asn Ile Ile Asn Asn
1 5 10 15
Ile Leu His Pro Gln Glu Ile Thr Gly Thr Asn Asn Lys Lys Trp Gln
20 25 30
Tyr Thr Tyr Thr Lys Leu Met Ala Pro Ile Tyr Tyr Ser Ala Asn Arg
35 40 45
Ala Ser Thr Tyr Asp Trp Glu Asn Tyr Ser Lys Glu Thr Asn Tyr Asn
50 55 60
Asn Thr Tyr Val Lys Phe Thr Gln Lys Arg Gln Glu Lys Leu Thr Lys
65 70 75 80
Ile Arg Lys Glu Trp Gln Met Leu Tyr Pro Gln Gln Pro Thr Ala Leu
85 90 95
Pro Asp Ser Tyr Asp Leu Leu Gln Glu Tyr Gly Leu Tyr Ser Pro Tyr
100 105 110
Tyr Leu Asn Pro Thr Arg
115
<210> 935
<211> 166
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 935
Ile Asn Leu Asp Trp Met Thr Pro Tyr Thr His Val Arg Tyr Asn Pro
1 5 10 15
Leu Val Asp Lys Gly Phe Gly Asn Arg Ile Tyr Ile Gln Trp Cys Ser
20 25 30
Glu Ala Asp Val Ser Tyr Asn Arg Thr Lys Ser Lys Cys Leu Leu Gln
35 40 45
Asp Met Pro Leu Phe Phe Met Cys Tyr Gly Tyr Ile Asp Trp Ala Ile
50 55 60
Lys Asn Thr Gly Val Ser Ser Leu Val Lys Asp Ala Arg Ile Cys Ile
65 70 75 80
Arg Cys Pro Tyr Thr Glu Pro Gln Leu Val Gly Ser Thr Glu Asp Ile
85 90 95
Gly Phe Val Pro Ile Ser Glu Thr Phe Met Arg Gly Asp Met Pro Val
100 105 110
Leu Ala Pro Tyr Ile Pro Leu Ser Trp Phe Cys Lys Trp Tyr Pro Asn
115 120 125
Ile Ala His Gln Lys Glu Val Leu Glu Ser Ile Ile Ser Cys Ser Pro
130 135 140
Phe Met Pro Arg Asp Gln Asp Met Asn Gly Trp Asp Ile Thr Ile Gly
145 150 155 160
Tyr Lys Met Asp Phe Leu
165
<210> 936
<211> 167
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 936
Trp Gly Gly Ser Pro Leu Pro Ser Gln Pro Ile Asp Asp Pro Cys Gln
1 5 10 15
Gln Gly Thr His Pro Ile Pro Asp Pro Asp Lys His Pro Arg Leu Leu
20 25 30
Gln Val Ser Asn Pro Lys Leu Leu Gly Pro Arg Thr Val Phe His Lys
35 40 45
Trp Asp Ile Arg Arg Gly Gln Phe Ser Lys Arg Ser Ile Lys Arg Val
50 55 60
Ser Glu Tyr Ser Ser Asp Asp Glu Ser Leu Ala Pro Gly Leu Pro Ser
65 70 75 80
Lys Arg Asn Lys Leu Asp Ser Ala Phe Arg Gly Glu Asn Arg Glu Gln
85 90 95
Lys Glu Cys Tyr Ser Leu Leu Lys Ala Leu Glu Glu Glu Glu Thr Pro
100 105 110
Glu Glu Glu Glu Pro Ala Pro Gln Glu Lys Ala Gln Lys Glu Glu Leu
115 120 125
Leu His Gln Leu Gln Leu Gln Arg Arg His Gln Arg Val Leu Arg Arg
130 135 140
Gly Leu Lys Leu Val Phe Thr Asp Ile Leu Arg Leu Arg Gln Gly Val
145 150 155 160
His Trp Asn Pro Glu Leu Thr
165
<210> 937
<400> 937
000
<210> 938
<400> 938
000
<210> 939
<400> 939
000
<210> 940
<400> 940
000
<210> 941
<400> 941
000
<210> 942
<400> 942
000
<210> 943
<400> 943
000
<210> 944
<400> 944
000
<210> 945
<400> 945
000
<210> 946
<400> 946
000
<210> 947
<400> 947
000
<210> 948
<400> 948
000
<210> 949
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
<220>
<221> 经修饰的残基
<222> (1)..(1)
<223> W或F
<220>
<221> 经修饰的残基
<222> (2)..(8)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (10)..(12)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (14)..(14)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (16)..(20)
<223> 任何氨基酸
<400> 949
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa
1 5 10 15
Xaa Xaa Xaa Xaa His
20
<210> 950
<400> 950
000
<210> 951
<400> 951
000
<210> 952
<400> 952
000
<210> 953
<400> 953
000
<210> 954
<400> 954
000
<210> 955
<400> 955
000
<210> 956
<400> 956
000
<210> 957
<400> 957
000
<210> 958
<400> 958
000
<210> 959
<400> 959
000
<210> 960
<400> 960
000
<210> 961
<400> 961
000
<210> 962
<400> 962
000
<210> 963
<400> 963
000
<210> 964
<400> 964
000
<210> 965
<400> 965
000
<210> 966
<400> 966
000
<210> 967
<400> 967
000
<210> 968
<400> 968
000
<210> 969
<400> 969
000
<210> 970
<400> 970
000
<210> 971
<400> 971
000
<210> 972
<400> 972
000
<210> 973
<400> 973
000
<210> 974
<400> 974
000
<210> 975
<400> 975
000
<210> 976
<400> 976
000
<210> 977
<400> 977
000
<210> 978
<400> 978
000
<210> 979
<400> 979
000
<210> 980
<400> 980
000
<210> 981
<400> 981
000
<210> 982
<400> 982
000
<210> 983
<400> 983
000
<210> 984
<400> 984
000
<210> 985
<400> 985
000
<210> 986
<400> 986
000
<210> 987
<400> 987
000
<210> 988
<400> 988
000
<210> 989
<400> 989
000
<210> 990
<400> 990
000
<210> 991
<400> 991
000
<210> 992
<400> 992
000
<210> 993
<400> 993
000
<210> 994
<400> 994
000
<210> 995
<400> 995
000
<210> 996
<400> 996
000
<210> 997
<400> 997
000
<210> 998
<400> 998
000
<210> 999
<400> 999
000
<210> 1000
<400> 1000
000
<210> 1001
<211> 2845
<212> DNA
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1001
ttattaatat tcaacaggaa aaccacctaa tttaaattgc cgaccacaaa ccgtcactaa 60
cttccttatt taacattact tcccttttaa ccaatgaata ttcatacaac acatcacact 120
tcctgggagg agacataaaa ctatataact aactacacag acgaatggct gagtttatgc 180
cgctagacgg aggacgcaca gctactgctg cgacctgaac ttgggcgggt gccgaaggtg 240
agtgtaacca ccgtagtcaa ggggcaattc gggctagttc agtctagcgg aacgggcaag 300
attattaata caaacttatt tttacagatg agcaaacaac taaaaccaac tttatacaaa 360
gacaaatcat tggaattaca atggctaaac aacattttta gctctcacga cctgtgctgc 420
ggctgcaacg atccagtttt acatttactg attttaatta acaaaaccgg agaagcacct 480
aaaccagaag aagacattaa aaatataaaa tgcctcctta ctggcgccaa aaatactacc 540
gaagaagata tagacctttc tcctggagaa ctagaagaat tattcaaaga agaaaaagat 600
ggagataccg caaaccaaga aaaacatact ggagaagaaa actgcgggta agaaaacgtt 660
tttataaaag aaagttaaaa aaaattgtac ttaaacagtt tcaaccaaaa attattagaa 720
gatgtacaat atttggaaca atctgcctat ttcaaggctc tccagaaaga gccaacaata 780
attatattca aacaatctac tcctacgtac cagataaaga accaggagga gggggatgga 840
ctttaataac tgaaagctta agtagtttat gggaagactg ggaacattta aaaaatgtat 900
ggactcaaag taacgctggt ttaccacttg taagatacgg gggagtaaca ttatactttt 960
atcaatctgc ctatactgac tatattgctc aagttttcaa ctgttatcct atgacagaca 1020
caaaatacac acatgcagac tcagcaccaa acagaatgtt attaaaaaaa catgtaataa 1080
gagtacctag cagagaaaca cgcaaaaaaa gaaagccata caaaagagtt agagtaggac 1140
ctccttctca aatgcaaaac aaatggtact ttcaaagaga catatgtgaa ataccattaa 1200
taatgattgc agccacagcc gttgacttta gatatccctt ttgtgcaagc gactgtgcta 1260
gtaacaactt aactctaaca tgtttaaacc cactattgtt tcaaaaccaa gactttgacc 1320
acccatccga tacacaaggc tactttccaa aacctggagt atatctatac tcaacacaaa 1380
gaagtaacaa gccaagttct tcagactgta tatacttagg aaacacaaaa gacaatcaag 1440
aaggtaaatc tgcaagtagt ctaatgactc taaaaacaca aaaaataaca gattggggaa 1500
atccattttg gcattattat atagacggtt ctaaaaaaat attttcttac tttaaacccc 1560
catcacaatt agacagcagc gactttgaac acatgacaga attagcagaa ccaatgttta 1620
tacaagttag atacaaccca gaaagagaca caggacaagg aaacttaata tacgtaacag 1680
aaaactttag aggacaacac tgggaccctc catctagtga caacctaaaa ttagatggat 1740
ttcccttata tgacatgtgc tggggtttca tagactggat agaaaaagtt catgaaacag 1800
aaaacttact taccaactac tgcttctgta ttagaagcag cgctttcaat gaaaaaaaaa 1860
cagtttttat acctgtagat cattcatttt taacaggttt tagcccatat gaaactccag 1920
ttaaatcatc agaccaagct cactggcacc cacaaataag atttcaaaca aaatcaataa 1980
atgacatttg tttaacaggc cccggttgtg ctaggtcccc atatggcaat tacatgcagg 2040
caaaaatgag ttataaattt catgtaaaat ggggaggatg tccaaaaact tatgaaaaac 2100
catatgatcc ttgttcacag cccaattgga ctattcccca taacctcaat gaaacaatac 2160
aaatccagaa tccaaacaca tgcccacaaa cagaactcca agaatgggac tggcgacgtg 2220
atattgttac aaaaaaagct atcgaaagaa ttagacaaca cacggaacct catgaaactt 2280
tgcaaatctc tacaggttcc aaacacaacc caccagtaca cagacaaaca tcaccgtgga 2340
cggactcaga aacggactcg gaagaggaaa aagaccaaac acaagagatc cagatccagc 2400
tcaacaagct cagaaagcat caacagcatc tcaagcagca gctcaagcag tacctgaaac 2460
cccaaaatat agaatagttg caagcaacat aaaagttgaa ctttttccta ctaaaaaacc 2520
ttttaaaaac agacgcttta ctccttctga aagagaaaca gaaagacaat gtgctaaagc 2580
tttttgtaga ccagaaagac atttctttta tgatcctcct ttttaccctt actgtgtacc 2640
tgaacctatt gtaaactttg ctttgggata taaaatttaa ggccaacaaa tttcacttag 2700
tggtgtctgt ttattaaagt ttaaccttaa taagcatact ccgcctccct acattaaggc 2760
gccaaaaggg ggctccgccc ccttaaaccc caagggggct ccgccccctt aaacccccaa 2820
gggggctccg cccccttaca ccccc 2845
<210> 1002
<211> 107
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1002
Met Ser Lys Gln Leu Lys Pro Thr Leu Tyr Lys Asp Lys Ser Leu Glu
1 5 10 15
Leu Gln Trp Leu Asn Asn Ile Phe Ser Ser His Asp Leu Cys Cys Gly
20 25 30
Cys Asn Asp Pro Val Leu His Leu Leu Ile Leu Ile Asn Lys Thr Gly
35 40 45
Glu Ala Pro Lys Pro Glu Glu Asp Ile Lys Asn Ile Lys Cys Leu Leu
50 55 60
Thr Gly Ala Lys Asn Thr Thr Glu Glu Asp Ile Asp Leu Ser Pro Gly
65 70 75 80
Glu Leu Glu Glu Leu Phe Lys Glu Glu Lys Asp Gly Asp Thr Ala Asn
85 90 95
Gln Glu Lys His Thr Gly Glu Glu Asn Cys Gly
100 105
<210> 1003
<211> 218
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1003
Met Ser Lys Gln Leu Lys Pro Thr Leu Tyr Lys Asp Lys Ser Leu Glu
1 5 10 15
Leu Gln Trp Leu Asn Asn Ile Phe Ser Ser His Asp Leu Cys Cys Gly
20 25 30
Cys Asn Asp Pro Val Leu His Leu Leu Ile Leu Ile Asn Lys Thr Gly
35 40 45
Glu Ala Pro Lys Pro Glu Glu Asp Ile Lys Asn Ile Lys Cys Leu Leu
50 55 60
Thr Gly Ala Lys Asn Thr Thr Glu Glu Asp Ile Asp Leu Ser Pro Gly
65 70 75 80
Glu Leu Glu Glu Leu Phe Lys Glu Glu Lys Asp Gly Asp Thr Ala Asn
85 90 95
Gln Glu Lys His Thr Gly Glu Glu Asn Cys Gly Pro Ile Gly Leu Phe
100 105 110
Pro Ile Thr Ser Met Lys Gln Tyr Lys Ser Arg Ile Gln Thr His Ala
115 120 125
His Lys Gln Asn Ser Lys Asn Gly Thr Gly Asp Val Ile Leu Leu Gln
130 135 140
Lys Lys Leu Ser Lys Glu Leu Asp Asn Thr Arg Asn Leu Met Lys Leu
145 150 155 160
Cys Lys Ser Leu Gln Val Pro Asn Thr Thr His Gln Tyr Thr Asp Lys
165 170 175
His His Arg Gly Arg Thr Gln Lys Arg Thr Arg Lys Arg Lys Lys Thr
180 185 190
Lys His Lys Arg Ser Arg Ser Ser Ser Thr Ser Ser Glu Ser Ile Asn
195 200 205
Ser Ile Ser Ser Ser Ser Ser Ser Ser Thr
210 215
<210> 1004
<211> 234
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1004
Met Ser Lys Gln Leu Lys Pro Thr Leu Tyr Lys Asp Lys Ser Leu Glu
1 5 10 15
Leu Gln Trp Leu Asn Asn Ile Phe Ser Ser His Asp Leu Cys Cys Gly
20 25 30
Cys Asn Asp Pro Val Leu His Leu Leu Ile Leu Ile Asn Lys Thr Gly
35 40 45
Glu Ala Pro Lys Pro Glu Glu Asp Ile Lys Asn Ile Lys Cys Leu Leu
50 55 60
Thr Gly Ala Lys Asn Thr Thr Glu Glu Asp Ile Asp Leu Ser Pro Gly
65 70 75 80
Glu Leu Glu Glu Leu Phe Lys Glu Glu Lys Asp Gly Asp Thr Ala Asn
85 90 95
Gln Glu Lys His Thr Gly Glu Glu Asn Cys Gly Phe Gln Thr Gln Pro
100 105 110
Thr Ser Thr Gln Thr Asn Ile Thr Val Asp Gly Leu Arg Asn Gly Leu
115 120 125
Gly Arg Gly Lys Arg Pro Asn Thr Arg Asp Pro Asp Pro Ala Gln Gln
130 135 140
Ala Gln Lys Ala Ser Thr Ala Ser Gln Ala Ala Ala Gln Ala Val Pro
145 150 155 160
Glu Thr Pro Lys Tyr Arg Ile Val Ala Ser Asn Ile Lys Val Glu Leu
165 170 175
Phe Pro Thr Lys Lys Pro Phe Lys Asn Arg Arg Phe Thr Pro Ser Glu
180 185 190
Arg Glu Thr Glu Arg Gln Cys Ala Lys Ala Phe Cys Arg Pro Glu Arg
195 200 205
His Phe Phe Tyr Asp Pro Pro Phe Tyr Pro Tyr Cys Val Pro Glu Pro
210 215 220
Ile Val Asn Phe Ala Leu Gly Tyr Lys Ile
225 230
<210> 1005
<211> 655
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1005
Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg Pro
1 5 10 15
Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp Arg
20 25 30
Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Val Arg
35 40 45
Lys Arg Phe Tyr Lys Arg Lys Leu Lys Lys Ile Val Leu Lys Gln Phe
50 55 60
Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys Leu
65 70 75 80
Phe Gln Gly Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln Thr Ile
85 90 95
Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp Thr Leu
100 105 110
Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His Leu Lys
115 120 125
Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg Tyr Gly
130 135 140
Gly Val Thr Leu Tyr Phe Tyr Gln Ser Ala Tyr Thr Asp Tyr Ile Ala
145 150 155 160
Gln Val Phe Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr His Ala
165 170 175
Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Val Ile Arg Val
180 185 190
Pro Ser Arg Glu Thr Arg Lys Lys Arg Lys Pro Tyr Lys Arg Val Arg
195 200 205
Val Gly Pro Pro Ser Gln Met Gln Asn Lys Trp Tyr Phe Gln Arg Asp
210 215 220
Ile Cys Glu Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val Asp Phe
225 230 235 240
Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu Thr Leu
245 250 255
Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp His Pro
260 265 270
Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu Tyr Ser
275 280 285
Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr Leu Gly
290 295 300
Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu Met Thr
305 310 315 320
Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp His Tyr
325 330 335
Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro Pro Ser
340 345 350
Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala Glu Pro
355 360 365
Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly Gln Gly
370 375 380
Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp Asp Pro
385 390 395 400
Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr Asp Met
405 410 415
Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr Glu Asn
420 425 430
Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe Asn Glu
435 440 445
Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr Gly Phe
450 455 460
Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His Trp His
465 470 475 480
Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys Leu Thr
485 490 495
Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln Ala Lys
500 505 510
Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys Thr Tyr
515 520 525
Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile Pro His
530 535 540
Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys Pro Gln
545 550 555 560
Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr Lys Lys
565 570 575
Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr Leu Gln
580 585 590
Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln Thr Ser
595 600 605
Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp Gln Thr
610 615 620
Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln Gln His
625 630 635 640
Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile Glu
645 650 655
<210> 1006
<211> 164
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1006
Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg Pro
1 5 10 15
Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp Arg
20 25 30
Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Pro Asn
35 40 45
Trp Thr Ile Pro His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro
50 55 60
Asn Thr Cys Pro Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp
65 70 75 80
Ile Val Thr Lys Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro
85 90 95
His Glu Thr Leu Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val
100 105 110
His Arg Gln Thr Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu
115 120 125
Glu Lys Asp Gln Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg
130 135 140
Lys His Gln Gln His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro
145 150 155 160
Gln Asn Ile Glu
<210> 1007
<211> 99
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1007
Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg Pro
1 5 10 15
Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp Arg
20 25 30
Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Val Pro
35 40 45
Asn Thr Thr His Gln Tyr Thr Asp Lys His His Arg Gly Arg Thr Gln
50 55 60
Lys Arg Thr Arg Lys Arg Lys Lys Thr Lys His Lys Arg Ser Arg Ser
65 70 75 80
Ser Ser Thr Ser Ser Glu Ser Ile Asn Ser Ile Ser Ser Ser Ser Ser
85 90 95
Ser Ser Thr
<210> 1008
<211> 2912
<212> DNA
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1008
taataaatat tcaacaggaa aaccacctaa tttaaattgc cgaccacaaa ccgtcactta 60
gttcctcttt ttccacaact tcctctttta ctaatgaata ttcatgtaat taattaataa 120
tcaccgtaat tccggggagg agcctttaaa ctataaaact aactacacat tcgaatggct 180
gagtttatgc cgccagacgg agacgggatc acttcagtga ctccaggctg atcaagggcg 240
ggtgccgaag gtgagtgaaa ccaccgtagt caaggggcaa ttcgggctag atcagtctgg 300
cggaacgggc aagaaactta aaatgtactt tattttacag aaatgttcaa atctccaaca 360
tacttaacaa ctaaaggcaa aaacaatgcc ttaatcaact gcttcgttgg agaccacgat 420
cttctgtgca gctgtaacaa tcctgcctac cattgcctcc aaatacttgc aactacctta 480
gcacctcaac taaaacaaga agaaaaacaa caaataatac aatgccttgg tggtacagac 540
gccgtagcta caacccgtgg agacgaagaa attggtttag aagacctaga aaaactattt 600
acagaagata cagaagaaga cgccgctggg taagaagaaa acctttttac aaacgtaaaa 660
ttaagagact aaatatagta gaatggcaac ctaaatcaat tagaaaatgt agaataaaag 720
gaatgctatg cttgtttcaa acgacagaag acagactgtc atataacttt gatatgtatg 780
aagagtctat tataccagaa aaactgccgg gagggggggg atttagcatt aagaatataa 840
gcttatatgc cttataccaa gaacacatac atgcacacaa catatttaca cacacaaaca 900
cagacagacc actagcaaga tacacaggct gttctttaaa attctaccaa agcaaagaca 960
tagactacgt agtaacatat tctacatcac tcccactaag aagctcaatg ggaatgtaca 1020
actccatgca accatccata catctaatgc aacaaaacaa actaattgta ccaagcaaac 1080
aaacacaaaa aagaagaaaa ccatatatta aaaaacatat atcaccacca acacaaatga 1140
aatctcaatg gtactttcaa cataacattg caaacatacc gctactaatg ataagaacca 1200
cagcattaac attagataat tactatatag gaagcagaca attaagtaca aatgtcacta 1260
tacatacact taacacaaca tacatccaaa acagagactg gggagacaga aataaaactt 1320
actactgcca aacattagga acacaaagat acttcctata tggaacacat tcaactgcac 1380
aaaatattaa tgacataaag ctacaagaac taataccttt aacaaacaca caagactatg 1440
tacaaggctt tgattggaca gaaaaagaca aacataacat aacaacctac aaagaattct 1500
taactaaagg agcaggaaat ccatttcacg cagaatggat aacagcacaa aacccagtaa 1560
tacacacagc aaacagtcct acacaaatag aacaaatata caccgcttca acaacaacat 1620
tccaaaacaa aaaactaaca gacctaccaa cgccaggata tatatttata actccaacag 1680
taagcttaag atacaaccca tacaaagacc tagcagaaag aaacaaatgc tactttgtaa 1740
gaagcaaaat aaatgcacac gggtgggacc cagaacaaca ccaagaatta ataaacagtg 1800
acctaccaca atggttacta ttatttggct acccagacta cataaaaaga acacaaaact 1860
ttgcattagt agacacaaat tacatactag tagaccactg cccatacaca aatccagaaa 1920
aaacaccatt tataccttta agcacatcat ttatagaagg tagaagccca tacagtcctt 1980
cagacacaca tgaaccagat gaagaagacc aaaacaggtg gtacccatgc taccaatatc 2040
aacaagaatc aataaattca atatgtctta gcggtccagg cacaccaaaa ataccaaaag 2100
gaataacagc agaagcaaaa gtaaaatatt cctttaattt taagtggggt ggtgacctac 2160
caccaatgtc tacaattaca aacccgacag accagccaac atatgttgtt cccaataact 2220
tcaatgaaac aacttcgtta cagaatccaa ccaccagacc agagcacttc ttgtactcct 2280
ttgacgaaag gaggggacaa cttacagaaa aagctacaaa acgcttgctt aaagactggg 2340
aaactaaaga aacttcttta ttgtctacag aatacagatt cgcggagcca acacaaacac 2400
aagccccaca agaggacccg tcctcggaag aagaagaaga gagcaacctc ttcgagcgac 2460
tcctccgaca gcgaaccaag cagctccagc tcaagcgcag aataatacaa acattgaaag 2520
acctacaaaa attagaataa ctaacagcaa aaacaccgtt tacctatttc cacctgaaca 2580
aaagaacaga agactaacac catgggaaat acaagaagac aaagaaatag ccaatttatt 2640
tggcagacca catagatact ttttaaaaga cattcctttc tattgggata tacccccaga 2700
gcctaaagta aactttgatt taaattttca ataaagaaat aaagggcaag gccccattaa 2760
ctcaaagtcg gtgtctacct ctttaagttt aactttacta aacggactcc gcctccctaa 2820
atttgggcgc caaaaggggg ctccgccccc ttaaacccca gggggctccg ccccctaaaa 2880
cccccaaggg ggctacgccc ccttacaccc cc 2912
<210> 1009
<211> 96
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1009
Met Phe Lys Ser Pro Thr Tyr Leu Thr Thr Lys Gly Lys Asn Asn Ala
1 5 10 15
Leu Ile Asn Cys Phe Val Gly Asp His Asp Leu Leu Cys Ser Cys Asn
20 25 30
Asn Pro Ala Tyr His Cys Leu Gln Ile Leu Ala Thr Thr Leu Ala Pro
35 40 45
Gln Leu Lys Gln Glu Glu Lys Gln Gln Ile Ile Gln Cys Leu Gly Gly
50 55 60
Thr Asp Ala Val Ala Thr Thr Arg Gly Asp Glu Glu Ile Gly Leu Glu
65 70 75 80
Asp Leu Glu Lys Leu Phe Thr Glu Asp Thr Glu Glu Asp Ala Ala Gly
85 90 95
<210> 1010
<211> 198
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1010
Met Phe Lys Ser Pro Thr Tyr Leu Thr Thr Lys Gly Lys Asn Asn Ala
1 5 10 15
Leu Ile Asn Cys Phe Val Gly Asp His Asp Leu Leu Cys Ser Cys Asn
20 25 30
Asn Pro Ala Tyr His Cys Leu Gln Ile Leu Ala Thr Thr Leu Ala Pro
35 40 45
Gln Leu Lys Gln Glu Glu Lys Gln Gln Ile Ile Gln Cys Leu Gly Gly
50 55 60
Thr Asp Ala Val Ala Thr Thr Arg Gly Asp Glu Glu Ile Gly Leu Glu
65 70 75 80
Asp Leu Glu Lys Leu Phe Thr Glu Asp Thr Glu Glu Asp Ala Ala Gly
85 90 95
Gln His Met Leu Phe Pro Ile Thr Ser Met Lys Gln Leu Arg Tyr Arg
100 105 110
Ile Gln Pro Pro Asp Gln Ser Thr Ser Cys Thr Pro Leu Thr Lys Gly
115 120 125
Gly Asp Asn Leu Gln Lys Lys Leu Gln Asn Ala Cys Leu Lys Thr Gly
130 135 140
Lys Leu Lys Lys Leu Leu Tyr Cys Leu Gln Asn Thr Asp Ser Arg Ser
145 150 155 160
Gln His Lys His Lys Pro His Lys Arg Thr Arg Pro Arg Lys Lys Lys
165 170 175
Lys Arg Ala Thr Ser Ser Ser Asp Ser Ser Asp Ser Glu Pro Ser Ser
180 185 190
Ser Ser Ser Ser Ala Glu
195
<210> 1011
<211> 216
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1011
Met Phe Lys Ser Pro Thr Tyr Leu Thr Thr Lys Gly Lys Asn Asn Ala
1 5 10 15
Leu Ile Asn Cys Phe Val Gly Asp His Asp Leu Leu Cys Ser Cys Asn
20 25 30
Asn Pro Ala Tyr His Cys Leu Gln Ile Leu Ala Thr Thr Leu Ala Pro
35 40 45
Gln Leu Lys Gln Glu Glu Lys Gln Gln Ile Ile Gln Cys Leu Gly Gly
50 55 60
Thr Asp Ala Val Ala Thr Thr Arg Gly Asp Glu Glu Ile Gly Leu Glu
65 70 75 80
Asp Leu Glu Lys Leu Phe Thr Glu Asp Thr Glu Glu Asp Ala Ala Gly
85 90 95
Ile Gln Ile Arg Gly Ala Asn Thr Asn Thr Ser Pro Thr Arg Gly Pro
100 105 110
Val Leu Gly Arg Arg Arg Arg Glu Gln Pro Leu Arg Ala Thr Pro Pro
115 120 125
Thr Ala Asn Gln Ala Ala Pro Ala Gln Ala Gln Asn Asn Thr Asn Ile
130 135 140
Glu Arg Pro Thr Lys Ile Arg Ile Thr Asn Ser Lys Asn Thr Val Tyr
145 150 155 160
Leu Phe Pro Pro Glu Gln Lys Asn Arg Arg Leu Thr Pro Trp Glu Ile
165 170 175
Gln Glu Asp Lys Glu Ile Ala Asn Leu Phe Gly Arg Pro His Arg Tyr
180 185 190
Phe Leu Lys Asp Ile Pro Phe Tyr Trp Asp Ile Pro Pro Glu Pro Lys
195 200 205
Val Asn Phe Asp Leu Asn Phe Gln
210 215
<210> 1012
<211> 672
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1012
Met Pro Trp Trp Tyr Arg Arg Arg Ser Tyr Asn Pro Trp Arg Arg Arg
1 5 10 15
Asn Trp Phe Arg Arg Pro Arg Lys Thr Ile Tyr Arg Arg Tyr Arg Arg
20 25 30
Arg Arg Arg Trp Val Arg Arg Lys Pro Phe Tyr Lys Arg Lys Ile Lys
35 40 45
Arg Leu Asn Ile Val Glu Trp Gln Pro Lys Ser Ile Arg Lys Cys Arg
50 55 60
Ile Lys Gly Met Leu Cys Leu Phe Gln Thr Thr Glu Asp Arg Leu Ser
65 70 75 80
Tyr Asn Phe Asp Met Tyr Glu Glu Ser Ile Ile Pro Glu Lys Leu Pro
85 90 95
Gly Gly Gly Gly Phe Ser Ile Lys Asn Ile Ser Leu Tyr Ala Leu Tyr
100 105 110
Gln Glu His Ile His Ala His Asn Ile Phe Thr His Thr Asn Thr Asp
115 120 125
Arg Pro Leu Ala Arg Tyr Thr Gly Cys Ser Leu Lys Phe Tyr Gln Ser
130 135 140
Lys Asp Ile Asp Tyr Val Val Thr Tyr Ser Thr Ser Leu Pro Leu Arg
145 150 155 160
Ser Ser Met Gly Met Tyr Asn Ser Met Gln Pro Ser Ile His Leu Met
165 170 175
Gln Gln Asn Lys Leu Ile Val Pro Ser Lys Gln Thr Gln Lys Arg Arg
180 185 190
Lys Pro Tyr Ile Lys Lys His Ile Ser Pro Pro Thr Gln Met Lys Ser
195 200 205
Gln Trp Tyr Phe Gln His Asn Ile Ala Asn Ile Pro Leu Leu Met Ile
210 215 220
Arg Thr Thr Ala Leu Thr Leu Asp Asn Tyr Tyr Ile Gly Ser Arg Gln
225 230 235 240
Leu Ser Thr Asn Val Thr Ile His Thr Leu Asn Thr Thr Tyr Ile Gln
245 250 255
Asn Arg Asp Trp Gly Asp Arg Asn Lys Thr Tyr Tyr Cys Gln Thr Leu
260 265 270
Gly Thr Gln Arg Tyr Phe Leu Tyr Gly Thr His Ser Thr Ala Gln Asn
275 280 285
Ile Asn Asp Ile Lys Leu Gln Glu Leu Ile Pro Leu Thr Asn Thr Gln
290 295 300
Asp Tyr Val Gln Gly Phe Asp Trp Thr Glu Lys Asp Lys His Asn Ile
305 310 315 320
Thr Thr Tyr Lys Glu Phe Leu Thr Lys Gly Ala Gly Asn Pro Phe His
325 330 335
Ala Glu Trp Ile Thr Ala Gln Asn Pro Val Ile His Thr Ala Asn Ser
340 345 350
Pro Thr Gln Ile Glu Gln Ile Tyr Thr Ala Ser Thr Thr Thr Phe Gln
355 360 365
Asn Lys Lys Leu Thr Asp Leu Pro Thr Pro Gly Tyr Ile Phe Ile Thr
370 375 380
Pro Thr Val Ser Leu Arg Tyr Asn Pro Tyr Lys Asp Leu Ala Glu Arg
385 390 395 400
Asn Lys Cys Tyr Phe Val Arg Ser Lys Ile Asn Ala His Gly Trp Asp
405 410 415
Pro Glu Gln His Gln Glu Leu Ile Asn Ser Asp Leu Pro Gln Trp Leu
420 425 430
Leu Leu Phe Gly Tyr Pro Asp Tyr Ile Lys Arg Thr Gln Asn Phe Ala
435 440 445
Leu Val Asp Thr Asn Tyr Ile Leu Val Asp His Cys Pro Tyr Thr Asn
450 455 460
Pro Glu Lys Thr Pro Phe Ile Pro Leu Ser Thr Ser Phe Ile Glu Gly
465 470 475 480
Arg Ser Pro Tyr Ser Pro Ser Asp Thr His Glu Pro Asp Glu Glu Asp
485 490 495
Gln Asn Arg Trp Tyr Pro Cys Tyr Gln Tyr Gln Gln Glu Ser Ile Asn
500 505 510
Ser Ile Cys Leu Ser Gly Pro Gly Thr Pro Lys Ile Pro Lys Gly Ile
515 520 525
Thr Ala Glu Ala Lys Val Lys Tyr Ser Phe Asn Phe Lys Trp Gly Gly
530 535 540
Asp Leu Pro Pro Met Ser Thr Ile Thr Asn Pro Thr Asp Gln Pro Thr
545 550 555 560
Tyr Val Val Pro Asn Asn Phe Asn Glu Thr Thr Ser Leu Gln Asn Pro
565 570 575
Thr Thr Arg Pro Glu His Phe Leu Tyr Ser Phe Asp Glu Arg Arg Gly
580 585 590
Gln Leu Thr Glu Lys Ala Thr Lys Arg Leu Leu Lys Asp Trp Glu Thr
595 600 605
Lys Glu Thr Ser Leu Leu Ser Thr Glu Tyr Arg Phe Ala Glu Pro Thr
610 615 620
Gln Thr Gln Ala Pro Gln Glu Asp Pro Ser Ser Glu Glu Glu Glu Glu
625 630 635 640
Ser Asn Leu Phe Glu Arg Leu Leu Arg Gln Arg Thr Lys Gln Leu Gln
645 650 655
Leu Lys Arg Arg Ile Ile Gln Thr Leu Lys Asp Leu Gln Lys Leu Glu
660 665 670
<210> 1013
<211> 80
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1013
Met Pro Trp Trp Tyr Arg Arg Arg Ser Tyr Asn Pro Trp Arg Arg Arg
1 5 10 15
Asn Trp Phe Arg Arg Pro Arg Lys Thr Ile Tyr Arg Arg Tyr Arg Arg
20 25 30
Arg Arg Arg Trp Asn Thr Asp Ser Arg Ser Gln His Lys His Lys Pro
35 40 45
His Lys Arg Thr Arg Pro Arg Lys Lys Lys Lys Arg Ala Thr Ser Ser
50 55 60
Ser Asp Ser Ser Asp Ser Glu Pro Ser Ser Ser Ser Ser Ser Ala Glu
65 70 75 80
<210> 1014
<211> 3853
<212> DNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 1014
ggcttagtgc gtcaccaccc acgtgacccg cctccgccaa ttaacaggta cttcgtacac 60
ttcctgggcg ggcttataag actaatataa gtagctgcac ttccgaatgg ctgagttttc 120
cacgcccgtc cgcagcggtg aagccacgga gggagctcag cgcgtcccga gggcgggtgc 180
cggaggtgag tttacacacc gcagtcaagg ggcaattcgg gctcgggact ggccgggctt 240
tgggcaaggc tcttaaaaaa gctatgttta ttggcaggca ctaccgaaag aaaagggcgc 300
tgctactgct atctgtgcat tctacaaaga caaaagggaa acttctaata gctatgtgga 360
ctcccccacg caatgatcaa caatacctta actggcaatg gtacacttct gtacttagct 420
cccactctgc tatgtgcggg tgttccgacg ctatcgctca tcttaatcat cttgctaatc 480
tgcttcgtgc cccgcaaaat ccgcccccgc ctgataatcc aagaccccta cccgtgcgag 540
cactgcctgc tcccccggct gcccacgagg cagccggtga tcgagcacca tggcctatgg 600
gtggtggagg agacgccgga ggcgctggcg caggtggaga cgccgaccat ggaggcgccg 660
ctggaggacc cgcagacgca gacctgctag acgccgtggc cgccgcagaa acgtaaggag 720
acggcgcaga gggaggtgga gaaggaggta caggaggtgg aaaagaaagg gcagacgtag 780
aagaaaagca aaaataataa taagacagtg gcagccaaac tacagaagaa gatgtaatat 840
agtgggctac ctccctatac ttatctgtgg tggaaatact gtttctagaa actatgccac 900
acactcagac gatactaact atccaggacc ctttggggga ggcatgacca cagacaaatt 960
cagccttaga atactatatg atgaatacaa aagatttatg aactactgga cagcctcaaa 1020
tgaggaccta gatctctgta gatatctagg atgcactttt tacttcttta gacaccctga 1080
agtagacttt attataaaaa taaacaccat gcccccattc ttagatacaa ccataacagc 1140
acctagcata cacccaggcc tcatggccct agacaaaaga gccagatgga ttccttctct 1200
taaaaataga ccaggtaaaa aacactatat aaaaattaga gtaggggctc ctaaaatgtt 1260
cacagataaa tggtaccctc aaacagacct ctgtgacatg acactgctaa ctatctatgc 1320
aaccgcagcg gatatgcaat atccgttcgg ctcaccacta actgacactg tggttgttaa 1380
ctcccaagtt ctgcaatcca tgtatgatga aacaattagc atattacctg atgaaaaaac 1440
taaaagaaat agccttctta cttctataag aagctacata cctttttata atactacaca 1500
aacaatagct caattaaaac catttgtaga tgcaggagga cacacaacag gctcaacaac 1560
aactacatgg ggacaactat taaacacaac taaatttacc actaccacaa caaccacata 1620
cacataccct ggcaccacaa atacagcagt aacatttata acagccaatg atacctggta 1680
caggggaaca gcatataaag ataacattaa agatgtacca caaaaagcag cacaattata 1740
ctttcaaaca acacaaaaac tactaggaaa cacattccat ggctcagatg aaacacttga 1800
ataccatgca ggcctataca gctctatctg gctatcacca ggtagatcct actttgaaac 1860
accaggtgca tacacagaca ttaaatataa cccttttaca gacagaggag aaggcaacat 1920
gctgtggata gactggctaa gtaaaaaaaa catgaaatat gacaaagtgc aaagtaagtg 1980
cctagtagca gacctaccac tgtgggcagc agcatatggt tatgtagaat tctgctctaa 2040
aagcacagga gacacaaaca tacacatgaa tgccagacta ctaataagaa gtccttttac 2100
agacccccag ctaatagtac acacagaccc cactaaaggc tttgtaccct attctttaaa 2160
ctttggaaat ggtaaaatgc caggaggtag cagcaatgtt cccataagaa tgagagctaa 2220
gtggtacccc actttatccc accaacaaga agttctagag gccttagcac agtcaggacc 2280
ctttgcttat cactcagaca ttaaaaaagt atctctaggc ataaaatacc gttttaagtg 2340
gatctggggt ggaaaccccg ttcgccaaca ggttgttaga aatccctgca aggaacccca 2400
ctcctcgggc aatagagtcc ctagaagcat acaaatcgtt gacccgagat acaactcacc 2460
ggaacttacc atccatgcct gggacttcag acgtggcttc tttggcccga aagctattca 2520
aagaatgcaa caacaaccaa ctgctactga atttttttca gcaggccgca agagacccag 2580
aagggacaca gaagtgtatc agtccgacca agaaaaggag caaaaagaaa gctcgctttt 2640
ccccccagtc aagctcctcc gaagagtccc cccgtgggag gactcggaac aggagcaaag 2700
cgggtcgcaa agctcagagg aagagacggc gaccctctcc cagcagctca aacagcagct 2760
gcagcagcag cgagtcttgg gagtcaaact cagactcctg ttcaaccaag tccaaaaaat 2820
ccaacaaaat caagatatca accctacctt gttaccaagg gggggggatc tagtatcctt 2880
ctttcaggct gtaccataaa tatgtttcca gaccctaaac cttactgccc ctccagcaat 2940
gactggaaag aagagtatga ggcctgtaaa tattgggata gacctcccag acacaacctt 3000
agagaccccc ccttttaccc ctgggcccct aaaaacaatc cttgcaatgt aagctttaaa 3060
cttggcttca aataaactag gccgtgggag tttcacttgt cggtgtctac ctctataagt 3120
cactaagcac tccgagcgca gcgaggagtg cgacccttcc ccctggtgca acgccctcgg 3180
cggccgcgcg ctacgccttc ggctgcgcgc ggcacctcgg acccccgctc gtgctgacac 3240
gcttgcgcgt gtcagaccac ttcgggctcg cgggggtcgg gaaatttgct aaacagactc 3300
cgagttgcca ttggacactg tagctatgaa tcagtaacga aagtgagtgg ggccagactt 3360
cgccataagg cctttatctt cttgccattt gtcagtattg ggggtcgcca taaactttgg 3420
gctccatttt aggccttccg gactacaaaa atcgccatat ttgtgacgtc agagccgcca 3480
ttttaagtca gctctgggga ggcgtgactt ccagttcaaa ggtcatcctc accataactg 3540
gcacaaaatg gccgccaact tcttccgggt caaaggtcac tgctacgtca taggtgacgt 3600
ggggggggac ctacttaaac acggaagtag gccccgacac gtcactgtca cgtgacagta 3660
cgtcacagcc gccattttgt tttacaaaat agccgacttc cttcctcttt tttaaaaaaa 3720
ggcgccaaaa aaccgtcggc gggggggccg cgcgctgcgc gcgcggcccc cgggggaggc 3780
acagcctccc ccccccgcgc gcatgcgcgc gggtcccccc ccctccgggg ggctccgccc 3840
cccggccccc ccc 3853
<210> 1015
<211> 120
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 1015
Met Trp Thr Pro Pro Arg Asn Asp Gln Gln Tyr Leu Asn Trp Gln Trp
1 5 10 15
Tyr Thr Ser Val Leu Ser Ser His Ser Ala Met Cys Gly Cys Ser Asp
20 25 30
Ala Ile Ala His Leu Asn His Leu Ala Asn Leu Leu Arg Ala Pro Gln
35 40 45
Asn Pro Pro Pro Pro Asp Asn Pro Arg Pro Leu Pro Val Arg Ala Leu
50 55 60
Pro Ala Pro Pro Ala Ala His Glu Ala Ala Gly Asp Arg Ala Pro Trp
65 70 75 80
Pro Met Gly Gly Gly Gly Asp Ala Gly Gly Ala Gly Ala Gly Gly Asp
85 90 95
Ala Asp His Gly Gly Ala Ala Gly Gly Pro Ala Asp Ala Asp Leu Leu
100 105 110
Asp Ala Val Ala Ala Ala Glu Thr
115 120
<210> 1016
<211> 286
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 1016
Met Trp Thr Pro Pro Arg Asn Asp Gln Gln Tyr Leu Asn Trp Gln Trp
1 5 10 15
Tyr Thr Ser Val Leu Ser Ser His Ser Ala Met Cys Gly Cys Ser Asp
20 25 30
Ala Ile Ala His Leu Asn His Leu Ala Asn Leu Leu Arg Ala Pro Gln
35 40 45
Asn Pro Pro Pro Pro Asp Asn Pro Arg Pro Leu Pro Val Arg Ala Leu
50 55 60
Pro Ala Pro Pro Ala Ala His Glu Ala Ala Gly Asp Arg Ala Pro Trp
65 70 75 80
Pro Met Gly Gly Gly Gly Asp Ala Gly Gly Ala Gly Ala Gly Gly Asp
85 90 95
Ala Asp His Gly Gly Ala Ala Gly Gly Pro Ala Asp Ala Asp Leu Leu
100 105 110
Asp Ala Val Ala Ala Ala Glu Thr Leu Leu Glu Ile Pro Ala Arg Asn
115 120 125
Pro Thr Pro Arg Ala Ile Glu Ser Leu Glu Ala Tyr Lys Ser Leu Thr
130 135 140
Arg Asp Thr Thr His Arg Asn Leu Pro Ser Met Pro Gly Thr Ser Asp
145 150 155 160
Val Ala Ser Leu Ala Arg Lys Leu Phe Lys Glu Cys Asn Asn Asn Gln
165 170 175
Leu Leu Leu Asn Phe Phe Gln Gln Ala Ala Arg Asp Pro Glu Gly Thr
180 185 190
Gln Lys Cys Ile Ser Pro Thr Lys Lys Arg Ser Lys Lys Lys Ala Arg
195 200 205
Phe Ser Pro Gln Ser Ser Ser Ser Glu Glu Ser Pro Arg Gly Arg Thr
210 215 220
Arg Asn Arg Ser Lys Ala Gly Arg Lys Ala Gln Arg Lys Arg Arg Arg
225 230 235 240
Pro Ser Pro Ser Ser Ser Asn Ser Ser Cys Ser Ser Ser Glu Ser Trp
245 250 255
Glu Ser Asn Ser Asp Ser Cys Ser Thr Lys Ser Lys Lys Ser Asn Lys
260 265 270
Ile Lys Ile Ser Thr Leu Pro Cys Tyr Gln Gly Gly Gly Ile
275 280 285
<210> 1017
<211> 289
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 1017
Met Trp Thr Pro Pro Arg Asn Asp Gln Gln Tyr Leu Asn Trp Gln Trp
1 5 10 15
Tyr Thr Ser Val Leu Ser Ser His Ser Ala Met Cys Gly Cys Ser Asp
20 25 30
Ala Ile Ala His Leu Asn His Leu Ala Asn Leu Leu Arg Ala Pro Gln
35 40 45
Asn Pro Pro Pro Pro Asp Asn Pro Arg Pro Leu Pro Val Arg Ala Leu
50 55 60
Pro Ala Pro Pro Ala Ala His Glu Ala Ala Gly Asp Arg Ala Pro Trp
65 70 75 80
Pro Met Gly Gly Gly Gly Asp Ala Gly Gly Ala Gly Ala Gly Gly Asp
85 90 95
Ala Asp His Gly Gly Ala Ala Gly Gly Pro Ala Asp Ala Asp Leu Leu
100 105 110
Asp Ala Val Ala Ala Ala Glu Thr Pro Gln Glu Thr Gln Lys Gly His
115 120 125
Arg Ser Val Ser Val Arg Pro Arg Lys Gly Ala Lys Arg Lys Leu Ala
130 135 140
Phe Pro Pro Ser Gln Ala Pro Pro Lys Ser Pro Pro Val Gly Gly Leu
145 150 155 160
Gly Thr Gly Ala Lys Arg Val Ala Lys Leu Arg Gly Arg Asp Gly Asp
165 170 175
Pro Leu Pro Ala Ala Gln Thr Ala Ala Ala Ala Ala Ala Ser Leu Gly
180 185 190
Ser Gln Thr Gln Thr Pro Val Gln Pro Ser Pro Lys Asn Pro Thr Lys
195 200 205
Ser Arg Tyr Gln Pro Tyr Leu Val Thr Lys Gly Gly Gly Ser Ser Ile
210 215 220
Leu Leu Ser Gly Cys Thr Ile Asn Met Phe Pro Asp Pro Lys Pro Tyr
225 230 235 240
Cys Pro Ser Ser Asn Asp Trp Lys Glu Glu Tyr Glu Ala Cys Lys Tyr
245 250 255
Trp Asp Arg Pro Pro Arg His Asn Leu Arg Asp Pro Pro Phe Tyr Pro
260 265 270
Trp Ala Pro Lys Asn Asn Pro Cys Asn Val Ser Phe Lys Leu Gly Phe
275 280 285
Lys
<210> 1018
<211> 185
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 1018
Met Trp Thr Pro Pro Arg Asn Asp Gln Gln Tyr Leu Asn Trp Gln Trp
1 5 10 15
Pro Gln Glu Thr Gln Lys Gly His Arg Ser Val Ser Val Arg Pro Arg
20 25 30
Lys Gly Ala Lys Arg Lys Leu Ala Phe Pro Pro Ser Gln Ala Pro Pro
35 40 45
Lys Ser Pro Pro Val Gly Gly Leu Gly Thr Gly Ala Lys Arg Val Ala
50 55 60
Lys Leu Arg Gly Arg Asp Gly Asp Pro Leu Pro Ala Ala Gln Thr Ala
65 70 75 80
Ala Ala Ala Ala Ala Ser Leu Gly Ser Gln Thr Gln Thr Pro Val Gln
85 90 95
Pro Ser Pro Lys Asn Pro Thr Lys Ser Arg Tyr Gln Pro Tyr Leu Val
100 105 110
Thr Lys Gly Gly Gly Ser Ser Ile Leu Leu Ser Gly Cys Thr Ile Asn
115 120 125
Met Phe Pro Asp Pro Lys Pro Tyr Cys Pro Ser Ser Asn Asp Trp Lys
130 135 140
Glu Glu Tyr Glu Ala Cys Lys Tyr Trp Asp Arg Pro Pro Arg His Asn
145 150 155 160
Leu Arg Asp Pro Pro Phe Tyr Pro Trp Ala Pro Lys Asn Asn Pro Cys
165 170 175
Asn Val Ser Phe Lys Leu Gly Phe Lys
180 185
<210> 1019
<211> 105
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 1019
Met Ile Asn Asn Thr Leu Thr Gly Asn Gly Thr Leu Leu Tyr Leu Ala
1 5 10 15
Pro Thr Leu Leu Cys Ala Gly Val Pro Thr Leu Ser Leu Ile Leu Ile
20 25 30
Ile Leu Leu Ile Cys Phe Val Pro Arg Lys Ile Arg Pro Arg Leu Ile
35 40 45
Ile Gln Asp Pro Tyr Pro Cys Glu His Cys Leu Leu Pro Arg Leu Pro
50 55 60
Thr Arg Gln Pro Val Ile Glu His His Gly Leu Trp Val Val Glu Glu
65 70 75 80
Thr Pro Glu Ala Leu Ala Gln Val Glu Thr Pro Thr Met Glu Ala Pro
85 90 95
Leu Glu Asp Pro Gln Thr Gln Thr Cys
100 105
<210> 1020
<211> 769
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 1020
Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Trp Arg Arg Trp
1 5 10 15
Arg Arg Arg Pro Trp Arg Arg Arg Trp Arg Thr Arg Arg Arg Arg Pro
20 25 30
Ala Arg Arg Arg Gly Arg Arg Arg Asn Val Arg Arg Arg Arg Arg Gly
35 40 45
Arg Trp Arg Arg Arg Tyr Arg Arg Trp Lys Arg Lys Gly Arg Arg Arg
50 55 60
Arg Lys Ala Lys Ile Ile Ile Arg Gln Trp Gln Pro Asn Tyr Arg Arg
65 70 75 80
Arg Cys Asn Ile Val Gly Tyr Leu Pro Ile Leu Ile Cys Gly Gly Asn
85 90 95
Thr Val Ser Arg Asn Tyr Ala Thr His Ser Asp Asp Thr Asn Tyr Pro
100 105 110
Gly Pro Phe Gly Gly Gly Met Thr Thr Asp Lys Phe Ser Leu Arg Ile
115 120 125
Leu Tyr Asp Glu Tyr Lys Arg Phe Met Asn Tyr Trp Thr Ala Ser Asn
130 135 140
Glu Asp Leu Asp Leu Cys Arg Tyr Leu Gly Cys Thr Phe Tyr Phe Phe
145 150 155 160
Arg His Pro Glu Val Asp Phe Ile Ile Lys Ile Asn Thr Met Pro Pro
165 170 175
Phe Leu Asp Thr Thr Ile Thr Ala Pro Ser Ile His Pro Gly Leu Met
180 185 190
Ala Leu Asp Lys Arg Ala Arg Trp Ile Pro Ser Leu Lys Asn Arg Pro
195 200 205
Gly Lys Lys His Tyr Ile Lys Ile Arg Val Gly Ala Pro Lys Met Phe
210 215 220
Thr Asp Lys Trp Tyr Pro Gln Thr Asp Leu Cys Asp Met Thr Leu Leu
225 230 235 240
Thr Ile Tyr Ala Thr Ala Ala Asp Met Gln Tyr Pro Phe Gly Ser Pro
245 250 255
Leu Thr Asp Thr Val Val Val Asn Ser Gln Val Leu Gln Ser Met Tyr
260 265 270
Asp Glu Thr Ile Ser Ile Leu Pro Asp Glu Lys Thr Lys Arg Asn Ser
275 280 285
Leu Leu Thr Ser Ile Arg Ser Tyr Ile Pro Phe Tyr Asn Thr Thr Gln
290 295 300
Thr Ile Ala Gln Leu Lys Pro Phe Val Asp Ala Gly Gly His Thr Thr
305 310 315 320
Gly Ser Thr Thr Thr Thr Trp Gly Gln Leu Leu Asn Thr Thr Lys Phe
325 330 335
Thr Thr Thr Thr Thr Thr Thr Tyr Thr Tyr Pro Gly Thr Thr Asn Thr
340 345 350
Ala Val Thr Phe Ile Thr Ala Asn Asp Thr Trp Tyr Arg Gly Thr Ala
355 360 365
Tyr Lys Asp Asn Ile Lys Asp Val Pro Gln Lys Ala Ala Gln Leu Tyr
370 375 380
Phe Gln Thr Thr Gln Lys Leu Leu Gly Asn Thr Phe His Gly Ser Asp
385 390 395 400
Glu Thr Leu Glu Tyr His Ala Gly Leu Tyr Ser Ser Ile Trp Leu Ser
405 410 415
Pro Gly Arg Ser Tyr Phe Glu Thr Pro Gly Ala Tyr Thr Asp Ile Lys
420 425 430
Tyr Asn Pro Phe Thr Asp Arg Gly Glu Gly Asn Met Leu Trp Ile Asp
435 440 445
Trp Leu Ser Lys Lys Asn Met Lys Tyr Asp Lys Val Gln Ser Lys Cys
450 455 460
Leu Val Ala Asp Leu Pro Leu Trp Ala Ala Ala Tyr Gly Tyr Val Glu
465 470 475 480
Phe Cys Ser Lys Ser Thr Gly Asp Thr Asn Ile His Met Asn Ala Arg
485 490 495
Leu Leu Ile Arg Ser Pro Phe Thr Asp Pro Gln Leu Ile Val His Thr
500 505 510
Asp Pro Thr Lys Gly Phe Val Pro Tyr Ser Leu Asn Phe Gly Asn Gly
515 520 525
Lys Met Pro Gly Gly Ser Ser Asn Val Pro Ile Arg Met Arg Ala Lys
530 535 540
Trp Tyr Pro Thr Leu Ser His Gln Gln Glu Val Leu Glu Ala Leu Ala
545 550 555 560
Gln Ser Gly Pro Phe Ala Tyr His Ser Asp Ile Lys Lys Val Ser Leu
565 570 575
Gly Ile Lys Tyr Arg Phe Lys Trp Ile Trp Gly Gly Asn Pro Val Arg
580 585 590
Gln Gln Val Val Arg Asn Pro Cys Lys Glu Pro His Ser Ser Gly Asn
595 600 605
Arg Val Pro Arg Ser Ile Gln Ile Val Asp Pro Arg Tyr Asn Ser Pro
610 615 620
Glu Leu Thr Ile His Ala Trp Asp Phe Arg Arg Gly Phe Phe Gly Pro
625 630 635 640
Lys Ala Ile Gln Arg Met Gln Gln Gln Pro Thr Ala Thr Glu Phe Phe
645 650 655
Ser Ala Gly Arg Lys Arg Pro Arg Arg Asp Thr Glu Val Tyr Gln Ser
660 665 670
Asp Gln Glu Lys Glu Gln Lys Glu Ser Ser Leu Phe Pro Pro Val Lys
675 680 685
Leu Leu Arg Arg Val Pro Pro Trp Glu Asp Ser Glu Gln Glu Gln Ser
690 695 700
Gly Ser Gln Ser Ser Glu Glu Glu Thr Ala Thr Leu Ser Gln Gln Leu
705 710 715 720
Lys Gln Gln Leu Gln Gln Gln Arg Val Leu Gly Val Lys Leu Arg Leu
725 730 735
Leu Phe Asn Gln Val Gln Lys Ile Gln Gln Asn Gln Asp Ile Asn Pro
740 745 750
Thr Leu Leu Pro Arg Gly Gly Asp Leu Val Ser Phe Phe Gln Ala Val
755 760 765
Pro
<210> 1021
<211> 216
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 1021
Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Trp Arg Arg Trp
1 5 10 15
Arg Arg Arg Pro Trp Arg Arg Arg Trp Arg Thr Arg Arg Arg Arg Pro
20 25 30
Ala Arg Arg Arg Gly Arg Arg Arg Asn Val Val Arg Asn Pro Cys Lys
35 40 45
Glu Pro His Ser Ser Gly Asn Arg Val Pro Arg Ser Ile Gln Ile Val
50 55 60
Asp Pro Arg Tyr Asn Ser Pro Glu Leu Thr Ile His Ala Trp Asp Phe
65 70 75 80
Arg Arg Gly Phe Phe Gly Pro Lys Ala Ile Gln Arg Met Gln Gln Gln
85 90 95
Pro Thr Ala Thr Glu Phe Phe Ser Ala Gly Arg Lys Arg Pro Arg Arg
100 105 110
Asp Thr Glu Val Tyr Gln Ser Asp Gln Glu Lys Glu Gln Lys Glu Ser
115 120 125
Ser Leu Phe Pro Pro Val Lys Leu Leu Arg Arg Val Pro Pro Trp Glu
130 135 140
Asp Ser Glu Gln Glu Gln Ser Gly Ser Gln Ser Ser Glu Glu Glu Thr
145 150 155 160
Ala Thr Leu Ser Gln Gln Leu Lys Gln Gln Leu Gln Gln Gln Arg Val
165 170 175
Leu Gly Val Lys Leu Arg Leu Leu Phe Asn Gln Val Gln Lys Ile Gln
180 185 190
Gln Asn Gln Asp Ile Asn Pro Thr Leu Leu Pro Arg Gly Gly Asp Leu
195 200 205
Val Ser Phe Phe Gln Ala Val Pro
210 215
<210> 1022
<211> 143
<212> PRT
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 1022
Met Ala Tyr Gly Trp Trp Arg Arg Arg Arg Arg Arg Trp Arg Arg Trp
1 5 10 15
Arg Arg Arg Pro Trp Arg Arg Arg Trp Arg Thr Arg Arg Arg Arg Pro
20 25 30
Ala Arg Arg Arg Gly Arg Arg Arg Asn Ala Ala Arg Asp Pro Glu Gly
35 40 45
Thr Gln Lys Cys Ile Ser Pro Thr Lys Lys Arg Ser Lys Lys Lys Ala
50 55 60
Arg Phe Ser Pro Gln Ser Ser Ser Ser Glu Glu Ser Pro Arg Gly Arg
65 70 75 80
Thr Arg Asn Arg Ser Lys Ala Gly Arg Lys Ala Gln Arg Lys Arg Arg
85 90 95
Arg Pro Ser Pro Ser Ser Ser Asn Ser Ser Cys Ser Ser Ser Glu Ser
100 105 110
Trp Glu Ser Asn Ser Asp Ser Cys Ser Thr Lys Ser Lys Lys Ser Asn
115 120 125
Lys Ile Lys Ile Ser Thr Leu Pro Cys Tyr Gln Gly Gly Gly Ile
130 135 140
<210> 1023
<400> 1023
000
<210> 1024
<400> 1024
000
<210> 1025
<400> 1025
000
<210> 1026
<400> 1026
000
<210> 1027
<400> 1027
000
<210> 1028
<400> 1028
000
<210> 1029
<400> 1029
000
<210> 1030
<211> 1932
<212> DNA
<213> 腺相关病毒
<400> 1030
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga 1920
cactctctct ga 1932
<210> 1031
<211> 621
<212> PRT
<213> 腺相关病毒
<400> 1031
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
545 550 555 560
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
565 570 575
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
580 585 590
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
595 600 605
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
610 615 620
<210> 1032
<211> 536
<212> PRT
<213> 腺相关病毒
<400> 1032
Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu
50 55 60
Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu
85 90 95
Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile
100 105 110
Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
275 280 285
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
465 470 475 480
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
500 505 510
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
515 520 525
Arg Leu Ala Arg Gly His Ser Leu
530 535
<210> 1033
<211> 397
<212> PRT
<213> 腺相关病毒
<400> 1033
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320
Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys
325 330 335
Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu
340 345 350
Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr
355 360 365
Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp
370 375 380
Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln
385 390 395
<210> 1034
<211> 312
<212> PRT
<213> 腺相关病毒
<400> 1034
Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln
50 55 60
Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val
245 250 255
Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val
275 280 285
Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp
290 295 300
Arg Leu Ala Arg Gly His Ser Leu
305 310
<210> 1035
<211> 1941
<212> DNA
<213> 腺相关病毒
<400> 1035
atgccggggt tctacgagat tgtcctgaag gtcccgagtg acctggacga gcgcctgccg 60
ggcatttcta actcgtttgt taactgggtg gccgagaagg aatgggacgt gccgccggat 120
tctgacatgg atccgaatct gattgagcag gcacccctga ccgtggccga aaagcttcag 180
cgcgagttcc tggtggagtg gcgccgcgtg agtaaggccc cggaggccct cttttttgtc 240
cagttcgaaa agggggagac ctacttccac ctgcacgtgc tgattgagac catcggggtc 300
aaatccatgg tggtcggccg ctacgtgagc cagattaaag agaagctggt gacccgcatc 360
taccgcgggg tcgagccgca gcttccgaac tggttcgcgg tgaccaaaac gcgaaatggc 420
gccgggggcg ggaacaaggt ggtggacgac tgctacatcc ccaactacct gctccccaag 480
acccagcccg agctccagtg ggcgtggact aacatggacc agtatttaag cgcctgtttg 540
aatctcgcgg agcgtaaacg gctggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaaccccaat tctgacgcgc cggtcatcag gtcaaaaacc 660
tcagccaggt acatggagct ggtcgggtgg ctggtggacc gcgggatcac gtcagaaaag 720
caatggattc aggaggacca ggcctcgtac atctccttca acgccgcctc caactcgcgg 780
tcccagatca aggccgcgct ggacaatgcc tccaagatca tgagcctgac aaagacggct 840
ccggactacc tggtgggcag caacccgccg gaggacatta ccaaaaatcg gatctaccaa 900
atcctggagc tgaacgggta cgatccgcag tacgcggcct ccgtcttcct gggctgggcg 960
caaaagaagt tcgggaagag gaacaccatc tggctctttg ggccggccac gacgggtaaa 1020
accaacatcg cggaagccat cgcccacgcc gtgcccttct acggctgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgattgcgtc gacaagatgg tgatctggtg ggaggagggc 1140
aagatgacgg ccaaggtcgt ggagagcgcc aaggccattc tgggcggaag caaggtgcgc 1200
gtggaccaaa agtgcaagtc atcggcccag atcgaaccca ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aacagcacca ccttcgagca tcagcagccg 1320
ctgcaggacc ggatgtttga atttgaactt acccgccgtt tggaccatga ctttgggaag 1380
gtcaccaaac aggaagtaaa ggactttttc cggtgggctt ccgatcacgt gactgacgtg 1440
gctcatgagt tctacgtcag aaagggtgga gctaagaaac gccccgcctc caatgacgcg 1500
gatgtaagcg agccaaaacg ggagtgcacg tcacttgcgc agccgacaac gtcagacgcg 1560
gaagcaccgg cggactacgc ggacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tttttccctg taaaacatgc gagagaatga atcaaatttc caatgtctgt 1680
tttacgcatg gtcaaagaga ctgtggggaa tgcttccctg gaatgtcaga atctcaaccc 1740
gtttctgtcg tcaaaaagaa gacttatcag aaactgtgtc caattcatca tatcctggga 1800
agggcacccg agattgcctg ttcggcctgc gatttggcca atgtggactt ggatgactgt 1860
gtttctgagc aataaatgac ttaaaccagg tatggctgct gacggttatc ttccagattg 1920
gctcgaggac aacctttctg a 1941
<210> 1036
<211> 624
<212> PRT
<213> 腺相关病毒
<400> 1036
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu Arg Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Asp Val Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
50 55 60
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu
85 90 95
Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
100 105 110
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
275 280 285
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
500 505 510
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
515 520 525
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
530 535 540
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys
545 550 555 560
Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser
565 570 575
Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu
580 585 590
Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser
595 600 605
Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
610 615 620
<210> 1037
<211> 536
<212> PRT
<213> 腺相关病毒
<400> 1037
Met Pro Gly Phe Tyr Glu Ile Val Leu Lys Val Pro Ser Asp Leu Asp
1 5 10 15
Glu Arg Leu Pro Gly Ile Ser Asn Ser Phe Val Asn Trp Val Ala Glu
20 25 30
Lys Glu Trp Asp Val Pro Pro Asp Ser Asp Met Asp Pro Asn Leu Ile
35 40 45
Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Glu Phe Leu
50 55 60
Val Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val
65 70 75 80
Gln Phe Glu Lys Gly Glu Thr Tyr Phe His Leu His Val Leu Ile Glu
85 90 95
Thr Ile Gly Val Lys Ser Met Val Val Gly Arg Tyr Val Ser Gln Ile
100 105 110
Lys Glu Lys Leu Val Thr Arg Ile Tyr Arg Gly Val Glu Pro Gln Leu
115 120 125
Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly
130 135 140
Asn Lys Val Val Asp Asp Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys
145 150 155 160
Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Asp Gln Tyr Leu
165 170 175
Ser Ala Cys Leu Asn Leu Ala Glu Arg Lys Arg Leu Val Ala Gln His
180 185 190
Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn
195 200 205
Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr
210 215 220
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
225 230 235 240
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
245 250 255
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
260 265 270
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
275 280 285
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
290 295 300
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
305 310 315 320
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
325 330 335
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
340 345 350
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
355 360 365
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
370 375 380
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
385 390 395 400
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
405 410 415
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
420 425 430
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
435 440 445
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
450 455 460
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
465 470 475 480
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
485 490 495
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
500 505 510
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
515 520 525
Arg Leu Ala Arg Gly Gln Pro Phe
530 535
<210> 1038
<211> 400
<212> PRT
<213> 腺相关病毒
<400> 1038
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
50 55 60
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
275 280 285
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
290 295 300
Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu
305 310 315 320
Phe Pro Cys Lys Thr Cys Glu Arg Met Asn Gln Ile Ser Asn Val Cys
325 330 335
Phe Thr His Gly Gln Arg Asp Cys Gly Glu Cys Phe Pro Gly Met Ser
340 345 350
Glu Ser Gln Pro Val Ser Val Val Lys Lys Lys Thr Tyr Gln Lys Leu
355 360 365
Cys Pro Ile His His Ile Leu Gly Arg Ala Pro Glu Ile Ala Cys Ser
370 375 380
Ala Cys Asp Leu Ala Asn Val Asp Leu Asp Asp Cys Val Ser Glu Gln
385 390 395 400
<210> 1039
<211> 312
<212> PRT
<213> 腺相关病毒
<400> 1039
Met Glu Leu Val Gly Trp Leu Val Asp Arg Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala
20 25 30
Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Ser Lys
35 40 45
Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Ser Asn
50 55 60
Pro Pro Glu Asp Ile Thr Lys Asn Arg Ile Tyr Gln Ile Leu Glu Leu
65 70 75 80
Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala
85 90 95
Gln Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Ala Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Glu Pro Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Glu Phe
210 215 220
Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Arg Trp Ala Ser Asp His Val Thr Asp Val
245 250 255
Ala His Glu Phe Tyr Val Arg Lys Gly Gly Ala Lys Lys Arg Pro Ala
260 265 270
Ser Asn Asp Ala Asp Val Ser Glu Pro Lys Arg Glu Cys Thr Ser Leu
275 280 285
Ala Gln Pro Thr Thr Ser Asp Ala Glu Ala Pro Ala Asp Tyr Ala Asp
290 295 300
Arg Leu Ala Arg Gly Gln Pro Phe
305 310
<210> 1040
<211> 610
<212> PRT
<213> 腺相关病毒
<400> 1040
Met Ala Thr Phe Tyr Glu Val Ile Val Arg Val Pro Phe Asp Val Glu
1 5 10 15
Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asp Trp Val Thr Gly
20 25 30
Gln Ile Trp Glu Leu Pro Pro Glu Ser Asp Leu Asn Leu Thr Leu Val
35 40 45
Glu Gln Pro Gln Leu Thr Val Ala Asp Arg Ile Arg Arg Val Phe Leu
50 55 60
Tyr Glu Trp Asn Lys Phe Ser Lys Gln Glu Ser Lys Phe Phe Val Gln
65 70 75 80
Phe Glu Lys Gly Ser Glu Tyr Phe His Leu His Thr Leu Val Glu Thr
85 90 95
Ser Gly Ile Ser Ser Met Val Leu Gly Arg Tyr Val Ser Gln Ile Arg
100 105 110
Ala Gln Leu Val Lys Val Val Phe Gln Gly Ile Glu Pro Gln Ile Asn
115 120 125
Asp Trp Val Ala Ile Thr Lys Val Lys Lys Gly Gly Ala Asn Lys Val
130 135 140
Val Asp Ser Gly Tyr Ile Pro Ala Tyr Leu Leu Pro Lys Val Gln Pro
145 150 155 160
Glu Leu Gln Trp Ala Trp Thr Asn Leu Asp Glu Tyr Lys Leu Ala Ala
165 170 175
Leu Asn Leu Glu Glu Arg Lys Arg Leu Val Ala Gln Phe Leu Ala Glu
180 185 190
Ser Ser Gln Arg Ser Gln Glu Ala Ala Ser Gln Arg Glu Phe Ser Ala
195 200 205
Asp Pro Val Ile Lys Ser Lys Thr Ser Gln Lys Tyr Met Ala Leu Val
210 215 220
Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys Gln Trp Ile Gln
225 230 235 240
Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr Gly Asn Ser Arg
245 250 255
Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys Ile Met Ser Leu
260 265 270
Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Val Pro Glu Asp
275 280 285
Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Asn Gly Tyr Asp
290 295 300
Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Gln Arg Ser Phe
305 310 315 320
Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Thr Thr Gly Lys
325 330 335
Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe Tyr Gly Cys
340 345 350
Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys Val Asp Lys
355 360 365
Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Lys Val Val Glu
370 375 380
Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val Asp Gln Lys
385 390 395 400
Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Ile Val Thr Ser
405 410 415
Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Thr Thr Phe Glu
420 425 430
His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Glu Leu Thr Lys
435 440 445
Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu Val Lys Asp
450 455 460
Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Thr His Glu Phe
465 470 475 480
Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Glu Lys Ser Leu
485 490 495
Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Lys Ser Leu Glu
500 505 510
Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Arg Ser Ser Asp
515 520 525
Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Trp Asn Ser Arg
530 535 540
Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp Asn Ile Ser Asn
545 550 555 560
Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys Asn Gly Cys Ile
565 570 575
Cys His Asn Val Thr His Cys Gln Ile Cys His Gly Ile Pro Pro Trp
580 585 590
Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp Asp Ala Asn Lys
595 600 605
Glu Gln
610
<210> 1041
<211> 390
<212> PRT
<213> 腺相关病毒
<400> 1041
Met Ala Leu Val Asn Trp Leu Val Glu His Gly Ile Thr Ser Glu Lys
1 5 10 15
Gln Trp Ile Gln Glu Asn Gln Glu Ser Tyr Leu Ser Phe Asn Ser Thr
20 25 30
Gly Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Thr Lys
35 40 45
Ile Met Ser Leu Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser
50 55 60
Val Pro Glu Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met
65 70 75 80
Asn Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys
85 90 95
Gln Arg Ser Phe Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala
100 105 110
Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro
115 120 125
Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp
130 135 140
Cys Val Asp Lys Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn
145 150 155 160
Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg
165 170 175
Val Asp Gln Lys Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val
180 185 190
Ile Val Thr Ser Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser
195 200 205
Thr Thr Phe Glu His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe
210 215 220
Glu Leu Thr Lys Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln
225 230 235 240
Glu Val Lys Asp Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val
245 250 255
Thr His Glu Phe Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala
260 265 270
Glu Lys Ser Leu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr
275 280 285
Lys Ser Leu Glu Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro
290 295 300
Arg Ser Ser Asp Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn
305 310 315 320
Trp Asn Ser Arg Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp
325 330 335
Asn Ile Ser Asn Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys
340 345 350
Asn Gly Cys Ile Cys His Asn Val Thr His Cys Gln Ile Cys His Gly
355 360 365
Ile Pro Pro Trp Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp
370 375 380
Asp Ala Asn Lys Glu Gln
385 390
<210> 1042
<211> 341
<212> PRT
<213> 腺相关病毒
<400> 1042
Met Ser Leu Thr Lys Ser Ala Val Asp Tyr Leu Val Gly Ser Ser Val
1 5 10 15
Pro Glu Asp Ile Ser Lys Asn Arg Ile Trp Gln Ile Phe Glu Met Asn
20 25 30
Gly Tyr Asp Pro Ala Tyr Ala Gly Ser Ile Leu Tyr Gly Trp Cys Gln
35 40 45
Arg Ser Phe Asn Lys Arg Asn Thr Val Trp Leu Tyr Gly Pro Ala Thr
50 55 60
Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro Phe
65 70 75 80
Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp Cys
85 90 95
Val Asp Lys Met Leu Ile Trp Trp Glu Glu Gly Lys Met Thr Asn Lys
100 105 110
Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg Val
115 120 125
Asp Gln Lys Cys Lys Ser Ser Val Gln Ile Asp Ser Thr Pro Val Ile
130 135 140
Val Thr Ser Asn Thr Asn Met Cys Val Val Val Asp Gly Asn Ser Thr
145 150 155 160
Thr Phe Glu His Gln Gln Pro Leu Glu Asp Arg Met Phe Lys Phe Glu
165 170 175
Leu Thr Lys Arg Leu Pro Pro Asp Phe Gly Lys Ile Thr Lys Gln Glu
180 185 190
Val Lys Asp Phe Phe Ala Trp Ala Lys Val Asn Gln Val Pro Val Thr
195 200 205
His Glu Phe Lys Val Pro Arg Glu Leu Ala Gly Thr Lys Gly Ala Glu
210 215 220
Lys Ser Leu Lys Arg Pro Leu Gly Asp Val Thr Asn Thr Ser Tyr Lys
225 230 235 240
Ser Leu Glu Lys Arg Ala Arg Leu Ser Phe Val Pro Glu Thr Pro Arg
245 250 255
Ser Ser Asp Val Thr Val Asp Pro Ala Pro Leu Arg Pro Leu Asn Trp
260 265 270
Asn Ser Arg Tyr Asp Cys Lys Cys Asp Tyr His Ala Gln Phe Asp Asn
275 280 285
Ile Ser Asn Lys Cys Asp Glu Cys Glu Tyr Leu Asn Arg Gly Lys Asn
290 295 300
Gly Cys Ile Cys His Asn Val Thr His Cys Gln Ile Cys His Gly Ile
305 310 315 320
Pro Pro Trp Glu Lys Glu Asn Leu Ser Asp Phe Gly Asp Phe Asp Asp
325 330 335
Ala Asn Lys Glu Gln
340
<210> 1043
<400> 1043
000
<210> 1044
<400> 1044
000
<210> 1045
<400> 1045
000
<210> 1046
<400> 1046
000
<210> 1047
<400> 1047
000
<210> 1048
<400> 1048
000
<210> 1049
<400> 1049
000
<210> 1050
<400> 1050
000
<210> 1051
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 1051
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
cc 62
<210> 1052
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 1052
cgggcgggtg gtggcggcgg ttggggctcg gcgctcgctc gctcgctggg cgggcgggcg 60
gt 62
<210> 1053
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
<400> 1053
Gly Met Gly Tyr Gly Met Gly Tyr Gly Met Gly Tyr Gly Met Gly Tyr
1 5 10 15
<210> 1054
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
<400> 1054
Gly Met Gly Tyr Gly Met Gly Tyr Gly Met Gly Tyr Gly Met Gly Tyr
1 5 10 15
Gly Met Gly Tyr
20
<210> 1055
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 1055
gcgcgctcgc tcgctc 16
<210> 1056
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 1056
gctcgctcgc tcgctg 16
<210> 1057
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<220>
<221> 经修饰的碱基
<222> (1)..(1)
<223> a、c、t或g
<400> 1057
ngttgg 6
<210> 1058
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 1058
agttgg 6
<210> 1059
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 1059
ggttgg 6
<210> 1060
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
<220>
<221> 经修饰的残基
<222> (4)..(5)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (7)..(7)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (9)..(10)
<223> 任何氨基酸
<400> 1060
Tyr Asn Pro Xaa Xaa Asp Xaa Gly Xaa Xaa Asn
1 5 10
<210> 1061
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
<220>
<221> 经修饰的残基
<222> (6)..(7)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (9)..(9)
<223> 任何氨基酸
<220>
<221> 经修饰的残基
<222> (15)..(16)
<223> 任何氨基酸
<400> 1061
Tyr Asn Cys Ser Pro Xaa Xaa Asp Xaa Gly Ala Ser Lys Arg Xaa Xaa
1 5 10 15
Asn Thr Ser Val Ala Lys
20
<210> 1062
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<220>
<221> 经修饰的碱基
<222> (45)..(45)
<223> a、c、t、g,未知或其他
<220>
<223> 请参见提交的说明书,以获取
置换和优选的实施例的详细描述
<400> 1062
aggtgagtga aaccaccgaa gtcaaggggc aattcgggct agggncagtc t 51
<210> 1063
<211> 50
<212> DNA
<213> 甲型细环病毒物种(Alphatorquevirus sp.)
<400> 1063
aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 50
<210> 1064
<211> 50
<212> DNA
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1064
aggtgagtga aaccaccgaa gtcaaggggc aattcgggct agatcagtct 50
<210> 1065
<211> 50
<212> DNA
<213> 丙型细环病毒物种(Gammatorquevirus sp.)
<400> 1065
aggtgagtga aaccaccgag gtctaggggc aattcgggct agggcagtct 50
<210> 1066
<211> 150
<212> PRT
<213> 乙型细环病毒物种(Betatorquevirus sp.)
<400> 1066
Met Pro Trp Trp Tyr Arg Arg Arg Ser Tyr Asn Pro Trp Arg Arg Arg
1 5 10 15
Asn Trp Phe Arg Arg Pro Arg Lys Thr Ile Tyr Arg Arg Tyr Arg Arg
20 25 30
Arg Arg Arg Trp Pro Thr Tyr Val Val Pro Asn Asn Phe Asn Glu Thr
35 40 45
Thr Ser Leu Gln Asn Pro Thr Thr Arg Pro Glu His Phe Leu Tyr Ser
50 55 60
Phe Asp Glu Arg Arg Gly Gln Leu Thr Glu Lys Ala Thr Lys Arg Leu
65 70 75 80
Leu Lys Asp Trp Glu Thr Lys Glu Thr Ser Leu Leu Ser Thr Glu Tyr
85 90 95
Arg Phe Ala Glu Pro Thr Gln Thr Gln Ala Pro Gln Glu Asp Pro Ser
100 105 110
Ser Glu Glu Glu Glu Glu Ser Asn Leu Phe Glu Arg Leu Leu Arg Gln
115 120 125
Arg Thr Lys Gln Leu Gln Leu Lys Arg Arg Ile Ile Gln Thr Leu Lys
130 135 140
Asp Leu Gln Lys Leu Glu
145 150
<210> 1067
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> 对人工序列的描述:合成的
寡核苷酸
<400> 1067
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
cc 62

Claims (7)

1.一种包含环状DNA的病毒颗粒,该环状DNA包含(i)AAV复制起点,(ii)与编码治疗性RNA或多肽的序列可操作地连接的启动子,以及(iii)结合指环病毒ORF1分子的序列,该环状DNA被包含指环病毒ORF1分子的衣壳包裹。
2.一种载体,其包含:
a)包含指环病毒ORF1分子的蛋白质外壳;以及
b)包含非指环病毒复制起点的遗传元件;
任选地,其中该遗传元件进一步包含:(i)编码外源性效应物的核酸序列,和/或(ii)与该编码外源性效应物的核酸序列可操作地连接的启动子元件。
3.一种遗传元件,其包含:
特异性结合指环病毒ORF1分子的蛋白结合序列(例如,5’UTR);和
AAV复制起点,例如,包含在第一AAV反向末端重复(ITR)中;
任选地,编码外源性效应物(例如,治疗性外源性效应物)的核酸序列;以及
任选地,与该编码外源性效应物的核酸序列可操作地连接的启动子元件。
4.一种系统,其包含:
a)第一核酸,其中该第一核酸是遗传元件或遗传元件构建体,该第一核酸包含:
AAV复制起点,例如,包含在第一AAV反向末端重复(ITR)中;
任选地,编码外源性效应物(例如,治疗性外源性效应物)的核酸序列;以及
任选地,与该编码外源性效应物的核酸序列可操作地连接的启动子元件;
b)编码指环病毒ORF1分子的第二核酸。
5.一种将外源性效应物递送至靶细胞(例如脊椎动物细胞,例如哺乳动物细胞,例如人细胞)的方法,该方法包括将如权利要求2所述的载体引入该细胞中。
6.一种在有需要的受试者中治疗或预防疾病或障碍的方法,该方法包括向该受试者中引入如权利要求2所述的载体。
7.一种制备治疗性组合物的方法,该方法包括:
(a)提供一种或多种包含外源性DNA的宿主细胞,该外源性DNA包含:
(i)AAV复制起点,
(ii)与编码治疗性效应物(例如,治疗性RNA或多肽)的序列可操作地连接的启动子,
(iii)编码指环病毒ORF1分子的序列,
(iv)任选地编码指环病毒ORF2分子的序列,
(v)任选地编码AAV REP2序列的序列,
(vi)任选地编码一种或多种辅助蛋白例如腺病毒辅助蛋白,例如E2A分子、腺病毒E4分子和/或腺病毒VARNA分子的序列;
(b)在适于形成包含蛋白质外壳(例如,衣壳)的载体(例如指环载体,例如病毒颗粒)的条件下培养该一种或多种宿主细胞,该蛋白质外壳包含足够数量的ORF1分子以包封(例如,包裹)该遗传元件;
(c)从细胞培养物中纯化步骤(b)中产生的载体,
从而制备治疗性组合物。
CN202280019539.4A 2021-02-08 2022-02-07 杂合aav-指环载体 Pending CN117279669A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163147102P 2021-02-08 2021-02-08
US63/147,102 2021-02-08
PCT/US2022/015499 WO2022170195A1 (en) 2021-02-08 2022-02-07 Hybrid aav-anellovectors

Publications (1)

Publication Number Publication Date
CN117279669A true CN117279669A (zh) 2023-12-22

Family

ID=82742534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280019539.4A Pending CN117279669A (zh) 2021-02-08 2022-02-07 杂合aav-指环载体

Country Status (9)

Country Link
US (1) US20240123083A1 (zh)
EP (1) EP4288115A1 (zh)
JP (1) JP2024507732A (zh)
KR (1) KR20230146560A (zh)
CN (1) CN117279669A (zh)
AU (1) AU2022216311A1 (zh)
CA (1) CA3210500A1 (zh)
IL (1) IL304741A (zh)
WO (1) WO2022170195A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200123203A1 (en) * 2017-06-13 2020-04-23 Flagship Pioneering Innovations V, Inc. Compositions comprising curons and uses thereof
JP7384797B2 (ja) * 2017-11-30 2023-11-21 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア ムコ多糖症iiib型のための遺伝子療法

Also Published As

Publication number Publication date
EP4288115A1 (en) 2023-12-13
CA3210500A1 (en) 2022-08-11
IL304741A (en) 2023-09-01
JP2024507732A (ja) 2024-02-21
KR20230146560A (ko) 2023-10-19
AU2022216311A1 (en) 2023-08-17
US20240123083A1 (en) 2024-04-18
WO2022170195A1 (en) 2022-08-11

Similar Documents

Publication Publication Date Title
KR20210125990A (ko) 단백질 대체 치료 양식을 운반하기 위한 아넬로좀
KR20210131310A (ko) 아넬로좀 및 사용 방법
KR20210131309A (ko) 분비형 치료 양식을 운반하기 위한 아넬로좀
KR20210131308A (ko) 세포내 치료 양식을 운반하기 위한 아넬로좀
CN116034160A (zh) 杆状病毒表达系统
KR20230124682A (ko) Rna를 봉입하는 아넬로바이러스 캡시드의 시험관 내어셈블리
CN117279669A (zh) 杂合aav-指环载体
AU2021372533A1 (en) Chicken anemia virus (cav)-based vectors
CN118647725A (zh) 表面修饰的病毒颗粒和模块化病毒颗粒
CN116829723A (zh) 基于鸡贫血病毒(cav)的载体
WO2023114857A2 (en) Surface-modified viral particles and modular viral particles
KR20230041686A (ko) 아넬로바이러스를 확인 및 특징화하는 방법 및 이의 용도
CN116075591A (zh) 串联型指环病毒构建体
WO2023225593A9 (en) Compositions comprising modified anellovirus capsid proteins and uses thereof
CN116887865A (zh) 包封rna的指环病毒衣壳的体外组装

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination