CN116887865A

CN116887865A - 包封rna的指环病毒衣壳的体外组装

Info

Publication number: CN116887865A
Application number: CN202180093903.7A
Authority: CN
Inventors: R·J·哈贾尔; S·德拉格拉夫; K·A·斯万森
Original assignee: Flagship Pioneering Innovations V Inc
Current assignee: Flagship Pioneering Innovations V Inc
Priority date: 2020-12-23
Filing date: 2021-12-22
Publication date: 2023-10-13

Abstract

本发明总体上涉及用于制备指环载体的组合物及其用途。

Description

包封RNA的指环病毒衣壳的体外组装

相关申请的交叉引用

本申请要求2020年12月23日提交的美国临时申请号63/130,360以及2021年2月8日提交的美国临时申请号63/147,064的权益。上述申请的内容通过引用以其全文特此并入。

序列表

本申请包含序列表，该序列表已以ASCII格式电子提交，并通过引用以其全文特此并入。所述ASCII副本创建于2021年12月21日，名为V2057-7017WO_SL.txt，并且大小为286,720字节。

背景技术

一直需要开发用于制备合适载体的组合物和方法，以将治疗性效应物递送至患者。

发明内容

本披露提供了用于产生指环载体(例如合成的指环载体)的组合物和方法，该指环载体可用作递送媒介物，例如，用于将遗传物质、用于将效应物(例如有效载荷)、或用于将治疗剂或治疗性效应物递送至真核细胞(例如，人类细胞或人类组织)。虽然天然存在的指环病毒(Anellovirus)具有DNA基因组，但本披露提供了具有包含RNA的遗传元件的指环载体。

指环载体(例如，使用如本文所述的组合物或方法产生的指环载体)通常包含包封在蛋白质外壳(例如，包含指环病毒衣壳蛋白例如指环病毒ORF1蛋白或由指环病毒ORF1核酸编码的多肽的蛋白质外壳，例如，如本文所述)中的遗传元件(例如，包含或编码效应物(例如外源性或内源性效应物，例如治疗性效应物)的遗传元件)，能够将该遗传元件引入细胞(例如，哺乳动物细胞，如人类细胞)中。遗传元件可以包括RNA。在一些实施例中，指环载体是感染性媒介物或颗粒，其包含蛋白质外壳，该蛋白质外壳包含由指环病毒ORF1核酸(例如，甲型细环病毒、乙型细环病毒或丙型细环病毒的ORF1核酸，如甲型细环病毒分支1、甲型细环病毒分支2、甲型细环病毒分支3、甲型细环病毒分支4、甲型细环病毒分支5、甲型细环病毒分支6或甲型细环病毒分支7的ORF1，例如，如本文所述)编码的多肽。本披露的指环载体的遗传元件通常是环状和/或单链RNA分子(例如，环状和单链的)，其具有与包封它的蛋白质外壳结合的蛋白结合序列，或与之相连的多肽，这可能有助于将遗传元件包封在蛋白质外壳内，和/或相对于其他核酸而言，将遗传元件富集在蛋白质外壳内。在一些实施例中，指环载体的遗传元件是使用杆状病毒、核酸构建体(例如，杆粒和/或供体载体)、昆虫细胞和/或动物细胞系产生的，例如，如本文所述。

在一些情况下，遗传元件包含或编码效应物(例如，包含核酸效应物如非编码RNA，或编码多肽效应物如蛋白质)，例如，可以在靶细胞中表达的效应物。在一些实施例中，效应物是治疗剂或治疗性效应物，例如，如本文所述的。在一些实施例中，效应物是内源性效应物或外源性效应物，例如针对野生型指环病毒或靶细胞而言是外源性的。在一些实施例中，效应物针对野生型指环病毒或靶细胞而言是外源性的。在一些实施例中，指环载体可以通过接触细胞并将编码效应物的遗传元件引入细胞中，从而将效应物递送到细胞内，使得效应物由细胞产生或表达。在某些情况下，效应物是内源性效应物(例如，针对靶细胞而言是内源性的，但是，例如由指环载体以更大的量提供的内源性效应物)。在其他情况下，效应物是外源性效应物。在一些情况下，效应物可以调节细胞的功能或者调节细胞中靶分子的活性或水平。例如，效应物可以降低细胞中靶蛋白的水平(例如，如PCT/US19/65995的实例3和4中所述)。在另一实例中，指环载体可以在体内递送和表达效应物，例如外源性蛋白(例如，如PCT/US19/65995的实例19和28中所述)。例如，指环载体可用于将遗传物质递送到靶细胞、组织或受试者；将效应物递送到靶细胞、组织或受试者；或用于治疗疾病和障碍，例如，通过将可作为治疗剂的效应物递送到所需细胞、组织或受试者。

在一些实施例中，本文所述的组合物和方法可用于产生合成指环载体的遗传元件，例如在宿主细胞中。合成指环载体与野生型病毒(例如，野生型指环病毒，例如，如本文所述)相比具有至少一种结构差异，例如，相对于野生型病毒的缺失、插入、置换、修饰(例如，酶促修饰)。一般而言，合成指环载体包括包封在蛋白质外壳内的外源性遗传元件，其可用于将遗传元件或在其中编码的(例如，多肽或核酸效应物)效应物(例如，外源性效应物或内源性效应物)递送至真核(例如，人类)细胞中。在实施例中，指环载体不会造成可检测的和/或不必要的免疫或炎症反应，例如，不会造成一种或多种炎症分子标志如TNF-α、IL-6、IL-12、IFN增加超过1％、5％、10％、15％，以及不会造成B细胞应答，如反应性或中和性抗体，例如，指环载体对靶细胞、组织或受试者是基本上非免疫原性的。

在一些实施例中，本文所述的组合物和方法可用于产生指环载体的遗传元件，该指环载体包括：(i)包含ORF1分子的蛋白质外壳；以及(ii)包含RNA的遗传元件；其中遗传元件被包封在蛋白质外壳内。在一些实施例中，遗传元件由至少10％、20％、25％、30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％RNA组成。在一些实施例中，遗传元件不包含DNA。在一些实施例中，遗传元件不包含ssDNA。替代性地，在一些实施例中，遗传元件包含DNA区域。在一些实施例中，本文所述的DNA或RNA分子包含一个或多个经修饰的核苷酸(例如碱基修饰、糖修饰或骨架修饰)。在一些实施例中，遗传元件是单链的。在一些实施例中，遗传元件包含双链区域。在一些实施例中，遗传元件是线性多肽。替代性地，在一些实施例中，遗传元件是环状多核苷酸。在一些实施例中，核酸序列经过密码子优化，例如，用于在昆虫细胞中表达。在一些实施例中，核酸序列中至少50％、60％、70％、80％、90％、95％、96％、97％、98％、99％或100％的密码子经过密码子优化，例如，用于在昆虫细胞中表达。在一些实施例中，核酸序列经过密码子优化，例如，用于在哺乳动物(如，人类)细胞中表达。在一些实施例中，核酸序列中至少50％、60％、70％、80％、90％、95％、96％、97％、98％、99％或100％的密码子经过密码子优化，例如，用于在哺乳动物(如，人类)细胞中表达。在一些实施例中，遗传元件的长度为约10-20、20-30、30-40、50-60、60-70、70-80、80-90、90-100、100-125、125-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-3500、3500-4000或4000-4500个核苷酸。在一些实施例中，遗传元件的长度为至少约10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000或4500个核苷酸。

在一些实施例中，本文所述的组合物和方法可用于产生包含衣壳(例如，包含指环病毒ORF如ORF1、多肽的衣壳)的感染性(例如，对人类细胞具有感染性)指环载体、媒介物或颗粒的遗传元件，该衣壳封装遗传元件，该遗传元件包含与衣壳结合的蛋白结合序列和编码治疗性效应物的异源(针对指环病毒而言)序列。在实施例中，指环载体能够将遗传元件递送至哺乳动物(例如，人类)细胞中。

在一方面，本发明的特征在于通过体外组装制备指环载体的方法。在一些实施例中，制备指环载体的方法包括：(a)提供混合物，其包含：(i)包含RNA的遗传元件，和(ii)ORF1分子；以及(b)在适用于将遗传元件包封在包含ORF1分子的蛋白质内的条件下孵育混合物，从而制备指环载体；任选地，其中该混合物不包含在细胞中。在一些实施例中，方法进一步包括在提供(a)之前，例如在宿主细胞(例如昆虫细胞或哺乳动物细胞)中表达ORF1分子。在一些实施例中，表达包括在适用于产生ORF1分子的条件下孵育包含编码ORF1分子的核酸分子(例如杆状病毒表达载体)的宿主细胞(例如，昆虫细胞或哺乳动物细胞)。在一些实施例中，方法进一步包括在提供(a)之前，纯化由宿主细胞表达的ORF1分子。

在一些实施例中，如本文所述的指环载体可用作有效的递送媒介物，用于将作用剂如本文所述的效应物引入靶细胞中，例如，待接受治疗性或预防性治疗的受试者中的靶细胞。

在一方面，本发明的特征在于药物组合物，其包含如本文所述的指环载体(例如，合成指环载体)。在一些实施例中，药物组合物进一步包含药学上可接受的载剂或赋形剂。在实施例中，药物组合物包含单位剂量，该单位剂量包含每千克目标受试者约10⁵-10¹⁴(例如，约10⁶-10¹³、10⁷-10¹²、10⁸-10¹¹或10⁹-10¹⁰)个基因组当量的指环载体。在一些实施例中，包含制剂的药物组合物在可接受的期限和温度范围内是稳定的，和/或与所期望的施用途径和/或该施用途径所需的任何装置(例如，针头或注射器)相容。在一些实施例中，将药物组合物配制用于作为单剂量或多剂量施用。在一些实施例中，将药物组合物在施用场所配制，例如由医疗保健专业人员配制。在一些实施例中，药物组合物包含所期望的浓度的指环载体基因组或基因组当量(例如，由每体积的基因组数量来定义)。

在一方面，本发明的特征在于治疗受试者中疾病或障碍的方法，该方法包括向该受试者施用指环载体，例如，合成指环载体，例如，如本文所述的。

在一方面，本发明的特征在于将效应物或有效载荷(例如，内源性或外源性效应物)递送至细胞、组织或受试者的方法，该方法包括向该受试者施用指环载体，例如合成指环载体，例如，如本文所述的，其中该指环载体包含编码该效应物的核酸序列。在一些实施例中，有效载荷是核酸。在一些实施例中，有效载荷是多肽。

在一方面，本发明的特征在于将指环载体递送至细胞的方法，该方法包括使该指环载体(例如合成指环载体，例如，如本文所述)与细胞(例如真核细胞，如哺乳动物细胞)进行接触，例如，在体内或离体条件下进行接触。

任何前述指环载体、组合物或方法的其他特征包括以下列举的实施例中的一个或多个。

本领域技术人员将会认识到，或者仅使用常规实验就能够确定本文所述本发明的具体实施例的许多等同形式。这样的等同形式意在由以下列举的实施例所涵盖。

列举的实施例

1.一种指环载体，其含有：

a)包含ORF1分子的蛋白质外壳；

b)包含RNA的遗传元件，

其中该遗传元件被包封在该蛋白质外壳内。

2.根据实施例1所述的指环载体，其中该遗传元件由至少10％、20％、25％、30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％RNA组成。

3.根据实施例1或2所述的指环载体，其中该RNA包含一个或多个化学修饰。

4.根据前述实施例中任一项所述的指环载体，其中该遗传元件由RNA组成或基本上由RNA组成。

5.根据前述实施例中任一项所述的指环载体，其中该指环载体不包含DNA。

6.根据前述实施例中任一项所述的指环载体，其中该指环载体不包含ssDNA。

7.根据前述实施例中任一项所述的指环载体，其中该遗传元件包含DNA区域。

8.根据前述实施例中任一项所述的指环载体，其中该DNA区域的所有核苷酸都经过化学修饰。

9.根据实施例7或8所述的指环载体，其中该DNA区域与该遗传元件的RNA共价连接。

10.根据前述实施例中任一项所述的指环载体，其中该DNA区域的至少一部分与该遗传元件的RNA的至少一部分杂交。

11.根据前述实施例中任一项所述的指环载体，其中该DNA区域的长度为10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900或900-1000个核苷酸。

12.根据前述实施例中任一项所述的指环载体，其中该遗传元件是单链的。

13.根据前述实施例中任一项所述的指环载体，其中该遗传元件包含双链区域(例如，与RNA配对的RNA区域或与RNA配对的DNA区域)。

14.根据前述实施例中任一项所述的指环载体，其中该遗传元件是线性的。

15.根据前述实施例中任一项所述的指环载体，其中该遗传元件是环状的。

16.根据前述实施例中任一项所述的指环载体，其中该遗传元件包含第一区域和可与该第一区域杂交的第二区域。

17.根据前述实施例中任一项所述的指环载体，其中该遗传元件不包含5'端或3'端。

18.根据实施例15-17中任一项所述的指环载体，其中该遗传元件不包含游离磷酸和游离糖中的一种或两种。

19.根据实施例15-18中任一项所述的指环载体，其中该遗传元件中的每个磷酸通过该磷酸所包含的第一氧原子共价连接到第一糖，并且通过该磷酸所包含的第二氧原子共价连接到第二糖。

20.根据实施例15-19中任一项所述的指环载体，其中该遗传元件中的每个糖通过该糖所包含的第一碳原子共价连接到第一磷酸，并且通过该糖所包含的第二碳原子共价连接到第二磷酸。

21.根据实施例15-20中任一项所述的指环载体，其中该遗传元件通过使线性RNA环化而产生。

22.根据前述实施例中任一项所述的指环载体，其中该遗传元件的长度为约10-20、20-30、30-40、50-60、60-70、70-80、80-90、90-100、100-125、125-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-3500、3500-4000或4000-4500个核苷酸。

23.根据前述实施例中任一项所述的指环载体，其中该遗传元件的长度为至少约10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000或4500个核苷酸。

24.根据前述实施例中任一项所述的指环载体，其中该遗传元件结合该ORF1分子。

25.根据前述实施例中任一项所述的指环载体，其中该遗传元件结合该ORF1分子所包含的胶冻卷结构域。

26.根据前述实施例中任一项所述的指环载体，其中该遗传元件结合该ORF1分子所包含的富含精氨酸的结构域。

27.根据前述实施例中任一项所述的指环载体，其中该指环载体包含多个遗传元件，例如，至少2、3、4、5、10、20、30、40、50或60个遗传元件。

28.根据实施例27所述的指环载体，其中多个遗传元件各自包含相同的序列。

29.根据实施例27所述的指环载体，其中多个遗传元件包含不同的序列。

30.根据前述实施例中任一项所述的指环载体，其中该遗传元件编码外源性效应物。

31.根据实施例30所述的指环载体，其中编码该外源性效应物的序列的长度为至少约10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500或3000个核苷酸。

32.根据实施例30-31中任一项所述的指环载体，其中该外源性效应物包含治疗性效应物(例如，多肽或核酸分子)。

33.根据实施例30-32中任一项所述的指环载体，其中该外源性效应物包含人蛋白质或包含与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的氨基酸序列的多肽。

34.根据实施例30-33中任一项所述的指环载体，其中该外源性效应物包含核酸分子。

35.根据实施例30-34中任一项所述的指环载体，其中该外源性效应物包含非编码核酸分子，例如功能性RNA，例如mRNA、miRNA或siRNA。

36.根据实施例30-35中任一项所述的指环载体，其中该遗传元件是编码外源性效应物(例如，肽或多肽，例如，治疗性肽或多肽)的mRNA分子。

37.根据实施例36所述的指环载体，其中该非编码核酸分子是人非编码核酸分子或包含与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列的核酸分子。

38.根据实施例30-37中任一项所述的指环载体，其中该外源性效应物包含胞质多肽或胞质肽(例如，DPP-4抑制剂、GLP-1信号传导激活剂、或中性粒细胞弹性蛋白酶抑制剂或其功能片段)。

39.根据实施例38所述的指环载体，其中该外源性效应物包含调节性细胞内多肽。

40.根据实施例30-39中任一项所述的指环载体，其中该外源性效应物包含分泌的多肽或肽(例如，细胞因子、抗体分子、激素、生长因子或凝血相关因子，或其功能片段)。

41.根据实施例30-40中任一项所述的指环载体，其中该外源性效应物包含蛋白质替代治疗剂。

42.根据实施例30-41中任一项所述的指环载体，其中该外源性效应物包含酶。

43.根据实施例30-42中任一项所述的指环载体，其中该外源性效应物包含促红细胞生成素(EPO)或人生长激素(hGH)，或其功能片段。

44.根据实施例30-43中任一项所述的指环载体，其中该外源性效应物包含基因编辑系统的组分(例如，CRISPR系统的组分，例如Cas9、Cpf1或其功能片段)。

45.根据前述实施例中任一项所述的指环载体，其中该RNA包含化学修饰的RNA，例如，如本文所述。

46.根据前述实施例中任一项所述的指环载体，其中该RNA包含帽。

47.根据前述实施例中任一项所述的指环载体，其中该RNA包含多聚A尾，例如，长度为至少约5、10、15、20、25、30、40、50、60、70、80、90或100个腺苷。

48.根据前述实施例中任一项所述的指环载体，其中该RNA缺少多聚A尾，例如，包含不超过5、10、15、20、25、30、40、50、60、70、80、90或100个连续的腺苷。

49.根据前述实施例中任一项所述的指环载体，其中该蛋白质外壳包含约60个(例如，约40、50、60、70或80个)拷贝的ORF1分子。

50.根据前述实施例中任一项所述的指环载体，其中这些ORF1分子的胶冻卷结构域面向该蛋白质外壳的内部。

51.根据前述实施例中任一项所述的指环载体，其中该ORF1分子包含如表N-S和37A-37C中任一个列出的氨基酸序列，或与其具有至少30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。

52.根据前述实施例中任一项所述的指环载体，其中该ORF1分子包含富含精氨酸的区域，例如，包含如表N-S和37A-37C中任一个列出的富含精氨酸的区域的氨基酸序列，或与其具有至少30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。

53.根据实施例52所述的指环载体，其中该富含精氨酸的区域包含至少约70％(例如，至少约70％、75％、80％、85％、90％、95％或100％)碱性残基(例如，精氨酸或赖氨酸)。

54.根据前述实施例中任一项所述的指环载体，其中该ORF1分子包含胶冻卷结构域，例如，包含如表N-S和37A-37C中任一个列出的胶冻卷结构域的氨基酸序列，或与其具有至少30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。

55.根据实施例54所述的指环载体，其中该胶冻卷结构域包含以下特征中的一个或多个(例如，1、2、3或4个)：

(i)该胶冻卷结构域的至少30％(例如，至少30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、90％或更多)的氨基酸是一个或多个β-折叠的部分；

(ii)该胶冻卷结构域的二级结构包含至少四个(例如，至少4、5、6、7、8、9、10、11或12个)β-折叠；和/或

(iii)该胶冻卷结构域的三级结构包含至少两个(例如，至少2、3或4个)β-折叠；和/或

(iv)该胶冻卷结构域包含β-折叠与α-螺旋的比例为至少2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。

56.根据实施例54所述的指环载体，其中该胶冻卷结构域包含两个β-折叠，例如，相对于彼此以反平行方向排列。

57.根据实施例54所述的指环载体，其中该胶冻卷结构域包含八条β-链。

58.根据实施例52-57中任一项所述的指环载体，其中该胶冻卷结构域包含与Dβ-链的序列具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的区域，例如，如图3所示。

59.根据实施例52所述的指环载体，其中该Dβ-链包含1、2或3或更多个碱性残基(例如，精氨酸或赖氨酸)。

60.根据实施例52-59中任一项所述的指环载体，其中该胶冻卷结构域包含与Gβ-链的序列具有至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的区域，例如，如图3所示。

61.根据实施例52所述的指环载体，其中该Gβ-链包含至少约1、2或3或更多个碱性残基(例如，精氨酸或赖氨酸)。

62.根据前述实施例中任一项所述的指环载体，其中该ORF1分子包含N22结构域，例如，包含如表N-S和37A-37C中任一个列出的N22结构域的氨基酸序列，或与其具有至少30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。

63.根据前述实施例中任一项所述的指环载体，其中该N22结构域包含氨基酸序列YNPX²DXGX²N，其中Xⁿ各自独立地为任何n个氨基酸的连续序列。

64.根据前述实施例中任一项所述的指环载体，其中该N22结构域包含氨基酸序列YNPX²DXGX²N侧翼的第一β链和第二β链，例如，其中该第一β链包含氨基酸序列YNPX²DXGX²N的酪氨酸(Y)残基和/或其中该第二β链包含氨基酸序列YNPX²DXGX²N的第二天冬酰胺(N)残基(从N到C)。

65.根据前述实施例中任一项所述的指环载体，其中该ORF1分子包含C-末端结构域，例如，包含表N-S和37A-37C中任一个列出的C-末端结构域的氨基酸序列，或与其具有至少30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。

66.根据前述实施例中任一项所述的指环载体，其中该遗传元件缺少编码指环病毒ORF1蛋白的序列(例如，如本文所述)。

67.根据前述实施例中任一项所述的指环载体，其中该遗传元件缺少编码指环病毒ORF2蛋白的序列(例如，如本文所述)。

68.根据前述实施例中任一项所述的指环载体，其中该遗传元件缺少编码指环病毒ORF3蛋白的序列(例如，如本文所述)。

69.根据前述实施例中任一项所述的指环载体，其中该指环载体被配置为将该遗传元件递送到细胞(例如，真核细胞，例如哺乳动物细胞，例如，人类细胞)。

70.根据实施例69所述的指环载体，其中至少1000个该指环载体的群体能够将至少约100个拷贝(例如，至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、5000、10,000、50,000、100,000、500,000或1,000,000个拷贝)的该遗传元件递送到一个或多个细胞中。

71.根据实施例69或70所述的指环载体，其中该指环载体的群体(例如，每个细胞至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000个基因组当量的该遗传元件)能够将该遗传元件递送到这些细胞的群体的至少10％、20％、30％、40％、50％、60％、70％、80％、90％、95％、99％或更多中。

72.根据实施例69-71中任一项所述的指环载体，其中该指环载体的群体(例如，每个细胞至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000个基因组当量的该遗传元件)能够将每个细胞至少1、2、3、4、5、6、7、8、9、10、20、50、100、200、500、1000、2000、5000、8,000、1x 10⁴、1x 10⁵、1x 10⁶、1x 10⁷或更多个拷贝的该遗传元件递送到这些细胞的群体中。

73.根据实施例69-72中任一项所述的指环载体，其中该指环载体的群体(例如，每个细胞至少1、2、3、4、5、10、20、30、40、50、100、200、300、400、500、600、700、800、900或1000个基因组当量的该遗传元件)能够将每个细胞1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、5-10、10-20、20-50、50-100、100-1000、1000-10⁴、1x 10⁴-1x 10⁵、1x 10⁴-1x 10⁶、1x 10⁴-1x 10⁷、1x 10⁵-1x 10⁶、1x 10⁵-1x 10⁷或1x 10⁶-1x 10⁷个拷贝的该遗传元件递送到这些细胞的群体中。

74.根据前述实施例中任一项所述的指环载体，其中该指环载体选择性地将该效应物递送到所需细胞类型、组织或器官(例如，骨髓、血液、心脏、GI、皮肤、视网膜中的光感受器、上皮衬里或胰腺)，或在其中以更高水平存在(例如，优选地在其中累积)。

75.根据前述实施例中任一项所述的指环载体，其中该遗传元件免受RNA酶(例如，蛋白质外壳)的酶切，或对其具有抗性。

76.根据前述实施例中任一项所述的指环载体，其中包封在该蛋白质外壳内的该遗传元件对核酸内切酶酶切，例如RNA酶酶切具有抗性。

77.根据前述实施例中任一项所述的指环载体，其中该遗传元件包含启动子元件。

78.根据前述实施例中任一项所述的指环载体，其中该遗传元件包含蛋白质结合序列。

79.根据实施例78所述的指环载体，其中该蛋白质结合序列能够结合该ORF1分子。

80.一种组合物，其包含多个根据前述实施例中任一项所述的指环载体。

81.根据实施例80所述的组合物，其中该组合物中至少50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的包含ORF1分子的蛋白质外壳包含至少一个拷贝的该遗传元件。

82.根据实施例80所述的组合物，其中该组合物中至少50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％的包含ORF1分子的蛋白质外壳包含至少一个拷贝的指环载体遗传元件。

83.根据实施例80-82中任一项所述的组合物，其中该组合物包含至少10²、10³、10⁴、10⁴、10⁵、10⁶或10⁷个相同指环载体。

84.根据实施例80-83中任一项所述的组合物，其中多个包括至少10³、10⁴、10⁵、10⁶、10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴或10¹⁵个指环载体(例如，该指环载体的拷贝)；或其中该组合物包含至少10⁵、10⁶、10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴或10¹⁵个指环载体/mL。

85.根据实施例80-84中任一项所述的组合物，其具有以下特征中的一个或多个(例如，1、2、3、4、5或6个)：

a)该组合物符合药品或良好生产规范(GMP)标准；

b)该组合物根据良好生产规范(GMP)制造；

c)该组合物具有低于预定参考值的病原体水平，例如，基本上不含病原体；

d)该组合物具有低于预定参考值的污染物水平，例如，基本上不含污染物(例如变性剂，例如尿素)；

e)该组合物具有预定水平的非感染性颗粒或预定比率的颗粒：感染性单位(例如，<300:1、<200:1、<100:1或<50:1)，或

f)该药物组合物具有低免疫原性或基本上是非免疫原性的，例如，如本文所述；

任选地，其中该组合物包含浓度小于0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、0.9M、1M、1.1M、1.2M、1.3M、1.5M、1.5M、1.6M、1.7M、1.8M、1.9M或2M的尿素。

86.根据实施例80-85中任一项所述的组合物，其中该药物组合物具有低于预定参考值的污染物水平，例如，基本上不含污染物。

87.根据实施例80-86中任一项所述的组合物，其中该组合物包含浓度小于0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、0.9M、1M、1.1M、1.2M、1.3M、1.5M、1.5M、1.6M、1.7M、1.8M、1.9M或2M的尿素。

88.根据实施例86或87所述的组合物，其中该污染物包含以下中的一种或多种：支原体、内毒素、宿主细胞核酸(例如，宿主细胞DNA和/或宿主细胞RNA)、动物源性的工艺杂质(例如，血清白蛋白或胰蛋白酶)、可复制型因子(RCA)，例如可复制型病毒或不必要的指环载体(例如，除了所期望的指环载体，例如本文所述合成指环载体之外的指环载体)、游离病毒衣壳蛋白、外源因子和/或聚集体。

89.根据实施例80-88中任一项所述的组合物，其中该组合物包含按重量计小于10％(例如小于约10％、5％、4％、3％、2％、1％、0.5％或0.1％)的污染物。

90.根据实施例80-89中任一项所述的组合物，其中至少90％的蛋白质外壳包含相同的遗传元件(例如，该指环载体的遗传元件)。

91.根据实施例80-90中任一项所述的组合物，其中至少90％的蛋白质外壳包含相同的ORF1分子。

92.一种药物组合物，其包含根据前述实施例中任一项所述的指环载体或组合物，以及药学上可接受的载剂或赋形剂。

93.一种制备指环载体的方法，该方法包括：

(a)提供混合物，其包含：

(i)包含RNA的遗传元件，和

(ii)ORF1分子；以及

(b)在适用于将该遗传元件包封在包含该ORF1分子的蛋白质外壳内的条件下孵育该混合物，从而制备指环载体；

任选地，其中该混合物不包含在细胞中。

94.根据实施例93所述的方法，其进一步包括在提供(a)之前，例如在宿主细胞(例如昆虫细胞或哺乳动物细胞)中表达该ORF1分子。

95.根据实施例94所述的方法，其中该表达包括在适用于产生该ORF1分子的条件下孵育包含编码该ORF1分子的核酸分子(例如杆状病毒表达载体)的宿主细胞(例如，昆虫细胞或哺乳动物细胞)。

96.根据实施例94或95所述的方法，其进一步包括在提供(a)之前，纯化由该宿主细胞表达的该ORF1分子。

97.一种纯化指环载体的方法，该方法包括：

(a)提供指环载体(例如，如本文所述)，其包含：

(i)遗传元件，例如，包含RNA的遗传元件，和

(ii)包含ORF1分子的蛋白质外壳，该蛋白质外壳包封该遗传元件；以及

(b)纯化该指环载体。

98.根据实施例96或97所述的方法，其中该纯化(例如，该ORF1分子的纯化或该指环载体的纯化)包括亲和纯化，例如肝素亲和纯化。

99.根据实施例96-98中任一项所述的方法，其中该纯化(例如，该ORF1分子的纯化或该指环载体的纯化)包括尺寸排阻色谱法(例如，使用Tris缓冲液流动相)。

100.根据实施例96-99中任一项所述的方法，其中该纯化(例如，该ORF1分子的纯化或该指环载体的纯化)包括亲和纯化(例如肝素亲和纯化)随后进行尺寸排阻色谱法。

101.根据实施例96-100中任一项所述的方法，其中该纯化(例如，该ORF1分子的纯化或该指环载体的纯化)包括阴离子交换色谱法(例如，Mustang Q膜色谱法)。

102.根据实施例96-101中任一项所述的方法，其中该纯化(例如，该ORF1分子的纯化或该指环载体的纯化)包括混合模式色谱法(例如，使用混合模式树脂，例如，Cato700树脂)。

103.根据实施例96-102中任一项所述的方法，其中该纯化(例如，该ORF1分子的纯化或该指环载体的纯化)产生包含一个或多个病毒样颗粒(VLP)的组合物，该病毒样颗粒包含至少约20、30、40、50或60个拷贝，或20-30、30-40、40-50或50-60个拷贝的该ORF1分子。

104.根据实施例103所述的方法，其中至少75％、80％、90％、95％、96％、97％、98％、99％或100％的该病毒样颗粒包含蛋白质外壳，这些蛋白质外壳为60聚体或直径为至少30、31、32、33、34或35nm的颗粒。

105.根据实施例103所述的方法，其中该组合物包含至少10⁵、10⁶、10⁷、10⁸、10⁹、10¹⁰个颗粒/mL，或包含10⁵-10⁶、10⁶-10⁷、10⁷-10⁹、10⁸-10⁹、10⁹-10¹⁰或10¹⁰-10¹¹个颗粒/mL(例如，如通过电子显微镜测量的)。

106.根据实施例93-105中任一项所述的方法，其进一步包括在提供(a)之前，在适用于分解包含该ORF1分子的蛋白质外壳(例如，病毒样颗粒(VLP))的条件下孵育该ORF1分子。

107.根据实施例106所述的方法，其中适用于分解包含该ORF1分子的该蛋白质外壳的条件包括在变性剂存在下孵育。

108.根据实施例106-107中任一项所述的方法，其中该变性剂包括离液剂(例如，尿素)或洗涤剂(例如，SDS(例如，0.1％SDS)、Tween或Triton)。

109.根据实施例106-108中任一项所述的方法，其中适用于分解包含该ORF1分子的该蛋白质外壳的条件包括预定的电导率、高盐溶液(例如，包含NaCl的溶液，例如，浓度为至少约1M，例如至少约0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、2、3、4或5M)、热度(例如，温度高于约85、86、87、88、89、90、91、92、93、94或95℃)或pH值(例如，酸性pH或碱性pH)。

110.根据实施例106-109中任一项所述的方法，其中适用于分解包含该ORF1分子的该蛋白质外壳的条件包括在包含浓度为至少0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、0.9M、1M、1.1M、1.2M、1.3M、1.5M、1.5M、1.6M、1.7M、1.8M、1.9M或2M的尿素的溶液中孵育。

111.根据实施例106-110中任一项所述的方法，其中(b)的孵育导致至少50％、60％、70％、75％、80％、85％、90％、96％或100％的包含该ORF1分子或其拷贝的颗粒群体被分解。

112.根据实施例106-111中任一项所述的方法，其中适用于分解该蛋白质外壳的条件足以分解包含至少约20、30、40、50或60个拷贝，或20-30、30-40、40-50或50-60个拷贝的ORF1分子的复合物(例如蛋白质外壳)。

113.根据实施例106-112中任一项所述的方法，其中适用于分解该蛋白质外壳的条件导致少于10⁸个剩余的完整颗粒/mL。

114.根据实施例106-113中任一项所述的方法，其进一步包括在提供(a)之前，将该ORF1分子从适用于分解该蛋白质外壳的条件中去除(例如，使ORF1分子经受非变性条件)。

115.根据实施例114所述的方法，其中将该ORF1分子从适用于分解该蛋白质外壳的条件中去除包括降低该变性剂的浓度，例如，将该变性剂(例如尿素)的浓度降低至低于0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、0.9M、1M、1.1M、1.2M、1.3M、1.5M、1.5M、1.6M、1.7M、1.8M、1.9M或2M。

116.根据实施例114或115所述的方法，其中该去除导致形成一个或多个指环载体，这些指环载体各自包封至少一个拷贝(例如，至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、150、200、250、300、400、500、600、700、800、900或1000个拷贝)的该遗传元件(例如，mRNA)。

117.根据实施例116所述的方法，其中在所得溶液中包封至少一个拷贝的该遗传元件的指环载体的数量为至少10⁵、10⁶、10⁷、10⁸、10⁹、10¹⁰或10¹¹个；或10⁵-10⁶、10⁶-10⁷、10⁷-10⁹、10⁸-10⁹、10⁹-10¹⁰或10¹⁰-10¹¹个(例如，如通过电子显微镜测量的)。

118.根据实施例116所述的方法，其中在所得溶液中包封至少一个拷贝的该遗传元件的指环载体的数量为至少10⁵、10⁶、10⁷、10⁸、10⁹、10¹⁰或10¹¹个指环载体/mL；或10⁵-10⁶、10⁶-10⁷、10⁷-10⁹、10⁸-10⁹、10⁹-10¹⁰或10¹⁰-10¹¹个指环载体/mL(例如，如通过电子显微镜测量的)。

119.根据实施例114-118中任一项所述的方法，其中该去除产生了包含至少10⁵、10⁶、10⁷、10⁸、10⁹、10¹⁰或10¹¹个指环载体/mL；或10⁵-10⁶、10⁶-10⁷、10⁷-10⁹、10⁸-10⁹、10⁹-10¹⁰或10¹⁰-10¹¹个指环载体/mL(例如，如通过电子显微镜测量的)的溶液，其中这些指环载体各自包封至少一个拷贝(例如，至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、40、50、60、70、80、90、100、150、200、250、300、400、500、600、700、800、900或1000个拷贝)的该遗传元件(例如，mRNA)。

120.根据实施例114-119中任一项所述的方法，其中至少75％、80％、90％、95％、96％、97％、98％、99％或100％的该指环载体包含蛋白质外壳，这些蛋白质外壳为60聚体或颗粒或为直径为至少30、31、32、33、34或35nm的颗粒。

121.根据实施例93-120中任一项所述的方法，其中该指环载体的遗传元件对核酸内切酶(例如，RNA酶)具有抗性。

122.根据实施例93-121中任一项所述的方法，其中(a)包括混合(i)和(ii)。

123.根据实施例93-122中任一项所述的方法，其在无细胞系统中进行。

124.一种制备指环载体组合物的方法，其包括：

(a)提供多个根据前述实施例中任一项所述的指环载体或组合物；

(b)任选地对多个根据前述实施例中任一项所述的指环载体或组合物评估以下一种或多种：本文所述的污染物、光密度测量(例如，OD 260)、颗粒数(例如，通过HPLC)、感染性(例如，颗粒：感染性单位比，例如，通过荧光和/或ELISA测定)；以及

(c)例如，如果(b)中的一个或多个参数满足指定阈值，则将多个指环载体配制为，例如，适用于施用给受试者的药物组合物。

125.一种治疗有需要的受试者的疾病或障碍的方法，该方法包括向该受试者施用根据前述实施例中任一项所述的指环载体或组合物，从而治疗该受试者的疾病或障碍(例如，如本文所述)。

126.一种调节，例如增强或抑制，受试者的生物学功能(例如，如本文所述)的方法，该方法包括向该受试者施用根据前述实施例中任一项所述的指环载体或组合物。

127.一种将遗传元件递送到细胞的方法，该方法包括使根据前述实施例中任一项所述的指环载体或组合物与细胞，例如真核细胞，例如哺乳动物细胞，例如人类细胞，接触。

128.根据前述实施例中任一项所述的指环载体或组合物用于治疗受试者的疾病或障碍(例如，如本文所述)的用途。

129.根据前述实施例中任一项所述的指环载体或组合物，用于在用于治疗受试者的疾病或障碍(例如，如本文所述)的方法中使用。

130.根据前述实施例中任一项所述的指环载体或组合物，用于在生产用于治疗受试者的疾病或障碍(例如，如本文所述)的药物中使用。

根据说明书和附图并且根据权利要求，本发明的其他特征、目的和优点将是显而易见的。

除非另外定义，否则本文所用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同含义。本文提及的所有出版物、专利申请、专利和其他参考文献均通过引用以其全文并入。另外，材料、方法和实例仅是说明性的，而并非意在进行限制。

附图说明

图1是一系列电子显微照片，显示来自指环病毒株的重组衣壳蛋白在体外形成病毒样颗粒(VLP)。如通过负染色电子显微镜观察到的，在不同细胞系中产生的衣壳蛋白在体外形成VLP。(A)从昆虫细胞中纯化的Ring 2ORF1 VLP，观察到的直径为大约35nm。(B)从昆虫细胞中纯化的Ring 10 ORF1 VLP，观察到的直径为大约35nm。(C)从哺乳动物细胞中纯化的CAV VP1 VLP，观察到的直径为大约20nm。

图2是显示在喙羽病病毒(BFDV)的结构中观察到的八条β-链胶冻卷结构域(或胶冻卷折叠)的图。按照惯例，β链被标记为B到I。这些链形成四个反平行β折叠，取向为B-I-D-G和C-H-E-F。B-I-D-G折叠形成病毒衣壳的内部。

图3是氨基酸序列比对，其描绘了与喙羽病病毒(BFDV)/戊型肝炎衣壳蛋白(HepE)的胶冻卷结构域相比，指环病毒ORF1蛋白的胶冻卷序列。

图4A-4E是一系列图，显示了生产包封编码eGFP的mRNA分子的基于指环病毒ORF1蛋白的病毒样颗粒(VLP)的示例性方法。(A)如本文所述，ORF1蛋白在细胞中产生并进行分离。(B)然后由ORF1蛋白形成的VLP在2M尿素溶液中分解。(C)当在不存在mRNA的情况下去除尿素时，少量VLP重新形成(通过电子显微镜检测到滴度小于10⁸个颗粒/mL)。(D，E)当在编码eGFP的mRNA存在下去除尿素时，通过电子显微镜(EM)检测到大量VLP(滴度为1x10⁹-1x10¹⁰个颗粒/mL)。

当结合附图阅读时，将会更好地理解以下对本发明实施例的详细描述。出于说明本发明的目的，在附图中示出了现在举例说明的实施例。然而，应该理解的是，本发明不限于附图中所示实施例的精确布置及手段。

具体实施方式

定义

本发明将针对特定实施例并参考某些附图进行描述，但本发明并不限于此，而是仅由权利要求书来限定。除非另有说明，否则通常应以其通常意义来理解下文中所阐述的术语。

在本说明书和权利要求书中使用术语“包含”时，它并不排除其他要素。出于本发明的目的，术语“由......组成”被认为是术语“包含......”的优选实施例。如果在下文中将组定义为包含至少一定数量的实施例，则这应理解为优选地还披露了仅由这些实施例组成的组。

当提及单数名词时，如果使用了不定冠词或定冠词，例如“一种/一个(a)”、“一种/一个(an)”或“该(the)”，这包括该名词的复数，除非另有明确说明。

词语“用于治疗、调节等的化合物、组合物、产物等”应理解为是指本身适合于所指定的治疗、调节等目的的化合物、组合物、产物等。词语“用于治疗、调节等的化合物、组合物、产物等”另外作为实施例披露了这样的化合物、组合物、产物等用于治疗、调节等。

词语“用于......的化合物、组合物、产物等”、“化合物、组合物、产物等在生产用于......的药物、药物组合物、兽用组合物、诊断组合物等中的用途”或“用作药物......的化合物、组合物、产物等”表示这些化合物、组合物、产物等将用于可在人体或动物体上实施的治疗方法中。它们被认为是关于治疗方法等的实施例和权利要求的等同披露。因此，如果实施例或权利要求是指“用于治疗疑似患有某种疾病的人或动物的化合物”，则这也被认为是披露了“化合物在生产用于治疗疑似患有某种疾病的人或动物的药物中的用途”或“通过向疑似患有某种疾病的人或动物施用化合物的治疗方法”。词语“用于治疗、调节等的化合物、组合物、产物等”应理解为是指本身适合于所指定的治疗、调节等目的的化合物、组合物、产物等。

如果在下文的括号中提供了术语、值、数量等的实例，则这应理解为表示在括号中提及的实例可以构成实施例。例如，如果指出“在实施例中，核酸分子包含与表1的指环病毒ORF1编码核苷酸序列(例如，表1的核酸序列中571-2613位核苷酸)具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列”，则一些实施例涉及包含与表1的核酸序列的571-2613位核苷酸具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列的核酸分子。

如本文所用的术语“扩增”，指的是核酸分子或其部分的复制，以产生一个或多个另外拷贝的该核酸分子或其部分(例如，遗传元件或遗传元件区域)。在一些实施例中，扩增导致核酸序列的部分复制。在一些实施例中，扩增经由滚环式复制进行。

如本文所用的，术语“指环载体”是指包含包封在蛋白质外壳中的遗传元件(例如RNA，例如环状RNA)的媒介物。在一些实施例中，遗传元件基本上被蛋白质外壳保护免于RNA酶酶切。如本文所用的“合成指环载体”通常指的是非天然存在的指环载体，例如，其具有与野生型病毒(例如，如本文所述的野生型指环病毒)不同的序列。在一些实施例中，合成指环载体是工程化的或重组的，例如，其包含遗传元件，该遗传元件包含相对于野生型病毒基因组(例如，如本文所述的野生型指环病毒基因组)的差异或修饰。在一些实施例中，包封在蛋白质外壳内涵盖100％的蛋白质外壳覆盖率，以及小于100％的覆盖，例如95％、90％、85％、80％、70％、60％、50％或更少。例如，蛋白质外壳可能存在缺口或间断(例如，这使得蛋白质外壳对水、离子、肽或小分子具有可渗透性)，只要遗传元件例如在进入宿主细胞之前，保留在蛋白质外壳中或免受RNA酶的酶切。在一些实施例中，将指环载体纯化，例如，将其从其原始来源中分离和/或基本上不含(>50％、>60％、>70％、>80％、>90％)其他组分。在一些实施例中，指环载体能够将遗传元件引入靶细胞中(例如，经由感染)。在一些实施例中，指环载体是含有某些指环病毒元件(例如，指环病毒ORF1分子)的感染性合成病毒颗粒。

如本文所用的，术语“抗体分子”是指包含至少一个免疫球蛋白可变结构域序列的蛋白质，例如免疫球蛋白链或其片段。术语“抗体分子”涵盖全长抗体和抗体片段(例如，scFv)。在一些实施例中，抗体分子是多特异性抗体分子，例如，该抗体分子包含多个免疫球蛋白可变结构域序列，其中该多个中第一免疫球蛋白可变结构域序列对第一表位具有结合特异性，而该多个中第二免疫球蛋白可变结构域序列对第二表位具有结合特异性。在一些实施例中，多特异性抗体分子是双特异性抗体分子。双特异性抗体分子的特征通常在于对第一表位具有结合特异性的第一免疫球蛋白可变结构域序列和对第二表位具有结合特异性的第二免疫球蛋白可变结构域序列。

如本文所用的，术语“骨架”或“骨架区域”是指核酸分子内(例如，在杆粒或供体载体内，例如，如本文所述)的区域，其包含参与(例如，必需和/或足够)宿主细胞中核酸分子复制和/或维持的一个或多个元件。在一些实施例中，骨架区域，例如“杆状病毒骨架区域”，包含一个或多个杆状病毒元件(例如杆状病毒基因组或其功能片段)，例如，适用于在昆虫细胞(例如Sf9细胞)中进行核酸构建体复制。在一些实施例中，骨架进一步包含选择性标志。在一些实施例中，核酸分子包含遗传元件区域和骨架区域(例如，杆状病毒骨架区域和/或适于在细菌细胞中复制的骨架区域)。

如本文所用的，术语“杆粒”是指包含足够的杆状病毒骨架元件以使其适于在昆虫细胞中复制而且还适于在细菌细胞中复制的核酸分子。在一些实施例中，核酸分子适于在细菌细胞(例如，大肠杆菌细胞，例如，DH 10Bac细胞)中复制。

如本文所用的，“环状”核酸是指形成没有游离5'端或3'端的结构的核酸。在一些实施例中，环状核酸通过共价键或非共价键闭合。例如，环状核酸可以例如用磷酸-糖键或合成接头部分通过共价连接线性核酸的末端而制备。在其他实施例中，环状核酸包括靠近且不游离的两个末端(核酸外切酶基本上不可接近)。例如，环状核酸可以通过直接或通过核酸夹板将线性核酸的末端杂交来制备。

如本文所用的，“DNA区域”是指包含多个DNA核苷酸的多核苷酸链的一部分。例如，在一些实施例中，DNA区域是并入到RNA链中的多个DNA核苷酸。例如，DNA区域在多核苷酸链内包含约5-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90或90-100个DNA核苷酸。

如本文所用的，“编码……”的核酸是指编码氨基酸序列或者多核苷酸例如mRNA或功能性多核苷酸(例如非编码RNA，例如siRNA或miRNA)的核酸序列。

如本文所用的“外源性”作用剂(例如，效应物、核酸(例如，RNA)、基因、有效载荷、蛋白质)是指不由相应的野生型病毒，例如，如本文所述的指环病毒包含或编码的作用剂。在一些实施例中，外源性作用剂不是天然存在的，例如具有相对于天然存在的蛋白质或核酸而言发生改变(例如，通过插入、缺失或置换)的序列的蛋白质或核酸。在一些实施例中，外源性因子不天然存在于宿主细胞中。在一些实施例中，外源性因子天然存在于宿主细胞中，但是对于病毒是外源的。在一些实施例中，外源性作用剂天然存在于宿主细胞中，但是不以期望的水平或在期望的时间存在。

如本文中针对另一种作用剂或元件(例如，效应物、核酸序列、氨基酸序列)所用的“异源”作用剂或元件(例如，效应物、核酸序列、氨基酸序列)，指的是并非天然存在于一起的作用剂或元件，例如，在野生型病毒，如指环病毒中。在一些实施例中，异源核酸序列可以与天然存在的核酸序列(例如，天然存在于指环病毒中的序列)存在于同一核酸中。在一些实施例中，相对于指环载体的其他(例如，其余的)元件所基于的指环病毒而言，异源作用剂或元件是外源性的。

如本文所用的，术语“遗传元件”指的是核酸分子，其包封在或可以包封在蛋白质外壳内(例如，蛋白质外壳保护其免受RNA酶的酶切)，例如，以形成如本文所述的指环载体。应当理解的是，遗传元件可以作为裸RNA产生，并且任选地进一步组装到蛋白质外壳中。还应理解的是，指环载体可将其遗传元件插入细胞中，其结果是遗传元件存在于细胞中，而蛋白质外壳不一定进入细胞。

如本文所用的，“遗传元件构建体”是指包含遗传元件序列或其片段的核酸构建体(例如，质粒、杆粒、供体载体、粘粒或微环)。在一些实施例中，如本文所述的杆粒或供体载体是包含遗传元件序列或其片段的遗传元件构建体。

如本文所用的术语“遗传元件区域”指的是包含遗传元件序列的构建体区域。在一些实施例中，遗传元件区域包含与野生型指环病毒序列或其片段具有足够同一性的序列，由蛋白质外壳包封，从而形成指环载体(例如，与野生型指环病毒序列或其片段具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列)。在实施例中，遗传元件区域包含蛋白结合序列，例如，如本文所述的(例如，如本文所述的5’UTR、3’UTR和/或GC富集区，或与其具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列)。在一些实施例中，包含遗传元件区域的构建体没有包封在蛋白质外壳中，但是由构建体产生的遗传元件可以包封在蛋白质外壳中。在一些实施例中，包含遗传元件区域的构建体进一步包括载体骨架(例如，杆粒骨架或供体载体骨架)。在一些实施例中，构建体(例如，杆粒)包含一个或多个杆状病毒元件(例如，杆状病毒基因组，其例如包含遗传元件区域)。

如本文所用的，当用于基因组(例如，指环病毒基因组)或其片段时，术语“突变体”指的是相对于相应的野生型指环病毒序列具有至少一处变化的序列。在一些实施例中，相对于相应的野生型指环病毒序列，突变体基因组或其片段包含至少一个单核苷酸多态性、添加、缺失或移码。在一些实施例中，相对于相应的野生型指环病毒序列，突变体基因组或其片段包含至少一种指环病毒ORF(例如，ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2中一种或多种)的缺失。在一些实施例中，相对于相应的野生型指环病毒序列，突变体基因组或其片段包含所有指环病毒ORF(例如，所有ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和ORF1/2)的缺失。在一些实施例中，相对于相应的野生型指环病毒序列，突变体基因组或其片段包含至少一种指环病毒非编码区(例如，5’UTR、3’UTR和/或GC富集区中一种或多种)的缺失。在一些实施例中，突变体基因组或其片段包含或者编码外源性效应物。

如本文所用的，术语“ORF分子”是指具有指环病毒ORF蛋白(例如，包含指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2蛋白的多肽)或其功能性片段的活性和/或结构特征的多肽。当一般使用(即，“ORF分子”)时，多肽可以包含本文所述的任何指环病毒ORF(例如，指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2中任一种)或其功能性片段的活性和/或结构特征。当与修饰词一起使用以说明特定的开放阅读框(例如，“ORF1分子”、“ORF2分子”、“ORF2/2分子”、“ORF2/3分子”、“ORF1/1分子”或“ORF1/2分子”)时，通常表示多肽包含相应的指环病毒ORF蛋白或其功能性片段(例如，如下文针对“ORF1分子”所定义)的活性和/或结构特征。例如，“ORF2分子”包含指环病毒ORF2蛋白或其功能性片段的活性和/或结构特征。

如本文所用，术语“ORF1分子”是指具有指环病毒ORF1蛋白(例如，如本文所述的指环病毒ORF1蛋白)或其功能性片段的活性和/或结构特征的多肽。在一些情况下，ORF1分子可以包含以下中的一个或多个(例如，1、2、3或4个)：包含至少60％碱性残基(例如，至少60％精氨酸残基)的第一区域、包含至少约六个β链(例如，至少4、5、6、7、8、9、10、11或12个β链)的第二区域、包含指环病毒N22结构域(例如，如本文所述的，例如来自如本文所述的指环病毒ORF1蛋白的N22结构域)的结构或活性的第三区域和/或包含指环病毒C-末端结构域(CTD)(例如，如本文所述的，例如来自如本文所述的指环病毒ORF1蛋白的CTD)的结构或活性的第四区域。在一些情况下，ORF1分子按照从N-末端到C-末端的顺序包含该第一、第二、第三和第四区域。在一些情况下，指环载体包含ORF1分子，该分子按照从N-末端到C-末端的顺序包含该第一、第二、第三和第四区域。在一些情况下，ORF1分子可以包含由指环病毒ORF1核酸编码的多肽。在一些情况下，ORF1分子可进一步包含异源序列，例如高变区(HVR)，例如来自指环病毒ORF1蛋白的HVR，例如，如本文所述的。如本文所用的“指环病毒ORF1蛋白”指的是由指环病毒基因组(例如，野生型指环病毒基因组，例如，如本文所述)编码的ORF1蛋白。

如本文所用的，术语“ORF2分子”是指具有指环病毒ORF2蛋白(例如，如本文所述的指环病毒ORF2蛋白)或其功能性片段的活性和/或结构特征的多肽。如本文所用的“指环病毒ORF2蛋白”指的是由指环病毒基因组(例如，野生型指环病毒基因组，例如，如本文所述)编码的ORF2蛋白。

如本文所用的，术语“蛋白质外壳”是指主要(例如，>50％、>60％、>70％、>80％、>90％)是蛋白质的外壳组分。

如本文所用的，术语“调节性核酸”是指修饰编码表达产物的DNA序列的表达，例如转录和/或翻译的核酸序列。在一些实施例中，表达产物包括RNA或蛋白质。

如本文所用的，术语“调节性序列”是指修饰靶基因产物的转录的核酸序列。在一些实施例中，调节性序列是启动子或增强子。

如本文所用的，“基本上非致病性”生物体、颗粒或组分是指不会导致或诱发不可接受的疾病或致病性状况的生物体、颗粒(例如，病毒或指环载体，例如，如本文所述)或其组分，例如，在宿主生物体，例如哺乳动物，如人类中。在一些实施例中，向受试者施用指环载体可导致轻微的反应或副作用，作为标准治疗的一部分，这些反应或副反应是可以接受的。

如本文所用的，术语“非致病性”是指不会导致或诱发不良状况(例如，疾病或致病性状况)的生物体或其组分，例如，在宿主生物体，例如，哺乳动物，如人类中。

如本文所用的，“基本上非整合的”遗传元件是指遗传元件，例如，病毒或指环载体中的遗传元件，例如，如本文所述的，其中进入宿主细胞(例如，真核细胞)或生物体(例如，哺乳动物，如人类)的遗传元件中低于约0.01％、0.05％、0.1％、0.5％或1％整合到基因组中。在一些实施例中，遗传元件没有可检测地整合到例如宿主细胞的基因组中。在一些实施例中，可以使用本文所述的技术，例如核酸测序、PCR检测和/或核酸杂交，检测遗传元件整合到基因组中。在一些实施例中，整合频率是通过对从游离载体中分离出来的基因组DNA进行定量凝胶纯化测定来确定的，例如，如Wang等人中所述(2004,Gene Therapy[基因治疗],11:711-721,其通过引用以其全文并入本文)。

如本文所用的，“基本上非免疫原性”生物体、颗粒或组分是指不会导致或诱发不期望的或非靶向的免疫应答的生物体、颗粒(例如，病毒或指环载体，例如，如本文所述)或其组分，例如，在宿主组织或生物体(例如，哺乳动物，如人类)中。在一些实施例中，基本上非免疫原性生物体、颗粒或组分不会产生具有临床意义的免疫应答。在一些实施例中，基本上非免疫原性指环载体不会产生针对包含氨基酸序列或者由指环病毒或指环载体遗传元件的核酸序列编码的蛋白质的具有临床意义的免疫应答。在一些实施例中，通过测定受试者中抗体(例如，中和抗体)的存在或水平(例如，抗指环载体抗体的存在或水平，例如针对文中所述的指环载体的抗体的存在或水平)来检测免疫应答(例如，不期望的或未靶向的免疫应答)，例如，根据Tsuda等人(1999；J.Virol.Methods[病毒学方法杂志]77:199-206；通过引用并入文中)中所述的抗TTV抗体检测方法和/或Kakkola等人(2008；Virology[病毒学]382:182-189；通过引用并入文中)中所述的测定抗TTV IgG水平的方法。还可以通过本领域用于检测抗病毒抗体的方法来检测针对指环病毒或基于指环病毒的指环载体的抗体(例如，中和性抗体)，这些方法是例如检测抗AAV抗体的方法，例如，如Calcedo等人(2013；Front.Immunol.[免疫学前沿]4(341):1-7；其通过引用并入本文)中所述。

如本文所用的“子序列”是指分别包含在较大核酸序列或氨基酸序列中的核酸序列或氨基酸序列。在一些情况下，子序列可以包含较大序列的结构域或功能性片段。在一些情况下，子序列可以包含较大序列的片段，当从较大序列中分离出来时，该片段能够形成二级和/或三级结构，类似于当与较大序列的其余部分一起存在时由该子序列形成的二级和/或三级结构。在一些情况下，子序列可以替换为另一序列(例如，包含外源性序列或对较大序列的其余部分而言异源的序列的子序列，例如，来自不同指环病毒的相应子序列)。

本发明总体上涉及指环载体，例如，合成指环载体，及其用途。本披露提供指环载体、包含指环载体的组合物，以及制备或使用指环载体的方法。指环载体通常用作递送媒介物，例如用于将治疗剂递送至真核细胞。通常，本文所述的指环载体将包括遗传元件，该遗传元件包含包封在蛋白质外壳内的RNA序列(例如，编码效应物，例如外源性效应物或内源性效应物的RNA序列)。相对于指环病毒序列(例如，如本文所述)，指环载体可包括序列(例如，如本文所述的区域或结构域)的一个或多个缺失。指环载体可以用作基本上非免疫原性媒介物，用于将遗传元件或其中编码的效应物(例如，多肽或核酸效应物，例如，如本文所述)递送到真核细胞中，例如，用以治疗包含这些细胞的受试者中的疾病或障碍。

I.用于通过体外组装制备指环载体的组合物和方法

A.指环载体的组分和组装

i.用于组装指环载体的ORF1分子

ii.用于组装指环载体的ORF2分子

B.遗传元件

i.包含RNA的遗传元件

a.仅RNA遗传元件

b.杂交RNA-ssDNA遗传元件

c RNA/DNA缀合物

C.遗传元件构建体

D.基于RNA的遗传元件的产生

E.蛋白质成分的产生

i.杆状病毒表达系统

ii.昆虫细胞系统

iii.哺乳动物细胞系统

F.效应物

G.体外组装方法

H.富集和纯化

II.指环载体

A.指环病毒

B.ORF1分子

C.ORF2分子

D.遗传元件

E.蛋白结合序列

F.5’UTR区

G.GC富集区

H.效应物

I.调节性序列

J.其他序列

K.蛋白质外壳

III.使用方法

IV.施用/递送

I.用于通过体外组装制备指环载体的组合物和方法

在一些方面，本披露提供了可用于产生指环载体(例如，具有包含RNA的遗传元件的指环载体，如本文所述)的组合物和方法。在一些实施例中，本文所述的组合物和方法可以用于产生遗传元件或遗传元件构建体。在一些实施例中，本文所述的组合物和方法可以用于通过体外组装产生遗传元件或遗传元件构建体。在一些实施例中，本文所述的组合物和方法可以用于产生一个或多个指环病毒ORF分子(例如，ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2分子或其功能性片段或剪接变体)。在一些实施例中，本文所述的组合物和方法可以用于在例如宿主细胞(例如，昆虫细胞，例如，Sf9细胞)中产生蛋白质外壳或其组分(例如，ORF1分子)。

指环载体的组分和组装

本文的组合物和方法可用于产生指环载体。如本文所述的，指环载体通常包含包封在蛋白质外壳(例如，包含由指环病毒ORF1核酸编码的多肽，例如，如本文所述)内的遗传元件(例如，RNA分子)。在一些实施例中，遗传元件包含一个或多个编码指环病毒ORF(例如，指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2中的一种或多种)的序列。如本文所用的，指环病毒ORF或ORF分子(例如，指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2)包括包含与相应指环病毒ORF序列(例如，如PCT/US2018/037379或PCT/US19/65995(其各自通过引用以其全文并入本文)中所述的)具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列的多肽。在实施例中，遗传元件包含编码指环病毒ORF1或者其剪接变体或功能性片段(例如，胶冻卷区域，例如，如本文所述)的序列。在一些实施例中，蛋白质外壳包含由指环病毒ORF1核酸编码的多肽(例如，指环病毒ORF1分子或者其剪接变体或功能性片段)。

在一些实施例中，通过将遗传元件(例如，如本文所述)包封在蛋白质外壳(例如，如本文所述)内来组装指环载体。在一些实施例中，将遗传元件包封在宿主细胞(例如，昆虫细胞，例如，Sf9细胞)的蛋白质外壳内。在一些实施例中，宿主细胞表达蛋白质外壳中包含的一种或多种多肽(例如，由指环病毒ORF1核酸编码的多肽，如ORF1分子)。例如，在一些实施例中，宿主细胞包含编码指环病毒ORF1分子，例如，指环病毒ORF1多肽(例如，野生型指环病毒ORF1蛋白或由野生型指环病毒ORF1核酸编码的多肽，例如，如本文所述)的剪接变体或功能性片段的核酸序列。在实施例中，编码指环病毒ORF1分子的核酸序列包含在宿主细胞中包含的核酸构建体(例如，质粒、病毒载体、病毒、微环、杆粒或人工染色体)中。在实施例中，编码指环病毒ORF1分子的核酸序列整合到宿主细胞的基因组中。

在一些实施例中，宿主细胞包含遗传元件和/或包含遗传元件序列的核酸构建体。在一些实施例中，核酸构建体选自质粒、病毒核酸、微环、杆粒或人工染色体。在一些实施例中，将遗传元件从核酸构建体(例如，杆粒)上切离，并且任选地，从双链形式转化为单链形式(例如，通过变性)。在一些实施例中，遗传元件是通过聚合酶根据核酸构建体(例如，杆粒)中的模板序列生成的。在一些实施例中，聚合酶产生遗传元件序列的单链拷贝，其可以任选地进行环化以形成如本文所述的遗传元件。

在一些实施例中，宿主细胞包含遗传元件构建体(例如，杆粒、质粒或微环)和包含一个或多个编码指环病毒ORF分子(例如，ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1和/或ORF1/2ORF分子)或其功能性片段的序列的杆粒。在一些实施例中，蛋白质外壳蛋白质从杆粒表达。在实施例中，从杆粒表达的蛋白质外壳蛋白质包封遗传元件，从而形成指环载体。在一些实施例中，杆粒包含适于核酸构建体在昆虫细胞(例如，Sf9细胞)中复制的骨架，例如，杆状病毒骨架区域。在一些实施例中，杆粒包含适于遗传元件构建体在细菌细胞(例如，大肠杆菌细胞，例如，DH 10Bac细胞)中复制的骨架区域。在一些实施例中，遗传元件构建体包含适于核酸构建体在昆虫细胞(例如，Sf9细胞)中复制的骨架，例如，杆状病毒骨架区域。在一些实施例中，遗传元件构建体包含适于遗传元件构建体在细菌细胞(例如，大肠杆菌细胞，例如，DH 10Bac细胞)中复制的骨架区域。在一些实施例中，将杆粒经由杆状病毒颗粒引入宿主细胞中。在实施例中，通过生产细胞例如昆虫细胞(例如，Sf9细胞)或细菌细胞(例如，大肠杆菌细胞，例如，DH 10Bac细胞)来产生杆粒。在实施例中，生产细胞包含杆粒和/或供体载体，例如，如本文所述。在实施例中，生产细胞进一步包含足以用于杆粒和/或供体载体的复制的细胞机构。

ORF1分子，例如用于组装指环载体的ORF1分子

例如，可以通过将遗传元件包封在蛋白质外壳内来制备指环载体。在一些实施例中，包封在无细胞系统或细胞中发生。指环载体的蛋白质外壳通常包含由指环病毒ORF1核酸编码的多肽(例如，指环病毒ORF1分子或者其剪接变体或功能性片段，例如，如本文所述)。在一些实施例中，ORF1分子包含以下一个或多个：包含精氨酸富集区的第一区域，例如具有至少60％的碱性残基(例如，至少60％、65％、70％、75％、80％、85％、90％、95％或100％碱性残基；例如，60％-90％、60％-80％、70％-90％或70-80％的碱性残基)的区域，以及包含胶冻卷结构域的第二区域，例如至少六个β链(例如，4、5、6、7、8、9、10、11或12个β链)。在实施例中，蛋白质外壳包含指环病毒ORF1精氨酸富集区、胶冻卷区域、N22结构域、高变区和/或C-末端结构域中的一种或多种(例如，1、2、3、4种或全部5种)。在一些实施例中，蛋白质外壳包含指环病毒ORF1胶冻卷区域(例如，如本文所述)。在一些实施例中，蛋白质外壳包含指环病毒ORF1精氨酸富集区(例如，如本文所述)。在一些实施例中，蛋白质外壳包含指环病毒ORF1 N22结构域(例如，如本文所述)。在一些实施例中，蛋白质外壳包含指环病毒高变区(例如，如本文所述)。在一些实施例中，蛋白质外壳包含指环病毒ORF1 C-末端结构域(例如，如本文所述)。

在一些实施例中，指环载体包含ORF1分子和/或编码ORF1分子的核酸。一般而言，ORF1分子包括具有指环病毒ORF1蛋白(例如，如本文所述的指环病毒ORF1蛋白)的结构特征和/或活性的多肽或其功能性片段。在一些实施例中，ORF1分子包含相对于指环病毒ORF1蛋白(例如，如本文所述的指环病毒ORF1蛋白)的截短。在一些实施例中，ORF1分子是截短了至少10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650或700个氨基酸的指环病毒ORF1蛋白。在一些实施例中，ORF1分子包含与甲型细环病毒、乙型细环病毒或丙型细环病毒ORF1蛋白(例如，如本文所述)具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。ORF1分子通常可以结合核酸分子，例如DNA(例如，遗传元件，例如，如本文所述)。在一些实施例中，ORF1分子定位于细胞核。在某些实施例中，ORF1分子定位于细胞的核仁。

不希望受到理论的束缚，ORF1分子可能能够与其他ORF1分子结合，例如，以形成蛋白质外壳(例如，如本文所述)。可以将这样的ORF1分子描述为具有形成衣壳的能力。在一些实施例中，蛋白质外壳可以包封核酸分子(例如，如本文所述的遗传元件)。在一些实施例中，多个ORF1分子可形成多聚体，例如，以产生蛋白质外壳。在一些实施例中，多聚体可以是同型多聚体。在其他实施例中，多聚体可以是异型多聚体。

ORF2分子，例如用于组装指环载体的ORF2分子

使用本文所述的组合物或方法产生指环载体可能涉及表达指环病毒ORF2分子(例如，如本文所述)或者其剪接变体或功能性片段。在一些实施例中，指环载体包含ORF2分子或者其剪接变体或功能性片段，和/或编码ORF2分子或者其剪接变体或功能性片段的核酸。在一些实施例中，指环载体不包含ORF2分子或者其剪接变体或功能性片段，和/或编码ORF2分子或者其剪接变体或功能性片段的核酸。在一些实施例中，产生指环载体包括ORF2分子或者其剪接变体或功能性片段的表达，但是该ORF2分子未并入指环载体中。

遗传元件

包含RNA的遗传元件

在一些实施例中，遗传元件是核酸或包含核酸。在一些实施例中，遗传元件是单链多核苷酸。在一些实施例中，遗传元件包含一个或多个双链区域。在一些实施例中，遗传元件包含RNA。在一些实施例中，遗传元件包含RNA发夹结构。在一些实施例中，遗传元件是mRNA，例如，化学修饰的mRNA。在一些实施例中，遗传元件由至少10％、20％、25％、30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％RNA组成。在一些实施例中，遗传元件包含DNA链和RNA链，例如，其中至少一部分DNA链与至少一部分RNA链杂交。

在一些实施例中，遗传元件不编码指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3或ORF2t/3中的任一个。

在一些实施例中，RNA遗传元件编码效应物，例如效应蛋白。

在一些实施例中，RNA遗传元件是效应物或包含效应物，例如功能性RNA。在一些实施例中，RNA选自由以下组成的组：mRNA、rRNA、tRNA(例如TREM)、调节RNA、非编码RNA、长非编码RNA(lncRNA)、环状RNA(circRNA)、双链RNA(dsRNA)、引导RNA(gRNA)、小干扰RNA(siRNA)、短发夹RNA(shRNA)、piwi相互作用RNA(piRNA)、小核仁RNA(snoRNA)、小核RNA(snRNA)、细胞外RNA(exRNA)、小卡哈尔体特异性RNA(scaRNA)、微小RNA(miRNA)和其他RNAi分子。

在一些实施例中，遗传元件包含RNA，例如化学修饰的RNA。在一些实施例中，遗传元件的RNA的一个或多个核苷酸被化学修饰。在一些实施例中，RNA包含对一个或多个碱基的一种或多种化学修饰。在一些实施例中，RNA包含对一个或多个糖的一种或多种化学修饰。在一些实施例中，遗传元件的RNA的至少1、2、3、4、5、6、7、8、9或10个核苷酸被化学修饰。在一些实施例中，RNA包含一个或多个骨架修饰。在一些实施例中，修饰包含非天然存在的修饰，例如表5-9中任一个中所述的修饰。可以根据本领域已知的方法进行非天然存在的修饰。

在一些实施例中，本文所述的遗传元件包含表5中提供的非天然存在的修饰，或其组合。

表5：示例性的非天然存在的修饰

在一些实施例中，本文所述的遗传元件包含表6中提供的修饰或其组合。表6中提供的修饰天然存在于RNA中，并且可以在本文中在不是天然存在的位置用于遗传元件中。

表6：另外的示例性修饰

在实施例中，本文所述的遗传元件包含表7中提供的非天然存在的修饰，或其组合。

表7：另外的示例性非天然存在的修饰

在实施例中，本文所述的遗传元件包含表8中提供的非天然存在的修饰，或其组合。

表8：示例性主链修饰

在实施例中，本文所述的遗传元件包含表9中提供的非天然存在的修饰，或其组合。

表9：示例性的非天然存在的主链修饰

合成的主链修饰的名称
	硫代磷酸酯
限制性核酸(CNA)
	2'O'甲基化
2'-O-甲氧基乙基核糖(MOE)
	2'氟
锁核酸(LNA)
	(S)-限制性乙基(cEt)
氟己糖醇核酸(FHNA)
	5'硫代磷酸酯
二氨基磷酸酯吗啉代低聚物(PMO)
	三环DNA(tcDNA)
(S)5'-C-甲基
	(E)-乙烯基膦酸酯
膦酸甲酯
	(S)5'-C-甲基与磷酸酯

在一些实施例中，遗传元件包含帽。帽典型地位于mRNA的5'端，但帽也可以位于RNA的3'端。在一些实施例中，帽保护遗传元件免受核酸外切酶降解，并且可以帮助细胞内递送和/或定位。帽可以存在于5'-末端(5'帽)或3'-末端(3'帽)或可以存在于两端。5'帽的非限制性实例包括但不限于甘油基、反向脱氧脱碱基残基(部分)；4’,5’-亚甲基核苷酸、1-(β-D-赤呋喃糖基)核苷酸、4′-硫代核苷酸；碳环核苷酸；1,5-脱水己糖醇核苷酸；L-核苷酸；α-核苷酸；经修饰的碱基核苷酸；二硫代磷酸酯连接；苏-戊呋喃糖基核苷酸；无环3’,4’-开环核苷酸；无环3,4-二羟丁基核苷酸；无环3,5-二羟戊基核苷酸、3’-3’-反向核苷酸部分；3’-3’-反向脱碱基部分；3’-2’-反向核苷酸部分；3’-2’-反向脱碱基部分；1,4-丁二醇磷酸酯；3’-氨基磷酸酯；己基磷酸酯；氨基己基磷酸酯；3’-磷酸酯；3’-硫代磷酸酯；二硫代磷酸酯；或桥接或非桥接甲基膦酸酯部分。

3'帽的非限制性实例包括但不限于甘油基、反向脱氧脱碱基残基(部分)；4’,5’-亚甲基核苷酸、1-(β-D-赤呋喃糖基)核苷酸；4’-硫代核苷酸、碳环核苷酸；5’-氨基烷基磷酸酯；1,3-二氨基-2-丙基磷酸酯；3-氨基丙基磷酸酯；6-氨基己基磷酸酯；1,2-氨基十二烷基磷酸酯；羟基丙基磷酸酯；1,5-脱水己糖醇核苷酸；L-核苷酸；α-核苷酸；经修饰的碱基核苷酸；二硫代磷酸酯；苏-戊呋喃糖基核苷酸；无环3′,4′-开环核苷酸；3,4-二羟基丁基核苷酸；3,5-二羟基戊基核苷酸，5′-5′-反向核苷酸部分；5′-5′-反向脱碱基部分；5′-氨基磷酸酯；5′-硫代磷酸酯；1,4-丁二醇磷酸酯；5’-氨基；桥联和/或非桥联5′-氨基磷酸酯、硫代磷酸酯和/或二硫代磷酸酯、桥接或非桥接甲基膦酸酯和5’-巯基部分(更多细节参见Beaucage和Iyer,1993,Tetrahedron[四面体]49,1925；其通过引用并入本文)。

在一些实施例中，遗传元件包括多聚A尾。在一些实施例中，多聚A尾的长度包含至少约5、10、15、20、25、30、40、50、60、70、80、90或100个腺苷。在一些实施例中，RNA缺少多聚A尾。在一些实施例中，其中RNA缺少多聚A尾，RNA包含不超过约5、10、15、20、25、30、40、50、60、70、80、90或100个连续的腺苷。

在一些实施例中，遗传元件是线性的。在一些实施例中，遗传元件是环状的。在一些实施例中，遗传元件包含第一区域和可与该第一区域杂交的第二区域。在一些实施例中，遗传元件包含第一区域和可与第一区域杂交以形成环的第二区域。在一些实施例中，遗传元件不包含5'端或3'端。在一些实施例中，遗传元件不包含游离磷酸和游离糖中的一种或两种。在一些实施例中，遗传元件中的每个磷酸通过磷酸所包含的第一氧原子与第一糖共价连接，并且通过磷酸所包含的第二氧原子与第二糖共价连接。在一些实施例中，遗传元件中的每个糖通过糖所包含的第一碳原子与第一磷酸共价连接，并且通过糖所包含的第二碳原子与第二磷酸共价连接。在一些实施例中，遗传元件通过使线性RNA环化而产生。环状RNA在例如美国专利公开20200306286中描述，其通过引用以其全文并入本文。

在一些实施例中，遗传元件的长度为约10-20、20-30、30-40、50-60、60-70、70-80、80-90、90-100、100-125、125-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-3500、3500-4000或4000-4500个核苷酸。在一些实施例中，遗传元件的长度为至少约10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000或4500个核苷酸。

仅RNA遗传元件

在一些实施例中，遗传元件由RNA组成或基本上由RNA组成。例如，在一些实施例中，遗传元件基本上不含DNA。在一些实施例中，遗传元件包含单链RNA。在一些实施例中，遗传元件包含至少一个双链区域。在一些实施例中，遗传元件的双链区域包含与RNA配对的RNA区域。

杂交的RNA-ssDNA遗传元件

在一些实施例中，遗传元件包含DNA区域。在一些实施例中，包含RNA的遗传元件进一步包含DNA区域。例如，遗传元件可以是单链的，其中单链的第一部分包含核糖核苷酸，单链的第二部分包含脱氧核糖核苷酸。在一些实施例中，包含DNA区域的遗传元件包含一个或多个具有化学修饰的DNA核苷酸。在一些实施例中，遗传元件包含DNA区域，其中DNA区域的所有核苷酸都被化学修饰。

在一些实施例中，遗传元件的至少一部分是单链的。在一些实施例中，遗传元件是单链的。在一些实施例中，遗传元件包含ssDNA。在一些实施例中，遗传元件包含双链区域。在一些实施例中，遗传元件的双链区域包含与RNA配对的RNA区域。在一些这样的实施例中，遗传元件的双链区域包含与RNA配对的DNA区域。在一些实施例中，DNA区域的至少一部分与遗传元件的RNA的至少一部分杂交。

在一些实施例中，DNA区域的长度为约10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-150、150-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900或900-1000个核苷酸。

RNA/DNA缀合物

在一些实施例中，遗传元件包含DNA区域。在一些实施例中，包含RNA的遗传元件进一步包含DNA区域。在一些实施例中，包含DNA区域的遗传元件包含一个或多个具有化学修饰的DNA核苷酸。在一些实施例中，遗传元件包含DNA区域，其中DNA区域的所有核苷酸都被化学修饰。

在一些实施例中，遗传元件的至少一部分是单链的。在一些实施例中，遗传元件是单链的。在一些实施例中，遗传元件包含ssDNA。在一些实施例中，遗传元件包含双链区域。在一些实施例中，遗传元件的双链区域包含与RNA配对的RNA区域。在一些这样的实施例中，遗传元件的双链区域包含与RNA配对的DNA区域。在一些实施例中，其中遗传元件包含RNA，DNA区域与遗传元件的RNA共价连接。

遗传元件构建体

在一些实施例中，遗传元件由遗传元件构建体产生。例如，在一些实施例中，遗传元件构建体是DNA，例如，双链DNA，并且遗传元件可以通过转录产生，从而产生RNA遗传元件。

如本文所述的指环载体的遗传元件可以从遗传元件构建体产生，该构建体包含遗传元件区域和任选的其他序列，例如杆粒(例如，包含杆状病毒基因组或其片段，例如，一个或多个杆状病毒元件)或供体载体骨架。在一些实施例中，遗传元件构建体包含指环病毒5’UTR(例如，如本文所述)。遗传元件构建体可以是适于将遗传元件序列递送到宿主细胞或无细胞系统中的任何核酸构建体，其中该遗传元件可以包封在蛋白质外壳内。在一些实施例中，遗传元件构建体包含启动子。在一些实施例中，从遗传元件构建体转录产生RNA遗传元件。

在一些实施例中，遗传元件构建体是线性核酸分子。在一些实施例中，遗传元件构建体是环状核酸分子(例如，质粒、杆粒、供体载体或微环，例如，如本文所述)。在一些实施例中，遗传元件构建体可以是双链的。在其他实施例中，遗传元件是单链的。在一些实施例中，遗传元件构建体包含DNA。在一些实施例中，遗传元件构建体包含RNA。在一些实施例中，遗传元件构建体包含一个或多个经修饰的核苷酸。

质粒

在一些实施例中，遗传元件构建体是质粒。质粒通常包含如本文所述的遗传元件序列以及适于在宿主细胞中复制的复制起点(例如，用于在细菌细胞中复制的细菌复制起点)和选择性标志(例如，抗生素抗性基因)。在一些实施例中，可以将遗传元件序列从质粒上切离。在一些实施例中，质粒能够在细菌细胞中复制。在一些实施例中，质粒能够在哺乳动物细胞(例如，人类细胞)中复制。在一些实施例中，质粒的长度为至少300、400、500、600、700、800、900、1000、2000、3000、4000或5000bp。在一些实施例中，质粒的长度小于600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10,000bp。在一些实施例中，质粒的长度为300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-1500、1500-2000、2000-2500、2500-3000、3000-4000或4000-5000bp。

小型环状核酸构建体

在一些实施例中，遗传元件构建体是环状核酸构建体，例如，缺少载体骨架(例如，缺少细菌复制起点和/或选择性标志)。在实施例中，遗传元件是单或双链环状核酸构建体。在实施例中，通过体外环化(IVC)，例如，如本文所述的体外环化来产生环状核酸构建体。在实施例中，可以将双链环状核酸构建体引入宿主细胞中，在宿主细胞中它可以转化为单链环状遗传元件或用作生成单链环状遗传元件的模板，例如，如本文所述的。在一些实施例中，环状核酸构建体不包含质粒骨架或其功能性片段。在一些实施例中，环状核酸构建体的长度为至少2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400或4500bp。在一些实施例中，环状核酸构建体的长度小于2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5500或6000bp。在一些实施例中，环状核酸构建体的长度为2000-2100、2100-2200、2200-2300、2300-2400、2400-2500、2500-2600、2600-2700、2700-2800、2800-2900、2900-3000、3000-3100、3100-3200、3200-3300、3300-3400、3400-3500、3500-3600、3600-3700、3700-3800、3800-3900、3900-4000、4000-4100、4100-4200、4200-4300、4300-4400或4400-4500bp。在一些实施例中，环状核酸构建体是微环。

顺式/反式构建体

在一些实施例中，如本文所述的遗传元件构建体(例如，杆粒或供体载体)包含一个或多个编码一种或多种指环病毒ORF，例如，蛋白质外壳组分(例如，由指环病毒ORF1核酸编码的多肽，例如，如本文所述)的序列。例如，遗传元件构建体可以包含编码指环病毒ORF1分子的核酸序列。这样的遗传元件构建体可适于将遗传元件和一种或多种指环病毒ORF以顺式引入宿主细胞中。在其他实施例中，如本文所述的遗传元件构建体不包含编码一种或多种指环病毒ORF，例如，蛋白质外壳组分(例如，由指环病毒ORF1核酸编码的多肽，例如，如本文所述)的序列。例如，遗传元件构建体可以不包含编码指环病毒ORF1分子的核酸序列。这样的遗传元件构建体可适用于将遗传元件引入宿主细胞中，其中一种或多种指环病毒ORF以反式提供(例如，经由引入编码一种或多种指环病毒ORF的第二核酸构建体，或者经由整合到宿主细胞基因组中的指环病毒ORF盒)。在一些实施例中，遗传元件构建体包含适于核酸构建体在昆虫细胞(例如，Sf9细胞)中复制的骨架，例如，杆状病毒骨架区域。在一些实施例中，遗传元件构建体包含适于遗传元件构建体在细菌细胞(例如，大肠杆菌细胞，例如，DH 10Bac细胞)中复制的骨架区域。

在一些实施例中，遗传元件构建体(例如，杆粒或供体载体)包含编码指环病毒ORF1分子或者其剪接变体或功能性片段(例如，胶冻卷区域，例如，如本文所述)的序列。在实施例中，不包含遗传元件序列的遗传元件部分包含编码指环病毒ORF1分子或者其剪接变体或功能性片段的序列(例如，在包含启动子和编码指环病毒ORF1分子或者其剪接变体或功能性片段的序列的盒中)。在另外的实施例中，包含遗传元件序列的构建体部分包含编码指环病毒ORF1分子或者其剪接变体或功能性片段(例如，胶冻卷区域，例如，如本文所述)的序列。在实施例中，将这样的遗传元件包封在蛋白质外壳中(例如，如本文所述)产生了可复制型组分指环载体(例如，指环载体在感染细胞后，使细胞能够产生另外拷贝的指环载体，而无需将另外的核酸构建体，例如，编码一种或多种如本文所述的指环病毒ORF的核酸构建体引入细胞中)。

在其他实施例中，遗传元件不包含编码指环病毒ORF1分子或者其剪接变体或功能性片段(例如，胶冻卷区域，例如，如本文所述)的序列。在实施例中，将这样的遗传元件包封在蛋白质外壳中(例如，如本文所述)产生了非复制型指环载体(例如，指环载体在感染细胞后，不能使受感染细胞产生另外的指环载体，例如，在缺乏一种或多种另外构建体(例如，编码一种或多种如本文所述的指环病毒ORF)的情况下)。

表达盒

在一些实施例中，遗传元件构建体(例如，杆粒或供体载体)包含一个或多个用于表达多肽或非编码RNA(例如，miRNA或siRNA)的盒。在一些实施例中，遗传元件构建体包含用于表达效应物(例如，外源性或内源性效应物)，例如，如本文所述的多肽或非编码RNA的盒。在一些实施例中，遗传元件构建体包含用于表达指环病毒蛋白(例如，指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2，或者其功能性片段)的盒。在一些实施例中，表达盒可以位于遗传元件序列内。在实施例中，效应物的表达盒位于遗传元件序列内。在实施例中，指环病毒蛋白的表达盒位于遗传元件序列内。在其他实施例中，表达盒位于遗传元件序列之外的遗传元件构建体内的某个位置(例如，在骨架中)。在实施例中，指环病毒蛋白的表达盒位于遗传元件序列之外的遗传元件构建体内的某个位置(例如，在骨架中)。

多肽表达盒通常包含启动子和编码多肽的编码序列(例如，编码指环病毒ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2或者其功能性片段的序列)，该多肽例如是效应物(例如，如本文所述的外源性或内源性效应物)或指环病毒蛋白。可以包含在多肽表达盒中的示例性启动子(例如，以驱动多肽的表达)包括但不限于组成型启动子(例如，CMV、RSV、PGK、EF1a或SV40启动子)、细胞或组织特异性启动子(例如，骨骼肌α-肌动蛋白启动子、肌球蛋白轻链2A启动子、抗肌萎缩蛋白启动子、肌肉型肌酸激酶启动子、肝白蛋白启动子、乙型肝炎病毒核心启动子、骨钙素启动子、骨唾液酸蛋白启动子、CD2启动子、免疫球蛋白重链启动子、T细胞受体α链启动子、神经元特异性烯醇化酶(NSE)启动子或神经丝蛋白轻链启动子)以及诱导型启动子(例如，锌诱导型绵羊金属硫蛋白(MT)启动子；地塞米松(Dex)诱导型小鼠乳腺瘤病毒(MMTV)启动子；T7聚合酶启动子系统、四环素阻遏系统、四环素诱导系统、RU486诱导系统、雷帕霉素诱导系统)，例如，如本文所述。在一些实施例中，表达盒进一步包含增强子，例如，如本文所述的增强子。

基于RNA的遗传元件的产生

基于RNA的遗传元件可以通过多种方法产生。例如，包含DNA的遗传元件构建体可以被转录以产生包含RNA的遗传元件，例如，如上所述。转录可以发生例如在细胞或无细胞系统中。RNA可以在体外合成，例如通过固相合成。

蛋白质组分的产生

指环载体的蛋白质组分，例如ORF1，可以以本文描述的多种方式产生。

杆状病毒表达系统

病毒表达系统(例如，杆状病毒表达系统)可以用于表达蛋白质(例如，用于产生指环载体)，例如，如本文所述。杆状病毒为具有环状、超螺旋的双链DNA基因组的杆状的病毒。杆状病毒属包括：甲型杆状病毒(核型多角体病毒(nucleopolyhedrovirus，NPV)，从鳞翅目分离)、乙型杆状病毒(颗粒体病毒(GV)，从鳞翅目分离)、丙型杆状病毒(NPV，从膜翅目(Hymenoptera)分离)和丁型杆状病毒(NPV，从双翅目(Diptera)分离)。GV通常每个包膜仅含有一个核衣壳，而NPV通常每个包膜含有单个(SNPV)或多个(MNPV)核衣壳。有包膜的病毒体被进一步包含在GV的颗粒蛋白基质中和NPV的多角体蛋白中。杆状病毒通常具有裂解和包含的生命周期。在一些实施例中，裂解和包含的生命周期在病毒复制的三个阶段中独立出现：早期、晚期和极晚期。在一些实施例中，在早期期间，病毒DNA复制在病毒进入宿主细胞、早期病毒基因表达和宿主基因表达机构切断之后发生。在一些实施例中，在晚期，编码病毒DNA复制的晚期基因被表达，病毒颗粒被组装，并且细胞外病毒(EV)由宿主细胞产生。在一些实施例中，在极晚期，多角体蛋白和p10基因被表达，封闭病毒(OV)由宿主细胞产生，并且宿主细胞被裂解。由于杆状病毒感染昆虫物种，它们可以用作在生物制剂，在杆状病毒允许性昆虫细胞或幼虫中产生外源性蛋白。杆状病毒的不同分离株，例如苜蓿银纹夜蛾(Autographa californica)多核多角体病毒(AcMNPV)和家蚕(Bombyx mori)(桑蚕)核多角体病毒(BmNPV)可以用于外源性蛋白表达。各种杆状病毒表达系统是市售的，例如，购自赛默飞世尔公司(ThermoFisher)。

在一些实施例中，本文所述的蛋白质(例如，指环病毒ORF分子，例如，ORF1、ORF2、ORF2/2、ORF2/3、ORF1/1或ORF1/2或其功能性片段或剪接变体)可以使用包含本文所述的一种或多种组分的杆状病毒表达载体(例如，杆粒)表达。例如，杆状病毒表达载体可以包含选择性标志(例如，kanR)、复制起点(例如，细菌复制起点和昆虫细胞复制起点中的一种或两种)、重组酶识别位点(例如，att位点)和启动子中的一种或多种(例如，所有)。在一些实施例中，可以通过用编码本文所述蛋白质的基因替换天然存在的编码杆状病毒包含体的野生型多角体蛋白基因来产生杆状病毒表达载体(例如，如本文所述的杆粒)。在一些实施例中，将编码本文所述蛋白质的基因克隆到含有杆状病毒启动子的杆状病毒表达载体(例如，如本文所述的杆粒)。在一些实施例中，杆状病毒载体包含一个或多个非杆状病毒启动子，例如，哺乳动物启动子或指环病毒启动子。在一些实施例中，将编码本文所述蛋白质的基因克隆到供体载体(例如，如本文所述)中，随后将该载体与空杆状病毒表达载体(例如，空杆粒)接触，使得编码本文所述蛋白质的基因从供体载体转移(例如，通过同源重组或转座酶活性)至杆状病毒表达载体(例如，杆粒)中。在一些实施例中，杆状病毒启动子的侧翼是来自非必要多角体蛋白基因座的杆状病毒DNA。在一些实施例中，本文所述的蛋白质在病毒复制的极晚期处于AcNPV多角体蛋白启动子的转录控制下。在一些实施例中，适合用于昆虫细胞中的杆状病毒表达的强启动子包括但不限于杆状病毒p10启动子、多角体蛋白(polh)启动子、p6.9启动子和衣壳蛋白启动子。适合用于昆虫细胞中的杆状病毒表达的弱启动子包括杆状病毒的ie1、ie2、ie0、et1、39K(aka pp31)和gp64启动子。

在一些实施例中，通过杆状病毒基因组(例如，野生型或突变型杆状病毒基因组)与转移载体之间的同源重组来产生重组杆状病毒。在一些实施例中，将一个或多个编码本文所述蛋白质的基因克隆到转移载体中。在一些实施例中，转移载体进一步含有杆状病毒启动子，该启动子的侧翼是来自非必要基因座例如多角体蛋白基因的DNA。在一些实施例中，通过杆状病毒基因组与转移载体之间的同源重组将一个或多个编码本文所述蛋白质的基因插入杆状病毒基因组中。在一些实施例中，将杆状病毒基因组在一个或多个独特位点处线性化。在一些实施例中，线性化的位点位于靶位点附近，该靶位点用于将编码本文所述蛋白质的基因插入杆状病毒基因组中。在一些实施例中，可以使用缺失基因(例如多角体蛋白基因)下游的杆状病毒基因组的线性化杆状病毒基因组进行同源重组。在一些实施例中，将杆状病毒基因组和转移载体共转染到昆虫细胞中。在一些实施例中，产生重组杆状病毒的方法包括以下步骤：制备用于与含有编码一种或多种本文所述蛋白质的基因的转移载体进行同源重组的杆状病毒基因组，并且将该转移载体与杆状病毒基因组DNA共转染到昆虫细胞中。在一些实施例中，杆状病毒基因组包含与转移载体的区域同源的区域。这些同源区域可以增强杆状病毒基因组与转移载体之间重组的可能性。在一些实施例中，转移载体中的同源区域位于启动子上游或下游。在一些实施例中，为诱导同源重组，将杆状病毒基因组与转移载体以约1:1至10:1的重量比混合。

在一些实施例中，通过以下方法产生重组杆状病毒：该方法包括用Tn7进行位点特异性转座，例如，从而将编码本文所述蛋白质的基因插入杆粒DNA中，例如，在细菌中繁殖，这些细菌是例如大肠杆菌(例如，DH 10Bac细胞)。在一些实施例中，将编码本文所述蛋白质的基因克隆到载体中并且转化到感受态细胞例如感受态细胞(含有具有最小attTn7靶位点的杆粒DNA)中。在一些实施例中，杆状病毒表达载体(例如，载体)可以具有启动子，例如双启动子(例如，多角体蛋白启动子、p10启动子)。市售供体质粒包括：pFASTBAC 1、pFASTBAC HT和pFASTBAC DUAL。在一些实施例中，鉴定含有重组杆粒DNA的集落并且分离杆粒DNA以转染昆虫细胞。

在一些实施例中，将杆状病毒载体与辅助核酸一起引入昆虫细胞中。引入可以为同时进行或依次进行。在一些实施例中，辅助核酸提供了一种或多种杆状病毒蛋白，例如，以促进杆状病毒载体的包装。在一些实施例中，在昆虫细胞中产生(例如，通过同源重组)的重组杆状病毒被扩增并用于感染昆虫细胞(例如，在中对数生长期)以进行重组蛋白表达。在一些实施例中，通过在细菌例如大肠杆菌中的位点特异性转座产生的重组杆粒DNA用于使用转染剂(例如II)来转染昆虫细胞。关于杆状病毒表达系统的其他信息在美国专利申请号14/447,341、14/277,892和12/278,916中讨论，以上申请通过引用特此并入。

昆虫细胞系统

本文所述的蛋白质可以在用重组杆状病毒或杆粒DNA(例如，如上所述)感染或转染的昆虫细胞中表达。在一些实施例中，昆虫细胞包括：来源于草地贪夜蛾(Spodopterafrugiperda)的Sf9和Sf21细胞以及来源于粉纹夜蛾(Trichoplusia ni)的Tn-368和HighFive^TMBTI-TN-5B1-4细胞(也称为Hi5细胞)。在一些实施例中，来源于蛹期草地贪夜蛾(Spodoptera frugiperda，fall army worm)卵巢的昆虫细胞系Sf21和Sf9可以用于使用杆状病毒表达系统表达重组蛋白。在一些实施例中，Sf21和Sf9昆虫细胞可以在市售的补充血清的培养基或无血清培养基中培养。用于培养昆虫细胞的合适培养基包括：格雷斯补充培养基(Grace’s Supplemented，TNM-FH)、IPL-41、TC-100、施耐德果蝇培养基(Schneider’sDrosophila,)、SF-900II SFM和EXPRESS-FIVE^TMSFM。在一些实施例中，一些无血清培养基配制品利用磷酸盐缓冲系统将培养物pH维持在6.0-6.4范围内(Licari等人,Insect cellhosts for baculovirus expression vectors contain endogenous exoglycosidaseactivity[用于杆状病毒表达载体的昆虫细胞宿主含有内源性外切糖苷酶活性].Biotechnology Progress[生物技术进展]9:146-152(1993)和Drugmand等人Insectcells as factories for biomanufacturing[作为生物制造工厂的昆虫细胞].Biotechnology Advances[生物技术进展]30:1140-1157(2012))，用于培养和重组蛋白产生。在一些实施例中，对于培养不同昆虫细胞系而言，可以使用6.0-6.8的pH。在一些实施例中，昆虫细胞在25℃至30℃的温度在通气情况下在悬浮液中培养或作为单层培养。关于昆虫细胞的其他信息在例如专利申请号14/564,512和14/775,154中讨论，以上每篇申请均通过引用特此并入。

哺乳动物细胞系统

在一些实施例中，本文所述的蛋白质可在用编码蛋白质的载体感染或转染的动物细胞系中体外表达，例如，如本文所述。在本披露的背景下设想的动物细胞系包括猪细胞系，例如，永生化猪细胞系，如但不限于猪肾上皮细胞系PK-15和SK、单核髓系细胞系3D4/31和睾丸细胞系ST。此外，还包括其他哺乳动物细胞系，如CHO细胞(中国仓鼠卵巢)、MARC-145、MDBK、RK-13、EEL。另外地或替代性地，本发明方法的特定实施例利用了动物细胞系，其是上皮细胞系，即上皮谱系细胞的细胞系。适合表达本文所述蛋白质的细胞系包括但不限于人类或灵长类动物来源的细胞系，例如人或灵长类动物肾癌细胞系。

效应物

本文所述的组合物和方法可用于产生指环载体的遗传元件，该指环载体包含编码效应物(例如，外源性效应物或内源性效应物)的序列，例如，如本文所述的。在一些实施例中，遗传元件是效应物，例如，遗传元件是功能性RNA。在一些情况下，效应物可以是内源性效应物或外源性效应物。在一些实施例中，效应物是治疗性效应物。在一些实施例中，效应物包括多肽(例如，治疗性多肽或肽，例如，如本文所述)。在一些实施例中，效应物包括非编码RNA(例如，miRNA、siRNA、shRNA、mRNA、lncRNA、RNA、DNA、反义RNA或gRNA)。在一些实施例中，效应物包括调节性核酸，例如，如本文所述的调节性核酸。

体外组装方法

例如，可以通过体外组装产生指环载体。在一些实施例中，遗传元件在允许组装的条件下在体外与ORF1接触。

在一些实施例中，杆状病毒构建体用于产生指环病毒蛋白。然后可以使用这些蛋白质，例如，用于体外组装以包封遗传元件，例如，包含RNA的遗传元件。在一些实施例中，将编码一种或多种指环病毒蛋白的多核苷酸与启动子融合，以在宿主细胞(例如昆虫或动物细胞)中表达。在一些实施例中，将多核苷酸克隆到杆状病毒表达系统中。在一些实施例中，将宿主细胞，例如昆虫细胞用杆状病毒表达系统感染并孵育一段时间。在一些实施例中，将感染的细胞孵育约1、2、3、4、5、10、15或20天。在一些实施例中，将感染细胞裂解以回收指环病毒蛋白。

在一些实施例中，将分离的指环病毒蛋白纯化。在一些实施例中，使用纯化技术将指环病毒蛋白纯化，这些纯化技术包括但不限于螯合纯化、肝素纯化、梯度沉降纯化和/或SEC纯化。在一些实施例中，将纯化的指环病毒蛋白与遗传元件混合以包封遗传元件，例如，包含RNA的遗传元件。在一些实施例中，使用ORF1蛋白、ORF2蛋白或其经修饰形式包封遗传元件。在一些实施例中，包封两个核酸。例如，第一核酸可以是mRNA，例如化学修饰的mRNA，第二核酸可以是DNA。

在一些实施例中，编码指环病毒(AV)ORF1(例如，野生型ORF1蛋白、携带突变(例如以改善组装效率、产量或稳定性)的ORF1蛋白，嵌合ORF1蛋白或其片段)的DNA在昆虫细胞系(例如，Sf9和/或HighFive)、动物细胞系(例如，鸡细胞系(MDCC))、细菌细胞(例如，大肠杆菌)和/或哺乳动物细胞系(例如，293expi和/或MOLT4)中表达。在一些实施例中，编码AVORF1的DNA可以是未标记的。在一些实施例中，编码AV ORF1的DNA可以含有N-末端和/或C-末端融合的标签。在一些实施例中，编码AV ORF1的DNA可能在ORF1蛋白内携带突变、插入或缺失以引入标签，例如，从而帮助纯化和/或通过免疫染色测定(包括但不限于ELISA或蛋白质印迹)鉴定身份。在一些实施例中，编码AV ORF1的DNA可以单独表达或与任意数量的辅助蛋白一起表达。在一些实施例中，编码AV ORF1的DNA与AV ORF2和/或ORF3蛋白一起表达。

在一些实施例中，携带突变以改善组装效率的ORF1蛋白可以包括但不限于携带引入N-末端精氨酸臂(ARG臂)以改变ARG臂的pI的突变的ORF1蛋白质，从而允许pH敏感性核酸结合以触发颗粒组装(SEQ ID 3-5)。在一些实施例中，携带改善稳定性的突变的ORF1蛋白可以包括对接触典型胶冻卷β-桶的β链F和G的原体间的突变，以改变原体表面的疏水状态并改善衣壳形成的热力学有利性。

在一些实施例中，嵌合ORF1蛋白可以包括但不限于ORF1蛋白，其序列的一部分或多部分被来自另一种衣壳蛋白(例如，喙羽病病毒(BFDV)衣壳蛋白，或戊型肝炎衣壳蛋白)的可比部分替代，例如，Ring 9ORF1的ARG臂或F和Gβ链被来自BFDV衣壳蛋白的可比组分替代。在一些实施例中，嵌合ORF1蛋白还可以包括ORF1蛋白，其序列的一部分或多部分被另一种AV ORF1蛋白的可比部分替代(例如，Ring 2ORF1的胶冻卷片段或C-末端部分被Ring9ORF1的可比部分替代)。

在一些实施例中，本披露描述了制备指环载体的方法，该方法包括：(a)提供混合物，该混合物含有：(i)包含RNA的遗传元件，和(ii)ORF1分子；以及(b)在适用于将遗传元件包封在包含ORF1分子的蛋白质外壳内的条件下孵育混合物，从而制备指环载体；任选地，其中该混合物不包含在细胞中。在一些实施例中，方法进一步包括在提供(a)之前，例如在宿主细胞(例如昆虫细胞或哺乳动物细胞)中表达ORF1分子。在一些实施例中，表达包括在适用于产生ORF1分子的条件下孵育包含编码ORF1分子的核酸分子(例如杆状病毒表达载体)的宿主细胞(例如，昆虫细胞或哺乳动物细胞)。在一些实施例中，方法进一步包括在提供(a)之前，纯化由宿主细胞表达的ORF1分子。在一些实施例中，该方法在无细胞系统中进行。在一些实施例中，本披露描述了制备指环载体组合物的方法，其包括：(a)提供多个根据前述实施例中任一项所述的指环载体或组合物；(b)任选地对多个根据前述实施例中任一项所述的指环载体或组合物评估以下一种或多种：本文所述的污染物、光密度测量(例如，OD260)、颗粒数(例如，通过HPLC)、感染性(例如，颗粒：感染性单位比，例如，通过荧光和/或ELISA测定)；以及(c)例如，如果(b)中的一个或多个参数满足指定阈值，则将多个指环载体配制为，例如，适合施用给受试者的药物组合物。

富集和纯化

可以纯化和/或富集收获的指环载体，例如，以产生指环载体制剂。在一些实施例中，从收获溶液中存在的其他成分或污染物中分离出收获的指环载体，例如，使用本领域已知的纯化病毒颗粒的方法(例如，通过沉降、色谱法和/或超滤进行纯化)。在一些实施例中，将收获的指环载体通过亲和纯化(例如，肝素亲和纯化)进行纯化。在一些实施例中，将收获的指环载体通过尺寸排阻色谱法(例如，使用Tris缓冲液流动相)来纯化。在一些实施例中，将收获的指环载体通过阴离子交换色谱法(例如，Mustang Q膜色谱法)来纯化。在一些实施例中，将收获的指环载体通过混合模式色谱法(例如，使用混合模式树脂，例如Cato700树脂)来纯化。在一些实施例中，纯化步骤包括从制剂中去除血清、宿主细胞DNA、宿主细胞蛋白质、缺少遗传元件的颗粒和/或酚红中的一种或多种。在一些实施例中，相对于收获溶液中存在的其他成分或污染物，富集收获的指环载体，例如，使用本领域已知的富集病毒颗粒的方法。

在一些实施例中，由此产生的制剂或包含该制剂的药物组合物在可接受的期限和温度范围内是稳定的，和/或与所期望的施用途径和/或该施用途径所期望的任何装置，例如，针头或注射器相容。

II.指环载体

在一些方面，本披露提供了使用和制备指环载体、指环载体制剂和治疗性组合物的组合物和方法。在一些实施例中，指环载体包含一种或多种核酸或多肽，这些核酸或多肽包含基于指环病毒(例如，如本文所述的指环病毒)或者其片段或部分或者其他基本上非致病性病毒(例如，共生病毒(symbiotic virus)、共栖病毒(commensal virus)、原生病毒)的序列、结构和/或功能。在一些实施例中，基于指环病毒的指环载体包含至少一个针对该指环病毒而言具有外源性的元件，例如，外源性效应物或编码位于指环载体遗传元件内的外源性效应物的核酸序列。在一些实施例中，基于指环病毒的指环载体包含至少一个针对来自该指环病毒的另一元件具有异源性的元件，例如，效应物编码核酸序列，其针对另一相连的核酸序列，如启动子元件，具有异源性。在一些实施例中，指环载体包含遗传元件(例如，环状DNA，例如，单链DNA)，其包含至少一个相对于该遗传元件的其余部分和/或蛋白质外壳而言具有异源性的元件(例如，编码效应物的外源性元件，例如，如本文所述)。指环载体可以是用于使有效载荷进入宿主，例如人类中的递送媒介物(例如，基本上非致病性递送媒介物)。在一些实施例中，指环载体能够在真核细胞例如哺乳动物细胞例如人类细胞中复制。在一些实施例中，指环载体在哺乳动物(例如人类)细胞中是基本上非致病性的和/或基本上非整合的。在一些实施例中，指环载体在哺乳动物例如人类中是基本上非免疫原性的。在一些实施例中，指环载体是复制缺损型。在一些实施例中，指环载体是可复制型。

在一些实施例中，指环载体包含愈合子(curon)或其组分(例如，遗传元件，例如，包含编码效应物和/或蛋白质外壳的序列)，例如，如PCT申请号PCT/US2018/037379中所述的，其通过引用以其全文并入本文。在一些实施例中，指环载体包含指环载体或其组分(例如，遗传元件，例如，包含编码效应物和/或蛋白质外壳的序列)，例如，如PCT申请号PCT/US19/65995中所述的，其通过引用以其全文并入本文。

在一方面，本发明包括指环载体，其包含：(i)遗传元件，其包含启动子元件、编码效应物(例如，内源性效应物或外源性效应物，例如，有效载荷)的序列和蛋白质结合序列(例如，外壳蛋白质结合序列，例如，包装信号)，其中该遗传元件是单链DNA，并具有以下一种或两种特性：为环状和/或以小于进入细胞的遗传元件的约0.001％、0.005％、0.01％、0.05％、0.1％、0.5％、1％、1.5％或2％的频率整合到真核细胞的基因组中；和(ii)蛋白质外壳；其中遗传元件被包封在蛋白质外壳内；并且其中该指环载体能够将遗传元件递送到真核细胞中。

在本文描述的指环载体的一些实施例中，遗传元件以少于进入细胞的遗传元件的约0.001％、0.005％、0.01％、0.05％、0.1％、0.5％、1％、1.5％或2％的频率整合。在一些实施例中，施用给受试者的多个指环载体的少于约0.01％、0.05％、0.1％、0.5％、1％、2％、3％、4％或5％的遗传元件将整合到受试者的一个或多个宿主细胞的基因组中。在一些实施例中，指环载体，例如，如本文所述的指环载体群体的遗传元件整合到宿主细胞基因组中的频率低于同类的AAV病毒群体的频率，例如，其频率比同类的AAV病毒群体低约50％、60％、70％、75％、80％、85％、90％、95％、100％或更多。

在一方面，本发明包括指环载体，该指环载体包含：(i)遗传元件，其包含启动子元件和编码效应物(例如，内源性效应物或外源性效应物，例如有效载荷)的序列和蛋白质结合序列(例如，外壳蛋白质结合序列)，其中该遗传元件与野生型指环病毒序列(例如，野生型细环病毒(TTV)、小细环病毒(TTMV)或TTMDV序列，例如本文所述的野生型指环病毒序列)具有至少75％(例如，至少75％、76％、77％、78％、79％、80％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％)序列同一性；和(ii)蛋白质外壳；其中遗传元件被包封在蛋白质外壳内；并且其中该指环载体能够将遗传元件递送到真核细胞中。

在一个方面中，本发明包括指环载体，该指环载体包含：

a)遗传元件，其包含(i)编码外壳蛋白(例如，非致病性外壳蛋白)的序列，(ii)使该遗传元件与该非致病性外壳蛋白结合的外壳蛋白结合序列，和(iii)编码效应物(例如，内源性效应物或外源性效应物)的序列；以及

b)蛋白质外壳，其与该遗传元件相关联，例如，包裹或包封该遗传元件。

在一些实施例中，指环载体包括来自非包膜环状单链DNA病毒的序列或表达产物(或与其具有>70％、75％、80％、85％、90％、95％、97％、98％、99％、100％同源性)。动物性环状单链DNA病毒通常是指感染真核非植物宿主并具有环状基因组的单链DNA(ssDNA)病毒亚群。因此，动物性环状ssDNA病毒可区别于感染原核生物的ssDNA病毒(即，微小噬菌体科和丝状噬菌体科)和感染植物的ssDNA病毒(即，双生病毒科和矮化病毒科)。它们也可区别于感染非植物真核生物的线性ssDNA病毒(即，细小病毒科)。

在一些实施例中，指环载体调节宿主细胞功能，例如，短暂或长期调节。在某些实施例中，细胞功能发生稳定改变，例如持续存在以下时间的调节：至少约1小时至约30天，或至少约2小时、6小时、12小时、18小时、24小时、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、16天、17天、18天、19天、20天、21天、22天、23天、24天、25天、26天、27天、28天、29天、30天、60天或更长时间或者其间的任何时间。在某些实施例中，细胞功能发生短暂改变，例如持续存在以下时间的调节：不超过约30分钟至约7天，或不超过约1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、24小时、36小时、48小时、60小时、72小时、4天、5天、6天、7天或其间的任何时间。

在一些实施例中，遗传元件包括启动子元件。在实施例中，启动子元件选自RNA聚合酶II依赖性启动子、RNA聚合酶III依赖性启动子、PGK启动子、CMV启动子、EF-1α启动子、SV40启动子、CAGG启动子或UBC启动子、TTV病毒启动子、组织特异性启动子、U6(pollIII)、具有活化蛋白(TetR-VP16、Gal4-VP16、dCas9-VP16等)的上游DNA结合位点的最小CMV启动子。在实施例中，启动子元件包含TATA盒。在实施例中，启动子元件对于野生型指环病毒，例如，如本文所述的野生型指环病毒而言是内源性的。

在一些实施例中，遗传元件包括以下特征中的一种或多种：单链、环状、负链和/或DNA。在实施例中，遗传元件包括附加体。在一些实施例中，除效应物之外的遗传元件部分的组合大小为约2.5kb-5kb(例如，约2.8kb-4kb、约2.8kb-3.2kb、约3.6kb-3.9kb或约2.8kb-2.9kb)、小于约5kb(例如，小于约2.9kb、3.2kb、3.6kb、3.9kb或4kb)或至少100个核苷酸(例如，至少1kb)。

在一些实施例中，将指环载体或指环载体中包含的遗传元件引入细胞(例如，人类细胞)中。在一些实施例中，例如由指环载体的遗传元件编码的效应子(例如，RNA，例如miRNA)在细胞(例如，人类细胞)中表达，例如，一旦将指环载体或遗传元件引入细胞中。在实施例中，将指环载体或其中包含的遗传元件引入细胞中例如通过改变细胞中靶分子的表达水平，来调节(例如，增加或减少)靶分子(例如，靶核酸，例如RNA，或靶多肽)在细胞中的水平。在实施例中，引入指环载体或其中包含的遗传元件降低了细胞产生的干扰素的水平。在实施例中，将指环载体或其中包含的遗传元件引入细胞中调节(例如，增加或减少)细胞的功能。在实施例中，将指环载体或其中包含的遗传元件引入细胞中调节(例如，增加或降低)细胞的存活力。在实施例中，将指环载体或其中包含的遗传元件引入细胞中降低了细胞(例如癌细胞)的存活力。

在一些实施例中，本文所述的指环载体(例如，合成指环载体)诱发的抗体阳性率低于70％(例如，低于约60％、50％、40％、30％、20％或10％的抗体阳性率)。在实施例中，根据本领域已知的方法确定抗体阳性率。在实施例中，通过检测生物样品中针对指环病毒(例如，如本文所述)或基于其的指环载体的抗体来确定抗体阳性率，例如，根据在以下文献中描述的抗TTV抗体检测方法：Tsuda等人(1999；J.Virol.Methods[病毒学方法杂志]77:199-206；通过引用并入本文)和/或根据在以下文献中描述的用于测定抗TTV IgG血清阳性率的方法：Kakkola等人(2008；Virology[病毒学]382:182-189；通过引用并入本文)。还可以通过本领域用于检测抗病毒抗体的方法来检测针对指环病毒或基于指环病毒的指环载体的抗体，这些方法是例如检测抗AAV抗体的方法，例如，如Calcedo等人(2013；Front.Immunol.[免疫学前沿]4(341):1-7；其通过引用并入本文)中所述。

在一些实施例中，复制缺损型、复制缺陷型或非复制型遗传元件不编码遗传元件复制所需的所有必要机构或组分。在一些实施例中，复制缺陷型遗传元件不编码复制因子。在一些实施例中，复制缺陷型遗传元件不编码一种或多种ORF(例如，ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3，例如，如本文所述)。在一些实施例中，可以以反式提供不由遗传元件编码的机构或组分(例如，在由宿主细胞包含的核酸中编码，例如整合到宿主细胞的基因组中)，例如，使得遗传元件可以在以反式提供的机构或组分存在的情况下进行复制。

在一些实施例中，包装缺损型、包装缺陷型或非包装型遗传元件不能被包装到蛋白质外壳(例如，其中蛋白质外壳包含衣壳或其部分，例如，包含由ORF1核酸编码的多肽，例如，如本文所述)中。在一些实施例中，与野生型指环病毒(例如，如本文所述)相比，包装缺损型遗传元件被包装到蛋白质外壳中的效率低于10％(例如，低于10％、9％、8％、7％、6％、5％、4％、3％、2％、1％、0.5％、0.1％、0.01％或0.001％)。在一些实施例中，即使在存在允许包装野生型指环病毒遗传元件(例如，如本文所述)的因子(例如，ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、或ORF2t/3)的情况下，包装缺陷型遗传元件也不能被包装到蛋白质外壳中。在一些实施例中，即使在存在允许包装野生型指环病毒遗传元件(例如，如本文所述)的因子(例如，ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3或ORF2t/3)的情况下，与野生型指环病毒(例如，如本文所述)相比，包装缺损型遗传元件被包装到蛋白质外壳中的效率也低于10％(例如，低于10％、9％、8％、7％、6％、5％、4％、3％、2％、1％、0.5％、0.1％、0.01％或0.001％)。

在一些实施例中，可包装型遗传元件可被包装到蛋白质外壳(例如，其中蛋白质外壳包含衣壳或其部分，例如，包含由ORF1核酸编码的多肽，例如，如本文所述)中。在一些实施例中，与野生型指环病毒(例如，如本文所述)相比，可包装型遗传元件被包装到蛋白质外壳中的效率为至少20％(例如，至少20％、30％、40％、50％、60％、70％、80％、85％、90％、95％、96％、97％、98％、99％、100％或更高)。在一些实施例中，在存在允许包装野生型指环病毒遗传元件(例如，如本文所述)的因子(例如，ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、或ORF2t/3)的情况下，可包装型遗传元件可以被包装到蛋白质外壳中。在一些实施例中，在存在允许包装野生型指环病毒遗传元件(例如，如本文所述)的因子(例如，ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3或ORF2t/3)的情况下，与野生型指环病毒(例如，如本文所述)相比，可包装型遗传元件被包装到蛋白质外壳中的效率为至少20％(例如，至少20％、30％、40％、50％、60％、70％、80％、85％、90％、95％、96％、97％、98％、99％、100％或更高)。

指环病毒

在一些实施例中，指环载体，例如，如本文所述的指环载体包含源自指环病毒的序列或表达产物。在一些实施例中，指环载体包括一个或多个相对于指环病毒而言具有外源性的序列或表达产物。在一些实施例中，指环载体包括一个或多个相对于指环病毒而言具有内源性的序列或表达产物。在一些实施例中，指环载体包括一个或多个相对于指环载体中一个或多个其他序列或表达产物而言具有异源性的序列或表达产物。指环病毒通常具有负极性的单链环状DNA基因组。

在一些实施例中，遗传元件包含编码以下的核苷酸序列：氨基酸序列或其功能性片段或与本文所述的氨基酸序列中任一个(例如，指环病毒氨基酸序列)具有至少约60％、70％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列。

在一些实施例中，如本文所述的指环载体包含一种或多种核酸分子(例如，如本文所述的遗传元件)，这些核酸分子包含与指环病毒序列，例如，如本文所述的指环病毒序列或者其片段具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列。

在一些实施例中，如本文所述的指环载体包含一种或多种核酸分子(例如，如本文所述的遗传元件)，这些核酸分子包含与指环病毒(例如，如本文所述的指环病毒)的TATA盒、加帽位点、起始元件、转录起始位点、5’UTR保守结构域、ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3、三个开放阅读框区域、多(A)信号、GC富集区或其任何组合中的一种或多种具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列。在一些实施例中，核酸分子包含编码衣壳蛋白，例如，本文所述任一指环病毒的ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3的序列。在实施例中，核酸分子包含编码衣壳蛋白的序列，该衣壳蛋白包含与指环病毒ORF1蛋白(或者其剪接变体或功能性片段)或由指环病毒ORF1核酸编码的多肽具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在实施例中，核酸分子包含与表A1的指环病毒ORF1核酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒ORF1/1核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒ORF1/2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒ORF2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒ORF2/2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒ORF2/3核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒ORF2t/3核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒TATA盒核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒起始元件核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒转录起始位点核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒多(A)信号核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表A1的指环病毒GC富集核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。

在实施例中，核酸分子包含与表B1的指环病毒ORF1核酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒ORF1/1核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒ORF1/2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒ORF2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒ORF2/2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒ORF2/3核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒TATA盒核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒起始元件核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒转录起始位点核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒多(A)信号核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表B1的指环病毒GC富集核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。

在实施例中，核酸分子包含与表C1的指环病毒ORF1核酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒ORF1/1核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒ORF1/2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒ORF2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒ORF2/2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒ORF2/3核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒TAIP核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒TATA盒核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒起始元件核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒转录起始位点核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒多(A)信号核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表C1的指环病毒GC富集核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。

在实施例中，核酸分子包含与表D1的指环病毒ORF1核酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒ORF1/1核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒ORF1/2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒ORF2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒ORF2/2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒ORF2/3核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒TAIP核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒TATA盒核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒起始元件核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒转录起始位点核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒多(A)信号核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表D1的指环病毒GC富集核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。

在实施例中，核酸分子包含与表E1的指环病毒ORF1核酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒ORF1/1核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒ORF1/2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒ORF2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒ORF2/2核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒ORF2/3核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒TAIP核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒TATA盒核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒起始元件核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒转录起始位点核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒5’UTR保守结构域核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒三个开放阅读框区域核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒多(A)信号核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。在实施例中，核酸分子包含与表E1的指环病毒GC富集核苷酸序列具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核酸序列。

在一些实施例中，如本文所述的指环载体包含一种或多种核酸分子(例如，如本文所述的遗传元件)，这些核酸分子包含与指环病毒序列，例如，如本文所述的指环病毒序列或者其片段具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列。在实施例中，指环载体包含选自如表A1-M2中任一个所示的序列或与其具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列的核酸序列。在实施例中，指环载体包含多肽，该多肽包含表A2-M2中任一个所示的序列，或与其具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列。

在一些实施例中，如本文所述的指环载体包含一种或多种核酸分子(例如，如本文所述的遗传元件)，这些核酸分子包含与本文所述的指环病毒中任一个的TATA盒、加帽位点、起始元件、转录起始位点、5’UTR保守结构域、ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3、三个开放阅读框区域、多(A)信号、GC富集区或其任何组合中的一种或多种具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列(例如，表A-M中任一个所注释的指环病毒序列或表A-M中任一个所列序列编码的指环病毒序列)。在一些实施例中，核酸分子包含编码衣壳蛋白，例如，本文所述任一指环病毒的ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3序列(例如，表A-M中任一个所注释的指环病毒序列或表A-M中任一个所列序列编码的指环病毒序列)。在实施例中，核酸分子包含编码衣壳蛋白的序列，该衣壳蛋白包含与指环病毒ORF1或ORF2蛋白(例如，表A2-M2中任一个所示的ORF1或ORF2氨基酸序列，或者由表A1-M1中任一个所示的核酸序列编码的ORF1或ORF2氨基酸序列)具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在实施例中，核酸分子包含编码衣壳蛋白的序列，该衣壳蛋白包含与指环病毒ORF1蛋白(例如，表A2-M2中任一个所示的ORF1氨基酸序列，或者由表A1-M1中任一个所示的核酸序列编码的ORF1氨基酸序列)具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在一些实施例中，如本文所述的指环载体是嵌合指环载体。在一些实施例中，嵌合指环载体进一步包含一种或多种来自除指环病毒以外的病毒的元件、多肽或核酸。

在实施例中，嵌合指环载体包含多种多肽(例如，指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3)，这些多肽包含来自多种不同指环病毒(例如，如本文所述的指环病毒)的序列。例如，嵌合指环载体可以包含来自一种指环病毒的ORF1分子(例如，Ring1 ORF1分子，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF1分子)；和来自不同指环病毒的ORF2分子(例如，Ring2 ORF2分子，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF2分子)。在另一实例中，嵌合指环载体可以包含来自一种指环病毒的第一ORF1分子(例如，Ring1 ORF1分子，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF1分子)和来自不同指环病毒的第二ORF1分子(例如，Ring2 ORF1分子，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF1分子)。

在一些实施例中，指环载体包含嵌合多肽(例如，指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3)，例如，该嵌合多肽包含至少一个来自一种指环病毒(例如，如本文所述)的部分和至少一个来自不同病毒(例如，如本文所述)的部分。

在一些实施例中，指环载体包含嵌合多肽(例如，指环病毒ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3和/或ORF2t/3)，例如，该嵌合多肽包含至少一个来自一种指环病毒(例如，如本文所述)的部分和至少一个来自不同指环病毒(例如，如本文所述)的部分。在实施例中，指环载体包含嵌合ORF1分子，其包含来自一种指环病毒(例如，如本文所述)的ORF1分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF1分子的至少一个部分，和来自不同指环病毒(例如，如本文所述)的ORF1分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF1分子的至少一个部分。在实施例中，嵌合ORF1分子包含来自一种指环病毒的ORF1胶冻卷结构域，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列；和来自不同指环病毒的ORF1氨基酸子序列(例如，如本文所述)或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列。在实施例中，嵌合ORF1分子包含来自一种指环病毒的ORF1精氨酸富集区，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列；和来自不同指环病毒的ORF1氨基酸子序列(例如，如本文所述)，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列。在实施例中，嵌合ORF1分子包含来自一种指环病毒的ORF1高变结构域，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列；和来自不同指环病毒的ORF1氨基酸子序列(例如，如本文所述)，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列。在实施例中，嵌合ORF1分子包含来自一种指环病毒的ORF1N22结构域，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列；和来自不同指环病毒的ORF1氨基酸子序列(例如，如本文所述)，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列。在实施例中，嵌合ORF1分子包含来自一种指环病毒的ORF1 C-末端结构域，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列；和来自不同指环病毒的ORF1氨基酸子序列(例如，如本文所述)，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列。在实施例中，指环载体包含嵌合ORF1/1分子，其包含来自一种指环病毒(例如，如本文所述)的ORF1/1分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF1/1分子的至少一个部分，和来自不同指环病毒(例如，如本文所述)的ORF1/1分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF1/1分子的至少一个部分。在实施例中，指环载体包含嵌合ORF1/2分子，其包含来自一种指环病毒(例如，如本文所述)的ORF1/2分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF1/2分子的至少一个部分，和来自不同指环病毒(例如，如本文所述)的ORF1/2分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF1/2分子的至少一个部分。在实施例中，指环载体包含嵌合ORF2分子，其包含来自一种指环病毒(例如，如本文所述)的ORF2分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF2分子的至少一个部分，和来自不同指环病毒(例如，如本文所述)的ORF2分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF2分子的至少一个部分。在实施例中，指环载体包含嵌合ORF2/2分子，其包含来自一种指环病毒(例如，如本文所述)的ORF2/2分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF2/2分子的至少一个部分，和来自不同指环病毒(例如，如本文所述)的ORF2/2分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF2/2分子的至少一个部分。在实施例中，指环载体包含嵌合ORF2/3分子，其包含来自一种指环病毒(例如，如本文所述)的ORF2/3分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF2/3分子的至少一个部分，和来自不同指环病毒(例如，如本文所述)的ORF2/3分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF2/3分子的至少一个部分。在实施例中，指环载体包含嵌合ORF2T/3分子，其包含来自一种指环病毒(例如，如本文所述)的ORF2T/3分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF2T/3分子的至少一个部分，和来自不同指环病毒(例如，如本文所述)的ORF2T/3分子或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％氨基酸序列同一性的ORF2T/3分子的至少一个部分。

例如，在PCT申请号PCT/US2018/037379和PCT/US19/65995(其通过引用以其全文并入本文)中描述了其他示例性指环病毒基因组，其中包含的序列或子序列可用于本文所述的组合物和方法中。在一些实施例中，示例性指环病毒序列包含如PCT/US19/65995(其通过引用并入本文)的表A1、A3、A5、A7、A9、A11、B1-B5、1、3、5、7、9、11、13、15或17中任一个所列的核酸序列。在一些实施例中，示例性指环病毒序列包含如PCT/US19/65995(其通过引用并入本文)的表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中任一个所列的氨基酸序列。在一些实施例中，示例性指环病毒序列包含ORF1分子序列或编码其的核酸序列，例如，如PCT/US19/65995(其通过引用并入本文)的表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10或37A-37C中任一个所列。

表A1.示例性指环病毒核酸序列(甲型细环病毒，分支3)

注释：

表A2.示例性指环病毒氨基酸序列(甲型细环病毒，分支3)

表B1.示例性指环病毒核酸序列(乙型细环病毒)

注释：

表B2.示例性指环病毒氨基酸序列(乙型细环病毒)

表C1.示例行指环病毒核酸序列(丙型细环病毒)

注释：

表C2.示例性指环病毒氨基酸序列(丙型细环病毒)

表D1.示例性指环病毒核酸序列(乙型细环病毒)

注释：

表D2.示例性指环病毒氨基酸序列(乙型细环病毒)

表E1：示例性指环病毒核酸序列(乙型细环病毒)

注释：

表E2.示例性指环病毒氨基酸序列(乙型细环病毒)

在一些实施例中，指环载体包含核酸，该核酸包含在PCT申请号PCT/US2018/037379(其通过引用以其全文并入本文)中列出的序列。在一些实施例中，指环载体包含多肽，该多肽包含在PCT申请号PCT/US2018/037379(其通过引用以其全文并入本文)中列出的序列。在一些实施例中，指环载体包含核酸，该核酸包含在PCT申请号PCT/US19/65995(其通过引用以其全文并入本文)中列出的序列。在一些实施例中，指环载体包含多肽，该多肽包含在PCT申请号PCT/US19/65995(其通过引用以其全文并入本文)中列出的序列。

ORF1分子

在一些实施例中，指环载体包含ORF1分子和/或编码ORF1分子的核酸。一般而言，ORF1分子包括具有指环病毒ORF1蛋白(例如，如本文所述的指环病毒ORF1蛋白)的结构特征和/或活性的多肽。在一些实施例中，ORF1分子包含相对于指环病毒ORF1蛋白(例如，如本文所述的指环病毒ORF1蛋白)的截短。ORF1分子可能能够与其他ORF1分子结合，例如，以形成蛋白质外壳(例如，如本文所述的蛋白质外壳)，例如，衣壳。在一些实施例中，蛋白质外壳可以包封核酸分子(例如，如本文所述的遗传元件)。在一些实施例中，多个ORF1分子可形成多聚体，例如，以形成蛋白质外壳。在一些实施例中，多聚体可以是同型多聚体。在其他实施例中，多聚体可以是异型多聚体。

在一些实施例中，ORF1分子包含以下一个或多个：包含精氨酸富集区的第一区域，例如具有至少60％的碱性残基(例如，至少60％、65％、70％、75％、80％、85％、90％、95％或100％碱性残基；例如，60％-90％、60％-80％、70％-90％或70-80％的碱性残基)的区域，以及包含胶冻卷结构域的第二区域，例如至少六个β链(例如，4、5、6、7、8、9、10、11或12个β链)。

在一些实施例中，本文所述的ORF1分子包含相对于野生型ORF1蛋白序列的一个或多个赖氨酸至组氨酸突变(例如，如本文所述)。在某些实施例中，ORF1分子在精氨酸富集区和/或第一β链中包含一个或多个赖氨酸至组氨酸突变。

精氨酸富集区

精氨酸富集区与本文所述的精氨酸富集区序列或者包含至少60％、70％或80％碱性残基(例如，精氨酸、赖氨酸或其组合)的至少约40个氨基酸的序列具有至少70％(例如，至少约70％、80％、90％、95％、96％、97％、98％、99％或100％)序列同一性。

胶冻卷结构域

胶冻卷结构域或区域包含(例如，由其组成)具有以下特征中一种或多种(例如，1、2或3种)的多肽(例如，较大多肽中包含的结构域或区域)：

(i)胶冻卷结构域的至少30％(例如，至少30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、90％或更多)的氨基酸是一个或多个β-折叠的部分；

(ii)胶冻卷结构域的二级结构包含至少四个(例如，至少4、5、6、7、8、9、10、11或12个)β-折叠；和/或

(iii)胶冻卷结构域的三级结构包含至少两个(例如，至少2、3或4个)β-折叠；和/或

(iv)胶冻卷结构域包含β-折叠与α-螺旋的比例为至少2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。

在某些实施例中，胶冻卷结构域包含两个β-折叠。

在某些实施例中，一个或多个(例如，1、2、3、4、5、6、7、8、9或10个)β-折叠包含约八个(例如，4、5、6、7、8、9、10、11或12个)β-链。在某些实施例中，一个或多个(例如，1、2、3、4、5、6、7、8、9或10个)β-折叠包含八个β-链。在某些实施例中，一个或多个(例如，1、2、3、4、5、6、7、8、9或10个)β-折叠包含七个β-链。在某些实施例中，一个或多个(例如，1、2、3、4、5、6、7、8、9或10个)β-折叠包含六个β-链。在某些实施例中，一个或多个(例如，1、2、3、4、5、6、7、8、9或10个)β-折叠包含五个β-链。在某些实施例中，一个或多个(例如，1、2、3、4、5、6、7、8、9或10个)β-折叠包含四个β-链。

在一些实施例中，胶冻卷结构域包含与第二β-折叠反向平行取向的第一β-折叠。在某些实施例中，第一β-折叠包含约四个(例如，3、4、5或6个)β-链。在某些实施例中，第二β-折叠包含约四个(例如，3、4、5或6个)β-链。在实施例中，第一和第二β-折叠总共包含约八个(例如，6、7、8、9、10、11或12个)β-链。

在某些实施例中，胶冻卷结构域是衣壳蛋白(例如，如本文所述的ORF1分子)的组分。在某些实施例中，胶冻卷结构域具有自组装活性。在一些实施例中，包含胶冻卷结构域的多肽与另一拷贝的包含胶冻卷结构域的多肽结合。在一些实施例中，第一多肽的胶冻卷结构域与该多肽的第二拷贝的胶冻卷结构域结合。

N22结构域

ORF1分子还可包括包含指环病毒N22结构域(例如，如本文所述的，例如，来自如本文所述的指环病毒ORF1蛋白的N22结构域)的结构或活性的第三区域，和/或包含指环病毒C-末端结构域(CTD)(例如，如本文所述的，例如，来自如本文所述的指环病毒ORF1蛋白的CTD)的结构或活性的第四区域。在一些实施例中，ORF1分子按照N-末端到C-末端的顺序包含该第一、第二、第三和第四区域。

高变区(HVR)

在一些实施例中，ORF1分子可以进一步包含高变区(HVR)，例如来自指环病毒ORF1蛋白(例如，如本文所述)的HVR。在一些实施例中，HVR位于该第二区域和该第三区域之间。在一些实施例中，HVR包含至少约55个(例如，至少约45、50、51、52、53、54、55、56、57、58、59、60或65个)氨基酸(例如，约45-160、50-160、55-160、60-160、45-150、50-150、55-150、60-150、45-140、50-140、55-140或60-140个氨基酸)。

示例性ORF1序列

下表中提供了示例性指环病毒ORF1氨基酸序列和示例性ORF1结构域的序列。在一些实施例中，本文所述的多肽(例如，ORF1分子)包含与一个或多个指环病毒ORF1子序列(例如，如表N-Z中任一个所述)具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，本文所述的指环载体包含ORF1分子，该分子包含与一种或多种指环病毒ORF1子序列(例如，如表N-Z中任一个所述)具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，本文所述的指环载体包含编码ORF1分子的核酸分子(例如，遗传元件)，该分子包含与一种或多种指环病毒ORF1子序列(例如，如表N-Z中任一个所述)具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在一些实施例中，一个或多个指环病毒ORF1子序列包含精氨酸(Arg)富集结构域、胶冻卷结构域、高变区(HVR)、N22结构域或C-末端结构域(CTD)中的一种或多种(例如，如表N-Z中任一个所列的)，或与其具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列。在一些实施例中，ORF1分子包含来自不同指环病毒的多个子序列(例如，选自表N-Z中所列的甲型细环病毒分支1-7子序列中ORF1子序列的任何组合)。在实施例中，ORF1分子包含来自一种指环病毒的Arg富集结构域、胶冻卷结构域、N22结构域和CTD中的一种或多种，以及来自另一种指环病毒的HVR。在实施例中，ORF1分子包含来自一种指环病毒的胶冻卷结构域、HVR、N22结构域和CTD中的一种或多种，以及来自另一种指环病毒的Arg富集结构域。在实施例中，ORF1分子包含来自一种指环病毒的Arg富集结构域、HVR、N22结构域和CTD中的一种或多种，以及来自另一种指环病毒的胶冻卷结构域。在实施例中，ORF1分子包含来自一种指环病毒的Arg富集结构域、胶冻卷结构域、HVR和CTD中的一种或多种，以及来自另一种指环病毒的N22结构域。在实施例中，ORF1分子包含来自一种指环病毒的Arg富集结构域、胶冻卷结构域、HVR和N22结构域中的一种或多种，以及来自另一种指环病毒的CTD。

例如，在PCT申请号PCT/US2018/037379和PCT/US19/65995(其通过引用以其全文并入本文)中描述了其他示例性指环病毒，这些指环病毒的ORF1分子或者其剪接变体或功能性片段可用于本文所述组合物和方法中，例如，以形成指环载体的蛋白质外壳，例如，通过包封遗传元件。

表N.示例性指环病毒ORF1氨基酸子序列(甲型细环病毒，分支3)

注释：

表O.示例性指环病毒ORF1氨基酸子序列(甲型细环病毒，分支3)

表P.示例性指环病毒ORF1氨基酸子序列(乙型细环病毒)

注释：

表Q.示例性指环病毒ORF1氨基酸子序列(乙型细环病毒)

表R.示例性指环病毒ORF1氨基酸子序列(丙型细环病毒)

注释：

表S.示例性指环病毒ORF1氨基酸子序列(丙型细环病毒)

在一些实施例中，第一区域可以结合核酸分子(例如，DNA)。在一些实施例中，碱性残基选自精氨酸、组氨酸或赖氨酸，或其组合。在一些实施例中，第一区域包含至少60％、65％、70％、75％、80％、85％、90％、95％或100％的精氨酸残基(例如，60％-90％、60％-80％、70％-90％或70％-80％精氨酸残基)。在一些实施例中，第一区域包含约30-120个氨基酸(例如，约40-120、40-100、40-90、40-80、40-70、50-100、50-90、50-80、50-70、60-100、60-90或60-80个氨基酸)。在一些实施例中，第一区域包含病毒ORF1精氨酸富集区(例如，来自指环病毒ORF1蛋白的精氨酸富集区，例如，如本文所述)的结构或活性。在一些实施例中，第一区域包含核定位信号。

在一些实施例中，第二区域包含胶冻卷结构域，例如，病毒ORF1胶冻卷结构域的结构或活性(例如，来自指环病毒ORF1蛋白的胶冻卷结构域，例如，如本文所述)。在一些实施例中，第二区域能够与另一ORF1分子的第二区域结合，例如，以形成蛋白质外壳(例如，衣壳)或其部分。

在一些实施例中，第四区域暴露在蛋白质外壳(例如，包含ORF1分子的多聚体的蛋白质外壳，例如，如本文所述)的表面上。

在一些实施例中，第一区域、第二区域、第三区域、第四区域和/或HVR各自包含少于四个(例如，0、1、2或3个)个β折叠。

在一些实施例中，第一区域、第二区域、第三区域、第四区域和/或HVR中的一个或多个可以由异源氨基酸序列(例如，来自异源ORF1分子的相应区域)替换。在一些实施例中，异源氨基酸序列具有所期望的功能，例如，如本文所述的。

在一些实施例中，ORF1分子包含多个保守基序(例如，包含约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100个或更多个氨基酸的基序)(例如，如PCT/US19/65995的图34所示)。在一些实施例中，保守基序可以显示出与一种或多种野生型指环病毒分支(例如，甲型细环病毒，分支1；甲型细环病毒，分支2；甲型细环病毒，分支3；甲型细环病毒，分支4；甲型细环病毒，分支5；甲型细环病毒，分支6；甲型细环病毒，分支7；乙型细环病毒；和/或丙型细环病毒)的ORF1蛋白存在60％、70％、80％、85％、90％、95％或100％序列同一性。在实施例中，每个保守基序的长度为1-1000个(例如，5-10、5-15、5-20、10-15、10-20、15-20、5-50、5-100、10-50、10-100、10-1000、50-100、50-1000或100-1000个)氨基酸。在某些实施例中，保守基序由约2％-4％(例如，约1％-8％、1％-6％、1％-5％、1％-4％、2％-8％、2％-6％、2％-5％或2％-4％)的ORF1分子序列组成，并且每个都显示出与野生型指环病毒分支的ORF1蛋白中相应基序存在100％序列同一性。在某些实施例中，保守基序由约5％-10％(例如，约1％-20％、1％-10％、5％-20％或5％-10％)的ORF1分子序列组成，并且每个都显示出与野生型指环病毒分支的ORF1蛋白中相应基序存在80％序列同一性。在某些实施例中，保守基序由约10％-50％(例如，约10％-20％、10％-30％、10％-40％、10％-50％、20％-40％、20％-50％或30％-50％)的ORF1分子序列组成，并且每个都显示出与野生型指环病毒分支的ORF1蛋白中相应基序存在60％序列同一性。在一些实施例中，保守基序包含一个或多个如表19中所列的氨基酸序列。

在一些实施例中，ORF1分子或编码其的核酸分子包含相对于野生型ORF1蛋白(例如，如本文所述)的至少一个差异(例如，突变、化学修饰或表观遗传改变)。

N22结构域中的保守ORF1基序

在一些实施例中，本文所述的多肽(例如，ORF1分子)包含氨基酸序列YNPX²DXGX²N(SEQ ID NO:829)，其中Xⁿ是任何n个氨基酸的连续序列。例如，X²表示任何两个氨基酸的连续序列。在一些实施例中，YNPX²DXGX²N(SEQ ID NO:829)包含在ORF1分子的N22结构域内，例如，如本文所述。在一些实施例中，本文所述的遗传元件包含编码氨基酸序列YNPX²DXGX²N(SEQ ID NO:829)的核酸序列(例如，编码ORF1分子的核酸序列，例如，如本文所述)，其中Xⁿ是任何n个氨基酸的连续序列。

在一些实施例中，多肽(例如，ORF1分子)包含保守的二级结构，例如，侧接和/或包含YNPX²DXGX²N(SEQ ID NO:829)基序的一部分，例如，在N22结构域中。在一些实施例中，保守二级结构包含第一β链和/或第二β链。在一些实施例中，第一β链的长度为约5-6个(例如，3、4、5、6、7或8个)氨基酸。在一些实施例中，第一β链包含位于YNPX²DXGX²N(SEQ ID NO:829)基序的N-末端的酪氨酸(Y)残基。在一些实施例中，YNPX²DXGX²N(SEQ ID NO:829)基序包含无规则卷曲(例如，约8-9个氨基酸的无规则卷曲)。在一些实施例中，第二β链的长度为约7-8个(例如，5、6、7、8、9或10个)氨基酸。在一些实施例中，第二β链包含位于YNPX²DXGX²N(SEQID NO:829)基序的C-末端的天冬酰胺(N)残基。

在PCT/US19/65995(其通过引用以其全文并入本文)的实例47和图48中描述了示例性YNPX²DXGX²N(SEQ ID NO:829)基序侧翼二级结构。在一些实施例中，ORF1分子包含如下区域，该区域包含PCT/US19/65995的图48中所示的一个或多个(例如，1、2、3、4、5、6、7、8、9、10个或全部)二级结构元件(例如，β链)。在一些实施例中，ORF1分子包含如下区域，该区域包含PCT/US19/65995的图48中所示的一个或多个(例如，1、2、3、4、5、6、7、8、9、10个或全部)二级结构元件(例如，β链)，位于YNPX²DXGX²N(SEQ ID NO:829)基序(例如，如本文所述)的侧翼。

ORF1胶冻卷结构域中的保守二级结构基序

在一些实施例中，本文所述的多肽(例如，ORF1分子)包含一个或多个由指环病毒ORF1蛋白(例如，如本文所述)所包含的二级结构元件。在一些实施例中，ORF1分子包含一个或多个由指环病毒ORF1蛋白(例如，如本文所述)的胶冻卷结构域所包含的二级结构元件。一般而言，ORF1胶冻卷结构域包含二级结构，该二级结构按照从N-末端到C-末端的方向依次包含第一β链、第二β链、第一α螺旋、第三β链、第四β链、第五β链、第二α螺旋、第六β链、第七β链、第八β链和第九β链。在一些实施例中，ORF1分子包含二级结构，该二级结构按照从N-末端到C-末端的方向依次包含第一β链、第二β链、第一α螺旋、第三β链、第四β链、第五β链、第二α螺旋、第六β链、第七β链、第八β链和/或第九β链。

在一些实施例中，一对保守的二级结构元件(即，β链和/或α螺旋)由间隙氨基酸序列隔开，例如，包含无规则卷曲序列、β链或α螺旋，或其组合。保守二级结构元件之间的间隙氨基酸序列可包含例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个氨基酸。在一些实施例中，ORF1分子可进一步包含一个或多个另外的β链和/或α螺旋(例如，在胶冻卷结构域中)。在一些实施例中，可以组合连续的β链或连续的α螺旋。在一些实施例中，第一β链和第二β链包含在更大的β链中。在一些实施例中，第三β链和第四β链包含在更大的β链中。在一些实施例中，第四β链和第五β链包含在更大的β链中。在一些实施例中，第六β链和第七β链包含在更大的β链中。在一些实施例中，第七条β链和第八条β链包含在更大的β链中。在一些实施例中，第八β链和第九β链包含在更大的β链中。

在一些实施例中，第一β链的长度为约5-7个(例如，3、4、5、6、7、8、9或10个)氨基酸。在一些实施例中，第二β链的长度为约15-16个(例如，13、14、15、16、17、18或19个)氨基酸。在一些实施例中，第一α螺旋的长度为约15-17个(例如，13、14、15、16、17、18、19或20个)氨基酸。在一些实施例中，第三β链的长度为约3-4个(例如，1、2、3、4、5或6个)氨基酸。在一些实施例中，第四β链的长度为约10-11个(例如，8、9、10、11、12或13个)氨基酸。在一些实施例中，第五β链的长度为约6-7个(例如，4、5、6、7、8、9或10个)氨基酸。在一些实施例中，第二α螺旋的长度为约8-14个(例如，5、6、7、8、9、10、11、12、13、14、15、16或17个)氨基酸。在一些实施例中，第二α螺旋可以分解成两个较小的α螺旋(例如，由无规则卷曲序列隔开)。在一些实施例中，两个较小的α螺旋中的每一个的长度为约4-6个(例如，2、3、4、5、6、7或8个)氨基酸。在一些实施例中，第六β链的长度为约4-5个(例如，2、3、4、5、6或7个)氨基酸。在一些实施例中，第七β链的长度为约5-6个(例如，3、4、5、6、7、8或9个)氨基酸。在一些实施例中，第八β链的长度为约7-9个(例如，5、6、7、8、9、10、11、12或13个)氨基酸。在一些实施例中，第九β链的长度为约5-7个(例如，3、4、5、6、7、8、9或10个)氨基酸。

在PCT/US19/65995的实例47和图47中描述了示例性胶冻卷结构域二级结构。在一些实施例中，ORF1分子包含如下区域，该区域包含PCT/US19/65995的图47中所示的任何胶冻卷结构域二级结构的一个或多个(例如，1、2、3、4、5、6、7、8、9、10个或全部)二级结构元件(例如，β链和/或α螺旋)。

共有ORF1结构域序列

在一些实施例中，ORF1分子(例如，如本文所述)包含胶冻卷结构域、N22结构域和/或C-末端结构域(CTD)中的一个或多个。在一些实施例中，胶冻卷结构域包含具有如本文所述的胶冻卷结构域共有序列的氨基酸序列(例如，如表37A-37C中任一个所列)。在一些实施例中，N22结构域包含具有如本文所述的N22结构域共有序列的氨基酸序列(例如，如表37A-37C中任一个所列)。在一些实施例中，CTD结构域包含具有如本文所述的CTD结构域共有序列的氨基酸序列(例如，如表37A-37C中任一个所列)。在一些实施例中，表37A-37C的任一中以“(X_a-b)”格式列出的氨基酸包含一系列连续氨基酸，其中该系列包含至少a个和至多b个氨基酸。在某些实施例中，该系列中的所有氨基酸都是相同的。在其他实施例中，该系列包括至少两个(例如，至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或21个)不同的氨基酸。

表37A.甲型细环病毒ORF1结构域共有序列

表37B.乙型细环病毒ORF1结构域共有序列

表37C.丙型细环病毒ORF1结构域共有序列

在一些实施例中，胶冻卷结构域包含如表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10、或37A-37C中任一个所列的胶冻卷结构域氨基酸序列，或与其具有至少70％、75％、80％、8％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，N22结构域包含如表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10、或37A-37C中任一个所列的N22结构域氨基酸序列，或与其具有至少70％、75％、80％、8％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。在一些实施例中，CTD结构域包含如表21、23、25、27、29、31、33、35、D2、D4、D6、D8、D10、或37A-37C中任一个所列的CTD结构域氨基酸序列，或与其具有至少70％、75％、80％、8％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

ORF1蛋白序列的鉴定

在一些实施例中，可以从指环病毒的基因组中鉴定指环病毒ORF1蛋白序列或编码ORF1蛋白的核酸序列(例如，推定的指环病毒基因组，例如，通过核酸测序技术如深度测序技术来鉴定)。在一些实施例中，通过以下一种或多种(例如，1、2或全部3种)选择标准来鉴定ORF1蛋白序列：

(i)长度选择：针对大于约600个氨基酸残基的那些序列，可以对蛋白序列(例如，符合下文(ii)或(iii)中描述的标准的推定的指环病毒ORF1序列)进行大小选择，以鉴定推定的指环病毒ORF1蛋白。在一些实施例中，指环病毒ORF1蛋白序列的长度为至少约600、650、700、750、800、850、900、950或1000个氨基酸残基。在一些实施例中，甲型细环病毒ORF1蛋白序列的长度为至少约700、710、720、730、740、750、760、770、780、790、800、900或1000个氨基酸残基。在一些实施例中，乙型细环病毒ORF1蛋白序列的长度为至少约650、660、670、680、690、700、750、800、900或1000个氨基酸残基。在一些实施例中，丙型细环病毒ORF1蛋白序列的长度为至少约650、660、670、680、690、700、750、800、900或1000个氨基酸残基。在一些实施例中，编码指环病毒ORF1蛋白的核酸序列的长度为至少约1800、1900、2000、2100、2200、2300、2400或2500个核苷酸。在一些实施例中，编码甲型细环病毒ORF1蛋白序列的核酸序列的长度为至少约2100、2150、2200、2250、2300、2400或2500个核苷酸。在一些实施例中，编码乙型细环病毒ORF1蛋白序列的核酸序列的长度为至少约1900、1950、2000、2500、2100、2150、2200、2250、2300、2400或2500或1000个核苷酸。在一些实施例中，编码丙型细环病毒ORF1蛋白序列的核酸序列的长度为至少约1900、1950、2000、2500、2100、2150、2200、2250、2300、2400或2500或1000个核苷酸。

(ii)存在ORF1基序：可以对蛋白序列(例如，符合上文(i)或下文(iii)中描述的标准的推定的指环病毒ORF1序列)进行过滤，以鉴定在上述N22结构域中含有保守ORF1基序的那些序列。在一些实施例中，推定的指环病毒ORF1序列包含序列YNPXXDXGXXN。在一些实施例中，推定的指环病毒ORF1序列包含序列Y[NCS]PXXDX[GASKR]XX[NTSVAK]。

(iii)存在精氨酸富集区：针对包括精氨酸富集区(例如，如本文所述)的那些序列，可以对蛋白序列(例如，符合上文(i)和/或(ii)中描述的标准的推定的指环病毒ORF1序列)进行过滤。在一些实施例中，推定的指环病毒ORF1序列包含至少约30、35、40、45、50、55、60、65或70个氨基酸的连续序列，其包含至少30％(例如，至少约20％、25％、30％、35％、40％、45％或50％)的精氨酸残基。在一些实施例中，推定的指环病毒ORF1序列包含约35-40、40-45、45-50、50-55、55-60、60-65或65-70个氨基酸的连续序列，其包含至少30％(例如，至少约20％、25％、30％、35％、40％、45％或50％)的精氨酸残基。在一些实施例中，精氨酸富集区位于推定的指环病毒ORF1蛋白起始密码子下游至少约30、40、50、60、70或80个氨基酸处。在一些实施例中，精氨酸富集区位于推定的指环病毒ORF1蛋白起始密码子下游至少约50个氨基酸处。

ORF2分子

在一些实施例中，指环载体包含ORF2分子和/或编码ORF2分子的核酸。一般而言，ORF2分子包括具有指环病毒ORF2蛋白(例如，如本文所述的指环病毒ORF2蛋白，例如，如表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中的任一个所列的)的结构特征和/或活性的多肽，或其功能性片段。在一些实施例中，ORF2分子包含与如表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中任一个所示的指环病毒ORF2蛋白序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的氨基酸序列。

在一些实施例中，ORF2分子包含与甲型细环病毒、乙型细环病毒或丙型细环病毒ORF2蛋白具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的氨基酸序列。在一些实施例中，ORF2分子(例如，与甲型细环病毒ORF2蛋白具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的ORF2分子)的长度为250个或更少个氨基酸(例如，约150-200个氨基酸)。在一些实施例中，ORF2分子(例如，与乙型细环病毒ORF2蛋白具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的ORF2分子)的长度约为50-150个氨基酸。在一些实施例中，ORF2分子(例如，与丙型细环病毒ORF2蛋白具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的ORF2分子)的长度为约100-200个氨基酸(例如，约100-150个氨基酸)。在一些实施例中，ORF2分子包含螺旋-转角-螺旋基序(例如，包含位于转角区侧翼的两个α螺旋的螺旋-转角-螺旋基序)。在一些实施例中，ORF2分子不包含TTV分离株TA278或TTV分离株SANBAN的ORF2蛋白的氨基酸序列。在一些实施例中，ORF2分子具有蛋白磷酸酶活性。在一些实施例中，ORF2分子或编码其的核酸分子包含相对于例如如本文所述的野生型ORF2蛋白(例如，如表A2、A4、A6、A8、A10、A12、C1-C5、2、4、6、8、10、12、14、16或18中的任一个中所示)的至少一个差异(例如，突变、化学修饰或表观遗传改变)。

保守的ORF2基序

在一些实施例中，本文所述的多肽(例如，ORF2分子)包含氨基酸序列[W/F]X⁷HX³CX¹CX⁵H(SEQ ID NO:949)，其中Xⁿ是任何n个氨基酸的连续序列。在实施例中，X⁷表示任何七个氨基酸的连续序列。在实施例中，X³表示任何三个氨基酸的连续序列。在实施例中，X¹表示任何单个氨基酸。在实施例中，X⁵表示任何五个氨基酸的连续序列。在一些实施例中，[W/F]可以是色氨酸或苯丙氨酸。在一些实施例中，[W/F]X⁷HX³CX¹CX⁵H(SEQ ID NO:949)包含在ORF2分子的N22结构域内，例如，如文中所述。在一些实施例中，本文所述的遗传元件包含编码氨基酸序列[W/F]X⁷HX³CX¹CX⁵H(SEQ ID NO:949)的核酸序列(例如，编码ORF2分子的核酸序列，例如，如本文所述)，其中Xn是任何n个氨基酸的连续序列。

遗传元件

在一些实施例中，指环载体包含遗传元件。在一些实施例中，遗传元件具有以下特征中的一种或多种：基本上不与宿主细胞的基因组整合，是游离核酸，是单链RNA，是环状的，大约1至10kb，存在于细胞核内，可以与内源性蛋白质结合，产生效应子，例如靶向宿主或靶细胞的基因、活性或功能的多肽或核酸(例如，RNA、iRNA、微小RNA)。在一个实施例中，遗传元件是基本上非整合的。在一些实施例中，遗传元件包含包装信号，例如，结合衣壳蛋白的序列。在一些实施例中，在包装或衣壳结合序列之外，遗传元件与野生型指环病毒核酸序列具有小于70％、60％、50％、40％、30％、20％、10％、5％序列同一性，例如，与指环病毒核酸序列，例如，如本文所述的指环病毒核酸序列具有小于70％、60％、50％、40％、30％、20％、10％、5％序列同一性。在一些实施例中，在包装或衣壳结合序列之外，遗传元件具有与指环病毒核酸序列至少70％、75％、80％、8％、90％、95％、96％、97％、98％、99％或100％同一性的少于500、450、400、350、300、250、200、150或100个连续核苷酸。

在一些实施例中，遗传元件的长度小于20kb(例如，小于约19kb、18kb、17kb、16kb、15kb、14kb、13kb、12kb、11kb、10kb、9kb、8kb、7kb、6kb、5kb、4kb、3kb、2kb、1kb或更小)。在一些实施例中，独立地或附加地，遗传元件的长度大于1000b(例如，至少约1.1kb、1.2kb、1.3kb、1.4kb、1.5kb、1.6kb、1.7kb、1.8kb、1.9kb、2kb、2.1kb、2.2kb、2.3kb、2.4kb、2.5kb、2.6kb、2.7kb、2.8kb、2.9kb、3kb、3.1kb、3.2kb、3.3kb、3.4kb、3.5kb、3.6kb、3.7kb、3.8kb、3.9kb、4kb、4.1kb、4.2kb、4.3kb、4.4kb、4.5kb、4.6kb、4.7kb、4.8kb、4.9kb、5kb或更大)。在一些实施例中，遗传元件的长度为约2.5kb-4.6kb、2.8kb-4.0kb、3.0kb-3.8kb或3.2kb-3.7kb。在一些实施例中，遗传元件的长度为约1.5kb-2.0kb、1.5kb-2.5kb、1.5kb-3.0kb、1.5kb-3.5kb、1.5kb-3.8kb、1.5kb-3.9kb、1.5kb-4.0kb、1.5kb-4.5kb或1.5kb-5.0kb。在一些实施例中，遗传元件的长度为约2.0kb-2.5kb、2.0kb-3.0kb、2.0kb-3.5kb、2.0kb-3.8kb、2.0kb-3.9kb、2.0kb-4.0kb、2.0kb-4.5kb或2.0kb-5.0kb。在一些实施例中，遗传元件的长度为约2.5kb-3.0kb、2.5kb-3.5kb、2.5kb-3.8kb、2.5kb-3.9kb、2.5kb-4.0kb、2.5kb-4.5kb或2.5kb-5.0kb。在一些实施例中，遗传元件的长度为约3.0kb-5.0kb、3.5kb-5.0kb、4.0kb-5.0kb或4.5kb-5.0kb。在一些实施例中，遗传元件的长度为约1.5kb-2.0kb、2.0kb-2.5kb、2.5kb-3.0kb、3.0kb-3.5kb、3.1kb-3.6kb、3.2kb-3.7kb、3.3kb-3.8kb、3.4kb-3.9kb、3.5kb-4.0kb、4.0kb-4.5kb或4.5kb-5.0kb。在一些实施例中，遗传元件的长度为约3.6-3.9kb。在一些实施例中，遗传元件的长度为约2.8-2.9kb。在一些实施例中，遗传元件的长度为约2.0-3.2kb。

在一些实施例中，遗传元件包含本文所述的一种或多种特征，例如，编码基本上非致病性蛋白的序列、蛋白结合序列、编码调节性核酸的一个或多个序列、一个或多个调节性序列、编码复制蛋白的一个或多个序列，以及其他序列。

在实施例中，遗传元件是由双链环状DNA产生的(例如，通过转录产生)。

在一些实施例中，遗传元件不包含一种或多种细菌质粒元件(例如，细菌复制起点或选择性标志，如细菌抗性基因)。在一些实施例中，遗传元件不包含细菌质粒骨架。

在一个实施例中，本披露提供了遗传元件，该遗传元件包含编码(i)基本上非致病性外壳蛋白，(ii)使该遗传元件结合至该基本上非致病性外壳蛋白的外壳蛋白结合序列，以及(iii)调节性核酸的核酸序列(例如，RNA序列)。在这样的实施例中，遗传元件可包含一个或多个与天然病毒序列(例如，天然指环病毒序列，例如，如本文所述)的任一个核苷酸序列具有至少约60％、70％、80％、85％、90％、95％、96％、97％、98％和99％核苷酸序列同一性的序列。

蛋白结合序列

在一些实施例中，遗传元件编码与基本上非致病性蛋白质结合的蛋白结合序列。在一些实施例中，蛋白结合序列有助于将遗传元件包装到蛋白质外壳中。在一些实施例中，蛋白结合序列特异性结合基本上非致病性蛋白质的精氨酸富集区。在一些实施例中，遗传元件包含如PCT/US19/65995的实例8中所述的蛋白结合序列。

在一些实施例中，遗传元件包含与指环病毒序列的5’UTR保守结构域或GC富集结构域(例如，如本文所述)具有至少70％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的蛋白结合序列。

在实施例中，蛋白结合序列与指环病毒5’UTR保守结构域核苷酸序列(例如，如本文所述)具有至少约70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性。

5’UTR区域

在一些实施例中，如本文所述的核酸分子(例如，遗传元件、遗传元件构建体或遗传元件区域)包含5’UTR序列，例如，如本文所述的5’UTR保守结构域序列(例如，在表A1、表B1或表C1的任一中)或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列。

在一些实施例中，5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGGGX₁CAGTCT，或与其具有至少85％、90％、95％、96％、97％、98％或99％序列同一性的核酸序列。在一些实施例中，5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGGGX₁CAGTCT，或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如，置换、缺失或添加)的核酸序列。在实施例中，X₁是A。在实施例中，X₁不存在。

在一些实施例中，5’UTR序列包含甲型细环病毒(例如，Ring1)5’UTR的核酸序列，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列。在实施例中，5’UTR序列包含表A1中列出的5’UTR保守结构域的核酸序列，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列。在一些实施例中，核酸分子包含与表A1中列出的5’UTR保守结构域具有至少95％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表A1中列出的5’UTR保守结构域具有至少95.775％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表A1中列出的5’UTR保守结构域具有至少97％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表A1中列出的5’UTR保守结构域具有至少97.183％序列同一性的核酸序列。在一些实施例中，5’UTR序列包含核酸序列AGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGC TCGGGACTGGC，或与其具有至少85％、90％、95％、96％、97％、98％或99％序列同一性的核酸序列。在一些实施例中，5’UTR序列包含核酸序列AGGTGAGTTTACACACCGCAGTCAAGGGGCAATTCGGGCTCGGGACT GGC，或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如，置换、缺失或添加)的核酸序列。

在一些实施例中，5’UTR序列包含乙型细环病毒(例如，Ring2)5’UTR的核酸序列，或与其具有至少75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在实施例中，5’UTR序列包含表B1中列出的5’UTR保守结构域的核酸序列，或与其具有至少75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少85％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少87％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少87.324％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少88％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少88.732％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少91％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少91.549％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少92％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少92.958％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少94％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少94.366％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少95％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少95.775％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少97％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表B1中列出的5’UTR保守结构域具有至少97.183％序列同一性的核酸序列。在一些实施例中，5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGATC AGTCT，或与其具有至少85％、90％、95％、96％、97％、98％或99％序列同一性的核酸序列。在一些实施例中，5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAAGTCAAGGGGCAATTCGGGCTAGATCAG TCT，或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如，置换、缺失或添加)的核酸序列。

在一些实施例中，5’UTR序列包含丙型细环病毒(例如，Ring4)5’UTR的核酸序列，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列。在实施例中，5’UTR序列包含表C1中列出的5’UTR保守结构域的核酸序列，或与其具有至少75％、80％、85％、90％、95％、96％、97％、98％或99％序列同一性的序列。在一些实施例中，核酸分子包含与表C1中列出的5’UTR保守结构域具有至少97％序列同一性的核酸序列。在一些实施例中，核酸分子包含与表C1中列出的5’UTR保守结构域具有至少97.183％序列同一性的核酸序列。在一些实施例中，5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAGGTCTAGGGGCAATTCGG GCTAGGGCAGTCT，或与其具有至少85％、90％、95％、96％、97％、98％或99％序列同一性的核酸序列。在一些实施例中，5’UTR序列包含核酸序列AGGTGAGTGAAACCACCGAGGTCTAGGGGCAATTCGGGCTAGGGCA GTCT，或者相对于其具有不超过1、2、3、4、5、6、7、8、9或10个核苷酸差异(例如，置换、缺失或添加)的核酸序列。

在一些实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与指环病毒5’UTR序列，例如表38中所示的核酸序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在一些实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含表38所示的共有5'UTR序列的核酸序列，其中X₁、X₂、X₃、X₄和X₅各自独立地是任何核苷酸，例如其中X₁＝G或T，X₂＝C或A，X₃＝G或A，X₄＝T或C，并且X₅＝A、C或T。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的共有5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的示例性TTV 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的TTV-CT30F 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的TTV-HD23a 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的TTV-JA20 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的TTV-TJN02 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的TTV-tth8 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。

在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒共有5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支1 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支2 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支3 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支4 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支5 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支6 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表38中所示的甲型细环病毒分支7 5’UTR序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。

表38.来自指环病毒的示例性5’UTR序列

鉴定5’UTR序列

在一些实施例中，可以在指环病毒基因组内鉴别指环病毒5’UTR序列(例如，推定的指环病毒基因组，例如，通过核酸测序技术如深度测序技术来鉴定)。在一些实施例中，通过以下步骤之一或二者鉴定指环病毒5’UTR序列：

(i)鉴定环化接合点：在一些实施例中，5’UTR将位于全长、环化指环病毒基因组的环化接合点附近。例如，可以通过鉴定序列的重叠区域来鉴定环化接合点。在一些实施例中，可以从序列中剪切掉序列的重叠区域以产生已环化的全长指环病毒基因组序列。在一些实施例中，使用软件以这种方式环化基因组序列。不希望受到理论的束缚，在计算上环化基因组可能导致序列的起始位置以非生物性方式定向。序列内的标记可用于将序列重新定向到正确的方向。例如，标记序列可以包括与如本文所述的指环病毒基因组内一个或多个元件(例如，指环病毒，例如，如本文所述的指环病毒的TATA盒、加帽位点、起始元件、转录起始位点、5’UTR保守结构域、ORF1、ORF1/1、ORF1/2、ORF2、ORF2/2、ORF2/3、ORF2t/3、三个开放阅读框区域、多(A)信号或GC富集区中一种或多种)具有基本同源性的序列。

(ii)鉴定5’UTR序列：一旦获得推定的指环病毒基因组序列，就可以将该序列(或其位置，例如，其长度为约40-50、50-60、60-70、70-80、80-90或90-100个核苷酸)与一个或多个指环病毒5'UTR序列(例如，如本文所述)进行比较，以鉴定与其具有实质同源性的序列。在一些实施例中，推定的指环病毒5’UTR区域与如本文所述的指环病毒5’UTR序列具有至少50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性。

GC富集区

在一些实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的核酸序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的GC富集序列具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。

在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与如表39中所示的36个核苷酸的GC富集序列(例如，36个核苷酸的共有GC富集区序列1、36个核苷酸的共有GC富集区序列2、TTV分支1 36个核苷酸的区域、TTV分支3 36个核苷酸的区域、TTV分支3分离株GH1 36个核苷酸的区域、TTV分支3sle1932 36个核苷酸的区域、TTV分支4ctdc002 36个核苷酸的区域、TTV分支5 36个核苷酸的区域、TTV分支6 36个核苷酸的区域或TTV分支7 36个核苷酸的区域)具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含核酸序列，该核酸序列包含如表39中所示的36个核苷酸的GC富集序列(例如，36个核苷酸的共有GC富集区序列1、36个核苷酸的共有GC富集区序列2、TTV分支1 36个核苷酸的区域、TTV分支3 36个核苷酸的区域、TTV分支3分离株GH1 36个核苷酸的区域、TTV分支3sle1932 36个核苷酸的区域、TTV分支4ctdc002 36个核苷酸的区域、TTV分支5 36个核苷酸区域、TTV分支6 36个核苷酸区域或TTV分支7 36个核苷酸的区域)的至少10、15、20、25、30、31、32、33、34、35或36个连续核苷酸。

在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与甲型细环病毒GC富集区序列(例如，选自TTV-CT30F、TTV-P13-1、TTV-tth8、TTV-HD20a、TTV-16、TTV-TJN02或TTV-HD16d，例如，如表39中所列的)具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含核酸序列，该核酸序列包含甲型细环病毒GC富集区序列(例如，选自TTV-CT30F、TTV-P13-1、TTV-tth8、TTV-HD20a、TTV-16、TTV-TJN02或TTV-HD16d，例如，如表39中所列的)的至少10、15、20、25、30、35、40、45、50、60、70、80、90、100、104、105、108、110、111、115、120、122、130、140、145、150、155或156个连续核苷酸。

在实施例中，36个核苷酸的GC富集序列选自：

(i)CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO:160)，

(ii)GCGCTX₁CGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO:164)，其中X₁选自T、G或A；

(iii)GCGCTTCGCGCGCCGCCCACTAGGGGGCGTTGCGCG(SEQ ID NO:165)；

(iv)GCGCTGCGCGCGCCGCCCAGTAGGGGGCGCAATGCG(SEQ ID NO:166)；

(v)GCGCTGCGCGCGCGGCCCCCGGGGGAGGCATTGCCT(SEQ ID NO:167)；

(vi)GCGCTGCGCGCGCGCGCCGGGGGGGCGCCAGCGCCC(SEQ ID NO:168)；

(vii)GCGCTTCGCGCGCGCGCCGGGGGGCTCCGCCCCCCC(SEQ ID NO:169)；

(viii)GCGCTTCGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO:170)；

(ix)GCGCTACGCGCGCGCGCCGGGGGGCTGCGCCCCCCC(SEQ ID NO:171)；或

(x)GCGCTACGCGCGCGCGCCGGGGGGCTCTGCCCCCCC(SEQ ID NO:172)。

在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含核酸序列CGCGCTGCGCGCGCCGCCCAGTAGGGGGAGCCATGC(SEQ ID NO:160)。

在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含表39中所示的共有GC富集序列的核酸序列，其中X₁、X₄、X₅、X₆、X₇、X₁₂、X₁₃、X₁₄、X₁₅、X₂₀、X₂₁、X₂₂、X₂₆、X₂₉、X₃₀和X₃₃各自独立地是任何核苷酸，并且其中X₂、X₃、X₈、X₉、X₁₀、X₁₁、X₁₆、X₁₇、X₁₈、X₁₉、X₂₃、X₂₄、X₂₅、X₂₇、X₂₈、X₃₁、X₃₂和X₃₄各自独立地是不存在的或任何核苷酸。在一些实施例中，X₁至X₃₄中的一个或多个(例如，全部)各自独立地是表39中指定的核苷酸(或不存在)。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的示例性TTV GC富集序列(例如，全序列、片段1、片段2、片段3、或其任何组合，例如按顺序排列的片段1-3)具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的TTV-CT30F GC富集序列(例如，全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8、或其任何组合，例如按顺序排列的片段1-7)具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的TTV-HD23a GC富集序列(例如，全序列、片段1、片段2、片段3、片段4、片段5、片段6、或其任何组合，例如按顺序排列的片段1-6)具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的TTV-JA20GC富集序列(例如，全序列、片段1、片段2、或其任何组合，例如按顺序排列的片段1和2)具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的TTV-TJN02GC富集序列(例如，全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8、或其任何组合，例如按顺序排列的片段1-8)具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的TTV-tth8 GC富集序列(例如，全序列、片段1、片段2、片段3、片段4、片段5、片段6、片段7、片段8、片段9、或其任何组合，例如按顺序排列的片段1-6)具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的片段7具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的片段8具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。在实施例中，遗传元件(例如，遗传元件的蛋白结合序列)包含与表39中所示的片段9具有至少约75％(例如，至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％)同一性的核酸序列。

表39.来自指环病毒的示例性GC富集序列

效应物

在一些实施例中，遗传元件可包括一个或多个作为效应物或编码效应物的序列，这些效应物是例如，功能性效应物，例如内源性效应物或外源性效应物，例如治疗性多肽或核酸，例如细胞毒性或细胞溶解性RNA或蛋白质。在一些实施例中，功能性核酸是非编码RNA。在一些实施例中，功能性核酸是编码RNA。效应物可以调节生物活性，例如增加或降低酶活性、基因表达、细胞信号传导以及细胞或器官功能。效应物活性还可包括结合调节性蛋白以调节调节子的活性，例如转录或翻译。效应物活性还可以包括激活或抑制功能。例如，效应物可通过触发酶中底物亲和力的增加来诱导酶活性，例如，果糖2,6-二磷酸激活磷酸果糖激酶1并增加糖酵解响应于胰岛素的速率。在另一实例中，效应物可以抑制底物与受体的结合并抑制其激活，例如，纳曲酮和纳洛酮结合阿片受体而不激活它们，并阻断受体结合阿片类物质的能力。效应物活性还可以包括调节蛋白质的稳定性/降解和/或转录本的稳定性/降解。例如，多肽辅因子(即泛素)可以将蛋白质定向到蛋白质上用于降解，从而标志它们进行降解。在另一实例中，效应物通过阻断酶的活性位点来抑制酶活性，例如，甲氨蝶呤是四氢叶酸(一种二氢叶酸还原酶的辅酶)的结构类似物，其与二氢叶酸还原酶的结合力比天然底物高1000倍，并抑制核苷酸碱基合成。

在一些实施例中，编码效应物的序列包括100-2000、100-1000、100-500、100-200、200-2000、200-1000、200-500、500-1000、500-2000或1000-2000个核苷酸。在一些实施例中，效应物是核酸或蛋白有效载荷，例如，如本文所述的核酸或蛋白有效载荷。

调节性核酸

在一些实施例中，效应物是调节性核酸。调节性核酸修饰内源性基因和/或外源性基因的表达。在一个实施例中，调节性核酸靶向宿主基因。调节性核酸可包括但不限于与内源性基因杂交的核酸(例如，如本文别处所述的miRNA、siRNA、mRNA、lncRNA、RNA、DNA、反义RNA、gRNA)、与外源性核酸(例如病毒DNA或RNA)杂交的核酸、与RNA杂交的核酸、干扰基因转录的核酸、干扰RNA翻译的核酸、稳定RNA或去稳定RNA的核酸(例如通过靶向降解的方式)，以及调节DNA或RNA结合因子的核酸。在实施例中，调节性核酸编码miRNA。在一些实施例中，针对野生型指环病毒而言，调节性核酸是内源性的。在一些实施例中，针对野生型指环病毒而言，调节性核酸是外源性的。

在一些实施例中，调节性核酸包含通常含有5-500个碱基对的RNA或RNA样结构(取决于特定的RNA结构，例如miRNA 5-30bp、lncRNA 200-500bp)并且可以具有与细胞内表达的靶基因中的编码序列或编码细胞内表达的靶基因的序列相同(或互补)或几乎相同(或基本上互补)的核碱基序列。

在一些实施例中，调节性核酸包含核酸序列，例如，引导RNA(gRNA)。在一些实施例中，DNA靶向部分包含引导RNA或编码引导RNA的核酸。gRNA，即一种短的合成RNA，可以由结合不完整效应部分所必需的“支架”序列和用户定义的用于基因组靶标的约20个核苷酸靶向序列组成。在实践中，通常将引导RNA序列设计为具有17-24个核苷酸(例如，19、20或21个核苷酸)的长度，并且与靶核酸序列互补。定制gRNA生成器和算法可通过商业途径获得，用于设计有效的引导RNA。使用嵌合性“单引导RNA”(“sgRNA”)也可以实现基因编辑，这是一种工程化(合成)的单一RNA分子，模拟天然存在的crRNA-tracrRNA复合物，并同时含有tracrRNA(用于结合核酸酶)和至少一个crRNA(以将核酸酶引导至被靶向序列进行编辑)。也已证明在基因组编辑中，经化学修饰的sgRNA是有效的；参见，例如，Hendel等人(2015)Nature Biotechnol[自然生物技术].,985-991。

调节性核酸包含识别特定DNA序列(例如，与基因的启动子、增强子、沉默子或阻遏子相邻或在其内的序列)的gRNA。

某些调节性核酸可以通过RNA干扰(RNAi)的生物学过程抑制基因表达。RNAi分子包含RNA或RNA样结构，其通常包含15-50个碱基对(例如约18-25个碱基对)并且具有与细胞内表达的靶基因中的编码序列相同(互补)或几乎相同(基本上互补)的核碱基序列。RNAi分子包括但不限于：短干扰RNA(siRNA)、双链RNA(dsRNA)、微小RNA(miRNA)、短发夹RNA(shRNA)、部分双链体和dicer底物(美国专利号8,084,599、8,349,809和8,513,207)。

长非编码RNA(lncRNA)被定义为长于100个核苷酸的非蛋白质编码转录物。这种有些武断的限制将lncRNA与小型调节性RNA(例如微小RNA(miRNA)、短干扰RNA(siRNA)及其他短RNA)区分开来。通常，大多数(约78％)的lncRNA的特征为组织特异性的。以与附近蛋白质编码基因相反的方向转录的发散lncRNA(占哺乳动物基因组中总lncRNA的约20％大比例)可能会调节附近基因的转录。

遗传元件可以编码具有与内源基因或基因产物(例如，mRNA)的全部或片段基本上互补或完全互补的序列的调节性核酸。调节性核酸可以与内含子和外显子之间的边界处的序列互补，从而防止特异性基因的新生成的核RNA转录物成熟为用于转录的mRNA。与特定基因互补的调节性核酸可与该基因的mRNA杂交并阻止其翻译。反义调节性核酸可以是DNA、RNA或其衍生物或杂合体。

与目的转录物杂交的调节性核酸的长度可以在5至30个核苷酸之间，在约10至30个核苷酸之间，或约11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个核苷酸。调节性核酸与靶向转录物的同一性程度应为至少75％、至少80％、至少85％、至少90％或至少95％。

遗传元件可以编码调节性核酸，例如与靶基因的约5至约25个连续核苷酸相同的微小RNA(miRNA)分子。在一些实施例中，miRNA序列靶向mRNA并从二核苷酸AA开始，其GC含量为约30％-70％(约30％-60％、约40％-60％或约45％-55％)，并且例如，如通过标准BLAST搜索所确定的，与要引入其中的哺乳动物基因组中的靶标以外的任何核苷酸序列不具有高百分比同一性。

siRNA和shRNA类似于内源性微小RNA(miRNA)基因的处理途径中的中间体(Bartel,Cell[细胞]116:281-297,2004)。在一些实施例中，siRNA可以用作miRNA，反之亦然(Zeng等人,Mol Cell[分子细胞学]9:1327-1333,2002；Doench等人,Genes Dev[基因与发育]17:438-442,2003)。像siRNA一样，微小RNA使用RISC来下调靶基因，但与siRNA不同，大多数动物性miRNA都不切割mRNA。相反，miRNA通过翻译抑制或多A(多腺苷酸)去除和mRNA降解降低蛋白质输出(Wu等人,Proc Natl Acad Sci USA[美国国家科学院院刊]103:4034-4039,2006)。已知的miRNA结合位点位于mRNA 3'UTR内；miRNA似乎靶向与miRNA 5'端的2-8个核苷酸几乎完全互补的位点(Rajewsky,Nat Genet[自然-遗传学]38增刊:S8-13,2006；Lim等人,Nature[自然]433:769-773,2005)。此区被称为种子区。由于siRNA和miRNA是可互换的，因此外源性siRNA下调与siRNA具有种子互补性的mRNA(Birmingham等人,NatMethods[自然-方法]3:199-204,2006)。3'UTR内的多个靶位点会产生更强的下调(Doench等人,Genes Dev[基因与发育]17:438-442,2003)。

已知miRNA序列的列表可在研究组织维护的数据库中找到，这些组织如维康信托基金会桑格研究院(Wellcome Trust Sanger Institute)、宾夕法尼亚生物信息学中心(Penn Center for Bioinformatics)、斯隆凯特灵癌症中心(Memorial Sloan KetteringCancer Center)和欧洲分子生物学实验室(European Molecule Biology Laboratory)等。已知的有效的siRNA序列和同源结合位点也很好地呈现在相关文献中。通过本领域已知的技术，RNAi分子易于设计及产生。另外，有一些计算工具可以增加找到有效和特异性序列基序的机会(Lagana等人,Methods Mol.Bio.[分子生物学方法],2015,1269:393-412)。

调节性核酸可以调节基因编码的RNA的表达。因为多个基因可以彼此共有一定程度的序列同源性，所以在一些实施例中，可以将调节性核酸设计为靶向具有足够序列同源性的一类基因。在一些实施例中，调节性核酸可含有与在不同基因靶之间共享的序列互补的或特定基因靶所特有的序列。在一些实施例中，可以将调节性核酸设计为靶向在几个基因之间具有同源性的RNA序列的保守区，从而靶向基因家族中的几个基因(例如，不同的基因同工型、剪接变体、突变基因等)。在一些实施例中，可以将调节性核酸设计为靶向单一基因的特定RNA序列所特有的序列。

在一些实施例中，遗传元件可以包括一个或多个编码调节一个或多个基因表达的调节性核酸的序列。

在一个实施例中，将本文别处描述的gRNA用作CRISPR系统的一部分，用于基因编辑。出于基因编辑的目的，可以将指环载体设计为包括一个或多个与所期望的靶DNA序列相对应的引导RNA序列；参见，例如，Cong等人(2013)Science[科学],339:819-823；Ran等人(2013)Nature Protocols[自然协议],8:2281-2308。至少约16或17个核苷酸的gRNA序列通常允许发生Cas9介导的DNA切割；对于Cpf1，需要至少约16个核苷酸的gRNA序列来实现可检测的DNA切割。

治疗性效应物(例如，肽或多肽)

在一些实施例中，遗传元件包含治疗性表达序列，例如，编码治疗性肽或多肽的序列，该肽或多肽是例如细胞内肽或细胞内多肽、分泌型多肽或蛋白质替代治疗剂。在一些实施例中，遗传元件包括编码蛋白质，例如治疗性蛋白质的序列。治疗性蛋白质的一些实例可以包括但不限于激素、细胞因子、酶、抗体(例如，一种或多种编码至少重链或轻链的多肽)、转录因子、受体(例如，膜受体)、配体、膜转运蛋白、分泌型蛋白质、肽、载体蛋白、结构蛋白、核酸酶或其组分。

在一些实施例中，遗传元件包括编码肽，例如治疗性肽的序列。肽可以是直链或支链的。该肽的长度为约5至约500个氨基酸、约15至约400个氨基酸、约20至约325个氨基酸、约25至约250个氨基酸、约50至约200个氨基酸或其间的任何范围。

在一些实施例中，由治疗性表达序列编码的多肽可以是上述任一种的功能性变体或其片段，例如，与本文表中通过参考其UniProt ID披露的蛋白序列具有至少80％、85％、90％、95％、967％、98％、99％同一性的蛋白质。

在一些实施例中，治疗性表达序列可以编码结合上述任一种的抗体或抗体片段，例如，针对蛋白质的抗体，该蛋白质与本文表中通过参考其UniProt ID披露的蛋白序列具有至少80％、85％、90％、95％、967％、98％、99％同一性。本文中的术语“抗体”在最广义上使用，并且涵盖各种抗体结构，包括但不限于单克隆抗体、多克隆抗体、多特异性抗体(例如，双特异性抗体)和抗体片段，只要它们表现出所期望的抗原结合活性。“抗体片段”是指包含至少一条重链或轻链并结合抗原的分子。抗体片段的实例包括但不限于Fv、Fab、Fab'、Fab'-SH、F(ab')₂；双抗体；线性抗体；单链抗体分子(例如scFv)；以及由抗体片段形成的多特异性抗体。

示例性细胞内多肽效应物

在一些实施例中，效应物包含胞质多肽或胞质肽。在一些实施例中，包含胞质肽的效应物是DPP-4抑制剂、GLP-1信号传导激活剂或中性粒细胞弹性蛋白酶抑制剂。在一些实施例中，效应物提高生长因子或其受体(例如FGF受体，例如FGFR3)的水平或活性。在一些实施例中，效应物包括n-myc相互作用蛋白活性抑制剂(例如，n-myc相互作用蛋白抑制剂)；EGFR活性抑制剂(例如，EGFR抑制剂)；IDH1和/或IDH2活性抑制剂(例如，IDH1抑制剂和/或IDH2抑制剂)；LRP5和/或DKK2活性抑制剂(例如，LRP5和/或DKK2抑制剂)；KRAS活性抑制剂；HTT活性激活剂；或DPP-4活性抑制剂(例如，DPP-4抑制剂)。

在一些实施例中，效应物包含调节性细胞内多肽。在一些实施例中，调节性细胞内多肽结合靶细胞内源的一种或多种分子(例如，蛋白质或核酸)。在一些实施例中，调节性细胞内多肽增加靶细胞内源的一种或多种分子(例如蛋白质或核酸)的水平或活性。在一些实施例中，调节性细胞内多肽降低靶细胞内源的一种或多种分子(例如蛋白质或核酸)的水平或活性。

示例性分泌型多肽效应物

示例性的分泌型治疗剂在本文中描述，例如在下表中。

表50.示例性细胞因子和细胞因子受体

在一些实施例中，本文所述的效应物包括表50的细胞因子或其功能性变体，例如，其同源物(例如，直系同源物或旁系同源物)或片段。在一些实施例中，本文所述的效应物包括与表50中通过参考其UniProt ID列出的氨基酸序列具有至少80％、85％、90％、95％、967％、98％、99％序列同一性的蛋白质。在一些实施例中，功能性变体与相应细胞因子受体结合，在相同条件下，对于相同受体，其Kd比相应野生型细胞因子的Kd高或低不超过10％、20％、30％、40％或50％。在一些实施例中，效应物包括融合蛋白，该融合蛋白包含第一区域(例如，表50的细胞因子多肽或者其功能性变体或片段)和第二异源区域。在一些实施例中，第一区域是表50的第一细胞因子多肽。在一些实施例中，第二区域是表50的第二细胞因子多肽，其中第一和第二细胞因子多肽在野生型细胞中彼此形成细胞因子异二聚体。在一些实施例中，表50的多肽或其功能性变体包含信号序列，例如，对于效应物而言内源性的信号序列，或异源信号序列。在一些实施例中，编码表50的细胞因子或其功能性变体的指环载体用于治疗本文所述的疾病或障碍。

在一些实施例中，本文所述的效应物包含与表50的细胞因子结合的抗体分子(例如，scFv)。在一些实施例中，本文所述的效应物包含与表50的细胞因子受体结合的抗体分子(例如，scFv)。在一些实施例中，抗体分子包含信号序列。

例如，在以下文献中描述了示例性细胞因子和细胞因子受体：Akdis等人,“Interleukins(from IL-1to IL-38),interferons,transforming growth factorβ,andTNF-α:Receptors,functions,and roles in diseases[白细胞介素(从IL-1到IL-38)、干扰素、转化生长因子β和TNF-α：受体、功能和在疾病中的作用]”2016年10月第138卷,第4期,第984-1010页，其通过引用以其全文并入本文，包括其中的表I。

表51.示例性多肽激素和受体

在一些实施例中，本文所述的效应物包括表51的激素或其功能性变体，例如，其同源物(例如，直系同源物或旁系同源物)或片段。在一些实施例中，本文所述的效应物包括与表51中通过参考其UniProt ID列出的氨基酸序列具有至少80％、85％、90％、95％、967％、98％、99％序列同一性的蛋白质。在一些实施例中，功能性变体与相应受体结合，在相同条件下，对于相同受体，其Kd比相应野生型激素的Kd高不超过10％、20％、30％、40％或50％。在一些实施例中，表51的多肽或其功能性变体包含信号序列，例如，对于效应物而言具有内源性的信号序列，或异源信号序列。在一些实施例中，编码表51的激素或其功能性变体的指环载体用于治疗本文所述的疾病或障碍。

在一些实施例中，本文所述的效应物包含与表51的激素结合的抗体分子(例如，scFv)。在一些实施例中，本文所述的效应物包含与表51的激素受体结合的抗体分子(例如，scFv)。在一些实施例中，抗体分子包含信号序列。

表52.示例性生长因子

在一些实施例中，本文所述的效应物包括表52的生长因子或其功能性变体，例如，其同源物(例如，直系同源物或旁系同源物)或片段。在一些实施例中，本文所述的效应物包括与表52中通过参考其UniProt ID列出的氨基酸序列具有至少80％、85％、90％、95％、967％、98％、99％序列同一性的蛋白质。在一些实施例中，功能性变体与相应受体结合，在相同条件下，对于相同受体，其Kd比相应野生型生长因子的Kd高不超过10％、20％、30％、40％或50％。在一些实施例中，表52的多肽或其功能性变体包含信号序列，例如，对于效应物而言具有内源性的信号序列，或异源信号序列。在一些实施例中，编码表52的生长因子或其功能性变体的指环载体用于治疗本文所述的疾病或障碍。

在一些实施例中，本文所述的效应物包含与表52的生长因子结合的抗体分子(例如，scFv)。在一些实施例中，本文所述的效应物包含与表52的生长因子受体结合的抗体分子(例如，scFv)。在一些实施例中，抗体分子包含信号序列。

在以下文献中描述了示例性的生长因子和生长因子受体：例如，Bafico等人,“Classification of Growth Factors and Their Receptors[生长因子及其受体的分类]”Holland-Frei Cancer Medicine.[荷兰弗雷癌症医学]第6版，其通过引用以其全文并入本文。

表53.凝血相关因子

在一些实施例中，本文所述的效应物包括表53的多肽或其功能性变体，例如其同源物(例如，直系同源物或旁系同源物)或片段。在一些实施例中，本文所述的效应物包括与表53中通过参考其UniProt ID列出的氨基酸序列具有至少80％、85％、90％、95％、967％、98％、99％序列同一性的蛋白质。在一些实施例中，功能性变体催化与相应野生型蛋白质相同的反应，例如，催化速率比野生型蛋白低不少于10％、20％、30％、40％或50％。在一些实施例中，表53的多肽或其功能性变体包含信号序列，例如，对于效应物而言具有内源性的信号序列，或异源信号序列。在一些实施例中，编码表53的多肽或其功能性变体的指环载体用于治疗表53的疾病或障碍。

示例性蛋白质替代治疗剂

本文例如在下表中描述了示例性蛋白质替代治疗剂。

表54.示例性酶促效应物和相应适应症

在一些实施例中，本文所述的效应物包括表54的酶或其功能性变体，例如其同源物(例如，直系同源物或旁系同源物)或片段。在一些实施例中，本文所述的效应物包括与表54中通过参考其UniProt ID列出的氨基酸序列具有至少80％、85％、90％、95％、967％、98％、99％序列同一性的蛋白质。在一些实施例中，功能性变体催化与相应野生型蛋白质相同的反应，例如，催化速率比野生型蛋白低不少于10％、20％、30％、40％或50％。在一些实施例中，编码表54的酶或其功能性变体的指环载体用于治疗表54的疾病或障碍。在一些实施例中，指环载体用于将尿苷二磷酸葡糖醛酸转移酶或其功能变体递送至靶细胞，例如肝细胞。在一些实施例中，指环载体用于将OCA1或其功能变体递送至靶细胞，例如视网膜细胞。

表55.示例性非酶效应物和相应适应症

在一些实施例中，本文所述的效应物包括促红细胞生成素(EPO)，例如人促红细胞生成素(hEPO)或其功能性变体。在一些实施例中，编码促红细胞生成素或其功能性变体的指环载体用于刺激红细胞生成。在一些实施例中，编码促红细胞生成素或其功能性变体的指环载体用于治疗疾病或障碍，例如贫血。在一些实施例中，使用指环载体将EPO或其功能性变体递送至靶细胞，例如红细胞。

在一些实施例中，本文所述的效应物包括表55的多肽或其功能性变体，例如其同源物(例如，直系同源物或旁系同源物)或片段。在一些实施例中，本文所述的效应物包括与表55中通过参考其UniProt ID列出的氨基酸序列具有至少80％、85％、90％、95％、967％、98％、99％序列同一性的蛋白质。在一些实施例中，编码表55的多肽或其功能性变体的指环载体用于治疗表55的疾病或障碍。在一些实施例中，指环载体用于将SMN或其功能性变体递送至靶细胞，例如，脊髓和/或运动神经元的细胞。在一些实施例中，使用指环载体将微小抗肌萎缩蛋白递送至靶细胞，例如，肌细胞。

在以下文献中描述了示例性微小抗肌萎缩蛋白：Duan,“Systemic AAV Micro-dystrophin Gene Therapy for Duchenne Muscular Dystrophy[杜兴氏肌肉萎缩症的全身性AAV微小抗肌萎缩蛋白基因治疗]”Mol Ther.[分子治疗]2018年10月3日；26(10):2337-2356.doi:10.1016/j.ymthe.2018.07.011.电子出版于2018年7月17日。

在一些实施例中，本文所述的效应物包含凝血因子，例如本文表54或表55中所列的凝血因子。在一些实施例中，本文所述的效应物包括蛋白质，该蛋白质在发生突变时会导致溶酶体贮积症，例如本文表54或表55中列出的蛋白质。在一些实施例中，本文所述的效应物包括转运蛋白，例如本文表55中所列的转运蛋白。

在一些实施例中，野生型蛋白的功能性变体包括具有野生型蛋白的一种或多种活性的蛋白质，例如，功能性变体催化与相应野生型蛋白相同的反应，例如，其催化速率比野生型蛋白低不少于10％、20％、30％、40％或50％。在一些实施例中，功能性变体与野生型蛋白结合的相同结合配偶体结合，例如，在相同条件下，对于相同的结合配偶体，其Kd比相应野生型蛋白的Kd高不超过10％、20％、30％、40％或50％。在一些实施例中，功能性变体具有与野生型多肽的多肽序列存在至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％同一性的多肽序列。在一些实施例中，功能性变体包括相应野生型蛋白的同源物(例如直系同源物或旁系同源物)。在一些实施例中，功能性变体是融合蛋白。在一些实施例中，融合体包含与相应野生型蛋白具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％同一性的第一区域，和第二异源区域。在一些实施例中，功能性变体包含相应野生型蛋白的片段或由其组成。

再生因子、修复因子和纤维化因子

本文所述的治疗性多肽还包括生长因子(例如，如在表56中所披露的)或者其功能性变体，例如，与表56中通过参考其UniProt ID所披露的蛋白序列具有至少80％、85％、90％、95％、967％、98％、99％同一性的蛋白质。还包括针对这样的生长因子的抗体或其片段，或者促进再生及修复的miRNA。

表56.示例性再生因子、修复因子和纤维化因子

转化因子

本文所述的治疗性多肽还包括转化因子，例如，将成纤维细胞转化为分化细胞的蛋白质因子，例如，表57中披露的因子或其功能性变体，例如，与表57中通过参考其UniProtID所披露的蛋白序列具有至少80％、85％、90％、95％、967％、98％、99％同一性的蛋白质。

表57.示例性转化因子

刺激细胞再生的蛋白质

本文所述的治疗性多肽还包括刺激细胞再生的蛋白质，例如，表58中披露的蛋白质或其功能性变体，例如，与表58中通过参考其UniProt ID所披露的蛋白序列具有至少80％、85％、90％、95％、967％、98％、99％同一性的蛋白质。

表58.示例性的刺激细胞再生的蛋白质

STING调节效应物

在一些实施例中，本文所述的分泌型效应物调节STING/cGAS信号传导。在一些实施例中，STING调节剂是多肽，例如病毒多肽或其功能性变体。例如，效应物可以包括在以下文献中描述的STING调节剂(例如，抑制剂)：Maringer等人,“Message in a bottle:lessons learned from antagonism of STING signalling during RNA virusinfection[瓶中的信息：从RNA病毒感染期间STING信号传导的拮抗作用中吸取的教训]”Cytokine&Growth Factor Reviews[细胞因子与生长因子综述]第25卷,第6期,2014年12月,第669-679页，其通过引用以其全文并入本文。在以下文献中描述了其他STING调节剂(例如，激活剂)：例如，Wang等人“STING activator c-di-GMP enhances the anti-tumoreffects of peptide vaccines in melanoma-bearing mice[STING激活剂c-di-GMP在荷黑色素瘤小鼠中增强肽疫苗的抗肿瘤作用]”Cancer Immunol Immunother.[癌症免疫学与免疫治疗]2015年8月；64(8):1057-66.doi:10.1007/s00262-015-1713-5.电子出版于2015年5月19日；Bose“cGAS/STING Pathway in Cancer:Jekyll and Hyde Story of CancerImmune Response[癌症中的cGAS/STING通路：癌症免疫应答的双重人格故事]”Int J MolSci.[国际分子科学杂志]2017年11月；18(11):2456；和Fu等人“STING agonistformulated cancer vaccines can cure established tumors resistant to PD-1blockade[STING激动剂配制的癌症疫苗可治愈对PD-1阻断有抗性的既定肿瘤]”SciTransl Med.[科学转化医学]2015年4月15日；7(283):283ra52，其各自通过引用以其全文并入本文。

肽的一些实例包括但不限于荧光标签或标志、抗原、肽治疗剂、天然生物活性肽的合成肽或肽类似物、激动肽或拮抗肽、抗微生物肽、靶向肽或细胞毒性肽、降解肽或自毁肽、以及多种降解肽或自毁肽。本文所述的可用于本发明的肽还包括抗原结合肽，例如抗原结合抗体或抗体样片段，例如单链抗体、纳米抗体(参见，例如，Steeland等人2016.Nanobodies as therapeutics:big opportunities for small antibodies[纳米抗体作为治疗剂：小抗体的巨大机遇].Drug Discov Today[当代药物发现]:21(7):1076-113)。这样的抗原结合肽可以结合细胞质抗原、核抗原或细胞器内抗原。

在一些实施例中，遗传元件包含编码小肽、肽模拟物(例如类肽)、氨基酸和氨基酸类似物的序列。这样的治疗剂通常具有小于约5,000克/摩尔的分子量、小于约2,000克/摩尔的分子量、小于约1,000克/摩尔的分子量、小于约500克/摩尔的分子量以及这样的化合物的盐类、酯类和其他药学上可接受的形式。这样的治疗剂可以包括但不限于神经递质、激素、药物、毒素、病毒或微生物颗粒、合成分子及其激动剂或拮抗剂。

在一些实施例中，本文所述的组合物或指环载体包括与能够靶向特定位置、组织或细胞的配体连接的多肽。

基因编辑组分

指环载体的遗传元件可以包括一个或多个编码基因编辑系统的组分的基因。示例性的基因编辑系统包括成簇规律间隔短回文重复序列(CRISPR)系统、锌指核酸酶(ZFN)和转录激活子样效应物核酸酶(TALEN)。在以下文献中描述了基于ZFN、TALEN和CRISPR的方法：例如，Gaj等人Trends Biotechnol.[生物技术趋势]31.7(2013):397-405；在以下文献中描述了基因编辑的CRISPR方法，例如，Guan等人,Application of CRISPR-Cas systemingene therapy:Pre-clinical progress in animal model.[CRISPR-Cas系统在基因治疗中的应用：动物模型的临床前进展]DNA Repair[DNA修复]2016年10月；46:1-8.doi:10.1016/j.dnarep.2016.07.004；Zheng等人,Precise gene deletion and replacementusing the CRISPR/Cas9 systemin human cells.[在人类细胞中使用CRISPR/Cas9系统进行精确的基因缺失和替换]BioTechniques[生物技术],第57卷,第3期,2014年9月,第115-124页。

CRISPR系统是最初在细菌和古细菌中发现的自适应防御系统。CRISPR系统使用称为CRISPR相关或“Cas”核酸内切酶的RNA引导性核酸酶(例如，Cas9或Cpf1)来切割外来DNA。在典型的CRISPR/Cas系统中，核酸内切酶通过靶向单链或双链DNA序列的序列特异性、非编码“引导RNA”定向到靶核苷酸序列(例如，基因组中要进行序列编辑的位点)。已经鉴定了三类(I-III)CRISPR系统。II类CRISPR系统使用单个Cas核酸内切酶(而不是多个Cas蛋白)。一种II类CRISPR系统包括II型Cas核酸内切酶，例如Cas9、CRISPR RNA(“crRNA”)和反式激活crRNA(“tracrRNA”)。crRNA含有“引导RNA”，即通常对应于靶DNA序列的约20个核苷酸的RNA序列。crRNA还含有与tracrRNA结合的区域，以形成被RNA酶III切割的部分双链结构，产生crRNA/tracrRNA杂合体。然后，crRNA/tracrRNA杂合体指导Cas9核酸内切酶识别并切割靶DNA序列。靶DNA序列通常必须邻近针对给定Cas核酸内切酶而言具有特异性的“前间隔序列邻近基序”(“PAM”)；然而，PAM序列似乎遍布整个给定基因组。

在一些实施例中，指环载体包括CRISPR核酸内切酶的基因。例如，从不同原核物种中鉴定出的一些CRISPR核酸内切酶具有独特的PAM序列要求；PAM序列的实例包括5'-NGG(酿脓链球菌(Streptococcus pyogenes))、5’-NNAGAA(嗜热链球菌(Streptococcusthermophilus)CRISPR1)、5’-NGGNG(嗜热链球菌CRISPR3)和5’-NNNGATT(奈瑟氏脑膜炎双球菌(Neisseria meningiditis))。一些核酸内切酶例如Cas9核酸内切酶与富含G的PAM位点例如5'-NGG有关，并在距PAM位点上游(5')3个核苷酸处对靶DNA进行平末端切割。另一II类CRISPR系统包括V型核酸内切酶Cpf1，其小于Cas9；实例包括AsCpf1(来自氨基酸球菌属物种(Acidaminococcussp.))和LbCpf1(来自毛螺旋菌属物种(Lachnospiraceae sp.))。Cpf1核酸内切酶与富含T的PAM位点例如5'-TTN相关。Cpf1也可以识别5'-CTA PAM基序。Cpf1通过引入具有4或5个核苷酸的5'突出端的错位或交错的双链断裂来切割靶DNA，例如切割如下靶DNA，该靶DNA中的5个核苷酸的错位或交错的切割位于距离编码链上的PAM位点下游(3’)18个核苷酸的位置处和距离互补链上的PAM位点下游23个核苷酸的位置处；由这样的错位裂解产生的5个核苷酸突出端使得通过同源重组的DNA插入比在平末端切割的DNA的插入更精确地进行基因组编辑。参见，例如，Zetsche等人(2015)Cell[细胞],163:759-771。

在指环载体中可以包括多种CRISPR相关(Cas)基因。基因的具体实例是那些编码来自II类系统的Cas蛋白(包括Cas1、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cpf1、C2C1或C2C3)的基因。在一些实施例中，指环载体包括编码Cas蛋白例如Cas9蛋白的基因，该Cas蛋白可以来自多种原核物种中的任一种。在一些实施例中，指环载体包括编码特定Cas蛋白例如特定Cas9蛋白的基因，选择该Cas蛋白以识别特定的前间隔序列邻近基序(PAM)序列。在一些实施例中，指环载体包括编码两种或更多种不同Cas蛋白的核酸，或者可以将两种或更多种Cas蛋白引入细胞、受精卵、胚胎或动物中，例如，以允许识别和修饰包含相同、相似或不同PAM基序的位点。在一些实施例中，指环载体包括编码具有失活核酸酶(例如，核酸酶缺损型Cas9)的修饰型Cas蛋白的基因。

尽管野生型Cas9蛋白在由gRNA靶向的特定DNA序列处产生双链断裂(DSB)，但已知许多具有改进功能的CRISPR核酸内切酶，例如：“切口酶”形式的Cas核酸内切酶(例如Cas9)仅产生单链断裂；无催化活性的Cas核酸内切酶，例如Cas9(“dCas9”)不切割靶DNA。可以将编码dCas9的基因与编码效应物结构域的基因融合，以抑制(CRISPRi)或激活(CRISPRa)靶基因的表达。例如，该基因可以编码Cas9与转录沉默子(例如KRAB结构域)或转录激活子的融合体(例如dCas9-VP64融合体)。可以包括编码与FokI核酸酶(“dCas9-FokI”)融合的无催化活性的Cas9(dCas9)的基因，以在与两个gRNA同源的靶序列处产生DSB。参见，例如，许多CRISPR/Cas9质粒在阿德基因资源库(Addgene repository)中披露并可公开获得(阿德基因组织，美国马萨诸塞州剑桥市西德尼大街75号550A室，邮政编码02139(Addgene,75Sidney St.,Suite 550A,Cambridge,MA 02139)；addgene.org/crispr/)。Ran等人(2013)Cell[细胞],154:1380-1389将引入两个独立的双链断裂(每个断裂被独立的引导RNA来指导)的“双切口酶”Cas9描述为实现了更准确的基因组编辑。

在美国专利申请公开2016/0138008A1和US2015/0344912 A1以及美国专利8,697,359、8,771,945、8,945,839、8,999,641、8,993,233、8,895,308、8,865,406、8,889,418、8,871,445、8,889,356、8,932,814、8,795,965和8,906,616中披露了用于编辑真核生物基因的CRISPR技术。在美国专利申请公开2016/0208243A1中披露了Cpf1核酸内切酶和相应的引导RNA和PAM位点。

在一些实施例中，指环载体包含编码本文所述多肽(例如，靶向核酸酶，例如，Cas9，例如，野生型Cas9、切口酶型Cas9(例如Cas9 D10A)、催化失活Cas9(dCas9)、eSpCas9、Cpf1、C2C1或C2C3)和gRNA的基因。编码核酸酶和一种或多种gRNA的基因的选择取决于靶向突变是否是核苷酸的缺失、置换或添加，例如，对靶向序列的核苷酸的缺失、置换或添加。编码与(一个或多个)效应物结构域(例如VP64)的全部或一部分(例如，其具有生物活性部分)相连的无催化活性的核酸内切酶(例如，催化失活Cas9(dCas9，例如D10A；H840A))的基因会产生可调节一个或多个靶核酸序列的活性和/或表达的嵌合蛋白。

在一些实施例中，指环载体包括编码dCas9与一个或多个效应物结构域的全部或一部分(例如，全长野生型效应物结构域，或者其片段或变体，例如，其具有生物活性部分)的融合体的基因，以产生可用于本文所述方法的嵌合蛋白。因此，在一些实施例中，指环载体包括编码dCas9-甲基化酶融合体的基因。在其他一些实施例中，指环载体包括编码dCas9酶与位点特异性gRNA的融合体的基因，以靶向内源基因。

在其他方面，指环载体包括编码1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个与dCas9融合的效应物结构域(全部或具有生物活性部分)的基因。

调节性序列

在一些实施例中，遗传元件包含与编码效应物的序列可操作地连接的调节性序列，例如启动子或增强子。在一些实施例中，例如，其中遗传元件是mRNA，启动子可以不存在于遗传元件中。在一些实施例中，遗传元件构建体包括用于驱动RNA遗传元件产生的启动子。

在一些实施例中，启动子包括与编码表达产物的DNA序列相邻的DNA序列。启动子可以可操作地连接至相邻的DNA序列。与不存在启动子时表达的产物的量相比，启动子通常增加DNA序列表达的产物的量。来自一种生物体的启动子可用于增强来自另一生物体的DNA序列的产物表达。例如，脊椎动物启动子可用于在脊椎动物中表达水母GFP。因此，一种启动子元件可以增强一种或多种产物的表达。多个启动子元件是本领域普通技术人员众所周知的。

在一个实施例中，期望高水平的组成型表达。这样的启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)长末端重复(LTR)启动子/增强子、巨细胞病毒(CMV)立即早期启动子/增强子(参见，例如，Boshart等人,Cell[细胞],41:521-530(1985))、SV40启动子、二氢叶酸还原酶启动子、细胞质β-肌动蛋白启动子和磷酸甘油激酶(PGK)启动子。

在另一个实施例中，可能期望诱导型启动子。诱导型启动子是由外源添加的化合物调节的启动子，例如，以顺式或反式提供的启动子，包括但不限于锌诱导型绵羊金属硫蛋白(MT)启动子；地塞米松(Dex)诱导型小鼠乳腺瘤病毒(MMTV)启动子；T7聚合酶启动子系统(WO 98/10088)；四环素阻遏系统(Gossen等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],89:5547-5551(1992))；四环素诱导系统(Gossen等人,Science[科学],268:1766-1769(1995)；还参见Harvey等人,Curr.Opin.Chem.Biol.[化学生物学的当前观点],2:512-518(1998))；RU486诱导系统(Wang等人,Nat.Biotech.[自然生物技术],15:239-243(1997)和Wang等人,Gene Ther.[基因治疗],4:432-441(1997))；和雷帕霉素诱导系统(Magari等人,J.Clin.Invest.[临床研究杂志],100:2865-2872(1997)；Rivera等人,Nat.Medicine.[自然医学]2:1028-1032(1996))。可在这种情况下使用的其他类型的诱导型启动子是那些由特定的生理状态(例如温度、急性期或仅在复制细胞中)调节的启动子。

在一些实施例中，使用感兴趣基因或核酸序列的天然启动子。当期望基因或核酸序列的表达应模拟天然表达时，可以使用天然启动子。当基因或其他核酸序列的表达必须在时间或发育上，或者以组织特异性方式或响应于特定转录刺激而受到调节时，可以使用天然启动子。在另外的实施例中，也可以使用其他天然表达控制元件，如增强子元件、多腺苷酸化位点或Kozak共有序列来模拟天然表达。

在一些实施例中，遗传元件包含可操作地连接至组织特异性启动子的基因。例如，如果需要在骨骼肌中表达，则可以使用在肌肉中有活性的启动子。这些包括来自编码骨骼肌α-肌动蛋白、肌球蛋白轻链2A、抗肌萎缩蛋白、肌肉型肌酸激酶的基因的启动子，以及活性高于天然存在启动子的合成肌肉启动子。参见Li等人,Nat.Biotech.[自然-生物技术],17:241-245(1999)。已知具有组织特异性的启动子的实例如下所示：肝白蛋白，Miyatake等人J.Virol.[病毒学杂志],71:5124-32(1997)；乙型肝炎病毒核心启动子，Sandig等人,Gene Ther[基因治疗].3:1002-9(1996)；甲胎蛋白(AFP)，Arbuthnot等人,Hum.Gene Ther[人类基因治疗].,7:1503-14(1996)，骨(骨钙素，Stein等人,Mol.Biol.Rep[分子生物学报告].,24:185-96(1997)；骨唾液酸蛋白，Chen等人,J.Bone Miner.Res.[骨与矿物质研究杂志]11:654-64(1996))，淋巴细胞(CD2，Hansal等人,J.Immunol.[免疫学杂志],161:1063-8(1998)；免疫球蛋白重链；T细胞受体a链)，神经元(神经元特异性烯醇化酶(NSE)启动子，Andersen等人Cell.Mol.Neurobiol.[细胞与分子神经生物杂志],13:503-15(1993)；神经丝轻链基因，Piccioli等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],88:5611-5(1991)；神经元特异性vgf基因，Piccioli等人,Neuron[神经元],15:373-84(1995))；等等。

遗传元件构建体可包括增强子，例如与编码基因的DNA序列相邻的DNA序列。增强子元件通常位于启动子元件的上游，或者可以位于编码DNA序列(例如，转录或翻译成一种或多种产物的DNA序列)的下游或之内。因此，增强子元件可位于编码产物的DNA序列上游或下游的100个碱基对、200个碱基对或300个或更多个碱基对。增强子元件可以增加DNA序列表达的重组产物的量，超出由启动子元件提供的增加的表达。对于本领域普通技术人员而言，多个增强子元件是容易获得的。

在一些实施例中，遗传元件包括位于编码本文所述的表达产物的序列侧翼的一个或多个反向末端重复序列(ITR)。在一些实施例中，遗传元件包含位于编码本文所述的表达产物的序列侧翼的一个或多个长末端重复序列(LTR)。可以使用的启动子序列的实例包括但不限于猿猴病毒40(SV40)早期启动子、小鼠乳腺瘤病毒(MMTV)、人类免疫缺陷病毒(HIV)长末端重复序列(LTR)启动子、MoMuLV启动子、禽白血病病毒启动子、EB病毒(Epstein-Barrvirus)立即早期启动子和劳斯肉瘤病毒启动子。

其他序列

在一些实施例中，遗传元件进一步包括编码产物(例如核酶、编码蛋白质的治疗性mRNA、外源性基因)的核酸。

在一些实施例中，遗传元件包括一个或多个影响指环载体在宿主或宿主细胞中以下功能的序列：物种和/或组织和/或细胞嗜性(例如，衣壳蛋白序列)、感染性(例如，衣壳蛋白序列)、免疫抑制/激活(例如，调节性核酸)、病毒基因组结合和/或包装、免疫逃逸(非免疫原性和/或耐受性)、药代动力学、胞吞作用和/或细胞附着、核进入、细胞内调节和定位、胞吐作用调节、增殖和核酸保护。

在一些实施例中，遗传元件可以包含其他序列，其包括DNA、RNA或人工核酸。其他序列可包括但不限于基因组DNA，cDNA或编码tRNA、mRNA、rRNA、miRNA、gRNA、siRNA或其他RNAi分子的序列。在一个实施例中，遗传元件包括编码siRNA的序列，以靶向与调节性核酸相同的基因表达产物的不同基因座。在一个实施例中，遗传元件包括编码siRNA的序列，以靶向与调节性核酸不同的基因表达产物。

在一些实施例中，遗传元件进一步包括以下序列中的一个或多个：编码一个或多个miRNA的序列、编码一种或多种复制蛋白的序列、编码外源性基因的序列、编码治疗剂的序列、调节性序列(例如，启动子、增强子)、编码一个或多个靶向内源性基因(siRNA、lncRNA、shRNA)的调节性序列的序列和编码治疗性mRNA或蛋白的序列。

其他序列的长度可为约2nt至约5000nt、约10nt至约100nt、约50nt至约150nt、约100nt至约200nt、约150nt至约250nt、约200至约300nt、约250nt至约350nt、约300nt至约500nt、约10nt至约1000nt、约50nt至约1000nt、约100nt至约1000nt、约1000nt至约2000nt、约2000nt至约3000nt、约3000nt至约4000nt、约4000nt至约5000nt或其间的任何范围。

编码的基因

例如，遗传元件可以包括与信号传导生化通路相关的基因，例如与信号传导生化通路相关的基因或多核苷酸。实例包括与疾病相关的基因或多核苷酸。“与疾病相关的”基因或多核苷酸是指与非疾病对照的组织或细胞相比，在患病组织衍生的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因或多核苷酸。它可能是会以异常高水平表达的基因；它可能是会以异常低水平表达的基因，其中表达的改变与疾病的发生和/或进展相关。疾病相关基因也指具有一个或多个突变或遗传变异的基因，这些突变或遗传变异直接导致疾病病因或与导致疾病病因的一个或多个基因连锁不平衡。

与疾病相关的基因和多核苷酸的实例可得自约翰·霍普金斯大学的麦考斯克-纳森斯遗传医学研究所(马里兰州巴尔的摩)(McKusick-Nathans Institute of GeneticMedicine,Johns Hopkins University(Baltimore,Md.))和国家医学图书馆的国家生物技术信息中心(马里兰州贝塞斯达)(National Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.))。与疾病相关的基因和多核苷酸的实例列于美国专利号：8,697,359的表A和B中，其通过引用以其全文并入本文。特定疾病信息可获自约翰·霍普金斯大学的麦考斯克-纳森斯遗传医学研究所(马里兰州巴尔的摩)(McKusick-Nathans Institute of Genetic Medicine,Johns Hopkins University(Baltimore,Md.))和国家医学图书馆的国家生物技术信息中心(马里兰州贝塞斯达)(National Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.))。与信号传导生化途径相关的基因和多核苷酸的实例列于美国专利号：8,697,359的表A-C中，其通过引用以其全文并入本文。

此外，如本文其他地方所述，遗传元件可以编码靶向部分。这可以例如通过插入编码糖、糖脂或蛋白质例如抗体的多核苷酸来实现。本领域技术人员知道用于生成靶向部分的其他方法。

病毒序列

在一些实施例中，遗传元件包含至少一个病毒序列。在一些实施例中，该序列与来自单链DNA病毒，例如指环病毒、比那病毒(Bidnavirus)、圆环病毒(Circovirus)、双生病毒、基诺病毒(Genomovirus)、丝状病毒、微小病毒、矮化病毒、细小病毒和斯派拉病毒(Spiravirus)的一个或多个序列具有同源性或同一性。在一些实施例中，该序列与来自双链DNA病毒，例如腺病毒、瓶状病毒、囊泡病毒、非洲猪瘟病毒、杆状病毒、微小纺锤形噬菌体、球状病毒、滴状病毒、唾液腺肥大病病毒、疱疹病毒、虹彩病毒、脂毛病毒、线头病毒和痘病毒的一个或多个序列具有同源性或同一性。在一些实施例中，序列与来自RNA病毒，例如甲病毒、真菌传杆状病毒、肝炎病毒、大麦病毒、烟草花叶病毒、烟草脆裂病毒、三角病毒(Tricornavirus)、风疹病毒、双RNA病毒、囊状病毒、分体病毒和呼肠病毒的一个或多个序列具有同源性或同一性。

在一些实施例中，遗传元件可包含来自非致病性病毒，例如共生病毒(symbioticvirus)，例如共栖病毒(commensal virus)，例如天然病毒，例如指环病毒的一个或多个序列。最近命名法的变化已将三种能够感染人类细胞的指环病毒划分为指环病毒科病毒的甲型细环病毒(TT)、乙型细环病毒(TTM)和丙型细环病毒(TTMD)属。在一些实施例中，遗传元件可以包含与细环病毒(TT)具有同源性或同一性的序列，该细环病毒(TT)是具有环状反义基因组的非包膜单链DNA病毒。在一些实施例中，遗传元件可包含与SEN病毒、岗哨病毒(Sentinel virus)、小TTV样病毒和TT病毒具有同源性或同一性的序列。已经描述了不同类型的TT病毒，包括TT病毒基因型6、TT病毒群、TTV样病毒DXL1和TTV样病毒DXL2。在一些实施例中，遗传元件可包含与较小病毒，即小细环样病毒(TTM)或基因组大小在TTV和TTMV之间的第三病毒(称为中细环样病毒(TTMD))具有同源性或同一性的序列。在一些实施例中，遗传元件可包含与本文所述核苷酸序列中任一个具有至少约60％、70％、80％、85％、90％、95％、96％、97％、98％和99％核苷酸序列同一性的来自非致病性病毒的一个或多个序列或序列的片段。

在一些实施例中，遗传元件可包含与本文所述例如表41中核苷酸序列中任一个具有至少约60％、70％、80％、85％、90％、95％、96％、97％、98％和99％核苷酸序列同一性的来自基本上非致病性病毒的一个或多个序列或序列的片段。

表41：指环病毒及其序列的实例。登录号和相关序列信息可在www.ncbi.nlm.nih.gov/genbank/上获得，以2018年12月11日作为参考。

在一些实施例中，遗传元件包含与来自一种或多种非指环病毒，例如腺病毒、疱疹病毒、pox病毒、痘苗病毒、SV40、乳头瘤病毒、RNA病毒(例如逆转录病毒、例如慢病毒)、单链RNA病毒(例如肝炎病毒)或双链RNA病毒(例如轮状病毒)的一个或多个序列具有同源性或同一性的一个或多个序列。在一些实施例中，由于重组逆转录病毒是有缺陷的，因此可以提供协助以产生感染性颗粒。可以提供这样的协助，例如，通过使用含有质粒的辅助细胞系，这些质粒编码在LTR内调节性序列的控制下的逆转录病毒的所有结构基因。用于复制本文所述的指环载体的合适细胞系包括本领域已知的细胞系，例如A549细胞，其可以如本文所述进行修饰。所述遗传元件可以另外含有编码选择性标志的基因，以便可以鉴定所期望的遗传元件。

在一些实施例中，遗传元件包括非沉默突变，例如导致编码的多肽中氨基酸差异的碱基置换、缺失或添加，只要序列与由第一核苷酸序列编码的多肽保持至少约70％、75％、80％、85％、90％、95％、96％、97％、98％或99％同一性或以其他方式可用于实施本发明。在这方面，可以进行某些保守性氨基酸置换，通常认为这些置换不会使蛋白质的整体功能失活：例如对于带正电的氨基酸(反之亦然)，赖氨酸、精氨酸和组氨酸；对于带负电的氨基酸(反之亦然)，天冬氨酸和谷氨酸；对于某些电中性氨基酸的组(在所有情况下，反之亦然)，(1)丙氨酸和丝氨酸，(2)天冬酰胺、谷氨酰胺和组氨酸，(3)半胱氨酸和丝氨酸，(4)甘氨酸和脯氨酸，(5)异亮氨酸、亮氨酸和缬氨酸，(6)蛋氨酸、亮氨酸和异亮氨酸，(7)苯丙氨酸、蛋氨酸、亮氨酸和酪氨酸，(8)丝氨酸和苏氨酸，(9)色氨酸和酪氨酸，(10)以及例如酪氨酸、色氨酸和苯丙氨酸。氨基酸可以根据物理特性以及对二级和三级蛋白质结构的贡献进行分类。保守性置换在本领域中被认为是一个氨基酸被具有相似特性的另一氨基酸置换。

具有相同或指定百分比的相同核苷酸或氨基酸残基的两个或更多个核酸或多肽序列的同一性(例如，当在比较窗口或指定区域内进行最大对应性比较和对齐时，在具体区域内约60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高同一性)可使用带有以下所述默认参数的BLAST或BLAST 2.0序列比较算法，或通过人工比对和目视检查(例如，参见NCBI网站www.ncbi.nlm.nih.gov/BLAST/或类似网站)进行测量。同一性也可以指或可以应用于测试序列的互补序列。同一性还包括具有缺失和/或添加的序列以及具有置换的序列。如本文所述，算法考虑了空位和类似情况。同一性可以在长度为至少约10个氨基酸或核苷酸、长度为约15个氨基酸或核苷酸、长度为约20个氨基酸或核苷酸、长度为约25个氨基酸或核苷酸、长度为约30个氨基酸或核苷酸、长度为约35个氨基酸或核苷酸、长度为约40个氨基酸或核苷酸、长度为约45个氨基酸或核苷酸、长度为约50个氨基酸或核苷酸、或更多的区域中存在。由于遗传密码是简并的，因此同源核苷酸序列可包括任何数目的“沉默”碱基改变，即仍然编码相同氨基酸的核苷酸置换。

蛋白质外壳

在一些实施例中，指环载体，例如合成指环载体包含包封遗传元件的蛋白质外壳。蛋白质外壳可以包含基本上非致病性外壳蛋白，其不能在哺乳动物中引发不必要的免疫应答。指环载体的蛋白质外壳通常包含基本上非致病性蛋白质，其可自组装成构成蛋白质外壳的二十面体构造。

在一些实施例中，蛋白质外壳蛋白质由指环载体的遗传元件的序列编码(例如，与遗传元件顺式)。在其他实施例中，蛋白质外壳蛋白质由独立于指环载体的遗传元件的核酸编码(例如，与遗传元件反式)。

在一些实施例中，蛋白质(例如基本上非致病性蛋白质和/或蛋白质外壳蛋白质)包含一个或多个糖基化氨基酸，例如2、3、4、5、6、7、8、9、10或更多个糖基化氨基酸。

在一些实施例中，蛋白质(例如基本上非致病性蛋白质和/或蛋白质外壳蛋白质)包含至少一个亲水性DNA结合区、精氨酸富集区、苏氨酸富集区、谷氨酰胺富集区、N-末端聚精氨酸序列、可变区、C-末端聚谷氨酰胺/谷氨酸序列和一个或多个二硫键。

在一些实施例中，蛋白质是衣壳蛋白，例如，具有与由编码本文所述的衣壳蛋白(例如，指环病毒ORF1分子和/或衣壳蛋白序列，例如，如本文所述)的任一核苷酸序列编码的蛋白质存在至少约60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列。在一些实施例中，蛋白质或衣壳蛋白的功能性片段由与指环病毒ORF1核酸(例如，如本文所述)具有至少约60％、70％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的核苷酸序列编码。

在一些实施例中，指环载体包含编码衣壳蛋白或衣壳蛋白的功能性片段或与如本文所述的指环病毒ORF1分子具有至少约60％、70％、80％、85％、90％、95％、96％、97％、98％、99％或100％序列同一性的序列的核苷酸序列。

在一些实施例中，序列同一性较低的氨基酸范围可以提供一种或多种本文所述的特性以及细胞/组织/物种特异性(例如，嗜性)的差异。

在一些实施例中，指环载体在蛋白质外壳中缺乏脂质。在一些实施例中，指环载体缺少脂质双层，例如病毒包膜。在一些实施例中，指环载体的内部完全由蛋白质外壳所覆盖(例如，100％覆盖率)。在一些实施例中，指环载体的内部低于100％由蛋白质外壳所覆盖，例如，95％、90％、85％、80％、70％、60％、50％或更低的覆盖率。在一些实施例中，蛋白质外壳包含缺口或间断，例如，允许对水、离子、肽或小分子具有渗透性，只要遗传元件还保留在指环载体中。

在一些实施例中，蛋白质外壳包含特异性识别和/或结合宿主细胞例如互补蛋白或多肽以介导遗传元件进入宿主细胞的一种或多种蛋白质或多肽。

在一些实施例中，蛋白质外壳包括以下中的一种或多种：例如ORF1分子(例如，如本文所述)的精氨酸富集区、胶冻卷区域、N22结构域、高变区和/或C-末端结构域。在一些实施例中，蛋白质外壳包括以下中的一种或多种：一种或多种糖基化蛋白、亲水性DNA结合区、精氨酸富集区、苏氨酸富集区、谷氨酰胺富集区、N-末端聚精氨酸序列、可变区、C-末端聚谷氨酰胺/谷氨酸序列、以及一个或多个二硫键。例如，蛋白质外壳包含由指环病毒ORF1核酸(例如，如本文所述)编码的蛋白质。

在一些实施例中，蛋白质外壳包括以下特征中的一种或多种：二十面体对称、识别和/或结合与一种或多种宿主细胞分子相互作用以介导进入宿主细胞的分子、缺乏脂质分子、缺乏碳水化合物、具有pH和温度稳定性、耐去垢剂、以及在宿主中基本上具有非免疫原性或非致病性。

III.使用方法

本文所述的指环载体和包含指环载体的组合物可用于例如在有需要的受试者(例如，哺乳动物受试者，例如，人类受试者)中治疗疾病、障碍或病症的方法中。本文所述的药物组合物的施用可以例如通过肠胃外(包括静脉内、肿瘤内、腹膜内、肌内、腔内和皮下)施用。指环载体可以单独施用或配制成药物组合物。

指环载体可以以单位剂量组合物，例如单位剂量肠胃外组合物的形式施用。这样的组合物通常通过混合来制备，并且可以适于肠胃外施用。这样的组合物可以是例如可注射和可输注的溶液剂或混悬剂或栓剂或气雾剂的形式。

在一些实施例中，施用指环载体或包含其的组合物，例如，如本文所述的指环载体或组合物可导致将指环载体所包含的遗传元件递送至(例如，受试者中的)靶细胞。

本文所述的指环载体或其组合物，例如，包含效应物(例如，内源性效应物或外源性效应物)，可用于将效应物递送至细胞、组织或受试者。在一些实施例中，指环载体或其组合物用于将效应物递送至骨髓、血液、心脏、GI或皮肤。通过施用本文所述的指环载体组合物来递送效应物可以调节(例如，提高或降低)细胞、组织或受试者中非编码RNA或多肽的表达水平。以这种方式调节表达水平可能导致效应物所递送到的细胞中功能性活动的改变。在一些实施例中，调节的功能性活动本质上可以是酶促性、结构性或调节性。

在一些实施例中，指环载体或其拷贝在递送至细胞中后24小时(例如1天、2天、3天、4天、5天、6天、1周、2周、3周、4周、30天或1个月)可在细胞中检测到。在实施例中，指环载体或其组合物介导对靶细胞的作用，并且该作用持续至少1、2、3、4、5、6或7天、2、3或4周或1、2、3、6或12个月。在一些实施例中(例如，其中指环载体或其组合物包含编码外源性蛋白的遗传元件)，该作用持续少于1、2、3、4、5、6或7天，2、3或4周，或者1、2、3、6或12个月。

可以用本文所述的指环载体或包含该指环载体的组合物治疗的疾病、障碍和病症的实例包括但不限于：免疫障碍、干扰素病(例如，I型干扰素病)、传染病、炎性障碍、自身免疫性病症、癌症(例如实体瘤，例如肺癌、非小细胞肺癌，例如，表达对mIR-625作出响应的基因(例如，胱天蛋白酶-3)的肿瘤)和胃肠道障碍。在一些实施例中，指环载体调节(例如，提高或降低)与指环载体接触的细胞中的活动或功能。在一些实施例中，指环载体调节(例如，提高或降低)与指环载体接触的细胞中分子(例如，核酸或蛋白质)的水平或活性。在一些实施例中，指环载体降低了与指环载体接触的细胞(例如，癌细胞)的活力，例如，降低了至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、95％、99％或更多。在一些实施例中，指环载体包含效应物，例如miRNA，如miR-625，其降低了与指环载体接触的细胞(例如癌细胞)的活力，例如，降低了至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、95％、99％或更多。在一些实施例中，指环载体例如通过提高胱天蛋白酶-3的活性增加与指环载体接触的细胞(例如，癌细胞)的凋亡，例如，增加了至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、95％、99％或更多。在一些实施例中，指环载体包含效应物，例如，miRNA，如miR-625，其例如通过提高胱天蛋白酶-3活性增加了与指环载体接触的细胞(例如癌细胞)的凋亡，例如，增加了至少约10％、20％、30％、40％、50％、60％、70％、80％、90％、95％、99％或更多。

IV.施用/递送

可以将组合物(例如，包含如本文所述的指环载体的药物组合物)配制成包括药学上可接受的赋形剂。药物组合物可任选地包含一种或多种另外的活性物质，例如治疗性和/或预防性活性物质。本发明的药物组合物可以是无菌的和/或无热原的。可在以下文献中找到药剂的配制和/或生产中的总体考虑：例如，Remington:The Science and Practice ofPharmacy[雷明顿：药物科学与实践]第21版,Lippincott Williams&Wilkins[利平科特·威廉斯和威尔金斯出版公司],2005(通过引用并入本文)。

尽管本文提供的药物组合物的描述主要针对适合于施用至人的药物组合物，但是本领域技术人员应理解，这样的组合物通常适合于施用至任何其他动物，例如非人动物，例如非人哺乳动物。为了使组合物适合于施用于各种动物而对适合于施用于人的药物组合物的修饰是熟知的，并且普通兽医药理师可仅通过普通实验(如果有的话)来设计和/或进行此种修饰。考虑施用药物组合物的受试者包括但不限于人类和/或其他灵长类动物；哺乳动物，包括商业相关的哺乳动物，如牛、猪、马、羊、猫、狗、小鼠和/或大鼠；和/或鸟类，包括商业相关的鸟类，如家禽、鸡、鸭、鹅和/或火鸡。

本文所述的药物组合物的配制品可通过药理学领域中已知的或以后开发的任何方法来制备。通常，这样的制备方法包括以下步骤：使活性成分与赋形剂和/或一种或多种其他辅助成分结合，并且然后，如果必要和/或期望的话，将产品分开、成形和/或包装。

在一个方面中，本发明的特征在于向受试者递送指环载体的方法。该方法包括向受试者施用包含如本文所述指环载体的药物组合物。在一些实施例中，所施用的指环载体在受试者中复制(例如，成为受试者病毒组的一部分)。

药物组合物可以包含野生型或天然病毒元件和/或修饰的病毒元件。指环载体可以包括一个或多个指环病毒序列(例如，核酸序列或编码其氨基酸序列的核酸序列)或与其具有至少约60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％和99％核苷酸序列同一性的序列。指环载体可包含核酸分子，该核酸分子包含与一种或多种指环病毒序列(例如，指环病毒ORF1核酸序列)具有至少约60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％和99％序列同一性的核酸序列。指环载体可以包含编码氨基酸序列的核酸分子，该氨基酸序列与指环病毒氨基酸序列(例如，指环病毒ORF1分子的氨基酸序列)具有至少约60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％和99％序列同一性。指环载体可以包含多肽，该多肽包含与指环病毒氨基酸序列(例如，指环病毒ORF1分子的氨基酸序列)具有至少约60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％和99％序列同一性的氨基酸序列。

在一些实施例中，指环载体足以增加(刺激)内源性基因和蛋白的表达，例如，与参考(例如健康对照)相比，增加(刺激)了至少约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％或更多。在某些实施例中，指环载体足以减少(抑制)内源性基因和蛋白的表达，例如，与参考(例如健康对照)相比，减少(抑制)了至少约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％或更多。

在一些实施例中，指环载体在宿主或宿主细胞中抑制/增强一种或多种病毒特性，例如，嗜性、感染性、免疫抑制/激活，例如，与参考(例如健康对照)相比，抑制/增强了至少约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％或更多。

在一些实施例中，向受试者施用的药物组合物，该药物组合物进一步包含一种或多种在病毒遗传信息中未表示的病毒株。

在一些实施例中，以足以调节病毒感染的剂量和时间施用包含本文所述的指环载体的药物组合物。病毒感染的一些非限制性实例包括腺相关病毒、爱知病毒(Aichivirus)、澳大利亚蝙蝠狂犬病病毒、BK多瘤病毒、版纳病毒(Banna virus)、巴马森林病毒(Barmah forest virus)、布尼亚韦拉病毒(Bunyamwera virus)、布尼亚病毒属拉克罗斯病毒(Bunyavirus La Crosse)、布尼亚病毒属雪鞋野兔病毒(Bunyavirus snowshoe hare)、猕猴疱疹病毒(Cercopithecine herpesvirus)、钱迪普拉病毒(Chandipura virus)、基孔肯雅病毒(Chikungunya virus)、库赛病毒(Cosavirus)A种、牛痘病毒、柯萨奇病毒(Coxsackievirus)、克里米亚-刚果出血热病毒、登革热病毒、多里病毒(Dhori virus)、杜贝病毒(Dugbe virus)、杜文海病毒(Duvenhage virus)、东部马脑炎病毒(Eastern equineencephalitis virus)、伊波拉病毒(Ebolavirus)、埃可病毒(Echovirus)、脑心肌炎病毒、EB病毒(Epstein-Barr virus)、欧洲蝙蝠狂犬病病毒、GB病毒C型/庚型肝炎病毒、汉坦病毒(Hantaan virus)、亨德拉病毒(Hendra virus)、甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、戊型肝炎病毒、丁型肝炎病毒、马痘病毒、人腺病毒、人星状病毒、人冠状病毒、人巨细胞病毒、人肠病毒68型、人肠病毒70型、人疱疹病毒1型、人疱疹病毒2型、人疱疹病毒6型、人疱疹病毒7型、人疱疹病毒8型、人类免疫缺陷病毒、人乳头瘤病毒1型、人乳头瘤病毒2型、人乳头瘤病毒16型、人乳头瘤病毒18型、人副流感病毒、人细小病毒B19型、人呼吸道合胞病毒、人鼻病毒、人SARS冠状病毒、人泡沫逆转录病毒(spumaretrovirus)、人嗜T淋巴细胞病毒、人环曲病毒(torovirus)、甲型流感病毒、乙型流感病毒、丙型流感病毒、伊斯法罕病毒(Isfahan virus)、JC多瘤病毒、日本脑炎病毒、呼宁砂粒病毒(Junin arenavirus)、KI多瘤病毒、昆津病毒(Kunjin virus)、拉各斯蝙蝠病毒、维多利亚湖马尔堡病毒(Lake Victoriamarburgvirus)、兰加特病毒(Langat virus)、拉沙病毒(Lassa virus)、洛兹达雷病毒(Lordsdale virus)、跳跃病病毒、淋巴细胞性脉络丛脑膜炎病毒、马秋波病毒(Machupovirus)、马亚罗病毒(Mayaro virus)、MERS冠状病毒、麻疹病毒、门戈脑心肌炎病毒(Mengoencephalomyocarditis virus)、默克尔细胞多瘤病毒、莫科拉病毒(Mokola virus)、传染性软疣病毒(Molluscum contagiosum virus)、猴痘病毒、腮腺炎病毒、墨累谷脑炎病毒(Murray valley encephalitis virus)、纽约病毒、尼帕病毒(Nipah virus)、诺瓦克病毒(Norwalk virus)、阿尼昂-尼昂病毒(O’nyong-nyong virus)、羊口疮病毒(Orf virus)、奥罗普切病毒(Oropouche virus)、皮钦德病毒(Pichinde virus)、脊髓灰质炎病毒、庞塔托鲁静脉病毒(Punta toro phlebovirus)、普马拉病毒(Puumala virus)、狂犬病病毒、裂谷热病毒、玫瑰病毒(Rosavirus)A种、罗斯河病毒、轮状病毒A种、轮状病毒B种、轮状病毒C种、风疹病毒、鹭山病毒(Sagiyama virus)、萨里病毒(Salivirus)A种、白蛉热西西里病毒、札幌病毒、塞姆利基森林病毒(Semliki forest virus)、汉城病毒、猴泡沫病毒、猿猴病毒5型、辛德毕斯病毒(Sindbis virus)、南安普顿病毒、圣路易斯脑炎病毒、蜱传波瓦桑病毒(Tick-borne powassan virus)、细环病毒、托斯卡纳病毒(Toscana virus)、乌库涅米病毒(Uukuniemi virus)、痘苗病毒、水痘-带状疱疹病毒、天花病毒、委内瑞拉马脑炎病毒、水疱性口炎病毒、西部马脑炎病毒、WU多瘤病毒、西尼罗河病毒、亚巴猴肿瘤病毒、亚巴样病病毒、黄热病毒和寨卡病毒(Zika Virus)。在某些实施例中，指环载体足以胜过和/或替换已经存在于受试者中的病毒，例如，与参考相比，胜过和/或替换了至少约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％或更多。在某些实施例中，指环载体足以与慢性或急性病毒感染竞争。在某些实施例中，可预防性施用指环载体以保护免受病毒感染(例如，益生病毒(provirotic))。在一些实施例中，指环载体的量足以调节(例如，表型、病毒水平、基因表达、与其他病毒竞争、疾病状态等至少约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％或更高)。在一些实施例中，治疗(treatment)、进行治疗(treating)及其同源词包括对受试者的医疗管理(例如，通过施用指环载体，例如，如本文所述制备的指环载体)，例如，旨在改善、缓解、稳定、预防或治愈疾病、病理状况或障碍。在一些实施例中，治疗包括积极治疗(旨在改善疾病、病理状况或障碍的治疗)、因果治疗(针对相关疾病、病理状况或障碍的原因的治疗)、姑息治疗(旨在缓解症状的治疗)、预防性治疗(旨在预防、最小化或者部分或完全抑制相关疾病、病理状况或障碍的发生的治疗)和/或支持性治疗(用来补充另一种疗法的治疗)。

本文引用的所有参考文献和出版物都特此通过引用并入。

提供以下实例是为了进一步说明本发明的一些实施例，但不用于限制本发明的范围；通过其示例性性质可以理解，可以替代性地使用本领域技术人员已知的其他程序、方法或技术。

实例

实例1：使用杆状病毒产生的ORF1体外组装指环载体

实例2：体外组装包封mRNA的基于Ring2 ORF1的指环载体

实例3：使用修饰的ORF1蛋白体外组装包封mRNA的指环载体

实例4：使用修饰的mRNA体外组装包封mRNA的指环载体

实例5：指环病毒ORF1衣壳蛋白的结构分析

实例1：使用杆状病毒产生的ORF1体外组装指环载体

在本实例中，通过体外组装产生适用于表达指环病毒蛋白(例如，ORF1)的杆状病毒构建体。

在第一个实例中，将编码与N-末端HIS₆标签融合的Ring2 ORF1(HIS-ORF1)的DNA针对昆虫表达进行密码子优化，并克隆到杆状病毒表达载体pFASTbac系统中(根据制造商的说明(赛默飞世尔科技公司(ThermoFisher Scientific)))。将10升昆虫细胞培养物(Sf9)用Ring2 HIS-ORF1杆状病毒感染，并在感染后3天通过离心收获细胞。将细胞裂解，并将裂解物使用螯合树脂柱使用本领域标准方法纯化。对含有HIS-ORF1的洗脱级分进行透析，并且用DNA酶处理以酶切宿主细胞DNA。将所得材料使用螯合树脂柱再次纯化，并且保留含有ORF1的级分以进行核酸衣壳化和病毒载体纯化。还通过负染色电子显微镜分析含ORF1的级分。

在第二个实例中，将编码与N-末端HIS₆标签融合的Ring10 ORF1(HIS-ORF1)的DNA针对昆虫表达进行密码子优化，并且根据制造商的说明(赛默飞世尔科技公司)克隆到杆状病毒表达载体pFASTbac系统中。将昆虫细胞(Sf9)用Ring HIS-ORF1杆状病毒感染，并且在感染后3天通过离心收获细胞。将细胞裂解，并且将蛋白质使用螯合树脂亲和柱(HisTrap，通用电气医疗集团(GE Healthcare))使用本领域标准方法进行纯化。使用肝素亲和柱(Heparin HiTrap，通用电气医疗集团)再次纯化所得材料，并通过负染色电子显微镜分析含有ORF1的级分。

在第三个实例中，将编码与N-末端HIS₆-Flag标签融合的鸡贫血病毒(CAV)衣壳蛋白(Vp1)(HIS-Flag-Vp1)和辅助蛋白(Vp2)的DNA针对哺乳动物表达进行密码子优化，并且使用CMV启动子克隆到哺乳动物表达载体中。用CAV Vp1和Vp2表达载体转染哺乳动物细胞(293expi)。感染后3天通过离心收获细胞。裂解细胞并使用螯合和肝素纯化方法纯化裂解物。通过负染色电子显微镜分析含有鸡贫血病毒(CAV)Vp1的洗脱级分。

如图1所示，Ring 2ORF1和Ring 10ORF1均显示出形成约35nm病毒样颗粒的倾向。

核酸衣壳化和病毒载体纯化：将Ring ORF1(野生型蛋白、嵌合蛋白或其片段)用足以使VLP或病毒衣壳解离的条件处理以便能够与核酸货物重组装。核酸货物可以被定义为例如编码人们想要将其作为治疗剂递送的目的基因的RNA。将确定浓度的核酸货物与确定浓度的Ring ORF1结合，并用足以允许核酸包封的条件进行处理，随后将所得颗粒(定义为病毒载体)使用标准病毒纯化程序纯化。

实例2：体外组装包封mRNA的基于Ring2 ORF1的指环载体

Ring2 ORF1通过尺寸排阻色谱法(SEC)利用流动相来纯化，这些流动相包括具有500mM NaCl的Tris pH 8.0、具有500mM NaCl和0.1％SDS的Tris pH 8.0、具有150mM NaCl的CAPS缓冲液pH 10.5、具有500mM NaCl的CAPS缓冲剂pH 10.5、或具有500mM NaCl和0.1％SDS的CAPS缓冲液pH 10.5，以将病毒颗粒或VLP解离成分散的蛋白质或壳体蛋白。

在第一个实例中，将ORF1与mRNA、荧光标记的mRNA或与实例1所示的ssDNA片段化学缀合的mRNA转基因混合，以能够诱导载体形成。通过透析和SEC纯化(使用Tris pH 8.0缓冲液)形成病毒载体，以分离包封RNA的指环载体(例如，如通过保留荧光吸收测量的)。通过生物物理评估(如DLS或电子显微镜)进一步评估指环载体组装。

在第二个实例中，将纯化的ORF1用含有0.1％SDS解离低聚物或VLP的1M NaCl处理成分散的蛋白质或壳体蛋白。然后将ORF1与mRNA(例如翻译目的基因(例如，报告基因，例如GFP、mCherry；或目的效应物，例如EPO)的mRNA)混合，并用含有150mM NaCl的Tris pH 8.0透析以允许VLP形成。随后的复合物通过SEC使用Tris pH 8.0缓冲液纯化，以分离包封mRNA的AV载体。指环载体载体组装可以通过体外或体内读数进一步评估，例如，通过转导细胞并观察报告基因(例如，mCherry或GFP)的表达或通过表达目的效应物(例如，使用ELISA来检测基因的表达，例如EPO)。

体外组装包封GFP mRNA的基于Ring2 ORF1的指环载体

在另一个实例中，Ring2 ORF1蛋白在昆虫细胞中表达为全长蛋白，组装的VLP通过肝素亲和柱随后尺寸排阻色谱法(SEC)(使用Tris缓冲液流动相)进行纯化。用负染色电子显微镜(EM)观察由分离的Ring2 ORF1蛋白形成的VLP，估计颗粒滴度为10¹⁰个颗粒/ml(pts/ml；图4A)。用2摩尔(2M)尿素处理VLP以分解VLP。通过EM的再成像显示未观察到VLP(图4B)。然后在不存在mRNA(图4C)或存在约10倍过量的编码GFP的mRNA(图4D和图4E)的情况下透析尿素处理的VLP以去除尿素。对于用尿素处理并在不存在mRNA的情况下透析的VLP样品，通过EM观察到很少的颗粒(小于10⁸个颗粒/ml；图4C)。相反，在存在过量mRNA的情况下进行透析导致通过EM观察到显著更高滴度的颗粒(约10⁹-10¹⁰个颗粒/ml；图4D和图eE)。这些数据表明，在mRNA存在下，VLP的分解和重组更有效，并表明指环病毒ORF1蛋白可用于体外包封mRNA以形成指环载体。

实例3：使用修饰的ORF1蛋白体外组装包封mRNA的指环载体

在本实例中，通过修饰ORF1蛋白以携带结合mRNA的接触残基来改善mRNA遗传元件的包装。在本实例中，接触ssDNA和/或N-末端富含精氨酸的基序(ARM)的ssDNA接触残基和/或胶冻卷β链可以用mRNA结合病毒蛋白或其他mRNA结合蛋白的组分替代，以允许mRNA的有效结合和包装。然后用含有0.1％SDS的1M NaCl处理该mRNA结合的嵌合ORF1，以将低聚物或VLP解离成分散的蛋白质或壳体蛋白。然后将嵌合ORF1与mRNA(例如编码目的基因(例如，报告基因，例如GFP、mCherry；或目的效应物，例如EPO)的mRNA)混合，并用含有150mM NaCl的Tris pH 8.0透析以允许VLP形成。随后的复合物通过SEC使用Tris pH 8.0缓冲液纯化，以分离包封mRNA的指环载体。指环载体组装可以通过体外或体内读数进一步评估，例如，通过转导细胞和观察报告基因的表达(例如，mCherry或GFP)或通过表达目的效应物(例如，使用ELISA来检测基因的表达，例如EPO)。

对ORF1分子的示例性修饰：可在本文所述方法中使用的Ring ORF1分子包括，例如，几种野生型指环病毒ORF1蛋白；CAV衣壳蛋白(VP1)变体；携带突变以改善组装效率、产量或稳定性的环病毒ORF1蛋白；和嵌合ORF1菌株或其功能片段。在一些情况下，亲和标签例如在N末端连接到ORF1分子(SEQ ID NO:561-562)。在一些情况下，ORF1分子是未标记的蛋白质。Ring ORF1分子可以单独表达或与任意数量的辅助蛋白一起表达，这些辅助蛋白包括但不限于指环病毒ORF2和/或ORF3蛋白。

携带突变以改善组装效率的Ring ORF1蛋白可能包括但不限于ORF1蛋白，其携带引入到N-末端富含精氨酸的基序(ARM)的突变，例如，以改变ARG臂的pI，这可能允许pH敏感性核酸结合以触发颗粒组装(SEQ ID NO:563-565)。改善稳定性的ORF1突变可能包括例如，对接触典型胶冻卷β桶的β链F和G(F和Gβ链)的原体间的突变，例如，以改变原体表面的疏水状态和/或使衣壳形成在热力学上更有利。

嵌合ORF1蛋白可以包括但不限于ORF1蛋白，其序列的一部分或多部分被来自另一种衣壳蛋白(例如，BFDV衣壳蛋白、戊型肝炎衣壳蛋白)的可比部分(例如，ARG臂和/或F和Gβ链，或其可比组分)替代。嵌合ORF1蛋白还可以包括ORF1蛋白，其序列的一部分或多部分被另一种指环病毒ORF1蛋白的可比部分替代(例如，Ring 2ORF1的胶冻卷片段或C-末端部分被Ring 9ORF1的可比部分替代；参见，例如，SEQ ID NO:568-575)。

通常，ORF1分子可以使用纯化技术进行纯化，这些纯化技术包括但不限于螯合纯化、肝素纯化、梯度沉降纯化和/或SEC纯化。

实例4：使用修饰的mRNA体外组装包封mRNA的指环载体

在本实例中，通过将mRNA分子与ssDNA结合或通过以这样的方式修饰mRNA转基因，使得骨架的一部分将允许结合至野生型ORF1的ssDNA接触残基，来优化基于mRNA的遗传元件的包封。mRNA通常编码目的基因，例如报告基因(例如GFP或mCherry)和/或效应物基因(例如EPO)。

在一个实例中，将修饰的ssDNA(其可通过其糖链骨架结合ORF1，但也可与mRNA非共价配对)与目的mRNA混合以产生mRNA/DNA复合物。然后可以使用Ring ORF1包封该mRNA/DNA复合物以形成指环载体，例如，如下文所述。

在另一个实例中，mRNA分子用mRNA分子的一个或多个片段合成，该一个或多个片段携带允许与ORF1结合和用其包封的DNA骨架，同时保留编码要递送的基因(例如，报告基因或效应物基因)的mRNA部分。然后可以使用Ring ORF1包封该mRNA/DNA杂交分子以形成指环载体，例如，如下文所述。

通过体外组装包封：然后将上述mRNA/DNA遗传元件通过体外组装包封。简而言之，然后用含有0.1％SDS的1M NaCl处理指环载体ORF1，以将低聚物或VLP解离成分散的蛋白质或壳体蛋白。然后将ORF1与合成的mRNA复合物或杂交分子混合，并用含有150mM NaCl的Tris pH 8.0透析以允许VLP形成。随后的颗粒通过SEC使用Tris pH 8.0缓冲液纯化，以分离包封mRNA的指环载体。指环载体组装可以通过体外或体内读数通过转导细胞和观察报告基因或效应物基因的表达来进一步评估，例如，如本文所述。

实例5：指环病毒ORF1衣壳蛋白的结构分析

指环病毒与其他特征明确的病毒(例如禽病原体喙羽病病毒(BFDV)或鸡贫血病毒(CAV))共享预测的结构特征。

指环病毒ORF1衣壳蛋白含有类似于BFDV的N-末端ARM序列。二级结构预测表明，ORF1的前约250个残基(取决于菌株)包括8个预测的β链(图3)。当ORF1的8个预测的β链(按照胶冻卷结构域命名惯例命名为B至I)在二级结构预测的指导下与BFDV和Hep E的衣壳蛋白对齐时，ORF1中的保守赖氨酸和精氨酸残基与BFDV和Hep E衣壳蛋白的已知ssDNA接触残基对齐(图3，用星号表示)。

序列

下文列出的序列注释如下。粗体和加下划线的文本表示包含用于螯合纯化的His6标签(HHHHHH)和flag标签(DYKDDDDK)的序列，该flag标签是例如用于低表达蛋白的蛋白质印迹检测的强表位。粗体和斜体序列表示Ring9 ORF1序列或其部分。未加粗、未加下划线的序列是Ring2序列或其部分。未加粗、加下划线的序列来自喙羽病病毒(BFDV)。灰色突出显示表示赖氨酸突变成组氨酸的位置，例如，在Ring 9ORF1的富含精氨酸的区域和第一β链中。

SEQ ID NO:561：

Ring 2 N-末端HIS-FLAG-3C蛋白酶-ORF1：

SEQ ID NO:562：

Ring 9 N-末端HIS-FLAG-3C蛋白酶-ORF1：

SEQ ID NO:563：

具有Ring 9的ARG臂的Ring 2 ORF1(Ring 291)

SEQ ID NO:564：

具有Ring 9的ARG臂和β链1+2 722表位的Ring 2 ORF1(Ring 292)

SEQ ID NO:565：

在ARG臂和第一β链中具有LYS/HIS突变的Ring 9

SEQ ID NO:566：

具有BFDV的ARG臂的Ring 9：

SEQ ID NO:567：

具有BFDV衣壳蛋白的β链F和G的Ring 9

SEQ ID NO:568：

具有Ring 9的βC的Ring 2：

SEQ ID NO:569：

具有Ring 9的接头1的Ring 2：

SEQ ID NO:570：

具有Ring 9的β链D的Ring 2：

SEQ ID NO:571：

具有Ring 9的接头2的Ring 2：

SEQ ID NO:572：

具有Ring 9的β链G DNA的Ring 2：

SEQ ID NO:573：

具有Ring 9的β链F原体间接触的Ring 2：

SEQ ID NO:574：

具有Ring 9的链H和I以及C-末端片段的Ring 2 ORF1：

SEQ ID NO:575：

具有Ring 9的链I和C-末端片段的Ring 2 ORF1：

序列表

<110> 旗舰先锋创新V股份有限公司

<120> 包封RNA的指环病毒衣壳的体外组装

<130> V2057-7017WO

<140>

<141>

<150> 63/147,064

<151> 2021-02-08

<150> 63/130,360

<151> 2020-12-23

<160> 968

<170> PatentIn 3.5版

<210> 1

<211> 699

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 1

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro

35 40 45

Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe

50 55 60

Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys

65 70 75 80

Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp

85 90 95

Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met

100 105 110

Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe

115 120 125

Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu

130 135 140

Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg

145 150 155 160

Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr

165 170 175

Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr

180 185 190

Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His

195 200 205

Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys

210 215 220

Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala

225 230 235 240

Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys

245 250 255

Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val

260 265 270

Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser

275 280 285

Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser

290 295 300

Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr

305 310 315 320

Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn

325 330 335

Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr

340 345 350

Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe

355 360 365

Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys

370 375 380

Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp

385 390 395 400

Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu

405 410 415

Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu

420 425 430

Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp

435 440 445

Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu

450 455 460

Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr

465 470 475 480

Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln

485 490 495

Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu

500 505 510

Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys

515 520 525

Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu

530 535 540

Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn

545 550 555 560

Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro

565 570 575

Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile

580 585 590

Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala

595 600 605

Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr

610 615 620

Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr

625 630 635 640

Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala

645 650 655

Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys

660 665 670

Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr

675 680 685

Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

690 695

<210> 2

<211> 688

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 2

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg

35 40 45

Pro Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp

50 55 60

Arg Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Val

65 70 75 80

Arg Lys Arg Phe Tyr Lys Arg Lys Leu Lys Lys Ile Val Leu Lys Gln

85 90 95

Phe Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys

100 105 110

Leu Phe Gln Gly Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln Thr

115 120 125

Ile Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp Thr

130 135 140

Leu Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His Leu

145 150 155 160

Lys Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg Tyr

165 170 175

Gly Gly Val Thr Leu Tyr Phe Tyr Gln Ser Ala Tyr Thr Asp Tyr Ile

180 185 190

Ala Gln Val Phe Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr His

195 200 205

Ala Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Val Ile Arg

210 215 220

Val Pro Ser Arg Glu Thr Arg Lys Lys Arg Lys Pro Tyr Lys Arg Val

225 230 235 240

Arg Val Gly Pro Pro Ser Gln Met Gln Asn Lys Trp Tyr Phe Gln Arg

245 250 255

Asp Ile Cys Glu Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val Asp

260 265 270

Phe Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu Thr

275 280 285

Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp His

290 295 300

Pro Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu Tyr

305 310 315 320

Ser Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr Leu

325 330 335

Gly Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu Met

340 345 350

Thr Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp His

355 360 365

Tyr Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro Pro

370 375 380

Ser Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala Glu

385 390 395 400

Pro Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly Gln

405 410 415

Gly Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp Asp

420 425 430

Pro Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr Asp

435 440 445

Met Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr Glu

450 455 460

Asn Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe Asn

465 470 475 480

Glu Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr Gly

485 490 495

Phe Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His Trp

500 505 510

His Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys Leu

515 520 525

Thr Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln Ala

530 535 540

Lys Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys Thr

545 550 555 560

Tyr Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile Pro

565 570 575

His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys Pro

580 585 590

Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr Lys

595 600 605

Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr Leu

610 615 620

Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln Thr

625 630 635 640

Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp Gln

645 650 655

Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln Gln

660 665 670

His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile Glu

675 680 685

<210> 3

<211> 714

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 3

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg

35 40 45

Pro Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp

50 55 60

Arg Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Val

65 70 75 80

Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln

85 90 95

Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys

100 105 110

Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr

115 120 125

Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser

130 135 140

Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys

145 150 155 160

Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr

165 170 175

Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile

180 185 190

Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr

195 200 205

Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile

210 215 220

Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile

225 230 235 240

Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr

245 250 255

Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn

260 265 270

Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr

275 280 285

Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val

290 295 300

Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe

305 310 315 320

Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln

325 330 335

Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg

340 345 350

Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe

355 360 365

Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn

370 375 380

Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser

385 390 395 400

Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn

405 410 415

Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro

420 425 430

Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp

435 440 445

Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro

450 455 460

Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile

465 470 475 480

Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn

485 490 495

Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys

500 505 510

Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly

515 520 525

Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp

530 535 540

Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln

545 550 555 560

Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile

565 570 575

Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys

580 585 590

Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro

595 600 605

Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro

610 615 620

Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr

625 630 635 640

Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val

645 650 655

Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu

660 665 670

Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu

675 680 685

Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg

690 695 700

Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

705 710

<210> 4

<211> 714

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 4

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg

35 40 45

Pro Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp

50 55 60

Arg Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Val

65 70 75 80

Arg Lys Arg Phe Tyr Lys Arg Lys Leu Lys Lys Ile Val Leu Lys Gln

85 90 95

Phe Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys

100 105 110

Leu Phe Gln Gly Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr

115 120 125

Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser

130 135 140

Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys

145 150 155 160

Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr

165 170 175

Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile

180 185 190

Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr

195 200 205

Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile

210 215 220

Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile

225 230 235 240

Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr

245 250 255

Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn

260 265 270

Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr

275 280 285

Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val

290 295 300

Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe

305 310 315 320

Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln

325 330 335

Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg

340 345 350

Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe

355 360 365

Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn

370 375 380

Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser

385 390 395 400

Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn

405 410 415

Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro

420 425 430

Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp

435 440 445

Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro

450 455 460

Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile

465 470 475 480

Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn

485 490 495

Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys

500 505 510

Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly

515 520 525

Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp

530 535 540

Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln

545 550 555 560

Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile

565 570 575

Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys

580 585 590

Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro

595 600 605

Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro

610 615 620

Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr

625 630 635 640

Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val

645 650 655

Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu

660 665 670

Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu

675 680 685

Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg

690 695 700

Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

705 710

<210> 5

<211> 688

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 5

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg

35 40 45

Pro Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg His Arg Trp

50 55 60

Arg Tyr Arg Lys Pro Arg His Thr Tyr Trp Arg Arg His Leu Arg Val

65 70 75 80

Arg His Arg Phe Tyr His Arg His Leu His His Ile Val Leu Lys Gln

85 90 95

Phe Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys

100 105 110

Leu Phe Gln Gly Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln Thr

115 120 125

Ile Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp Thr

130 135 140

Leu Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His Leu

145 150 155 160

Lys Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg Tyr

165 170 175

Gly Gly Val Thr Leu Tyr Phe Tyr Gln Ser Ala Tyr Thr Asp Tyr Ile

180 185 190

Ala Gln Val Phe Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr His

195 200 205

Ala Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Val Ile Arg

210 215 220

Val Pro Ser Arg Glu Thr Arg Lys Lys Arg Lys Pro Tyr Lys Arg Val

225 230 235 240

Arg Val Gly Pro Pro Ser Gln Met Gln Asn Lys Trp Tyr Phe Gln Arg

245 250 255

Asp Ile Cys Glu Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val Asp

260 265 270

Phe Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu Thr

275 280 285

Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp His

290 295 300

Pro Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu Tyr

305 310 315 320

Ser Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr Leu

325 330 335

Gly Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu Met

340 345 350

Thr Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp His

355 360 365

Tyr Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro Pro

370 375 380

Ser Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala Glu

385 390 395 400

Pro Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly Gln

405 410 415

Gly Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp Asp

420 425 430

Pro Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr Asp

435 440 445

Met Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr Glu

450 455 460

Asn Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe Asn

465 470 475 480

Glu Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr Gly

485 490 495

Phe Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His Trp

500 505 510

His Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys Leu

515 520 525

Thr Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln Ala

530 535 540

Lys Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys Thr

545 550 555 560

Tyr Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile Pro

565 570 575

His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys Pro

580 585 590

Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr Lys

595 600 605

Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr Leu

610 615 620

Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln Thr

625 630 635 640

Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp Gln

645 650 655

Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln Gln

660 665 670

His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile Glu

675 680 685

<210> 6

<211> 687

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 6

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Trp Gly Thr Ser Asn Cys Ala Cys Ala Lys Phe Gln Ile Arg

35 40 45

Arg Arg Tyr Ala Arg Pro Tyr Arg Arg Arg His Ile Arg Arg Tyr Arg

50 55 60

Arg Arg Arg Arg His Phe Arg Arg Arg Arg Phe Thr Thr Asn Arg Arg

65 70 75 80

Lys Arg Phe Tyr Lys Arg Lys Leu Lys Lys Ile Val Leu Lys Gln Phe

85 90 95

Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys Leu

100 105 110

Phe Gln Gly Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln Thr Ile

115 120 125

Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp Thr Leu

130 135 140

Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His Leu Lys

145 150 155 160

Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg Tyr Gly

165 170 175

Gly Val Thr Leu Tyr Phe Tyr Gln Ser Ala Tyr Thr Asp Tyr Ile Ala

180 185 190

Gln Val Phe Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr His Ala

195 200 205

Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Val Ile Arg Val

210 215 220

Pro Ser Arg Glu Thr Arg Lys Lys Arg Lys Pro Tyr Lys Arg Val Arg

225 230 235 240

Val Gly Pro Pro Ser Gln Met Gln Asn Lys Trp Tyr Phe Gln Arg Asp

245 250 255

Ile Cys Glu Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val Asp Phe

260 265 270

Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu Thr Leu

275 280 285

Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp His Pro

290 295 300

Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu Tyr Ser

305 310 315 320

Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr Leu Gly

325 330 335

Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu Met Thr

340 345 350

Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp His Tyr

355 360 365

Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro Pro Ser

370 375 380

Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala Glu Pro

385 390 395 400

Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly Gln Gly

405 410 415

Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp Asp Pro

420 425 430

Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr Asp Met

435 440 445

Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr Glu Asn

450 455 460

Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe Asn Glu

465 470 475 480

Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr Gly Phe

485 490 495

Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His Trp His

500 505 510

Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys Leu Thr

515 520 525

Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln Ala Lys

530 535 540

Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys Thr Tyr

545 550 555 560

Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile Pro His

565 570 575

Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys Pro Gln

580 585 590

Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr Lys Lys

595 600 605

Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr Leu Gln

610 615 620

Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln Thr Ser

625 630 635 640

Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp Gln Thr

645 650 655

Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln Gln His

660 665 670

Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile Glu

675 680 685

<210> 7

<211> 688

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 7

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Pro Tyr Trp Arg Gln Lys Tyr Tyr Arg Arg Arg Tyr Arg

35 40 45

Pro Phe Ser Trp Arg Thr Arg Arg Ile Ile Gln Arg Arg Lys Arg Trp

50 55 60

Arg Tyr Arg Lys Pro Arg Lys Thr Tyr Trp Arg Arg Lys Leu Arg Val

65 70 75 80

Arg Lys Arg Phe Tyr Lys Arg Lys Leu Lys Lys Ile Val Leu Lys Gln

85 90 95

Phe Gln Pro Lys Ile Ile Arg Arg Cys Thr Ile Phe Gly Thr Ile Cys

100 105 110

Leu Phe Gln Gly Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln Thr

115 120 125

Ile Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp Thr

130 135 140

Leu Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His Leu

145 150 155 160

Lys Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg Tyr

165 170 175

Gly Gly Val Thr Leu Tyr Phe Tyr Gln Ser Ala Tyr Thr Asp Tyr Ile

180 185 190

Ala Gln Val Phe Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr His

195 200 205

Ala Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Ala Lys Lys

210 215 220

Trp Phe Ser Arg Glu Thr Arg Lys Lys Arg Lys Pro Gly Phe Lys Arg

225 230 235 240

Leu Leu Gly Pro Pro Ser Gln Met Gln Asn Lys Trp Tyr Phe Gln Arg

245 250 255

Asp Ile Cys Glu Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val Asp

260 265 270

Phe Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu Thr

275 280 285

Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp His

290 295 300

Pro Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu Tyr

305 310 315 320

Ser Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr Leu

325 330 335

Gly Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu Met

340 345 350

Thr Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp His

355 360 365

Tyr Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro Pro

370 375 380

Ser Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala Glu

385 390 395 400

Pro Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly Gln

405 410 415

Gly Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp Asp

420 425 430

Pro Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr Asp

435 440 445

Met Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr Glu

450 455 460

Asn Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe Asn

465 470 475 480

Glu Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr Gly

485 490 495

Phe Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His Trp

500 505 510

His Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys Leu

515 520 525

Thr Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln Ala

530 535 540

Lys Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys Thr

545 550 555 560

Tyr Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile Pro

565 570 575

His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys Pro

580 585 590

Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr Lys

595 600 605

Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr Leu

610 615 620

Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln Thr

625 630 635 640

Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp Gln

645 650 655

Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln Gln

660 665 670

His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile Glu

675 680 685

<210> 8

<211> 699

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 8

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro

35 40 45

Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe

50 55 60

Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys

65 70 75 80

Gln Trp Gln Pro Pro Tyr Lys Arg Arg Cys Thr Ile Phe Gly Thr Ile

85 90 95

Cys Leu Phe Gln Gly Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met

100 105 110

Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe

115 120 125

Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu

130 135 140

Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg

145 150 155 160

Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr

165 170 175

Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr

180 185 190

Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His

195 200 205

Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys

210 215 220

Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala

225 230 235 240

Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys

245 250 255

Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val

260 265 270

Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser

275 280 285

Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser

290 295 300

Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr

305 310 315 320

Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn

325 330 335

Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr

340 345 350

Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe

355 360 365

Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys

370 375 380

Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp

385 390 395 400

Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu

405 410 415

Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu

420 425 430

Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp

435 440 445

Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu

450 455 460

Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr

465 470 475 480

Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln

485 490 495

Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu

500 505 510

Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys

515 520 525

Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu

530 535 540

Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn

545 550 555 560

Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro

565 570 575

Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile

580 585 590

Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala

595 600 605

Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr

610 615 620

Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr

625 630 635 640

Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala

645 650 655

Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys

660 665 670

Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr

675 680 685

Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

690 695

<210> 9

<211> 699

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 9

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro

35 40 45

Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe

50 55 60

Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys

65 70 75 80

Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp

85 90 95

Cys Leu Ile Tyr Tyr Ser Pro Glu Arg Ala Asn Asn Asn Tyr Ile Gln

100 105 110

Thr Ile Tyr Ser Tyr Val Pro Asp Lys Glu Pro Gly Gly Gly Gly Trp

115 120 125

Thr Leu Ile Thr Glu Ser Leu Ser Ser Leu Trp Glu Asp Trp Glu His

130 135 140

Leu Lys Asn Val Trp Thr Gln Ser Asn Ala Gly Leu Pro Leu Val Arg

145 150 155 160

Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr

165 170 175

Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr

180 185 190

Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His

195 200 205

Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys

210 215 220

Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala

225 230 235 240

Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys

245 250 255

Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val

260 265 270

Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser

275 280 285

Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser

290 295 300

Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr

305 310 315 320

Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn

325 330 335

Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr

340 345 350

Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe

355 360 365

Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys

370 375 380

Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp

385 390 395 400

Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu

405 410 415

Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu

420 425 430

Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp

435 440 445

Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu

450 455 460

Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr

465 470 475 480

Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln

485 490 495

Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu

500 505 510

Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys

515 520 525

Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu

530 535 540

Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn

545 550 555 560

Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro

565 570 575

Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile

580 585 590

Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala

595 600 605

Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr

610 615 620

Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr

625 630 635 640

Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala

645 650 655

Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys

660 665 670

Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr

675 680 685

Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

690 695

<210> 10

<211> 699

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 10

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro

35 40 45

Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe

50 55 60

Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys

65 70 75 80

Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp

85 90 95

Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met

100 105 110

Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe

115 120 125

Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu

130 135 140

Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg

145 150 155 160

Tyr Gly Gly Val Thr Leu Tyr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr

165 170 175

Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr

180 185 190

Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His

195 200 205

Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys

210 215 220

Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala

225 230 235 240

Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys

245 250 255

Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val

260 265 270

Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser

275 280 285

Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser

290 295 300

Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr

305 310 315 320

Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn

325 330 335

Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr

340 345 350

Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe

355 360 365

Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys

370 375 380

Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp

385 390 395 400

Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu

405 410 415

Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu

420 425 430

Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp

435 440 445

Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu

450 455 460

Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr

465 470 475 480

Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln

485 490 495

Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu

500 505 510

Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys

515 520 525

Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu

530 535 540

Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn

545 550 555 560

Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro

565 570 575

Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile

580 585 590

Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala

595 600 605

Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr

610 615 620

Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr

625 630 635 640

Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala

645 650 655

Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys

660 665 670

Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr

675 680 685

Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

690 695

<210> 11

<211> 699

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 11

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro

35 40 45

Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe

50 55 60

Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys

65 70 75 80

Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp

85 90 95

Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met

100 105 110

Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe

115 120 125

Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu

130 135 140

Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg

145 150 155 160

Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr

165 170 175

Ile Val Arg Ile His Asn Cys Tyr Pro Met Thr Asp Thr Lys Tyr Thr

180 185 190

His Ala Asp Ser Ala Pro Asn Arg Met Leu Leu Lys Lys His Lys His

195 200 205

Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys

210 215 220

Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala

225 230 235 240

Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys

245 250 255

Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val

260 265 270

Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser

275 280 285

Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser

290 295 300

Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr

305 310 315 320

Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn

325 330 335

Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr

340 345 350

Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe

355 360 365

Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys

370 375 380

Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp

385 390 395 400

Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu

405 410 415

Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu

420 425 430

Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp

435 440 445

Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu

450 455 460

Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr

465 470 475 480

Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln

485 490 495

Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu

500 505 510

Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys

515 520 525

Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu

530 535 540

Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn

545 550 555 560

Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro

565 570 575

Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile

580 585 590

Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala

595 600 605

Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr

610 615 620

Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr

625 630 635 640

Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala

645 650 655

Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys

660 665 670

Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr

675 680 685

Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

690 695

<210> 12

<211> 699

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 12

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro

35 40 45

Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe

50 55 60

Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys

65 70 75 80

Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp

85 90 95

Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met

100 105 110

Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe

115 120 125

Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu

130 135 140

Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg

145 150 155 160

Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr

165 170 175

Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr

180 185 190

Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His

195 200 205

Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Lys Arg

210 215 220

Val Arg Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala

225 230 235 240

Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys

245 250 255

Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val

260 265 270

Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser

275 280 285

Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser

290 295 300

Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr

305 310 315 320

Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn

325 330 335

Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr

340 345 350

Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe

355 360 365

Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys

370 375 380

Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp

385 390 395 400

Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu

405 410 415

Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu

420 425 430

Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp

435 440 445

Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu

450 455 460

Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr

465 470 475 480

Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln

485 490 495

Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu

500 505 510

Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys

515 520 525

Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu

530 535 540

Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn

545 550 555 560

Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro

565 570 575

Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile

580 585 590

Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala

595 600 605

Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr

610 615 620

Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr

625 630 635 640

Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala

645 650 655

Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys

660 665 670

Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr

675 680 685

Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

690 695

<210> 13

<211> 699

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 13

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro

35 40 45

Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe

50 55 60

Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys

65 70 75 80

Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp

85 90 95

Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met

100 105 110

Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe

115 120 125

Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu

130 135 140

Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg

145 150 155 160

Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr

165 170 175

Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr

180 185 190

Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys His Val Ile

195 200 205

Arg Val Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys

210 215 220

Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala

225 230 235 240

Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys

245 250 255

Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val

260 265 270

Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser

275 280 285

Val Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser

290 295 300

Phe Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr

305 310 315 320

Gln Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn

325 330 335

Arg Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr

340 345 350

Phe Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe

355 360 365

Asn Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys

370 375 380

Ser Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp

385 390 395 400

Asn Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu

405 410 415

Pro Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu

420 425 430

Asp Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp

435 440 445

Pro Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu

450 455 460

Ile Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr

465 470 475 480

Asn Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln

485 490 495

Lys Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu

500 505 510

Gly Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys

515 520 525

Trp Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu

530 535 540

Gln Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn

545 550 555 560

Ile Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro

565 570 575

Lys Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile

580 585 590

Pro Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala

595 600 605

Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr

610 615 620

Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr

625 630 635 640

Val Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala

645 650 655

Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys

660 665 670

Glu Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr

675 680 685

Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

690 695

<210> 14

<211> 673

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 14

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro

35 40 45

Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe

50 55 60

Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys

65 70 75 80

Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp

85 90 95

Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met

100 105 110

Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe

115 120 125

Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu

130 135 140

Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg

145 150 155 160

Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr

165 170 175

Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr

180 185 190

Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His

195 200 205

Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys

210 215 220

Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala

225 230 235 240

Thr Asp Leu Tyr Lys Ile Pro Leu Ile Met Ile Ala Ala Thr Ala Val

245 250 255

Asp Phe Arg Tyr Pro Phe Cys Ala Ser Asp Cys Ala Ser Asn Asn Leu

260 265 270

Thr Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp

275 280 285

His Pro Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu

290 295 300

Tyr Ser Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr

305 310 315 320

Leu Gly Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu

325 330 335

Met Thr Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp

340 345 350

His Tyr Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro

355 360 365

Pro Ser Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala

370 375 380

Glu Pro Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly

385 390 395 400

Gln Gly Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp

405 410 415

Asp Pro Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr

420 425 430

Asp Met Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr

435 440 445

Glu Asn Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe

450 455 460

Asn Glu Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr

465 470 475 480

Gly Phe Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His

485 490 495

Trp His Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys

500 505 510

Leu Thr Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln

515 520 525

Ala Lys Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys

530 535 540

Thr Tyr Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile

545 550 555 560

Pro His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys

565 570 575

Pro Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr

580 585 590

Lys Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr

595 600 605

Leu Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln

610 615 620

Thr Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp

625 630 635 640

Gln Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln

645 650 655

Gln His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile

660 665 670

Glu

<210> 15

<211> 673

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成多肽

<400> 15

Met Gly Ser Ser His His His His His His Gly Ser Asp Tyr Lys Asp

1 5 10 15

Asp Asp Asp Lys Ser Gly Ser Leu Glu Val Leu Phe Gln Gly Pro Ser

20 25 30

Gly Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro

35 40 45

Arg Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe

50 55 60

Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys

65 70 75 80

Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp

85 90 95

Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met

100 105 110

Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe

115 120 125

Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu

130 135 140

Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg

145 150 155 160

Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr

165 170 175

Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr

180 185 190

Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His

195 200 205

Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys

210 215 220

Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala

225 230 235 240

Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys

245 250 255

Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Leu

260 265 270

Thr Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln Asn Gln Asp Phe Asp

275 280 285

His Pro Ser Asp Thr Gln Gly Tyr Phe Pro Lys Pro Gly Val Tyr Leu

290 295 300

Tyr Ser Thr Gln Arg Ser Asn Lys Pro Ser Ser Ser Asp Cys Ile Tyr

305 310 315 320

Leu Gly Asn Thr Lys Asp Asn Gln Glu Gly Lys Ser Ala Ser Ser Leu

325 330 335

Met Thr Leu Lys Thr Gln Lys Ile Thr Asp Trp Gly Asn Pro Phe Trp

340 345 350

His Tyr Tyr Ile Asp Gly Ser Lys Lys Ile Phe Ser Tyr Phe Lys Pro

355 360 365

Pro Ser Gln Leu Asp Ser Ser Asp Phe Glu His Met Thr Glu Leu Ala

370 375 380

Glu Pro Met Phe Ile Gln Val Arg Tyr Asn Pro Glu Arg Asp Thr Gly

385 390 395 400

Gln Gly Asn Leu Ile Tyr Val Thr Glu Asn Phe Arg Gly Gln His Trp

405 410 415

Asp Pro Pro Ser Ser Asp Asn Leu Lys Leu Asp Gly Phe Pro Leu Tyr

420 425 430

Asp Met Cys Trp Gly Phe Ile Asp Trp Ile Glu Lys Val His Glu Thr

435 440 445

Glu Asn Leu Leu Thr Asn Tyr Cys Phe Cys Ile Arg Ser Ser Ala Phe

450 455 460

Asn Glu Lys Lys Thr Val Phe Ile Pro Val Asp His Ser Phe Leu Thr

465 470 475 480

Gly Phe Ser Pro Tyr Glu Thr Pro Val Lys Ser Ser Asp Gln Ala His

485 490 495

Trp His Pro Gln Ile Arg Phe Gln Thr Lys Ser Ile Asn Asp Ile Cys

500 505 510

Leu Thr Gly Pro Gly Cys Ala Arg Ser Pro Tyr Gly Asn Tyr Met Gln

515 520 525

Ala Lys Met Ser Tyr Lys Phe His Val Lys Trp Gly Gly Cys Pro Lys

530 535 540

Thr Tyr Glu Lys Pro Tyr Asp Pro Cys Ser Gln Pro Asn Trp Thr Ile

545 550 555 560

Pro His Asn Leu Asn Glu Thr Ile Gln Ile Gln Asn Pro Asn Thr Cys

565 570 575

Pro Gln Thr Glu Leu Gln Glu Trp Asp Trp Arg Arg Asp Ile Val Thr

580 585 590

Lys Lys Ala Ile Glu Arg Ile Arg Gln His Thr Glu Pro His Glu Thr

595 600 605

Leu Gln Ile Ser Thr Gly Ser Lys His Asn Pro Pro Val His Arg Gln

610 615 620

Thr Ser Pro Trp Thr Asp Ser Glu Thr Asp Ser Glu Glu Glu Lys Asp

625 630 635 640

Gln Thr Gln Glu Ile Gln Ile Gln Leu Asn Lys Leu Arg Lys His Gln

645 650 655

Gln His Leu Lys Gln Gln Leu Lys Gln Tyr Leu Lys Pro Gln Asn Ile

660 665 670

Glu

<210> 16

<211> 3753

<212> DNA

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 16

tgctacgtca ctaacccacg tgtcctctac aggccaatcg cagtctatgt cgtgcacttc 60

ctgggcatgg tctacataat tatataaatg cttgcacttc cgaatggctg agtttttgct 120

gcccgtccgc ggagaggagc cacggcaggg gatccgaacg tcctgagggc gggtgccgga 180

ggtgagttta cacaccgaag tcaaggggca attcgggctc aggactggcc gggctttggg 240

caaggctctt aaaaatgcac ttttctcgaa taagcagaaa gaaaaggaaa gtgctactgc 300

tttgcgtgcc agcagctaag aaaaaaccaa ctgctatgag cttctggaaa cctccggtac 360

acaatgtcac ggggatccaa cgcatgtggt atgagtcctt tcaccgtggc cacgcttctt 420

tttgtggttg tgggaatcct atacttcaca ttactgcact tgctgaaaca tatggccatc 480

caacaggccc gagaccttct gggccaccgg gagtagaccc caacccccac atccgtagag 540

ccaggcctgc cccggccgct ccggagccct cacaggttga ttcgagacca gccctgacat 600

ggcatgggga tggtggaagc gacggaggcg ctggtggttc cggaagcggt ggacccgtgg 660

cagacttcgc agacgatggc ctcgatcagc tcgtcgccgc cctagacgac gaagagtaag 720

gaggcgcaga cggtggagga gggggagacg aaaaacaagg acttacagac gcaggagacg 780

ctttagacgc aggggacgaa aagcaaaact tataataaaa ctgtggcaac ctgcagtaat 840

taaaagatgc agaataaagg gatacatacc actgattata agtgggaacg gtacctttgc 900

cacaaacttt accagtcaca taaatgacag aataatgaaa ggccccttcg ggggaggaca 960

cagcactatg aggttcagcc tctacatttt gtttgaggag cacctcagac acatgaactt 1020

ctggaccaga agcaacgata acctagagct aaccagatac ttgggggctt cagtaaaaat 1080

atacaggcac ccagaccaag actttatagt aatatacaac agaagaaccc ctctaggagg 1140

caacatctac acagcaccct ctctacaccc aggcaatgcc attttagcaa aacacaaaat 1200

attagtacca agtttacaga caagaccaaa gggtagaaaa gcaattagac taagaatagc 1260

accccccaca ctctttacag acaagtggta ctttcaaaag gacatagccg acctcaccct 1320

tttcaacatc atggcagttg aggctgactt gcggtttccg ttctgctcac cacaaactga 1380

caacacttgc atcagcttcc aggtccttag ttccgtttac aacaactacc tcagtattaa 1440

tacctttaat aatgacaact cagactcaaa gttaaaagaa tttttaaata aagcatttcc 1500

aacaacaggc acaaaaggaa caagtttaaa tgcactaaat acatttagaa cagaaggatg 1560

cataagtcac ccacaactaa aaaaaccaaa cccacaaata aacaaaccat tagagtcaca 1620

atactttgca cctttagatg ccctctgggg agaccccata tactataatg atctaaatga 1680

aaacaaaagt ttgaacgata tcattgagaa aatactaata aaaaacatga ttacatacca 1740

tgcaaaacta agagaatttc caaattcata ccaaggaaac aaggcctttt gccacctaac 1800

aggcatatac agcccaccat acctaaacca aggcagaata tctccagaaa tatttggact 1860

gtacacagaa ataatttaca acccttacac agacaaagga actggaaaca aagtatggat 1920

ggacccacta actaaagaga acaacatata taaagaagga cagagcaaat gcctactgac 1980

tgacatgccc ctatggactt tactttttgg atatacagac tggtgtaaaa aggacactaa 2040

taactgggac ttaccactaa actacagact agtactaata tgcccttata cctttccaaa 2100

attgtacaat gaaaaagtaa aagactatgg gtacatcccg tactcctaca aattcggagc 2160

gggtcagatg ccagacggca gcaactacat accctttcag tttagagcaa agtggtaccc 2220

cacagtacta caccagcaac aggtaatgga ggacataagc aggagcgggc cctttgcacc 2280

taaggtagaa aaaccaagca ctcagctggt aatgaagtac tgttttaact ttaactgggg 2340

cggtaaccct atcattgaac agattgttaa agaccccagc ttccagccca cctatgaaat 2400

acccggtacc ggtaacatcc ctagaagaat acaagtcatc gacccgcggg tcctgggacc 2460

gcactactcg ttccggtcat gggacatgcg cagacacaca tttagcagag caagtattaa 2520

gagagtgtca gaacaacaag aaacttctga ccttgtattc tcaggcccaa aaaagcctcg 2580

ggtcgacatc ccaaaacaag aaacccaaga agaaagctca cattcactcc aaagagaatc 2640

gagaccgtgg gagaccgagg aagaaagcga gacagaagcc ctctcgcaag agagccaaga 2700

ggtccccttc caacagcagt tgcagcagca gtaccaagag cagctcaagc tcagacaggg 2760

aatcaaagtc ctcttcgagc agctcataag gacccaacaa ggggtccatg taaacccatg 2820

cctacggtag gtcccaggca gtggctgttt ccagagagaa agccagcccc agctcctagc 2880

agtggagact gggccatgga gtttctcgca gcaaaaatat ttgataggcc agttagaagc 2940

aaccttaaag atacccctta ctacccatat gttaaaaacc aatacaatgt ctactttgac 3000

cttaaatttg aataaacagc agcttcaaac ttgcaaggcc gtgggagttt cactggtcgg 3060

tgtctacctc taaaggtcac taagcactcc gagcgtaagc gaggagtgcg accctccccc 3120

ctggaacaac ttcttcggag tccggcgcta cgccttcggc tgcgccggac acctcagacc 3180

ccccctccac ccgaaacgct tgcgcgtttc ggaccttcgg cgtcgggggg gtcgggagct 3240

ttattaaacg gactccgaag tgctcttgga cactgagggg gtgaacagca acgaaagtga 3300

gtggggccag acttcgccat aaggccttta tcttcttgcc atttgtcagt gtccggggtc 3360

gccataggct tcgggctcgt ttttaggcct tccggactac aaaaatcgcc attttggtga 3420

cgtcacggcc gccatcttaa gtagttgagg cggacggtgg cgtgagttca aaggtcacca 3480

tcagccacac ctactcaaaa tggtggacaa tttcttccgg gtcaaaggtt acagccgcca 3540

tgttaaaaca cgtgacgtat gacgtcacgg ccgccatttt gtgacacaag atggccgact 3600

tccttcctct ttttcaaaaa aaagcggaag tgccgccgcg gcggcggggg gcggcgcgct 3660

gcgcgcgccg cccagtaggg ggagccatgc gccccccccc gcgcatgcgc ggggcccccc 3720

cccgcggggg gctccgcccc ccggcccccc ccg 3753

<210> 17

<211> 127

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 17

Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg

1 5 10 15

Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys

20 25 30

Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His

35 40 45

Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro

50 55 60

His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln

65 70 75 80

Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp

85 90 95

Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala

100 105 110

Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu

115 120 125

<210> 18

<211> 268

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 18

Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg

1 5 10 15

Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys

20 25 30

Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His

35 40 45

Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro

50 55 60

His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln

65 70 75 80

Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp

85 90 95

Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala

100 105 110

Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu Leu

115 120 125

Leu Lys Thr Pro Ala Ser Ser Pro Pro Met Lys Tyr Pro Val Pro Val

130 135 140

Thr Ser Leu Glu Glu Tyr Lys Ser Ser Thr Arg Gly Ser Trp Asp Arg

145 150 155 160

Thr Thr Arg Ser Gly His Gly Thr Cys Ala Asp Thr His Leu Ala Glu

165 170 175

Gln Val Leu Arg Glu Cys Gln Asn Asn Lys Lys Leu Leu Thr Leu Tyr

180 185 190

Ser Gln Ala Gln Lys Ser Leu Gly Ser Thr Ser Gln Asn Lys Lys Pro

195 200 205

Lys Lys Lys Ala His Ile His Ser Lys Glu Asn Arg Asp Arg Gly Arg

210 215 220

Pro Arg Lys Lys Ala Arg Gln Lys Pro Ser Arg Lys Arg Ala Lys Arg

225 230 235 240

Ser Pro Ser Asn Ser Ser Cys Ser Ser Ser Thr Lys Ser Ser Ser Ser

245 250 255

Ser Asp Arg Glu Ser Lys Ser Ser Ser Ser Ser Ser

260 265

<210> 19

<211> 276

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 19

Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg

1 5 10 15

Met Trp Tyr Glu Ser Phe His Arg Gly His Ala Ser Phe Cys Gly Cys

20 25 30

Gly Asn Pro Ile Leu His Ile Thr Ala Leu Ala Glu Thr Tyr Gly His

35 40 45

Pro Thr Gly Pro Arg Pro Ser Gly Pro Pro Gly Val Asp Pro Asn Pro

50 55 60

His Ile Arg Arg Ala Arg Pro Ala Pro Ala Ala Pro Glu Pro Ser Gln

65 70 75 80

Val Asp Ser Arg Pro Ala Leu Thr Trp His Gly Asp Gly Gly Ser Asp

85 90 95

Gly Gly Ala Gly Gly Ser Gly Ser Gly Gly Pro Val Ala Asp Phe Ala

100 105 110

Asp Asp Gly Leu Asp Gln Leu Val Ala Ala Leu Asp Asp Glu Glu Pro

115 120 125

Lys Lys Ala Ser Gly Arg His Pro Lys Thr Arg Asn Pro Arg Arg Lys

130 135 140

Leu Thr Phe Thr Pro Lys Arg Ile Glu Thr Val Gly Asp Arg Gly Arg

145 150 155 160

Lys Arg Asp Arg Ser Pro Leu Ala Arg Glu Pro Arg Gly Pro Leu Pro

165 170 175

Thr Ala Val Ala Ala Ala Val Pro Arg Ala Ala Gln Ala Gln Thr Gly

180 185 190

Asn Gln Ser Pro Leu Arg Ala Ala His Lys Asp Pro Thr Arg Gly Pro

195 200 205

Cys Lys Pro Met Pro Thr Val Gly Pro Arg Gln Trp Leu Phe Pro Glu

210 215 220

Arg Lys Pro Ala Pro Ala Pro Ser Ser Gly Asp Trp Ala Met Glu Phe

225 230 235 240

Leu Ala Ala Lys Ile Phe Asp Arg Pro Val Arg Ser Asn Leu Lys Asp

245 250 255

Thr Pro Tyr Tyr Pro Tyr Val Lys Asn Gln Tyr Asn Val Tyr Phe Asp

260 265 270

Leu Lys Phe Glu

275

<210> 20

<211> 167

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 20

Met Ser Phe Trp Lys Pro Pro Val His Asn Val Thr Gly Ile Gln Arg

1 5 10 15

Met Trp Pro Lys Lys Ala Ser Gly Arg His Pro Lys Thr Arg Asn Pro

20 25 30

Arg Arg Lys Leu Thr Phe Thr Pro Lys Arg Ile Glu Thr Val Gly Asp

35 40 45

Arg Gly Arg Lys Arg Asp Arg Ser Pro Leu Ala Arg Glu Pro Arg Gly

50 55 60

Pro Leu Pro Thr Ala Val Ala Ala Ala Val Pro Arg Ala Ala Gln Ala

65 70 75 80

Gln Thr Gly Asn Gln Ser Pro Leu Arg Ala Ala His Lys Asp Pro Thr

85 90 95

Arg Gly Pro Cys Lys Pro Met Pro Thr Val Gly Pro Arg Gln Trp Leu

100 105 110

Phe Pro Glu Arg Lys Pro Ala Pro Ala Pro Ser Ser Gly Asp Trp Ala

115 120 125

Met Glu Phe Leu Ala Ala Lys Ile Phe Asp Arg Pro Val Arg Ser Asn

130 135 140

Leu Lys Asp Thr Pro Tyr Tyr Pro Tyr Val Lys Asn Gln Tyr Asn Val

145 150 155 160

Tyr Phe Asp Leu Lys Phe Glu

165

<210> 21

<211> 743

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 21

Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys

1 5 10 15

Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg

20 25 30

Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg

35 40 45

Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg

50 55 60

Arg Gly Arg Lys Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val

65 70 75 80

Ile Lys Arg Cys Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly

85 90 95

Asn Gly Thr Phe Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile

100 105 110

Met Lys Gly Pro Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu

115 120 125

Tyr Ile Leu Phe Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg

130 135 140

Ser Asn Asp Asn Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys

145 150 155 160

Ile Tyr Arg His Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg

165 170 175

Thr Pro Leu Gly Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly

180 185 190

Asn Ala Ile Leu Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr

195 200 205

Arg Pro Lys Gly Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr

210 215 220

Leu Phe Thr Asp Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr

225 230 235 240

Leu Phe Asn Ile Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys

245 250 255

Ser Pro Gln Thr Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser

260 265 270

Val Tyr Asn Asn Tyr Leu Ser Ile Asn Thr Phe Asn Asn Asp Asn Ser

275 280 285

Asp Ser Lys Leu Lys Glu Phe Leu Asn Lys Ala Phe Pro Thr Thr Gly

290 295 300

Thr Lys Gly Thr Ser Leu Asn Ala Leu Asn Thr Phe Arg Thr Glu Gly

305 310 315 320

Cys Ile Ser His Pro Gln Leu Lys Lys Pro Asn Pro Gln Ile Asn Lys

325 330 335

Pro Leu Glu Ser Gln Tyr Phe Ala Pro Leu Asp Ala Leu Trp Gly Asp

340 345 350

Pro Ile Tyr Tyr Asn Asp Leu Asn Glu Asn Lys Ser Leu Asn Asp Ile

355 360 365

Ile Glu Lys Ile Leu Ile Lys Asn Met Ile Thr Tyr His Ala Lys Leu

370 375 380

Arg Glu Phe Pro Asn Ser Tyr Gln Gly Asn Lys Ala Phe Cys His Leu

385 390 395 400

Thr Gly Ile Tyr Ser Pro Pro Tyr Leu Asn Gln Gly Arg Ile Ser Pro

405 410 415

Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp

420 425 430

Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr Lys Glu Asn

435 440 445

Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr Asp Met Pro

450 455 460

Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys Lys Asp Thr

465 470 475 480

Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu Ile Cys Pro

485 490 495

Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp Tyr Gly Tyr

500 505 510

Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro Asp Gly Ser

515 520 525

Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro Thr Val Leu

530 535 540

His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly Pro Phe Ala

545 550 555 560

Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys Tyr Cys Phe

565 570 575

Asn Phe Asn Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp

580 585 590

Pro Ser Phe Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro

595 600 605

Arg Arg Ile Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser

610 615 620

Phe Arg Ser Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile

625 630 635 640

Lys Arg Val Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly

645 650 655

Pro Lys Lys Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu

660 665 670

Ser Ser His Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu

675 680 685

Glu Ser Glu Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe

690 695 700

Gln Gln Gln Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln

705 710 715 720

Gly Ile Lys Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val

725 730 735

His Val Asn Pro Cys Leu Arg

740

<210> 22

<211> 194

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 22

Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys

1 5 10 15

Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg

20 25 30

Arg Arg Pro Arg Arg Arg Arg Ile Val Lys Asp Pro Ser Phe Gln Pro

35 40 45

Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro Arg Arg Ile Gln Val

50 55 60

Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser Phe Arg Ser Trp Asp

65 70 75 80

Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile Lys Arg Val Ser Glu

85 90 95

Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly Pro Lys Lys Pro Arg

100 105 110

Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu Ser Ser His Ser Leu

115 120 125

Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu Glu Ser Glu Thr Glu

130 135 140

Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe Gln Gln Gln Leu Gln

145 150 155 160

Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln Gly Ile Lys Val Leu

165 170 175

Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val His Val Asn Pro Cys

180 185 190

Leu Arg

<210> 23

<211> 113

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 23

Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys

1 5 10 15

Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg

20 25 30

Arg Arg Pro Arg Arg Arg Arg Ala Gln Lys Ser Leu Gly Ser Thr Ser

35 40 45

Gln Asn Lys Lys Pro Lys Lys Lys Ala His Ile His Ser Lys Glu Asn

50 55 60

Arg Asp Arg Gly Arg Pro Arg Lys Lys Ala Arg Gln Lys Pro Ser Arg

65 70 75 80

Lys Arg Ala Lys Arg Ser Pro Ser Asn Ser Ser Cys Ser Ser Ser Thr

85 90 95

Lys Ser Ser Ser Ser Ser Asp Arg Glu Ser Lys Ser Ser Ser Ser Ser

100 105 110

Ser

<210> 24

<400> 24

000

<210> 25

<400> 25

000

<210> 26

<400> 26

000

<210> 27

<400> 27

000

<210> 28

<400> 28

000

<210> 29

<400> 29

000

<210> 30

<400> 30

000

<210> 31

<400> 31

000

<210> 32

<400> 32

000

<210> 33

<400> 33

000

<210> 34

<400> 34

000

<210> 35

<400> 35

000

<210> 36

<400> 36

000

<210> 37

<400> 37

000

<210> 38

<400> 38

000

<210> 39

<400> 39

000

<210> 40

<400> 40

000

<210> 41

<400> 41

000

<210> 42

<400> 42

000

<210> 43

<400> 43

000

<210> 44

<400> 44

000

<210> 45

<400> 45

000

<210> 46

<400> 46

000

<210> 47

<400> 47

000

<210> 48

<400> 48

000

<210> 49

<400> 49

000

<210> 50

<400> 50

000

<210> 51

<400> 51

000

<210> 52

<400> 52

000

<210> 53

<400> 53

000

<210> 54

<211> 2979

<212> DNA

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 54

taataaatat tcaacaggaa aaccacctaa tttaaattgc cgaccacaaa ccgtcactta 60

gttccccttt ttgcaacaac ttctgctttt ttccaactgc cggaaaacca cataatttgc 120

atggctaacc acaaactgat atgctaatta acttccacaa aacaacttcc ccttttaaaa 180

ccacacctac aaattaatta ttaaacacag tcacatcctg ggaggtacta ccacactata 240

ataccaagtg cacttccgaa tggctgagtt tatgccgcta gacggagaac gcatcagtta 300

ctgactgcgg actgaacttg ggcgggtgcc gaaggtgagt gaaaccaccg aagtcaaggg 360

gcaattcggg ctagttcagt ctagcggaac gggcaagaaa cttaaaatta ttttattttt 420

cagatgagcg actgctttaa accaacatgc tacaacaaca aaacaaagca aactcactgg 480

attaataacc tgcatttaac ccacgacctg atctgcttct gcccaacacc aactagacac 540

ttattactag ctttagcaga acaacaagaa acaattgaag tgtctaaaca agaaaaagaa 600

aaaataacaa gatgccttat tactacagaa gaagacggta caactacaga cgtcctagat 660

ggtatggacg aggttggatt agacgccctt ttcgcagaag atttcgaaga aaaagaaggg 720

taagacctac ttatactact attcctctaa agcaatggca accgccatat aaaagaacat 780

gctatataaa aggacaagac tgtttaatat actatagcaa cttaagactg ggaatgaata 840

gtacaatgta tgaaaaaagt attgtacctg tacattggcc gggagggggt tctttttctg 900

taagcatgtt aactttagat gccttgtatg atatacataa actttgtaga aactggtgga 960

catccacaaa ccaagactta ccactagtaa gatataaagg atgcaaaata acattttatc 1020

aaagcacatt tacagactac atagtaagaa tacatacaga actaccagct aacagtaaca 1080

aactaacata cccaaacaca catccactaa tgatgatgat gtctaagtac aaacacatta 1140

tacctagtag acaaacaaga agaaaaaaga aaccatacac aaaaatattt gtaaaaccac 1200

ctccgcaatt tgaaaacaaa tggtactttg ctacagacct ctacaaaatt ccattactac 1260

aaatacactg cacagcatgc aacttacaaa acccatttgt aaaaccagac aaattatcaa 1320

acaatgttac attatggtca ctaaacacca taagcataca aaatagaaac atgtcagtgg 1380

atcaaggaca atcatggcca tttaaaatac taggaacaca aagcttttat ttttactttt 1440

acaccggagc aaacctacca ggtgacacaa cacaaatacc agtagcagac ctattaccac 1500

taacaaaccc aagaataaac agaccaggac aatcactaaa tgaggcaaaa attacagacc 1560

atattacttt cacagaatac aaaaacaaat ttacaaatta ttggggtaac ccatttaata 1620

aacacattca agaacaccta gatatgatac tatactcact aaaaagtcca gaagcaataa 1680

aaaacgaatg gacaacagaa aacatgaaat ggaaccaatt aaacaatgca ggaacaatgg 1740

cattaacacc atttaacgag ccaatattca cacaaataca atataaccca gatagagaca 1800

caggagaaga cactcaatta tacctactct ctaacgctac aggaacagga tgggacccac 1860

caggaattcc agaattaata ctagaaggat ttccactatg gttaatatat tggggatttg 1920

cagactttca aaaaaaccta aaaaaagtaa caaacataga cacaaattac atgttagtag 1980

caaaaacaaa atttacacaa aaacctggca cattctactt agtaatacta aatgacacct 2040

ttgtagaagg caatagccca tatgaaaaac aacctttacc tgaagacaac attaaatggt 2100

acccacaagt acaataccaa ttagaagcac aaaacaaact actacaaact gggccattta 2160

caccaaacat acaaggacaa ctatcagaca atatatcaat gttttataaa ttttacttta 2220

aatggggagg aagcccacca aaagcaatta atgttgaaaa tcctgcccac cagattcaat 2280

atcccatacc ccgtaacgag catgaaacaa cttcgttaca gagtccaggg gaagccccag 2340

aatccatctt atactccttc gactatagac acgggaacta cacaacaaca gctttgtcac 2400

gaattagcca agactgggca cttaaagaca ctgtttctaa aattacagag ccagatcgac 2460

agcaactgct caaacaagcc ctcgaatgcc tgcaaatctc ggaagaaacg caggagaaaa 2520

aagaaaaaga agtacagcag ctcatcagca acctcagaca gcagcagcag ctgtacagag 2580

agcgaataat atcattatta aaggaccaat aacttttaac tgtgtaaaaa aggtgaaatt 2640

gtttgatgat aaaccaaaaa accgtagatt tacacctgag gaatttgaaa ctgagttaca 2700

aatagcaaaa tggttaaaga gacccccaag atcctttgta aatgatcctc ccttttaccc 2760

atggttacca cctgaacctg ttgtaaactt taagcttaat tttactgaat aaaggccagc 2820

attaattcac ttaaggagtc tgtttattta agttaaacct taataaacgg tcaccgcctc 2880

cctaatacgc aggcgcagaa agggggctcc gcccccttta acccccaggg ggctccgccc 2940

cctgaaaccc ccaagggggc tacgccccct tacaccccc 2979

<210> 55

<211> 99

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 55

Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln

1 5 10 15

Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe

20 25 30

Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln

35 40 45

Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys

50 55 60

Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly

65 70 75 80

Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu

85 90 95

Lys Glu Gly

<210> 56

<211> 203

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 56

Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln

1 5 10 15

Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe

20 25 30

Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln

35 40 45

Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys

50 55 60

Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly

65 70 75 80

Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu

85 90 95

Lys Glu Gly Phe Asn Ile Pro Tyr Pro Val Thr Ser Met Lys Gln Leu

100 105 110

Arg Tyr Arg Val Gln Gly Lys Pro Gln Asn Pro Ser Tyr Thr Pro Ser

115 120 125

Thr Ile Asp Thr Gly Thr Thr Gln Gln Gln Leu Cys His Glu Leu Ala

130 135 140

Lys Thr Gly His Leu Lys Thr Leu Phe Leu Lys Leu Gln Ser Gln Ile

145 150 155 160

Asp Ser Asn Cys Ser Asn Lys Pro Ser Asn Ala Cys Lys Ser Arg Lys

165 170 175

Lys Arg Arg Arg Lys Lys Lys Lys Lys Tyr Ser Ser Ser Ser Ala Thr

180 185 190

Ser Asp Ser Ser Ser Ser Cys Thr Glu Ser Glu

195 200

<210> 57

<211> 219

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 57

Met Ser Asp Cys Phe Lys Pro Thr Cys Tyr Asn Asn Lys Thr Lys Gln

1 5 10 15

Thr His Trp Ile Asn Asn Leu His Leu Thr His Asp Leu Ile Cys Phe

20 25 30

Cys Pro Thr Pro Thr Arg His Leu Leu Leu Ala Leu Ala Glu Gln Gln

35 40 45

Glu Thr Ile Glu Val Ser Lys Gln Glu Lys Glu Lys Ile Thr Arg Cys

50 55 60

Leu Ile Thr Thr Glu Glu Asp Gly Thr Thr Thr Asp Val Leu Asp Gly

65 70 75 80

Met Asp Glu Val Gly Leu Asp Ala Leu Phe Ala Glu Asp Phe Glu Glu

85 90 95

Lys Glu Gly Ala Arg Ser Thr Ala Thr Ala Gln Thr Ser Pro Arg Met

100 105 110

Pro Ala Asn Leu Gly Arg Asn Ala Gly Glu Lys Arg Lys Arg Ser Thr

115 120 125

Ala Ala His Gln Gln Pro Gln Thr Ala Ala Ala Ala Val Gln Arg Ala

130 135 140

Asn Asn Ile Ile Ile Lys Gly Pro Ile Thr Phe Asn Cys Val Lys Lys

145 150 155 160

Val Lys Leu Phe Asp Asp Lys Pro Lys Asn Arg Arg Phe Thr Pro Glu

165 170 175

Glu Phe Glu Thr Glu Leu Gln Ile Ala Lys Trp Leu Lys Arg Pro Pro

180 185 190

Arg Ser Phe Val Asn Asp Pro Pro Phe Tyr Pro Trp Leu Pro Pro Glu

195 200 205

Pro Val Val Asn Phe Lys Leu Asn Phe Thr Glu

210 215

<210> 58

<211> 666

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 58

Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg

1 5 10 15

Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg

20 25 30

Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln

35 40 45

Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys

50 55 60

Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr

65 70 75 80

Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser

85 90 95

Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys

100 105 110

Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr

115 120 125

Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile

130 135 140

Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr

145 150 155 160

Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile

165 170 175

Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile

180 185 190

Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr

195 200 205

Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn

210 215 220

Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr

225 230 235 240

Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val

245 250 255

Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe

260 265 270

Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln

275 280 285

Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg

290 295 300

Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe

305 310 315 320

Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn

325 330 335

Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser

340 345 350

Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn

355 360 365

Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro

370 375 380

Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp

385 390 395 400

Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro

405 410 415

Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile

420 425 430

Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn

435 440 445

Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys

450 455 460

Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly

465 470 475 480

Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp

485 490 495

Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln

500 505 510

Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile

515 520 525

Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys

530 535 540

Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro

545 550 555 560

Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro

565 570 575

Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr

580 585 590

Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val

595 600 605

Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu

610 615 620

Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu

625 630 635 640

Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg

645 650 655

Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

660 665

<210> 59

<211> 148

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 59

Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg

1 5 10 15

Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg

20 25 30

Arg Lys Arg Arg Ile Gln Tyr Pro Ile Pro Arg Asn Glu His Glu Thr

35 40 45

Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro Glu Ser Ile Leu Tyr Ser

50 55 60

Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr Thr Ala Leu Ser Arg Ile

65 70 75 80

Ser Gln Asp Trp Ala Leu Lys Asp Thr Val Ser Lys Ile Thr Glu Pro

85 90 95

Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu Glu Cys Leu Gln Ile Ser

100 105 110

Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu Val Gln Gln Leu Ile Ser

115 120 125

Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg Glu Arg Ile Ile Ser Leu

130 135 140

Leu Lys Asp Gln

145

<210> 60

<211> 82

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 60

Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg

1 5 10 15

Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg

20 25 30

Arg Lys Arg Arg Ser Gln Ile Asp Ser Asn Cys Ser Asn Lys Pro Ser

35 40 45

Asn Ala Cys Lys Ser Arg Lys Lys Arg Arg Arg Lys Lys Lys Lys Lys

50 55 60

Tyr Ser Ser Ser Ser Ala Thr Ser Asp Ser Ser Ser Ser Cys Thr Glu

65 70 75 80

Ser Glu

<210> 61

<400> 61

000

<210> 62

<400> 62

000

<210> 63

<400> 63

000

<210> 64

<400> 64

000

<210> 65

<400> 65

000

<210> 66

<400> 66

000

<210> 67

<400> 67

000

<210> 68

<400> 68

000

<210> 69

<400> 69

000

<210> 70

<400> 70

000

<210> 71

<400> 71

000

<210> 72

<400> 72

000

<210> 73

<400> 73

000

<210> 74

<400> 74

000

<210> 75

<400> 75

000

<210> 76

<400> 76

000

<210> 77

<400> 77

000

<210> 78

<400> 78

000

<210> 79

<400> 79

000

<210> 80

<400> 80

000

<210> 81

<400> 81

000

<210> 82

<400> 82

000

<210> 83

<400> 83

000

<210> 84

<400> 84

000

<210> 85

<400> 85

000

<210> 86

<400> 86

000

<210> 87

<400> 87

000

<210> 88

<400> 88

000

<210> 89

<400> 89

000

<210> 90

<400> 90

000

<210> 91

<400> 91

000

<210> 92

<400> 92

000

<210> 93

<400> 93

000

<210> 94

<400> 94

000

<210> 95

<400> 95

000

<210> 96

<400> 96

000

<210> 97

<400> 97

000

<210> 98

<400> 98

000

<210> 99

<400> 99

000

<210> 100

<400> 100

000

<210> 101

<400> 101

000

<210> 102

<400> 102

000

<210> 103

<400> 103

000

<210> 104

<400> 104

000

<210> 105

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 105

cgggtgccgk aggtgagttt acacaccgma gtcaaggggc aattcgggct crggactggc 60

cgggcyhtgg g 71

<210> 106

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 106

cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggctwtgg g 71

<210> 107

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 107

cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggctatgg g 71

<210> 108

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 108

cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggccctgg g 71

<210> 109

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 109

cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggctttgg g 71

<210> 110

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 110

cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggctatgg g 71

<210> 111

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 111

cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60

cgggctttgg g 71

<210> 112

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 112

cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggcyhtgg g 71

<210> 113

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 113

cgggtgccgt aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggctatgg g 71

<210> 114

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 114

cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggcccggg 70

<210> 115

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 115

cgggtgccgg aggtgagttt acacaccgaa gtcaaggggc aattcgggct caggactggc 60

cgggctttgg g 71

<210> 116

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 116

cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggaggccg 60

ggccatggg 69

<210> 117

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 117

cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggccccgg g 71

<210> 118

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 118

cgggtgccgg aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggctatgg g 71

<210> 119

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 119

cgggtgccga aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 60

cgggctatgg g 71

<210> 120

<211> 117

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<220>

<221> 尚未归类的特征

<222> (10)..(10)

<223> 可能存在或可能不存在

<220>

<221> 尚未归类的特征

<222> (12)..(12)

<223> 可能存在或可能不存在

<220>

<221> 尚未归类的特征

<222> (30)..(32)

<223> 可能存在或可能不存在

<220>

<221> 尚未归类的特征

<222> (34)..(34)

<223> 可能存在或可能不存在

<220>

<221> 尚未归类的特征

<222> (43)..(46)

<223> 可能存在或可能不存在

<220>

<221> 尚未归类的特征

<222> (52)..(54)

<223> 可能存在或可能不存在

<220>

<221> 尚未归类的特征

<222> (70)..(71)

<223> 可能存在或可能不存在

<220>

<221> 尚未归类的特征

<222> (89)..(90)

<223> 可能存在或可能不存在

<220>

<221> 尚未归类的特征

<222> (103)..(103)

<223> 可能存在或可能不存在

<400> 120

cggcggsggs gcsscgcgct dcgcgcgcsg cccrsyrggg grdssmmwgc skcscccccc 60

cscgcgcatg cgcrcgggkc ccccccccyv sggggggctc cgcccccccg gcccccc 117

<210> 121

<211> 169

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<220>

<221> 修饰的碱基

<222> (20)..(20)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (22)..(22)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (40)..(42)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (53)..(56)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (62)..(62)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (64)..(64)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (97)..(98)

<223> a、c、t、g、未知或其他

<400> 121

gccgccgcgg cggcggsggn gnsgcgcgct dcgcgcgcsn nncrccrggg ggnnnncwgc 60

sncncccccc cccgcgcatg cgcgggkccc ccccccnncg gggggctccg ccccccggcc 120

cccccccgtg ctaaacccac cgcgcatgcg cgaccacgcc cccgccgcc 169

<210> 122

<211> 79

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<220>

<221> 修饰的碱基

<222> (20)..(20)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (22)..(22)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (40)..(42)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (53)..(56)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (62)..(62)

<223> a、c、t、g、未知或其他

<220>

<221> 修饰的碱基

<222> (64)..(64)

<223> a、c、t、g、未知或其他

<400> 122

gccgccgcgg cggcggsggn gnsgcgcgct dcgcgcgcsn nncrccrggg ggnnnncwgc 60

sncncccccc cccgcgcat 79

<210> 123

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<220>

<221> 修饰的碱基

<222> (18)..(19)

<223> a、c、t、g、未知或其他

<400> 123

gcgcgggkcc cccccccnnc ggggggctcc g 31

<210> 124

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 124

ccccccggcc cccccccgtg ctaaacccac cgcgcatgcg cgaccacgcc cccgccgcc 59

<210> 125

<211> 156

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 125

gcggcggggg ggcggccgcg ttcgcgcgcc gcccaccagg gggtgctgcg cgcccccccc 60

cgcgcatgcg cggggccccc ccccgggggg gctccgcccc cccggccccc ccccgtgcta 120

aacccaccgc gcatgcgcga ccacgccccc gccgcc 156

<210> 126

<211> 7

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 126

gcggcgg 7

<210> 127

<211> 7

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 127

gggggcg 7

<210> 128

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 128

gccgcg 6

<210> 129

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 129

ttcgcgcgcc gcccaccagg gggtg 25

<210> 130

<211> 5

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 130

ctgcg 5

<210> 131

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 131

cgcccccccc cgcgcat 17

<210> 132

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 132

gcgcggggcc ccccccc 17

<210> 133

<211> 72

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 133

gggggggctc cgcccccccg gccccccccc gtgctaaacc caccgcgcat gcgcgaccac 60

gcccccgccg cc 72

<210> 134

<211> 115

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 134

cggcggcggc ggcgcgcgcg ctgcgcgcgc gcgccggggg ggcgccagcg cccccccccc 60

cgcgcatgca cgggtccccc cccccacggg gggctccgcc ccccggcccc ccccc 115

<210> 135

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 135

cggcggcggc ggcg 14

<210> 136

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 136

cgcgcgctgc gcgcgcg 17

<210> 137

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 137

cgccgggggg gcgccagcg 19

<210> 138

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 138

cccccccccc cgcgcat 17

<210> 139

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 139

gcacgggtcc ccccccccac ggggggctcc g 31

<210> 140

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 140

ccccccggcc ccccccc 17

<210> 141

<211> 121

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 141

ccgtcggcgg gggggccgcg cgctgcgcgc gcggcccccg ggggaggcac agcctccccc 60

ccccgcgcgc atgcgcgcgg gtcccccccc ctccgggggg ctccgccccc cggccccccc 120

c 121

<210> 142

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 142

ccgtcggcgg gggggccgcg cgctgcgcgc gcggccc 37

<210> 143

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 143

ccgggggagg cacagcctcc cccccccgcg cgcatgcgcg cgggtccccc cccctccggg 60

gggctccgcc ccccggcccc cccc 84

<210> 144

<211> 104

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 144

cggcggcggc gcgcgcgcta cgcgcgcgcg ccggggggct gccgcccccc ccccgcgcat 60

gcgcggggcc cccccccgcg gggggctccg ccccccggcc cccc 104

<210> 145

<211> 11

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 145

cggcggcggc g 11

<210> 146

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 146

cgcgcgctac gcgcgcg 17

<210> 147

<211> 10

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 147

cgccgggggg 10

<210> 148

<211> 7

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 148

ctgccgc 7

<210> 149

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 149

cccccccccg cgcat 15

<210> 150

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 150

gcgcggggcc ccccccc 17

<210> 151

<211> 13

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 151

gcggggggct ccg 13

<210> 152

<211> 14

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 152

ccccccggcc cccc 14

<210> 153

<211> 122

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 153

gccgccgcgg cggcgggggg cggcgcgctg cgcgcgccgc ccagtagggg gagccatgcg 60

cccccccccg cgcatgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc 120

cg 122

<210> 154

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 154

gccgccgcgg cggcggggg 19

<210> 155

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 155

gcggcgcgct gcgcgcgccg cccagtaggg ggagccatgc g 41

<210> 156

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 156

cccccccccg cgcat 15

<210> 157

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 157

gcgcggggcc ccccccc 17

<210> 158

<211> 13

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 158

gcggggggct ccg 13

<210> 159

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 159

ccccccggcc ccccccg 17

<210> 160

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 160

cgcgctgcgc gcgccgccca gtagggggag ccatgc 36

<210> 161

<211> 78

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 161

ccgccatctt aagtagttga ggcggacggt ggcgtgagtt caaaggtcac catcagccac 60

acctactcaa aatggtgg 78

<210> 162

<211> 172

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 162

cttaagtagt tgaggcggac ggtggcgtga gttcaaaggt caccatcagc cacacctact 60

caaaatggtg gacaatttct tccgggtcaa aggttacagc cgccatgtta aaacacgtga 120

cgtatgacgt cacggccgcc attttgtgac acaagatggc cgacttcctt cc 172

<210> 163

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 163

cgcgctgcgc gcgccgccca gtagggggag ccatgc 36

<210> 164

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 164

gcgctdcgcg cgcgcgccgg ggggctgcgc cccccc 36

<210> 165

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 165

gcgcttcgcg cgccgcccac tagggggcgt tgcgcg 36

<210> 166

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 166

gcgctgcgcg cgccgcccag tagggggcgc aatgcg 36

<210> 167

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 167

gcgctgcgcg cgcggccccc gggggaggca ttgcct 36

<210> 168

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 168

gcgctgcgcg cgcgcgccgg gggggcgcca gcgccc 36

<210> 169

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 169

gcgcttcgcg cgcgcgccgg ggggctccgc cccccc 36

<210> 170

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 170

gcgcttcgcg cgcgcgccgg ggggctgcgc cccccc 36

<210> 171

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 171

gcgctacgcg cgcgcgccgg ggggctgcgc cccccc 36

<210> 172

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<400> 172

gcgctacgcg cgcgcgccgg ggggctctgc cccccc 36

<210> 173

<400> 173

000

<210> 174

<400> 174

000

<210> 175

<400> 175

000

<210> 176

<400> 176

000

<210> 177

<400> 177

000

<210> 178

<400> 178

000

<210> 179

<400> 179

000

<210> 180

<400> 180

000

<210> 181

<400> 181

000

<210> 182

<400> 182

000

<210> 183

<400> 183

000

<210> 184

<400> 184

000

<210> 185

<211> 743

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 185

Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys

1 5 10 15

Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg

20 25 30

Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg

35 40 45

Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg

50 55 60

Arg Gly Arg Lys Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val

65 70 75 80

Ile Lys Arg Cys Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly

85 90 95

Asn Gly Thr Phe Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile

100 105 110

Met Lys Gly Pro Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu

115 120 125

Tyr Ile Leu Phe Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg

130 135 140

Ser Asn Asp Asn Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys

145 150 155 160

Ile Tyr Arg His Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg

165 170 175

Thr Pro Leu Gly Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly

180 185 190

Asn Ala Ile Leu Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr

195 200 205

Arg Pro Lys Gly Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr

210 215 220

Leu Phe Thr Asp Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr

225 230 235 240

Leu Phe Asn Ile Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys

245 250 255

Ser Pro Gln Thr Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser

260 265 270

Val Tyr Asn Asn Tyr Leu Ser Ile Asn Thr Phe Asn Asn Asp Asn Ser

275 280 285

Asp Ser Lys Leu Lys Glu Phe Leu Asn Lys Ala Phe Pro Thr Thr Gly

290 295 300

Thr Lys Gly Thr Ser Leu Asn Ala Leu Asn Thr Phe Arg Thr Glu Gly

305 310 315 320

Cys Ile Ser His Pro Gln Leu Lys Lys Pro Asn Pro Gln Ile Asn Lys

325 330 335

Pro Leu Glu Ser Gln Tyr Phe Ala Pro Leu Asp Ala Leu Trp Gly Asp

340 345 350

Pro Ile Tyr Tyr Asn Asp Leu Asn Glu Asn Lys Ser Leu Asn Asp Ile

355 360 365

Ile Glu Lys Ile Leu Ile Lys Asn Met Ile Thr Tyr His Ala Lys Leu

370 375 380

Arg Glu Phe Pro Asn Ser Tyr Gln Gly Asn Lys Ala Phe Cys His Leu

385 390 395 400

Thr Gly Ile Tyr Ser Pro Pro Tyr Leu Asn Gln Gly Arg Ile Ser Pro

405 410 415

Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro Tyr Thr Asp

420 425 430

Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr Lys Glu Asn

435 440 445

Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr Asp Met Pro

450 455 460

Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys Lys Asp Thr

465 470 475 480

Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu Ile Cys Pro

485 490 495

Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp Tyr Gly Tyr

500 505 510

Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro Asp Gly Ser

515 520 525

Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro Thr Val Leu

530 535 540

His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly Pro Phe Ala

545 550 555 560

Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys Tyr Cys Phe

565 570 575

Asn Phe Asn Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp

580 585 590

Pro Ser Phe Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro

595 600 605

Arg Arg Ile Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser

610 615 620

Phe Arg Ser Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile

625 630 635 640

Lys Arg Val Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly

645 650 655

Pro Lys Lys Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu

660 665 670

Ser Ser His Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu

675 680 685

Glu Ser Glu Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe

690 695 700

Gln Gln Gln Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln

705 710 715 720

Gly Ile Lys Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val

725 730 735

His Val Asn Pro Cys Leu Arg

740

<210> 186

<211> 68

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 186

Met Ala Trp Gly Trp Trp Lys Arg Arg Arg Arg Trp Trp Phe Arg Lys

1 5 10 15

Arg Trp Thr Arg Gly Arg Leu Arg Arg Arg Trp Pro Arg Ser Ala Arg

20 25 30

Arg Arg Pro Arg Arg Arg Arg Val Arg Arg Arg Arg Arg Trp Arg Arg

35 40 45

Gly Arg Arg Lys Thr Arg Thr Tyr Arg Arg Arg Arg Arg Phe Arg Arg

50 55 60

Arg Gly Arg Lys

65

<210> 187

<211> 212

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 187

Ala Lys Leu Ile Ile Lys Leu Trp Gln Pro Ala Val Ile Lys Arg Cys

1 5 10 15

Arg Ile Lys Gly Tyr Ile Pro Leu Ile Ile Ser Gly Asn Gly Thr Phe

20 25 30

Ala Thr Asn Phe Thr Ser His Ile Asn Asp Arg Ile Met Lys Gly Pro

35 40 45

Phe Gly Gly Gly His Ser Thr Met Arg Phe Ser Leu Tyr Ile Leu Phe

50 55 60

Glu Glu His Leu Arg His Met Asn Phe Trp Thr Arg Ser Asn Asp Asn

65 70 75 80

Leu Glu Leu Thr Arg Tyr Leu Gly Ala Ser Val Lys Ile Tyr Arg His

85 90 95

Pro Asp Gln Asp Phe Ile Val Ile Tyr Asn Arg Arg Thr Pro Leu Gly

100 105 110

Gly Asn Ile Tyr Thr Ala Pro Ser Leu His Pro Gly Asn Ala Ile Leu

115 120 125

Ala Lys His Lys Ile Leu Val Pro Ser Leu Gln Thr Arg Pro Lys Gly

130 135 140

Arg Lys Ala Ile Arg Leu Arg Ile Ala Pro Pro Thr Leu Phe Thr Asp

145 150 155 160

Lys Trp Tyr Phe Gln Lys Asp Ile Ala Asp Leu Thr Leu Phe Asn Ile

165 170 175

Met Ala Val Glu Ala Asp Leu Arg Phe Pro Phe Cys Ser Pro Gln Thr

180 185 190

Asp Asn Thr Cys Ile Ser Phe Gln Val Leu Ser Ser Val Tyr Asn Asn

195 200 205

Tyr Leu Ser Ile

210

<210> 188

<211> 133

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 188

Asn Thr Phe Asn Asn Asp Asn Ser Asp Ser Lys Leu Lys Glu Phe Leu

1 5 10 15

Asn Lys Ala Phe Pro Thr Thr Gly Thr Lys Gly Thr Ser Leu Asn Ala

20 25 30

Leu Asn Thr Phe Arg Thr Glu Gly Cys Ile Ser His Pro Gln Leu Lys

35 40 45

Lys Pro Asn Pro Gln Ile Asn Lys Pro Leu Glu Ser Gln Tyr Phe Ala

50 55 60

Pro Leu Asp Ala Leu Trp Gly Asp Pro Ile Tyr Tyr Asn Asp Leu Asn

65 70 75 80

Glu Asn Lys Ser Leu Asn Asp Ile Ile Glu Lys Ile Leu Ile Lys Asn

85 90 95

Met Ile Thr Tyr His Ala Lys Leu Arg Glu Phe Pro Asn Ser Tyr Gln

100 105 110

Gly Asn Lys Ala Phe Cys His Leu Thr Gly Ile Tyr Ser Pro Pro Tyr

115 120 125

Leu Asn Gln Gly Arg

130

<210> 189

<211> 166

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 189

Ile Ser Pro Glu Ile Phe Gly Leu Tyr Thr Glu Ile Ile Tyr Asn Pro

1 5 10 15

Tyr Thr Asp Lys Gly Thr Gly Asn Lys Val Trp Met Asp Pro Leu Thr

20 25 30

Lys Glu Asn Asn Ile Tyr Lys Glu Gly Gln Ser Lys Cys Leu Leu Thr

35 40 45

Asp Met Pro Leu Trp Thr Leu Leu Phe Gly Tyr Thr Asp Trp Cys Lys

50 55 60

Lys Asp Thr Asn Asn Trp Asp Leu Pro Leu Asn Tyr Arg Leu Val Leu

65 70 75 80

Ile Cys Pro Tyr Thr Phe Pro Lys Leu Tyr Asn Glu Lys Val Lys Asp

85 90 95

Tyr Gly Tyr Ile Pro Tyr Ser Tyr Lys Phe Gly Ala Gly Gln Met Pro

100 105 110

Asp Gly Ser Asn Tyr Ile Pro Phe Gln Phe Arg Ala Lys Trp Tyr Pro

115 120 125

Thr Val Leu His Gln Gln Gln Val Met Glu Asp Ile Ser Arg Ser Gly

130 135 140

Pro Phe Ala Pro Lys Val Glu Lys Pro Ser Thr Gln Leu Val Met Lys

145 150 155 160

Tyr Cys Phe Asn Phe Asn

165

<210> 190

<211> 164

<212> PRT

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 190

Trp Gly Gly Asn Pro Ile Ile Glu Gln Ile Val Lys Asp Pro Ser Phe

1 5 10 15

Gln Pro Thr Tyr Glu Ile Pro Gly Thr Gly Asn Ile Pro Arg Arg Ile

20 25 30

Gln Val Ile Asp Pro Arg Val Leu Gly Pro His Tyr Ser Phe Arg Ser

35 40 45

Trp Asp Met Arg Arg His Thr Phe Ser Arg Ala Ser Ile Lys Arg Val

50 55 60

Ser Glu Gln Gln Glu Thr Ser Asp Leu Val Phe Ser Gly Pro Lys Lys

65 70 75 80

Pro Arg Val Asp Ile Pro Lys Gln Glu Thr Gln Glu Glu Ser Ser His

85 90 95

Ser Leu Gln Arg Glu Ser Arg Pro Trp Glu Thr Glu Glu Glu Ser Glu

100 105 110

Thr Glu Ala Leu Ser Gln Glu Ser Gln Glu Val Pro Phe Gln Gln Gln

115 120 125

Leu Gln Gln Gln Tyr Gln Glu Gln Leu Lys Leu Arg Gln Gly Ile Lys

130 135 140

Val Leu Phe Glu Gln Leu Ile Arg Thr Gln Gln Gly Val His Val Asn

145 150 155 160

Pro Cys Leu Arg

<210> 191

<400> 191

000

<210> 192

<400> 192

000

<210> 193

<400> 193

000

<210> 194

<400> 194

000

<210> 195

<400> 195

000

<210> 196

<400> 196

000

<210> 197

<400> 197

000

<210> 198

<400> 198

000

<210> 199

<400> 199

000

<210> 200

<400> 200

000

<210> 201

<400> 201

000

<210> 202

<400> 202

000

<210> 203

<400> 203

000

<210> 204

<400> 204

000

<210> 205

<400> 205

000

<210> 206

<400> 206

000

<210> 207

<400> 207

000

<210> 208

<400> 208

000

<210> 209

<400> 209

000

<210> 210

<400> 210

000

<210> 211

<400> 211

000

<210> 212

<400> 212

000

<210> 213

<400> 213

000

<210> 214

<400> 214

000

<210> 215

<211> 666

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 215

Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg

1 5 10 15

Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg

20 25 30

Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln

35 40 45

Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys

50 55 60

Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met Tyr

65 70 75 80

Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe Ser

85 90 95

Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu Cys

100 105 110

Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr

115 120 125

Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile

130 135 140

Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr

145 150 155 160

Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His Ile

165 170 175

Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile

180 185 190

Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr

195 200 205

Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys Asn

210 215 220

Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val Thr

225 230 235 240

Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser Val

245 250 255

Asp Gln Gly Gln Ser Trp Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe

260 265 270

Tyr Phe Tyr Phe Tyr Thr Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln

275 280 285

Ile Pro Val Ala Asp Leu Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg

290 295 300

Pro Gly Gln Ser Leu Asn Glu Ala Lys Ile Thr Asp His Ile Thr Phe

305 310 315 320

Thr Glu Tyr Lys Asn Lys Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn

325 330 335

Lys His Ile Gln Glu His Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser

340 345 350

Pro Glu Ala Ile Lys Asn Glu Trp Thr Thr Glu Asn Met Lys Trp Asn

355 360 365

Gln Leu Asn Asn Ala Gly Thr Met Ala Leu Thr Pro Phe Asn Glu Pro

370 375 380

Ile Phe Thr Gln Ile Gln Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp

385 390 395 400

Thr Gln Leu Tyr Leu Leu Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro

405 410 415

Pro Gly Ile Pro Glu Leu Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile

420 425 430

Tyr Trp Gly Phe Ala Asp Phe Gln Lys Asn Leu Lys Lys Val Thr Asn

435 440 445

Ile Asp Thr Asn Tyr Met Leu Val Ala Lys Thr Lys Phe Thr Gln Lys

450 455 460

Pro Gly Thr Phe Tyr Leu Val Ile Leu Asn Asp Thr Phe Val Glu Gly

465 470 475 480

Asn Ser Pro Tyr Glu Lys Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp

485 490 495

Tyr Pro Gln Val Gln Tyr Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln

500 505 510

Thr Gly Pro Phe Thr Pro Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile

515 520 525

Ser Met Phe Tyr Lys Phe Tyr Phe Lys Trp Gly Gly Ser Pro Pro Lys

530 535 540

Ala Ile Asn Val Glu Asn Pro Ala His Gln Ile Gln Tyr Pro Ile Pro

545 550 555 560

Arg Asn Glu His Glu Thr Thr Ser Leu Gln Ser Pro Gly Glu Ala Pro

565 570 575

Glu Ser Ile Leu Tyr Ser Phe Asp Tyr Arg His Gly Asn Tyr Thr Thr

580 585 590

Thr Ala Leu Ser Arg Ile Ser Gln Asp Trp Ala Leu Lys Asp Thr Val

595 600 605

Ser Lys Ile Thr Glu Pro Asp Arg Gln Gln Leu Leu Lys Gln Ala Leu

610 615 620

Glu Cys Leu Gln Ile Ser Glu Glu Thr Gln Glu Lys Lys Glu Lys Glu

625 630 635 640

Val Gln Gln Leu Ile Ser Asn Leu Arg Gln Gln Gln Gln Leu Tyr Arg

645 650 655

Glu Arg Ile Ile Ser Leu Leu Lys Asp Gln

660 665

<210> 216

<211> 38

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 216

Met Pro Tyr Tyr Tyr Arg Arg Arg Arg Tyr Asn Tyr Arg Arg Pro Arg

1 5 10 15

Trp Tyr Gly Arg Gly Trp Ile Arg Arg Pro Phe Arg Arg Arg Phe Arg

20 25 30

Arg Lys Arg Arg Val Arg

35

<210> 217

<211> 208

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 217

Pro Thr Tyr Thr Thr Ile Pro Leu Lys Gln Trp Gln Pro Pro Tyr Lys

1 5 10 15

Arg Thr Cys Tyr Ile Lys Gly Gln Asp Cys Leu Ile Tyr Tyr Ser Asn

20 25 30

Leu Arg Leu Gly Met Asn Ser Thr Met Tyr Glu Lys Ser Ile Val Pro

35 40 45

Val His Trp Pro Gly Gly Gly Ser Phe Ser Val Ser Met Leu Thr Leu

50 55 60

Asp Ala Leu Tyr Asp Ile His Lys Leu Cys Arg Asn Trp Trp Thr Ser

65 70 75 80

Thr Asn Gln Asp Leu Pro Leu Val Arg Tyr Lys Gly Cys Lys Ile Thr

85 90 95

Phe Tyr Gln Ser Thr Phe Thr Asp Tyr Ile Val Arg Ile His Thr Glu

100 105 110

Leu Pro Ala Asn Ser Asn Lys Leu Thr Tyr Pro Asn Thr His Pro Leu

115 120 125

Met Met Met Met Ser Lys Tyr Lys His Ile Ile Pro Ser Arg Gln Thr

130 135 140

Arg Arg Lys Lys Lys Pro Tyr Thr Lys Ile Phe Val Lys Pro Pro Pro

145 150 155 160

Gln Phe Glu Asn Lys Trp Tyr Phe Ala Thr Asp Leu Tyr Lys Ile Pro

165 170 175

Leu Leu Gln Ile His Cys Thr Ala Cys Asn Leu Gln Asn Pro Phe Val

180 185 190

Lys Pro Asp Lys Leu Ser Asn Asn Val Thr Leu Trp Ser Leu Asn Thr

195 200 205

<210> 218

<211> 128

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 218

Ile Ser Ile Gln Asn Arg Asn Met Ser Val Asp Gln Gly Gln Ser Trp

1 5 10 15

Pro Phe Lys Ile Leu Gly Thr Gln Ser Phe Tyr Phe Tyr Phe Tyr Thr

20 25 30

Gly Ala Asn Leu Pro Gly Asp Thr Thr Gln Ile Pro Val Ala Asp Leu

35 40 45

Leu Pro Leu Thr Asn Pro Arg Ile Asn Arg Pro Gly Gln Ser Leu Asn

50 55 60

Glu Ala Lys Ile Thr Asp His Ile Thr Phe Thr Glu Tyr Lys Asn Lys

65 70 75 80

Phe Thr Asn Tyr Trp Gly Asn Pro Phe Asn Lys His Ile Gln Glu His

85 90 95

Leu Asp Met Ile Leu Tyr Ser Leu Lys Ser Pro Glu Ala Ile Lys Asn

100 105 110

Glu Trp Thr Thr Glu Asn Met Lys Trp Asn Gln Leu Asn Asn Ala Gly

115 120 125

<210> 219

<211> 163

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 219

Thr Met Ala Leu Thr Pro Phe Asn Glu Pro Ile Phe Thr Gln Ile Gln

1 5 10 15

Tyr Asn Pro Asp Arg Asp Thr Gly Glu Asp Thr Gln Leu Tyr Leu Leu

20 25 30

Ser Asn Ala Thr Gly Thr Gly Trp Asp Pro Pro Gly Ile Pro Glu Leu

35 40 45

Ile Leu Glu Gly Phe Pro Leu Trp Leu Ile Tyr Trp Gly Phe Ala Asp

50 55 60

Phe Gln Lys Asn Leu Lys Lys Val Thr Asn Ile Asp Thr Asn Tyr Met

65 70 75 80

Leu Val Ala Lys Thr Lys Phe Thr Gln Lys Pro Gly Thr Phe Tyr Leu

85 90 95

Val Ile Leu Asn Asp Thr Phe Val Glu Gly Asn Ser Pro Tyr Glu Lys

100 105 110

Gln Pro Leu Pro Glu Asp Asn Ile Lys Trp Tyr Pro Gln Val Gln Tyr

115 120 125

Gln Leu Glu Ala Gln Asn Lys Leu Leu Gln Thr Gly Pro Phe Thr Pro

130 135 140

Asn Ile Gln Gly Gln Leu Ser Asp Asn Ile Ser Met Phe Tyr Lys Phe

145 150 155 160

Tyr Phe Lys

<210> 220

<211> 129

<212> PRT

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 220

Trp Gly Gly Ser Pro Pro Lys Ala Ile Asn Val Glu Asn Pro Ala His

1 5 10 15

Gln Ile Gln Tyr Pro Ile Pro Arg Asn Glu His Glu Thr Thr Ser Leu

20 25 30

Gln Ser Pro Gly Glu Ala Pro Glu Ser Ile Leu Tyr Ser Phe Asp Tyr

35 40 45

Arg His Gly Asn Tyr Thr Thr Thr Ala Leu Ser Arg Ile Ser Gln Asp

50 55 60

Trp Ala Leu Lys Asp Thr Val Ser Lys Ile Thr Glu Pro Asp Arg Gln

65 70 75 80

Gln Leu Leu Lys Gln Ala Leu Glu Cys Leu Gln Ile Ser Glu Glu Thr

85 90 95

Gln Glu Lys Lys Glu Lys Glu Val Gln Gln Leu Ile Ser Asn Leu Arg

100 105 110

Gln Gln Gln Gln Leu Tyr Arg Glu Arg Ile Ile Ser Leu Leu Lys Asp

115 120 125

Gln

<210> 221

<400> 221

000

<210> 222

<400> 222

000

<210> 223

<400> 223

000

<210> 224

<400> 224

000

<210> 225

<400> 225

000

<210> 226

<400> 226

000

<210> 227

<211> 220

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多肽

<220>

<221> 经修饰的残基

<222> (29)..(31)

<223> 任何氨基酸

<220>

<221> 位点

<222> (29)..(31)

<223> 该区域可包含0-3个残基

<220>

<221> 经修饰的残基

<222> (100)..(100)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (125)..(129)

<223> 任何氨基酸

<220>

<221> 位点

<222> (125)..(129)

<223> 该区域可包含1-5个残基

<220>

<221> 经修饰的残基

<222> (181)..(181)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (211)..(211)

<223> 任何氨基酸

<400> 227

Leu Val Leu Thr Gln Trp Gln Pro Asn Thr Val Arg Arg Cys Tyr Ile

1 5 10 15

Arg Gly Tyr Leu Pro Leu Ile Ile Cys Gly Glu Asn Xaa Xaa Xaa Thr

20 25 30

Thr Ser Arg Asn Tyr Ala Thr His Ser Asp Asp Thr Ile Gln Lys Gly

35 40 45

Pro Phe Gly Gly Gly Met Ser Thr Thr Thr Phe Ser Leu Arg Val Leu

50 55 60

Tyr Asp Glu Tyr Gln Arg Phe Met Asn Arg Trp Thr Tyr Ser Asn Glu

65 70 75 80

Asp Leu Asp Leu Ala Arg Tyr Leu Gly Cys Lys Phe Thr Phe Tyr Arg

85 90 95

His Pro Asp Xaa Asp Phe Ile Val Gln Tyr Asn Thr Asn Pro Pro Phe

100 105 110

Lys Asp Thr Lys Leu Thr Ala Pro Ser Ile His Pro Xaa Xaa Xaa Xaa

115 120 125

Xaa Gly Met Leu Met Leu Ser Lys Arg Lys Ile Leu Ile Pro Ser Leu

130 135 140

Lys Thr Arg Pro Lys Gly Lys His Tyr Val Lys Val Arg Ile Gly Pro

145 150 155 160

Pro Lys Leu Phe Glu Asp Lys Trp Tyr Thr Gln Ser Asp Leu Cys Asp

165 170 175

Val Pro Leu Val Xaa Leu Tyr Ala Thr Ala Ala Asp Leu Gln His Pro

180 185 190

Phe Gly Ser Pro Gln Thr Asp Asn Pro Cys Val Thr Phe Gln Val Leu

195 200 205

Gly Ser Xaa Tyr Asn Lys His Leu Ser Ile Ser Pro

210 215 220

<210> 228

<211> 172

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多肽

<220>

<221> 经修饰的残基

<222> (38)..(38)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (44)..(46)

<223> 任何氨基酸

<220>

<221> 位点

<222> (44)..(46)

<223> 该区域可包含0-3个残基

<220>

<221> 经修饰的残基

<222> (77)..(77)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (79)..(79)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (98)..(101)

<223> 任何氨基酸

<220>

<221> 位点

<222> (98)..(101)

<223> 该区域可包含0-4个残基

<400> 228

Ser Asn Phe Glu Phe Pro Gly Ala Tyr Thr Asp Ile Thr Tyr Asn Pro

1 5 10 15

Leu Thr Asp Lys Gly Val Gly Asn Met Val Trp Ile Gln Tyr Leu Thr

20 25 30

Lys Pro Asp Thr Ile Xaa Asp Lys Thr Gln Ser Xaa Xaa Xaa Lys Cys

35 40 45

Leu Ile Glu Asp Leu Pro Leu Trp Ala Ala Leu Tyr Gly Tyr Val Asp

50 55 60

Phe Cys Glu Lys Glu Thr Gly Asp Ser Ala Ile Ile Xaa Asn Xaa Gly

65 70 75 80

Arg Val Leu Ile Arg Cys Pro Tyr Thr Lys Pro Pro Leu Tyr Asp Lys

85 90 95

Thr Xaa Xaa Xaa Xaa Asn Lys Gly Phe Val Pro Tyr Ser Thr Asn Phe

100 105 110

Gly Asn Gly Lys Met Pro Gly Gly Ser Gly Tyr Val Pro Ile Tyr Trp

115 120 125

Arg Ala Arg Trp Tyr Pro Thr Leu Phe His Gln Lys Glu Val Leu Glu

130 135 140

Asp Ile Val Gln Ser Gly Pro Phe Ala Tyr Lys Asp Glu Lys Pro Ser

145 150 155 160

Thr Gln Leu Val Met Lys Tyr Cys Phe Asn Phe Asn

165 170

<210> 229

<211> 258

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多肽

<220>

<221> 经修饰的残基

<222> (20)..(22)

<223> 任何氨基酸

<220>

<221> 位点

<222> (20)..(22)

<223> 该区域可包含0-3个残基

<220>

<221> 经修饰的残基

<222> (25)..(25)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (78)..(78)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (89)..(89)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (91)..(91)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (95)..(98)

<223> 任何氨基酸

<220>

<221> 位点

<222> (95)..(98)

<223> 该区域可包含1-4个残基

<220>

<221> 经修饰的残基

<222> (107)..(120)

<223> 任何氨基酸

<220>

<221> 位点

<222> (107)..(120)

<223> 该区域可包含2-14个残基

<220>

<221> 经修饰的残基

<222> (129)..(129)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (139)..(168)

<223> 任何氨基酸

<220>

<221> 位点

<222> (139)..(168)

<223> 该区域可包含0-30 个残基

<220>

<221> 经修饰的残基

<222> (201)..(204)

<223> 任何氨基酸

<220>

<221> 位点

<222> (201)..(204)

<223> 该区域可包含0-4 个残基

<220>

<221> 经修饰的残基

<222> (219)..(258)

<223> 任何氨基酸

<220>

<221> 位点

<222> (219)..(258)

<223> 该区域可包含0-40 个残基

<400> 229

Trp Gly Gly Asn Pro Ile Ser Gln Gln Val Val Arg Asn Pro Cys Lys

1 5 10 15

Asp Ser Gly Xaa Xaa Xaa Ser Gly Xaa Gly Arg Gln Pro Arg Ser Val

20 25 30

Gln Val Val Asp Pro Lys Tyr Met Gly Pro Glu Tyr Thr Phe His Ser

35 40 45

Trp Asp Trp Arg Arg Gly Leu Phe Gly Glu Lys Ala Ile Lys Arg Met

50 55 60

Ser Glu Gln Pro Thr Asp Asp Glu Ile Phe Thr Gly Gly Xaa Pro Lys

65 70 75 80

Arg Pro Arg Arg Asp Pro Pro Thr Xaa Gln Xaa Pro Glu Glu Xaa Xaa

85 90 95

Xaa Xaa Gln Lys Glu Ser Ser Ser Phe Arg Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Trp Glu Ser Ser Ser Gln Glu

115 120 125

Xaa Glu Ser Glu Ser Gln Glu Glu Glu Glu Xaa Xaa Xaa Xaa Xaa Xaa

130 135 140

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

145 150 155 160

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Glu Gln Thr Val Gln Gln Gln Leu

165 170 175

Arg Gln Gln Leu Arg Glu Gln Arg Arg Leu Arg Val Gln Leu Gln Leu

180 185 190

Leu Phe Gln Gln Leu Leu Lys Thr Xaa Xaa Xaa Xaa Gln Ala Gly Leu

195 200 205

His Ile Asn Pro Leu Leu Leu Ser Gln Ala Xaa Xaa Xaa Xaa Xaa Xaa

210 215 220

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

225 230 235 240

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

245 250 255

Xaa Xaa

<210> 230

<211> 214

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多肽

<220>

<221> 经修饰的残基

<222> (136)..(136)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (138)..(141)

<223> 任何氨基酸

<220>

<221> 位点

<222> (138)..(141)

<223> 该区域可包含1-4个残基

<220>

<221> 经修饰的残基

<222> (179)..(179)

<223> 任何氨基酸

<400> 230

Leu Lys Gln Trp Gln Pro Ser Thr Ile Arg Lys Cys Lys Ile Lys Gly

1 5 10 15

Tyr Leu Pro Leu Phe Gln Cys Gly Lys Gly Arg Ile Ser Asn Asn Tyr

20 25 30

Thr Gln Tyr Lys Glu Ser Ile Val Pro His His Glu Pro Gly Gly Gly

35 40 45

Gly Trp Ser Ile Gln Gln Phe Thr Leu Gly Ala Leu Tyr Glu Glu His

50 55 60

Leu Lys Leu Arg Asn Trp Trp Thr Lys Ser Asn Asp Gly Leu Pro Leu

65 70 75 80

Val Arg Tyr Leu Gly Cys Thr Ile Lys Leu Tyr Arg Ser Glu Asp Thr

85 90 95

Asp Tyr Ile Val Thr Tyr Gln Arg Cys Tyr Pro Met Thr Ala Thr Lys

100 105 110

Leu Thr Tyr Leu Ser Thr Gln Pro Ser Arg Met Leu Met Asn Lys His

115 120 125

Lys Ile Ile Val Pro Ser Lys Xaa Thr Xaa Xaa Xaa Xaa Asn Lys Lys

130 135 140

Lys Lys Pro Tyr Lys Lys Ile Phe Ile Lys Pro Pro Ser Gln Met Gln

145 150 155 160

Asn Lys Trp Tyr Phe Gln Gln Asp Ile Ala Asn Thr Pro Leu Leu Gln

165 170 175

Leu Thr Xaa Thr Ala Cys Ser Leu Asp Arg Met Tyr Leu Ser Ser Asp

180 185 190

Ser Ile Ser Asn Asn Ile Thr Phe Thr Ser Leu Asn Thr Asn Phe Phe

195 200 205

Gln Asn Pro Asn Phe Gln

210

<210> 231

<211> 187

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多肽

<220>

<221> 经修饰的残基

<222> (1)..(10)

<223> 任何氨基酸

<220>

<221> 位点

<222> (1)..(10)

<223> 该区域可包含4-10个残基

<220>

<221> 经修饰的残基

<222> (38)..(45)

<223> 任何氨基酸

<220>

<221> 位点

<222> (38)..(45)

<223> 该区域可包含1-8个残基

<220>

<221> 经修饰的残基

<222> (94)..(94)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (100)..(102)

<223> 任何氨基酸

<220>

<221> 位点

<222> (100)..(102)

<223> 该区域可包含1-3个残基

<220>

<221> 经修饰的残基

<222> (112)..(112)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (114)..(115)

<223> 任何氨基酸

<220>

<221> 位点

<222> (114)..(115)

<223> 该区域可包含0-2个残基

<220>

<221> 经修饰的残基

<222> (124)..(139)

<223> 任何氨基酸

<220>

<221> 位点

<222> (124)..(139)

<223> 该区域可包含3-16个残基

<220>

<221> 经修饰的残基

<222> (154)..(154)

<223> 任何氨基酸

<400> 231

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Pro Leu Tyr Phe Glu

1 5 10 15

Cys Arg Tyr Asn Pro Phe Lys Asp Lys Gly Thr Gly Asn Lys Val Tyr

20 25 30

Leu Val Ser Asn Asn Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Gly Trp

35 40 45

Asp Pro Pro Thr Asp Pro Asp Leu Ile Ile Glu Gly Phe Pro Leu Trp

50 55 60

Leu Leu Leu Trp Gly Trp Leu Asp Trp Gln Lys Lys Leu Gly Lys Ile

65 70 75 80

Gln Asn Ile Asp Thr Asp Tyr Ile Leu Val Ile Gln Ser Xaa Tyr Tyr

85 90 95

Ile Pro Pro Xaa Xaa Xaa Lys Leu Pro Tyr Tyr Val Pro Leu Asp Xaa

100 105 110

Asp Xaa Xaa Phe Leu His Gly Arg Ser Pro Tyr Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Pro Ser Asp Lys Gln

130 135 140

His Trp His Pro Lys Val Arg Phe Gln Xaa Glu Thr Ile Asn Asn Ile

145 150 155 160

Ala Leu Thr Gly Pro Gly Thr Pro Lys Leu Pro Asn Gln Lys Ser Ile

165 170 175

Gln Ala His Met Lys Tyr Lys Phe Tyr Phe Lys

180 185

<210> 232

<211> 163

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多肽

<220>

<221> 经修饰的残基

<222> (34)..(34)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (65)..(65)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (77)..(78)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (86)..(87)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (96)..(96)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (102)..(106)

<223> 任何氨基酸

<220>

<221> 位点

<222> (102)..(106)

<223> 该区域可包含0-5个残基

<220>

<221> 经修饰的残基

<222> (125)..(125)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (135)..(135)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (138)..(163)

<223> 任何氨基酸

<220>

<221> 位点

<222> (138)..(163)

<223> 该区域可包含0-26个残基

<400> 232

Trp Gly Gly Cys Pro Ala Pro Met Glu Thr Ile Thr Asp Pro Cys Lys

1 5 10 15

Gln Pro Lys Tyr Pro Ile Pro Asn Asn Leu Leu Gln Thr Thr Ser Leu

20 25 30

Gln Xaa Pro Thr Thr Pro Ile Glu Thr Tyr Leu Tyr Lys Phe Asp Glu

35 40 45

Arg Arg Gly Leu Leu Thr Lys Lys Ala Ala Lys Arg Ile Lys Lys Asp

50 55 60

Xaa Thr Thr Glu Thr Thr Leu Phe Thr Asp Thr Gly Xaa Xaa Thr Ser

65 70 75 80

Thr Thr Leu Pro Thr Xaa Xaa Gln Thr Glu Thr Thr Gln Glu Glu Xaa

85 90 95

Thr Ser Glu Glu Glu Xaa Xaa Xaa Xaa Xaa Glu Thr Leu Leu Gln Gln

100 105 110

Leu Gln Gln Leu Arg Arg Lys Gln Lys Gln Leu Arg Xaa Arg Ile Leu

115 120 125

Gln Leu Leu Gln Leu Leu Xaa Leu Leu Xaa Xaa Xaa Xaa Xaa Xaa Xaa

130 135 140

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

145 150 155 160

Xaa Xaa Xaa

<210> 233

<211> 203

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多肽

<220>

<221> 经修饰的残基

<222> (79)..(79)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (104)..(104)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (116)..(116)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (120)..(121)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (125)..(125)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (170)..(170)

<223> 任何氨基酸

<400> 233

Thr Ile Pro Leu Lys Gln Trp Gln Pro Glu Ser Ile Arg Lys Cys Lys

1 5 10 15

Ile Lys Gly Tyr Gly Thr Leu Val Leu Gly Ala Glu Gly Arg Gln Phe

20 25 30

Tyr Cys Tyr Thr Asn Glu Lys Asp Glu Tyr Thr Pro Pro Lys Ala Pro

35 40 45

Gly Gly Gly Gly Phe Gly Val Glu Leu Phe Ser Leu Glu Tyr Leu Tyr

50 55 60

Glu Gln Trp Lys Ala Arg Asn Asn Ile Trp Thr Lys Ser Asn Xaa Tyr

65 70 75 80

Lys Asp Leu Cys Arg Tyr Thr Gly Cys Lys Ile Thr Phe Tyr Arg His

85 90 95

Pro Thr Thr Asp Phe Ile Val Xaa Tyr Ser Arg Gln Pro Pro Phe Glu

100 105 110

Ile Asp Lys Xaa Thr Tyr Met Xaa Xaa His Pro Gln Xaa Leu Leu Leu

115 120 125

Arg Lys His Lys Lys Ile Ile Leu Ser Lys Ala Thr Asn Pro Lys Gly

130 135 140

Lys Leu Lys Lys Lys Ile Lys Ile Lys Pro Pro Lys Gln Met Leu Asn

145 150 155 160

Lys Trp Phe Phe Gln Lys Gln Phe Ala Xaa Tyr Gly Leu Val Gln Leu

165 170 175

Gln Ala Ala Ala Cys Asx Leu Arg Tyr Pro Arg Leu Gly Cys Cys Asn

180 185 190

Glu Asn Arg Leu Ile Thr Leu Tyr Tyr Leu Asn

195 200

<210> 234

<211> 162

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多肽

<220>

<221> 经修饰的残基

<222> (12)..(12)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (20)..(20)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (23)..(23)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (30)..(30)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (58)..(58)

<223> I或L

<220>

<221> 经修饰的残基

<222> (84)..(84)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (90)..(90)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (95)..(95)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (105)..(105)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (111)..(111)

<223> I或L

<220>

<221> 经修饰的残基

<222> (113)..(113)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (154)..(154)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (156)..(156)

<223> 任何氨基酸

<400> 234

Leu Pro Ile Val Val Ala Arg Tyr Asn Pro Ala Xaa Asp Thr Gly Lys

1 5 10 15

Gly Asn Lys Xaa Trp Leu Xaa Ser Thr Leu Asn Gly Ser Xaa Trp Ala

20 25 30

Pro Pro Thr Thr Asp Lys Asp Leu Ile Ile Glu Gly Leu Pro Leu Trp

35 40 45

Leu Ala Leu Tyr Gly Tyr Trp Ser Tyr Xaa Lys Lys Val Lys Lys Asp

50 55 60

Lys Gly Ile Leu Gln Ser His Met Phe Val Val Lys Ser Pro Ala Ile

65 70 75 80

Gln Pro Leu Xaa Thr Ala Thr Thr Gln Xaa Thr Phe Tyr Pro Xaa Ile

85 90 95

Asp Asn Ser Phe Ile Gln Gly Lys Xaa Pro Tyr Asp Glu Pro Xaa Thr

100 105 110

Xaa Asn Gln Lys Lys Leu Trp Tyr Pro Thr Leu Glu His Gln Gln Glu

115 120 125

Thr Ile Asn Ala Ile Val Glu Ser Gly Pro Tyr Val Pro Lys Leu Asp

130 135 140

Asn Gln Lys Asn Ser Thr Trp Glu Leu Xaa Tyr Xaa Tyr Thr Phe Tyr

145 150 155 160

Phe Lys

<210> 235

<211> 177

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多肽

<220>

<221> 经修饰的残基

<222> (16)..(16)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (26)..(26)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (33)..(33)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (73)..(73)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (81)..(82)

<223> 任何氨基酸

<220>

<221> 位点

<222> (81)..(82)

<223> 该区域可包含0-2个残基

<220>

<221> 经修饰的残基

<222> (90)..(90)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (94)..(94)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (119)..(124)

<223> 任何氨基酸

<220>

<221> 位点

<222> (119)..(124)

<223> 该区域可包含1-6个残基

<220>

<221> 经修饰的残基

<222> (168)..(177)

<223> 任何氨基酸

<220>

<221> 位点

<222> (168)..(177)

<223> 该区域可包含1-10个残基

<400> 235

Trp Gly Gly Pro Gln Ile Pro Asp Gln Pro Val Glu Asp Pro Lys Xaa

1 5 10 15

Gln Gly Thr Tyr Pro Val Pro Asp Thr Xaa Gln Gln Thr Ile Gln Ile

20 25 30

Xaa Asn Pro Leu Lys Gln Lys Pro Glu Thr Met Phe His Asp Trp Asp

35 40 45

Tyr Arg Arg Gly Ile Ile Thr Ser Thr Ala Leu Lys Arg Met Gln Glu

50 55 60

Asn Leu Glu Thr Asp Ser Ser Phe Xaa Ser Asp Ser Glu Glu Thr Pro

65 70 75 80

Xaa Xaa Lys Lys Lys Lys Arg Leu Thr Xaa Glu Leu Pro Xaa Pro Gln

85 90 95

Glu Glu Thr Glu Glu Ile Gln Ser Cys Leu Leu Ser Leu Cys Glu Glu

100 105 110

Ser Thr Cys Gln Glu Glu Xaa Xaa Xaa Xaa Xaa Xaa Glu Asn Leu Gln

115 120 125

Gln Leu Ile His Gln Gln Gln Gln Gln Gln Gln Gln Leu Lys His Asn

130 135 140

Ile Leu Lys Leu Leu Ser Asp Leu Lys Glx Lys Gln Arg Leu Leu Gln

145 150 155 160

Leu Gln Thr Gly Ile Leu Glu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

165 170 175

Xaa

<210> 236

<400> 236

000

<210> 237

<400> 237

000

<210> 238

<400> 238

000

<210> 239

<400> 239

000

<210> 240

<400> 240

000

<210> 241

<400> 241

000

<210> 242

<400> 242

000

<210> 243

<400> 243

000

<210> 244

<400> 244

000

<210> 245

<400> 245

000

<210> 246

<400> 246

000

<210> 247

<400> 247

000

<210> 248

<400> 248

000

<210> 249

<400> 249

000

<210> 250

<400> 250

000

<210> 251

<400> 251

000

<210> 252

<400> 252

000

<210> 253

<400> 253

000

<210> 254

<400> 254

000

<210> 255

<400> 255

000

<210> 256

<400> 256

000

<210> 257

<400> 257

000

<210> 258

<400> 258

000

<210> 259

<400> 259

000

<210> 260

<400> 260

000

<210> 261

<400> 261

000

<210> 262

<400> 262

000

<210> 263

<400> 263

000

<210> 264

<400> 264

000

<210> 265

<400> 265

000

<210> 266

<400> 266

000

<210> 267

<400> 267

000

<210> 268

<400> 268

000

<210> 269

<400> 269

000

<210> 270

<400> 270

000

<210> 271

<400> 271

000

<210> 272

<400> 272

000

<210> 273

<400> 273

000

<210> 274

<400> 274

000

<210> 275

<400> 275

000

<210> 276

<400> 276

000

<210> 277

<400> 277

000

<210> 278

<400> 278

000

<210> 279

<400> 279

000

<210> 280

<400> 280

000

<210> 281

<400> 281

000

<210> 282

<400> 282

000

<210> 283

<400> 283

000

<210> 284

<400> 284

000

<210> 285

<400> 285

000

<210> 286

<400> 286

000

<210> 287

<400> 287

000

<210> 288

<400> 288

000

<210> 289

<400> 289

000

<210> 290

<400> 290

000

<210> 291

<400> 291

000

<210> 292

<400> 292

000

<210> 293

<400> 293

000

<210> 294

<400> 294

000

<210> 295

<400> 295

000

<210> 296

<400> 296

000

<210> 297

<400> 297

000

<210> 298

<400> 298

000

<210> 299

<400> 299

000

<210> 300

<400> 300

000

<210> 301

<400> 301

000

<210> 302

<400> 302

000

<210> 303

<400> 303

000

<210> 304

<400> 304

000

<210> 305

<400> 305

000

<210> 306

<400> 306

000

<210> 307

<400> 307

000

<210> 308

<400> 308

000

<210> 309

<400> 309

000

<210> 310

<400> 310

000

<210> 311

<400> 311

000

<210> 312

<400> 312

000

<210> 313

<400> 313

000

<210> 314

<400> 314

000

<210> 315

<400> 315

000

<210> 316

<400> 316

000

<210> 317

<400> 317

000

<210> 318

<400> 318

000

<210> 319

<400> 319

000

<210> 320

<400> 320

000

<210> 321

<400> 321

000

<210> 322

<400> 322

000

<210> 323

<400> 323

000

<210> 324

<400> 324

000

<210> 325

<400> 325

000

<210> 326

<400> 326

000

<210> 327

<400> 327

000

<210> 328

<400> 328

000

<210> 329

<400> 329

000

<210> 330

<400> 330

000

<210> 331

<400> 331

000

<210> 332

<400> 332

000

<210> 333

<400> 333

000

<210> 334

<400> 334

000

<210> 335

<400> 335

000

<210> 336

<400> 336

000

<210> 337

<400> 337

000

<210> 338

<400> 338

000

<210> 339

<400> 339

000

<210> 340

<400> 340

000

<210> 341

<400> 341

000

<210> 342

<400> 342

000

<210> 343

<400> 343

000

<210> 344

<400> 344

000

<210> 345

<400> 345

000

<210> 346

<400> 346

000

<210> 347

<400> 347

000

<210> 348

<400> 348

000

<210> 349

<400> 349

000

<210> 350

<400> 350

000

<210> 351

<400> 351

000

<210> 352

<400> 352

000

<210> 353

<400> 353

000

<210> 354

<400> 354

000

<210> 355

<400> 355

000

<210> 356

<400> 356

000

<210> 357

<400> 357

000

<210> 358

<400> 358

000

<210> 359

<400> 359

000

<210> 360

<400> 360

000

<210> 361

<400> 361

000

<210> 362

<400> 362

000

<210> 363

<400> 363

000

<210> 364

<400> 364

000

<210> 365

<400> 365

000

<210> 366

<400> 366

000

<210> 367

<400> 367

000

<210> 368

<400> 368

000

<210> 369

<400> 369

000

<210> 370

<400> 370

000

<210> 371

<400> 371

000

<210> 372

<400> 372

000

<210> 373

<400> 373

000

<210> 374

<400> 374

000

<210> 375

<400> 375

000

<210> 376

<400> 376

000

<210> 377

<400> 377

000

<210> 378

<400> 378

000

<210> 379

<400> 379

000

<210> 380

<400> 380

000

<210> 381

<400> 381

000

<210> 382

<400> 382

000

<210> 383

<400> 383

000

<210> 384

<400> 384

000

<210> 385

<400> 385

000

<210> 386

<400> 386

000

<210> 387

<400> 387

000

<210> 388

<400> 388

000

<210> 389

<400> 389

000

<210> 390

<400> 390

000

<210> 391

<400> 391

000

<210> 392

<400> 392

000

<210> 393

<400> 393

000

<210> 394

<400> 394

000

<210> 395

<400> 395

000

<210> 396

<400> 396

000

<210> 397

<400> 397

000

<210> 398

<400> 398

000

<210> 399

<400> 399

000

<210> 400

<400> 400

000

<210> 401

<400> 401

000

<210> 402

<400> 402

000

<210> 403

<400> 403

000

<210> 404

<400> 404

000

<210> 405

<400> 405

000

<210> 406

<400> 406

000

<210> 407

<400> 407

000

<210> 408

<400> 408

000

<210> 409

<400> 409

000

<210> 410

<400> 410

000

<210> 411

<400> 411

000

<210> 412

<400> 412

000

<210> 413

<400> 413

000

<210> 414

<400> 414

000

<210> 415

<400> 415

000

<210> 416

<400> 416

000

<210> 417

<400> 417

000

<210> 418

<400> 418

000

<210> 419

<400> 419

000

<210> 420

<400> 420

000

<210> 421

<400> 421

000

<210> 422

<400> 422

000

<210> 423

<400> 423

000

<210> 424

<400> 424

000

<210> 425

<400> 425

000

<210> 426

<400> 426

000

<210> 427

<400> 427

000

<210> 428

<400> 428

000

<210> 429

<400> 429

000

<210> 430

<400> 430

000

<210> 431

<400> 431

000

<210> 432

<400> 432

000

<210> 433

<400> 433

000

<210> 434

<400> 434

000

<210> 435

<400> 435

000

<210> 436

<400> 436

000

<210> 437

<400> 437

000

<210> 438

<400> 438

000

<210> 439

<400> 439

000

<210> 440

<400> 440

000

<210> 441

<400> 441

000

<210> 442

<400> 442

000

<210> 443

<400> 443

000

<210> 444

<400> 444

000

<210> 445

<400> 445

000

<210> 446

<400> 446

000

<210> 447

<400> 447

000

<210> 448

<400> 448

000

<210> 449

<400> 449

000

<210> 450

<400> 450

000

<210> 451

<400> 451

000

<210> 452

<400> 452

000

<210> 453

<400> 453

000

<210> 454

<400> 454

000

<210> 455

<400> 455

000

<210> 456

<400> 456

000

<210> 457

<400> 457

000

<210> 458

<400> 458

000

<210> 459

<400> 459

000

<210> 460

<400> 460

000

<210> 461

<400> 461

000

<210> 462

<400> 462

000

<210> 463

<400> 463

000

<210> 464

<400> 464

000

<210> 465

<400> 465

000

<210> 466

<400> 466

000

<210> 467

<400> 467

000

<210> 468

<400> 468

000

<210> 469

<400> 469

000

<210> 470

<400> 470

000

<210> 471

<400> 471

000

<210> 472

<400> 472

000

<210> 473

<400> 473

000

<210> 474

<400> 474

000

<210> 475

<400> 475

000

<210> 476

<400> 476

000

<210> 477

<400> 477

000

<210> 478

<400> 478

000

<210> 479

<400> 479

000

<210> 480

<400> 480

000

<210> 481

<400> 481

000

<210> 482

<400> 482

000

<210> 483

<400> 483

000

<210> 484

<400> 484

000

<210> 485

<400> 485

000

<210> 486

<400> 486

000

<210> 487

<400> 487

000

<210> 488

<400> 488

000

<210> 489

<400> 489

000

<210> 490

<400> 490

000

<210> 491

<400> 491

000

<210> 492

<400> 492

000

<210> 493

<400> 493

000

<210> 494

<400> 494

000

<210> 495

<400> 495

000

<210> 496

<400> 496

000

<210> 497

<400> 497

000

<210> 498

<400> 498

000

<210> 499

<400> 499

000

<210> 500

<400> 500

000

<210> 501

<400> 501

000

<210> 502

<400> 502

000

<210> 503

<400> 503

000

<210> 504

<400> 504

000

<210> 505

<400> 505

000

<210> 506

<400> 506

000

<210> 507

<400> 507

000

<210> 508

<400> 508

000

<210> 509

<400> 509

000

<210> 510

<400> 510

000

<210> 511

<400> 511

000

<210> 512

<400> 512

000

<210> 513

<400> 513

000

<210> 514

<400> 514

000

<210> 515

<400> 515

000

<210> 516

<400> 516

000

<210> 517

<400> 517

000

<210> 518

<400> 518

000

<210> 519

<400> 519

000

<210> 520

<400> 520

000

<210> 521

<400> 521

000

<210> 522

<400> 522

000

<210> 523

<400> 523

000

<210> 524

<400> 524

000

<210> 525

<400> 525

000

<210> 526

<400> 526

000

<210> 527

<400> 527

000

<210> 528

<400> 528

000

<210> 529

<400> 529

000

<210> 530

<400> 530

000

<210> 531

<400> 531

000

<210> 532

<400> 532

000

<210> 533

<400> 533

000

<210> 534

<400> 534

000

<210> 535

<400> 535

000

<210> 536

<400> 536

000

<210> 537

<400> 537

000

<210> 538

<400> 538

000

<210> 539

<400> 539

000

<210> 540

<400> 540

000

<210> 541

<400> 541

000

<210> 542

<400> 542

000

<210> 543

<400> 543

000

<210> 544

<400> 544

000

<210> 545

<400> 545

000

<210> 546

<400> 546

000

<210> 547

<400> 547

000

<210> 548

<400> 548

000

<210> 549

<400> 549

000

<210> 550

<400> 550

000

<210> 551

<400> 551

000

<210> 552

<400> 552

000

<210> 553

<400> 553

000

<210> 554

<400> 554

000

<210> 555

<400> 555

000

<210> 556

<400> 556

000

<210> 557

<400> 557

000

<210> 558

<400> 558

000

<210> 559

<400> 559

000

<210> 560

<400> 560

000

<210> 561

<400> 561

000

<210> 562

<400> 562

000

<210> 563

<400> 563

000

<210> 564

<400> 564

000

<210> 565

<400> 565

000

<210> 566

<400> 566

000

<210> 567

<400> 567

000

<210> 568

<400> 568

000

<210> 569

<400> 569

000

<210> 570

<400> 570

000

<210> 571

<400> 571

000

<210> 572

<400> 572

000

<210> 573

<400> 573

000

<210> 574

<400> 574

000

<210> 575

<400> 575

000

<210> 576

<400> 576

000

<210> 577

<400> 577

000

<210> 578

<400> 578

000

<210> 579

<400> 579

000

<210> 580

<400> 580

000

<210> 581

<400> 581

000

<210> 582

<400> 582

000

<210> 583

<400> 583

000

<210> 584

<400> 584

000

<210> 585

<400> 585

000

<210> 586

<400> 586

000

<210> 587

<400> 587

000

<210> 588

<400> 588

000

<210> 589

<400> 589

000

<210> 590

<400> 590

000

<210> 591

<400> 591

000

<210> 592

<400> 592

000

<210> 593

<400> 593

000

<210> 594

<400> 594

000

<210> 595

<400> 595

000

<210> 596

<400> 596

000

<210> 597

<400> 597

000

<210> 598

<400> 598

000

<210> 599

<400> 599

000

<210> 600

<400> 600

000

<210> 601

<400> 601

000

<210> 602

<400> 602

000

<210> 603

<400> 603

000

<210> 604

<400> 604

000

<210> 605

<400> 605

000

<210> 606

<400> 606

000

<210> 607

<400> 607

000

<210> 608

<400> 608

000

<210> 609

<400> 609

000

<210> 610

<400> 610

000

<210> 611

<400> 611

000

<210> 612

<400> 612

000

<210> 613

<400> 613

000

<210> 614

<400> 614

000

<210> 615

<400> 615

000

<210> 616

<400> 616

000

<210> 617

<400> 617

000

<210> 618

<400> 618

000

<210> 619

<400> 619

000

<210> 620

<400> 620

000

<210> 621

<400> 621

000

<210> 622

<400> 622

000

<210> 623

<400> 623

000

<210> 624

<400> 624

000

<210> 625

<400> 625

000

<210> 626

<400> 626

000

<210> 627

<400> 627

000

<210> 628

<400> 628

000

<210> 629

<400> 629

000

<210> 630

<400> 630

000

<210> 631

<400> 631

000

<210> 632

<400> 632

000

<210> 633

<400> 633

000

<210> 634

<400> 634

000

<210> 635

<400> 635

000

<210> 636

<400> 636

000

<210> 637

<400> 637

000

<210> 638

<400> 638

000

<210> 639

<400> 639

000

<210> 640

<400> 640

000

<210> 641

<400> 641

000

<210> 642

<400> 642

000

<210> 643

<400> 643

000

<210> 644

<400> 644

000

<210> 645

<400> 645

000

<210> 646

<400> 646

000

<210> 647

<400> 647

000

<210> 648

<400> 648

000

<210> 649

<400> 649

000

<210> 650

<400> 650

000

<210> 651

<400> 651

000

<210> 652

<400> 652

000

<210> 653

<400> 653

000

<210> 654

<400> 654

000

<210> 655

<400> 655

000

<210> 656

<400> 656

000

<210> 657

<400> 657

000

<210> 658

<400> 658

000

<210> 659

<400> 659

000

<210> 660

<400> 660

000

<210> 661

<400> 661

000

<210> 662

<400> 662

000

<210> 663

<400> 663

000

<210> 664

<400> 664

000

<210> 665

<400> 665

000

<210> 666

<400> 666

000

<210> 667

<400> 667

000

<210> 668

<400> 668

000

<210> 669

<400> 669

000

<210> 670

<400> 670

000

<210> 671

<400> 671

000

<210> 672

<400> 672

000

<210> 673

<400> 673

000

<210> 674

<400> 674

000

<210> 675

<400> 675

000

<210> 676

<400> 676

000

<210> 677

<400> 677

000

<210> 678

<400> 678

000

<210> 679

<400> 679

000

<210> 680

<400> 680

000

<210> 681

<400> 681

000

<210> 682

<400> 682

000

<210> 683

<400> 683

000

<210> 684

<400> 684

000

<210> 685

<400> 685

000

<210> 686

<400> 686

000

<210> 687

<400> 687

000

<210> 688

<400> 688

000

<210> 689

<400> 689

000

<210> 690

<400> 690

000

<210> 691

<400> 691

000

<210> 692

<400> 692

000

<210> 693

<400> 693

000

<210> 694

<400> 694

000

<210> 695

<400> 695

000

<210> 696

<400> 696

000

<210> 697

<400> 697

000

<210> 698

<400> 698

000

<210> 699

<400> 699

000

<210> 700

<400> 700

000

<210> 701

<400> 701

000

<210> 702

<400> 702

000

<210> 703

<400> 703

000

<210> 704

<400> 704

000

<210> 705

<400> 705

000

<210> 706

<400> 706

000

<210> 707

<400> 707

000

<210> 708

<400> 708

000

<210> 709

<400> 709

000

<210> 710

<400> 710

000

<210> 711

<400> 711

000

<210> 712

<400> 712

000

<210> 713

<400> 713

000

<210> 714

<400> 714

000

<210> 715

<400> 715

000

<210> 716

<400> 716

000

<210> 717

<400> 717

000

<210> 718

<400> 718

000

<210> 719

<400> 719

000

<210> 720

<400> 720

000

<210> 721

<400> 721

000

<210> 722

<400> 722

000

<210> 723

<400> 723

000

<210> 724

<400> 724

000

<210> 725

<400> 725

000

<210> 726

<400> 726

000

<210> 727

<400> 727

000

<210> 728

<400> 728

000

<210> 729

<400> 729

000

<210> 730

<400> 730

000

<210> 731

<400> 731

000

<210> 732

<400> 732

000

<210> 733

<400> 733

000

<210> 734

<400> 734

000

<210> 735

<400> 735

000

<210> 736

<400> 736

000

<210> 737

<400> 737

000

<210> 738

<400> 738

000

<210> 739

<400> 739

000

<210> 740

<400> 740

000

<210> 741

<400> 741

000

<210> 742

<400> 742

000

<210> 743

<400> 743

000

<210> 744

<400> 744

000

<210> 745

<400> 745

000

<210> 746

<400> 746

000

<210> 747

<400> 747

000

<210> 748

<400> 748

000

<210> 749

<400> 749

000

<210> 750

<400> 750

000

<210> 751

<400> 751

000

<210> 752

<400> 752

000

<210> 753

<400> 753

000

<210> 754

<400> 754

000

<210> 755

<400> 755

000

<210> 756

<400> 756

000

<210> 757

<400> 757

000

<210> 758

<400> 758

000

<210> 759

<400> 759

000

<210> 760

<400> 760

000

<210> 761

<400> 761

000

<210> 762

<400> 762

000

<210> 763

<400> 763

000

<210> 764

<400> 764

000

<210> 765

<400> 765

000

<210> 766

<400> 766

000

<210> 767

<400> 767

000

<210> 768

<400> 768

000

<210> 769

<400> 769

000

<210> 770

<400> 770

000

<210> 771

<400> 771

000

<210> 772

<400> 772

000

<210> 773

<400> 773

000

<210> 774

<400> 774

000

<210> 775

<400> 775

000

<210> 776

<400> 776

000

<210> 777

<400> 777

000

<210> 778

<400> 778

000

<210> 779

<400> 779

000

<210> 780

<400> 780

000

<210> 781

<400> 781

000

<210> 782

<400> 782

000

<210> 783

<400> 783

000

<210> 784

<400> 784

000

<210> 785

<400> 785

000

<210> 786

<400> 786

000

<210> 787

<400> 787

000

<210> 788

<400> 788

000

<210> 789

<400> 789

000

<210> 790

<400> 790

000

<210> 791

<400> 791

000

<210> 792

<400> 792

000

<210> 793

<400> 793

000

<210> 794

<400> 794

000

<210> 795

<400> 795

000

<210> 796

<400> 796

000

<210> 797

<400> 797

000

<210> 798

<400> 798

000

<210> 799

<400> 799

000

<210> 800

<400> 800

000

<210> 801

<211> 156

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 801

gcggcggggg ggcggccgcg ttcgcgcgcc gcccaccagg gggtgctgcg cgcccccccc 60

cgcgcatgcg cggggccccc ccccgggggg gctccgcccc cccggccccc ccccgtgcta 120

aacccaccgc gcatgcgcga ccacgccccc gccgcc 156

<210> 802

<211> 150

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 802

ccgagcgtta gcgaggagtg cgaccctacc ccctgggccc acttcttcgg agccgcgcgc 60

tacgccttcg gctgcgcgcg gcacctcaga cccccgctcg tgctgacacg cttgcgcgtg 120

tcagaccact tcgggctcgc gggggtcggg 150

<210> 803

<211> 122

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 803

gccgccgcgg cggcgggggg cggcgcgctg cgcgcgccgc ccagtagggg gagccatgcg 60

cccccccccg cgcatgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc 120

cg 122

<210> 804

<211> 111

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 804

cggcccagcg gcggcgcgcg cgcttcgcgc gcgcgccggg gggctccgcc cccccccgcg 60

catgcgcggg gccccccccc gcggggggct ccgccccccg gtcccccccc g 111

<210> 805

<211> 115

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 805

cggccgtgcg gcggcgcgcg cgcttcgcgc gcgcgccggg ggctgccgcc cccccccgcg 60

catgcgcgcg gggccccccc ccgcgggggg ctccgccccc cggccccccc ccccg 115

<210> 806

<211> 104

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 806

cggcggcggc gcgcgcgcta cgcgcgcgcg ccggggggct gccgcccccc ccccgcgcat 60

gcgcggggcc cccccccgcg gggggctccg ccccccggcc cccc 104

<210> 807

<211> 108

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的多核苷酸

<400> 807

ggcggcggcg cgcgcgctac gcgcgcgcgc cggggagctc tgcccccccc cgcgcatgcg 60

cgcgggtccc ccccccgcgg ggggctccgc cccccggtcc cccccccg 108

<210> 808

<400> 808

000

<210> 809

<400> 809

000

<210> 810

<400> 810

000

<210> 811

<400> 811

000

<210> 812

<400> 812

000

<210> 813

<400> 813

000

<210> 814

<400> 814

000

<210> 815

<400> 815

000

<210> 816

<400> 816

000

<210> 817

<400> 817

000

<210> 818

<400> 818

000

<210> 819

<400> 819

000

<210> 820

<400> 820

000

<210> 821

<400> 821

000

<210> 822

<400> 822

000

<210> 823

<400> 823

000

<210> 824

<400> 824

000

<210> 825

<400> 825

000

<210> 826

<400> 826

000

<210> 827

<400> 827

000

<210> 828

<400> 828

000

<210> 829

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的肽

<220>

<221> 经修饰的残基

<222> (4)..(5)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (7)..(7)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (9)..(10)

<223> 任何氨基酸

<400> 829

Tyr Asn Pro Xaa Xaa Asp Xaa Gly Xaa Xaa Asn

1 5 10

<210> 830

<400> 830

000

<210> 831

<400> 831

000

<210> 832

<400> 832

000

<210> 833

<400> 833

000

<210> 834

<400> 834

000

<210> 835

<400> 835

000

<210> 836

<400> 836

000

<210> 837

<400> 837

000

<210> 838

<400> 838

000

<210> 839

<400> 839

000

<210> 840

<400> 840

000

<210> 841

<400> 841

000

<210> 842

<400> 842

000

<210> 843

<400> 843

000

<210> 844

<400> 844

000

<210> 845

<400> 845

000

<210> 846

<400> 846

000

<210> 847

<400> 847

000

<210> 848

<400> 848

000

<210> 849

<400> 849

000

<210> 850

<400> 850

000

<210> 851

<400> 851

000

<210> 852

<400> 852

000

<210> 853

<400> 853

000

<210> 854

<400> 854

000

<210> 855

<400> 855

000

<210> 856

<400> 856

000

<210> 857

<400> 857

000

<210> 858

<400> 858

000

<210> 859

<400> 859

000

<210> 860

<400> 860

000

<210> 861

<400> 861

000

<210> 862

<400> 862

000

<210> 863

<400> 863

000

<210> 864

<400> 864

000

<210> 865

<400> 865

000

<210> 866

<400> 866

000

<210> 867

<400> 867

000

<210> 868

<400> 868

000

<210> 869

<400> 869

000

<210> 870

<400> 870

000

<210> 871

<400> 871

000

<210> 872

<400> 872

000

<210> 873

<400> 873

000

<210> 874

<400> 874

000

<210> 875

<400> 875

000

<210> 876

<400> 876

000

<210> 877

<400> 877

000

<210> 878

<400> 878

000

<210> 879

<400> 879

000

<210> 880

<400> 880

000

<210> 881

<400> 881

000

<210> 882

<400> 882

000

<210> 883

<400> 883

000

<210> 884

<400> 884

000

<210> 885

<400> 885

000

<210> 886

<211> 3176

<212> DNA

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 886

taaaatggcg ggagccaatc attttatact ttcactttcc aattaaaaat ggccacgtca 60

caaacaaggg gtggagccat ttaaactata taactaagtg gggtggcgaa tggctgagtt 120

taccccgcta gacggtgcag ggaccggatc gagcgcagcg aggaggtccc cggctgccca 180

tgggcgggag ccgaggtgag tgaaaccacc gaggtctagg ggcaattcgg gctagggcag 240

tctagcggaa cgggcaagaa acttaaaaca atatttgttt tacagatggt tagtatatcc 300

tcaagtgatt tttttaagaa aacgaaattt aatgaggaga cgcagaacca agtatggatg 360

tctcaaattg ctgactctca tgataatatc tgcagttgct ggcatccatt tgctcacctt 420

cttgcttcca tatttcctcc tggccacaaa gatcgtgatc ttactattaa ccaaattctt 480

ctaagagatt ataaagaaaa atgccattct ggtggagaag aaggagaaaa ttctggacca 540

acaacaggtt taattacacc aaaagaagaa gatatagaaa aagatggccc agaaggcgcc 600

gcagaagaag accatacaga cgccctgttc gccgccgccg tagaaaactt cgaaaggtaa 660

agagaaaaaa aaaatcttta attgttagac aatggcaacc agacagtata agaacttgta 720

aaattatagg acagtcagct atagttgttg gggctgaagg aaagcaaatg tactgttata 780

ctgtcaataa gttaattaat gtgcccccaa aaacaccata tgggggaggc tttggagtag 840

accaatacac actgaaatac ttatatgaag aatacagatt tgcacaaaac atttggacac 900

aatctaatgt actgaaagac ttatgcagat acataaatgt taagctaata ttctacagag 960

acaacaaaac agactttgtc ctttcctatg acagaaaccc accttttcaa ctaacaaaat 1020

ttacataccc aggagcacac ccacaacaaa tcatgcttca aaaacaccac aaattcatac 1080

tatcacaaat gacaaagcct aatggaagac taacaaaaaa actcaaaatt aaacctccta 1140

aacaaatgct ttctaaatgg ttcttttcaa aacaattctg taaataccct ttactatctc 1200

ttaaagcttc tgcactagac cttaggcact cttacctagg ctgctgtaat gaaaatccac 1260

aggtattttt ttattattta aaccatggat actacacaat aacaaactgg ggagcacaat 1320

cctcaacagc atacagacct aactccaagg tgacagacac aacatactac agatacaaaa 1380

atgacagaaa aaatattaac attaaaagcc atgaatacga aaaaagtata tcatatgaaa 1440

acggttattt tcaatctagt ttcttacaaa cacagtgcat atataccagt gagcgtggtg 1500

aagcctgtat agcagaaaaa ccactaggaa tagctattta caatccagta aaagacaatg 1560

gagatggtaa tatgatatac cttgtaagca ctctagcaaa cacttgggac cagcctccaa 1620

aagacagtgc tattttaata caaggagtac ccatatggct aggcttattt ggatatttag 1680

actactgtag acaaattaaa gctgacaaaa catggctaga cagtcatgta ctagtaattc 1740

aaagtcctgc tatttttact tacccaaatc caggagcagg caaatggtat tgtccactat 1800

cacaaagttt tataaatggc aatggtccgt ttaatcaacc acctacactg ctacaaaaag 1860

caaagtggtt tccacaaata caataccaac aagaaattat taatagcttt gtagaatcag 1920

gaccatttgt tcccaaatat gcaaatcaaa ctgaaagcaa ctgggaacta aaatataaat 1980

atgtttttac atttaagtgg ggtggaccac aattccatga accagaaatt gctgacccta 2040

gcaaacaaga gcagtatgat gtccccgata ctttctacca aacaatacaa attgaagatc 2100

cagaaggaca agaccccaga tctctcatcc atgattggga ctacagacga ggctttatta 2160

aagaaagatc tcttaaaaga atgtcaactt acttctcaac tcatacagat cagcaagcaa 2220

cttcagagga agacattccc aaaaagaaaa agagaattgg accccaactc acagtcccac 2280

aacaaaaaga agaggagaca ctgtcatgtc tcctctctct ctgcaaaaaa gataccttcc 2340

aagaaacaga gacacaagaa gacctccagc agctcatcaa gcagcagcag gagcagcagc 2400

tcctcctcaa gagaaacatc ctccagctca tccacaaact aaaagagaat caacaaatgc 2460

ttcagcttca cacaggcatg ttaccttaac cagatttaaa cctggatttg aagagcaaac 2520

agagagagaa ttagcaatta tatttcatag gccccctaga acctacaaag aggaccttcc 2580

attctatccc tggctaccac ctgcacccct tgtacaattt aaccttaact tcaaaggcta 2640

ggccaacaat gtacacttag taaagcatgt ttattaaagc acaaccccca aaataaatgt 2700

aaaaataaaa aaaaaaaaaa aaaaataaaa aattgcaaaa attcggcgct cgcgcgcatg 2760

tgcgcctctg gcgcaaatca cgcaacgctc gcgcgcccgc gtatgtctct ttaccacgca 2820

cctagattgg ggtgcgcgcg ctagcgcgcg caccccaatg cgccccgccc tcgttccgac 2880

ccgcttgcgc gggtcggacc acttcgggct cgggggggcg cgcctgcggc gcttttttac 2940

taaacagact ccgagccgcc atttggcccc ctaagctccg cccccctcat gaatattcat 3000

aaaggaaacc acataattag aattgccgac cacaaactgc catatgctaa ttagttcccc 3060

ttttacaaag taaaagggga agtgaacata gccccacacc cgcaggggca aggccccgca 3120

cccctacgtc actaaccacg cccccgccgc catcttgggt gcggcagggc gggggc 3176

<210> 887

<211> 124

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 887

Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn

1 5 10 15

Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His

20 25 30

Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser

35 40 45

Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile

50 55 60

Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly

65 70 75 80

Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp

85 90 95

Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp

100 105 110

Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Arg

115 120

<210> 888

<211> 271

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 888

Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn

1 5 10 15

Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His

20 25 30

Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser

35 40 45

Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile

50 55 60

Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly

65 70 75 80

Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp

85 90 95

Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp

100 105 110

Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Ser Gly Val Asp His

115 120 125

Asn Ser Met Asn Gln Lys Leu Leu Thr Leu Ala Asn Lys Ser Ser Met

130 135 140

Met Ser Pro Ile Leu Ser Thr Lys Gln Tyr Lys Leu Lys Ile Gln Lys

145 150 155 160

Asp Lys Thr Pro Asp Leu Ser Ser Met Ile Gly Thr Thr Asp Glu Ala

165 170 175

Leu Leu Lys Lys Asp Leu Leu Lys Glu Cys Gln Leu Thr Ser Gln Leu

180 185 190

Ile Gln Ile Ser Lys Gln Leu Gln Arg Lys Thr Phe Pro Lys Arg Lys

195 200 205

Arg Glu Leu Asp Pro Asn Ser Gln Ser His Asn Lys Lys Lys Arg Arg

210 215 220

His Cys His Val Ser Ser Leu Ser Ala Lys Lys Ile Pro Ser Lys Lys

225 230 235 240

Gln Arg His Lys Lys Thr Ser Ser Ser Ser Ser Ser Ser Ser Arg Ser

245 250 255

Ser Ser Ser Ser Ser Arg Glu Thr Ser Ser Ser Ser Ser Thr Asn

260 265 270

<210> 889

<211> 267

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 889

Met Val Ser Ile Ser Ser Ser Asp Phe Phe Lys Lys Thr Lys Phe Asn

1 5 10 15

Glu Glu Thr Gln Asn Gln Val Trp Met Ser Gln Ile Ala Asp Ser His

20 25 30

Asp Asn Ile Cys Ser Cys Trp His Pro Phe Ala His Leu Leu Ala Ser

35 40 45

Ile Phe Pro Pro Gly His Lys Asp Arg Asp Leu Thr Ile Asn Gln Ile

50 55 60

Leu Leu Arg Asp Tyr Lys Glu Lys Cys His Ser Gly Gly Glu Glu Gly

65 70 75 80

Glu Asn Ser Gly Pro Thr Thr Gly Leu Ile Thr Pro Lys Glu Glu Asp

85 90 95

Ile Glu Lys Asp Gly Pro Glu Gly Ala Ala Glu Glu Asp His Thr Asp

100 105 110

Ala Leu Phe Ala Ala Ala Val Glu Asn Phe Glu Arg Ser Ala Ser Asn

115 120 125

Phe Arg Gly Arg His Ser Gln Lys Glu Lys Glu Asn Trp Thr Pro Thr

130 135 140

His Ser Pro Thr Thr Lys Arg Arg Gly Asp Thr Val Met Ser Pro Leu

145 150 155 160

Ser Leu Gln Lys Arg Tyr Leu Pro Arg Asn Arg Asp Thr Arg Arg Pro

165 170 175

Pro Ala Ala His Gln Ala Ala Ala Gly Ala Ala Ala Pro Pro Gln Glu

180 185 190

Lys His Pro Pro Ala His Pro Gln Thr Lys Arg Glu Ser Thr Asn Ala

195 200 205

Ser Ala Ser His Arg His Val Thr Leu Thr Arg Phe Lys Pro Gly Phe

210 215 220

Glu Glu Gln Thr Glu Arg Glu Leu Ala Ile Ile Phe His Arg Pro Pro

225 230 235 240

Arg Thr Tyr Lys Glu Asp Leu Pro Phe Tyr Pro Trp Leu Pro Pro Ala

245 250 255

Pro Leu Val Gln Phe Asn Leu Asn Phe Lys Gly

260 265

<210> 890

<211> 50

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 890

Met Arg Arg Arg Arg Thr Lys Tyr Gly Cys Leu Lys Leu Leu Thr Leu

1 5 10 15

Met Ile Ile Ser Ala Val Ala Gly Ile His Leu Leu Thr Phe Leu Leu

20 25 30

Pro Tyr Phe Leu Leu Ala Thr Lys Ile Val Ile Leu Leu Leu Thr Lys

35 40 45

Phe Phe

50

<210> 891

<211> 662

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 891

Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg

1 5 10 15

Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg

20 25 30

Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg

35 40 45

Lys Leu Arg Lys Val Lys Arg Lys Lys Lys Ser Leu Ile Val Arg Gln

50 55 60

Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys Ile Ile Gly Gln Ser Ala

65 70 75 80

Ile Val Val Gly Ala Glu Gly Lys Gln Met Tyr Cys Tyr Thr Val Asn

85 90 95

Lys Leu Ile Asn Val Pro Pro Lys Thr Pro Tyr Gly Gly Gly Phe Gly

100 105 110

Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala

115 120 125

Gln Asn Ile Trp Thr Gln Ser Asn Val Leu Lys Asp Leu Cys Arg Tyr

130 135 140

Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp Asn Lys Thr Asp Phe Val

145 150 155 160

Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln Leu Thr Lys Phe Thr Tyr

165 170 175

Pro Gly Ala His Pro Gln Gln Ile Met Leu Gln Lys His His Lys Phe

180 185 190

Ile Leu Ser Gln Met Thr Lys Pro Asn Gly Arg Leu Thr Lys Lys Leu

195 200 205

Lys Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Ser Lys

210 215 220

Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu Lys Ala Ser Ala Leu Asp

225 230 235 240

Leu Arg His Ser Tyr Leu Gly Cys Cys Asn Glu Asn Pro Gln Val Phe

245 250 255

Phe Tyr Tyr Leu Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala

260 265 270

Gln Ser Ser Thr Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr

275 280 285

Tyr Tyr Arg Tyr Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His

290 295 300

Glu Tyr Glu Lys Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser

305 310 315 320

Phe Leu Gln Thr Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys

325 330 335

Ile Ala Glu Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp

340 345 350

Asn Gly Asp Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr

355 360 365

Trp Asp Gln Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro

370 375 380

Ile Trp Leu Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys

385 390 395 400

Ala Asp Lys Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro

405 410 415

Ala Ile Phe Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro

420 425 430

Leu Ser Gln Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro

435 440 445

Thr Leu Leu Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln

450 455 460

Glu Ile Ile Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr

465 470 475 480

Ala Asn Gln Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe

485 490 495

Thr Phe Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp

500 505 510

Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr

515 520 525

Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His

530 535 540

Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg

545 550 555 560

Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu

565 570 575

Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val

580 585 590

Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys

595 600 605

Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln

610 615 620

Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile

625 630 635 640

Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu

645 650 655

His Thr Gly Met Leu Pro

660

<210> 892

<211> 215

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 892

Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg

1 5 10 15

Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg

20 25 30

Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg

35 40 45

Lys Leu Arg Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala

50 55 60

Asp Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln

65 70 75 80

Thr Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile

85 90 95

His Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys

100 105 110

Arg Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser

115 120 125

Glu Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr

130 135 140

Val Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu

145 150 155 160

Cys Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln

165 170 175

Gln Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn

180 185 190

Ile Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln

195 200 205

Leu His Thr Gly Met Leu Pro

210 215

<210> 893

<211> 129

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 893

Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg

1 5 10 15

Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg

20 25 30

Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg

35 40 45

Lys Leu Arg Lys Ile Ser Lys Gln Leu Gln Arg Lys Thr Phe Pro Lys

50 55 60

Arg Lys Arg Glu Leu Asp Pro Asn Ser Gln Ser His Asn Lys Lys Lys

65 70 75 80

Arg Arg His Cys His Val Ser Ser Leu Ser Ala Lys Lys Ile Pro Ser

85 90 95

Lys Lys Gln Arg His Lys Lys Thr Ser Ser Ser Ser Ser Ser Ser Ser

100 105 110

Arg Ser Ser Ser Ser Ser Ser Arg Glu Thr Ser Ser Ser Ser Ser Thr

115 120 125

Asn

<210> 894

<400> 894

000

<210> 895

<400> 895

000

<210> 896

<400> 896

000

<210> 897

<400> 897

000

<210> 898

<400> 898

000

<210> 899

<400> 899

000

<210> 900

<400> 900

000

<210> 901

<400> 901

000

<210> 902

<400> 902

000

<210> 903

<400> 903

000

<210> 904

<400> 904

000

<210> 905

<400> 905

000

<210> 906

<400> 906

000

<210> 907

<400> 907

000

<210> 908

<400> 908

000

<210> 909

<400> 909

000

<210> 910

<400> 910

000

<210> 911

<400> 911

000

<210> 912

<400> 912

000

<210> 913

<400> 913

000

<210> 914

<400> 914

000

<210> 915

<400> 915

000

<210> 916

<400> 916

000

<210> 917

<400> 917

000

<210> 918

<400> 918

000

<210> 919

<400> 919

000

<210> 920

<400> 920

000

<210> 921

<400> 921

000

<210> 922

<400> 922

000

<210> 923

<400> 923

000

<210> 924

<400> 924

000

<210> 925

<211> 662

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 925

Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg

1 5 10 15

Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg

20 25 30

Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg

35 40 45

Lys Leu Arg Lys Val Lys Arg Lys Lys Lys Ser Leu Ile Val Arg Gln

50 55 60

Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys Ile Ile Gly Gln Ser Ala

65 70 75 80

Ile Val Val Gly Ala Glu Gly Lys Gln Met Tyr Cys Tyr Thr Val Asn

85 90 95

Lys Leu Ile Asn Val Pro Pro Lys Thr Pro Tyr Gly Gly Gly Phe Gly

100 105 110

Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala

115 120 125

Gln Asn Ile Trp Thr Gln Ser Asn Val Leu Lys Asp Leu Cys Arg Tyr

130 135 140

Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp Asn Lys Thr Asp Phe Val

145 150 155 160

Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln Leu Thr Lys Phe Thr Tyr

165 170 175

Pro Gly Ala His Pro Gln Gln Ile Met Leu Gln Lys His His Lys Phe

180 185 190

Ile Leu Ser Gln Met Thr Lys Pro Asn Gly Arg Leu Thr Lys Lys Leu

195 200 205

Lys Ile Lys Pro Pro Lys Gln Met Leu Ser Lys Trp Phe Phe Ser Lys

210 215 220

Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu Lys Ala Ser Ala Leu Asp

225 230 235 240

Leu Arg His Ser Tyr Leu Gly Cys Cys Asn Glu Asn Pro Gln Val Phe

245 250 255

Phe Tyr Tyr Leu Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala

260 265 270

Gln Ser Ser Thr Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr

275 280 285

Tyr Tyr Arg Tyr Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His

290 295 300

Glu Tyr Glu Lys Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser

305 310 315 320

Phe Leu Gln Thr Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys

325 330 335

Ile Ala Glu Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp

340 345 350

Asn Gly Asp Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr

355 360 365

Trp Asp Gln Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro

370 375 380

Ile Trp Leu Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys

385 390 395 400

Ala Asp Lys Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro

405 410 415

Ala Ile Phe Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro

420 425 430

Leu Ser Gln Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro

435 440 445

Thr Leu Leu Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln

450 455 460

Glu Ile Ile Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr

465 470 475 480

Ala Asn Gln Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe

485 490 495

Thr Phe Lys Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp

500 505 510

Pro Ser Lys Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr

515 520 525

Ile Gln Ile Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His

530 535 540

Asp Trp Asp Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg

545 550 555 560

Met Ser Thr Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu

565 570 575

Glu Asp Ile Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val

580 585 590

Pro Gln Gln Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys

595 600 605

Lys Lys Asp Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln

610 615 620

Leu Ile Lys Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile

625 630 635 640

Leu Gln Leu Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu

645 650 655

His Thr Gly Met Leu Pro

660

<210> 926

<211> 58

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 926

Met Pro Phe Trp Trp Arg Arg Arg Arg Lys Phe Trp Thr Asn Asn Arg

1 5 10 15

Phe Asn Tyr Thr Lys Arg Arg Arg Tyr Arg Lys Arg Trp Pro Arg Arg

20 25 30

Arg Arg Arg Arg Arg Pro Tyr Arg Arg Pro Val Arg Arg Arg Arg Arg

35 40 45

Lys Leu Arg Lys Val Lys Arg Lys Lys Lys

50 55

<210> 927

<211> 202

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 927

Ser Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Arg Thr Cys Lys

1 5 10 15

Ile Ile Gly Gln Ser Ala Ile Val Val Gly Ala Glu Gly Lys Gln Met

20 25 30

Tyr Cys Tyr Thr Val Asn Lys Leu Ile Asn Val Pro Pro Lys Thr Pro

35 40 45

Tyr Gly Gly Gly Phe Gly Val Asp Gln Tyr Thr Leu Lys Tyr Leu Tyr

50 55 60

Glu Glu Tyr Arg Phe Ala Gln Asn Ile Trp Thr Gln Ser Asn Val Leu

65 70 75 80

Lys Asp Leu Cys Arg Tyr Ile Asn Val Lys Leu Ile Phe Tyr Arg Asp

85 90 95

Asn Lys Thr Asp Phe Val Leu Ser Tyr Asp Arg Asn Pro Pro Phe Gln

100 105 110

Leu Thr Lys Phe Thr Tyr Pro Gly Ala His Pro Gln Gln Ile Met Leu

115 120 125

Gln Lys His His Lys Phe Ile Leu Ser Gln Met Thr Lys Pro Asn Gly

130 135 140

Arg Leu Thr Lys Lys Leu Lys Ile Lys Pro Pro Lys Gln Met Leu Ser

145 150 155 160

Lys Trp Phe Phe Ser Lys Gln Phe Cys Lys Tyr Pro Leu Leu Ser Leu

165 170 175

Lys Ala Ser Ala Leu Asp Leu Arg His Ser Tyr Leu Gly Cys Cys Asn

180 185 190

Glu Asn Pro Gln Val Phe Phe Tyr Tyr Leu

195 200

<210> 928

<211> 79

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 928

Asn His Gly Tyr Tyr Thr Ile Thr Asn Trp Gly Ala Gln Ser Ser Thr

1 5 10 15

Ala Tyr Arg Pro Asn Ser Lys Val Thr Asp Thr Thr Tyr Tyr Arg Tyr

20 25 30

Lys Asn Asp Arg Lys Asn Ile Asn Ile Lys Ser His Glu Tyr Glu Lys

35 40 45

Ser Ile Ser Tyr Glu Asn Gly Tyr Phe Gln Ser Ser Phe Leu Gln Thr

50 55 60

Gln Cys Ile Tyr Thr Ser Glu Arg Gly Glu Ala Cys Ile Ala Glu

65 70 75

<210> 929

<211> 160

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 929

Lys Pro Leu Gly Ile Ala Ile Tyr Asn Pro Val Lys Asp Asn Gly Asp

1 5 10 15

Gly Asn Met Ile Tyr Leu Val Ser Thr Leu Ala Asn Thr Trp Asp Gln

20 25 30

Pro Pro Lys Asp Ser Ala Ile Leu Ile Gln Gly Val Pro Ile Trp Leu

35 40 45

Gly Leu Phe Gly Tyr Leu Asp Tyr Cys Arg Gln Ile Lys Ala Asp Lys

50 55 60

Thr Trp Leu Asp Ser His Val Leu Val Ile Gln Ser Pro Ala Ile Phe

65 70 75 80

Thr Tyr Pro Asn Pro Gly Ala Gly Lys Trp Tyr Cys Pro Leu Ser Gln

85 90 95

Ser Phe Ile Asn Gly Asn Gly Pro Phe Asn Gln Pro Pro Thr Leu Leu

100 105 110

Gln Lys Ala Lys Trp Phe Pro Gln Ile Gln Tyr Gln Gln Glu Ile Ile

115 120 125

Asn Ser Phe Val Glu Ser Gly Pro Phe Val Pro Lys Tyr Ala Asn Gln

130 135 140

Thr Glu Ser Asn Trp Glu Leu Lys Tyr Lys Tyr Val Phe Thr Phe Lys

145 150 155 160

<210> 930

<211> 163

<212> PRT

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 930

Trp Gly Gly Pro Gln Phe His Glu Pro Glu Ile Ala Asp Pro Ser Lys

1 5 10 15

Gln Glu Gln Tyr Asp Val Pro Asp Thr Phe Tyr Gln Thr Ile Gln Ile

20 25 30

Glu Asp Pro Glu Gly Gln Asp Pro Arg Ser Leu Ile His Asp Trp Asp

35 40 45

Tyr Arg Arg Gly Phe Ile Lys Glu Arg Ser Leu Lys Arg Met Ser Thr

50 55 60

Tyr Phe Ser Thr His Thr Asp Gln Gln Ala Thr Ser Glu Glu Asp Ile

65 70 75 80

Pro Lys Lys Lys Lys Arg Ile Gly Pro Gln Leu Thr Val Pro Gln Gln

85 90 95

Lys Glu Glu Glu Thr Leu Ser Cys Leu Leu Ser Leu Cys Lys Lys Asp

100 105 110

Thr Phe Gln Glu Thr Glu Thr Gln Glu Asp Leu Gln Gln Leu Ile Lys

115 120 125

Gln Gln Gln Glu Gln Gln Leu Leu Leu Lys Arg Asn Ile Leu Gln Leu

130 135 140

Ile His Lys Leu Lys Glu Asn Gln Gln Met Leu Gln Leu His Thr Gly

145 150 155 160

Met Leu Pro

<210> 931

<400> 931

000

<210> 932

<400> 932

000

<210> 933

<400> 933

000

<210> 934

<400> 934

000

<210> 935

<400> 935

000

<210> 936

<400> 936

000

<210> 937

<400> 937

000

<210> 938

<400> 938

000

<210> 939

<400> 939

000

<210> 940

<400> 940

000

<210> 941

<400> 941

000

<210> 942

<400> 942

000

<210> 943

<400> 943

000

<210> 944

<400> 944

000

<210> 945

<400> 945

000

<210> 946

<400> 946

000

<210> 947

<400> 947

000

<210> 948

<400> 948

000

<210> 949

<211> 21

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成肽

<220>

<221> 经修饰的残基

<222> (1)..(1)

<223> W或F

<220>

<221> 经修饰的残基

<222> (2)..(8)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (10)..(12)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (14)..(14)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (16)..(20)

<223> 任何氨基酸

<400> 949

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa His Xaa Xaa Xaa Cys Xaa Cys Xaa

1 5 10 15

Xaa Xaa Xaa Xaa His

20

<210> 950

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成肽

<220>

<221> 经修饰的残基

<222> (6)..(7)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (9)..(9)

<223> 任何氨基酸

<220>

<221> 经修饰的残基

<222> (15)..(16)

<223> 任何氨基酸

<400> 950

Tyr Asn Cys Ser Pro Xaa Xaa Asp Xaa Gly Ala Ser Lys Arg Xaa Xaa

1 5 10 15

Asn Thr Ser Val Ala Lys

20

<210> 951

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 人工序列的描述：合成的寡核苷酸

<220>

<221> 经修饰的碱基

<222> (45)..(45)

<223> a、c、 t、g、未知或其他

<400> 951

aggtgagtga aaccaccgaa gtcaaggggc aattcgggct agggncagtc t 51

<210> 952

<211> 50

<212> DNA

<213> 甲型细环病毒属物种（Alphatorquevirus sp.）

<400> 952

aggtgagttt acacaccgca gtcaaggggc aattcgggct cgggactggc 50

<210> 953

<211> 50

<212> DNA

<213> 乙型细环病毒属物种（Betatorquevirus sp.）

<400> 953

aggtgagtga aaccaccgaa gtcaaggggc aattcgggct agatcagtct 50

<210> 954

<211> 50

<212> DNA

<213> 丙型细环病毒属物种（Gammatorquevirus sp.）

<400> 954

aggtgagtga aaccaccgag gtctaggggc aattcgggct agggcagtct 50

<210> 955

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> 人工序列的描述：合成的6xHis标签

<400> 955

His His His His His His

1 5

<210> 956

<211> 237

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 956

Arg Arg Lys Leu Arg Val Arg Lys Arg Phe Tyr Lys Arg Lys Leu Lys

1 5 10 15

Lys Ile Val Leu Lys Gln Phe Gln Pro Lys Ile Ile Arg Arg Cys Thr

20 25 30

Ile Phe Gly Thr Ile Cys Leu Phe Gln Gly Ser Pro Glu Arg Ala Asn

35 40 45

Asn Asn Tyr Ile Gln Thr Ile Tyr Ser Tyr Val Pro Asp Lys Glu Pro

50 55 60

Gly Gly Gly Gly Trp Thr Leu Ile Thr Glu Ser Leu Ser Ser Leu Trp

65 70 75 80

Glu Asp Trp Glu His Leu Lys Asn Val Trp Thr Gln Ser Asn Ala Gly

85 90 95

Leu Pro Leu Val Arg Tyr Gly Gly Val Thr Leu Tyr Phe Tyr Gln Ser

100 105 110

Ala Tyr Thr Asp Tyr Ile Ala Gln Val Phe Asn Cys Tyr Pro Met Thr

115 120 125

Asp Thr Lys Tyr Thr His Ala Asp Ser Ala Pro Asn Arg Met Leu Leu

130 135 140

Lys Lys His Val Ile Arg Val Pro Ser Arg Glu Thr Arg Lys Lys Arg

145 150 155 160

Lys Pro Tyr Lys Arg Val Arg Val Gly Pro Pro Ser Gln Met Gln Asn

165 170 175

Lys Trp Tyr Phe Gln Arg Asp Ile Cys Glu Ile Pro Leu Ile Met Ile

180 185 190

Ala Ala Thr Ala Val Asp Phe Arg Tyr Pro Phe Cys Ala Ser Asp Cys

195 200 205

Ala Ser Asn Asn Leu Thr Leu Thr Cys Leu Asn Pro Leu Leu Phe Gln

210 215 220

Asn Gln Asp Phe Asp His Pro Ser Asp Thr Gln Gly Tyr

225 230 235

<210> 957

<211> 232

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 957

Arg Arg Lys Arg Arg Val Arg Pro Thr Tyr Thr Thr Ile Pro Leu Lys

1 5 10 15

Gln Trp Gln Pro Pro Tyr Lys Arg Thr Cys Tyr Ile Lys Gly Gln Asp

20 25 30

Cys Leu Ile Tyr Tyr Ser Asn Leu Arg Leu Gly Met Asn Ser Thr Met

35 40 45

Tyr Glu Lys Ser Ile Val Pro Val His Trp Pro Gly Gly Gly Ser Phe

50 55 60

Ser Val Ser Met Leu Thr Leu Asp Ala Leu Tyr Asp Ile His Lys Leu

65 70 75 80

Cys Arg Asn Trp Trp Thr Ser Thr Asn Gln Asp Leu Pro Leu Val Arg

85 90 95

Tyr Lys Gly Cys Lys Ile Thr Phe Tyr Gln Ser Thr Phe Thr Asp Tyr

100 105 110

Ile Val Arg Ile His Thr Glu Leu Pro Ala Asn Ser Asn Lys Leu Thr

115 120 125

Tyr Pro Asn Thr His Pro Leu Met Met Met Met Ser Lys Tyr Lys His

130 135 140

Ile Ile Pro Ser Arg Gln Thr Arg Arg Lys Lys Lys Pro Tyr Thr Lys

145 150 155 160

Ile Phe Val Lys Pro Pro Pro Gln Phe Glu Asn Lys Trp Tyr Phe Ala

165 170 175

Thr Asp Leu Tyr Lys Ile Pro Leu Leu Gln Ile His Cys Thr Ala Cys

180 185 190

Asn Leu Gln Asn Pro Phe Val Lys Pro Asp Lys Leu Ser Asn Asn Val

195 200 205

Thr Leu Trp Ser Leu Asn Thr Ile Ser Ile Gln Asn Arg Asn Met Ser

210 215 220

Val Asp Gln Gly Gln Ser Trp Pro

225 230

<210> 958

<211> 238

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 958

Arg Arg Arg Arg Arg Trp Arg Lys Arg Pro Thr Val Arg Arg Lys Leu

1 5 10 15

Lys Lys Leu Thr Ile Gln Gln Trp Gln Pro Lys Thr Ile Arg Lys Cys

20 25 30

Cys Ile Gln Gly Leu His Cys Leu Phe Leu Val Thr Glu Asp Thr Ile

35 40 45

Ser Arg Asn Tyr Arg Met Tyr Glu His Ser Tyr Thr Gly Glu Tyr Tyr

50 55 60

Pro Gly Gly Gly Gly Phe Ser Ile Thr Arg Tyr Ser Leu Asp Gly Leu

65 70 75 80

Tyr Glu Gln His Gln Leu Asp Arg Asn Trp Trp Thr Asn Ser Asn Thr

85 90 95

Asn Leu Pro Leu Val Arg Tyr Thr Gly Cys Lys Ile Lys Phe Tyr Gln

100 105 110

Ser Trp Ser Val Asp Tyr Ile Cys Asn Tyr Ser Leu Thr Trp Pro Met

115 120 125

Val Ala Thr Gln Leu Leu Tyr Gln Ser Cys Gln Pro Ser Phe Met Met

130 135 140

Met Asn Lys Asn Ser Ile Met Ile Pro Ser Lys Leu Thr Lys Pro Ile

145 150 155 160

Lys Lys Gly Tyr Lys Thr Ile Lys Glu Lys Pro Pro His Glu Met Leu

165 170 175

Asn Arg Trp Tyr Phe Ala Lys Asp Leu Ser Lys Val Gly Leu Leu Met

180 185 190

Leu Thr Ala Ala Ser Ala Ser Phe Asp His Tyr Tyr Gln Ala Thr Asp

195 200 205

Ser Leu Ser Asn Asn Cys Thr Phe Glu Ser Leu Asn Pro Tyr Phe Tyr

210 215 220

Met Arg His Asp Phe Ile Leu Phe Pro Val Thr Gly Tyr Val

225 230 235

<210> 959

<211> 238

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 959

Arg Arg Arg Arg Arg Trp Val Arg Arg Lys Pro Phe Tyr Lys Arg Lys

1 5 10 15

Ile Lys Arg Leu Asn Ile Val Glu Trp Gln Pro Lys Ser Ile Arg Lys

20 25 30

Cys Arg Ile Lys Gly Met Leu Cys Leu Phe Gln Thr Thr Glu Asp Arg

35 40 45

Leu Ser Tyr Asn Phe Asp Met Tyr Glu Glu Ser Ile Ile Pro Glu Lys

50 55 60

Leu Pro Gly Gly Gly Gly Phe Ser Ile Lys Asn Ile Ser Leu Tyr Ala

65 70 75 80

Leu Tyr Gln Glu His Ile His Ala His Asn Ile Phe Thr His Thr Asn

85 90 95

Thr Asp Arg Pro Leu Ala Arg Tyr Thr Gly Cys Ser Leu Lys Phe Tyr

100 105 110

Gln Ser Lys Asp Ile Asp Tyr Val Val Thr Tyr Ser Thr Ser Leu Pro

115 120 125

Leu Arg Ser Ser Met Gly Met Tyr Asn Ser Met Gln Pro Ser Ile His

130 135 140

Leu Met Gln Gln Asn Lys Leu Ile Val Pro Ser Lys Gln Thr Gln Lys

145 150 155 160

Arg Arg Lys Pro Tyr Ile Lys Lys His Ile Ser Pro Pro Thr Gln Met

165 170 175

Lys Ser Gln Trp Tyr Phe Gln His Asn Ile Ala Asn Ile Pro Leu Leu

180 185 190

Met Ile Arg Thr Thr Ala Leu Thr Leu Asp Asn Tyr Tyr Ile Gly Ser

195 200 205

Arg Gln Leu Ser Thr Asn Val Thr Ile His Thr Leu Asn Thr Thr Tyr

210 215 220

Ile Gln Asn Arg Asp Trp Gly Asp Arg Asn Lys Thr Tyr Tyr

225 230 235

<210> 960

<211> 240

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 960

Arg Arg Pro Val Arg Arg Arg Arg Arg Lys Leu Arg Lys Val Lys Arg

1 5 10 15

Lys Lys Lys Ser Leu Ile Val Arg Gln Trp Gln Pro Asp Ser Ile Arg

20 25 30

Thr Cys Lys Ile Ile Gly Gln Ser Ala Ile Val Val Gly Ala Glu Gly

35 40 45

Lys Gln Met Tyr Cys Tyr Thr Val Asn Lys Leu Ile Asn Val Pro Pro

50 55 60

Lys Thr Pro Tyr Gly Gly Gly Phe Gly Val Asp Gln Tyr Thr Leu Lys

65 70 75 80

Tyr Leu Tyr Glu Glu Tyr Arg Phe Ala Gln Asn Ile Trp Thr Gln Ser

85 90 95

Asn Val Leu Lys Asp Leu Cys Arg Tyr Ile Asn Val Lys Leu Ile Phe

100 105 110

Tyr Arg Asp Asn Lys Thr Asp Phe Val Leu Ser Tyr Asp Arg Asn Pro

115 120 125

Pro Phe Gln Leu Thr Lys Phe Thr Tyr Pro Gly Ala His Pro Gln Gln

130 135 140

Ile Met Leu Gln Lys His His Lys Phe Ile Leu Ser Gln Met Thr Lys

145 150 155 160

Pro Asn Gly Arg Leu Thr Lys Lys Leu Lys Ile Lys Pro Pro Lys Gln

165 170 175

Met Leu Ser Lys Trp Phe Phe Ser Lys Gln Phe Cys Lys Tyr Pro Leu

180 185 190

Leu Ser Leu Lys Ala Ser Ala Leu Asp Leu Arg His Ser Tyr Leu Gly

195 200 205

Cys Cys Asn Glu Asn Pro Gln Val Phe Phe Tyr Tyr Leu Asn His Gly

210 215 220

Tyr Tyr Thr Ile Thr Asn Trp Gly Ala Gln Ser Ser Thr Ala Tyr Arg

225 230 235 240

<210> 961

<211> 240

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 961

Arg Phe Thr Lys Thr Arg Arg Arg Arg Lys Arg Lys Lys Val Arg Arg

1 5 10 15

Lys Leu Lys Lys Ile Thr Ile Lys Gln Trp Gln Pro Asp Ser Val Lys

20 25 30

Lys Cys Lys Ile Lys Gly Tyr Ser Thr Leu Val Met Gly Ala Gln Gly

35 40 45

Lys Gln Tyr Asn Cys Tyr Thr Asn Gln Ala Ser Asp Tyr Val Gln Pro

50 55 60

Lys Ala Pro Gln Gly Gly Gly Phe Gly Cys Glu Val Phe Asn Leu Lys

65 70 75 80

Trp Leu Tyr Gln Glu Tyr Thr Ala His Arg Asn Ile Trp Thr Lys Thr

85 90 95

Asn Glu Tyr Thr Asp Leu Cys Arg Tyr Thr Gly Ala Gln Ile Ile Leu

100 105 110

Tyr Arg His Pro Asp Val Asp Phe Ile Val Ser Trp Asp Asn Gln Pro

115 120 125

Pro Phe Leu Leu Asn Lys Tyr Thr Tyr Pro Glu Leu Gln Pro Gln Asn

130 135 140

Leu Leu Leu Ala Arg Arg Lys Arg Ile Ile Leu Ser Gln Lys Ser Asn

145 150 155 160

Pro Lys Gly Lys Leu Arg Ile Lys Leu Arg Ile Pro Pro Pro Lys Gln

165 170 175

Met Ile Thr Lys Trp Phe Phe Gln Arg Asp Phe Cys Asp Val Asn Leu

180 185 190

Phe Lys Leu Cys Ala Ser Ala Ala Ser Phe Arg Tyr Pro Gly Ile Ser

195 200 205

His Gly Ala Gln Ser Thr Ile Phe Ser Ala Tyr Ala Leu Asn Thr Asp

210 215 220

Phe Tyr Gln Cys Ser Asp Trp Cys Gln Thr Asn Thr Glu Thr Gly Tyr

225 230 235 240

<210> 962

<211> 239

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 962

Gly Arg Arg Thr Tyr Thr Arg Arg Ala Val Arg Arg Arg Arg Arg Pro

1 5 10 15

Arg Lys Arg Leu Val Leu Thr Gln Trp Ser Pro Gln Thr Val Arg Asn

20 25 30

Cys Ser Ile Arg Gly Ile Val Pro Met Val Ile Cys Gly His Thr Lys

35 40 45

Ala Gly Arg Asn Tyr Ala Ile His Ser Glu Asp Phe Thr Thr Gln Ile

50 55 60

Gln Pro Phe Gly Gly Ser Phe Ser Thr Thr Thr Trp Ser Leu Lys Val

65 70 75 80

Leu Trp Asp Glu His Gln Lys Phe Gln Asn Arg Trp Ser Tyr Pro Asn

85 90 95

Thr Gln Leu Asp Leu Ala Arg Tyr Arg Gly Val Thr Phe Trp Phe Tyr

100 105 110

Arg Asp Gln Lys Thr Asp Tyr Ile Val Gln Trp Ser Arg Asn Pro Pro

115 120 125

Phe Lys Leu Asn Lys Tyr Ser Ser Ala Met Tyr His Pro Gly Met Met

130 135 140

Met Gln Ala Lys Arg Lys Leu Val Val Pro Ser Phe Gln Thr Arg Pro

145 150 155 160

Lys Gly Lys Lys Arg Tyr Arg Val Thr Ile Lys Pro Pro Asn Met Phe

165 170 175

Ala Asp Lys Trp Tyr Thr Gln Glu Asp Leu Cys Pro Val Pro Leu Val

180 185 190

Gln Ile Val Val Ser Ala Ala Ser Leu Leu His Pro Phe Cys Pro Pro

195 200 205

Gln Thr Asn Asn Pro Cys Ile Thr Phe Gln Val Leu Lys Asp Ile Tyr

210 215 220

Asp Glu Cys Ile Gly Val Asn Glu Thr Met Lys Asp Lys Tyr Lys

225 230 235

<210> 963

<211> 240

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 963

Arg Arg Arg Arg Arg Arg Gly Arg Arg Arg Arg Arg Arg Arg Arg Arg

1 5 10 15

His Lys Pro Thr Leu Ile Leu Arg Gln Trp Gln Pro Asp Cys Ile Arg

20 25 30

His Cys Lys Ile Thr Gly Trp Met Pro Leu Ile Ile Cys Gly Lys Gly

35 40 45

Ser Thr Gln Phe Asn Tyr Ile Thr His Ala Asp Asp Ile Thr Pro Arg

50 55 60

Gly Ala Ser Tyr Gly Gly Asn Phe Thr Asn Met Thr Phe Ser Leu Glu

65 70 75 80

Ala Ile Tyr Glu Gln Phe Leu Tyr His Arg Asn Arg Trp Ser Ala Ser

85 90 95

Asn His Asp Leu Glu Leu Cys Arg Tyr Lys Gly Thr Thr Leu Lys Leu

100 105 110

Tyr Arg His Pro Glu Val Asp Tyr Ile Val Thr Tyr Ser Arg Thr Gly

115 120 125

Pro Phe Glu Ile Ser His Met Thr Tyr Leu Ser Thr His Pro Met Leu

130 135 140

Met Leu Leu Asn Lys His His Ile Val Val Pro Ser Leu Lys Thr Lys

145 150 155 160

Pro Arg Gly Arg Lys Ala Ile Lys Val Arg Ile Arg Pro Pro Lys Leu

165 170 175

Met Asn Asn Lys Trp Tyr Phe Thr Arg Asp Phe Cys Asn Ile Gly Leu

180 185 190

Phe Gln Leu Trp Ala Thr Gly Leu Glu Leu Arg Asn Pro Trp Leu Arg

195 200 205

Met Ser Thr Leu Ser Pro Cys Ile Gly Phe Asn Val Leu Lys Asn Ser

210 215 220

Ile Tyr Thr Asn Leu Ser Asn Leu Pro Gln Tyr Lys Asn Glu Arg Leu

225 230 235 240

<210> 964

<211> 233

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 964

Arg Arg Arg Arg Arg Phe Arg Arg Arg Gly Arg Lys Ala Lys Leu Ile

1 5 10 15

Ile Lys Leu Trp Gln Pro Ala Val Ile Lys Arg Cys Arg Ile Lys Gly

20 25 30

Tyr Ile Pro Leu Ile Ile Ser Gly Asn Gly Thr Phe Ala Thr Asn Phe

35 40 45

Thr Ser His Ile Asn Asp Arg Ile Met Lys Gly Pro Phe Gly Gly Gly

50 55 60

His Ser Thr Met Arg Phe Ser Leu Tyr Ile Leu Phe Glu Glu His Leu

65 70 75 80

Arg His Met Asn Phe Trp Thr Arg Ser Asn Asp Asn Leu Glu Leu Thr

85 90 95

Arg Tyr Leu Gly Ala Ser Val Lys Ile Tyr Arg His Pro Asp Gln Asp

100 105 110

Phe Ile Val Ile Tyr Asn Arg Arg Thr Pro Leu Gly Gly Asn Ile Tyr

115 120 125

Thr Ala Pro Ser Leu His Pro Gly Asn Ala Ile Leu Ala Lys His Lys

130 135 140

Ile Leu Val Pro Ser Leu Gln Thr Arg Pro Lys Gly Arg Lys Ala Ile

145 150 155 160

Arg Leu Arg Ile Ala Pro Pro Thr Leu Phe Thr Asp Lys Trp Tyr Phe

165 170 175

Gln Lys Asp Ile Ala Asp Leu Thr Leu Phe Asn Ile Met Ala Val Glu

180 185 190

Ala Asp Leu Arg Phe Pro Phe Cys Ser Pro Gln Thr Asp Asn Thr Cys

195 200 205

Ile Ser Phe Gln Val Leu Ser Ser Val Tyr Asn Asn Tyr Leu Ser Ile

210 215 220

Asn Thr Phe Asn Asn Asp Asn Ser Asp

225 230

<210> 965

<211> 233

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 965

Arg Arg Trp Arg Arg Lys Gly Lys Arg Ser Arg Lys Lys Lys Ile Ile

1 5 10 15

Ile Arg Gln Trp Gln Pro Asn Tyr Thr Arg Arg Cys Asn Ile Val Gly

20 25 30

Tyr Met Pro Leu Leu Ile Cys Gly Glu Asn Thr Val Ala Thr Asn Tyr

35 40 45

Ala Thr His Ser Asp Asp Ser Tyr Tyr Pro Gly Pro Phe Gly Gly Gly

50 55 60

Met Thr Thr Asp Lys Phe Thr Leu Arg Ile Leu Tyr Asp Glu Tyr Lys

65 70 75 80

Arg Phe Met Asn Tyr Trp Thr Ser Ser Asn Glu Asp Leu Asp Leu Cys

85 90 95

Arg Tyr Leu Gly Cys Thr Leu Tyr Val Phe Arg His Pro Glu Val Asp

100 105 110

Phe Ile Ile Ile Ile Asn Thr Ser Pro Pro Phe Leu Asp Thr Glu Ile

115 120 125

Thr Gly Pro Ser Ile His Pro Gly Met Met Ala Leu Asn Lys Arg Ser

130 135 140

Arg Trp Ile Pro Ser Ile Lys Asn Arg Pro Gly Arg Lys His Tyr Ile

145 150 155 160

Lys Ile Lys Val Gly Ala Pro Arg Met Phe Thr Asp Lys Trp Tyr Pro

165 170 175

Gln Thr Asp Leu Cys Asp Met Thr Leu Leu Thr Ile Phe Ala Ser Ala

180 185 190

Ala Asp Met Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp Thr Ile Val

195 200 205

Val Ser Phe Gln Val Leu Gln Ser Met Tyr Asn Asp Cys Leu Ser Val

210 215 220

Leu Pro Asp Asn Phe Ala Glu Thr Ser

225 230

<210> 966

<211> 232

<212> PRT

<213> 未知

<220>

<223> 未知的描述：指环病毒（Anelloviridae）科序列

<400> 966

Arg Arg Trp Lys Arg Lys Gly Arg Arg Arg Arg Lys Ala Lys Ile Ile

1 5 10 15

Ile Arg Gln Trp Gln Pro Asn Tyr Arg Arg Arg Cys Asn Ile Val Gly

20 25 30

Tyr Leu Pro Ile Leu Ile Cys Gly Gly Asn Thr Val Ser Arg Asn Tyr

35 40 45

Ala Thr His Ser Asp Asp Thr Asn Tyr Pro Gly Pro Phe Gly Gly Gly

50 55 60

Met Thr Thr Asp Lys Phe Ser Leu Arg Ile Leu Tyr Asp Glu Tyr Lys

65 70 75 80

Arg Phe Met Asn Tyr Trp Thr Ala Ser Asn Glu Asp Leu Asp Leu Cys

85 90 95

Arg Tyr Leu Gly Cys Thr Phe Tyr Phe Phe Arg His Pro Glu Val Asp

100 105 110

Phe Ile Ile Lys Ile Asn Thr Met Pro Pro Phe Leu Asp Thr Thr Ile

115 120 125

Thr Ala Pro Ser Ile His Pro Gly Leu Met Ala Leu Asp Lys Arg Ala

130 135 140

Arg Trp Ile Pro Ser Leu Lys Asn Arg Pro Gly Lys Lys His Tyr Ile

145 150 155 160

Lys Ile Arg Val Gly Ala Pro Lys Met Phe Thr Asp Lys Trp Tyr Pro

165 170 175

Gln Thr Asp Leu Cys Asp Met Thr Leu Leu Thr Ile Tyr Ala Thr Ala

180 185 190

Ala Asp Met Gln Tyr Pro Phe Gly Ser Pro Leu Thr Asp Thr Val Val

195 200 205

Val Asn Ser Gln Val Leu Gln Ser Met Tyr Asp Glu Thr Ile Ser Ile

210 215 220

Leu Pro Asp Glu Lys Thr Lys Arg

225 230

<210> 967

<211> 170

<212> PRT

<213> 喙羽病病毒（Beak and feather disease virus）

<400> 967

Arg Arg Arg Arg Arg Arg Phe Ser Thr Asn Arg Ile Tyr Thr Leu Arg

1 5 10 15

Leu Thr Arg Gln Phe Gln Phe Lys Ile Asn Lys Gln Leu Ile Phe Asn

20 25 30

Ala Asp Tyr Ile Thr Phe Ala Leu Asp Asp Phe Leu Gln Ala Val Pro

35 40 45

Asn Pro His Thr Leu Asn Phe Glu Asp Tyr Arg Ile Lys Leu Ala Lys

50 55 60

Met Glu Met Arg Pro Thr Gly Gly His Tyr Thr Gly Phe Gly His Thr

65 70 75 80

Ala Val Ile Gln Asp Ser Arg Ile Thr Arg Phe Lys Thr Thr Ala Asp

85 90 95

Pro Leu Ala Pro Phe Asp Gly Ala Lys Lys Trp Phe Val Ser Arg Gly

100 105 110

Phe Lys Arg Leu Leu Arg Pro Lys Pro Gln Ile Thr Ile Glu Gly Pro

115 120 125

Asn Ser Ala Gly Thr Lys Val Arg His Tyr Gly Ile Ala Phe Ser Phe

130 135 140

Pro Gln Pro Glu Gln Thr Val Thr Lys Leu Thr Leu Tyr Val Gln Phe

145 150 155 160

Arg Gln Phe Ala Pro Asn Asn Pro Ser Thr

165 170

<210> 968

<211> 179

<212> PRT

<213> 戊型肝炎病毒A（Orthohepevirus A）

<400> 968

Gly Ala Ile Leu Arg Arg Gln Tyr Asn Leu Ser Thr Ser Pro Leu Thr

1 5 10 15

Ser Ser Val Ala Ser Gly Thr Asn Leu Val Leu Tyr Ala Ala Pro Leu

20 25 30

Asn Pro Leu Leu Pro Leu Gln Asp Gly Thr Asn Thr His Ile Met Ala

35 40 45

Thr Glu Ala Ser Asn Tyr Ala Gln Tyr Arg Val Val Arg Ala Thr Ile

50 55 60

Arg Tyr Arg Pro Leu Val Pro Asn Ala Val Ser Ile Ser Phe Trp Pro

65 70 75 80

Gln Thr Thr Thr Thr Pro Thr Ser Val Asp Met Asn Ser Ile Thr Ser

85 90 95

Thr Asp Val Arg Ile Leu Val Gln Pro Gly Ile Ala Ser Glu Leu Val

100 105 110

Ile Pro Ser Glu Arg Leu His Tyr Arg Thr Arg Thr Gly Val Ala Glu

115 120 125

Glu Glu Ala Thr Ser Gly Leu Val Met Leu Cys Ile His Gly Ser Pro

130 135 140

Val Asn Ser Ala Leu Gly Leu Leu Asp Phe Ala Leu Glu Leu Glu Phe

145 150 155 160

Arg Asn Leu Thr Pro Gly Asn Thr Asn Thr Arg Val Ser Arg Tyr Thr

165 170 175

Ser Thr Ala

Claims

1.一种指环载体，其含有：

a)包含ORF1分子的蛋白质外壳；

b)包含RNA的遗传元件，

其中该遗传元件被包封在该蛋白质外壳内。

2.根据权利要求1所述的指环载体，其中该遗传元件由至少10％、20％、25％、30％、40％、50％、60％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％或100％RNA组成。

3.根据权利要求1或2所述的指环载体，其中该RNA包含一个或多个化学修饰。

4.根据前述权利要求中任一项所述的指环载体，其中该遗传元件由RNA组成或基本上由RNA组成。

5.根据前述权利要求中任一项所述的指环载体，其中该遗传元件包含DNA区域。

6.根据前述权利要求中任一项所述的指环载体，其中该DNA区域的至少一部分与该遗传元件的RNA的至少一部分杂交。

7.根据前述权利要求中任一项所述的指环载体，其中该遗传元件是环状的。

8.一种制备指环载体的方法，该方法包括：

(a)提供混合物，该混合物含有：

(i)包含RNA的遗传元件，和

(ii)ORF1分子；以及

任选地，其中该混合物不包含在细胞中。

9.一种将遗传元件递送至细胞的方法，该方法包括使根据权利要求1-7中任一项所述的指环载体与细胞，例如真核细胞，例如哺乳动物细胞，例如人类细胞接触。