CN117813379A - 包括crispr核酸酶的基因编辑系统和其用途 - Google Patents

包括crispr核酸酶的基因编辑系统和其用途 Download PDF

Info

Publication number
CN117813379A
CN117813379A CN202280050146.XA CN202280050146A CN117813379A CN 117813379 A CN117813379 A CN 117813379A CN 202280050146 A CN202280050146 A CN 202280050146A CN 117813379 A CN117813379 A CN 117813379A
Authority
CN
China
Prior art keywords
nucleotides
sequence
rna
polypeptide
gene editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280050146.XA
Other languages
English (en)
Inventor
D·A·斯科特
N·M·杰科姆
P·亨尼韦尔
F-K·谢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abbott Biotechnology
Original Assignee
Abbott Biotechnology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abbott Biotechnology filed Critical Abbott Biotechnology
Priority claimed from PCT/US2022/031821 external-priority patent/WO2022256440A2/en
Publication of CN117813379A publication Critical patent/CN117813379A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Enzymes And Modification Thereof (AREA)

Abstract

一种基因编辑系统,其包括:(a)V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的第一核酸;(b)逆转录酶(RT)多肽或编码所述RT多肽的第二核酸;(c)向导RNA(gRNA)或编码所述gRNA的第三核酸,其中所述gRNA包括一个或多个可被V型CRISPR核酸酶识别的结合位点(CRISPR核酸酶结合位点)和对所关注的基因组位点内的靶序列具有特异性的间隔子序列,所述靶序列与原间隔子相邻基序(PAM)相邻;以及(d)逆转录供体RNA(RT供体RNA)或编码所述RT供体RNA的第四核酸,其中所述RT供体RNA包括引物结合位点(PBS)和模板序列。

Description

包括CRISPR核酸酶的基因编辑系统和其用途
相关申请的交叉引用
本申请要求根据35 U.S.C.§119(e)于2021年6月1日提交的美国临时申请第63/195,621号、于2021年8月23日提交的美国临时申请第63/236,047号、于2021年10月28日提交的美国临时申请第63/272,937号和于2022年1月14日提交的美国临时申请第63/299,695号的权益,所述美国临时申请中的每个美国临时申请的内容以全文引用的方式并入本文。
序列表
本申请含有已经以ASCII格式电子提交并且特此通过引用以其整体并入的序列表。创建于2022年6月1日的所述ASCII副本命名为116928-0042-0001WO00_SEQ.txt并且大小为388,313字节。
背景技术
成簇的规律间隔的短回文重复序列(CRISPR)和CRISPR相关(Cas)基因统称为CRISPR-Cas或CRISPR/Cas系统,是保护特定物种免受外来遗传要素影响的古生菌(archaea)和细菌中的适应性免疫系统。
发明内容
本公开至少部分地基于基因编辑系统的开发,所述基因编辑系统涉及V型CRISPR核酸酶多肽(例如,Cas12i2多肽)和逆转录酶,以及介导CRISPR核酸酶多肽在所关注的基因位点处切割的向导RNA(gRNA)和介导待并入到所关注的基因组位点中的所期望序列的合成的逆转录供体RNA。如本文所报道的,本文所公开的基因编辑系统已经以高编辑效率和准确性在各种基因组位点处实现了成功的基因编辑。不受理论的束缚,本文所公开的基因编辑系统示出了以下有利特征中的至少一个有利特征:
1.本文所描述的编辑模板RNA中的许多编辑模板RNA,如对Cas12i多肽具有特异性的编辑模板RNA,不需要反式激活CRISPR RNA(tracrRNA)组分,并且因此小于主要编辑向导RNA(pegRNA)。另外地,本文所描述的CRISPR核酸酶-逆转录酶融合体中的许多CRISPR核酸酶-逆转录酶融合体,如Cas12i多肽-逆转录酶融合体,小于Cas9-逆转录酶融合体。这些方面中的两者在递送和合成成本方面都是优选的。
2.本文所描述的编辑模板RNA可以被设计成具有比pegRNA的PBS更长的引物结合位点(PBS)。此特征可以提高并入到靶核酸中的编辑的效率。
3.包括编辑模板RNA的基因编辑系统被设计成仅结合非PAM链(即,PAM基序所在链的互补链;在本文中也称为靶链),如本文所描述的,与主要编辑系统相比,所述基因编辑系统能够在更宽的窗口上并入编辑。特别地,Cas12i多肽-逆转录酶系统能够重写Cas12i多肽的完整识别序列和RNA向导。因此,这些基因编辑系统可以更有效地避免通过CRISPR核酸酶-逆转录酶融合体和编辑模板RNA再靶向靶核酸。
因此,本文提供了基因编辑系统、包括此类基因编辑系统的药物组合物或试剂盒、使用基因编辑系统产生经基因修饰的细胞的方法以及由此产生的所得细胞。
在一些方面,本公开的特征在于一种基因编辑系统,其包括:(a)V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的第一核酸;(b)逆转录酶(RT)多肽或编码所述RT多肽的第二核酸;(c)向导RNA(gRNA)或编码所述gRNA的第三核酸,其中所述gRNA包括一个或多个可被V型CRISPR核酸酶识别的结合位点(CRISPR核酸酶结合位点)和对所关注的基因组位点内的靶序列具有特异性的间隔子序列,所述靶序列与原间隔子相邻基序(PAM)相邻;以及(d)逆转录供体RNA(RT供体RNA)或编码所述RT供体RNA的第四核酸,其中所述RT供体RNA包括引物结合位点(PBS)和模板序列。
在一些实施例中,本文所公开的任何基因编辑系统中的所述V型CRISPR核酸酶多肽是Cas12多肽。在一些实例中,所述Cas12多肽是Cas12i多肽,例如,Cas12i2多肽。在一些情况下,所述Cas12i多肽是Cas12i2多肽,所述Cas12i2多肽包括与SEQ ID NO:2至少95%相同的氨基酸序列。
在一些情况下,所述Cas12i2多肽包括位于SEQ ID NO:2的位置D581、G624、F626、P868、I926、V1030、E1035和/或S1046处的一个或多个突变。例如,所述一个或多个突变是氨基酸取代,所述氨基酸取代任选地是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其组合。在一个实例中,所述Cas12i2多肽包括位于位置D581、D911、I926和V1030处的突变(例如,D581R、D911R、I926R和V1030G的氨基酸取代)。在另一个实例中,所述Cas12i2多肽包括位于位置D581、I926和V1030处的突变(例如,D581R、I926R和V1030G的氨基酸取代)。在又另一个实例中,所述Cas12i2多肽包括位于位置D581、I926、V1030和S1046处的突变(例如,D581R、I926R、V1030G和S1046G的氨基酸取代)。在仍另一个实例中,所述Cas12i2多肽包括位于位置D581、G624、F626、I926、V1030、E1035和S1046处的突变(例如,D581R、G624R、F626R、I926R、V1030G、E1035R和S1046G的氨基酸取代)。在另一个实例中,所述Cas12i2多肽包括位于位置D581、G624、F626、P868、I926、V1030、E1035和S1046处的突变(例如,D581R、G624R、F626R、P868T、I926R、V1030G、E1035R和S1046G的氨基酸取代)。用于本文所公开的任何基因编辑系统的示例性Cas12i2多肽可以包括SEQ ID NO:3-7中的任一者的氨基酸序列。在一些实例中,示例性Cas12i2多肽可以包括SEQ ID NO:4的氨基酸序列。在另一个实例中,示例性Cas12i2多肽可以包括SEQ ID NO:7的氨基酸序列。
在其它情况下,所述Cas12i多肽具有降低的crRNA处理活性,任选地其中所述Cas12i多肽包括位于SEQ ID NO:2的位置H485和/或位置H486处的突变。
在一些实施例中,本文所公开的任何基因编辑系统可以包括所述V型CRISPR核酸酶多肽。在一些实施例中,所述基因编辑系统可以包括编码所述V型CRISPR核酸酶多肽的所述第一核酸。在一些情况下,所述第一核酸位于第一载体中(例如,病毒载体,如腺相关病毒载体或AAV载体)。在其它情况下,所述第一核酸是第一信使RNA(mRNA)。
在本文所公开的任何基因编辑系统中,所述RT多肽可以是莫洛尼鼠类白血病病毒(Moloney Murine Leukemia Virus,MMLV)-RT、小鼠乳腺肿瘤病毒(MMTV)-RT、Marathon-RT或RTx-RT(例如,MMLV RT,其可以包括SEQ ID NO:29的氨基酸序列)。在一些情况下,所述基因编辑系统包括所述RT多肽。可替代地,所述系统包括编码所述RT多肽的所述第二核酸。在一些情况下,所述第二核酸位于第二载体(例如,病毒载体,如腺相关病毒载体或AAV载体)中。在一个实例中,所述基因编辑系统包括载体(例如,病毒载体),所述载体包括编码所述V型CRISPR多肽的所述第一核酸和编码所述RT多肽的所述第二核酸两者。在其它实例中,编码所述RT的所述第二核酸是第二mRNA。在一个实例中,所述基因编辑系统包括包含编码所述V型CRISPR多肽的第一mRNA和编码所述RT的第二mRNA两者的单个RNA分子。
在一些实施例中,本文所公开的基因编辑系统包括融合多肽,所述融合多肽包括所述V型CRISPR核酸酶多肽和所述RT多肽,或编码所述融合多肽的核酸(例如,载体,如病毒载体)。可替代地,所述基因编辑系统包括所述V型CRISPR核酸酶多肽和所述RT多肽,作为两种单独的多肽。
在本文所公开的任何基因编辑系统中,所述间隔子序列的长度可以为20-30个核苷酸。在一些实例中,所述间隔子序列的长度为20个核苷酸。
在一些实施例中,所述PAM包括5'-TTN-3'的基序。在一些情况下(例如,与Cas12i2多肽缔合),所述PAM可以位于所述靶序列的5'。
在一些实施例中,所述一个或多个CRISPR核酸酶结合位点是直接重复序列。在一些情况下,每个直接重复序列的长度为23-36个核苷酸。在一个实例中,所述直接重复序列长度为23个核苷酸。在一些实例中,所述直接重复序列与SEQ ID NO:15-17和241-247中的任一者(例如,SEQ ID NO:17)或其长度为至少23个核苷酸的片段至少90%相同。在具体实例中,所述直接重复序列是SEQ ID NO:15-17和241-247中的任一者(例如,SEQ ID NO:17),或其长度为至少23个核苷酸的片段。
在一些实施例中,本文所公开的基因编辑系统包括所述gRNA。可替代地,所述基因编辑系统包括编码所述gRNA的所述第三核酸。在一些实例中,所述第三核酸位于第三载体中,所述第三载体任选地是病毒载体。在一些实例中,所述基因编辑系统可以包括载体,如病毒载体,所述病毒载体包括编码所述gRNA的所述第三核酸和编码所述V型CRISPR核酸酶多肽和/或所述RT多肽的所述第一核酸和/或所述第二核酸。
在一些实施例中,本文所公开的任何基因编辑系统的所述RT供体RNA中的所述PBS的长度可以为5-100个核苷酸。在一些实例中,所述PBS的长度为10-60个核苷酸。在具体实例中,所述PBS的长度为10-30个核苷酸。在一些情况下,所述PBS与和所述靶序列的互补区相邻的靶向PBS的位点结合。所述靶向PBS的位点位于所述靶序列的所述互补区的上游。例如,所述靶向PBS的位点可以是位于所述靶序列的所述互补区的上游的3-10个核苷酸(例如,4-10个核苷酸)。可替代地,所述靶向PBS的位点可以与所述靶序列的所述互补区重叠。在其它情况下,所述靶向PBS的位点与所述靶序列相邻或重叠。
在一些实施例中,本文所公开的任何基因编辑系统的所述RT供体RNA中的所述模板序列的长度可以为5-100个核苷酸。例如,所述模板序列的长度可以为30-50个核苷酸。在一些情况下,所述模板序列可以与所述所关注的基因组位点同源,并且包括相对于所述所关注的基因组位点的一个或多个核苷酸变异。在一些实例中,至少一个核苷酸变异位于所述靶序列内。可替代地地或另外,至少一个核苷酸变异位于所述PAM中。
在一些实施例中,本文所公开的任何基因编辑系统包括所述RT供体RNA。可替代地,所述基因编辑系统包括编码所述RT供体RNA的所述第四核酸。在一些实例中,述第四核酸位于第四载体中,所述第四载体任选地是第四病毒载体。在一些情况下,所述基因编辑系统包括载体,如包括编码所述RT供体RNA的所述核酸的病毒载体,以及一种或多种编码所述向导RNA、所述V型CRISPR核酸酶多肽和所述RT多肽的另外的核酸。
在一些实施例中,本文所公开的基因编辑系统包括包含所述gRNA和所述RT供体RNA的单个RNA分子。此类单个RNA包括所述CRISPR核酸酶结合位点、所述间隔子序列、所述PBS和所述模板序列,其可以以任何合适的顺序布置。在一些实例中,所述单个RNA分子进一步包括位于所述gRNA与所述RT供体RNA之间的接头。此类接头可以包括发夹结构。在一个实例中,所述单个RNA分子从5'至3'包括:所述CRISPR核酸酶结合位点、所述间隔子序列、所述模板序列和所述PBS。在另一个实例中,所述单个RNA分子从5'至3'包括:所述CRISPR核酸酶结合位点、所述间隔子序列、所述接头、所述模板序列和所述PBS。在又另一个实例中,所述单个RNA分子从5'至3'包括:所述模板序列、所述PBS、所述CRISPR核酸酶结合位点和所述间隔子序列。在又另一个实例中,所述单个RNA分子从5'至3'包括:所述模板序列、所述PBS、所述接头、所述CRISPR核酸酶结合位点和所述间隔子序列。
在一些情况下,本文所公开的任何单个RNA分子可以进一步包括5'端保护片段、3’端保护片段或两者。所述5'端保护片段和所述3'端保护片段中的每一个可以形成次级结构,例如,发夹、假结或三链体结构。在一些实例中,所述5'端保护片段和/或所述3'端保护片段是核糖核酸外切酶抗性RNA(xrRNA)、转移RNA(tRNA)或截短的tRNA。在具体实例中,所述5'端保护片段、所述3'端保护片段或两者可以包括所述CRISPR核酸酶结合位点中的一个或多个CRISPR核酸酶结合位点。所述5'端保护片段、所述3'端保护片段或两者可以进一步包括一个或多个与任何人序列不同源的区段(不能通过碱基配对与任何人序列结合)。
在一些实施例中,本文所公开的基因编辑系统包括作为两个单独的RNA分子的任何gRNA和任何RT供体RNA。在一些实例中,所述gRNA、所述RT供体RNA或两者可以进一步包括5'端保护片段和/或3'端保护片段。所述保护片段中的每一个可以形成次级结构,例如,发夹、假结或三链体结构。在一些实例中,所述5'端保护片段和/或所述3'端保护片段是核糖核酸外切酶抗性RNA(xrRNA)、转移RNA(tRNA)或截短的tRNA。在其它实例中,所述5'端保护片段和/或所述3'端保护片段包括所述CRISPR核酸酶结合位点中的一个或多个CRISPR核酸酶结合位点,以及任选地一个或多个与任何人序列不同源的区段。
本文所公开的任何基因编辑系统可以包括涵盖所述V型CRISPR核酸酶多肽或编码核酸、所述RT多肽或编码核酸、所述向导RNA或编码核酸、所述RT供体RNA或编码核酸或其任何组合的一个或多个脂质纳米颗粒(LNP)。可替代地,所述基因编辑系统可以包括(i)一个或多个脂质纳米颗粒(LNP),其共同涵盖选自所述V型CRISPR核酸酶多肽或编码核酸、所述RT多肽或编码核酸、所述向导RNA或编码核酸、所述RT供体RNA或编码核酸的至多三种组分的;以及(ii)一种或多种载体,其编码所述基因编辑系统中剩余组分。在一些情况下,所述一种或多种载体可以是一种或多种病毒载体,例如,一种或多种腺相关病毒(AAV)载体。
在一些实例中,本文所公开的基因编辑系统包括所述V型CRISPR核酸酶多肽、所述RT多肽、所述gRNA和所述RT供体RNA。在一些情况下,所述V型CRISPR核酸酶多肽和/或所述RT多肽与所述gRNA和/或所述RT供体RNA形成复合物(例如,核糖核蛋白(RNP)复合物)。
在一些方面,本公开还提供了一种药物组合物,其包括本文所公开的任何基因编辑系统和药学上可接受的载剂,以及一种试剂盒,其包括所述基因编辑系统的组分。
在其它方面,本公开的特征还在于一种用于对细胞进行基因编辑的方法,所述方法包括使宿主细胞与本文所公开的任何基因编辑系统或包括此类基因编辑系统的药物组合物接触,以对所述宿主细胞进行基因编辑。在一些实例中,所述宿主细胞在体外培养。在其它实例中,接触步骤是通过向包括所述宿主细胞的受试者施用所述基因编辑系统来进行的。
经基因修饰的细胞群体也在本公开的范围内,其可以通过本文所公开的基因编辑系统产生。在一些实例中,所述经基因修饰的细胞可以包括不可由所述基因编辑系统编辑的细胞,例如,包括所述PAM中、所述靶序列中或两者中的一个或多个修饰。
在又其它方面,本公开的特征在于基因编辑RNA分子,其包括:(i)一个或多个可被V型CRISPR核酸酶识别的结合位点(CRISPR核酸酶结合位点);(ii)对基因位点内的靶序列具有特异性的间隔子序列,所述靶序列与原间隔子相邻基序(PAM)相邻;(iii)引物结合位点(PBS);以及(iv)模板序列。在一些实施例中,所述基因编辑RNA分子可以进一步包括一个或多个接头,如本文公开的接头。
在一些实例中,所述RNA分子从5'至3'包括:所述CRISPR核酸酶结合位点、所述间隔子序列、所述模板序列和所述PBS。在其它实例中,所述RNA分子从5'至3'包括:所述CRISPR核酸酶结合位点、所述间隔子序列、所述接头、所述模板序列和所述PBS。在又其它实例中,所述RNA分子从5'至3'包括:所述模板序列、所述PBS、所述CRISPR核酸酶结合位点和所述间隔子序列。在仍其它实例中,所述RNA分子从5'至3'包括:所述模板序列、所述PBS、所述接头、所述CRISPR核酸酶结合位点和所述间隔子序列。
本文所公开的任何基因编辑RNA分子可以进一步包括5'端保护片段、3’端保护片段或两者。所述保护片段中的每一个可以形成次级结构,例如,发夹、假结或三链体结构。在一些实例中,所述5'端保护片段和/或所述3'端保护片段是核糖核酸外切酶抗性RNA(xrRNA)、转移RNA(tRNA)或截短的tRNA。在其它实例中,所述5'端保护片段和/或所述3'端保护片段包括所述CRISPR核酸酶结合位点中的一个或多个CRISPR核酸酶结合位点,以及任选地一个或多个与任何人序列不同源的区段。
另外,本公开的特征在于一种基因编辑RNA分子集合(两个单独的RNA分子),其包括:(i)向导RNA,所述向导RNA包括一个或多个可被V型CRISPR核酸酶识别的结合位点(CRISPR核酸酶结合位点)和对基因位点内的靶序列具有特异性的间隔子序列,所述靶序列与原间隔子相邻基序(PAM)相邻;以及(ii)逆转录供体RNA(RT供体RNA)或编码所述RT供体RNA的第四核酸,其中所述RT供体RNA包括引物结合位点(PBS)和模板序列。在一些实例中,所述gRNA、所述RT供体RNA或两者进一步包括5'端保护片段和/或3'端保护片段。所述保护片段中的每一个可以形成次级结构,例如,发夹、假结或三链体结构。在一些实例中,所述5'端保护片段和/或所述3'端保护片段是核糖核酸外切酶抗性RNA(xrRNA)、转移RNA(tRNA)或截短的tRNA。在其它实例中,所述5'端保护片段和/或所述3'端保护片段包括所述CRISPR核酸酶结合位点中的一个或多个CRISPR核酸酶结合位点,以及任选地一个或多个与任何人序列不同源的区段。
本文还提供了一种DNA分子或DNA分子集合,其编码如本文所公开的基因编辑RNA分子或基因编辑RNA分子集合。在一些实例中,根据权利要求76所述的DNA分子或DNA分子集合,其包含在载体或载体集合中,任选地其中所述载体或所述载体集合是病毒载体。
另外,本文提供了一种融合多肽,其包括CRISPR核酸酶和逆转录酶。任何此类CRISPR核酸酶-RT融合多肽均可以用于本文所公开的基因编辑系统。在一些实施例中,所述CRISPR核酸酶是V型CRISPR核酸酶,例如,Cas12i多肽。在一些实例中,所述Cas12i多肽是Cas12i2多肽,例如本文所公开的那些。在具体实例中,所述融合多肽可以包括25-26和219-223的氨基酸序列。
在一些实施例中,所述Cas12i多肽是Cas12i4多肽。在一些实例中,所述Cas12i4多肽可以与逆转录酶,如MMLV RT融合。此类融合Cas12i4-RT融合多肽可以包括SEQ ID NO:53的氨基酸序列。
包含载体,如表达载体(例如,病毒载体)的编码任何CRISPR核酸酶-RT融合多肽的任何核酸也在本公开的范围内。
在下文的描述中阐述了本发明的一个或多个实施例的细节。本发明的其它特征或优点从以下附图和若干实施例的详细说明以及还从所附权利要求中将变得显而易见。
附图说明
以下附图形成本说明书的一部分,并且被包含在内以进一步说明本公开的某些方面,通过参考附图与本文呈现的具体实施例的详细说明的组合可以更好地理解所述方面。
图1A-1B包含示出本文所公开的示例性基因编辑系统的示意图。图1A是示出包括与逆转录酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA向导的3'端处与RT供体RNA融合的RNA向导的基因编辑系统的示意图。RT供体RNA包括逆转录模板序列和PBS。PBS包括与靶核酸的PAM链(亦称非靶链)的基本互补性。图1B示出了与逆转录酶融合的Cas9切口酶(左)和与逆转录酶融合的Cas12i切口酶(右)。使用与RNA向导的3'端融合的RT供体RNA,将编辑并入到靶核酸的PAM链中。
图2是示出包括与逆转录酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA向导的5'端处与RT供体RNA融合的RNA向导的示例性基因编辑系统的示意图。RT供体RNA包括PBS和逆转录模板序列。PBS包括与靶核酸的PAM链的互补性。
图3是示出CRISPR核酸酶(例如,Cas12i多肽)、逆转录酶多肽、RNA向导和RT供体RNA的示意图。RT供体RNA包括逆转录模板序列和PBS。在被CRISPR核酸酶切割后,编辑被并入到基因组中。
图4是示出CRISPR核酸酶(例如,Cas12i多肽)、逆转录酶多肽、RNA向导和RNA逆转录模板序列的示意图。RT供体RNA包括PBS和逆转录模板序列。在存在CRISPR核酸酶的情况下,编辑被并入到基因组中。
图5是示出包括与逆转录酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和含有与在RNA向导的3'端处与RT供体RNA融合的靶核酸错配的RNA向导的示例性基因编辑系统的示意图。RT供体RNA包括PBS。PBS包括与靶核酸的非PAM链(亦称靶链或TS)的互补性。
图6A-6B包含示出本文所公开的示例性基因编辑系统的示意图。图6A是示出包括与逆转录酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA向导的3'端处与RT供体RNA融合的RNA向导的示例性基因编辑系统的示意图。RT供体RNA包括逆转录模板序列和PBS。当RNA向导的间隔子序列和PBS与靶核酸结合时,逆转录模板序列形成未配对核苷酸的环。PBS包括与靶核酸的非PAM链的互补性。PAM链和非PAM链中的变体Cas12i2切割位点通过三角形指示。使用与RNA向导的3'端融合的RT供体RNA,将编辑并入到靶核酸的非PAM链中。图6B示出了编辑、逆转录模板序列和PBS的定位,其中逆转录模板序列和PBS的长度可以变化。
图7是示出包括与逆转录酶多肽融合的CRISPR核酸酶(例如,Cas12i多肽)和在RNA向导的5'端处与RT供体RNA融合的RNA向导的示例性基因编辑系统的示意图。RT供体RNA包括PBS和逆转录模板序列。PBS包括与靶核酸的非PAM链的互补性。
图8A-8C包含示出示例性Cas12i2 RNA向导-RT供体RNA融合体的示意图。图8A是在实例1中测试的与RT供体RNA融合的变体Cas12i2 RNA向导的示意图。RNA向导的间隔子与与5'-TTT-3'PAM相邻的非PAM链结合。RT供体RNA包括逆转录模板序列和PBS。当间隔子序列和PBS与靶核酸结合时,逆转录模板序列形成未配对核苷酸的环。PBS包括与靶核酸的非PAM链的互补性。在此示意图中,PBS的长度为13个核苷酸,并且逆转录模板序列的长度为34个核苷酸。PBS被设计成使得与非PAM链的互补性开始于切割位点(三角形)。图8B示出了如在实例1中测试的靶向AAVS1_T7基因组位点的示例性RNA向导-RT供体RNA融合体。测试了不同长度的PBS(13个、30个和60个核苷酸)。RNA向导-RT供体RNA融合体被设计成将取代(S)、插入(I)、缺失(D)或发夹(H)引入到靶序列中。图8C示出了如在实例1中所描述的引入到AAVS1_T7基因组位点(上小图)、EMX1_T6基因组位点(中小图)和VEGFA_T5基因组位点(下小图)中的经编码的编辑(取代、插入和缺失)。图8A中的序列从上到下是SEQ ID NO:65-67。图8B中的序列从上到下是SEQ ID NO:74-80和87-89。图8C中的序列从上到下是SEQ ID NO:248-259。
图9A-9J包含示出由本文所公开的示例性基因编辑系统产生的基因编辑效率的图。图9A示出了由SEQ ID NO:4的变体Cas12i2和SEQ ID NO:25和SEQ ID NO:26的C末端和N末端Cas12i2-MMLV RT融合体与靶向AAVS1_T6基因组位点的RNA向导诱导的用插入缺失和经编码的编辑分析的NGS读段的百分比。图9B示出了由SEQ ID NO:26和SEQ ID NO:25的N末端和C末端Cas12i2-MMLV RT融合体和靶向AAVS1_T6基因组位点的RNA向导-RT供体RNA融合体诱导的用插入缺失和经编码的编辑分析的NGS读段的百分比。RNA向导-RT供体RNA融合体具有13个、30个或60个核苷酸的PBS长度,并且被设计成将取代(S)、插入(I)、缺失(D)或发夹(H)引入到AAVS1_T6基因组位点中。图9C示出了由SEQ ID NO:4的变体Cas12i2和SEQ IDNO:25和SEQ ID NO:26的C末端和N末端Cas12i2-MMLV RT融合体与靶向AAVS1_T7基因组位点的RNA向导诱导的用插入缺失和经编码的编辑分析的NGS读段的百分比。图9D示出了由SEQ ID NO:26和SEQ ID NO:25的N末端和C末端Cas12i2-MMLV RT融合体和靶向AAVS1_T7基因组位点的RNA向导-RT供体RNA融合体诱导的用插入缺失和经编码的编辑分析的NGS读段的百分比。RNA向导-RT供体RNA融合体具有13个、30个或60个核苷酸的PBS长度,并且被设计成将取代(S)、插入(I)、缺失(D)或发夹(H)引入到AAVS1_T7基因组位点中。图9E示出了由SEQ ID NO:4的变体Cas12i2和SEQ ID NO:25和SEQ ID NO:26的C末端和N末端Cas12i2-MMLV RT融合体与靶向EMX1_T6基因组位点的RNA向导诱导的用插入缺失和经编码的编辑分析的NGS读段的百分比。图9F示出了由SEQ ID NO:26和SEQ ID NO:25的N末端和C末端Cas12i2-MMLV RT融合体和靶向EMX1_T6基因组位点的RNA向导-RT供体RNA融合体诱导的用插入缺失和编辑分析的NGS读段的百分比。RNA向导-RT供体RNA融合体具有13个、30个或60个核苷酸的PBS长度,并且被设计成将取代(S)、插入(I)、缺失(D)或发夹(H)引入到EMX1_T6基因组位点中。图9G示出了由SEQ ID NO:4的变体Cas12i2和SEQ ID NO:25和SEQ ID NO:26的C末端和N末端Cas12i2-MMLV RT融合体与靶向VEGFA_T2基因组位点的RNA向导诱导的用插入缺失和经编码的编辑分析的NGS读段的百分比。图9H示出了由SEQ ID NO:26和SEQ IDNO:25的N末端和C末端Cas12i2-MMLV RT融合体和靶向VEGFA_T2基因组位点的RNA向导-RT供体RNA融合体诱导的用插入缺失和经编码的编辑分析的NGS读段的百分比。RNA向导-RT供体RNA融合体具有13个、30个或60个核苷酸的PBS长度,并且被设计成将取代(S)、插入(I)、缺失(D)或发夹(H)引入到VEGFA_T2基因组位点中。图9I示出了由SEQ ID NO:4的变体Cas12i2和SEQ ID NO:25和SEQ ID NO:26的C末端和N末端Cas12i2-MMLV RT融合体与靶向VEGFA_T5基因组位点的RNA向导诱导的用插入缺失和经编码的编辑分析的NGS读段的百分比。图9J示出了由SEQ ID NO:26和SEQ ID NO:25的N末端和C末端Cas12i2-MMLV RT融合体和靶向VEGFA_T5基因组位点的RNA向导-RT供体RNA融合体诱导的用插入缺失和经编码的编辑分析的NGS读段的百分比。RNA向导-RT供体RNA融合体具有13个、30个或60个核苷酸的PBS长度,并且被设计成将取代(S)、插入(I)、缺失(D)或发夹(H)引入到VEGFA_T5基因组位点中。
图10是示出与逆转录酶融合的Cas12i多肽(例如,Cas12i2切口酶)的示意图。使用与RNA向导的5'端或3'端融合的RT供体RNA,将经编码的编辑并入到靶核酸的PAM链中。可以保护RNA向导-RT供体RNA的端,以防止核酸外切酶或核酸内切酶活性。PBS长度可以在介于约3-100个核苷酸之间变化,并且包括与PAM链的基本互补性。可以在间隔子与逆转录模板序列之间引入结构化RNA,如发夹。
图11是示出RNA向导-RT供体RNA与第二直接重复序列(DR)-间隔子序列进一步融合的示意图。另外的DR-间隔子抑制核酸外切酶活性。
图12A-12B包含示出编辑模板RNA(基因编辑RNA)的示例性设计的示意图。图12A是描绘进一步包括3'端保护的编辑模板RNA(5'-核酸酶结合序列-DNA结合序列-逆转录模板-PBS-3')的示意图。3'端保护可以是化学端保护(图的顶部)或发夹(图的底部)。发夹可以是核酸酶结合序列,例如直接重复序列。图12B是描绘有和没有5'端保护的编辑模板RNA(5'-逆转录模板-PBS核酸酶结合序列-DNA结合序列-3')的示意图。5'端保护可以是发夹(例如,核酸酶结合序列,如直接重复序列),如图的底部所示出的。
图13A-13D包含示出由本文所公开的示例性基因编辑系统产生的基因编辑效率的图。图13A示出了SEQ ID NO:112的RNA向导或SEQ ID NO:123-137的编辑模板RNA在AAVS1_T7基因组位点(SEQ ID NO:30)处的Cas12i2(SEQ ID NO:4)和Cas12i2-RT(SEQ ID NO:25)的活性。被分析为具有插入缺失的NGS读段%在Cas12i2的白色条和Cas12i2-RT的灰色条中示出。被分析为具有经编码的编辑的NGS读段%在Cas12i2的有方格的条和Cas12i2-RT的黑色条中示出。图13B示出了SEQ ID NO:114的RNA向导或SEQ ID NO:138-152的编辑模板RNA在EMX1_T6基因组位点(SEQ ID NO:34)处的Cas12i2(SEQ ID NO:4)和Cas12i2-RT(SEQ IDNO:25)的活性。被分析为具有插入缺失的NGS读段%在Cas12i2的白色条和Cas12i2-RT的灰色条中示出。被分析为具有经编码的编辑的读段%在Cas12i2的有方格的条和Cas12i2-RT的黑色条中示出。图13C示出了SEQ ID NO:116的RNA向导或SEQ ID NO:153-167的编辑模板RNA在VEGFA_T2(SEQ ID NO:36)处的Cas12i2(SEQ ID NO:4)和Cas12i2-RT(SEQ ID NO:25)的活性。被分析为具有插入缺失的NGS读段%在Cas12i2的白色条和Cas12i2-RT的灰色条中示出。被分析为具有经编码的编辑的NGS读段%在Cas12i2的有方格的条和Cas12i2-RT的黑色条中示出。图13D示出了SEQ ID NO:118的RNA向导或SEQ ID NO:168-182的编辑模板RNA在VEGFA_T5基因组位点(SEQ ID NO:38)处的Cas12i2(SEQ ID NO:4)和Cas12i2-RT(SEQ IDNO:25)的活性。被分析为具有插入缺失的NGS读段%在Cas12i2的白色条和Cas12i2-RT的灰色条中示出。被分析为具有经编码的编辑的NGS读段%在Cas12i2的有方格的条和Cas12i2-RT的黑色条中示出。
图14A-14C包含描述用RNA向导或编辑模板RNA鉴定Cas12i2的切割模式的测定步骤的示意图。图14A示出了包括靶序列和条形码的寡聚物构型。图14B示出了处理切割产物以钝化5'和3'突出端或端修复以填充5'突出端。图14C示出了切割产物的扩增。
图15A-15E包含示出使用本文所公开的示例性基因编辑系统进行基因编辑的图。图15A是描绘由SEQ ID NO:2的Cas12i2在AAVS1_T2基因组位点的PAM链和非PAM链上诱导的体外切割位点(三角形)的示意图。图15B是填充处理后从5'切割产物的扩增中获得的读段长度的直方图。图15C是填充处理后从3'切割产物的扩增中获得的读段长度的直方图。图15D是钝化处理后从5'切割产物的扩增中获得的读段长度的直方图。图15E是钝化处理后从3'切割产物的扩增中获得的读段长度的直方图。每个读段长度直方图被映射到靶序列,如在图15B-15E的x轴线上所示出的。
图16A-16B示出了由SEQ ID NO:2的Cas12i2或SEQ ID NO:4的变体Cas12i2在EMX1_T6基因组位点(图16A)和VEGFA_T5基因组位点(图16B)的PAM链或非PAM链上诱导的体外切割位点(三角形)。比例尺(右)代表如通过测序读段的数量所测量的切割频率。
图17A-17B包含示出示例性基因组大小的基因编辑结果的图。图17A示出了通过编辑模板RNA将4个核苷酸插入引入到AAVS1_T7基因组位点(SEQ ID NO:30)、EMX1_T6基因组位点(SEQ ID NO:34)或VEGFA_T5基因组位点(SEQ ID NO:38)中的活性。编辑模板RNA包括34个核苷酸的逆转录模板序列和3个、8个、13个、30个或60个核苷酸的PBS。经编码的编辑与总编辑的比率在y轴线上示出。图17B示出了通过编辑模板RNA将4个核苷酸插入引入到AAVS1_T7基因组位点(SEQ ID NO:30)、EMX1_T6基因组位点(SEQ ID NO:34)或VEGFA_T5基因组位点(SEQ ID NO:38)中的活性。编辑模板RNA包括13个核苷酸的PBS和14个、24个、34个、44个或54个核苷酸的逆转录模板序列。经编码的编辑与总编辑的比率在y轴线上示出。图17A中的序列从上到下是SEQ ID NO:90-92。图17B中的序列从上到下是SEQ ID NO:90-92。
图18示出了并入到U2OS细胞中的AAVS1_T7基因组位点(SEQ ID NO:32)和EMX1_T6基因组位点(SEQ ID NO:34)中的经编码的编辑。
图19A-19B包含展示使用本文所公开的示例性基因编辑系统的基因编辑程序的示意图。图19A是描绘包括与逆转录酶和pegRNA融合的Cas9的Cas9引物编辑器的示意图。Cas9切割PAM链后,在靶DNA上产生引物。引物与pegRNA的杂交启动逆转录。图19B是描绘与逆转录酶和编辑模板RNA融合的V型CRISPR核酸酶的示意图。在V型CRISPR核酸酶切割非PAM链后,在靶DNA上产生引物。引物与编辑模板RNA的杂交启动逆转录。
图20A-20C包含示出如所指示的用Cas12i2-RT融合多肽在不同基因组位点处编辑的图。图20A是示出包括在AAVS1基因组位点处由SEQ ID NO:219-223的变体Cas12i2-RT融合体引入的插入缺失编辑(白条)或经编码的编辑(灰条)的NGS读段的%的图。图20B是示出包括在EMX1基因组位点处由SEQ ID NO:219-223的变体Cas12i2-RT融合体引入的插入缺失编辑(白条)或经编码的编辑(灰条)的NGS读段的%的图。图20C是示出包括在VEGFA基因组位点处由SEQ ID NO:219-223的变体Cas12i2-RT融合体引入的插入缺失编辑(白条)或经编码的编辑(灰条)的NGS读段的%的图。
图21是示出包括由变体Cas12i2(SEQ ID NO:4)或变体Cas12i2-RT融合体(SEQ IDNO:219)和RNA向导或编辑模板RNA引入的插入缺失编辑或经编码的编辑的NGS读段的%的图。RNA向导和编辑模板RNA要么是未经修饰的,要么包括末端硫代磷酸酯主链键和/或2'O-甲基核苷酸。
图22是示出包括在AAVS1基因组位点处由变体Cas12i4-RT融合体引入的插入缺失编辑(白条)或经编码的编辑(灰条)的NGS读段的%的图。
图23是示出包括在AAVS1、EMX1或VEGFA基因组位点处由变体Cas12i2或变体Cas12i2-RT融合体、RNA向导和RT供体RNA引入的插入缺失编辑(白条)或经编码的编辑(灰条)的NGS读段的%的图。
具体实施方式
本公开涉及基因编辑系统,其包括V型核酸酶或编码此类V型核酸酶的核酸、RNA向导或编码此类RNA向导的核酸、逆转录酶或编码此类逆转录酶的核酸、以及RT供体RNA或编码此类RT供体RNA的核酸。本文还提供了包括本文所公开的任何基因编辑系统的药物组合物和试剂盒,使用本文所公开的任何基因编辑系统对细胞进行基因编辑的方法,由此产生的基因工程化细胞,和基因编辑RNA分子或涉及基因编辑系统的RNA分子集合,以及用于产生此类基因编辑系统的DNA分子。
定义
本公开将相对于具体实施例并参考某些图来描述,但本公开并不受限于此而只受权利要求限制。除非另有说明,否则下文中所示的术语通常被理解为其常识。
如本文所使用的,术语“活性”是指生物活性。在一些实施例中,活性是指效应子活性。在一些实施例中,活性包含酶促活性,例如,效应子的催化能力。例如,活性可以包含核酸酶活性。在另一个实例中,活性是指酶从RNA产生DNA或将编辑物引入到靶序列中的能力。
如本文所使用的,术语“相邻”是指与另一个核苷酸或氨基酸序列非常接近的核苷酸或氨基酸序列。在一些实施例中,如果没有核苷酸将两个序列分离,则核苷酸序列与另一个核苷酸序列相邻(即,直接相邻)。在一些实施例中,如果少量核苷酸将两个序列分离(例如,约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个核苷酸),则核苷酸序列与另一个核苷酸序列相邻。在一些实施例中,如果两个序列相隔约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个核苷酸,则第一序列与第二序列相邻。在一些实施例中,如果两个序列相隔至多2个核苷酸、至多5个核苷酸、至多8个核苷酸、至多10个核苷酸、至多12个核苷酸或至多15个核苷酸,则第一序列与第二序列相邻。在一些实施例中,如果两个序列相隔2-5个核苷酸、4-6个核苷酸、4-8个核苷酸、4-10个核苷酸、6-8个核苷酸、6-10个核苷酸、6-12个核苷酸、8-10个核苷酸、8-12个核苷酸、10-12个核苷酸、10-15个核苷酸或12-15个核苷酸,则第一序列与第二序列相邻。
如本文所使用的,术语“CRISPR核酸酶”是指能够结合核酸并引入单链断裂或双链断裂的RNA向导的效应子。在一些实施例中,CRISPR核酸酶是II型CRISPR核酸酶或V型CRISPR核酸酶。在一些实施例中,CRISPR核酸酶是效应子,如在Makarova等人,“CRISPR-Cas系统的分类和命名:从这里到哪里(Classification and Nomenclature of CRISPR-CasSystems:Where from Here)?”《CRISPR杂志(CRISPRJ.)》1(5):325-36(2018)中所描述的。
如本文所使用的,术语“II型”和“II型核酸酶”是指包括RuvC结构域和HNH结构域的核酸酶。II型核酸酶可以是II-A型核酸酶、II-B型核酸酶或II-C型核酸酶。在一些实施例中,II型核酸酶需要tracrRNA。在一些实施例中,II型核酸酶是Cas9多肽。Cas9多肽可以切割双链DNA靶标或者是切口酶。
如本文所使用的,术语“V型”和“V型核酸酶”是指具有RuvC结构域的RNA向导的CRISPR核酸酶。在一些实施例中,V型核酸酶不需要tracrRNA。在一些实施例中,V型核酸酶需要tracrRNA。在一些实施例中,V型核酸酶是Cas12多肽,如Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)多肽。
如本文所使用的,术语“Cas12i多肽”(本文也称为Cas12i)是指与RNA向导所指定的靶核酸上的靶序列结合的多肽,其中所述多肽与野生型Cas12i多肽具有至少一些氨基酸序列同源性。在一些实施例中,Cas12i多肽包括与美国专利第10,808,245号的SEQ ID NO:1-5和11-18中的任一者的至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性,所述文献通过引用并入以用于本文所引用的主题和目的。在一些实施例中,Cas12i多肽包括与本申请的SEQ ID NO:8、2、11和9中的任一者的至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施例中,本公开的Cas12i多肽是如WO/2021/202800中所描述的Cas12i2多肽,所述文献的相关公开内容通过引用并入以用于本文所引用的主题和目的。在一些实施例中,Cas12i多肽切割靶核酸(例如,作为缺口或双链断裂)。
两个核酸或两个氨基酸序列的“同一性百分比”(亦称序列同一性)是使用Karlin和Altschul《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)》87:2264-68,1990的算法确定的,如在Karlin和Altschul《美国国家科学院院刊》90:5873-77,1993中所述修饰。此类算法并入到Altschul等人,《分子生物学杂志(J.Mol.Biol.)》215:403-10,1990的NBLAST和XBLAST程序(2.0版)中。可以用NBLAST程序,评分=100,字长-12进行BLAST核苷酸检索,以获得与本发明的核酸分子同源的核苷酸序列。可以用XBLAST程序,检=50,字长=3进行BLAST蛋白检索以获得与所关注蛋白质分子同源的氨基酸序列。在两个序列之间存在缺口的情况下,可以利用如Altschul等人,《核酸研究(Nucleic Acids Res.)》25(17):3389-3402,1997中所描述的带空位的BLAST(Gapped BLAST)。当利用BLAST程序和带空位的BLAST程序时,可以使用相应程序(例如,XBLAST和NBLAST)的默认参数。
如本文所使用的,术语“复合物”是指两个或更多个分子的组合。在一些实施例中,复合物包括彼此相互作用(例如,结合、接触、粘附)的多肽和核酸分子。在一些实施例中,术语“复合物”用于指代CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和逆转录酶多肽的缔合。例如,CRISPR核酸酶(例如,如本文所公开的Cas12i2多肽)和逆转录酶多肽的复合物可以是两种多肽的异二聚体,例如,通过二聚化结构域(例如,亮氨酸拉链)、抗体、纳米抗体或适体。在一些实施例中,术语“复合物”用于指代RNA向导和RT供体RNA的缔合。在一些实施例中,术语“复合物”用于指代CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)、逆转录酶多肽、RNA向导和RT供体RNA的缔合。在一些实施例中,术语“复合物”用于指代逆转录酶多肽和RT供体RNA的缔合。
如本文所使用的,术语“可被核酸酶识别的结合位点”或“核酸酶结合序列”是指能够与CRISPR核酸酶结合的序列。在一些实施例中,核酸酶结合序列是RNA序列。在一些实施例中,核酸酶结合序列是直接重复序列。在一些实施例中,核酸酶结合序列能够与II型CRISPR核酸酶或V型CRISPR核酸酶(例如,可被II型CRISPR核酸酶识别的结合位点,或可被V型CRISPR核酸酶识别的结合位点)结合。
如本文所使用的,术语“缺失”指相对于参考序列,核酸序列中一个或多个核苷酸的丧失。在如何制备包括缺失的序列中,没有暗示特定的过程。例如,包括缺失的序列可以直接由单独的核苷酸合成。在其它实施例中,缺失是通过提供并且然后改变参考序列来进行的。核酸序列可以在生物体的基因组中。核酸序列可以在细胞中。核酸序列可以是DNA序列。缺失可以是移码突变或非移码突变。本文所描述的缺失是指至多几千个碱基的插入。
如本文所使用的,术语“编辑”是指引入到靶核酸中,如所关注的基因组位点中的核苷酸序列中的一个或多个修饰。编辑可以发生在如本文所定义的靶序列内。可替代地,编辑可以发生在靶序列之外(例如,与靶序列相邻)。编辑可以是一个或多个取代、一个或多个插入、一个或多个缺失或其组合。
如本文所使用的,术语“融合(fusion/fused)”是指至少两个核苷酸或蛋白质分子的连接。例如,例如,“融合(fusion/fused)”可以指在自然界中由单独的基因(例如,V型核酸酶和逆转录酶多肽)编码的至少两个多肽结构域的连接。融合可以是N末端融合、C末端融合或分子内融合。在一些方面,结构域被转录和翻译以产生单个多肽。还如本文所使用的,术语“融合(fusion/fused)”用于指代两种核酸分子,如两种RNA分子(例如,RNA向导和RT供体RNA)的连接。融合可以是5'融合、3'融合或分子内融合。
如本文所使用的,术语“插入”是指核酸序列中一个或多个核苷酸相对于参考序列的增益。在如何制备包括插入的序列中,没有暗示特定的过程。例如,包括插入的序列可以直接由单独的核苷酸合成。在其它实施例中,插入是通过提供并且然后改变参考序列来进行的。核酸序列可以在生物体的基因组中。核酸序列可以在细胞中。核酸序列可以是DNA序列。插入是移码突变或非移码突变。本文所描述的插入是指至多几千个碱基的插入。
如本文所使用的,术语“原间隔子相邻基序”或“PAM序列”是指与靶序列相邻的DNA序列。在一些实施例中,PAM序列是酶活性所必需的。在双链DNA分子中,含有PAM基序的链被称为“PAM链”,并且互补链被称为“非PAM链”RNA向导与与本文所公开的靶序列互补的非PAM链中的位点结合,并且如本文所描述的PAM序列存在于PAM链中。
如本文所使用的,术语“PAM链”是指包括PAM基序的靶核酸链(双链)。在一些实施例中,PAM链是编码(例如,有义)链。在其它实施例中,PAM链是非编码链(例如,反义链)。术语“非PAM链”是指PAM链的互补链。由于gRNA通过碱基配对结合非PAM链,非PAM链也被称为靶链,而PAM链也被称为非靶链。
如本文所使用的,术语“靶序列”是指与PAM基序(在PAM链上)相邻的DNA片段。靶序列的互补区在非PAM链上。靶序列可以紧邻PAM基序。可替代地,靶序列和PAM可以通过小的序列区段(例如,至多5个核苷酸,例如,至多4个、3个、2个或1个核苷酸)分离。根据本领域已知的识别PAM基序的CRISPR核酸酶,靶序列可以位于PAM基序的3'端处或PAM基序的5'端处。例如,靶序列位于Cas12i多肽(例如,Cas12i2多肽,如本文所公开的那些)的PAM基序的3'端处。
如本文所使用的,术语“RNA向导”或“RNA向导序列”是指有助于本文所描述的CRISPR核酸酶靶向所关注的基因组位点的RNA分子或经修饰的RNA分子。例如,RNA向导可以是识别(例如,结合)与PAM链中的靶序列互补的非PAM链中位点的分子,例如,被设计成与特定核酸序列互补。RNA向导包括间隔子和核酸酶结合序列(例如,直接重复(DR)序列)。术语CRISPR RNA(crRNA)、前crRNA和成熟crRNA在本文中也用于指RNA向导。RNA向导的5'端或3'端可以与本文所公开的RT供体RNA融合。在一些情况下,RNA向导可以是包括一个或多个脱氧核糖核苷酸的经修饰的RNA分子,例如,包含在RNA向导中的DNA结合序列中,其结合靶序列的互补序列。在一些实例中,DNA结合序列可以含有DNA序列或DNA/RNA杂交序列。
如本文所使用的,术语“间隔子”和“间隔子序列”(亦称DNA结合序列)是为靶序列(DNA序列)的RNA等效物的RNA向导中的一部分。间隔子含有能够通过与靶序列(在PAM链中)互补的位点处的碱基配对与非PAM链结合的序列。此类间隔子也被称为对靶序列具有特异性。在一些情况下,除了RNA-DNA序列差异之外,间隔子可以与靶序列至少75%(例如,至少80%、至少85%、至少90%、至少95%、至少98%或至少99%)相同。在一些情况下,除了RNA-DNA序列差异之外,间隔子可以与靶序列100%相同。
如本文所使用的,术语“互补”是指与第二多核苷酸(例如,靶序列的互补序列)具有一定程度的互补性的第一多核苷酸(例如,RNA向导的间隔子序列),使得第一多核苷酸和第二多核苷酸可以通过碱基配对形成双链复合物,以允许与第一多核苷酸复合的效应多肽(例如,Cas12i2多肽,Cas12i2-逆转录酶融合多肽,或其变体)作用于(例如,切割)第二多核苷酸。在一些实施例中,第一多核苷酸可以与第二多核苷酸基本上互补,即,与第二多核苷酸具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%互补性。在一些实施例中,第一多核苷酸与第二多核苷酸完全互补,即,与第二多核苷酸具有100%互补性。
如本文所使用的,术语“逆转录酶”和“RT”是指多功能酶,所述多功能酶通常具有三种酶促活性,其包含RNA依赖性和DNA依赖性DNA聚合活性和催化RNA-DNA杂交体中RNA的切割的RNA酶H活性。逆转录酶可以从RNA模板产生DNA。
如本文所使用的,术语“逆转录供体RNA”和“RT供体RNA”是指包括逆转录模板序列(模板序列)和引物结合位点(PBS)的RNA分子。RT供体RNA可以在RNA向导的5'端或3'端与RNA向导融合。
如本文所使用的,术语“靶向PBS的位点”是指PBS结合的区。靶向PBS的位点可以与与靶序列互补的非PAM链区相邻(例如,在其上游)。例如,靶向PBS的位点可以是与靶序列互补的区上游的3-10个核苷酸(例如,3个核苷酸或4个核苷酸)。在一些情况下,靶向PBS的位点可以紧邻与靶序列互补的非PAM链区。在其它实例中,靶向PBS的位点可以与与靶序列互补的非PAM链区重叠。可替代地,靶向PBS的位点可以与PAM链上的靶序列相邻、在其上游或与其重叠。
如本文所使用的,术语“逆转录模板序列”或“模板序列”是指充当逆转录酶合成DNA的模板的RNA分子或RT供体RNA的片段。在一些实施例中,逆转录模板序列包括待并入到需要基因编辑的基因组位点中的编辑。在一些情况下,RT供体RNA中逆转录模板序列介导的编辑破坏或去除PAM序列、靶序列或两者。
如本文所使用的,术语“编辑模板RNA”或“基因编辑RNA”(本文中可互换使用)是指包括RNA向导(包括间隔子和一个或多个可被CRISPR核酸酶识别的结合位点,如本文所公开的那些)和RT供体RNA(包括PBS和逆转录模板序列)的RNA分子或RNA分子集合。基因编辑RNA能够介导CRISPR核酸酶在所关注的基因组位点内的靶序列处的切割,以及基于基因编辑RNA中的模板序列从通过CRISPR核酸酶切割产生的游离DNA链的游离3'端合成DNA片段。在一些实施例中,编辑模板RNA或基因编辑RNA是包括与RT供体RNA连接(例如,融合)的RNA向导的单个RNA分子。在一些实施例中,编辑模板RNA从5'至3'包括一个或多个可被CRISPR核酸酶识别的结合位点、间隔子序列、PBS和RT供体RNA。在一些实施例中,编辑模板RNA或基因编辑RNA从5'至3'包括一个或多个可被CRISPR核酸酶识别的结合位点、间隔子、模板序列和PBS。在一些实施例中,编辑模板RNA或基因编辑RNA从5'至3'包括模板序列、PBS、一个或多个可被CRISPR核酸酶识别的结合位点和间隔子序列。在一些实施例中,编辑模板RNA进一步包括接头。例如,在一些实施例中,编辑模板RNA包括一个或多个可被CRISPR核酸酶识别的结合位点与PBS之间或间隔子序列与RT供体RNA之间的接头。
如本文所使用的,术语“取代”是指相对于参考序列,用不同的一个或多个核苷酸置换一个或多个核苷酸。在如何制备包括取代的序列中,没有暗示特定的过程。例如,包括取代的序列可以直接由单独的核苷酸合成。在其它实施例中,取代是通过提供并且然后改变参考序列来进行的。核酸序列可以在生物体的基因组中。核酸序列可以在细胞中。核酸序列可以是DNA序列。本文所描述的取代是指至多几千个碱基的取代。
如本文所使用的,术语“上游”和“下游”是指单个核酸(例如,DNA)序列内的相对位置。“上游”和“下游”分别涉及其中RNA转录发生的5'至3'方向。当第一序列的3'端出现在第二序列的5'端之前时,第一序列位于第二序列的上游。当第一序列的5'端出现在第二序列的3'端之后时,第一序列位于第二序列的下游。在一些实施例中,术语“上游”和“下游”用于指代非PAM链。例如,在一些实施例中,PBS与靶序列上游的非PAM链序列互补。因此,在一些实施例中,PBS与间隔子序列结合的序列上游的序列结合,并且间隔子序列结合PBS结合的序列下游。
I.基因编辑系统
主要编辑被开发用于将取代、小插入或小缺失引入到靶序列中。主要编辑方法依赖于与逆转录酶和主要编辑向导RNA(pegRNA)融合的Cas9切口酶。pegRNA包括能够与靶基因座的非PAM链(与PAM序列相对的链)结合的间隔子序列,能够与靶基因座的PAM链(包括PAM序列的链)结合的引物结合位点(PBS),和包括编辑的逆转录模板序列。pegRNA的间隔子序列与非PAM链上的靶序列结合,并且切口酶Cas9缺口PAM链。这暴露了可以与PBS杂交的靶基因座的PAM链上的3'瓣。逆转录酶然后拷贝逆转录模板,由此延伸3'瓣。参见例如,图19A。通过DNA修复机制,编辑被并入到靶基因座中。
在一些方面,本文提供了能够编辑靶核酸(例如,在所关注的基因组位点处)的基因编辑系统,例如,在基因组位点处引入插入、缺失、取代或其组合。编辑可以发生在靶核酸的任一条链上。本文所公开的基因编辑系统包括至少一种蛋白质组分或编码此类蛋白质组分的核苷酸序列,以及至少一种RNA组分或编码此类RNA组分的核苷酸序列。蛋白质组分具有在RNA组分向导下在所期望的位点处切割靶核酸的活性,以及使用部分RNA组分作为模板,从由切割产生的DNA链的游离3'端开始合成新DNA序列的活性。然后,新合成的DNA片段可以通过例如宿主细胞中的DNA修复机制并入到靶核酸中,从而导致对靶核酸进行基因编辑。
本文所公开的基因编辑系统中的蛋白质组分可以包括CRISPR核酸酶(例如,V型核酸酶,如变体Cas12i多肽)和逆转录酶(RT)多肽。在一些实例中,CRISPR核酸酶和RT多肽是两种单独的多肽。在其它实例中,CRISPR核酸酶和RT多肽是融合多肽的一部分。
本文所公开的基因编辑系统中的RNA组分可以包括向导RNA(gRNA)(本文中也描述为RNA向导或CRISPR RNA(crRNA)),所述向导RNA如所设计的那样介导CRISPR核酸酶在靶核酸中特定位点处的切割,以及逆转录供体RNA(RT供体RNA),所述RT供体RNA介导RT多肽的逆转录并为逆转录提供模板序列。在一些实例中,gRNA和RT供体RNA是两种单独的RNA分子。在其它实例中,gRNA和RT供体RNA是单个RNA分子的一部分。
如在本文中所示出的,并且不受理论束缚,本文所描述的基因编辑系统提供了优于现有技术的若干个优点。例如,RNA模板化编辑尚未用V型CRISPR核酸酶如Cas12iCRISPR核酸酶证明。存在大量比Cas9核酸酶小的V型核酸酶。例如,Cas12i2的长度为1,054个氨基酸,而化脓性链球菌(S.pyogenes)Cas9(SpCas9)的长度为1,368个氨基酸,嗜热链球菌(S.thermophilus)Cas9(StCas9)的长度为1,128个氨基酸,FnCpf1的长度为1,300个氨基酸,AsCpf1的长度为1,307个氨基酸,并且LbCpf1的长度为1,246个氨基酸。另外地,许多V型核酸酶利用不需要反式激活CRISPR RNA(tracrRNA)的RNA向导,并且因此比Cas9 RNA向导小。例如参见,下表4。较小的Cas12i多肽和RNA向导大小有利于递送。另外地,尚未用任何利用结合靶基因座的单链,如靶链(非PAM链)的单个编辑模板RNA的CRISPR核酸酶证明RNA模板化编辑。如本文所示出的,与包括SpCas9多肽的基因编辑系统相比,包括Cas12i多肽的基因编辑系统也表现出降低的脱靶活性。参见PCT/US2021/025257,所述文献通过引用以其整体并入。
A.CRISPR核酸酶
本文所公开的任何基因编辑系统可以包括CRISPR核酸酶。在一些实施例中,CRISPR核酸酶能够结合本文其它地方所描述的核酸酶结合序列和/或与其结合。在一些实施例中,CRISPR核酸酶切割靶序列处的DNA。在一些实施例中,CRISPR核酸酶通过本文其它地方所描述的特异性地识别和/或结合靶序列的DNA结合序列被募集到靶序列。在一些实施例中,CRISPR核酸酶在靶序列处切割一条或两条DNA链。在一些实施例中,多于一种CRISPR核酸酶被募集到靶序列,并且一种或多种CRISPR核酸酶切割靶序列处或其附近的一条或两条DNA链。在此类实施例中,CRISPR核酸酶可以具有或能够具有核酸酶活性。在一些实施例中,CRISPR核酸酶可能具有降低的或有限的核酸酶活性。在一些实施例中,如本文其它地方所描述的CRISPR核酸酶-逆转录酶融合多肽能够结合如本文其它地方所描述的编辑模板RNA中的至少一个核酸酶结合序列并与其结合。在一些实施例中,CRISPR核酸酶-逆转录酶融合体能够通过编辑模板RNA中的至少一个DNA结合序列结合靶序列并与其结合。在此类实施例中,CRISPR核酸酶通过与编辑模板RNA的核酸酶结合序列和DNA结合序列结合被募集到靶序列或被带到靶序列附近。进一步地,在此类实施例中,逆转录酶能够将如本文其它地方所描述的逆转录模板序列转录和转录到DNA中。
在一些实施例中,CRISPR核酸酶-逆转录酶融合多肽将逆转录模板序列转录到靶核酸的非PAM链中。在一些实施例中,CRISPR核酸酶-逆转录酶融合多肽将逆转录模板序列转录到靶核酸的PAM链中。在一些实施例中,CRISPR核酸酶-逆转录酶融合多肽从PBS开始从5'至3'(例如,PBS的5'或3'端)转录逆转录模板序列。在一些实施例中,在PBS与靶核酸的非PAM链的游离3'端杂交后,CRISPR核酸酶-逆转录酶融合体从非PAM链的3'端开始转录逆转录模板序列。在一些实施例中,在PBS与靶核酸的PAM链的游离3'端杂交后,CRISPR核酸酶-逆转录酶融合体从PAM链的3'端开始转录逆转录模板序列。
在一些实施例中,CRISPR核酸酶是RNA向导的CRISPR核酸酶。在一些实施例中,CRISPR核酸酶是靶向DNA的核酸酶。
在一些实施例中,CRISPR核酸酶是Cas9(例如,Cas9和nCas9)、Casl2a/Cpf1、Cas12b/C2c1、Casl2c/C2c3、Casl2d/CasY、Casl2e/CasX、Casl2g、Casl2h、Casl2i和Casl2j/CasPhi。Cas酶的非限制性实例包含Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(也称为Csn1或Csxl2)、Cas10、Cas10d、Casl2a/Cpfl、Casl2b/C2cl、Casl2c/C2c3、Casl2d/CasY、Casl2e/CasX、Casl2g、Casl2h、Casl2i、Casl2j/CasΦ、Cpf1、Csy1、Csy2、Csy3、Csy4、Csel、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csnl、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csxl6、CsaX、Csx3、Csx1、CsxlS、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csal、Csa2、Csa3、Csa4、Csa5、II型CRISPR核酸酶、V型CRISPR核酸酶、VI型CRISPR核酸酶、CARF、DinG、其同源物或其经修饰的或工程化版本。其它CRISPR核酸酶也在本公开的范围内,尽管其可能未在本公开中具体列出。参见例如,Makarova等人,“CRISPR-Cas系统的分类和命名:从这里到哪里?”《CRISPR杂志》1(5):325-36(2018)。
在一些实施例中,CRISPR核酸酶是在以下文献中所公开的核酸酶:WO2021055874、WO 2020206036、WO 2020191102、WO 2020186213、WO 2020028555、WO2020033601、WO 2019126762、WO 2019126774、WO 2019071048、WO 2019018423、WO2019005866、WO 2018191388、WO 2018170333、WO 2018035388、WO 2018035387、WO2017219027、WO 2017189308、WO 2017184768、WO 2017106657、WO 2016205749、WO2017070605、WO 2016205764、WO 2016205711、WO 2016028682、WO 2015089473、WO2014093595、WO 2015089427、WO 2014204725、WO 2015070083、WO 2014093655、WO2014093694、WO 2014093712、WO 2014093635、WO 2021133829、WO 2021007177、WO2020197934、WO 2020181102、WO 2020181101、WO 2020041456、WO 2020023529、WO2020005980、WO 2019104058、WO 2019089820、WO 2019089808、WO 2019089804、WO2019089796、WO 2019036185、WO 2018226855、WO 2018213351、WO 2018089664、WO2018064371、WO 2018064352、WO 2017106569、WO 2017048969、WO 2016196655、WO2016106239、WO 2016036754、WO 2015103153、WO 2015089277、WO 2014150624、WO2013176772、WO 2021119563、WO 2021118626、WO 2020247883、WO 2020247882、WO2020223634、WO 2020142754、WO 2020086475、WO 2020028729、WO 2019241452、WO2019173248、WO 2018236548、WO 2018183403、WO 2017027423、WO 2018106727、WO2018071672、WO 2017096328、WO 2017070598、WO 2016201155、WO 2014150624、WO2013098244、WO 2021113522、WO 2021050534、WO 2021046442、WO 2021041569、WO2021007563、WO 2020252378、WO 2020180699、WO 2020018142、WO 2019222555、WO2019178428、WO 2019178427或WO 2019006471,所述文献通过引用并入以用于本文所引用的主题和目的。
在一些实施例中,本发明的组合物包括V型CRISPR核酸酶(例如,V型核酸酶)。在一些实施例中,V型核酸酶是Cas12 CRISPR核酸酶。在一些实施例中,V型核酸酶是Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)CRISPR核酸酶。在一些实施例中,V型核酸酶是Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)CRISPR核酸酶的变体(例如,功能变体)。在一些实施例中,V型核酸酶包括与野生型V型核酸酶序列(例如,Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)的野生型氨基酸序列)具有至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。
在一些实施例中,本发明的V型核酸酶是Cas12i CRISPR核酸酶。在一些实施例中,Cas12i CRISPR核酸酶是包括核苷酸序列如SEQ ID NO:1的Cas12i2 CRISPR核酸酶,或由包括氨基酸序列如SEQ ID NO:2的多肽编码。在一些实施例中,本发明的CRISPR核酸酶是野生型CRISPR核酸酶的变体,其中野生型包括核苷酸序列如SEQ ID NO:1,或由包括氨基酸序列如SEQ ID NO:2的多肽编码。参见表1。
在一些实施例中,本发明的II型核酸酶是Cas9 CRISPR核酸酶。在一些实施例中,Cas9 CRISPR核酸酶是包括氨基酸序列如SEQ ID NO:120的SpCas9 CRISPR核酸酶。在一些实施例中,Cas9 CRISPR核酸酶是切口酶,例如,包括氨基酸序列如SEQ ID NO:121的nSpCas9。在一些实施例中,本发明的CRISPR核酸酶是Cas9 CRISPR核酸酶的不同物种。在一些实施例中,Cas9 CRISPR核酸酶是包括氨基酸序列如SEQ ID NO:122的SaCas9 CRISPR核酸酶。参见表1。
表1.Cas12i和Cas9序列。
/>
/>
/>
/>
/>
/>
/>
编码本文所描述的CRISPR核酸酶的核酸序列可以与参考核酸序列,例如SEQ IDNO:1基本上相同。在一些实施例中,CRISPR核酸酶由核酸编码,所述核酸包括与参考核酸序列,例如编码野生型多肽的核酸序列,例如SEQ ID NO:1具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%序列同一性的序列。两个此类核酸之间的同一性百分比可以通过检查两个最佳比对的核酸序列或者通过使用标准参数的软件程序或算法(例如BLAST、ALIGN、CLUSTAL)来手动确定。两个核酸序列基本上相同的一个指示是核酸分子在严格条件下(例如,在中等至高度严格的范围内)与另一个的互补序列杂交。
在一些实施例中,CRISPR核酸酶由核酸序列编码,所述核酸序列与参考核酸序列,例如编码CRISPR核酸酶的核酸序列,例如SEQ ID NO:1具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更多序列同一性,但不是100%序列同一性。
在一些实施例中,本发明的CRISPR核酸酶包括与SEQ ID NO:2具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些实施例中,本发明的CRISPR核酸酶包括与SEQ ID NO:2具有大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,但不是100%同一性的序列。
在一些实施例中,本发明描述了与一种或多种参考多肽,例如,野生型多肽具有特定程度的氨基酸序列同一性的CRISPR核酸酶,例如,与SEQ ID NO:2的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%、但不是100%序列同一性。同源性或同一性可以通过氨基酸序列比对,例如,使用如本文所描述的BLAST、ALIGN或CLUSTAL等程序来确定。
在一些实施例中,CRISPR核酸酶是WO/2021/202800中所描述的变体Cas12i2多肽,所述文献的相关公开内容通过引用并入以用于本文所引用的主题和目的。在一些实施例中,变体Cas12i2多肽包括WO/2021/202800的表2中列出的氨基酸取代中的一个或多个氨基酸取代。在一些实施例中,CRISPR核酸酶是与PCT/US2021/025257的SEQ ID NO:3的氨基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的变体Cas12i2多肽。在一些实施例中,CRISPR核酸酶是与PCT/US2021/025257的SEQ ID NO:4的氨基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的变体Cas12i2多肽。在一些实施例中,CRISPR核酸酶是与PCT/US2021/025257的SEQ ID NO:5的氨基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的变体Cas12i2多肽。在一些实施例中,CRISPR核酸酶是与PCT/US2021/025257的SEQ ID NO:495的氨基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的变体Cas12i2多肽。在一些实施例中,CRISPR核酸酶是与PCT/US2021/025257的SEQ ID NO:496的氨基酸序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的变体Cas12i2多肽。在一些实施例中,CRISPR核酸酶是与WO/2021/202800的SEQ ID NO:3-146和495-512中的任一者具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的变体Cas12i2多肽。
在一些实施例中,CRISPR核酸酶是Cas12i多肽。在一些实施例中,CRISPR核酸酶是Cas12i1多肽。在一些实施例中,Cas12i1多肽是变体Cas12i1多肽。在一些实施例中,本发明的变体Cas12i1多肽包括与SEQ ID NO:8具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些实施例中,本发明的变体Cas12i1多肽包括与SEQ ID NO:8具有大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些实施例中,CRISPR核酸酶与一种或多种参考多肽,例如,野生型Casi1多肽具有特定程度的氨基酸序列同一性,例如,与SEQ ID NO:8的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以通过氨基酸序列比对,例如,使用如本文所描述的BLAST、ALIGN或CLUSTAL等程序来确定。
在一些实施例中,编码如本文所描述的变体Cas12i1多肽的核酸编码与SEQ IDNO:8具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。在一些实施例中,变体Cas12i1多肽具有与SEQ ID NO:8大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些实施例中,当使用任何前述比对方法进行比对时,本文所描述的具有酶促活性,例如核酸酶或核酸内切酶活性的变体Cas12i1多肽包括与CRISPR核酸酶和SEQ IDNO:8中的任一者的氨基酸序列相差100个、95个、90个、85个、80个、75个、70个、65个、60个、55个、50个、40个、35个、30个、25个、20个、19个、18个、17个、16个、15个、14个、13个、12个、11个、10个、9个、8个、7个、6个、5个、4个、3个、2个或1个氨基酸残基的氨基酸序列。
在一些实施例中,Cas12i多肽是Cas12i3多肽。在一些实施例中,本发明的Cas12i3多肽包括与SEQ ID NO:11具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些实施例中,本发明的Cas12i3多肽包括与SEQ ID NO:11具有大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些实施例中,Cas12i3多肽是变体Cas12i3多肽。在一些实施例中,变体Cas12i3多肽与一种或多种参考多肽,例如,野生型多肽具有特定程度的氨基酸序列同一性,例如,与SEQ ID NO:11的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以通过氨基酸序列比对,例如,使用如本文所描述的BLAST、ALIGN或CLUSTAL等程序来确定。
在一些实施例中,编码如本文所描述的变体Cas12i3多肽的核酸编码与SEQ IDNO:11具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。在一些实施例中,变体Cas12i3多肽具有与SEQ ID NO:11大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些实施例中,当使用任何前述比对方法进行比对时,本文所描述的具有酶促活性,例如核酸酶或核酸内切酶活性的变体Cas12i3多肽包括与CRISPR核酸酶和SEQ IDNO:11中的任一者的氨基酸序列相差100个、95个、90个、85个、80个、75个、70个、65个、60个、55个、50个、40个、35个、30个、25个、20个、19个、18个、17个、16个、15个、14个、13个、12个、11个、10个、9个、8个、7个、6个、5个、4个、3个、2个或1个氨基酸残基的氨基酸序列。
在一些实施例中,所述Cas12i多肽是Cas12i4多肽。在一些实施例中,本发明的Cas12i4多肽包括与SEQ ID NO:9或SEQ ID NO:10具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些实施例中,本发明的Cas12i4多肽包括与SEQ ID NO:9或SEQ ID NO:10具有大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些实施例中,Cas12i4多肽是变体Cas12i4多肽。在一些实施例中,变体Cas12i4多肽与一种或多种参考多肽,例如,野生型多肽具有特定程度的氨基酸序列同一性,例如,与SEQ ID NO:9或SEQ ID NO:10的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以通过氨基酸序列比对,例如,使用如本文所描述的BLAST、ALIGN或CLUSTAL等程序来确定。
在一些实施例中,编码如本文所描述的变体Cas12i4多肽的核酸编码与SEQ IDNO:9或SEQ ID NO:10具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。在一些实施例中,变体Cas12i4多肽具有与SEQ ID NO:9或SEQ ID NO:10大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些实施例中,当使用任何前述比对方法进行比对时,本文所描述的具有酶促活性,例如核酸酶或核酸内切酶活性的变体Cas12i4多肽包括与CRISPR核酸酶和SEQ IDNO:9或SEQ ID NO:10中的任一者的氨基酸序列相差100个、95个、90个、85个、80个、75个、70个、65个、60个、55个、50个、40个、35个、30个、25个、20个、19个、18个、17个、16个、15个、14个、13个、12个、11个、10个、9个、8个、7个、6个、5个、4个、3个、2个或1个氨基酸残基的氨基酸序列。
在一些实施例中,CRISPR核酸酶是II型CRISPR核酸酶,例如,Cas9核酸酶。在一些实施例中,Cas9核酸酶来自化脓性链球菌(S.pyogenes)或金黄色葡萄球菌(S.aureus)或其变体的Cas9。参见例如,美国20190136248,所述文献通过引用以其整体并入。在一些实施例中,Cas9多肽是切口酶。
在一些实施例中,本发明的Cas9多肽包括与SEQ ID NO:120-122中的任一者具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些实施例中,本发明的Cas9多肽包括与SEQ IDNO:120-122中的任一者具有大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些实施例中,Cas9多肽是变体Cas9多肽。在一些实施例中,变体Cas9多肽与一种或多种参考多肽,例如,野生型多肽具有特定程度的氨基酸序列同一性,例如,与SEQ IDNO:120-122中的任一者的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。同源性或同一性可以通过氨基酸序列比对,例如,使用如本文所描述的BLAST、ALIGN或CLUSTAL等程序来确定。
在一些实施例中,编码如本文所描述的变体Cas9多肽的核酸编码与SEQ ID NO:120-122中的任一者具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的氨基酸序列。在一些实施例中,变体Cas9多肽具有与SEQ ID NO:120-122中的任一者大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。
在一些实施例中,当使用任何前述比对方法进行比对时,本文所描述的具有酶促活性,例如核酸酶或核酸内切酶活性的变体Cas9多肽包括与CRISPR核酸酶和SEQ ID NO:120或SEQ ID NO:121中的任一者的氨基酸序列相差100个、95个、90个、85个、80个、75个、70个、65个、60个、55个、50个、40个、35个、30个、25个、20个、19个、18个、17个、16个、15个、14个、13个、12个、11个、10个、9个、8个、7个、6个、5个、4个、3个、2个或1个氨基酸残基的氨基酸序列。
在一些实施例中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽或II型核酸酶)包括野生型多肽的一个或多个(例如,若干个)氨基酸处的改变,其中至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、101个、102个、103个、104个、105个、106个、107个、108个、109个、110个、111个、112个、113个、114个、115个、116个、117个、118个、119个、120个、121个、122个、123个、124个、125个、126个、127个、128个、129个、130个、131个、132个、133个、134个、135个、136个、137个、138个、139个、140个、141个、142个、143个、144个、145个、146个、147个、148个、149个、150个、151个、152个、153个、154个、155个、156个、157个、158个、159个、160个、161个、162个、162个、164个、164个、165个、166个、167个、168个、169个、170个、171个、172个、173个、174个、175个、176个、177个、178个、179个、180个、181个、182个、183个、184个、185个、186个、187个、188个、189个、190个、191个、193个、194个、195个、196个、197个、198个、199个、200个或更多个被改变。
在一些实施例中,如本文所描述的实施例中的任一个实施例中的CRISPR核酸酶包括crRNA处理活性。在一些实施例中,V型核酸酶(例如,Cas12i多肽)是缺乏crRNA处理活性的变体。例如,在一些实施例中,其中V型核酸酶是变体Cas12i2多肽,变体Cas12i2多肽包括H485或H486取代。在一些实施例中,与SEQ ID NO:2-7中的任一者具有至少90%同一性(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)的变体Cas12i2多肽进一步包括H485或H486突变。在一些实施例中,包括H485或H486突变的变体Cas12i2多肽包括减少的crRNA处理活性或缺乏crRNA处理活性。
在一些实施例中,编码本文所描述的CRISPR核酸酶的核苷酸序列可以经密码子优化以用于特定宿主细胞或生物体,或用于特定目的,例如,表达。例如,核酸可以针对包含小鼠、大鼠、兔、狗、家畜或非人类灵长类动物的任何非人真核生物进行密码子优化。密码子使用表例如可在www.kazusa.orjp/codon/上的“密码子使用数据库”中很容易获得,并且这些表可以通过多种方式进行调整。参见Nakamura等人,《核酸研究》28:292(2000),所述文献通过引用以其整体并入本文。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可得的,如基因制造(Gene Forge)(宾夕法尼亚州雅各布斯的Aptagen公司(Aptagen;Jacobus,PA))。在一些实例中,编码CRISPR核酸酶(例如,本文所公开的任何Casl2i多肽,如Casl2i2或Casl2i4多肽)、逆转录酶或其任何融合多肽的核酸可以是mRNA分子,所述mRNA分子可以经密码子优化。在一些实例中,本文所公开的任何编辑模板RNA中的RT模板序列或其部分也可以经密码子优化。
尽管本文所描述的变化可以是一个或多个氨基酸变化,但CRISPR核酸酶的变化也可以是结构性的或实质性的,如多肽作为氨基末端延伸部和/或羧基末端延伸部的融合体。例如,CRISPR核酸酶可以含有另外的肽,例如,一种或多种肽。另外的肽的实例可以包含用于标记的表位肽,如多聚组氨酸标签(His标签)、Myc和FLAG。在一些实施例中,本文所描述的CRISPR核酸酶可以与可检测部分,如荧光蛋白(例如,绿色荧光蛋白(GFP)或黄色荧光蛋白(YFP))融合。
在一些实施例中,如本文所描述的实施例中的任一个实施例中的CRISPR核酸酶包括至少一个(例如,两个、三个、四个、五个、六个或更多个)核定位信号(NLS)。在一些实施例中,CRISPR核酸酶包括至少一个(例如,两个、三个、四个、五个、六个或更多个)核输出信号(NES)。在一些实施例中,CRISPR核酸酶包括至少一个(例如,两个、三个、四个、五个、六个或更多个)NLS和至少一个(例如,两个、三个、四个、五个、六个或更多个)NES。
在一些实施例中,CRISPR核酸酶包括至少一个RuvC结构域,但小于全CRISPR核酸酶。在一些实施例中,相对于野生型CRISPR核酸酶,CRISPR核酸酶是截短的CRISPR核酸酶。在一些实施例中,截短的CRISPR核酸酶包括RuvC结构域。在一些实施例中,CRISPR核酸酶包括全CRISPR核酸酶的至少一个功能结构域。在一些实施例中,CRISPR核酸酶包括至少两个RuvC结构域或至少两个RuvC基序。在一些实施例中,CRISPR核酸酶包括至少三个RuvC结构域或至少三个RuvC基序。在一些实施例中,CRISPR核酸酶包括至少一个催化死亡的RuvC结构域和至少一个催化活性的RuvC结构域。在一些实施例中,CRISPR核酸酶包括来自一种或多种V型或II型核酸酶的两个RuvC结构域。在一些实施例中,CRISPR核酸酶至少包括RuvC结构域和二聚化结构域。
在一些实施例中,如本文所描述的实施例中的任一个实施例中的CRISPR核酸酶与聚合酶融合。在一些实施例中,如前述实施例中的任一个实施例中所描述的CRISPR核酸酶与逆转录酶多肽融合。在一些实施例中,CRISPR核酸酶包括N末端逆转录酶多肽。在一些实施例中,CRISPR核酸酶包括C末端逆转录酶多肽。在一些实施例中,CRISPR核酸酶包括在CRISPR核酸酶内的分子内位置处逆转录酶多肽(例如,逆转录酶在CRISPR核酸酶的环内)。
在一些实施例中,如本文所描述的实施例中的任一个实施例中的CRISPR核酸酶与逆转录酶多肽相互作用(例如,通过静电相互作用)。在一些实施例中,CRISPR核酸酶包括二聚化结构域。如本文所使用的,术语“二聚化结构域”是指能够特异性地结合单独的并且可相容的多肽结构域的多肽结构域(例如,第二可相容的二聚化结构域)。在一些实施例中,二聚体由第一二聚化结构域与第二可相容的二聚化结构域之间的非共价键形成。在一些实施例中,二聚化结构域是亮氨酸拉链、纳米抗体或抗体。在一些实施例中,二聚化结构域募集逆转录酶多肽。在一些实施例中,CRISPR核酸酶和逆转录酶多肽通过卷曲螺旋肽异二聚体相互作用。
在一些实施例中,如本文所描述的实施例中的任一个实施例中的CRISPR核酸酶与连接酶、整合酶和/或重组酶相互作用。在一些实施例中,如本文所描述的实施例中的任一个实施例中的CRISPR核酸酶与连接酶、整合酶和/或重组酶融合。在一些实施例中,连接酶、整合酶和/或重组酶与CRISPR核酸酶的N末端或C末端融合。在一些实施例中,连接酶、整合酶和/或重组酶与CRISPR核酸酶在内部融合。在一些实施例中,整合酶是丝氨酸整合酶。在一些实施例中,整合酶是Bxb1、TP901或PhiBT1整合酶。在一些实施例中,重组酶是丝氨酸重组酶或酪氨酸重组酶。在一些实施例中,重组酶是CRE重组酶。在一些实施例中,与连接酶、整合酶和/或重组酶相互作用或融合的CRISPR核酸酶进一步与逆转录酶相互作用或融合。
B.逆转录酶
在各个实施例中,本文所公开的组合物包含聚合酶(例如,DNA依赖性DNA聚合酶或RNA依赖性DNA聚合酶)或其变体,其可以作为与CRISPR核酸酶的融合体提供。聚合酶可以是野生型聚合酶、功能片段、变体、截短的变体等。聚合酶可以包含来自真核生物、原核生物、古菌或病毒生物体的野生型聚合酶,和/或聚合酶可以通过基因工程化、诱变、基于定向进化的过程进行修饰。
任何CRISPR核酸酶-RT融合多肽,如本文所公开的那些(例如,表7和17中所示出的那些),其编码核酸,包含此类编码核酸的载体和制备此类编码核酸的方法也在本公开的范围内。
在一些实施例中,聚合酶是逆转录酶。在一些实施例中,逆转录酶多肽是从任何天然存在的生物体或病毒中获得的,或者从商业或非商业来源获得的任何野生型逆转录酶。逆转录酶多肽也可以是变体逆转录酶多肽。
逆转录酶多肽可以从许多不同的来源获得。例如,基因可以从被逆转录病毒感染的真核细胞中获得,或者从包括部分或全部逆转录病毒基因组的质粒中获得。另外,包括逆转录酶基因的RNA可以从逆转录病毒中获得。在一些实施例中,逆转录酶作为单独的组分表达或以其它方式提供,即,不作为与CRISPR核酸酶(例如,Cas12i)多肽的融合蛋白。
本领域普通技术人员将认识到逆转录酶是本领域已知的,包含但不限于莫洛尼鼠类白血病病毒(MMLV)逆转录酶、人体免疫缺陷病毒(HIV)逆转录酶和禽肉瘤-白血病病毒(ASLV)逆转录酶,其包含但不限于劳斯氏肉瘤病毒(RSV)逆转录酶、禽成髓细胞瘤病毒(AMV)逆转录酶、禽成红细胞病毒(AEV)辅助病毒MCAV逆转录酶、禽髓细胞瘤病病毒MC29辅助病毒MCAV逆转录酶、禽网状内皮增生病病毒(REV-T)辅助病毒REV-A逆转录酶、禽肉瘤病毒UR2辅助病毒UR2AV逆转录酶、禽肉瘤病毒Y73辅助病毒YAV逆转录酶、劳斯伴随病毒(RAV)逆转录酶和成髓细胞瘤相关病毒(Myeloblastosis Associated Virus,MAV)逆转录酶可以适用于本文所描述的组合物。
在一些实施例中,逆转录酶是MMLV-RT、来自直肠真杆菌(Eubacterium rectale)的MarathonRT或RTX逆转录酶或MMLV-RT、MarathonRT或RTX逆转录酶的变体。在一些实施例中,逆转录酶是表2中所示出的序列、其变体或其直系同源物。
表2.逆转录酶序列。
/>
/>
在一些实施例中,逆转录酶多肽与如本文所描述的实施例中的任一个实施例中的CRISPR核酸酶融合。在一些实施例中,逆转录酶多肽包括N末端CRISPR核酸酶。在一些实施例中,逆转录酶多肽包括C末端CRISPR核酸酶。在一些实施例中,逆转录酶多肽包括在逆转录酶多肽的环内的位于逆转录酶多肽内的分子内位置处的CRISPR核酸酶(例如,CRISPR核酸酶)。
在一些实施例中,逆转录酶多肽包括二聚化结构域。在一些实施例中,二聚化结构域是亮氨酸拉链、纳米抗体或抗体。在一些实施例中,二聚化结构域募集CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)。
在一些实施例中,逆转录酶多肽是“易错”逆转录酶变体。可以使用本领域已知和/或可获得的易错逆转录酶。应当理解,逆转录酶自然不具有任何校对功能;因此,逆转录酶的错误率通常高于包括校对活性的DNA聚合酶。在一些实施例中,如果逆转录酶在合成的约15,000个核苷酸中具有小于一个错误的错误率,则认为所述逆转录酶是“易错的”。
在一些实施例中,逆转录酶多肽在RNA酶H结构域中具有一个或多个突变。在一些实施例中,逆转录酶多肽不包括RNA酶H结构域(例如,RNA酶H结构域已从逆转录酶多肽中去除)。在一些实施例中,RNA酶H结构域在逆转录酶多肽中被截短。在一些实施例中,逆转录酶多肽在RNA依赖性DNA聚合酶结构域中具有一个或多个突变。在一些实施例中,逆转录酶多肽是具有改变的热稳定性特征的变体。逆转录酶耐高温的能力是cDNA合成的一个重要方面。升高的反应温度有助于使具有强次级结构和/或高GC含量的RNA变性,从而允许逆转录酶能够读取整个序列。因此,在更高温度下进行逆转录能够合成全长cDNA并获得更高的产率。野生型M-MLV逆转录酶通常具有37-48℃范围内的最佳温度;然而,可以引入允许在超过48℃的更高温度下的逆转录活性的突变,所述更高温度包含49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃和更高温度。
本文所使用的变体逆转录酶多肽可以与包含本文所公开或设想的或本领域已知的任何野生型逆转录酶、突变型逆转录酶或逆转录酶的片段,或其它逆转录酶变体的任何参考逆转录酶多肽至少约20%相同、至少约25%相同、至少约30%相同、至少约35%相同、至少约40%相同、至少约45%相同、至少约50%相同、至少约55%相同、至少约60%相同、至少约65%相同、至少约70%相同、至少约75%相同、至少约80%相同、至少约85%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施例中,与参考逆转录酶相比,逆转录酶变体可以具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、21个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、或至多100个、或至多200个、或至多300个、或至多400个、或至多500个或更多个氨基酸变化。在一些实施例中,逆转录酶变体包括参考逆转录酶的片段,使得所述片段与参考逆转录酶的对应片段至少约20%相同、至少约25%相同、至少约30%相同、至少约35%相同、至少约40%相同、至少约45%相同、至少约50%相同、至少约55%相同、至少约60%相同、至少约65%相同、至少约70%相同、至少约75%相同、至少约80%相同、至少约85%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。
包含易错逆转录酶、热稳定逆转录酶和持续合成能力增加的逆转录酶的变体逆转录酶可以通过包含诱变或进化过程的各种常规策略工程化。在一些情况下,可以通过引入单个突变来产生变体。在其它情况下,变体可能需要多于一个突变。对于那些包括多于一个突变的突变体,可以通过通过与特定突变体携带的其它突变分离的定点诱变将经鉴定的突变引入到野生型基因中来评估给定突变的效果。由此产生的单个突变体的筛选测定将允许单独确定所述突变的效果。
在一些实施例中,逆转录酶多肽包括结构域或与结构域融合,以提高逆转录酶的延伸速率和/或效率。在一些实施例中,逆转录酶多肽与Sso7d多肽,如来自硫磺矿硫化叶菌(Sulfolobus solfataricus)的Sso7d多肽融合。参见例如,Wang等人,《核酸研究》32(3):1197-207(2004)。
在一些实施例中,如本文其它地方所描述的CRISPR核酸酶-逆转录酶融合多肽能够结合编辑模板RNA中的至少一个核酸酶结合序列并与其结合。在一些实施例中,CRISPR核酸酶-逆转录酶融合多肽能够通过编辑模板RNA中的至少一个DNA结合序列结合靶序列并与其结合。在此类实施例中,CRISPR核酸酶-逆转录酶融合多肽通过编辑模板RNA的核酸酶结合序列和DNA结合序列通过CRISPR核酸酶的结合被募集到靶序列或被带到靶序列附近。
在一些实施例中,逆转录酶从PBS的5'端开始将逆转录模板序列转录到靶核酸的非PAM链中。在一些实施例中,逆转录酶从PBS的3'端开始将逆转录模板序列转录到靶核酸的非PAM链中。在一些实施例中,逆转录酶从PBS的5'端开始将逆转录模板序列转录到靶核酸的PAM链中。在一些实施例中,逆转录酶从PBS的3'端开始将逆转录模板序列转录到靶核酸的PAM链中。在一些实施例中,在PBS与靶核酸的非PAM链结合后,逆转录酶从非PAM链的游离3'端开始转录逆转录模板序列。在一些实施例中,在PBS与靶核酸的PAM链杂交后,逆转录酶从PAM链的游离3'端开始转录逆转录模板序列。
在一些实施例中,如本文所描述的实施例中的任一个实施例中的逆转录酶与连接酶、整合酶和/或重组酶相互作用。在一些实施例中,如本文所描述的实施例中的任一个实施例中的逆转录酶与连接酶、整合酶和/或重组酶融合。在一些实施例中,连接酶、整合酶和/或重组酶与逆转录酶的N末端或C末端融合。在一些实施例中,连接酶、整合酶和/或重组酶与逆转录酶在内部融合。在一些实施例中,整合酶是丝氨酸整合酶。在一些实施例中,整合酶是Bxb1、TP901或PhiBT1整合酶。在一些实施例中,重组酶是丝氨酸重组酶或酪氨酸重组酶。在一些实施例中,重组酶是CRE重组酶。在一些实施例中,与连接酶、整合酶和/或重组酶相互作用或融合的逆转录酶进一步与CRISPR核酸酶相互作用或融合。
C.基因编辑RNA分子
本文所公开的任何基因编辑系统可以包括编辑模板RNA(基因编辑RNA),其包括RNA向导和RNA逆转录酶(RT)供体(RT供体RNA)。编辑模板RNA有助于编辑靶核酸如所期望的基因组位点中的序列。在一些实施例中,编辑模板RNA可以是包括RNA向导(例如,包括核酸酶结合序列和DNA结合序列)和RT供体RNA两者的单个RNA分子。在其它实施例中,编辑模板RNA包括RNA向导和RT供体RNA作为单独的RNA分子。
在一些实施例中,编辑模板RNA或其任何部分在载体中编码。在一些实施例中,载体包括Pol II启动子或Pol III启动子。在一些实施例中,本文所公开的编辑模板RNA不包括tracrRNA组分。可替代地,本文所公开的编辑模板RNA可以包括tracrRNA组分。
i.RNA向导
在本文所公开的任何基因编辑系统中,编辑模板RNA包括RNA向导,所述RNA向导通过也包含在基因编辑系统中的CRISPR核酸酶介导靶核酸的切割。RNA向导(或gRNA)包括核酸酶结合序列和DNA结合序列(间隔子)。核酸酶结合序列可以包括一个或多个可被CRISPR核酸酶识别以用于结合的结合位点。在一些情况下,gRNA是包括核酸酶结合序列和间隔子序列两者的单个RNA分子。可替代地,gRNA可以包括作为两个单独的RNA分子的核酸酶结合序列和间隔子。
在一些实施例中,RNA向导包括在RNA向导的5'端处、RNA向导的3'端处或RNA向导内的分子内位置处的RNA延伸部。在各个实施例中,RNA延伸部的长度为至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、至少22个核苷酸、至少23个核苷酸、至少24个核苷酸、至少25个核苷酸、至少26个核苷酸、至少27个核苷酸、至少28个核苷酸、至少29个核苷酸、至少30个核苷酸、至少31个核苷酸、至少32个核苷酸、至少33个核苷酸、至少34个核苷酸、至少35个核苷酸、至少36个核苷酸、至少37个核苷酸、至少38个核苷酸、至少39个核苷酸、至少40个核苷酸、至少41个核苷酸、至少42个核苷酸、至少43个核苷酸、至少44个核苷酸、至少45个核苷酸、至少46个核苷酸、至少47个核苷酸、至少48个核苷酸、至少49个核苷酸或至少50个核苷酸。在一些实施例中,RNA延伸部是逆转录供体RNA(“RT供体RNA”)(例如,RNA向导与RT供体RNA融合)。在一些实施例中,RT供体RNA包括如本文所描述的的引物结合位点(PBS)和逆转录模板序列。
核酸酶结合序列
在一些实施例中,如本文所描述的组合物包括核酸酶结合序列。在一些实施例中,核酸酶结合序列是CRISPR核酸酶结合序列(例如,核酸酶结合序列能够与V型核酸酶或II型核酸酶结合)。在一些实施例中,核酸酶结合序列进一步是核酸结合序列(例如,DNA结合序列)。
在一些实施例中,核酸酶结合序列包括RNA向导。RNA向导可以以特异性结合亲和力结合本文所描述的CRISPR核酸酶中的任一种CRISPR核酸酶(例如,V型核酸酶或II型核酸酶)。在一些实施例中,RNA向导进一步包括对靶序列的特异性结合亲和力。在一些实施例中,本文所描述的组合物包括两个或多个RNA向导(例如,2个、3个、4个、5个、6个、7个、8个、9个或更多个)。在一些实施例中,核酸酶结合序列在载体中编码。在一些实施例中,载体包括Pol II启动子或Pol III启动子。
在一些实施例中,核酸酶结合序列包括直接重复序列。在一些实施例中,核酸酶结合序列包含与DNA结合序列(例如,靶向DNA的序列或间隔子)连接的直接重复序列。在一些实施例中,核酸酶结合序列包含直接重复序列和DNA结合序列或直接重复序列-DNA结合序列-直接重复序列。在一些实施例中,核酸酶结合序列包含截短的直接重复序列和DNA结合序列,其是经处理的或成熟crRNA的典型。
在一些实施例中,核酸酶结合序列(例如,直接重复序列)能够结合Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)多肽。在一些实施例中,直接重复序列能够结合Cas9多肽。
在核酸酶结合序列是可公开获得的CRISPR核酸酶的直接重复序列的实施例中,那些直接重复序列是本领域已知的。在一些实施例中,能够结合CRISPR核酸酶的直接重复序列是在以下文献中所公开的任何直接重复序列:WO 2021055874、WO 2020206036、WO2020191102、WO 2020186213、WO 2020028555、WO 2020033601、WO 2019126762、WO2019126774、WO 2019071048、WO 2019018423、WO 2019005866、WO 2018191388、WO2018170333、WO 2018035388、WO 2018035387、WO 2017219027、WO 2017189308、WO2017184768、WO 2017106657、WO 2016205749、WO 2017070605、WO 2016205764、WO2016205711、WO 2016028682、WO 2015089473、WO 2014093595、WO 2015089427、WO2014204725、WO 2015070083、WO 2014093655、WO 2014093694、WO 2014093712、WO2014093635、WO 2021133829、WO 2021007177、WO 2020197934、WO 2020181102、WO2020181101、WO 2020041456、WO 2020023529、WO 2020005980、WO 2019104058、WO2019089820、WO 2019089808、WO 2019089804、WO 2019089796、WO 2019036185、WO2018226855、WO 2018213351、WO 2018089664、WO 2018064371、WO 2018064352、WO2017106569、WO 2017048969、WO 2016196655、WO 2016106239、WO 2016036754、WO2015103153、WO 2015089277、WO 2014150624、WO 2013176772、WO 2021119563、WO2021118626、WO 2020247883、WO 2020247882、WO 2020223634、WO 2020142754、WO2020086475、WO 2020028729、WO 2019241452、WO 2019173248、WO 2018236548、WO2018183403、WO 2017027423、WO 2018106727、WO 2018071672、WO 2017096328、WO2017070598、WO 2016201155、WO 2014150624、WO 2013098244、WO 2021113522、WO2021050534、WO 2021046442、WO 2021041569、WO 2021007563、WO 2020252378、WO2020180699、WO 2020018142、WO 2019222555、WO 2019178428、WO 2019178427或WO2019006471,所述文献的相关公开内容通过引用并入以用于本文所引用的主题和目的。
在一些实施例中,其中CRISPR核酸酶是Cas12i多肽,直接重复序列包括与SEQ IDNO:12-24中的任一者的至少90%同一性。在一些实施例中,其中CRISPR核酸酶是Cas12i多肽,直接重复序列包括与SEQ ID NO:12-24中的任一者的至少95%同一性。在一些实施例中,其中CRISPR核酸酶是Cas12i多肽,直接重复序列包括SEQ ID NO:12-24中的任一者。在一些实施例中,直接重复序列包括SEQ ID NO:12-24中的任一者的一部分。
表3.直接重复序列。
/>
其它CRISPR核酸酶如其它V型CRISPR核酸酶的核酸酶结合序列是本领域已知的和/或在下表4-6中提供。
DNA结合序列
RNA向导也可以包括DNA结合序列。在一些实施例中,DNA结合序列是靶向DNA的序列(例如,间隔子)。间隔子的长度可以为约7个核苷酸至约100个核苷酸。例如,间隔子的长度可以为约7个核苷酸至约80个核苷酸、约7个核苷酸至约50个核苷酸、约7个核苷酸至约40个核苷酸、约7个核苷酸至约30个核苷酸、约7个核苷酸至约25个核苷酸、约7个核苷酸至约20个核苷酸或约7个核苷酸至约19个核苷酸。例如,间隔子的长度可以为约7个核苷酸至约20个核苷酸、约7个核苷酸至约25个核苷酸、约7个核苷酸至约30个核苷酸、约7个核苷酸至约35个核苷酸、约7个核苷酸至约40个核苷酸、约7个核苷酸至约45个核苷酸、约7个核苷酸至约50个核苷酸、约7个核苷酸至约60个核苷酸、约7个核苷酸至约70个核苷酸、约7个核苷酸至约80个核苷酸、约7个核苷酸至约90个核苷酸、约7个核苷酸至约100个核苷酸、约10个核苷酸至约25个核苷酸、约10个核苷酸至约30个核苷酸、约10个核苷酸至约35个核苷酸、约10个核苷酸至约40个核苷酸、约10个核苷酸至约45个核苷酸、约10个核苷酸至约50个核苷酸、约10个核苷酸至约60个核苷酸、约10个核苷酸至约70个核苷酸、约10个核苷酸至约80个核苷酸、约10个核苷酸至约90个核苷酸或约10个核苷酸至约100个核苷酸。
在一些实施例中,RNA向导中的间隔子通常可以被设计成长度介于7个与50个核苷酸之间或15个与35个核苷酸之间(例如,7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个核苷酸),并且与特异性靶序列互补。在一些实施例中,RNA向导可以被设计成长度介于18-22个核苷酸之间。
在一些实施例中,DNA结合序列与如本文所描述的靶序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%的序列同一性,并且能够通过碱基配对与靶序列的互补区结合。
在一些实施例中,DNA结合序列仅包括RNA碱基。在一些实施例中,DNA结合序列包括DNA碱基(例如,间隔子包括至少一个胸腺嘧啶)。在一些实施例中,DNA结合序列包括RNA碱基和DNA碱基(例如,DNA结合序列包括至少一个胸腺嘧啶和至少一个尿嘧啶)。
在一些情况下,本文所公开的RNA向导可以进一步包括接头序列、5'端和/或3'端保护片段(参见本文的公开内容)或其组合。
本文所公开的任何RNA向导中的间隔子可以对靶序列具有特异性,即能够通过碱基配对与靶序列的互补区结合。在一些情况下,靶序列可以在所关注的基因组位点内,例如,需要基因编辑的位点。
在一些实施例中,靶序列与PAM序列相邻。PAM序列在本领域是已知的。在一些实施例中,能够被CRISPR核酸酶识别的PAM序列在以下文献中公开:WO 2021055874、WO2020206036、WO 2020191102、WO 2020186213、WO 2020028555、WO 2020033601、WO2019126762、WO 2019126774、WO 2019071048、WO 2019018423、WO 2019005866、WO2018191388、WO 2018170333、WO 2018035388、WO 2018035387、WO 2017219027、WO2017189308、WO 2017184768、WO 2017106657、WO 2016205749、WO 2017070605、WO2016205764、WO 2016205711、WO 2016028682、WO 2015089473、WO 2014093595、WO2015089427、WO 2014204725、WO 2015070083、WO 2014093655、WO 2014093694、WO2014093712、WO 2014093635、WO 2021133829、WO 2021007177、WO 2020197934、WO2020181102、WO 2020181101、WO 2020041456、WO 2020023529、WO 2020005980、WO2019104058、WO 2019089820、WO 2019089808、WO 2019089804、WO 2019089796、WO2019036185、WO 2018226855、WO 2018213351、WO 2018089664、WO 2018064371、WO2018064352、WO 2017106569、WO 2017048969、WO 2016196655、WO 2016106239、WO2016036754、WO 2015103153、WO 2015089277、WO 2014150624、WO 2013176772、WO2021119563、WO 2021118626、WO 2020247883、WO 2020247882、WO 2020223634、WO2020142754、WO 2020086475、WO 2020028729、WO 2019241452、WO 2019173248、WO2018236548、WO 2018183403、WO 2017027423、WO 2018106727、WO 2018071672、WO2017096328、WO 2017070598、WO 2016201155、WO 2014150624、WO 2013098244、WO2021113522、WO 2021050534、WO 2021046442、WO 2021041569、WO 2021007563、WO2020252378、WO 2020180699、WO 2020018142、WO 2019222555、WO 2019178428、WO2019178427或WO 2019006471,所述文献中的每个文献的相关公开内容被并入以用于本文所引用的主题和目的。
当基因编辑系统包括Cas12i多肽时,PAM序列包括5'-NTTN-3'(或5'-TTN-3'),其中N是任何核苷酸(例如,A、G、T或C)。PAM序列在靶序列的上游。与其它CRISPR核酸酶缔合的PAM序列可以包括序列5'-TTY-3'或5'-TTB-3',其中Y是C或T,并且B是G、T或C。PAM序列可以紧邻靶序列,或者例如在靶序列的少量(例如1个、2个、3个、4个或5个)核苷酸内。
下表4-6提供了本领域已知的示例性V型CRISPR核酸酶和其对应的核酸酶结合序列和PAM序列。这些序列允许本领域技术人员用另一种V型CRISPR核酸酶设计如本文所描述的编辑模板RNA。
表4.示例性V型CRISPR核酸酶的PAM序列
a:所引用参考文献的相关公开内容通过引用并入以用于本文所引用的主题和目的。
*:V代表A、C或G;R代表A或G;B代表C、G或T;(T)可选;na代表无PAM
表5.Cas12家族蛋白的直接重复序列
还参见Zetsche等人,《细胞》163:759-771(2015),所述文献的相关公开内容通过引用并入以用于本文所引用的主题和目的。
下表6提供了本领域已知的另外的V型CRISPR核酸酶的信息
表6.另外的V型CRISPR核酸酶
亚型 蛋白质名称 参考a
B Cas12b Shmakov等人,2015
C Cas12c Yan等人,2019;Harrington等人,2020
D Cas12d Harrington等人,2020
E Cas12e Liu J.J.等人,2019
F Cas14(cas12f) Harrington等人,2018
a:所引用参考文献的相关公开内容通过引用并入以用于本文所引用的主题和目的。
ii.RNA逆转录酶供体或RT供体RNA
本文所公开的任何基因编辑系统中的编辑模板RNA还可以包括RNA逆转录酶(RT)供体(RT供体RNA)。RT供体RNA可以包括:(i)引物结合位点(PBS),以及(ii)逆转录模板序列。在一些情况下,RT供体RNA可以进一步包括:(iii)核苷酸接头序列,(iv)5'端和/或3'端保护片段(参见本文的公开内容,或其组合。在一些实施例中,编辑模板RNA包括一种或多种RT供体RNA。在一些实施例中,编辑模板RNA包括一个或多个PBS、一个或多个逆转录模板序列和/或一个或多个核苷酸接头序列。在一些实施例中,第一编辑模板RNA包括一个或多个PBS,并且第二编辑模板RNA包括一个或多个逆转录模板序列。
在一些实施例中,RT供体RNA包括适体。在一些实施例中,适体募集逆转录酶多肽。
引物结合位点(PBS)
在一些实施例中,本文所公开的RT供体RNA中的PBS是能够通过碱基配对与DNA链结合的RNA序列。DNA链已经或可以被CRISPR核酸酶切开或切割。在一些实施例中,PBS包括能够通过碱基配对与DNA链(靶向PBS的位点)结合的RNA序列。DNA链可以具有可以通过被包含在相同基因编辑系统中的CRISPR核酸酶切割而产生的游离3'自由端或者3'自由端。在一些实例中,靶向PBS的位点可以位于与PAM序列相同的DNA链(PAM链)上。在一些实例中,靶向PBS的位点可以位于PAM链的互补链(非PAM链)上。
在一些实施例中,PBS的长度为至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少30个核苷酸、至少40个核苷酸、至少50个核苷酸、至少60个核苷酸、至少70个核苷酸、至少80个核苷酸、至少90个核苷酸、至少100个核苷酸、至少200个核苷酸、至少300个核苷酸、至少400个核苷酸或至少500个核苷酸。在一些实施例中,PBS的长度为约3个核苷酸至约200个核苷酸(例如,约3个核苷酸、5个核苷酸、8个核苷酸、10个核苷酸、13个核苷酸、15个核苷酸、20个核苷酸、30个核苷酸、40个核苷酸、50个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、100个核苷酸、110个核苷酸、120个核苷酸、130个核苷酸、140个核苷酸、150个核苷酸、160个核苷酸、170个核苷酸、180个核苷酸、190个核苷酸、200个核苷酸或其间的任何长度)。在一些实施例中,PBS的长度为约3个核苷酸至约100个核苷酸(例如,约3个核苷酸、5个核苷酸、8个核苷酸、10个核苷酸、13个核苷酸、15个核苷酸、20个核苷酸、30个核苷酸、40个核苷酸、50个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、或100个核苷酸或其间的任何长度)。
在一些实施例中,PBS的长度为约10个核苷酸至约50个核苷酸。在一些实施例中,PBS的长度为约10个核苷酸至约40个核苷酸。在一些实施例中,PBS的长度为约10个核苷酸至约30个核苷酸。在一些实施例中,PBS的长度为约10个核苷酸至约20个核苷酸。在一些实施例中,PBS的长度为约10个核苷酸至约15个核苷酸。在一些实施例中,PBS的长度为约11个核苷酸。在一些实施例中,PBS的长度为约12个核苷酸。在一些实施例中,PBS的长度为约13个核苷酸。在一些实施例中,PBS的长度为约14个核苷酸。在一些实施例中,PBS的长度为约30个核苷酸。
在包括Cas12i多肽(例如,如本文所公开的Cas12i2多肽)的基因编辑系统中,RT供体RNA中的PBS可以与非PAM链上的区(靶向PBS的位点)结合。在一些情况下,靶向PBS的位点可以位于靶序列的互补区的上游。例如,靶向PBS的位点可以是互补区上游的至多20个核苷酸,例如至多15个核苷酸、至多10个核苷酸或至多5个核苷酸。在具体实例中,靶向PBS的位点可以是互补区上游的约3个核苷酸至约10个核苷酸。在具体实例中,靶向PBS的位点可以是互补区上游的1个核苷酸、1-2个核苷酸、1-3个核苷酸、1-4个核苷酸、1-5个核苷酸、1-6个核苷酸、1-7个核苷酸、1-8个核苷酸、1-9个核苷酸、1-10个核苷酸、2-3个核苷酸、2-4个核苷酸、2-5个核苷酸、2-6个核苷酸、2-7个核苷酸、2-8个核苷酸、2-9个核苷酸、2-10个核苷酸、3-4个核苷酸、3-5个核苷酸、3-6个核苷酸、3-7个核苷酸、3-8个核苷酸、3-9个核苷酸、3-10个核苷酸、4-5个核苷酸、4-6个核苷酸、4-7个核苷酸、4-8个核苷酸、4-9个核苷酸、4-10个核苷酸、5-6个核苷酸、5-7个核苷酸、5-8个核苷酸、5-9个核苷酸、5-10个核苷酸、6-7个核苷酸、6-8个核苷酸、6-9个核苷酸、6-10个核苷酸、7-8个核苷酸、7-9个核苷酸、7-10个核苷酸、8-9个核苷酸、8-10个核苷酸、9-10个核苷酸或10个核苷酸。在其它情况下,靶向PBS的位点可以与互补区重叠。当基因编辑系统中的Cas12i多肽在靶序列和互补区内或附近产生游离3'端时,在互补区上游或与互补区重叠的位点处与非PAM链结合的PBS可以有效地促进基因编辑系统中RT多肽合成DNA,从非PAM链中产生的游离3'端开始。示例性说明在图12A和图12B中提供。
逆转录模板序列
逆转录模板序列(模板序列)在本文所公开的基因编辑系统中充当RT多肽介导的逆转录的模板。在一些实施例中,逆转录模板序列包括具有至少一个经编码的编辑的序列。在一些实施例中,逆转录模板序列包括与靶序列或其具有至少一个经编码的编辑的互补区的序列同源性。在一些实施例中,逆转录模板序列的长度为至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少30个核苷酸、至少40个核苷酸、至少50个核苷酸、至少60个核苷酸、至少70个核苷酸、至少80个核苷酸、至少90个核苷酸、至少100个核苷酸、至少200个核苷酸、至少300个核苷酸、至少400个核苷酸或至少500个核苷酸。在一些实施例中,逆转录模板序列的长度为约10个核苷酸、20个核苷酸、30个核苷酸、40个核苷酸、50个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、100个核苷酸、110个核苷酸或120个核苷酸或其间的任何长度。
在一些实施例中,逆转录模板序列的长度为约25个核苷酸。在一些实施例中,逆转录模板序列的长度为约26个核苷酸。在一些实施例中,逆转录模板序列的长度为约27个核苷酸。在一些实施例中,逆转录模板序列的长度为约28个核苷酸。在一些实施例中,逆转录模板序列的长度为约29个核苷酸。在一些实施例中,逆转录模板序列的长度为约30个核苷酸。在一些实施例中,逆转录模板序列的长度为约31个核苷酸。在一些实施例中,逆转录模板序列的长度为约32个核苷酸。在一些实施例中,逆转录模板序列的长度为约33个核苷酸。在一些实施例中,逆转录模板序列的长度为约34个核苷酸。在一些实施例中,逆转录模板序列的长度为约35个核苷酸。在一些实施例中,逆转录模板序列的长度为约36个核苷酸。在一些实施例中,逆转录模板序列的长度为约37个核苷酸。在一些实施例中,逆转录模板序列的长度为约38个核苷酸。在一些实施例中,逆转录模板序列的长度为约39个核苷酸。在一些实施例中,逆转录模板序列的长度为约40个核苷酸。在一些实施例中,逆转录模板序列的长度为约41个核苷酸。在一些实施例中,逆转录模板序列的长度为约42个核苷酸。在一些实施例中,逆转录模板序列的长度为约43个核苷酸。在一些实施例中,逆转录模板序列的长度为约44个核苷酸。在一些实施例中,逆转录模板序列的长度为约45个核苷酸。在一些实施例中,逆转录模板序列的长度为约46个核苷酸。在一些实施例中,逆转录模板序列的长度为约47个核苷酸。在一些实施例中,逆转录模板序列的长度为约48个核苷酸。在一些实施例中,逆转录模板序列的长度为约49个核苷酸。在一些实施例中,逆转录模板序列的长度为约50个核苷酸。
在一些实施例中,逆转录模板序列包括相对于靶序列的至少一个经编码的编辑。在其它实施例中,逆转录模板序列包括相对于靶序列的互补区的至少一个经编码的编辑。在一些实施例中,至少一个经编码的编辑包括至少一个取代、插入和/或缺失。在一些实施例中,靶序列中的编辑包括相对于靶序列的序列的取代、插入和/或缺失。在一些实施例中,逆转录模板序列包括至少一个LoxP位点。
在一些实施例中,编辑可以是单核苷酸或多核苷酸取代,如G至T取代、G至A取代、G至C取代、T至G取代、T至A取代、T至C取代、C至G取代、C至T取代、C至A取代、A至T取代、A至G取代或A至C取代。在一些实施例中,序列的改变可以将G:C碱基对转化为T:A碱基对、G:C碱基对转化为A:T碱基对,G:C碱基对转化为C:G碱基对、T:A碱基对转化为G:C碱基对、T:A碱基对转化为A:T碱基对、T:A碱基对转化为C:G碱基对、C:G碱基对转化为G:C碱基对、C:G碱基对转化为T:A碱基对、C:G碱基对转化为A:T碱基对、A:T碱基对转化为T:A碱基对、A:T碱基对转化为G:C碱基对或A:T碱基对转化为C:G碱基对。
在一些实施例中,单核苷酸或多核苷酸取代的长度包括至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少200个、至少300个、至少400个或至少500个核苷酸。在一些实施例中,取代的长度为1个核苷酸至约200个核苷酸,例如,长度为1个核苷酸至5个核苷酸、5个核苷酸至10个核苷酸、10个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、20个核苷酸至25个核苷酸、25个核苷酸至30个核苷酸、30个核苷酸至35个核苷酸、35个核苷酸至40个核苷酸、40个核苷酸至45个核苷酸、45个核苷酸至50个核苷酸、50个核苷酸至55个核苷酸、55个核苷酸至60个核苷酸、60个核苷酸至65个核苷酸、65个核苷酸至70个核苷酸、70个核苷酸至75个核苷酸、75个核苷酸至80个核苷酸、80个核苷酸至85个核苷酸、85个核苷酸至90个核苷酸、90个核苷酸至95个核苷酸、95个核苷酸至100个核苷酸、100个核苷酸至105个核苷酸、105个核苷酸至110个核苷酸、110个核苷酸至115个核苷酸、115个核苷酸至120个核苷酸、120个核苷酸至125个核苷酸、125个核苷酸至130个核苷酸、130个核苷酸至135个核苷酸、135个核苷酸至140个核苷酸、140个核苷酸至145个核苷酸、145个核苷酸至150个核苷酸、150个核苷酸至155个核苷酸、155个核苷酸至160个核苷酸、160个核苷酸至165个核苷酸、165个核苷酸至170个核苷酸、170个核苷酸至175个核苷酸、175个核苷酸至180个核苷酸、180个核苷酸至185个核苷酸、185个核苷酸至190个核苷酸、190个核苷酸至195个核苷酸或195个核苷酸至200个核苷酸。在一些实施例中,取代的长度为1个核苷酸至约300个核苷酸,例如,长度为1个核苷酸至5个核苷酸、5个核苷酸至10个核苷酸、10个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、20个核苷酸至25个核苷酸、25个核苷酸至30个核苷酸、30个核苷酸至35个核苷酸、35个核苷酸至40个核苷酸、40个核苷酸至45个核苷酸、45个核苷酸至50个核苷酸、50个核苷酸至55个核苷酸、55个核苷酸至60个核苷酸、60个核苷酸至65个核苷酸、65个核苷酸至70个核苷酸、70个核苷酸至75个核苷酸、75个核苷酸至80个核苷酸、80个核苷酸至85个核苷酸、85个核苷酸至90个核苷酸、90个核苷酸至95个核苷酸、95个核苷酸至100个核苷酸、100个核苷酸至105个核苷酸、105个核苷酸至110个核苷酸、110个核苷酸至115个核苷酸、115个核苷酸至120个核苷酸、120个核苷酸至125个核苷酸、125个核苷酸至130个核苷酸、130个核苷酸至135个核苷酸、135个核苷酸至140个核苷酸、140个核苷酸至145个核苷酸、145个核苷酸至150个核苷酸、150个核苷酸至155个核苷酸、155个核苷酸至160个核苷酸、160个核苷酸至165个核苷酸、165个核苷酸至170个核苷酸、170个核苷酸至175个核苷酸、175个核苷酸至180个核苷酸、180个核苷酸至185个核苷酸、185个核苷酸至190个核苷酸、190个核苷酸至195个核苷酸、195个核苷酸至200个核苷酸、200个核苷酸至210个核苷酸、210个核苷酸至220个核苷酸、220个核苷酸至230个核苷酸、230个核苷酸至240个核苷酸、240个核苷酸至250个核苷酸、250个核苷酸至260个核苷酸、260个核苷酸至270个核苷酸、270个核苷酸至280个核苷酸、280个核苷酸至290个核苷酸或290个核苷酸至300个核苷酸。在一些实施例中,取代的长度为至多约10,000个碱基(10kb)。例如,在一些实施例中,取代的长度为1个碱基、约10个碱基、约20个碱基、约30个碱基、约40个碱基、约50个碱基、约60个碱基、约70个碱基、约80个碱基、约90个碱基、约100个碱基、约200个碱基、约300个碱基、约400个碱基、约500个碱基、约600个碱基、约700个碱基、约800个碱基、约900个碱基、约1kb、约1.1kb、约1.2kb、约1.3kb、约1.4kb、约1.5kb、约1.6kb、约1.7kb、约1.8kb、约1.9kb、约2kb、约2.1kb、约2.2kb、约2.3kb、约2.4kb、约2.5kb、约2.6kb、约2.7kb、约2.8kb、约2.9kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb或10kb。
在一些实施例中,编辑包括长度为至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少200个、至少300个、至少400个或至少500个核苷酸的单核苷酸或多核苷酸插入。在一些实施例中,单核苷酸或多核苷酸插入的长度为1个核苷酸至约200个核苷酸,例如,长度为1个核苷酸至5个核苷酸、5个核苷酸至10个核苷酸、10个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、20个核苷酸至25个核苷酸、25个核苷酸至30个核苷酸、30个核苷酸至35个核苷酸、35个核苷酸至40个核苷酸、40个核苷酸至45个核苷酸、45个核苷酸至50个核苷酸、50个核苷酸至55个核苷酸、55个核苷酸至60个核苷酸、60个核苷酸至65个核苷酸、65个核苷酸至70个核苷酸、70个核苷酸至75个核苷酸、75个核苷酸至80个核苷酸、80个核苷酸至85个核苷酸、85个核苷酸至90个核苷酸、90个核苷酸至95个核苷酸、95个核苷酸至100个核苷酸、100个核苷酸至105个核苷酸、105个核苷酸至110个核苷酸、110个核苷酸至115个核苷酸、115个核苷酸至120个核苷酸、120个核苷酸至125个核苷酸、125个核苷酸至130个核苷酸、130个核苷酸至135个核苷酸、135个核苷酸至140个核苷酸、140个核苷酸至145个核苷酸、145个核苷酸至150个核苷酸、150个核苷酸至155个核苷酸、155个核苷酸至160个核苷酸、160个核苷酸至165个核苷酸、165个核苷酸至170个核苷酸、170个核苷酸至175个核苷酸、175个核苷酸至180个核苷酸、180个核苷酸至185个核苷酸、185个核苷酸至190个核苷酸、190个核苷酸至195个核苷酸或195个核苷酸至200个核苷酸。在一些实施例中,单核苷酸或多核苷酸插入的长度为1个核苷酸至约300个核苷酸,例如,长度为1个核苷酸至5个核苷酸、5个核苷酸至10个核苷酸、10个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、20个核苷酸至25个核苷酸、25个核苷酸至30个核苷酸、30个核苷酸至35个核苷酸、35个核苷酸至40个核苷酸、40个核苷酸至45个核苷酸、45个核苷酸至50个核苷酸、50个核苷酸至55个核苷酸、55个核苷酸至60个核苷酸、60个核苷酸至65个核苷酸、65个核苷酸至70个核苷酸、70个核苷酸至75个核苷酸、75个核苷酸至80个核苷酸、80个核苷酸至85个核苷酸、85个核苷酸至90个核苷酸、90个核苷酸至95个核苷酸、95个核苷酸至100个核苷酸、100个核苷酸至105个核苷酸、105个核苷酸至110个核苷酸、110个核苷酸至115个核苷酸、115个核苷酸至120个核苷酸、120个核苷酸至125个核苷酸、125个核苷酸至130个核苷酸、130个核苷酸至135个核苷酸、135个核苷酸至140个核苷酸、140个核苷酸至145个核苷酸、145个核苷酸至150个核苷酸、150个核苷酸至155个核苷酸、155个核苷酸至160个核苷酸、160个核苷酸至165个核苷酸、165个核苷酸至170个核苷酸、170个核苷酸至175个核苷酸、175个核苷酸至180个核苷酸、180个核苷酸至185个核苷酸、185个核苷酸至190个核苷酸、190个核苷酸至195个核苷酸、195个核苷酸至200个核苷酸、200个核苷酸至210个核苷酸、210个核苷酸至220个核苷酸、220个核苷酸至230个核苷酸、230个核苷酸至240个核苷酸、240个核苷酸至250个核苷酸、250个核苷酸至260个核苷酸、260个核苷酸至270个核苷酸、270个核苷酸至280个核苷酸、280个核苷酸至290个核苷酸或290个核苷酸至300个核苷酸。在一些实施例中,单核苷酸或多核苷酸插入的长度为至多约10,000个碱基(10kb)。例如,在一些实施例中,插入的长度为1个碱基、约10个碱基、约20个碱基、约30个碱基、约40个碱基、约50个碱基、约60个碱基、约70个碱基、约80个碱基、约90个碱基、约100个碱基、约200个碱基、约300个碱基、约400个碱基、约500个碱基、约600个碱基、约700个碱基、约800个碱基、约900个碱基、约1kb、约1.1kb、约1.2kb、约1.3kb、约1.4kb、约1.5kb、约1.6kb、约1.7kb、约1.8kb、约1.9kb、约2kb、约2.1kb、约2.2kb、约2.3kb、约2.4kb、约2.5kb、约2.6kb、约2.7kb、约2.8kb、约2.9kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb或10kb。
在一些实施例中,编辑包括长度为至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少200个、至少300个、至少400个或至少500个核苷酸的单核苷酸或多核苷酸缺失。在一些实施例中,单核苷酸或多核苷酸缺失的长度为1个核苷酸至约200个核苷酸,例如,长度为1个核苷酸至5个核苷酸、5个核苷酸至10个核苷酸、10个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、20个核苷酸至25个核苷酸、25个核苷酸至30个核苷酸、30个核苷酸至35个核苷酸、35个核苷酸至40个核苷酸、40个核苷酸至45个核苷酸、45个核苷酸至50个核苷酸、50个核苷酸至55个核苷酸、55个核苷酸至60个核苷酸、60个核苷酸至65个核苷酸、65个核苷酸至70个核苷酸、70个核苷酸至75个核苷酸、75个核苷酸至80个核苷酸、80个核苷酸至85个核苷酸、85个核苷酸至90个核苷酸、90个核苷酸至95个核苷酸、95个核苷酸至100个核苷酸、100个核苷酸至105个核苷酸、105个核苷酸至110个核苷酸、110个核苷酸至115个核苷酸、115个核苷酸至120个核苷酸、120个核苷酸至125个核苷酸、125个核苷酸至130个核苷酸、130个核苷酸至135个核苷酸、135个核苷酸至140个核苷酸、140个核苷酸至145个核苷酸、145个核苷酸至150个核苷酸、150个核苷酸至155个核苷酸、155个核苷酸至160个核苷酸、160个核苷酸至165个核苷酸、165个核苷酸至170个核苷酸、170个核苷酸至175个核苷酸、175个核苷酸至180个核苷酸、180个核苷酸至185个核苷酸、185个核苷酸至190个核苷酸、190个核苷酸至195个核苷酸或195个核苷酸至200个核苷酸。在一些实施例中,单核苷酸或多核苷酸缺失的长度为1个核苷酸至约300个核苷酸,例如,长度为1个核苷酸至5个核苷酸、5个核苷酸至10个核苷酸、10个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、20个核苷酸至25个核苷酸、25个核苷酸至30个核苷酸、30个核苷酸至35个核苷酸、35个核苷酸至40个核苷酸、40个核苷酸至45个核苷酸、45个核苷酸至50个核苷酸、50个核苷酸至55个核苷酸、55个核苷酸至60个核苷酸、60个核苷酸至65个核苷酸、65个核苷酸至70个核苷酸、70个核苷酸至75个核苷酸、75个核苷酸至80个核苷酸、80个核苷酸至85个核苷酸、85个核苷酸至90个核苷酸、90个核苷酸至95个核苷酸、95个核苷酸至100个核苷酸、100个核苷酸至105个核苷酸、105个核苷酸至110个核苷酸、110个核苷酸至115个核苷酸、115个核苷酸至120个核苷酸、120个核苷酸至125个核苷酸、125个核苷酸至130个核苷酸、130个核苷酸至135个核苷酸、135个核苷酸至140个核苷酸、140个核苷酸至145个核苷酸、145个核苷酸至150个核苷酸、150个核苷酸至155个核苷酸、155个核苷酸至160个核苷酸、160个核苷酸至165个核苷酸、165个核苷酸至170个核苷酸、170个核苷酸至175个核苷酸、175个核苷酸至180个核苷酸、180个核苷酸至185个核苷酸、185个核苷酸至190个核苷酸、190个核苷酸至195个核苷酸、195个核苷酸至200个核苷酸、200个核苷酸至210个核苷酸、210个核苷酸至220个核苷酸、220个核苷酸至230个核苷酸、230个核苷酸至240个核苷酸、240个核苷酸至250个核苷酸、250个核苷酸至260个核苷酸、260个核苷酸至270个核苷酸、270个核苷酸至280个核苷酸、280个核苷酸至290个核苷酸或290个核苷酸至300个核苷酸。在一些实施例中,缺失的长度为至多约10,000个碱基(10kb)。例如,在一些实施例中,缺失的长度为1个碱基、约10个碱基、约20个碱基、约30个碱基、约40个碱基、约50个碱基、约60个碱基、约70个碱基、约80个碱基、约90个碱基、约100个碱基、约200个碱基、约300个碱基、约400个碱基、约500个碱基、约600个碱基、约700个碱基、约800个碱基、约900个碱基、约1kb、约1.1kb、约1.2kb、约1.3kb、约1.4kb、约1.5kb、约1.6kb、约1.7kb、约1.8kb、约1.9kb、约2kb、约2.1kb、约2.2kb、约2.3kb、约2.4kb、约2.5kb、约2.6kb、约2.7kb、约2.8kb、约2.9kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb或10kb。
在一些实施例中,逆转录模板序列包括至少一个经编码的编辑,并且长度为约5个核苷酸至约10,000个核苷酸,例如,长度为5个核苷酸至10个核苷酸、10个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、20个核苷酸至25个核苷酸、25个核苷酸至30个核苷酸、30个核苷酸至35个核苷酸、35个核苷酸至40个核苷酸、40个核苷酸至45个核苷酸、45个核苷酸至50个核苷酸、50个核苷酸至55个核苷酸、55个核苷酸至60个核苷酸、60个核苷酸至65个核苷酸、65个核苷酸至70个核苷酸、70个核苷酸至75个核苷酸、75个核苷酸至80个核苷酸、80个核苷酸至85个核苷酸、85个核苷酸至90个核苷酸、90个核苷酸至95个核苷酸、95个核苷酸至100个核苷酸、100个核苷酸至105个核苷酸、105个核苷酸至110个核苷酸、110个核苷酸至115个核苷酸、115个核苷酸至120个核苷酸、120个核苷酸至125个核苷酸、125个核苷酸至130个核苷酸、130个核苷酸至135个核苷酸、135个核苷酸至140个核苷酸、140个核苷酸至145个核苷酸、145个核苷酸至150个核苷酸、150个核苷酸至155个核苷酸、155个核苷酸至160个核苷酸、160个核苷酸至165个核苷酸、165个核苷酸至170个核苷酸、170个核苷酸至175个核苷酸、175个核苷酸至180个核苷酸、180个核苷酸至185个核苷酸、185个核苷酸至190个核苷酸、190个核苷酸至195个核苷酸、195个核苷酸至200个核苷酸、200个核苷酸至210个核苷酸、210个核苷酸至220个核苷酸、220个核苷酸至230个核苷酸、230个核苷酸至240个核苷酸、240个核苷酸至250个核苷酸、250个核苷酸至260个核苷酸、260个核苷酸至270个核苷酸、270个核苷酸至280个核苷酸、280个核苷酸至290个核苷酸或290个核苷酸至300个核苷酸,或约1千碱基(kb)、约1.1kb、约1.2kb、约1.3kb、约1.4kb、约1.5kb、约1.6kb、约1.7kb、约1.8kb、约1.9kb、约2kb、约2.1kb、约2.2kb、约2.3kb、约2.4kb、约2.5kb、约2.6kb、约2.7kb、约2.8kb、约2.9kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb或10kb。
逆转录模板序列可以通过本文所描述的基因编辑系统的逆转录酶转录到DNA中。在一些实施例中,逆转录模板序列从5'至3'转录到PAM链的DNA中。在一些实施例中,逆转录模板序列从5'至3'转录到非PAM链的DNA中。在一些实施例中,逆转录模板序列从5'至3'转录到PAM链的DNA中。在一些实施例中,逆转录模板序列从5'至3'转录到非PAM链的DNA中。在一些实施例中,逆转录模板序列是PBS的5'。在一些实施例中,逆转录模板序列是PBS的3'。在一些实施例中,逆转录模板序列通过来自PBS的3'延伸部被转录到PAM链的DNA中。在一些实施例中,逆转录模板序列通过来自PBS的3'延伸部被转录到非PAM链的DNA中。
iii.另外的要素
在一些实施例中,编辑模板RNA可以包括一个或多个另外的要素。例如,编辑模板RNA或其gRNA和/或RT供体RNA可以在RNA分子的任一端或两端处包括一个或多个保护片段。可替代地或另外,编辑模板RNA或其gRNA和/或RT供体RNA可以包括RNA分子内部的另外的要素(例如,在编辑模板RNA中的序列中的一个或多个序列之间,例如,在PBS与逆转录模板序列,例如接头之间)。在一些实施例中,编辑模板RNA包括编辑模板RNA中的一个或多个序列之间的另外的要素,例如,RNA向导(核酸酶结合序列或DNA结合序列)或RT供体RNA(PBS或逆转录模板序列)。
在一些实施例中,编辑模板RNA在一个或多个端处包括另外的要素,例如直接重复序列。在一些实施例中,直接重复序列可以募集CRISPR核酸酶(例如,V型核酸酶,如变体Cas12i2多肽或变体Cas12i2-逆转录酶融合多肽,或Cas12i4-逆转录酶融合多肽)。
在一些实施例中,另外的要素的长度为至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少30个核苷酸、至少40个核苷酸、至少50个核苷酸、至少60个核苷酸、至少70个核苷酸、至少80个核苷酸、至少90个核苷酸、至少100个核苷酸、至少200个核苷酸、至少300个核苷酸、至少400个核苷酸或至少500个核苷酸。
在一些实例中,编辑模板RNA可以包括任选的核苷酸接头。此类任选的核苷酸接头序列的长度可以为至少3个核苷酸、至少4个核苷酸、至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少30个核苷酸、至少40个核苷酸、至少50个核苷酸、至少60个核苷酸、至少70个核苷酸、至少80个核苷酸、至少90个核苷酸、至少100个核苷酸、至少200个核苷酸、至少300个核苷酸、至少400个核苷酸或至少500个核苷酸。在一些实施例中,任选的核苷酸接头位于任何核酸酶结合序列、DNA结合序列、PBS和/或逆转录模板序列之间。
在一些实例中,编辑模板RNA的5'端和/或3'端,或其gRNA和/或RT供体RNA可以含有保护片段,所述保护片段可以增强RNA分子对核酸外切酶活性的抗性。参见例如,图11。在一些情况下,端保护片段可以包括能够形成次级结构如发夹、假结或三链体结构的核苷酸序列。在其它情况下,端保护片段可以包括核糖核酸外切酶抗性RNA(xrRNA)、转移RNA(tRNA)或截短的tRNA的序列。在一些实施例中,修饰是寨卡样假结(Zika-likepseudoknot)、鼠类白血病病毒假结(MLV-PK)序列、红三叶草坏死花叶病毒(RCNMV)序列、草木樨坏死花叶病毒(SCNMV)序列、香石竹环斑病毒(CRSV)序列、preQ序列或RNA噬菌体MS2序列。在具体实例中,端保护片段可以包括一个或多个CRISPR核酸酶结合位点(例如,Cas12i多肽如Cas12i2多肽的结合位点),以及任选地一个或多个与任何人序列不共享同源性的区段(例如,间隔子)。在一些情况下,一个或多个区段与与人类基因组的任何序列不超过85%相同的序列结合。参见图10、图11、图12A和图12B。此类端保护片段可以募集包含在相同基因编辑系统中的CRISPR核酸酶来抑制核糖核酸外切酶活性,而不诱导脱靶基因编辑。
在一些实施例中,如本文所公开的基因编辑系统包括至少一个编辑模板RNA(例如,基因编辑RNA)或编码此类编辑模板RNA的核苷酸序列。在一些实例中,至少一个编辑模板RNA能够与CRISPR核酸酶(例如,V型CRISPR核酸酶)结合。在一些实例中,至少一个编辑模板RNA进一步能够与核酸(例如,DNA或靶核酸)结合。在一些实例中,至少一个编辑模板RNA包括核酸酶结合序列(例如,一个或多个可被CRISPR核酸酶识别的结合位点)和DNA结合序列(例如,间隔子)。在一些情况下,至少一个编辑模板RNA包括gRNA(包括核酸酶结合序列和间隔子)和RT供体RNA。在一些实施例中,编辑模板RNA包括与RT供体RNA连接的RNA向导。参见例如,图19B。
iv.核酸修饰
如本文所公开的基因编辑系统中的任何RNA组分,例如,编辑模板RNA、RNA向导、RT供体RNA,可以包含一个或多个修饰。
示例性修饰可以包含对糖、核碱基、核苷间键(例如,对连接磷酸/对磷酸二酯键/对磷酸二酯主链)的任何修饰,以及其任何组合。下文详细描述了本文所提供的一些示例性修饰。
RNA向导或任何编码组合物的组分的核酸序列可以包含如对糖、核碱基或核苷间键(例如,对连接磷酸酯、对磷酸二酯键、对磷酸二酯主链)的任何可用修饰。嘧啶核碱基的一个或多个原子可以被任选地经取代的氨基、任选地经取代的硫醇、任选地经取代的烷基(例如,甲基或乙基)或卤基(例如,氯基或氟基)置换或取代。在某些实施例中,修饰(例如,一个或多个修饰)存在于糖和核苷间键中的每一种中。修饰可以是核糖核酸(RNA)对脱氧核糖核酸(DNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA)或其杂交体的修饰。本文描述了另外的修饰。
在一些实施例中,修饰可以包含化学修饰或细胞诱导的修饰。例如,Lewis和Pan在《分子细胞生物学自然综述(Nat Reviews Mol Cell Biol)》,2017,18:202-210的“RNA修饰和结构配合向导RNA-蛋白质相互作用(RNA modifications and structures cooperateto guide RNA-protein interactions)”中描述了细胞内RNA修饰的一些非限制性实例。
不同的糖修饰、核苷酸修饰和/或核苷间键(例如,主链结构)可以存在于序列中的不同位置。本领域普通技术人员将理解,核苷酸类似物或其它修饰可以位于序列的任何位置,使得序列的功能基本上不会降低。序列可以包含约1%至约100%经修饰的核苷酸(相对于总核苷酸含量,或相对于一种或多种类型的核苷酸,即A、G、U或C中的任一种或多种)或任何中间百分比(例如,1%至20%>、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%和95%至100%)。
在一些实施例中,糖修饰(例如,位于2'位置或4'位置处)或序列的一个或多个核糖核苷酸处的糖的置换,以及主链修饰可以包含磷酸二酯键的修饰或置换。序列的具体实例包含但不限于包含经修饰的主链或无天然核苷间键的序列,如核苷间修饰,包含磷酸二酯键的修饰或置换。除此之外,具有经修饰的主链的序列包含在主链中不具有磷原子的那些。出于本申请的目的,并且如本领域中有时提及的,在其核苷间主链中不具有磷原子的经修饰的RNA也可以被视为寡核苷。在特定实施例中,序列将包含在其核苷间主链中具有磷原子的核糖核苷酸。
经修饰的序列主链可以包含例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其它烷基膦酸酯,如3'-亚烷基膦酸酯和手性膦酸酯、次膦酸酯、磷酰胺酯,如3'-氨基磷酰胺酯和氨基烷基磷酸胺酯、硫代羰基磷酰胺酯、硫代羰基烷基膦酸酯、硫代羰基烷基磷酸三酯、以及具有正常3'-5'键的硼烷磷酸酯、这些酯的2'-5'连接类似物、以及具有反向极性的那些酯,其中相邻对的核苷单位以3'-5'至5'-3'或2'-5'至5'-2'连接。也包含了各种盐、混合盐和游离酸形式。在一些实施例中,序列可以带负电荷或带正电荷。
可以并入到序列中的经修饰的核苷酸可以在核苷间键(例如,磷酸酯主链)上进行修饰。本文中,在多核苷酸主链的上下文中,短语“磷酸酯”和“磷酸二酯”可互换使用。主链磷酸酯基团可以通过用不同的取代基置换氧原子中的一个或多个氧原子来修饰。进一步地,经修饰的核苷和核苷酸可以包含用如本文所描述的另一个核苷间键大规模置换未经修饰的磷酸酯部分。经修饰的磷酸酯基团的实例包含但不限于硫代磷酸酯、硒代磷酸酯、硼代磷酸酯(boranophosphates)、硼代磷酸酯(boranophosphate esters)、磷酸氢酯、磷酰胺酯、磷酸二酰胺酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的两个非连接氧都被硫置换。磷酸酯接头还可以通过用氮(桥接的磷酰胺酯)、硫(桥接的硫代磷酸酯)和碳(桥接的亚甲基膦酸酯)置换连接氧来修饰。
经α-硫代取代的磷酸酯部分通过非天然硫代磷酸酯主链键赋予RNA和DNA聚合物稳定性。硫代磷酸酯DNA和RNA具有增加的核酸酶抗性,并且因此在细胞环境中具有更长的半衰期。
在具体实施例中,经修饰的核苷包含α-硫代-核苷(例如,5'-O-(1-硫代磷酸酯)-腺苷、5'-O-(1-硫代磷酸酯)-胞苷(a-硫代胞苷)、5'-O-(1-硫代磷酸酯)-鸟苷、5'-O-(1-硫代磷酸酯)-尿苷或5'-O-(1-硫代磷酸酯)-假尿苷)。
本文描述了根据本发明可以采用的其它核苷间键,包含不含磷原子的核苷间键。
在一些实施例中,序列可以包含一个或多个细胞毒性核苷。例如,细胞毒性核苷可以并入到序列中,如双官能修饰。细胞毒性核苷可以包含但不限于腺苷阿拉伯糖苷、5-氮杂胞苷、4'-硫代-阿糖胞苷、环戊烯基胞嘧啶、克拉屈滨(cladribine)、氯法拉滨(clofarabine)、阿糖胞苷、胞嘧啶阿拉伯糖苷、1-(2-C-氰基-2-脱氧-β-D-阿拉伯糖-呋喃戊糖基)-胞嘧啶、地西他滨(decitabine)、5-氟尿嘧啶、氟达拉滨(fludarabine)、氟尿苷(floxuridine)、吉西他滨(gemcitabine)、替加氟(tegafur)和尿嘧啶的组合、替加氟((RS)-5-氟-1-(四氢呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他滨(troxacitabine)、替扎他滨(tezacitabine)、2'-脱氧-2'-亚甲基胞苷(DMDC)和6-巯基嘌呤。另外的实例包含磷酸氟达拉滨、N4-山嵛酰基-1-β-D-阿拉伯糖呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-阿拉伯糖呋喃糖基胞嘧啶、N4-棕榈酰基-1-(2-C-氰基-2-脱氧-β-D-阿拉伯糖-呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5'-反油酸酯)。
在一些实施例中,序列包含一个或多个转录后修饰(例如,封端、切割、聚腺苷酸化、剪接、poly-A序列、甲基化、酰化、磷酸化、赖氨酸和精氨酸残基的甲基化、乙酰化以及硫醇基和酪氨酸残基的亚硝基化等)。一个或多个转录后修饰可以是任何转录后修饰,如在RNA中已经鉴定的多于一百种的不同核苷修饰中的任一种核苷修饰(Rozenski,J,Crain,P和McCloskey,J.(1999).RNA修饰数据库:1999新版(The RNA Modification Database:1999update).《核酸研究》27:196-197)。在一些实施例中,第一分离的核酸包括信使RNA(mRNA)。在一些实施例中,mRNA包括至少一种选自由以下组成的组的核苷:吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酰甲基尿苷、1-牛磺酰甲基-假尿苷、5-牛磺酰甲基-2-硫代-尿苷、1-牛磺酰甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷以及4-甲氧基-2-硫代-假尿苷。在一些实施例中,mRNA包括至少一种选自由以下组成的组的核苷:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟甲基胞苷、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮-假异胞苷、1-甲基-1-脱氮-假异胞苷、折布拉林(zebularine)、5-氮杂-折布拉林、5-甲基-折布拉林、5-氮杂-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷以及4-甲氧基-1-甲基-假异胞苷。在一些实施例中,mRNA包括至少一种选自由以下组成的组的核苷:2-氨基嘌呤、2,6-二氨基嘌呤、7-脱氮-腺嘌呤、7-脱氮-8-氮杂-腺嘌呤、7-脱氮-2-氨基嘌呤、7-脱氮-8-氮杂-2-氨基嘌呤、7-脱氮-2,6-二氨基嘌呤、7-脱氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺式-羟基异戊烯基)腺苷、2-甲硫基-N6-(顺式-羟基异戊烯基)腺苷、N6-甘氨酰氨基甲酰基腺苷、N6-苏氨酰氨基甲酰基腺苷、2-甲硫基-N6-苏氨酰氨基甲酰基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲硫基-腺嘌呤以及2-甲氧基-腺嘌呤。在一些实施例中,mRNA包括至少一种选自由以下组成的组的核苷:肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-脱氮-鸟苷、7-脱氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮-鸟苷、6-硫代-7-脱氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷以及N2,N2-二甲基-6-硫代-鸟苷。
序列可以或可以不沿着分子的全长被一致地修饰。例如,一种或多种或所有类型的核苷酸(例如,天然存在的核苷酸、嘌呤或嘧啶,或A、G、U、C、I、pU中的任一种或多种或全部)可以或可以不在序列中或在其给定的预定序列区中被均匀地修饰。在一些实施例中,序列包含假尿苷。在一些实施例中,序列包含肌苷,所述肌苷可以有助于免疫系统将所述序列表征为相对于病毒RNA为内源性的。肌苷的并入也可以介导RNA稳定性的提高/降解的减少。参见例如,Yu,Z.等人,(2015)ADAR1的RNA编辑将dsRNA标记为“自我”(RNA editing byADAR1 marks dsRNA as“self”).《细胞研究(Cell Res.)》25,1283-1284,所述文献通过引用以其整体并入。
在一些实施例中,本文所描述的任何RNA序列,如编辑模板RNA可以包括端修饰(例如,5'端修饰或3'端修饰)。在一些实施例中,端修饰是化学修饰。在一些实施例中,端修饰是结构修饰。参见本文的公开内容。
当本文所公开的基因编辑系统包括编码CRISPR核酸酶和/或RT多肽的核酸,例如,mRNA分子时,在适用的情况下,此类核酸分子可以含有本文所公开的任何修饰。
D.示例性基因编辑系统
本文所描述的示例性基因编辑系统仅仅是说明性的。
在一些实施例中,示例性基因编辑系统在图1A和图1B中描绘。在这些示例性设计中,RNA向导可以包括3'融合配偶体,其可以包括RT供体RNA(包括PBS和逆转录模板序列)、本文所公开的任何另外的要素或其组合。在一些情况下,PBS的长度为约3个至约24个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个或24个核苷酸)。可替代地或另外,PBS可以与可以位于PAM链上的对应的靶向PBS的位点具有至少约75%互补性。在一些实施例中,逆转录模板序列的长度为约10个核苷酸至约100个核苷酸(例如,约10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个或100个核苷酸)。在一些实施例中,接头存在于RNA向导中的DNA结合序列(间隔子)与逆转录模板序列之间。在一些实例中,接头包括一个或多个发夹。例如,发夹可以减少PBS与DNA结合序列之间的退火。
在一些情况下,示例性基因编辑系统中的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)可以包括N末端或C末端融合配偶体。在一些实施例中,N末端或C末端融合配偶体包括逆转录酶多肽。
在其它实施例中,如本文所公开的示例性基因编辑系统在图2描绘。在这些示例性设计中,RNA向导可以包括5'融合配偶体,其可以包括RT供体RNA(包括PBS和逆转录模板序列)、另外的要素中的一个或多个要素或其组合。在一些实施例中,逆转录模板序列的长度为约10个核苷酸至约100个核苷酸(例如,约10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个或100个核苷酸)。在一些实施例中,PBS的长度为约3个核苷酸至约24个核苷酸(例如,约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个或24个核苷酸)。可替代地或另外,PBS与可以位于PAM链上的对应的靶向PBS的位点具有至少约75%互补性。在一些实施例中,接头存在于RNA向导的DNA结合序列与PBS之间。在一些实例中,接头包括一个或多个发夹。例如,发夹可以减少PBS与DNA结合序列之间的退火。
在一些情况下,示例性基因编辑系统中的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)可以包括N末端或C末端融合配偶体。在一些实施例中,N末端或C末端融合配偶体包括逆转录酶多肽。
在图1A、图1B和图2中描绘的示例性基因编辑系统可以用于编辑靶核酸(例如,所关注的基因组位点)的PAM链。不希望受理论束缚,使用这些示例性的基因编辑系统图1A、图1B和图2,在被CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)切割期间,PAM链的游离3'端可以与PBS碱基配对,使用逆转录模板序列作为模板延伸,并且链交换回与互补基因组链碱基配对,从而导致编辑并入。
在又其它实施例中,本文所公开的示例性基因编辑系统在图3中描绘。此类示例性基因编辑系统包括两种RNA分子:包括核酸酶结合序列和DNA结合序列(间隔子)的RNA向导和RT供体RNA。RT供体RNA可以包括PBS和逆转录模板序列。在一些实例中,逆转录模板序列不编码编辑。在其它实例中,RT供体RNA包括PBS和编码编辑的逆转录模板序列。在一些实施例中,逆转录模板序列或其部分可以通过碱基配对与靶核酸结合。
在一些情况下,PBS的长度为至多约100个核苷酸。在一些实施例中,PBS的长度为约3个核苷酸至约100个核苷酸。在一些实施例中,逆转录模板序列的长度为约10个核苷酸至约100个核苷酸。在一些实施例中,RT供体RNA的逆转录模板序列在5'端处包括适体。在一些实施例中,适体募集逆转录酶多肽。在一些实施例中,RT供体RNA的PBS不与编辑模板RNA的任何其它部分(例如,核酸酶结合序列和/或DNA结合序列)互补。
在图3中描绘的示例性基因编辑系统可以包括一种或两种蛋白质组分。例如,示例性基因编辑系统可以包括具有N末端或C末端融合配偶体的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),其可以包括逆转录酶多肽。可替代地,基因编辑系统可以包括CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和逆转录酶多肽,作为两种单独的多肽。
在图3中描绘的示例性基因编辑系统可以用于编辑靶核酸(例如,所关注的基因组位点)的PAM链或非PAM链。不希望受理论束缚,使用此类示例性基因编辑系统,在CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)从靶核酸释放后,PAM链或非PAM链的游离3'端可以与PBS碱基配对,使用逆转录模板序列作为模板延伸,并且链交换回与互补基因组链杂交,从而导致并入来自RT供体RNA的编辑。示例性基因编辑系统可以用于在靶核酸的PAM远端区进行编辑。
在仍其它实施例中,本文所公开的示例性基因编辑系统在图4中描绘。此类示例性基因编辑系统可以包括作为两个单独的RNA分子的两种RNA分子:RNA向导和RT供体RNA。示例性基因编辑系统可以包括如本文所公开的一种或两种蛋白质组分。例如,示例性基因编辑系统可以包括具有N末端或C末端融合配偶体的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽),其可以包括逆转录酶多肽。可替代地,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和逆转录酶多肽不彼此融合(是两种单独的多肽)。
在图4中描绘的示例性基因编辑系统可以用于编辑PAM链或非PAM链。不希望受理论束缚,使用示例性基因编辑系统,PAM链或非PAM链的游离3'端可以在相同的基因编辑系统中与RT供体RNA的PBS碱基配对,使用逆转录模板序列作为模板延伸,并且链交换回与互补基因组链杂交,从而导致并入来自RT供体RNA的编辑。
在一些实施例中,本文所公开的示例性基因编辑系统在图5中描绘。在此类示例性基因编辑系统中,RNA向导可以包括3'融合配偶体,其可以包括RT供体RNA(包括逆转录模板序列和PBS)。在一些情况下,PBS结合靶序列的互补区上游的非PAM链上的位点。
在一些实例中,PBS的长度为约3个核苷酸至约100个核苷酸(例如,约3个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个或100个核苷酸)。在一些实施例中,DNA结合序列(间隔子)的长度为约20个核苷酸至约25个核苷酸。在一些实施例中,DNA结合序列包括并入来自PAM序列的约10个核苷酸至约25个核苷酸的至少一个编辑。
在一些实例中,示例性基因编辑系统可以包括包含5'融合或3'融合配偶体的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)。5'融合或3'融合配偶体可以包括逆转录酶多肽。在一些实施例中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)缺乏crRNA处理活性。
在图5中描绘的示例性基因编辑系统可以用于编辑靶核酸(例如,所关注的基因组位点)的非PAM链。不希望受理论束缚,使用此类示例性基因编辑系统,在被CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)切割期间,非PAM链的游离3'端可以与PBS碱基配对,并且使用DNA结合序列作为模板延伸。非PAM链上的RT延伸部交换回与互补基因组链碱基配对,从而导致并入来自RT供体RNA的编辑。
在一些实施例中,示例性基因编辑系统在图6A和图6B中描绘。在此类示例性基因编辑系统中,RNA向导可以包括3'融合配偶体,其可以包括RT供体RNA(包括逆转录模板序列和PBS)。在一些实施例中,PBS与位于PAM链上靶序列的互补区上游的非PAM链中的区互补。在一些实例中,发夹存在于在RNA向导的DNA结合序列与逆转录模板序列之间。在一些实施例中,发夹存在于逆转录模板序列内。在一些实施例中,模板序列中的编辑可以在并入了编辑的靶核酸中产生发夹。
在一些实例中,示例性基因编辑系统可以包括包含N末端或C末端融合配偶体的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)。N末端或C末端融合配偶体可以包括逆转录酶多肽。
在一些实施例中,示例性基因编辑系统在图7中描绘。在此类示例性基因编辑系统中,RNA向导可以包括5'融合配偶体,其可以包括RT供体RNA(包括PBS和逆转录模板序列)。在一些实施例中,PBS的长度为约5个至约20个核苷酸(例如,约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个核苷酸)。可替代地或另外,PBS与非PAM链上的区(对应的靶向PBS的位点)具有至少约75%互补性。在一些情况下,接头存在于RNA向导的核酸酶结合序列与RT供体RNA的PBS之间。可替代地或另外地,发夹可以存在于RNA向导的DNA结合序列与RT供体RNA的逆转录模板序列之间。在一些实施例中,发夹存在于逆转录模板序列内。在一些实施例中,模板序列中的编辑可以在并入了编辑的靶核酸中产生发夹。
在一些情况下,示例性基因编辑系统中的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)可以包括可以包括逆转录酶多肽的N末端或C末端融合配偶体。在一些实施例中,CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)缺乏crRNA处理活性(例如,本文所公开的那些)。
在图6A、图6B或图7中描绘的示例性基因编辑系统可以用于编辑靶核酸(例如,所关注的基因组位点)的非PAM链。不希望受理论束缚,使用示例性基因编辑系统,在被CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)切割期间,非PAM链的游离3'端可以与PBS碱基配对,并且使用逆转录模板序列作为模板延伸。非PAM链上的RT延伸部交换回与互补基因组链碱基配对,从而导致并入来自RT供体RNA的至少一个编辑。
本文所公开的示例性基因编辑系统,例如,在图6A、图6B和图7描绘的,可以用于在与PAM链上的靶序列互补的非PAM链上的区内并入至少一个PAM近端编辑。在一些实例中,示例性基因编辑系统可以用于修饰PAM序列和/或PAM序列上游的序列(例如,通过在与PAM序列和/或上游序列互补的区中引入变异)。此类示例性基因编辑系统可以用于防止相同CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)对所得经修饰的基因基因座进行再靶向。
在一些实施例中,本文所公开的示例性基因编辑系统在图10中描绘。在此类示例性基因编辑系统中,RNA向导可以包括3'融合配偶体,其可以包括RT供体RNA(包括PBS和逆转录模板序列)。可替代地,RNA向导可以包括5'融合配偶体,其可以包括RT供体RNA(包括逆转录模板序列和PBS)。PBS的长度可以是可变的。例如,PBS长的长度可以为约3个核苷酸至约16个核苷酸。在一些实例中,PBS能够与靶核酸(例如,所关注的基因组位点)的PAM链上的区,例如与靶序列重叠的区结合。在一些实例中,发夹存在于RNA向导的DNA结合序列与RT供体RNA的逆转录模板序列之间。RNA向导-逆转录模板序列的一端或两端可以包含保护片段,例如本文所公开的保护片段,以防止核酸外切酶或核酸内切酶活性。
示例性基因编辑系统可以包括可以包括N末端或C末端融合配偶体的CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)。在一些实例中,所述N末端或C末端融合配偶体包括逆转录酶多肽。在一些实例中,所述CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)缺乏crRNA处理活性。在一些实例中,所述CRISPR核酸酶是切口酶。在一些实例中,使用图10中所描绘的示例性基因编辑系统,将编辑并入到靶核酸的PAM链中。
图1-7、8A-C和10中描绘的示例性编辑模板RNA包括与RNA向导序列的3'端融合的RT供体RNA序列或与RNA向导序列的5'端融合的RT供体RNA序列,可以替代为包括与RNA向导序列的内部位置融合的RT供体RNA序列,反之亦然。例如,RT供体RNA可以与RNA向导、sgRNA或RNA向导-tracrRNA(例如,sgRNA)的内部位置融合。
延伸的RNA向导端(例如,通过RT供体RNA的5'延伸部或3'延伸部)可能易受核酸外切酶和/或核酸内切酶活性的影响,这降低了逆转录模板序列浓度以及编辑并入的效率。在一些实施例中,RNA向导-RT供体RNA融合体进一步包括添加的次级结构以抑制或防止核酸外切酶活性。在一些实施例中,添加的次级结构是三链体结构、假结、xrRNA、环状RNA、tRNA或截短的tRNA。在一些实施例中,添加的次级结构是寨卡样假结、鼠类白血病病毒假结(MLV-PK)序列、红三叶草坏死花叶病毒(RCNMV)序列、草木樨坏死花叶病毒(SCNMV)序列、香石竹环斑病毒(CRSV)序列、preQ序列或RNA噬菌体MS2序列。在一些实施例中,添加的次级结构是通过碱基堆积或3'端碱基配对。在其它实施例中,添加的次级结构是核酸酶结合序列或核酸酶结合序列和DNA结合序列。参见图10、图11、图12A和图12B。在一些实施例中,添加的DNA结合序列涉及非哺乳动物靶标。在一些实施例中,添加的DNA结合序列涉及非人靶标。在一些实施例中,在人类基因组中未发现添加的DNA结合序列。在一些实施例中,添加的DNA结合序列与人类基因组的任何序列不超过85%相同。参见实例2。
不希望受理论所束缚,添加核酸酶结合序列和DNA结合序列可以募集CRISPR核酸酶或CRISPR核酸酶-逆转录酶融合体。通过蛋白质-RNA相互作用,结合的CRISPR核酸酶可以提供对内源性核酸外切酶和核酸内切酶的抗性。在一些实施例中,另外的核酸酶结合序列和DNA结合序列募集缺乏RNA处理活性的CRISPR核酸酶。在一些实施例中,次级结构是适体(例如,RNA适体),并且组合物进一步包括与适体相互作用的蛋白质。在一些实施例中,包括适体和适体相互作用蛋白的组合物抑制内源性核酸外切酶和/或核酸内切酶活性。
如本文所公开的另外的示例性基因编辑系统仅出于说明目的在下文中提供。
在一些实施例中,如本文所公开的基因编辑系统包括至少一种RNA向导(或向导RNA,其在本文中可互换使用)和至少一种RT供体RNA。在一些实例中,至少一种RNA向导包括核酸酶结合序列和DNA结合序列(间隔子)。RNA向导可能能够与CRISPR核酸酶(例如,V型CRISPR核酸酶)结合。在一些实例中,至少一种RNA向导进一步能够与靶核酸,例如通过间隔子区结合。在一些实例中,RT供体RNA包括至少一个引物结合位点(PBS)和至少一个逆转录模板序列。PBS能够与靶核酸的一条链结合,所述链可以是有义链或反义链。PBS结合的区在本文中被描述为靶向PBS的位点。至少一个逆转录模板序列可以包括相对于靶核酸的对应序列(经编码的编辑)具有至少一个核苷酸变异的序列。在一些情况下,至少一个经编码的编辑是插入、取代和/或缺失。
在一些实施例中,本文所公开的基因编辑系统包括至少一种RNA向导、至少一种RT供体RNA和至少一个其它序列。在一些实施例中,至少一种RNA向导包括核酸酶结合序列和DNA结合序列。在一些实施例中,RNA向导能够与CRISPR核酸酶(例如,V型CRISPR核酸酶)结合。在一些实施例中,至少一种RNA向导进一步能够与靶核酸结合。在一些实施例中,至少一种RT供体RNA的PBS能够于靶核酸的非PAM链结合。在一些实施例中,至少一种RT供体RNA的PBS能够与靶核酸的PAM链结合。
在一些实施例中,本文所公开的基因编辑系统可以包括CRISPR核酸酶、逆转录酶和编辑模板RNA中的至少一种,其可以包括RNA向导和RT供体RNA。在一些实例中,CRISPR核酸酶、逆转录酶和编辑模板RNA中的至少一种以单独的组合物提供。在一些实施例中,CRISPR核酸酶、逆转录酶、RNA向导和RT供体RNA中的至少一种以单独的组合物提供。在一些实施例中,CRISPR核酸酶、逆转录酶和编辑模板RNA中的至少一种中的一种或多种以单独的组合物提供。在一些实施例中,包括CRISPR核酸酶和逆转录酶的组合物与包括编辑模板RNA的组合物单独提供。在一些实施例中,CRISPR核酸酶、逆转录酶、RNA向导和RT供体RNA中的至少一种中的一种或多种以单独的组合物提供。在一些实施例中,包括CRISPR核酸酶和逆转录酶的组合物与包括RNA向导和RT供体RNA的组合物单独提供。
在一些实施例中,本文所提供的基因编辑系统可能能够于靶核酸结合,所述靶核酸可以是需要基因编辑的基因组位点。在一些实施例中,组合物中的一种或多种组分,如编辑模板RNA结合靶核酸。在一些实施例中,组合物中的一种或多种组分,如RNA向导和RT供体RNA结合靶核酸。在一些实施例中,靶核酸是DNA。在一些实施例中,本发明的组合物修饰或能够修饰靶核酸。在一些实施例中,组合物的组分中的一种或多种组分,如CRISPR核酸酶和逆转录酶修饰靶核酸。在一些实施例中,本发明的组合物将取代、插入或缺失引入到靶核酸中。在一些实施例中,本发明的组合物能够将取代、插入或缺失引入到靶核酸的非PAM链中。在一些实施例中,如本文所公开的基因编辑系统能够将取代、插入或缺失引入到靶核酸的PAM链中。
在一些实施例中,如本文所公开的基因编辑系统可以包括CRISPR核酸酶、RT多肽或两者的蛋白质组分。可替代地,基因编辑系统可以包括一种或多种编码蛋白质组分的核酸(例如,载体,如病毒载体)。在一些实例中,基因编辑系统可以包括一种编码CRISPR核酸酶和RT多肽两者的载体。可替代地或另外,如本文所公开的基因编辑系统可以包括基因编辑RNA、向导RNA或两者的RNA组分。可替代地,基因编辑系统可以包括一种或多种编码RNA组分的核酸(载体)。例如,基因编辑系统可以包括编码基因编辑RNA和RNA向导两者的一种载体(例如,病毒载体,如AAV载体,例如,AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAV 11和AAV 12)。
在一些实例中,如本文所公开的基因编辑系统可以包括CRISPR核酸酶、RT多肽或两者的蛋白质组分,以及基因编辑RNA和RNA向导的RNA组分。在其它实例中,如本文所公开的基因编辑系统可以包括CRISPR核酸酶、RT多肽或两者的蛋白质组分,以及编码基因编辑RNA和RNA向导的RNA组分的一种或多种核酸。在一些实例中,如本文所公开的基因编辑系统可以包括编码CRISPR核酸酶、RT多肽或两者的蛋白质组分的一种或多种核酸,以及基因编辑RNA和RNA向导的RNA组分。可替代地,如本文所公开的基因编辑系统可以包括编码CRISPR核酸酶、RT多肽或两者的蛋白质组分的一种或多种核酸,以及编码基因编辑RNA和RNA向导的RNA组分的一种或多种核酸。在一些情况下,基因编辑系统可以包括编码基因编辑系统的多种组分的一种载体。在一些情况下,编码CRISPR核酸酶、RT多肽和/或其融合多肽的核酸可以是一种或多种mRNA分子。在一些实例中,mRNA分子可以经密码子优化。
在一些实施例中,本文所公开的基因编辑系统包括涵盖基因编辑系统的蛋白质和/或RNA组分中的一种或多种,或其编码核酸的一个或多个脂质纳米颗粒(LNP)。在其它实施例中,基因编辑系统可以包括涵盖一部分组分的一个或多个LNP和编码剩余组分的一种或多种载体。
II.基因编辑系统组分的制备
蛋白质组分、RNA组分或其编码核酸(例如,载体或mRNA)可以通过本文所公开的方法中的常规方法制备。
在一些实施例中,CRISPR核酸酶(例如,V型核酸酶,例如Cas12i多肽)、逆转录酶或CRISPR核酸酶-逆转录酶融合体可以通过以下方式制备:(a)培养能够产生蛋白质的宿主细胞,如细菌细胞或哺乳动物细胞,分离如此产生的蛋白质,并且任选地纯化蛋白质。如此制备的CRISPR核酸酶、逆转录酶或融合蛋白可以与编辑模板RNA复合。
CRISPR核酸酶和逆转录酶还可以通过以下方式制备:(b)已知的基因工程化技术,具体地,通过从细菌中分离编码本发明的CRISPR核酸酶和逆转录酶的基因,构建重组表达载体,并且然后将载体转移到表达编辑模板RNA的合适宿主细胞中,以用于在宿主细胞中表达与编辑模板RNA复合的重组蛋白。可替代地,CRISPR核酸酶和逆转录酶可以通过以下方式制备:(c)体外偶联转录-翻译系统,并且然后与编辑模板RNA复合。可以用于制备本发明的CRISPR核酸酶和逆转录酶的细菌没有特定的限制,只要其能够产生本发明的CRISPR核酸酶和逆转录酶。细菌的一些非限制性实例包含本文所描述的大肠杆菌细胞(E.coli cell)。
除非另有说明,否则本文所提供的所有组合物和复合物以及多肽都是参考所述组合物或复合物或多肽的活性水平制备的,并且不包括可能存在于商业上可获得的来源中的杂质,例如残余溶剂或副产物。酶促组分重量基于总活性蛋白。除非另有说明,否则所有百分比和比例均按重量计算。除非另有说明,否则所有百分比和比例均基于总组合物计算。在例示的组合物中,酶促水平按纯酶占总组合物的重量表示,除非另有说明,成分按总组合物的重量表示。
A.载体
本公开提供了用于表达本文所描述的CRISPR核酸酶、逆转录酶或其融合多肽的一种或多种载体,或者编码本文所描述的组分的核酸可以被并入到载体中。在一些实施例中,本文所公开的载体包含编码CRISPR核酸酶、逆转录酶或融合多肽的核苷酸序列。本公开还提供了编码编辑模板RNA或其任何部分的一种或多种载体,例如RNA向导或RT供体RNA。在一些实施例中,载体包括Pol II启动子或Pol III启动子。
天然或合成多核苷酸的表达通常通过将编码所关注的基因的多核苷酸,例如编码CRISPR核酸酶、逆转录酶或融合多肽的核苷酸序列,和/或编辑模板RNA与启动子可操作地连接,并将构建体并入到表达载体中来实现。表达载体没有特定的限制,只要其包含编码本发明的CRISPR核酸酶和逆转录酶和/或编辑模板RNA的多核苷酸,并且可以适用于在真核细胞中复制和整合。
典型的表达载体包含用于所期望的多核苷酸表达的转录和翻译终止子、起始序列和启动子。例如,可以使用携带RNA聚合酶的识别序列(pSP64,pBluescript等)的质粒载体。包含源自如慢病毒等逆转录病毒的载体是适于实现长期基因转移的工具,因为其允许转基因的长期稳定整合以及其在子细胞中的繁殖。载体的实例包含表达载体、复制载体、探针生成载体和测序载体。可以将表达载体以病毒载体的形式提供到细胞。
病毒载体技术是本领域众所周知的,并且在各种病毒学和分子生物学手册中有所描述。可用作载体的病毒包含但不限于噬菌体病毒、逆转录病毒、腺病毒、腺相关病毒、疱疹病毒和慢病毒。通常,合适的载体含有在至少一种生物体中有复制功能的起点、启动子序列、方便的限制性核酸内切酶位点和一种或多种可选择标志物。
载体的种类没有特定的限制,并且可以适当地选择可以在宿主细胞中表达的载体。更具体说,取决于宿主细胞的种类,适当地选择确保多肽从多核苷酸表达的启动子序列,并将此启动子序列和多核苷酸插入到任何不同的质粒等中以用于表达载体的制备。
另外的启动子元件,例如增强序列,调节转录起始的频率。通常,这些位于起始位点上游30-110bp的区中,但是许多启动子最近已示出也在起始位点下游含有功能元件。取决于启动子,似乎单独的元件可以协同或独立地起作用以激活转录。
进一步地,本公开不应限于使用组成型启动子。还设想了诱导型启动子作为本公开的一部分。使用诱导型启动子提供了能够在期望此类表达时开启与其可操作地连接的多核苷酸序列的表达或者在不期望表达时关闭所述表达的分子开关。诱导型启动子的实例包含但不限于金属硫蛋白启动子、糖皮质激素启动子、孕酮启动子和四环素启动子。
待引入的表达载体还可以含有可选择标志物基因或报告基因或两者以促进从试图通过病毒载体转染或感染的细胞群体中鉴定和选择表达细胞。在其它方面,可选择标志物可以携带在单独的DNA片段上并在共转染程序中使用。可选择标志物和报告基因两者均可以侧接适当的转录对照序列以使得能够在宿主细胞中表达。此类标志物的实例包含用于真核细胞培养的二氢叶酸还原酶基因和新霉素抗性,以及用于在大肠杆菌和其它细菌中培养的四环素抗性基因和氨苄青霉素抗性基因。通过使用此类选择标志物,可以证实编码本发明的多肽的多核苷酸是否已经被转移到宿主细胞中,并且然后被成功表达。
重组表达载体的制备方法没有特定的限制,并且其实例包含使用质粒、噬菌体或粘粒的方法。
B.表达的方法
本公开包含用于蛋白质表达的方法,所述方法包括翻译CRISPR核酸酶和逆转录酶,并且表达本文所描述的编辑模板RNA。
在一些实施例中,本文所描述的宿主细胞用于表达CRISPR核酸酶和逆转录酶和/或编辑模板RNA。宿主细胞没有特定的限制,并且可以优选地使用各种已知的细胞。宿主细胞的具体实例包含细菌如大肠杆菌、酵母(芽殖酵母,酿酒酵母(Saccharomycescerevisiae)和裂殖酵母,粟酒裂殖酵母(Schizosaccharomyces pombe))、线虫(秀丽隐杆线虫(Caenorhabditis elegans))、爪蟾卵母细胞(Xenopus laevis oocytes)和动物细胞(例如,CHO细胞、COS细胞和HEK293细胞)。用于将上文所描述的表达载体转移到宿主细胞中的方法,即转化方法,没有特定的限制,并且可以使用已知的方法如电穿孔法、磷酸钙法、脂质体法和DEAE葡聚糖法。
用表达载体转化宿主后,可以培养、培育或繁殖宿主细胞,以用于产生CRISPR核酸酶、逆转录酶和/或编辑模板RNA。在表达CRISPR核酸酶、逆转录酶和/或编辑模板RNA后,可以收集宿主细胞,并根据常规方法(例如,过滤、离心、细胞破碎、凝胶过滤色谱法、离子交换色谱法等)从培养物等中纯化CRISPR核酸酶、逆转录酶和/或编辑模板RNA。
在一些实施例中,用于CRISPR核酸酶和逆转录酶表达的方法包括翻译多肽的至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少400个氨基酸、至少500个氨基酸、至少600个氨基酸、至少700个氨基酸、至少800个氨基酸、至少900个氨基酸或至少1000个氨基酸。在一些实施例中,用于蛋白质表达的方法包括翻译CRISPR核酸酶和逆转录酶的约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约50个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸、约600个氨基酸、约700个氨基酸、约800个氨基酸、约900个氨基酸、约1000个氨基酸或更多个。
多种方法可以用于确定宿主细胞中成熟CRISPR核酸酶、逆转录酶和/或编辑模板RNA的生产水平。此类方法包含但不限于例如,利用对蛋白质或如本文其它地方所描述的标记标签具有特异性的多克隆抗体或单克隆抗体的方法。示例性方法包含但不限于酶联免疫吸附测定(ELISA)、放射免疫测定(MA)、荧光免疫测定(FIA)和荧光激活细胞分选(FACS)。这些和其它测定在本领域是众所周知的(参见例如,Maddox等人,《实验医学杂志(J.Exp.Med.)》158:1211[1983])。
本公开提供了在细胞中体内表达CRISPR核酸酶和逆转录酶和/或编辑模板RNA的方法,所述方法包括向宿主细胞提供编码CRISPR核酸酶、逆转录酶和/或编辑模板RNA的多核糖核苷酸,其中所述多核糖核苷酸编码CRISPR核酸酶、逆转录酶和/或编辑模板RNA,在细胞中表达CRISPR核酸酶、逆转录酶和/或编辑模板RNA,并从细胞中获得CRISPR核酸酶、逆转录酶和/或编辑模板RNA。
III.用于基因编辑的方法
任何基因编辑系统可以用于对靶核酸进行基因修饰(编辑),其可以是所关注的基因位点,例如需要进行基因编辑的基因位点,例如,修复基因突变、引入保护性突变、引入用于调节基因表达的修饰等。
本文所公开的基因编辑系统和组合物适用于编辑和将编辑引入到各种靶序列中。在一些实施例中,靶序列是DNA分子,例如DNA基因座(本文称为靶序列或在靶序列)。在一些实施例中,靶序列是RNA,如RNA基因座或mRNA。在一些实施例中,靶序列是单链的(例如,单链DNA)。在一些实施例中,靶序列是双链的(例如,双链DNA)。在一些实施例中,靶序列包括单链区和双链区两者。在一些实施例中,靶序列是直链的。在一些实施例中,靶序列是环状的。在一些实施例中,靶序列包括一个或多个经修饰的核苷酸,如甲基化的核苷酸、受损的核苷酸或核苷酸类似物。在一些实施例中,靶序列未经修饰。在一些实施例中,单链靶序列不需要PAM序列。
靶序列可以是任何长度,如以下中的约至少任一者:100bp、200bp、500bp、1000bp、2000bp、5000bp、10kb、20kb、50kb、100kb、200kb、500kb、1Mb或更长。靶序列还可以包括任何序列。在一些实施例中,靶序列富含GC,如具有以下中的至少约任一者:40%、45%、50%、55%、60%、65%或更高GC含量。在一些实施例中,靶序列具有至少约70%、80%或更多的GC含量。在一些实施例中,靶序列是不富含GC的靶序列中的富含GC的片段。在一些实施例中,靶序列不富含GC。在一些实施例中,靶序列具有一个或多个次级结构或更高级结构。在一些实施例中,靶序列不处于浓缩状态,如在染色质中,使得核糖核蛋白无法接近靶序列。
在一些实施例中,靶核酸是细胞中的基因组位点。在一些情况下,发生基因编辑的靶核酸可能位于蛋白质编码区中。可替代地,靶核酸可以位于调控区,如启动子、增强子、5'或3'非翻译区。在其它情况下,靶核酸可以在非编码基因,如转座子、miRNA、tRNA、核糖体RNA、核酶或lincRNA中。
A.用于进行基因编辑的示例性基因
本文所公开的任何基因编辑系统可以用于编辑所关注的靶基因,例如涉及疾病(例如,遗传病)的基因。在一些实施例中,靶基因可以是涉及受试者的免疫应答的基因。例如,靶基因可以是免疫检查点基因。
示例性靶基因包含但不限于BCL11A内含子红系增强子、CD3、β-2微球蛋白(B2M)、T细胞受体α常数(TRAC)、程序性细胞死亡1(PDCD1)、T细胞受体α、T细胞受体β、B细胞淋巴瘤/白血病11A(BCL11A)、细胞毒性T淋巴细胞抗原4(CTLA-4)、趋化因子(C-C基序)受体5(基因/假基因)(CCR5)、CXCR4基因、CD160分子(CD160)、腺苷A2a受体(ADORA)、CD276、B7-H3、B7-H4、BTLA、烟酰胺腺嘌呤二核苷酸磷酸NADPH氧化酶同种型2(NOX2)、T细胞激活的V结构域Ig抑制剂(VISTA)、唾液酸结合免疫球蛋白型凝集素7(SIGLEC7)、唾液酸结合免疫球蛋白型凝集素9(SIGLEC9)、SIGLEC10、含有T细胞激活抑制剂1的V集合结构域(VTCN1)、B和T淋巴细胞相关(BTLA)、吲哚胺2,3-双加氧酶(IDO)、吲哚胺2,3-双加氧酶1(IDO1)、杀伤细胞免疫球蛋白样受体(KIR)、杀伤细胞免疫球蛋白样受体、三个结构域、长细胞质尾1(KIR3DL1)、淋巴细胞激活基因3(LAG3)、T细胞免疫球蛋白结构域和粘蛋白结构域3(TIM3)、甲型肝炎病毒细胞受体2(HAVCR2)、自然杀伤细胞受体2B4(CD244)、次黄嘌呤磷酸核糖基转移酶1(HPRT)、具有Ig和ITIM结构域的T细胞免疫受体(TIGIT)、CD96分子(CD96)、细胞毒性和调节性T细胞分子(CRTAM)、白细胞相关免疫球蛋白样受体1(LAIR1)、腺相关病毒整合位点1(AAVS1)、AAVS2、AAVS3、AAVS4、AAVS5、AAVS6、AAVS7、AAVS8、转化生长因子β受体II(TGFBRII)、转化生长因子β受体I(TGFBR1)、SMAD家族成员2(SMAD2)、SMAD家族成员3(SMAD3)、SMAD家族成员4(SMAD4)、SKI原癌基因(SKI)、SKI样原癌基因(SKIL)、egl-9家族缺氧诱导因子1(EGLN1)、egl-9家族缺氧诱导因子2(EGLN2)、egl-9家族缺氧诱导因子3(EGLN3)、蛋白磷酸酶1调节亚单位12C(PPP1R12C)、TGFB诱导因子同源盒1(TGIF1)、肿瘤坏死因子受体超家族成员、肿瘤坏死因子受体超家族成员10b(TNFRSF10B)、肿瘤坏死因子受体超家族成员10a(TNFRSF10A)、BY55、B7H5、胱天蛋白酶8(CASP8)、胱天蛋白酶10(CASP10)、胱天蛋白酶3(CASP3)、胱天蛋白酶6(CASP6)、胱天蛋白酶7(CASP7)、Fas相关死亡结构域(Fasassociated via death domain,FADD)、Fas细胞表面死亡受体(FAS)、白介素10受体亚单位α(IL10RA)、白介素10受体亚单位β(IL10RB)、血红素加氧酶2(HMOX2)、白介素6受体(IL6R)、白介素6信号转导子(IL6ST)、c-src酪氨酸激酶(CSK)、具有鞘糖脂微结构域1的磷蛋白膜锚(PAG1)、鸟苷酸环化酶1可溶性β3(GUCY1B3),信号传导阈值调节跨膜衔接子1(SIT1)、叉头盒P3(FOXP3)、PR结构域1(PRDM1)、碱性亮氨酸拉链转录因子、ATF样(BATF)、鸟苷酸环化酶1可溶性α2(GUCY1A2)、鸟苷酸环化酶1可溶性α3(GUCY1A3)、鸟苷酸环化酶1可溶性β2(GUCY1B2)、脯氨酰羟化酶结构域(PHD1、PHD2、PHD3)蛋白质家族、CD27、CD28、CD40、CD122、CD137、OX40、GITR和ICOS。在一些实施例中,经修饰的基因是程序性死亡配体1(PD-L1)、II类主要组织相容性复合物反式激活因子(CIITA)、柠檬酰辅酶A裂解酶(CLYBL)、运甲状腺素蛋白(TTR)、乳酸脱氢酶A(LDHA)、羟基酸氧化酶-1(HAO1)、丙氨酸-乙醛酸和丝氨酸丙酮酸氨基转移酶(AGXT)、乙醛酸还原酶/羟基丙酮酸还原酶(GRHPR)、4-羟基-2-氧化戊二酸醛缩酶(HOGA)、多嘧啶通道结合蛋白1(PTBP1)、stathmin 2(STMN2)或肌动蛋白β(ACTB)。
本公开提供了使用本文也公开的基因编辑系统对如本文所公开的任何靶基因进行基因编辑的方法。
B.编辑
在一些方面,本文提供了使用本文所描述的基因编辑系统将至少一种编辑引入到靶核酸(例如,所关注的基因组位点,如本文所公开的任何靶基因中)中的方法。在一些实施例中,编辑可以包含到靶核酸中的取代、插入、缺失或其组合。在一些实例中,编辑可以是单核苷酸取代,如G至T取代、G至A取代、G至C取代、T至G取代、T至A取代、T至C取代、C至G取代、C至T取代、C至A取代、A至T取代、A至G取代或A至C取代。在一些实例中,编辑可以将G:C碱基对转化为T:A碱基对、G:C碱基对转化为A:T碱基对,G:C碱基对转化为C:G碱基对、T:A碱基对转化为G:C碱基对、T:A碱基对转化为A:T碱基对、T:A碱基对转化为C:G碱基对、C:G碱基对转化为G:C碱基对、C:G碱基对转化为T:A碱基对、C:G碱基对转化为A:T碱基对、A:T碱基对转化为T:A碱基对、A:T碱基对转化为G:C碱基对或A:T碱基对转化为C:G碱基对。
在一些实施例中,描述了用于将至少一种编辑引入到靶核酸中的方法,其中编辑是至少一个取代、至少一个插入和/或至少一个缺失。在一些实施例中,编辑包括至少一个取代、插入或缺失。在一些实施例中,取代、插入或缺失的长度为至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少200个、至少300个、至少400个或至少500个核苷酸。在一些实施例中,取代、插入或缺失的长度为1个核苷酸至约200个核苷酸,例如,1个核苷酸至5个核苷酸、5个核苷酸至10个核苷酸、10个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、20个核苷酸至25个核苷酸、25个核苷酸至30个核苷酸、30个核苷酸至35个核苷酸、35个核苷酸至40个核苷酸、40个核苷酸至45个核苷酸、45个核苷酸至50个核苷酸、50个核苷酸至55个核苷酸、55个核苷酸至60个核苷酸、60个核苷酸至65个核苷酸、65个核苷酸至70个核苷酸、70个核苷酸至75个核苷酸、75个核苷酸至80个核苷酸、80个核苷酸至85个核苷酸、85个核苷酸至90个核苷酸、90个核苷酸至95个核苷酸、95个核苷酸至100个核苷酸、100个核苷酸至105个核苷酸、105个核苷酸至110个核苷酸、110个核苷酸至115个核苷酸、115个核苷酸至120个核苷酸、120个核苷酸至125个核苷酸、125个核苷酸至130个核苷酸、130个核苷酸至135个核苷酸、135个核苷酸至140个核苷酸、140个核苷酸至145个核苷酸、145个核苷酸至150个核苷酸、150个核苷酸至155个核苷酸、155个核苷酸至160个核苷酸、160个核苷酸至165个核苷酸、165个核苷酸至170个核苷酸、170个核苷酸至175个核苷酸、175个核苷酸至180个核苷酸、180个核苷酸至185个核苷酸、185个核苷酸至190个核苷酸、190个核苷酸至195个核苷酸或195个核苷酸至200个核苷酸。在一些实施例中,取代、插入或缺失的长度为1个核苷酸至约300个核苷酸,例如,1个核苷酸至5个核苷酸、5个核苷酸至10个核苷酸、10个核苷酸至15个核苷酸、15个核苷酸至20个核苷酸、20个核苷酸至25个核苷酸、25个核苷酸至30个核苷酸、30个核苷酸至35个核苷酸、35个核苷酸至40个核苷酸、40个核苷酸至45个核苷酸、45个核苷酸至50个核苷酸、50个核苷酸至55个核苷酸、55个核苷酸至60个核苷酸、60个核苷酸至65个核苷酸、65个核苷酸至70个核苷酸、70个核苷酸至75个核苷酸、75个核苷酸至80个核苷酸、80个核苷酸至85个核苷酸、85个核苷酸至90个核苷酸、90个核苷酸至95个核苷酸、95个核苷酸至100个核苷酸、100个核苷酸至105个核苷酸、105个核苷酸至110个核苷酸、110个核苷酸至115个核苷酸、115个核苷酸至120个核苷酸、120个核苷酸至125个核苷酸、125个核苷酸至130个核苷酸、130个核苷酸至135个核苷酸、135个核苷酸至140个核苷酸、140个核苷酸至145个核苷酸、145个核苷酸至150个核苷酸、150个核苷酸至155个核苷酸、155个核苷酸至160个核苷酸、160个核苷酸至165个核苷酸、165个核苷酸至170个核苷酸、170个核苷酸至175个核苷酸、175个核苷酸至180个核苷酸、180个核苷酸至185个核苷酸、185个核苷酸至190个核苷酸、190个核苷酸至195个核苷酸、195个核苷酸至200个核苷酸、200个核苷酸至210个核苷酸、210个核苷酸至220个核苷酸、220个核苷酸至230个核苷酸、230个核苷酸至240个核苷酸、240个核苷酸至250个核苷酸、250个核苷酸至260个核苷酸、260个核苷酸至270个核苷酸、270个核苷酸至280个核苷酸、280个核苷酸至290个核苷酸或290个核苷酸至300个核苷酸。在一些实施例中,取代、插入或缺失的长度为至多约10,000个碱基对(10kb)。例如,在一些实施例中,取代、插入或缺失的长度为1个碱基对、约10个碱基对、约20个碱基对、约30个碱基对、约40个碱基对、约50个碱基对、约60个碱基对、约70个碱基对、约80个碱基对、约90个碱基对、约100个碱基对、约200个碱基对、约300个碱基对、约400个碱基对、约500个碱基对、约600个碱基对、约700个碱基对、约800个碱基对、约900个碱基对、约1kb、约1.1kb、约1.2kb、约1.3kb、约1.4kb、约1.5kb、约1.6kb、约1.7kb、约1.8kb、约1.9kb、约2kb、约2.1kb、约2.2kb、约2.3kb、约2.4kb、约2.5kb、约2.6kb、约2.7kb、约2.8kb、约2.9kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb或10kb。
在一些实施例中,插入物是或包括发夹。例如,逆转录酶可以转录发夹,所述发夹可以被并入到靶核酸中。在其它实施例中,逆转录模板序列包含发夹结构,并且逆转录酶在发夹处停止转录逆转录模板序列。
在一些实施例中,编辑发生在II型PAM序列(例如,SpCas9的5'-NGG-3')或V型PAM序列(例如,Cas12i多肽的5'-NTTN-3')的约500个核苷酸内。在一些实施例中,编辑发生在PAM序列附近,例如,在PAM序列上游或下游的约500个核苷酸内。在一些实施例中,编辑发生在PAM序列的约400个核苷酸内。在一些实施例中,编辑发生在在PAM序列上游或下游的约400个核苷酸内。在一些实施例中,编辑发生在PAM序列的约300个核苷酸内。在一些实施例中,编辑发生在在PAM序列上游或下游的约300个核苷酸内。在一些实施例中,编辑发生在PAM序列的约200个核苷酸内。在一些实施例中,编辑发生在在PAM序列上游或下游的约200个核苷酸内。在一些实施例中,编辑发生在PAM序列的约100个核苷酸内。在一些实施例中,编辑发生在在PAM序列上游或下游的约100个核苷酸内。在一些实施例中,编辑发生在PAM序列的约50个核苷酸内。在一些实施例中,编辑发生在在PAM序列上游或下游的约50个核苷酸内。在一些实施例中,编辑发生在PAM序列的约30个核苷酸内。在一些实施例中,编辑发生在在PAM序列上游或下游的约30个核苷酸内。在一些实施例中,编辑发生在PAM序列的约20个核苷酸内。在一些实施例中,编辑发生在在PAM序列上游或下游的约20个核苷酸内。
在一些实施例中,编辑开始于PAM序列上游的约300个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约290个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约280个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约270个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约260个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约250个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约240个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约230个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约2020个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约210个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约200个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约190个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约180个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约170个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约160个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约150个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约140个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约130个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约120个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约110个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约100个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约90个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约80个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约70个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约60个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约50个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约40个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约30个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约20个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约10个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约9个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约8个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约7个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约6个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约5个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约4个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约3个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约2个核苷酸内。在一些实施例中,编辑开始于PAM序列上游的约1个核苷酸内。
在一些实施例中,编辑开始于PAM序列处。在一些实施例中,编辑开始于PAM下游的约1个核苷酸内。在一些实施例中,编辑开始于PAM下游的约2个核苷酸内。在一些实施例中,编辑开始于PAM下游的约3个核苷酸内。在一些实施例中,编辑开始于PAM下游的约4个核苷酸内。在一些实施例中,编辑开始于PAM下游的约5个核苷酸内。在一些实施例中,编辑开始于PAM下游的约6个核苷酸内。在一些实施例中,编辑开始于PAM下游的约7个核苷酸内。在一些实施例中,编辑开始于PAM下游的约8个核苷酸内。在一些实施例中,编辑开始于PAM下游的约9个核苷酸内。在一些实施例中,编辑开始于PAM下游的约10个核苷酸内。在一些实施例中,编辑开始于PAM下游的约11个核苷酸内。在一些实施例中,编辑开始于PAM下游的约12个核苷酸内。在一些实施例中,编辑开始于PAM下游的约13个核苷酸内。在一些实施例中,编辑开始于PAM下游的约14个核苷酸内。在一些实施例中,编辑开始于PAM下游的约15个核苷酸内。在一些实施例中,编辑开始于PAM下游的约16个核苷酸内。在一些实施例中,编辑开始于PAM下游的约17个核苷酸内。在一些实施例中,编辑开始于PAM下游的约18个核苷酸内。在一些实施例中,编辑开始于PAM下游的约19个核苷酸内。在一些实施例中,编辑开始于PAM下游的约20个核苷酸内。在一些实施例中,编辑开始于PAM下游的约21个核苷酸内。在一些实施例中,编辑开始于PAM下游的约22个核苷酸内。在一些实施例中,编辑开始于PAM下游的约23个核苷酸内。在一些实施例中,编辑开始于PAM下游的约24个核苷酸内。在一些实施例中,编辑开始于PAM下游的约25个核苷酸内。在一些实施例中,编辑开始于PAM下游的约26个核苷酸内。在一些实施例中,编辑开始于PAM下游的约27个核苷酸内。在一些实施例中,编辑开始于PAM下游的约28个核苷酸内。在一些实施例中,编辑开始于PAM下游的约29个核苷酸内。在一些实施例中,编辑开始于PAM下游的约30个核苷酸内。
在一些实施例中,编辑终止于PAM序列上游的约300个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约290个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约280个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约270个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约260个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约250个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约240个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约230个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约2020个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约210个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约200个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约190个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约180个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约170个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约160个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约150个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约140个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约130个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约120个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约110个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约100个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约90个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约80个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约70个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约60个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约50个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约40个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约30个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约20个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约10个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约9个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约8个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约7个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约6个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约5个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约4个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约3个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约2个核苷酸内。在一些实施例中,编辑终止于PAM序列上游的约1个核苷酸内。
在一些实施例中,编辑终止于PAM序列处。在一些实施例中,编辑终止于PAM下游的约1个核苷酸内。在一些实施例中,编辑终止于PAM下游的约2个核苷酸内。在一些实施例中,编辑终止于PAM下游的约3个核苷酸内。在一些实施例中,编辑终止于PAM下游的约4个核苷酸内。在一些实施例中,编辑终止于PAM下游的约5个核苷酸内。在一些实施例中,编辑终止于PAM下游的约6个核苷酸内。在一些实施例中,编辑终止于PAM下游的约7个核苷酸内。在一些实施例中,编辑终止于PAM下游的约8个核苷酸内。在一些实施例中,编辑终止于PAM下游的约9个核苷酸内。在一些实施例中,编辑终止于PAM下游的约10个核苷酸内。在一些实施例中,编辑终止于PAM下游的约11个核苷酸内。在一些实施例中,编辑终止于PAM下游的约12个核苷酸内。在一些实施例中,编辑终止于PAM下游的约13个核苷酸内。在一些实施例中,编辑终止于PAM下游的约14个核苷酸内。在一些实施例中,编辑终止于PAM下游的约15个核苷酸内。在一些实施例中,编辑终止于PAM下游的约16个核苷酸内。在一些实施例中,编辑终止于PAM下游的约17个核苷酸内。在一些实施例中,编辑终止于PAM下游的约18个核苷酸内。在一些实施例中,编辑终止于PAM下游的约19个核苷酸内。在一些实施例中,编辑终止于PAM下游的约20个核苷酸内。在一些实施例中,编辑终止于PAM下游的约21个核苷酸内。在一些实施例中,编辑终止于PAM下游的约22个核苷酸内。在一些实施例中,编辑终止于PAM下游的约23个核苷酸内。在一些实施例中,编辑终止于PAM下游的约24个核苷酸内。在一些实施例中,编辑终止于PAM下游的约25个核苷酸内。在一些实施例中,编辑终止于PAM下游的约26个核苷酸内。在一些实施例中,编辑终止于PAM下游的约27个核苷酸内。在一些实施例中,编辑终止于PAM下游的约28个核苷酸内。在一些实施例中,编辑终止于PAM下游的约29个核苷酸内。在一些实施例中,编辑终止于PAM下游的约30个核苷酸内。
C.非PAM链编辑
在一些实施例中,本文提供了使用如本文所公开的合适的基因编辑系统将至少一种编辑引入到靶核酸的非PAM链中的方法,所述基因编辑系统例如在图5、图6A、图6B、图7、图8A、图12A或图12B中所描绘的基因编辑系统。最初可以使用包含在基因编辑系统中的逆转录模板序列将至少一种编辑引入到非PAM链中。通过细胞DNA修复机制,将至少一种编辑最终引入到靶核酸的两条链中。基因编辑系统可以包括靶向非PAM链的编辑模板RNA,其包括(a)CRISPR核酸酶结合序列;(b)DNA结合序列;以及(c)RT供体RNA。在一些实施例中,RT供体RNA包括PBS和逆转录模板序列。
在一些实施例中,描述了通过RT供体RNA的逆转录模板序列的5'至3'转录用于将至少一种编辑引入到靶核酸的非PAM链中的方法和基因编辑系统或组合物。在一些实施例中,描述了通过逆转录模板序列的5'至3'转录用于将至少一种编辑引入到靶核酸的非PAM链中的方法和组合物。
在一些实施例中,RT供体RNA的PBS(例如,编辑模板RNA的RT供体RNA)与非PAM链上的区(靶向PBS的位点)结合。逆转录模板序列包括将被并入到非PAM链中的编辑。在一些实例中,逆转录模板包括与PAM链相似的序列。在一些实例中,逆转录模板包括相对于PAM链的序列的编辑。在一些实施例中,非PAM链通过碱基配对结合RT供体RNA的PBS,并且逆转录酶(例如,CRISPR核酸酶-逆转录酶融合体)拷贝逆转录模板序列。在链交换回与互补基因组链的碱基配对之后,编辑被并入到靶核酸中。
在一些实施例中,靶向非PAM链的编辑模板RNA从5'至3'包括以下组分:CRISPR核酸酶结合序列、DNA结合序列、逆转录模板序列和PBS(参见例如,图5、图6A、图6B、图8A和图12A)。在一些实施例中,靶向非PAM链的编辑模板RNA从5'至3'包括以下组分:逆转录模板序列、PBS、CRISPR核酸酶结合序列和DNA结合序列(间隔子),或者从5'至3'包括以下组分:逆转录模板序列、PBS、接头、CRISPR核酸酶结合序列和DNA结合序列(图7和图12B)。
在一些实施例中,CRISPR核酸酶结合序列与DNA结合序列相邻。在一些实施例中,CRISPR核酸酶结合序列是DNA结合序列的5'延伸部(图5、图6A、图6B、图8A和图12A)。在一些实施例中,CRISPR核酸酶结合序列与DNA结合序列和PBS相邻。在一些实施例中,CRISPR核酸酶结合序列是PBS的3'延伸部(图7和图12B)。在一些实施例中,CRISPR核酸酶结合序列与II型CRISPR核酸酶结合。在一些实施例中,CRISPR核酸酶结合序列与V型CRISPR核酸酶(例如,Cas12i多肽,如Cas12i1、Cas12i2、Cas12i3或Cas12i4多肽)结合。在一些实施例中,CRISPR核酸酶结合序列与缺乏crRNA处理活性的CRISPR核酸酶结合。在一些实施例中,CRISPR核酸酶结合序列是直接重复序列(例如,Cas9直接重复序列或Cas12i直接重复序列)。
在一些实施例中,DNA结合序列与CRISPR核酸酶结合序列和PBS相邻。在一些实施例中,DNA结合序列是CRISPR核酸酶结合序列的3'延伸部(图5、图6A、图6B、图7、图8A、图12A和图12B)。在一些实施例中,DNA结合序列可以包括RNA序列、DNA序列或RNA/DNA杂交序列。在一些实施例中,DNA结合序列的长度为约10个核苷酸至约50个核苷酸。在一些实施例中,DNA结合序列的长度为约15个核苷酸至约35个核苷酸。
在一些实施例中,PBS与逆转录模板序列相邻。在一些实施例中,PBS是逆转录模板序列的3'延伸部(图5、图6A、图6B、图7、图8A、图12A和图12B)。在一些实施例中,PBS与逆转录模板序列和CRISPR核酸酶结合序列相邻。在一些实施例中,PBS的长度介于约3个核苷酸与约200个核苷酸之间。在一些实施例中,PBS的长度为约3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、105个或110个核苷酸。在一些实施例中,DNA结合序列和PBS与靶核酸的同一条链(例如,非PAM链)结合。
在一些实施例中,逆转录模板序列与PBS和DNA结合序列相邻。在一些实施例中,逆转录模板序列是PBS的5'延伸部(图5、图6A、图6B、图8A和图12A)。在一些实施例中,逆转录模板序列是靶向DNA的序列的3'延伸部(图5、图6A、图6B、图8A和图12A)。在一些实施例中,逆转录模板序列是PBS的5'延伸部(图7和图12B)。在一些实施例中,逆转录模板序列的长度为约10个核苷酸至约300个核苷酸。在一些实施例中,逆转录模板序列的长度为约10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、105个、110个、115个或120个核苷酸。
在一些实施例中,当DNA结合序列和PBS与靶核酸结合时,靶向非PAM链的编辑模板RNA包括未配对核苷酸的环。参见图6A、图6B、图8A和图12A。在一些实施例中,靶向非PAM链的编辑模板RNA包括与PBS相邻的环。参见图7和图12B。在一些实施例中,环包括逆转录模板序列,并且随后是PBS。在一些实施例中,PBS包括与靶核酸的非PAM链的互补性。在一些实施例中,环的序列包括与PAM链相似的序列。在一些实施例中,环包括相对于PAM链的序列的编辑。在一些实施例中,编辑是取代、插入或缺失。在一些实施例中,环包括发夹。
D.PAM链编辑
在一些实施例中,本文提供了使用本文所公开的合适的基因编辑系统将至少一种编辑引入到靶核酸的PAM链(例如,所关注的基因组位点)中的方法,所述基因编辑系统如在图1A、图1B、图2、图3、图4或图10中所描绘的基因编辑系统。此类方法可以涉及使用靶向PAM链的编辑模板RNA,其可以包括(a)CRISPR核酸酶结合序列;(b)DNA结合序列;以及(c)RT供体RNA(图1A、图1B、图2和图10)。在一些实例中,靶向PAM链的组合物包括RNA向导和RT供体RNA(图3和图4)。在一些实例中,RT供体RNA包括PBS和逆转录模板序列。
在一些实施例中,描述了通过逆转录模板序列的5'至3'转录用于将至少一种编辑引入到靶核酸的PAM链中的方法和组合物。在一些实施例中,描述了通过逆转录模板序列的5'至3'转录用于将至少一种编辑引入到靶核酸的PAM链中的方法和组合物。
在一些情况下,RT供体RNA的PBS(例如,编辑模板RNA的RT供体RNA)与PAM链结合。RT供体RNA的逆转录模板序列包括将被并入到PAM链中的编辑。在一些实例中,逆转录模板包括与非PAM链相似的序列。在一些实施例中,逆转录模板包括相对于非PAM链的序列的编辑。在一些实施例中,PAM链可以通过碱基配对与RT供体RNA的PBS结合,并且逆转录酶(例如,CRISPR核酸酶-逆转录酶融合体)拷贝逆转录模板序列。在链交换回与互补基因组链的碱基配对之后,编辑被并入到靶核酸中。
在一些实施例中,靶向PAM链的编辑模板RNA从5'至3'包括以下组分:CRISPR核酸酶结合序列、DNA结合序列、逆转录模板序列和PBS(图1A、图1B和图10)。在一些实施例中,靶向PAM链的编辑模板RNA从5'至3'包括以下组分:逆转录模板序列、PBS、CRISPR核酸酶结合序列和DNA结合序列,或者从5'至3'包括以下组分:逆转录模板序列、PBS、接头、CRISPR核酸酶结合序列和DNA结合序列(图2)。
在一些实施例中,CRISPR核酸酶结合序列与DNA结合序列相邻。在一些实施例中,DNA结合序列是CRISPR核酸酶结合序列的3'延伸部(图1A、图1B、图2和图10)。在一些实施例中,CRISPR核酸酶结合序列与DNA结合序列和PBS相邻(图2)。在一些实施例中,DNA结合序列是PBS的3'延伸部(图2)。在一些实施例中,CRISPR核酸酶结合序列与II型CRISPR核酸酶结合。在一些实施例中,CRISPR核酸酶结合序列与V型CRISPR核酸酶(例如,Cas12i多肽,如Cas12i1、Cas12i2、Cas12i3或Cas12i4多肽)结合。在一些实施例中,CRISPR核酸酶结合序列与缺乏crRNA处理活性的CRISPR核酸酶结合。在一些实施例中,CRISPR核酸酶结合序列是直接重复序列(例如,Cas9直接重复序列或Cas12i直接重复序列)。
在一些实施例中,DNA结合序列与CRISPR核酸酶结合序列相邻。在一些实施例中,DNA结合序列是CRISPR核酸酶结合序列的3'延伸部(图1A、图1B、图2和图10)。在一些实施例中,DNA结合序列与CRISPR核酸酶结合序列和逆转录模板序列相邻。在一些实施例中,逆转录模板序列是DNA结合序列的3'延伸部(图10)。在一些实施例中,DNA结合序列是RNA序列、DNA序列或RNA/DNA杂交序列。在一些实施例中,DNA结合序列的长度为约10个核苷酸至约50个核苷酸。在一些实施例中,DNA结合序列的长度为约15个核苷酸至约35个核苷酸。在一些实施例中,DNA结合序列是间隔子序列。
在一些实施例中,PBS与逆转录模板序列相邻。在一些实施例中,PBS是逆转录模板序列的3'延伸部(图1A、图2、图1B和图10)。在一些实施例中,PBS与CRISPR核酸酶结合序列相邻。在一些实施例中,CRISPR核酸酶结合序列是PBS的3'延伸部(图2)。在一些实施例中,PBS的长度介于约3个核苷酸与约200个核苷酸之间。在一些实施例中,PBS的长度为约3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、105个或110个核苷酸。在一些实施例中,DNA结合序列和PBS与靶核酸的不同链结合(例如,DNA结合序列与靶链结合,并且PBS与PAM链结合)。
在一些实施例中,逆转录模板序列与DNA结合序列相邻。在一些实施例中,逆转录模板序列是DNA结合序列的3'延伸部(图1A、图1B和图10)。在一些实施例中,逆转录模板序列与PBS相邻。在一些实施例中,逆转录模板序列是PBS的5'延伸部(图1A、图1B、图2)。在一些实施例中,PBS是逆转录模板序列的3'延伸部(图10)。在一些实施例中,逆转录模板序列的长度为约10个核苷酸至约300个核苷酸。在一些实施例中,逆转录模板序列的长度为约10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、105个、110个、115个或120个核苷酸。
E.细胞中的基因编辑
在一些方面,本文提供了使用如本文也公开的合适的基因编辑系统编辑细胞中所关注的基因组位点(例如,如本文所公开的靶基因)的方法。为了实施此方法,可以将基因编辑系统递送或引入到细胞群体中。在一些情况下,可以收集包括进行所期望的基因编辑的细胞,并且任选地在体外培养和扩增。
本文所描述的细胞可以是多种细胞。在一些实施例中,细胞是分离的细胞。在一些实施例中,细胞处于细胞培养物或两种或多种细胞类型的共培养物中。在一些实施例中,细胞是离体的。在一些实施例中,细胞从活生物体获得并保持在细胞培养物中。在一些实施例中,细胞是单细胞生物体。
在一些实施例中,细胞是原核细胞。在一些实施例中,细胞是细菌细胞或源自细菌细胞。在一些实施例中,细胞是古菌细胞或源自古菌细胞。
在一些实施例中,细胞是真核细胞。在一些实施例中,细胞是植物细胞或源自植物细胞。在一些实施例中,细胞是真菌细胞或源自真菌细胞。在一些实施例中,细胞是动物细胞或源自动物细胞。在一些实施例中,细胞是无脊椎动物细胞或源自无脊椎动物细胞。在一些实施例中,细胞是脊椎动物细胞或源自脊椎动物细胞。在一些实施例中,细胞是哺乳动物细胞或源自哺乳动物细胞。在一些实施例中,细胞是人细胞。在一些实施例中,细胞是斑马鱼细胞。在一些实施例中,细胞是灵长类动物细胞。在一些实施例中,细胞是啮齿动物细胞。在一些实施例中,细胞是合成的,有时称为人工细胞。
在一些实施例中,细胞源自细胞系。本领域已知多种用于组织培养的细胞系。细胞系的实例包含但不限于293T、MF7、K562、HeLa、CHO和其转基因变种。细胞系可从本领域技术人员已知的各种来源获得(参见例如,美国典型培养物保藏中心(ATCC)(弗吉尼亚州马纳萨斯(Manassas,Va)))。在一些实施例中,细胞是永生细胞或无限增殖化细胞。在一些实施例中,细胞是干细胞,如全能干细胞(例如,全能的)、多能干细胞、专能干细胞、寡能干细胞或单能干细胞。在一些实施例中,细胞是诱导多能干细胞(iPSC)或源自iPSC。在一些实施例中,细胞是间充质干细胞。在一些实施例中,细胞是胚胎干细胞。在一些实施例中,细胞是造血干细胞。在一些实施例中,细胞是分化细胞。例如,在一些实施例中,分化细胞是肌肉细胞(例如,肝细胞)、脂细胞(例如,脂肪细胞)、骨细胞(例如,成骨细胞、骨细胞、破骨细胞)、血细胞(例如,单核细胞、淋巴细胞、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、巨噬细胞、红细胞或血小板)、神经细胞(例如,神经元)、上皮细胞、免疫细胞(例如,淋巴细胞、嗜中性粒细胞、单核细胞或巨噬细胞)、肝脏细胞(例如,肝细胞)、成纤维细胞或性细胞。在一些实施例中,细胞是终末分化细胞。例如,在一些实施例中,终末分化细胞是神经元细胞、脂肪细胞、心肌细胞、骨骼肌细胞、表皮细胞或肠细胞。在一些实施例中,细胞是胶质细胞。在一些实施例中,细胞是胰岛细胞,包含α细胞、β细胞、δ细胞或肠嗜铬细胞。在一些实施例中,细胞是免疫细胞。在一些实施例中,免疫细胞是T细胞。在一些实施例中,免疫细胞是B细胞。在一些实施例中,免疫细胞是自然杀伤(NK)细胞。在一些实施例中,免疫细胞是肿瘤浸润淋巴细胞(TIL)。在一些实施例中,细胞是哺乳动物细胞,例如,人细胞、灵长类动物细胞或鼠类细胞。在一些实施例中,鼠类细胞源自野生型小鼠、免疫抑制小鼠或疾病特异性小鼠模型。在一些实施例中,细胞是活组织、器官或生物体内的细胞。
在一些实施例中,细胞是原代细胞。例如,原代细胞的培养物可以传代0次、1次、2次、4次、5次、10次、15次或更多次。在一些实施例中,通过任何已知的方法从个体中采集原代细胞。例如,可以通过分离技术、白细胞分离技术、密度梯度分离等方法采集白细胞。来自皮肤、肌肉、骨髓、脾脏、肝脏、胰腺、肺、肠、胃等组织的细胞可以通过活检采集。可以使用适当的溶液来分散或悬浮采集的细胞。此类溶液通常是平衡盐溶液(例如,生理盐水、磷酸盐缓冲盐水(PBS)、汉克氏平衡盐溶液等,所述平衡盐溶液方便地补充有胎牛血清或其它天然存在的因子、与低浓度的可接受缓冲液结合。缓冲液可以包含HEPES、磷酸盐缓冲液、乳酸盐缓冲液等。细胞可以立即使用,或者其可以储存(例如,通过冷冻)。冷冻的细胞可以解冻,并且能够重新使用。细胞可以在DMSO、血清、培养基缓冲液(例如,10% DMSO、50%血清、40%缓冲培养基)和/或用于在冷冻温度下保存细胞的一些其它此类普通溶液中冷冻。
在其中将本文所公开的基因编辑系统引入到多个细胞中的实施例中,至少约0.5%的细胞包括所期望的编辑。在一些实施例中,至少约1%的细胞包括所期望的编辑。在一些实施例中,至少约2%的细胞包括所期望的编辑。在一些实施例中,至少约3%的细胞包括所期望的编辑。在一些实施例中,至少约4%的细胞包括所期望的编辑。在一些实施例中,至少约5%的细胞包括所期望的编辑。在一些实施例中,至少约10%的细胞包括所期望的编辑。在一些实施例中,至少约20%的细胞包括所期望的编辑。在一些实施例中,至少约30%的细胞包括所期望的编辑。在一些实施例中,至少约40%的细胞包括所期望的编辑。在一些实施例中,至少约50%的细胞包括所期望的编辑。
携带进行所期望的基因编辑的细胞,例如通过本文所公开的方法使用本文也公开的任何基因编辑系统产生的细胞,也在本公开的范围内。在一些情况下,由如本文所描述的CRISPR核酸酶、逆转录酶和编辑模板RNA修饰的细胞可以用作制备生物分子的表达系统。例如,经修饰的细胞可以用于产生生物分子,如蛋白质(例如,细胞因子、抗体、基于抗体的分子)、肽、脂质、碳水化合物、核酸、氨基酸和维生素。在其它实施例中,经修饰的细胞可以用于产生病毒载体,如慢病毒、腺病毒、腺相关病毒和溶瘤病毒载体。在一些实施例中,经修饰的细胞可以用于细胞毒性研究中。在一些实施例中,经修饰的细胞可以用作疾病模型。在一些实施例中,经修饰的细胞可以用于疫苗生产。在一些实施例中,经修饰的细胞可以用于治疗。例如,在一些实施例中,经修饰的细胞可以用于细胞疗法,如输血和移植。
在一些实施例中,由如本文所描述的CRISPR核酸酶、逆转录酶和编辑模板RNA修饰的细胞可以用于建立包括经修饰的基因组序列的新细胞系。在一些实施例中,本公开的经修饰的细胞是分化成包括经修饰的干细胞的缺失的一种或多种细胞谱系的经修饰的干细胞(例如,经修饰的全能/全能干细胞、经修饰的多能干细胞、经修饰的专能干细胞、经修饰的寡能干细胞或经修饰的单能干细胞)。本公开进一步提供了包括本公开的经修饰的细胞或由本公开的经修饰的细胞产生的生物体(如动物、植物或真菌)。
F.向细胞递送基因编辑系统
在一些实施例中,可以调配任何基因编辑系统或其组分,例如,包含载剂,如载剂和/或聚合物载剂,例如脂质体或脂质纳米颗粒,并且通过已知方法递送到细胞(例如,原核、真核、植物、哺乳动物等)。这些方法包含但不限于转染(例如,脂质介导的阳离子聚合物、磷酸钙、树状物);电穿孔或其它膜破坏方法(例如,核转染)、病毒递送(例如,慢病毒、逆转录病毒、腺病毒、AAV)、显微注射、微粒轰击(“基因枪”)、fugene、直接声波加载、细胞挤压、光学转染、原生质体融合、刺穿转染(impalefection)、磁转染、外来体介导的转移、脂质纳米颗粒介导的转移和其任何组合。
在一些实施例中,所述方法包括将一种或多种核酸(例如,编码CRISPR核酸酶、逆转录酶、编辑模板RNA(例如,RNA向导和RT供体RNA)的核酸等),其一种或多种转录物,和/或预先形成的核糖核蛋白递送到细胞。示例性的细胞内递送方法包含但不限于病毒或病毒样药剂;基于化学的转染方法,如使用磷酸钙、树状物、脂质体或阳离子聚合物(例如,DEAE-葡聚糖或聚乙烯亚胺)的方法;非化学方法,如显微注射、电穿孔、细胞挤压、声致穿孔、光学转染、刺穿转染、原生质体融合、细菌接合、质粒或转座子的递送;基于颗粒的方法,如使用基因枪、磁转染或磁辅助转染、颗粒轰击;和杂交方法,如核转染。在一些实施例中,本申请进一步提供了通过此类方法产生的细胞,以及包括此类细胞或由此类细胞产生的生物体(如动物、植物或真菌)。在一些实施例中,本发明的组合物进一步与影响DNA修复或DNA修复机制的药剂(例如,化合物、分子或生物分子)一起递送。在一些实施例中,本发明的组合物进一步与影响细胞周期的药剂(例如,化合物、分子或生物分子)一起递送。
在一些实施例中,将包括CRISPR核酸酶或CRISPR核酸酶和逆转录酶(例如CRISPR核酸酶-逆转录酶融合体)的第一组合物递送到细胞。在一些实施例中,将包括RNA向导或RNA向导和RT供体RNA(例如,编辑模板RNA)的第二组合物递送到细胞。在一些实施例中,在第二组合物与细胞接触之前,第一组合物与细胞接触。在一些实施例中,在第二组合物与细胞接触的同时,第一组合物与细胞接触。在一些实施例中,在第二组合物与细胞接触之后,第一组合物与细胞接触。在一些实施例中,第一组合物通过第一递送方法递送,并且第二组合物通过第二递送方法递送。在一些实施例中,第一递送方法与第二递送方法相同。例如,在一些实施例中,第一组合物和第二组合物通过病毒递送来递送。在一些实施例中,第一递送方法与第二递送方法不同。例如,在一些实施例中,第一组合物通过病毒递送来递送,并且第二组合物通过脂质纳米颗粒介导的转移来递送,以及第二组合物通过病毒递送来递送,或者第一组合物通过脂质纳米颗粒介导的转移来递送,并且第二组合物通过病毒递送来递送。
IV.治疗应用
任何基因编辑系统或使用如本文所公开的此类基因编辑系统产生的经修饰的细胞可以用于治疗可受益于由基因编辑系统引入的或由经修饰的细胞携带的基因编辑的疾病。例如,疾病可能是遗传病,并且基因编辑修复了与遗传病相关的基因突变。可替代地,疾病可能与基因的异常表达有关,并且基因编辑拯救了此类异常表达。
在一些实施例中,本文提供了用于治疗疾病的方法,所述方法包括向需要治疗的受试者(例如,人类患者)施用本文所公开的任何基因编辑系统。基因编辑系统可以被递送到需要基因编辑的特定组织或特定类型的细胞。基因编辑系统可以包括涵盖组分中的一种或多种组分的LNP、编码组分中的一种或多种组分的一种或多种载体(例如,病毒载体)或其组合。基因编辑系统的组分可以被调配以形成药物组合物,所述药物组合物可以进一步包括一种或多种药学上可接受的载剂。
在一些实施例中,使用本文所公开的任何基因编辑系统产生的经修饰细胞可以向需要治疗的受试者(例如,人类患者)施用。经修饰的细胞可以包括本文所描述的取代、插入和/或缺失。在一些实例中,经修饰的细胞可以包含由CRISPR核酸酶、逆转录酶多肽和编辑模板RNA(例如,RNA向导和RT供体RNA)修饰的细胞系。在一些情况下,经修饰的细胞可以是包括具有不同类型的基因编辑的细胞的异源群体。可替代地,经修饰的细胞可以包括包含一个特定基因编辑的基本上同源的细胞群体(例如,整个群体中至少80%的细胞)。在一些实例中,细胞可以悬浮在合适的培养基中。
在一些实施例中,本文提供了包括基因编辑系统或其组分或经修饰的细胞的组合物。此类组合物可以是药物组合物。有用的药物组合物可以以适用于口服、直肠、阴道、肠胃外、局部、肺部、鼻内、病灶内、口腔、眼部、静脉内、器官内或另一种施用途径的调配物制备、包装或销售。本公开的药物组合物可以以单个单位剂量或多个单个单位剂量的形式大量制备、包装或销售。如本文所使用的,“单位剂量”是包括预定数量的细胞的药物组合物的离散量。细胞的数量通常等于将向受试者施用的细胞的剂量或此类剂量的方便分数,例如此类剂量的一半或三分之一。
适用于胃肠外施用的药物组合物的调配物可以包括与药学上可接受的载剂,如无菌水或无菌等渗盐水组合的活性剂(例如,基因编辑系统或其组分或经修饰的细胞)。此类调配物可以以适用于团注施用或连续施用的形式制备、包装或销售。一些可注射调配物可以以单位剂型,如以安瓿或含有防腐剂的多剂量容器形式制备、包装或销售。用于肠胃外施用的一些调配物包含但不限于悬浮液、溶液、油性或水性媒剂中的乳液、糊剂以及可植入的持续释放的或生物可降解的调配物。一些调配物可以进一步包括一种或多种另外的成分,包含但不限于悬浮剂、稳定剂或分散剂。
药物组合物可以呈无菌可注射水性或油性悬浮液或溶液的形式。这种悬浮液或溶液可以根据已知技术来调配,并且除了细胞之外还可以包括另外的成分,如本文所描述的分散剂、润湿剂或悬浮剂。此类无菌可注射调配物可以使用无毒肠胃外可接受的稀释剂或溶剂,如水或盐水制备。其它可接受的稀释剂和溶剂包含但不限于林格氏溶液(Ringer’ssolution)、等渗氯化钠溶液和固定油,如合成甘油单酯或甘油二酯。可用的其它可肠胃外施用的调配物包含可以包括呈包装形式、呈脂质体制剂形式或作为可生物降解的聚合物系统的组分的细胞的那些。用于持续释放或植入的一些组合物可以包括药学上可接受的聚合物或疏水材料,如乳液、离子交换树脂、微溶聚合物或微溶盐。
V.试剂盒和其用途
本公开还提供了可以用于例如实施本文所描述的方法的试剂盒或系统。在一些实施例中,试剂盒或系统包含CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和逆转录酶。在一些实施例中,试剂盒或系统包含编码CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和逆转录酶的多核苷酸,并且任选地多核苷酸包括在例如,如本文所描述的载体内。在一些实施例中,试剂盒或系统包含V型核酸酶-逆转录酶融合多肽(例如,Cas12i-逆转录酶融合多肽,如Cas12i2-RT融合体或Cas12i4-RT融合体)。试剂盒或系统还可以包含逆转录酶和如本文所描述的编辑模板RNA(例如,RNA向导和RT供体RNA)。本发明的试剂盒或系统的RNA向导和/或RT供体RNA可以被设计成靶向所关注的序列。CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)、逆转录酶和编辑模板RNA(例如,RNA向导和RT供体RNA)可以包装在试剂盒或系统内的相同小瓶或其它器皿中,或者可以包装在单独的小瓶或其它器皿中,其内容物可以在使用之前混合。试剂盒或系统可以另外地包含任选地缓冲液和/或CRISPR核酸酶(例如,V型核酸酶,如Cas12i多肽)和逆转录酶,以及编辑模板RNA(例如,RNA向导和RT供体RNA)的使用说明。
在一些实施例中,试剂盒包括包含CRISPR核酸酶或CRISPR核酸酶和逆转录酶(例如,CRISPR核酸酶-逆转录酶融合体)的第一组合物。在一些实施例中,试剂盒包括包含RNA向导或RNA向导和RT供体RNA(例如,编辑模板RNA)的第二组合物。在一些实施例中,第一组合物和第二组合物包装在相同的小瓶内。在一些实施例中,第一组合物和第二组合物包装在不同的小瓶内。
在一些实施例中,试剂盒可以用于研究目的。例如,在一些实施例中,试剂盒可以用于研究基因功能。
本文所引用的所有参考文献和出版物特此通过引用并入。
另外的实施例
下文提供了另外的实施例,其也在本公开的范围内。
实施例1:一种组合物,其包括:
(a)V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的核酸,所述V型CRISPR核酸酶多肽任选地是Cas12多肽;
(b)RNA向导或编码所述RNA向导的核酸,其中所述RNA向导包括V型核酸酶结合序列(例如,直接重复序列)和DNA结合序列(例如,间隔子序列);
(c)逆转录酶多肽或编码所述逆转录酶多肽的核酸;以及
(d)逆转录供体RNA(RT供体RNA),所述RT供体RNA包括引物结合。
在实施例1中,所述V型CRISPR核酸酶可以是Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c、Cas12d、Cas12e、Cas12f、Cas12h、Cas12i或Cas12j(CasPhi)多肽。在一些实例中,所述V型CRISPR核酸酶多肽是Cas12i多肽,所述Cas12i多肽任选地包括Cas12i1多肽或变体Cas12i1多肽、Cas12i2多肽或变体Cas12i2多肽、Cas12i3多肽或变体Cas12i3多肽或Cas12i4多肽或变体Cas12i4多肽。
实施例2:根据实施例1所述的组合物可以包括Cas12i多肽,所述Cas12i多肽可以是以下中的一种:
(a)所述Cas12i1多肽,所述Cas12i1多肽包括与SEQ ID NO:8具有至少80%同一性的氨基酸序列;任选地与SEQ ID NO:8具有至少95%同一性的氨基酸序列;
(b)所述Cas12i2多肽,所述Cas12i2多肽包括与SEQ ID NO:2-7中的任一者具有至少80%同一性的氨基酸序列;任选地与SEQ ID NO:2-7中的任一者具有至少95%同一性的氨基酸序列;
(c)所述Cas12i3多肽,所述Cas12i3多肽包括与SEQ ID NO:11具有至少80%同一性的氨基酸序列;任选地与SEQ ID NO:11具有至少95%的同一性的氨基酸序列;以及
(d)所述Cas12i4多肽,所述Cas12i4多肽包括与SEQ ID NO:9具有至少80%同一性或与SEQ ID NO:10具有至少80%同一性的氨基酸序列;任选地与SEQ ID NO:9具有至少95%同一性或与SEQ ID NO:10具有至少95%同一性的氨基酸序列。
在具体实例中,根据实施例2所述的组合物包括以下中的一种:
(a)所述Cas12i1多肽,所述Cas12i1多肽包括SEQ ID NO:8中所示的氨基酸序列;
(b)所述Cas12i2多肽,所述Cas12i2多肽包括SEQ ID NO:2-7中的任一者中所示的氨基酸序列;
(c)所述Cas12i3多肽,所述Cas12i3多肽包括SEQ ID NO:11中所示的氨基酸序列;以及
(d)所述Cas12i4多肽,所述Cas12i4多肽包括SEQ ID NO:9或SEQ ID NO:10中所示的氨基酸序列。
根据本文所公开的实施例2所述的组合物中的任何组合物可以包括具有降低的crRNA处理活性或缺乏crRNA处理活性的所述V型CRISPR核酸酶多肽。例如,所述V型CRISPR核酸酶多肽是Cas12i2多肽,并且其中所述Cas12i2多肽包括位于位置H485或H486处的取代。在一些情况下,所述Cas12i2多肽包括与SEQ ID NO:2-7中的任一者的至少80%同一性,并且其中所述Cas12i2多肽包括位于位置H485或H486处的取代。在一些实例中,所述Cas12i2多肽包括与SEQ ID NO:2-7中的任一者的至少95%同一性,并且其中所述Cas12i2多肽包括位于位置H485或H486处的取代。
根据本文所公开的实施例2所述的组合物中的任何组合物可以包括所述V型CRISPR核酸酶多肽,所述V型CRISPR核酸酶多肽包括以下中的至少一种:表位肽、核定位信号和核输出信号。
在一些实例中,根据实施例2所述的组合物包括以下中的一种:
(a)所述Cas12i1多肽,所述Cas12i1多肽包括与SEQ ID NO:8具有至少80%(例如,至少95%)同一性的氨基酸序列,并且所述直接重复序列包括与SEQ ID NO:12-14中的任一者具有至少90%同一性的核苷酸序列;
(b)所述Cas12i2多肽,所述Cas12i2多肽包括与SEQ ID NO:2-7中的任一者具有至少80%(例如,至少95%)同一性的氨基酸序列,并且所述直接重复序列包括与SEQ ID NO:15-17中的任一者具有至少90%同一性的核苷酸序列;
(c)所述Cas12i3多肽,所述Cas12i3多肽包括与SEQ ID NO:11具有至少80%(例如,至少95%)同一性的氨基酸序列,并且所述直接重复序列包括与SEQ ID NO:18-20中的任一者具有至少90%同一性的核苷酸序列;以及
(d)所述Cas12i4多肽,所述Cas12i4多肽包括与SEQ ID NO:9或SEQ ID NO:10具有至少80%(例如,至少95%)同一性的氨基酸序列,并且所述直接重复序列包括与SEQ IDNO:21-24中的任一者具有至少90%同一性的核苷酸序列。
在一些实例中,根据实施例2所述的组合物包括以下中的一种:
(a)所述Cas12i1多肽,所述Cas12i1多肽包括与SEQ ID NO:8具有至少95%同一性的氨基酸序列,并且所述直接重复序列包括与SEQ ID NO:12-14中的任一者具有至少95%同一性的核苷酸序列;
(b)所述Cas12i2多肽,所述Cas12i2多肽包括与SEQ ID NO:2-7中的任一者具有至少95%同一性的氨基酸序列,并且所述直接重复序列包括与SEQ ID NO:15-17中的任一者具有至少95%同一性的核苷酸序列;
(c)所述Cas12i3多肽,所述Cas12i3多肽包括与SEQ ID NO:11具有至少95%同一性的氨基酸序列,并且所述直接重复序列包括与SEQ ID NO:18-20中的任一者具有至少95%同一性的核苷酸序列;以及
(d)所述Cas12i4多肽,所述Cas12i4多肽包括与SEQ ID NO:9或SEQ ID NO:10具有至少95%同一性的氨基酸序列,并且所述直接重复序列包括与SEQ ID NO:21-24中的任一者具有至少95%同一性的核苷酸序列。
实施例3:根据本文所公开的实施例1或实施例2所述的组合物中的任何组合物的所述间隔子序列的长度为约10个核苷酸至约50个核苷酸。在一些实例中,所述间隔子序列的长度为约15个核苷酸至约35个核苷酸。在一些实例中,所述间隔子序列与靶核酸的靶链(例如,靶序列的互补序列)基本上互补。在一些实例中,所述靶序列与非靶链上的原间隔子相邻基序(PAM)序列相邻。
实施例4:根据实施例1、2或3所述的组合物中的任何组合物,可以包括是Cas12i多肽的所述V型核酸酶,并且其中所述PAM序列包括如5'-NTTN-3'所示的序列,其中N是任何核苷酸。
实施例5:在根据任何前述实施例所述的组合物中的任何组合物中,所述逆转录酶多肽包括MMLV-RT、MMTV-RT、Marathon-RT或RTX逆转录酶。
实施例6:在根据实施例1至5中任一项所述的组合物中的任何组合物中,所述逆转录酶多肽与所述V型CRISPR核酸酶多肽融合。在一些实例中,所述逆转录酶多肽与所述V型CRISPR核酸酶多肽的N末端融合。在其它实例中,所述逆转录酶多肽与所述V型CRISPR核酸酶多肽的C末端融合。在又其它实例中,所述逆转录酶多肽被插入所述V型CRISPR核酸酶多肽的环内。
实施例7:在根据实施例1至5中任一项所述的组合物中的任何组合物中,所述逆转录酶多肽和所述V型CRISPR核酸酶多肽通过亮氨酸拉链、纳米抗体、抗体或卷曲螺旋结构域形成复合物。
实施例8:在根据实施例1至7中任一项所述的组合物中的任何组合物中,所述RT供体RNA可以与所述RNA向导融合。在一些实例中,所述RT供体RNA与所述RNA向导的5'端融合。在其它实例中,所述RT供体RNA与所述RNA向导的3'端融合。在一些情况下,所述RNA向导的所述间隔子序列与所述RT供体RNA中的逆转录模板序列相邻。可替代地,所述RNA向导的所述间隔子序列与所述RT供体RNA中的PBS相邻。在其它情况下,所述RNA向导的所述直接重复序列与RT RNA供体中的逆转录模板序列相邻。可替代地,所述RNA向导的所述直接重复序列与所述RT供体RNA中的PBS相邻。
在一些实例中,所述RT供体RNA-RNA向导融合多核苷酸可以进一步包括接头。在一些情况下,所述接头位于所述直接重复序列与所述PBS之间。在其它情况下,所述接头位于所述间隔子序列与所述逆转录模板序列之间。所述接头的长度可以介于约1个核苷酸与约200个核苷酸之间。在一些实例中,所述接头包括发夹。
实施例9:在根据实施例1至8中任一项所述的组合物中的任何组合物中,所述PBS的长度可以介于约3个核苷酸与约200个核苷酸之间。例如,所述PBS的长度为约3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、105个或110个核苷酸。在一些情况下,所述PBS与所述非靶链(PAM链)的游离3'端杂交(通过碱基配对结合)。在其它情况下,所述PBS杂交所述靶链(非PAM链)的游离3'端。
实施例10:在根据实施例1至9中任一项所述的组合物中的任何组合物中,所述逆转录模板序列的长度介于约10个核苷酸与约300个核苷酸之间。例如,所述逆转录模板序列的长度为约10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、105个、110个、115个或120个核苷酸。
实施例11:在根据实施例1至10中任一项所述的组合物中的任何组合物中,所述PBS与所述靶核酸的所述靶链或所述非靶链(其为双链)具有基本互补性。例如,所述PBS包括与所述靶核酸的所述靶链或所述非靶链的至少约75%互补性。在其它实例中,所述PBS包括与所述靶核酸的所述靶链或所述非靶链的至少约85%互补性。在其它实例中,所述PBS包括与所述靶核酸的所述靶链或所述非靶链的至少约95%互补性。
实施例12:在根据实施例1至11中任一项所述的组合物中的任何组合物中,所述逆转录模板序列包括适体。在一些情况下,所述适体募集所述逆转录酶多肽。
实施例13:在根据实施例1至11中任一项所述的组合物中的任何组合物中,逆转录模板包括修饰,例如在5'端处或在3'端处。在一些实例中,所述修饰是化学修饰。在其它实例中,所述修饰是包括次级结构的核酸序列。在具体实例中,所述修饰是发夹、假结、三链体结构、核糖核酸外切酶抗性RNA(xrRNA)、转移RNA(tRNA)或截短的tRNA。在其它具体实例中,所述修饰包括核酸酶结合序列(例如,一个或多个直接重复序列)或核酸酶结合序列和DNA结合序列(间隔子)。
根据实施例1至13中任一项所述的组合物中的任何组合物可以将编辑引入到所述靶链或所述非靶链中。在一些实例中,所述编辑是取代、插入或缺失。在一些情况下,所述编辑是1个核苷酸至约200个核苷酸的取代。在一些情况下,所述编辑是1个核苷酸至约120个核苷酸的取代。在一些情况下,所述编辑是1个核苷酸至约20个核苷酸的取代。在其它情况下,所述编辑是1个核苷酸至约200个核苷酸的插入,例如,1个核苷酸至约120个核苷酸的插入,1个核苷酸至约20个核苷酸的插入。在一些实例中,所述插入包括发夹。在又其它情况下,所述编辑是1个核苷酸至约100个核苷酸的缺失。例如,所述编辑是1个核苷酸至约120个核苷酸的缺失,或1个核苷酸至约20个核苷酸的缺失。
在一些实例中,所述编辑发生在所述PAM序列的约200个核苷酸内。在一个实例中,所述编辑发生在所述PAM序列的约100个核苷酸内。在另一个实例中,所述编辑发生在所述PAM序列的约50个核苷酸内。在又另一个实例中,所述编辑发生在所述PAM序列的约30个核苷酸内。在仍另一个实例中,所述编辑发生在所述PAM序列的约20个核苷酸内。
在一些实例中,所述编辑开始和/或终止于所述PAM序列上游的约200个核苷酸内,例如,开始和/或终止于所述PAM序列上游的约100个核苷酸内、开始和/或终止于所述PAM序列上游的约50个核苷酸内、开始和/或终止于所述PAM序列上游的约30个核苷酸内、开始和/或终止于所述PAM序列上游的约20个核苷酸内、开始和/或终止于所述PAM序列上游的约10个核苷酸内、开始和/或终止于所述PAM序列上游的约5个核苷酸内或开始和/或终止于所述PAM序列下游的约5个核苷酸内。
在其它实例中,所述编辑开始和/或终止于所述PAM序列下游的约10个核苷酸内,例如,开始和/或终止于所述PAM序列下游的约25个核苷酸内。
在一些实例中,所述编辑去除或改变了所述PAM序列。在一些实例中,所述编辑防止所述V型CRISPR核酸酶多肽的再靶向(例如,防止所述V型CRISPR核酸酶与所述靶序列的结合)。
实施例14:在根据实施例1至13中任一项所述的组合物中的任何组合物中,所述靶序列存在于细胞中。
实施例15:根据实施例1至14中任一项所述的组合物中的任何组合物可以被调配以用于递送到细胞。在一些实例中,所述细胞是哺乳动物细胞,例如人细胞。在一个实例中,所述细胞是肝脏细胞(例如,肝细胞)。
在一些实例中,所述V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的核酸、所述RNA向导或编码所述RNA向导的核酸、所述逆转录酶多肽或编码所述逆转录酶多肽的核酸和所述RT供体RNA在单个递送媒剂中调配。
在其它实例中,所述V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的核酸、所述RNA向导或编码所述RNA向导的核酸、所述逆转录酶多肽或编码所述逆转录酶多肽的核酸和所述RT供体RNA在两种或更多种递送媒剂中调配。
在又其它实例中,所述V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的核酸和所述逆转录酶多肽或编码所述逆转录酶多肽的核酸在单个递送媒剂中调配。
在一些实例中,所述RNA向导和所述RT供体RNA在单个递送媒剂中调配。在一些实例中,所述V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的核酸和所述逆转录酶多肽或编码所述逆转录酶多肽的核酸在第一递送媒剂中调配,并且所述RNA向导和所述RT供体RNA在第二递送媒剂中调配。
实施例16:在根据实施例1至15中任一项所述的组合物中的任何组合物中,如果适用的话,所述V型CRISPR核酸酶多肽、逆转录酶多肽、RNA向导和/或RT供体RNA在一种或多种载体,例如一种或多种表达载体中编码。
实施例17:一种载体,其包括编码根据实施例1至16中任一项所述的组合物的所述V型CRISPR核酸酶多肽、逆转录酶多肽、RNA向导和/或RT供体RNA的序列。
实施例18:一种细胞,其包括根据实施例1至16中任一项所述的组合物或根据实施例17所述的载体。在一些实例中,所述细胞是哺乳动物细胞,例如人细胞。在一个实例中,所述细胞是肝脏细胞(例如,肝细胞)。
实施例19:一种表达根据实施例17所述的载体的方法。
实施例20:一种产生根据实施例1至17中任一项所述的组合物的方法。
实施例21:一种递送根据实施例1至16中任一项所述的组合物的方法。
在一些实例中,所述V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的核酸、所述RNA向导或编码所述RNA向导的核酸、所述逆转录酶多肽或编码所述逆转录酶多肽的核酸和所述RT供体RNA在单个递送媒剂中递送。
在其它实例中,所述V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的核酸、所述RNA向导或编码所述RNA向导的核酸、所述逆转录酶多肽或编码所述逆转录酶多肽的核酸和所述RT供体RNA在两种或更多种递送媒剂中递送。
在又其它实例中,所述V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的核酸和所述逆转录酶多肽或编码所述逆转录酶多肽的核酸在单个递送媒剂中递送。
在一些情况下,所述RNA向导和所述RT供体RNA在单个递送媒剂中递送。
在具体实例中,所述V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的核酸和所述逆转录酶多肽或编码所述逆转录酶多肽的核酸在第一递送媒剂中递送,并且所述RNA向导和所述RT供体RNA在第二递送媒剂中递送。
实施例22:一种将根据实施例1至16中任一项所述的组合物与靶核酸结合的方法。在一些实例中,所述靶核酸存在于细胞,例如,哺乳动物细胞,如人细胞中。在一个实例中,所述细胞是肝脏细胞(例如,肝细胞)。
实施例23:一种将编辑引入到靶核酸中的方法,所述靶核酸包括使靶核酸与根据实施例1至16中任一项所述的组合物接触。在一些实例中,所述组合物将编辑引入到所述靶核酸的所述靶链或所述非靶链中。在一些情况下,所述编辑是取代、插入或缺失。
在具体实例中,所述编辑是1个核苷酸至约200个核苷酸的取代,例如,1个核苷酸至约120个核苷酸的取代或1个核苷酸至约20个核苷酸的取代。在其它具体实例中,所述编辑是1个核苷酸至约200个核苷酸的插入,例如,1个核苷酸至约120个核苷酸的插入或1个核苷酸至约20个核苷酸的插入。在一些情况下,所述插入包括发夹。在又其它具体实例中,所述编辑是1个核苷酸至约100个核苷酸的缺失,例如,1个核苷酸至约120个核苷酸的缺失或1个核苷酸至约20个核苷酸的缺失。
在一些情况下,所述编辑发生在所述PAM序列的约200个核苷酸内,例如,发生在所述PAM序列的约100个核苷酸内,发生在所述PAM序列的约50个核苷酸内,发生在所述PAM序列的约30个核苷酸内或发生在所述PAM序列的约20个核苷酸内。
在一些情况下,所述编辑开始和/或终止于所述PAM序列上游的约200个核苷酸内,例如,开始和/或终止于所述PAM序列上游的约100个核苷酸内、开始和/或终止于所述PAM序列上游的约50个核苷酸内、开始和/或终止于所述PAM序列上游的约30个核苷酸内、开始和/或终止于所述PAM序列上游的约20个核苷酸内、开始和/或终止于所述PAM序列上游的约10个核苷酸内或开始和/或终止于所述PAM序列上游的约5个核苷酸内。
可替代地,所述编辑开始和/或终止于所述PAM序列下游的约25个核苷酸内,例如,开始和/或终止于所述PAM序列下游的约10个核苷酸内或开始和/或终止于所述PAM序列下游的约5个核苷酸内。
在一些实例中,所述编辑去除或改变了所述PAM序列。
实施例24:一种编辑模板RNA,其包括:
(a)CRISPR核酸酶结合序列;
(b)DNA结合序列,所述DNA结合序列与包括靶链和非靶链的靶核酸的靶链(例如,靶序列的互补序列)互补,其中靶序列与所述非靶链上的原间隔子相邻基序(PAM)序列相邻;以及
(c)逆转录供体RNA(RT供体RNA),所述RT供体RNA包括引物结合位点(PBS)和逆转录模板序列,其中所述PBS与与所述靶序列相邻的序列基本上互补,并且其中所述逆转录模板序列包括相对于所述靶核酸的至少一个经编码的编辑,并且
其中所述DNA结合序列和所述PBS与所述靶核酸的同一条链结合。
实施例25:在根据实施例24所述的编辑模板RNA中,所述DNA结合序列和所述PBS与所述靶核酸的靶链(非PAM链)结合。
实施例26:在根据实施例24所述的编辑模板RNA中,至少一个经编码的编辑相对于所述靶核酸的所述非靶链(PAM链)。
实施例27:根据实施例24至26中任一项所述的编辑模板RNA在与所述靶核酸结合时包括未配对核苷酸区。例如,所述未配对核苷酸区与所述DNA结合序列相邻。可替代地或另外,所述未配对核苷酸区与所述PBS相邻。在一些情况下,所述未配对核苷酸区包括所述逆转录模板序列。
实施例28:在根据实施例24至27中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述CRISPR核酸酶结合序列、PBS和逆转录模板序列是RNA序列。
实施例29:在根据实施例24至28中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述CRISPR核酸酶结合序列与II型CRISPR核酸酶结合。
实施例30:在根据实施例24至28中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述CRISPR核酸酶结合序列与V型CRISPR核酸酶结合。在一些实例中,所述CRISPR核酸酶结合序列与Cas12i多肽或变体Cas12i多肽结合。在一些情况下,所述CRISPR核酸酶结合序列与与SEQ ID NO:2-11中的任一者具有至少80%同一性的多肽结合。在一个实例中,所述CRISPR核酸酶结合序列与与SEQ ID NO:2-11中的任一者具有至少95%同一性的多肽结合。在另一个实例中,所述CRISPR核酸酶结合序列与包括SEQ ID NO:2-11中的任一者的氨基酸序列的多肽结合。
实施例31:在根据实施例24至30中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述CRISPR核酸酶结合序列与具有降低的crRNA处理活性或缺乏crRNA处理活性的CRISPR核酸酶结合。
实施例32:在根据实施例24至31中任一项所述的编辑模板RNA中的任何编辑模板RNA中,如果适用的话,所述CRISPR核酸酶结合序列是直接重复序列。在一些实例中,所述CRISPR核酸酶结合序列是Cas9直接重复序列。在其它实例中,所述CRISPR核酸酶结合序列是Cas12i直接重复序列。在一些情况下,所述CRISPR核酸酶结合序列包括与SEQ ID NO:12-24中的任一者具有至少90%同一性的核苷酸序列。例如,所述CRISPR核酸酶结合序列包括与SEQ ID NO:12-24中的任一者具有至少95%同一性的核苷酸序列。在一个实例中,所述CRISPR核酸酶结合序列包括SEQ ID NO:12-24中的任一者中所示的核苷酸序列。
实施例33:在根据实施例24至32中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述CRISPR核酸酶结合序列与所述DNA结合序列相邻。例如,所述DNA结合序列是所述CRISPR核酸酶结合序列的3'延伸部。
实施例34:在根据实施例24至33中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述DNA结合序列是RNA序列、DNA序列或RNA/DNA杂交序列。
实施例35:在根据实施例24至34中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述DNA结合序列(例如,间隔子序列)的长度为约10个核苷酸至约50个核苷酸。在一些实例中,所述DNA结合序列的长度为约15个核苷酸至约35个核苷酸。
实施例36:在根据实施例24至35中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述DNA结合序列与所述PBS相邻。在一些实例中,所述PBS是所述DNA结合序列的3'延伸部
实施例37:在根据实施例24至36中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述PBS的长度介于约3个核苷酸与约200个核苷酸之间。例如,所述PBS的长度为约3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、105个或110个核苷酸。
实施例38:在根据实施例24至37中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述PBS与所述逆转录模板序列相邻。在一些实例中,所述逆转录模板序列是所述PBS的3'延伸部。
实施例39:在根据实施例24至38中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述逆转录模板序列的长度为约10个核苷酸至约300个核苷酸。在一些实例中,所述逆转录模板序列的长度为约10个、15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、105个、110个、115个或120个核苷酸。
实施例40:根据实施例24至39中任一项所述的编辑模板RNA中的任何编辑模板RNA从5'至3'可以包括所述核酸酶结合序列、所述DNA结合序列、所述逆转录模板和所述PBS。
实施例41:根据实施例24至39中任一项所述的编辑模板RNA中的任何编辑模板RNA从5'至3'可以包括所述逆转录模板、所述PBS、所述核酸酶结合序列和所述DNA结合序列。
实施例42:在根据实施例24至41中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述PBS的3'端包括修饰。
实施例43:在根据实施例24至42中任一项所述的编辑模板RNA中的任何编辑模板RNA中,所述逆转录模板的5'端包括修饰。
实施例44:在根据实施例42或43所述的编辑模板RNA中,所述修饰是化学修饰。
实施例45:在根据实施例42或43所述的编辑模板RNA中,所述修饰是包括次级结构的核酸序列。例如,所述修饰是发夹、假结、三链体结构、xrRNA、tRNA或截短的tRNA。
实施例46:在根据实施例42或43所述的编辑模板RNA中,所述修饰包括核酸酶结合序列或核酸酶结合序列和DNA结合序列。
实施例47:根据实施例24至47中任一项所述的编辑模板RNA中的任何编辑模板RNA可以引起编辑,所述编辑可以是取代、插入或缺失。在一些实例中,所述编辑是1个核苷酸至约200个核苷酸的取代,例如,1个核苷酸至约120个核苷酸的取代或1个核苷酸至约20个核苷酸的取代。在其它实例中,所述编辑是1个核苷酸至约200个核苷酸的插入,例如,1个核苷酸至约120个核苷酸的插入或1个核苷酸至约20个核苷酸的插入。在一些情况下,所述插入包括发夹。在又其它实例中,所述编辑是1个核苷酸至约100个核苷酸的缺失,例如,1个核苷酸至约120个核苷酸的缺失或1个核苷酸至约20个核苷酸的缺失。
在一些实例中,所述编辑在所述PAM序列的约200个核苷酸内,例如,在所述PAM序列的约100个核苷酸内,在所述PAM序列的约50个核苷酸内,在所述PAM序列的约30个核苷酸内或在所述PAM序列的约20个核苷酸内。
在一些实例中,所述编辑开始和/或终止于所述PAM序列上游的约200个核苷酸内,例如,开始和/或终止于所述PAM序列上游的约100个核苷酸内、开始和/或终止于所述PAM序列上游的约50个核苷酸内、开始和/或终止于所述PAM序列上游的约30个核苷酸内、开始和/或终止于所述PAM序列上游的约20个核苷酸内、开始和/或终止于所述PAM序列上游的约10个核苷酸内或开始和/或终止于所述PAM序列上游的约5个核苷酸内。
在其它实例中,所述编辑开始和/或终止于所述PAM序列下游的约5个核苷酸内。在一个实例中,所述编辑开始和/或终止于所述PAM序列下游的约10个核苷酸内。在另一个实例中,所述编辑开始和/或终止于所述PAM序列下游的约25个核苷酸内。
在一些实例中,所述编辑去除或改变了所述PAM序列。可替代地或另外,所述编辑防止所述V型CRISPR核酸酶多肽的再靶向(例如,防止所述V型CRISPR核酸酶与所述靶序列的结合)。
实施例48:根据实施例24至47中任一项所述的编辑模板RNA存在于细胞,例如哺乳动物细胞,如人细胞中。在一个实例中,所述细胞是肝脏细胞(例如,肝细胞)。
实施例49:根据实施例24至47中任一项所述的编辑模板RNA被调配以用于递送到细胞,例如哺乳动物细胞,如人细胞中。在一个实例中,所述细胞是肝脏细胞(例如,肝细胞)。在一些实例中,所述编辑模板RNA与CRISPR核酸酶或编码所述CRISPR核酸酶的核酸一起在单个递送媒剂中调配。在其它实例中,所述编辑模板RNA与CRISPR核酸酶多肽或编码所述CRISPR核酸酶多肽的核酸和逆转录酶多肽或编码所述逆转录酶多肽的核酸一起在单个递送媒剂中调配。
实施例50:根据实施例24至49中任一项所述的编辑模板RNA,如果适用的话,在载体中编码。
实施例51:一种载体,其包括编码根据实施例24至50中任一项所述的编辑模板RNA的序列。
实施例52:一种复合物,其包括根据实施例24至50中任一项所述的编辑模板RNA。在一些实例中,所述复合物包括CRISPR核酸酶。在其它实例中,所述复合物包括靶序列或靶核酸。在其它实例中,所述复合物包括CRISPR核酸酶和靶序列或靶核酸。
在一些实例中,所述CRISPR核酸酶是切口酶。在其它实例中,所述CRISPR核酸酶切割DNA双链体的两条链。在其它实例中,所述CRISPR核酸酶是钝化切割核酸酶。可替代地,所述CRISPR核酸酶是交错切割核酸酶。
实施例53:一种细胞,其包括根据实施例24至52中任一项所述的编辑模板RNA,载体或复合物。在一些情况下,所述细胞是哺乳动物细胞,如人细胞。在一个实例中,所述细胞是肝脏细胞(例如,肝细胞)。
实施例54:一种表达根据实施例31所述的载体的方法。
实施例55:一种产生根据实施例24至50中任一项所述的编辑模板RNA的方法。
实施例56:一种递送根据实施例24至50中任一项所述的编辑模板RNA的方法。在一些情况下,所述编辑模板RNA与CRISPR核酸酶或编码所述CRISPR核酸酶的核酸一起在单个递送媒剂中调配。在其它实例中,所述编辑模板RNA与CRISPR核酸酶多肽或编码所述CRISPR核酸酶多肽的核酸和逆转录酶多肽或编码所述逆转录酶多肽的核酸一起在单个递送媒剂中调配。
实施例57:一种将根据实施例24至50中任一项所述的编辑模板RNA与CRISPR核酸酶结合的方法。
实施例58:一种将根据实施例24至50中任一项所述的编辑模板RNA与靶序列或靶核酸结合的方法。
实施例59:一种将根据实施例24至50中任一项所述的编辑模板RNA与CRISPR核酸酶和靶序列或靶核酸结合的方法。
实施例60:一种将编辑引入到靶核酸中的方法,所述靶核酸包括使靶核酸与根据实施例24至50中任一项所述的编辑模板RNA和CRISPR核酸酶接触。在一些情况下,所述CRISPR核酸酶是II型CRISPR核酸酶。在一些情况下,所述CRISPR是V型CRISPR核酸酶。在一些实例中,所述CRISPR核酸酶是Cas12i多肽或变体Cas12i多肽。在具体实例中,所述CRISPR核酸酶是与SEQ ID NO:2-11中的任一者具有至少80%同一性,例如,与SEQ ID NO:2-11中的任一者具有至少95%同一性的多肽。在一个实例中,所述CRISPR核酸酶是包括SEQ IDNO:2-11中的任一者的氨基酸序列的多肽。
在一些实例中,所述CRISPR核酸酶是包括降低的crRNA处理活性或缺乏crRNA处理活性的CRISPR核酸酶。
在一些实例中,所述CRISPR核酸酶是切口酶。可替代地,所述CRISPR核酸酶切割DNA双链体的两条链。在一些情况下,所述CRISPR核酸酶是钝化切割核酸酶。可替代地,所述CRISPR核酸酶是交错切割核酸酶。
实施例61:在根据实施例60所述的方法中,所述编辑模板RNA将编辑引入到所述靶核酸的靶链中。在一些实例中,所述编辑是取代、插入或缺失。例如,所述编辑可以是1个核苷酸至约200个核苷酸的取代,例如,1个核苷酸至约120个核苷酸的取代或1个核苷酸至约20个核苷酸的取代。可替代地,所述编辑可以是1个核苷酸至约200个核苷酸的插入,例如,1个核苷酸至约120个核苷酸的插入或1个核苷酸至约20个核苷酸的插入。在一些情况下,所述插入包括发夹。在其它实例中,所述编辑可以是1个核苷酸至约100个核苷酸的缺失,例如,1个核苷酸至约120个核苷酸的缺失或1个核苷酸至约20个核苷酸的缺失。
在一些实例中,所述编辑在所述PAM序列的约200个核苷酸内,例如,在所述PAM序列的约100个核苷酸内,在所述PAM序列的约50个核苷酸内,在所述PAM序列的约30个核苷酸内或在所述PAM序列的约20个核苷酸内。
在一些实例中,所述编辑开始和/或终止于所述PAM序列上游的约200个核苷酸内,例如,开始和/或终止于所述PAM序列上游的约100个核苷酸内、开始和/或终止于所述PAM序列上游的约50个核苷酸内、开始和/或终止于所述PAM序列上游的约30个核苷酸内、开始和/或终止于所述PAM序列上游的约20个核苷酸内、开始和/或终止于所述PAM序列上游的约10个核苷酸内或开始和/或终止于所述PAM序列上游的约5个核苷酸内。
在其它实例中,所述编辑开始和/或终止于所述PAM序列下游的约5个核苷酸内。在一个实例中,所述编辑开始和/或终止于所述PAM序列下游的约10个核苷酸内。在另一个实例中,所述编辑开始和/或终止于所述PAM序列下游的约25个核苷酸内。
在一些实例中,所述编辑去除或改变了所述PAM序列。可替代地或另外,所述编辑防止所述V型CRISPR核酸酶多肽的再靶向(例如,防止所述V型CRISPR核酸酶与所述靶序列的结合)。
在一些实例中,所述靶核酸存在于细胞,例如,哺乳动物细胞,如人细胞中。在一个实例中,所述细胞是肝脏细胞(例如,肝细胞)。
通用技术
除非另有指示,否则本公开的实践将采用在本领域技术范围内的常规分子生物学(包含重组技术)、微生物学、细胞生物学、生物化学和免疫学技术。此类技术在如以下等文献中进行了充分解释:《分子克隆:实验室手册(Molecular Cloning:A LaboratoryManual)》,第二版(Sambrook等人,1989)冷泉港出版社(Cold Spring Harbor Press);《寡核苷酸合成(Oligonucleotide Synthesis)》(M.J.Gait编辑1984);《分子生物学方法(Methods in Molecular Biology)》,胡马纳出版社(Humana Press);《细胞生物学:实验室手册(Cell Biology:A Laboratory Notebook)》(J.E.Cellis编辑,1989)学术出版社(Academic Press);《动物细胞培养(Animal Cell Culture)》(R.I.Freshney编辑,1987);《细胞和组织培养导论(Introduction to Cell and Tissue Culture)》(J.P.Mather和P.E.Roberts,1998),普莱南出版社(Plenum Press);《细胞和组织培养:实验室程序(Celland Tissue Culture:Laboratory Procedures)》(A.Doyle,J.B.Griffiths和D.G.Newell编辑1993-8)约翰·威利父子出版公司(J.Wiley and Sons);《酶学方法(Methods inEnzymology)》(学术出版社公司(Academic Press,Inc.));《实验免疫学手册(Handbook ofExperimental Immunology)》(D.M.Weir和C.C.Blackwell编辑);《哺乳动物细胞基因转移载体(Gene Transfer Vectors for Mammalian Cells)》(J.M.Miller和M.P.Calos编辑,1987);《当代分子生物学实验指南(Current Protocols in Molecular Biology)》(F.M.Ausubel等人编辑1987);《PCR:聚合酶链式反应(PCR:The Polymerase ChainReaction)》(Mullis等人编辑1994);《当代免疫学指南(Current Protocols inImmunology)》(J.E.Coligan等人编辑,1991);《精编分子生物学实验指南(ShortProtocols in Molecular Biology)》(约翰威利父子出版公司,1999);《免疫生物学(Immunobiology)》(C.A.Janeway和P.Travers,1997);《抗体(Antibodies)》(P.Finch,1997);《抗体:实用方法(Antibodies:a practice approach)》(D.Catty.编辑,IRL出版社(IRL Press),1988-1989);《单克隆抗体:实用方法(Monoclonal antibodies:a practicalapproach)》(P.Shepherd和C.Dean编辑,牛津大学出版社(Oxford University Press),2000);《使用抗体:实验室手册(Using antibodies:a laboratory manual)》(E.Harlow和D.Lane(冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),1999));《抗体(The Antibodies)》(M.Zanetti和J.D.Capra编辑哈伍德学术出版社(Harwood AcademicPublishers),1995);《DNA克隆:实用方法(DNA Cloning:A practical Approach)》,第I卷和第II卷(D.N.Glover编辑1985);《核酸杂交(Nucleic Acid Hybridization)》(B.D.Hames和S.J.Higgins编辑(1985));《转录和翻译(Transcription and Translation)》(B.D.Hames和S.J.Higgins编辑(1984));《动物细胞培养》(R.I.Freshney编辑,(1986));《固定化细胞和酶(Immobilized Cells and Enzymes)》(IRL出版社,(1986));以及B.Perbal,《分子克隆实用指南(A practical Guide To Molecular Cloning)》(1984);F.M.Ausubel等人(编辑)。
无需进一步详细阐述,据信本领域的技术人员可以基于以上描述在最大程度上利用本发明。因此,以下具体实施例应被解释为仅是说明性的,并且不以任何方式限制本公开的其余部分。本文所引用的所有公开出于本文参考的目的或主题通过引用并入。
实例
提供以下实例以进一步展示本发明的一些实施例,但不旨在限制本发明的范围;通过其示例性性质将会理解,可以可替代地使用本领域技术人员已知的其它程序、方法或技术。
实例1-哺乳动物细胞中靶链的RNA模板化编辑
此实例描述了哺乳动物基因的靶链编辑(例如,使用结合所选哺乳动物基因的非PAM链的编辑模板RNA)。
将变体Cas12i2(SEQ ID NO:4)与SEQ ID NO:29的突变型MMLV逆转录酶的融合体克隆到pcda3.1主链中(英杰公司(Invitrogen))。变体Cas12i2的N末端和C末端RT融合体的构型在表7中示出。在水中制备用于表达具有变体Cas12i2的RT融合体的质粒的工作溶液(变体Cas12i2-RT融合体工作溶液)。
表7.CAS-RT融合体设计和序列
/>
/>
/>
测试了各种RNA向导-RT供体RNA融合体构型,如在表8中示出的和图8A中描绘的。逆转录模板序列和PBS与RNA向导的3'端融合。逆转录模板序列被设计成将取代、插入、缺失或发夹引入到AAVS1_T7靶标或VEGFA_T5靶标中。RNA向导-RT供体RNA融合体的序列在表9中示出,并且部分在图8B中描绘。在表9和图8B中,“S”是指取代,“I”是指插入,“D”是指缺失,并且“H”是指发夹,并且PBS的长度在括号中。仅用作对照的RNA向导的序列在表10中示出。将RNA向导-RT供体RNA融合体或RNA向导克隆到具有U6启动子的质粒主链中,并最大化制备。在水中制备表达每个RNA向导/RT供体RNA质粒(或RNA向导)的质粒的工作溶液(编辑模板RNA工作溶液)。
表8.RNA向导-RT供体RNA融合体设计。
表9.RNA向导-RT供体融合体序列。
/>
/>
/>
/>
表10.RNA向导对照序列。
/>
转染前大约16小时,将DMEM/10%FBS+Pen/Strep中的25,000个HEK293T细胞平板接种到96孔板中的每个孔中。在转染当天,细胞70-90%汇合。对于每个待转染的孔,制备LipofectamineTM2000(赛默飞世尔公司(Themo Fisher))和Opti-MEMTM培养基(赛默飞世尔公司)的混合物,并且然后在室温下温育5-20分钟(溶液1)。温育后,将LipofectamineTM:OptiMEMTM混合物添加到含有变体Cas12i2-RT融合体工作溶液、RNA工作溶液和OptiMEMTM培养基的单独混合物中(溶液2)。通过上下移液混合溶液1和溶液2混合物,并且然后在室温下温育25分钟。温育后,将溶液1和溶液2混合物逐滴添加到含有细胞的96孔板的每个孔中。转染后72小时,通过向每个孔的中心添加TrypLETM(赛默飞世尔公司)来对细胞进行胰蛋白酶化,并温育大约5分钟。然后向每个孔中添加生长培养基并混合以重新悬浮细胞。然后将细胞以400g向下旋转10分钟,并丢弃上清液。将QuickExtractTM缓冲液(Lucigen公司(Lucigen))添加到原始细胞悬浮液体积量的1/5。将细胞在65℃下温育15分钟,在68℃下温育15分钟,并且在98℃下温育10分钟。
通过两轮PCR制备用于下一代测序的样品。第一轮(PCR1)用于根据靶标扩增特异性基因组区。通过柱纯化来纯化PCR1产物。进行第2轮PCR(PCR2)以添加因美纳公司(Illumina)衔接子和索引。然后汇集反应,并通过柱纯化进行纯化。用150个循环NextSeqv2.5中或高输出试剂盒进行测序。
图9A和图9B示出了AAVS1_T6上变体Cas12i2的活性,图9C和图9D示出了AAVS1_T7上变体Cas12i2的活性,图9E和图9F示出了EMX1_T6上变体Cas12i2的活性,图9G和图9H示出了VEGFA_T2上变体Cas12i2的活性,并且图9I和图9J示出了VEGFA_T5上变体Cas12i2的活性。NGS读段的百分比在y轴线上示出,总编辑如在浅灰色条中示出,并且经编码的编辑如在深灰色条中示出。示出的数据是两个生物复制品的平均值,所述生物复制品中的每个生物复制品具有三个技术复制品。如在图9A、图9C、图9E、图9G和图9I中所示出的,在靶向AAVS1_T6、AAVS1_T7、EMX1_T6、VEGFA_T2或VEGFA_T5的RNA向导存在的情况下,变体Cas12i2和变体Cas12i2-RT融合体是活性核酸酶。
如在图9B、图9D、图9F、图9H和图9J中所示出的,在RNA向导-RT供体RNA融合体序列存在的情况下,变体Cas12i2-RT融合体能够将经编码的取代、插入和缺失引入到AAVS1_T6、AAVS1_T7、EMX1_T6、VEGFA_T2或VEGFA_T5中。用长度为13个、30个和60个核苷酸的PBS观察到活性。C末端MMLV RT融合体的编辑超过了具有变体Cas12i2的N末端MMLV RT融合体的编辑。用变体Cas12i2进行编辑的范围为约1-5%。
此实例示出了使用编辑模板RNA和Cas12i2-RT融合体将特异性编辑并入到所选哺乳动物基因组位点中。
实例2-使用端保护的编辑模板RNA编辑哺乳动物细胞中的靶链
此实例描述了哺乳动物基因的靶链编辑(例如,使用结合所选哺乳动物基因的非PAM链的编辑模板RNA)。
将SEQ ID NO:4的变体Cas12i2和SEQ ID NO:25的变体Cas12i2-RT融合体各自克隆到pcda3.1主链(英杰公司)中。在水中制备用于表达具有变体Cas12i2的RT融合体的质粒的工作溶液(变体Cas12i2-RT融合体工作溶液)。
测试了各种RNA向导-RT供体RNA融合体构型,如在表11中示出的和在图12A和图12B所描绘的。逆转录模板序列和PBS与RNA向导的5'端或3'端融合。在5'或3'端上添加另外的DR-间隔子序列。用于端保护的间隔子序列是非人靶向的(即,其不靶向人类基因组中的任何序列)。RNA向导-RT供体RNA融合体的序列如在表12中所示出的;在RT供体中编码的所期望的编辑以小写字母示出。仅用作对照的RNA向导的序列在表13中示出。将RNA向导-RT供体RNA融合体或RNA向导克隆到具有U6启动子的质粒主链中,并最大化制备。在水中制备表达RNA向导/RT供体RNA质粒(或RNA向导)的每个质粒的工作溶液(编辑模板RNA工作溶液)。
表11.RNA向导-RT供体RNA融合体设计
表12.RNA向导-RT供体融合体序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
表13.RNA向导对照序列
转染前大约16小时,将DMEM/10%FBS+Pen/Strep中的25,000个HEK293T细胞平板接种到96孔板中的每个孔中。在转染当天,细胞70-90%汇合。对于每个待转染的孔,制备LipofectamineTM2000(赛默飞世尔公司)和Opti-MEMTM(赛默飞世尔公司)的混合物,并且然后在室温下温育5-20分钟(溶液1)。温育后,将LipofectamineTM:OptiMEMTM混合物添加到含有变体Cas12i2-RT融合体工作溶液、RNA工作溶液和OptiMEMTM培养基的单独混合物中(溶液2)。通过上下移液混合溶液1和溶液2混合物,并且然后在室温下温育25分钟。温育后,将溶液1和溶液2混合物逐滴添加到含有细胞的96孔板的每个孔中。转染后72小时,通过向每个孔的中心添加TrypLETM(赛默飞世尔公司)来对细胞进行胰蛋白酶化,并温育大约5分钟。然后向每个孔中添加生长培养基并混合以重新悬浮细胞。然后将细胞以400g向下旋转10分钟,并丢弃上清液。将QuickExtractTM缓冲液(Lucigen公司(Lucigen))添加到原始细胞悬浮液体积量的1/5。将细胞在65℃下温育15分钟,在68℃下温育15分钟,并且在98℃下温育10分钟。
通过两轮PCR制备用于下一代测序的样品。第一轮(PCR1)用于根据靶标扩增特异性基因组区。通过柱纯化来纯化PCR1产物。进行第2轮PCR(PCR2)以添加因美纳公司衔接子和索引。然后汇集反应,并通过柱纯化进行纯化。用150个循环NextSeq v2.5(因美纳公司)中或高输出试剂盒进行测序。
图13A示出了AAVS1_T7的活性,图13B示出了EMX1_T6的活性,图13C示出了VEGFA_T2的活性,并且图13D示出了VEGFA_T5的活性。NGS读段的百分比在y轴线上示出。数据是三个技术复制品的平均值。
如在图13A、图13B、图13C和图13D中所示出的,在靶向AAVS1_T7、EMX1_T6、VEGFA_T2或VEGFA_T5的RNA向导存在的情况下,SEQ ID NO:4的变体Cas12i2和SEQ ID NO:25的变体Cas12i2-RT融合体是活性核酸酶(参见gRNA样品)。所期望的编辑仅在RT(SEQ ID NO:25的变体Cas12i2-RT融合体)存在的情况下观察到。观察到具有SEQ ID NO:25的变体Cas12i2-RT融合体的每个经测试的编辑模板RNA的插入缺失和经编码的编辑。与没有端保护的5'延伸部编辑模板RNA(逆转录模板序列–PBS–核酸酶结合序列–DNA-结合序列)相比,具端保护的5'延伸部编辑模板RNA(端保护–逆转录模板序列–PBS–核酸酶结合序列–DNA结合序列)显示出更多数量的具有所期望的编辑的读段。
此实例表明,使用编辑模板RNA和Cas12i2-RT融合体的多种构型,将特异性编辑并入到所选哺乳动物基因组位点中。
实例3-Cas12i2体外切割模式的测定
在此实例中,测定了具有RNA向导的变体Cas12i2的体外切割模式。测定由Cas12i2在双链DNA靶标上产生的切割位点使得能够设计编辑模板RNA的PBS组分。
用于确定切割模式的测定的示意图在图14A-C中示出。首先设计了含有用于切割位点分析的靶序列的寡聚物。寡聚物包括在靶标两端上均有12个核苷酸的侧接序列的靶序列,内部条形码,以及允许靶向扩增的引发位点(图14A)。如在图14B中所示出的,将所有切割产物分成两半,其中一半用钝化5'和3'突出端(钝化处理)的绿豆核酸酶(MBN)处理,另一半反应被端修复(NEBNext DNA文库制备的一部分,新英格兰生物实验室(New EnglandBiolabs)),其中5'突出端被填充(填充处理)。然后两半都进行NGS文库制备和半靶向扩增。V型CRISPR核酸酶已经示出产生具有如通过该灰色箭头所指示的的5'突出端的交错切割。这些切割位点通过填充处理被捕获,以填充任何5'突出端。因此,这些产物的5'和3'测序指示了靶链和非靶链上的切割位点。最近对Cpf1的研究指示了另外的切割位点,特别是在不能通过填充方法捕获的非靶链上。为了捕获这些切割位点,钝化方法导致所有5'和3'突出端的钝化。因此,钝化方法中的5'切割产物指示非靶链上的任何另外的切割位点,并且3'切割产物指示靶链上的另外的切割位点。NEBNext衔接子连接后的半靶向扩增允许5'和3'切割产物的特异性扩增;汇集扩增的产物并通过NGS进行分析(图14C)。
分别使用IR800和IR700标记的正向引物和反向引物通过PCR扩增产生DNA底物,从而产生具有IR800标记的靶链和IR700标记的非靶链的dsDNA靶标。使用CleanNGS SPRI珠以1.8倍的珠对PCR产物的比率对PCR产物进行清洁。将经纯化的Cas12i2与crRNA在37℃下在NEBuffer 3(10mM Tris-HCl、pH 7.9、150mM NaCl、10mM MgCl2、1mM DTT)中预温育10分钟以形成RNP。将包括在NEBuffer 3中与系列稀释的RNP混合的dsDNA底物的体外切割反应在37℃下进行1小时。将反应用EDTA淬灭。将反应用RNA酶混合物处理(37℃下,持续15分钟),随后通过蛋白酶K处理(37℃下,持续15分钟)。使用15% TBE-尿素凝胶通过变性凝胶电泳分析反应,并在Odyssey CLx(LI-COR)成像仪上成像。DNA底物和RNA向导序列如在表14中所示出的;靶序列以粗体示出。
表14.切割测定序列
为了进行体外切割片段分析以确定切割位置,使用SPRI珠和异丙醇(SPRI IPA)纯化反应产物。将经纯化的反应物分成两半。将一半用绿豆核酸酶(新英格兰生物实验室)在30℃下处理30分钟以去除所有5'和3'突出端以产生钝端,随后用IPA SPRI纯化。然后使用NEBNext Ultra-IIDNA文库制备试剂盒(新英格兰生物实验室),按照制造商的说明制备用于测序的经绿豆核酸酶处理的一半和未经处理的一半两者。半靶向扩增用于分别扩增每个样品的5'和3'切割产物。在测序前,汇集所有扩增子并进行凝胶提取。对于每个样品,将经绿豆核酸酶处理的和未经绿豆核酸酶处理的样品的5'和3'切割产物获得的读段长度绘制成直方图,并映射到靶序列。
为了获得完整的切割模式,从所有四个直方图中提取数据并在R-环图上可视化,如在图15A-E和图16中所示出的。图15B-E示出了从AAVS1_T2的5'和3'切割产物的半靶向扩增获得的读段长度的直方图。图15B和图15D示出了分别用于填充处理和钝化处理的5'切割产物的读段长度直方图。图15C和图15E示出了分别用于填充处理和钝化处理的3'切割产物的读段长度直方图。每个读段长度直方图被映射到x轴线上所示出的靶序列。还指示了PAM序列(5'-NTTT-3')。从直方图获得的切割位点在图15A的R-环图中展示为三角形。图16比较了包括Cas12i2(SEQ ID NO:2)或变体Cas12i2(SEQ ID NO:4)的RNP在AAVS1_T2和EMX1_T6上的切割位点。比例尺(右)代表如通过测序读段的数量所测量的切割频率。
对于所有靶标,在靶链和非靶链两者上均观察到不同频率的多个切割位点。在非靶链上,观察到具有在间隔子区内(即,RNA向导结合区)以及在间隔子区外检测到的若干个切割位点的宽切割谱。这表明,在Cas12i2结合时,双链DNA可能从间隔子区(即,RNA向导结合区)解开若干个碱基对,并作为单链DNA存在,使其易于被Cas12i2切割。靶链上的切割位点始终在间隔子区之外(即,RNA向导结合区之外)被观察到。对于AAVS1_T2,在来自PAM序列的位置22至24个核苷酸处观察到靶链切割位点。对于VEGFA_T5和EMX1_T6,在来自PAM序列的位置22至23个核苷酸处观察到靶链切割位点。因此,这表明被设计用于靶向靶链的编辑模板RNA应该包括来自PAM序列的位置22至24个核苷酸处的PBS。
实例4-使用具有不同PBS和逆转录模板序列长度的编辑模板RNA编辑哺乳动物细 胞中的靶链
此实例描述了使用PBS长度为3至60个核苷酸和逆转录模板序列长度为14至54个核苷酸的编辑模板RNA对哺乳动物基因进行靶链编辑。
在水中制备包括SEQ ID NO:25的变体Cas12i2-RT融合体的质粒的工作溶液(变体Cas12i2-RT融合体工作溶液)。编辑模板RNA序列在表15中示出。在条件的一个集合中,逆转录模板序列的长度为34个核苷酸,并且PBS的长度为3个、8个、13个、30个或60个核苷酸。在条件的第二集合中,PBS的长度为13个核苷酸,并且逆转录模板序列的长度为14个、24个、34个、44个或54个核苷酸。将每个编辑模板RNA克隆到具有U6启动子的质粒主链中,并最大化制备。在水中制备表达每个编辑模板RNA的质粒的工作溶液(编辑模板RNA工作溶液)。
表15.编辑模板RNA序列
/>
/>
/>
如在实例2中所描述的,转染细胞并进行分析。图17A示出了AAVS1_T7的SEQ IDNO:25的Cas12i2-RT和SEQ ID NO:183-187的编辑模板RNA的活性,EMX1_T6的SEQ ID NO:25的Cas12i2-RT、SEQ ID NO:193-197的编辑模版RNA的活性,以及VEGFA_T5的SEQ ID NO:25的Cas12i2-RT和SEQ ID NO:203-207的编辑模板RNA的活性。图17B示出了AAVS1_T7的SEQID NO:25的Cas12i2-RT和SEQ ID NO:188-192的编辑模板RNA的活性,EMX1_T6的SEQ IDNO:25的Cas12i2-RT、SEQ ID NO:198-202的编辑模版RNA的活性,以及VEGFA_T5的SEQ IDNO:25的Cas12i2-RT和SEQ ID NO:208-212的编辑模板RNA的活性。经编码的编辑与总插入缺失的比率在图17A和图17B的y轴线上示出。
如在图17A中所示出的,每个经测试的PBS长度导致经编码的编辑被并入到所选靶站点中。使用长度为13个、30个和60个核苷酸的PBS导致经编码的编辑与总插入缺失的最高比率。如在图17B中所示出的,长度为24个、34个、44个和54个核苷酸的经测试的逆转录模板序列导致经编码的编辑的存在。对于EMX1_T6,使用具有长度为13个核苷酸的PBS和长度为34个或44个核苷酸的逆转录模板序列的编辑模板RNA,经编码的编辑占总编辑的约30%。因此,此实施例表明,具有各种PBS和逆转录模板序列长度的编辑模板RNA将经编码的编辑引入到哺乳动物细胞中的靶序列中。
实例5-U2OS细胞中靶链的RNA模板化编辑
此实例描述了U2OS细胞中哺乳动物基因的靶链编辑。在水中制备包括SEQ ID NO:25的变体Cas12i2-RT融合体的质粒的工作溶液。将每个编辑模板RNA克隆到具有U6启动子的质粒主链中,并最大化制备。在水中制备包括每个编辑模板RNA的质粒的工作溶液。编辑模板RNA序列在表16中示出。将另外的DR-间隔子序列添加到3'端,其中另外的间隔子序列是非人靶向的(即,其不靶向人类基因组中的任何序列)。在RT供体中编码的所期望的编辑在表16中以小写字母示出。
表16.编辑模板RNA序列
U2OS细胞由美国典型培养物保藏中心(American Type Culture Collection)供应,并在补充有10% FBS(康宁公司(Corning))和100U/mL青霉素-链霉素(HyCloneTM)的McCoy's-5A培养基(赛默飞世尔公司)中维持低于90%的汇合率。使用TrypLETM表达(赛默飞世尔公司)对细胞进行胰蛋白酶化、重新悬浮和计数。使用SF细胞系核转染试剂盒(龙沙公司(Lonza)),按照制造商预设的DN-100程序,用800ng的Cas12i2-RT融合质粒和200ng的每个编辑模板RNA质粒的混合物对400,000个细胞群体进行核转染。然后将细胞重新悬浮并重新平板接种在具有预热的生长培养基的96孔板(40,000个细胞/孔)中。将核感染的细胞培养72小时并采集。
如在实例2中所描述的,通过NGS分析编辑。如在图18中所示出的,在约5-8%的NGS读段中鉴定出由每个逆转录模板序列编码的编辑。经编码的编辑总计大约占AAVS1_T7的总插入缺失的20%,并且大约占EMX1_T6的总插入缺失的10%。因此,此实例和前述实例表明经编码的编辑能够被引入到多种细胞系的基因中。
实例6-用Cas12i2-RT融合体对靶链进行RNA模板化编辑
此实例描述了使用与MMLV RT(SEQ ID NO:29)、缺乏RNA酶H结构域的SEQ ID NO:29的MMLV RT的变体(SEQ ID NO:224)或Marathon RT(SEQ ID NO:232)融合的Cas12i2变体对哺乳动物基因进行靶链编辑。
将表14的Cas12i2-RT融合体序列克隆到pcDNA3.1主链(英杰公司)中。C末端RT融合体包括在Cas12i2的N末端处的His标签以及在Cas12i2的C末端处的二分核质蛋白NLS(npNLS)。紧接npNLS的是GS-XTEN-GS接头。RT的C末端处是二分SV40NLS标签。N末端RT融合体包括在N末端处的二分SV40 NLS标签和在RT的C末端处的GS-XTEN-GS接头,随后是Cas12i2。Cas12i2的C末端处是二分核质蛋白NLS(bpNLS)。在水中制备Cas12i2-RT质粒的工作溶液。
表17.CAS-RT融合体序列
/>
/>
/>
靶标和对应的编辑模板RNA序列在表18中示出。RT模板的长度为40个核苷酸,并且PBS的长度为13个核苷酸。经编码的编辑是4个核苷酸取代以及单个碱基取代,以去除PAM序列。编辑模板RNA进一步用另外的直接重复序列和非靶向间隔子序列进行端保护。将编辑模板RNA克隆到具有U6启动子的质粒主链中并最大化制备,并且在水中制备每个编辑模板RNA质粒的工作溶液。
表18.编辑模板RNA序列
/>
HEK293T细胞由美国典型培养物保藏中心供应,并在D10培养基中维持低于90%的汇合率:DMEM(赛默飞世尔公司)加GlutaMAXTM(赛默飞世尔公司)和丙酮酸盐(赛默飞世尔公司)补充有10% FBS(康宁公司)和100U/mL青霉素-链霉素(HyCloneTM)。在转导之前,将HEK293T细胞以25,000个细胞/孔平板接种在组织培养处理的96孔板中。15-18小时后,转染细胞。将每个Cas12i2-RT融合质粒和编辑模板RNA质粒在Opti-MEMTM培养基(赛默飞世尔公司)中稀释,并且然后与在Opti-MEMTM中稀释的LipofectamineTM 2000(赛默飞世尔公司)混合。将LipofectamineTM 2000溶液逐滴添加到孔中,并且将经转染的细胞在采集前培养72小时。
通过两轮PCR制备用于下一代测序的样品。第一轮(PCR1)用于根据靶标扩增特异性基因组区。通过柱纯化来纯化PCR1产物。进行第2轮PCR(PCR2)以添加因美纳公司衔接子和索引。然后汇集反应,并通过柱纯化进行纯化。用150个循环NextSeq v2.5中或高输出试剂盒进行测序。
图20A、图20B和图20C分别示出了表19的Cas12i2-RT融合体对AAVS1_T7、EMX1_T6和VEGFA_T5的活性。插入缺失编辑(包括在靶序列内或与靶序列相邻的插入或缺失的总NGS读段的百分比)和精确编辑(包括由编辑模板RNA编码的编辑的总NGS读段的百分比)在y轴线上示出。插入缺失编辑示出为白色条,并且经编码的编辑示出为灰色条。示出的数据是两个生物复制品的平均值。如在图20A、图20B和图20C中所示出的,Cas12i2-RT融合体在编辑模板RNA存在的情况下是活性核酸酶。此外,每个Cas12i2-RT融合体将由编辑模板RNA编码的编辑引入到靶序列中。对于用SEQ ID NO:220的Cas12i2-RT融合体编辑的三个靶标中的每个靶标,大约15%的NGS读段包括由编辑模板RNA编码的编辑。因此,MMLV的RNA酶H结构域的缺失似乎对Cas12i2-RT融合体将插入缺失和精确编辑引入到哺乳动物基因组中的能力没有显著影响。此外,包括Marathon RT的Cas12i2-RT融合体能够将经编码的编辑引入到靶序列中(图20A、图20B和图20C)。
因此,此实施例表明,使用多个RT序列和Cas12i2-RT融合体能够将经编码的编辑并入到哺乳动物基因的靶链中。
实例7-使用经化学修饰的编辑模板RNA进行RNA模板化编辑
此实例描述了使用SEQ ID NO:219的质粒编码的Cas12i2-RT融合体和包括末端硫代磷酸酯主链键和/或2'O-甲基核苷酸的编辑模板RNA的哺乳动物基因VEGFA的靶链编辑。靶序列是TTAAACTCTCCATGGACCAG(SEQ ID NO:38)。
表19.RNA向导和编辑模板RNA序列
/>
将SEQ ID NO:4的变体Cas12i2和SEQ ID NO:219的Cas12i2-RT融合体单独克隆到pcDNA3.1主链(英杰公司)中。RNA向导和编辑模板RNA序列由IDT合成。HEK293T细胞由美国典型培养物保藏中心供应,并维持低于90%的汇合率D10培养基:DMEM(赛默飞世尔公司)加GlutaMAXTM(赛默飞世尔公司)和丙酮酸盐(赛默飞世尔公司)补充有10% FBS(康宁公司)和100U/mL青霉素-链霉素(HyCloneTM)。在转导之前,将HEK293T细胞以25,000个细胞/孔平板接种在D10中的组织培养处理的96孔板中。15-18小时后,将细胞通过(MirusBio公司(Mirus Bio))转染然后将DNA加转染试剂溶液逐滴添加到细胞的孔中。将100ng的Cas12i2或Cas12i2-RT质粒DNA和9pmol的合成RNA向导(IDT)的混合物在Opti-MEMTM培养基(赛默飞世尔公司)中稀释,并且然后按照制造商的说明与在Opti-MEMTM中稀释的LipofectamineTM 2000混合。将经转染的细胞在采集前培养72小时。
如在前述实例中所描述的,通过NGS分析编辑。如在图21中所示出的,用每个编辑模板RNA和SEQ ID NO:219的Cas12i2-RT融合体检测VEGFA-T5靶位点处的经编码的编辑。在对照(gRNA和编辑模板RNA+Cas12i2)样品中未检测到经编码的编辑。与未经修饰的编辑模板RNA相比,使用经修饰的编辑模板RNA在更高百分比的NGS读段中检测到经编码的编辑。PS-2'-O-Me修饰的使用导致包括经编码的编辑的最高百分比的NGS读段。
因此,此实例表明所关注的基因组位点能够通过经化学修饰的编辑模板RNA和Cas12i2-RT融合体进行编辑。
实例8-使用Cas12i4-RT融合体进行RNA模板化编辑
此实例描述了使用与MMLV RT(SEQ ID NO:29)融合的Cas12i4变体对AAVS1进行靶链编辑。
将表20的Cas12i4-RT融合体序列克隆到pcDNA3.1主链(英杰公司)中。C末端RT融合体包括在Cas12i4的N末端处的His标签以及在Cas12i4的C末端处的核质蛋白NLS。紧接NLS的是Flex XTEN接头。RT的C末端处是二分SV40 NLS标签。N末端RT融合体包括在N末端处的二分SV40 NLS标签和在RT的C末端处的Flex XTEN接头,随后是Cas12i4。Cas12i4的C末端处是核质蛋白NLS。在水中制备Cas12i4-RT质粒的工作溶液。
表20.变体CAS12I4和变体CAS12I4-RT融合体序列
/>
/>
靶标、RNA向导和编辑模板RNA序列在表21中示出。RT模板的长度为46个核苷酸,并且PBS的长度为13个核苷酸。经编码的编辑是4个核苷酸取代以及单个碱基取代,以去除PAM序列。将编辑模板RNA和RNA向导单独克隆到具有U6启动子的质粒主链中并最大化制备,并且在水中制备每个RNA向导或编辑模板RNA质粒的工作溶液。
表21.靶标和RNA序列。
如在实例6中所描述的转染并采集HEK293T细胞。如在前述实例中所描述的,进一步进行NGS。如在图22中所示出的,用编辑模板RNA和Cas12i4-RT融合体中的任一者检测AAVS1_T7靶位点处的经编码的编辑。在对照(gRNA和编辑模板RNA+Cas12i4)样品中未检测到经编码的编辑。与MMLV与变体Cas12i4的N末端融合体相比,使用MMLV与变体Cas12i4的C末端融合体在更高百分比的NGS读段中检测到经编码的编辑。
因此,此实例表明所关注的基因组位点能够通过编辑模板RNA和Cas12i4-RT融合体进行编辑。
实例9-使用Cas12i2-RT融合体、RNA向导和RT供体RNA进行RNA模板化编辑
此实例描述了使用Cas12i2-RT融合体、RNA向导和RT供体RNA对哺乳动物基因进行靶链编辑。
将SEQ ID NO:219的Cas12i2-RT融合体克隆到pcDNA3.1主链(英杰公司)中。在水中制备Cas12i2-RT质粒的工作溶液。将表22的RNA向导和RT供体RNA单独克隆到具有U6启动子的质粒主链中并最大化制备,并在水中制备每个RNA向导或RT供体RNA质粒的工作溶液。RT供体RNA从5'至3'依次包括以下组分:直接重复序列-非靶向间隔子-RT模板-PBS-直接重复序列-非靶向间隔子。侧接RT模板和PBS的直接重复序列和间隔子序列充当端保护。
表22.靶标、RNA向导和RT供体RNA序列
HEK293T细胞由美国典型培养物保藏中心供应,并在D10培养基中维持低于90%的汇合率:DMEM(赛默飞世尔公司)加GlutaMAXTM(赛默飞世尔公司)和丙酮酸盐(赛默飞世尔公司)补充有10% FBS(康宁公司)和100U/mL青霉素-链霉素(HyCloneTM)。在转导之前,将HEK293T细胞以25,000个细胞/孔平板接种在组织培养处理的96孔板中。15-18小时后,转染细胞。将每个Cas12i2-RT融合质粒、RNA向导质粒和RT供体RNA质粒在Opti-MEMTM培养基(赛默飞世尔公司)中稀释,并且然后与在Opti-MEMTM中稀释的LipofectamineTM 2000(赛默飞世尔公司)混合。将LipofectamineTM 2000溶液逐滴添加到孔中,并且将经转染的细胞在采集前培养72小时。
如在前述实例中所描述的,进一步进行NGS。如在图23中所示出的,在用Cas12i2-RT融合体、相应的RNA向导和相应的RT供体RNA转染后,检测到每个靶位点处的经编码的编辑。在对照(Cas12i2)样品中未检测到经编码的编辑。因此,此实例表明,所选基因组位点能够被Cas12i2-RT融合体和两种RNA组分,RNA向导和RT供体RNA编辑。RNA向导和RT供体RNA不需要融合以将经编码的编辑并入到所关注的基因组位点中。
其它实施例
本说明书中所公开的特征中的所有特征可以以任何组合来组合。本说明书中所公开的每个特征可以被用于相同、等效或类似目的的替代性特征替换。因此,除非另有明确说明,否则所公开的每个特征仅是通用系列的等效或类似特征的实例。
通过以上描述,本领域的技术人员可以很容易地确定本发明的实质特性,并且在不偏离本发明的精神和范围的情况下,可以对本发明进行各种改变和修改以使其适于各种用途和条件。因此,其它实施例也在权利要求范围内。
等效方案
尽管本文已经描述和展示了若干个本发明实施例,但本领域的普通技术人员将容易想到用于执行本文所描述的功能和/或获得这些结果和/或这些优点中的一个或多个优点的各种其它装置和/或结构,并且此类变型和/或修改中的每个变型和/或修改被视为处于本文所描述的本发明实施例的范围内。更一般地,本领域的技术人员将容易地理解,本文所描述的所有参数、尺寸、材料和构型意味着示例性的,并且实际参数、尺寸、材料和/或构型将取决于使用本发明教导所使用的一种或多种具体应用。仅使用常规实验,本领域的技术人员将认识到或能够确定本文所描述的具体本发明实施例的许多等效物。因此,应理解,前述实施例仅通过实例的方式呈现,并且在所附权利要求以及其等效物的范围内,可以以不同于具体描述的和要求保护的方式来实践本发明实施例。本公开的本发明实施例涉及本文所描述的每个单独的特征、系统、制品、材料、试剂盒和/或方法。另外,如果此类特征、系统、制品、材料、试剂盒和/或方法并不相互矛盾,则两个或更多个此类特征、系统、制品、材料、试剂盒和/或方法的任何组合包含在本公开的本发明范围内。
如本文中定义和使用的所有定义都应当理解为对字典定义的控制、通过引用并入的文件中的定义和/或定义术语的普通含义。
本文所公开的所有参考文献、专利和专利申请相对于各自所引用的主题而通过引用并入,在一些情况下,其可能涵盖整个文件。
除非明确相反地指出,否则如本文在说明书和权利要求中所使用的,不定冠词“一个(a/an)”和“一种(a/an)”应当理解为意指“至少一个(种)”。
如本文在说明书和权利要求中所使用的,短语“和/或”应当理解为意指如此结合的要素的“任一或两者”,即,在一些情况下结合存在和在其它情况下分离存在的要素。用“和/或”列出的多个要素应以相同的方式解释,即,如此结合的要素中的“一个或多个要素”。除了通过“和/或”从句具体标识的要素之外,还可以任选地存在其它要素,而无论是与具体标识的那些要素相关还是不相关。因此,作为非限制性实例,当与如“包括(comprising)”等开放式语言结合使用时,对“A和/或B”的引用在一个实施例中可以仅指A(任选地包含除了B之外的要素);在另一个实施例中,仅指B(任选地包含除了A之外的要素);在又另一个实施例中,指A和B两者(任选地包含其它要素);等。
如本文在说明书和权利要求中所使用的,“或”应被理解为具有与如上文所定义的“和/或”相同的含义。例如,当在将列表中的项分开时,“或”或“和/或”应被解释为包含性的,即,包含许多要素或要素列表中的至少一个要素,但还包含多于一个要素以及任选地另外的未列出的项。仅明确指出相反的术语如“仅一个”或“恰好一个”或当在权利要求中使用时,“由…组成”指包含许多要素或要素列表中的恰好一个要素。一般而言,当之前为排他性术语,如“…中的任一个”、“…中的一个”、“…中的仅一个”或“…中的恰好一个”时,如本文所使用的术语“或”应仅解释为指示唯一的备选方案(即,“一个或另一个,但不是两者”)。当在权利要求中使用时,“基本上由…组成”应当具有如在专利法领域中所使用的普通含义。
如本文在说明书和权利要求中所使用的,关于一个或多个要素的列表的短语“至少一个”应被理解为意指选自要素列表中的任一个或多个要素中的至少一个要素、但不一定包含要素列表内具体列出的每一个要素中的至少一个要素,并且不排除要素列表中的要素的任何组合。此定义还允许可以任选地存在除了在短语“至少一个”所指的要素列表内具体标识的要素之外的要素,而无论与具体标识的那些要素相关还是不相关。因此,作为非限制性实例,在一个实施例中,“A和B中的至少一个”(或等效地,“A或B中的至少一个”,或等效地“A和/或B中的至少一个”)可以指任选地包含多于一个A,不存在B(并且任选地包含除了B之外的要素)的至少一个;在另一个实施例中,可以指任选地包含多于一个B,不存在A(并且任选地包含除了A之外的要素)的至少一个;在又另一个实施例中,可以指任选地包含多于一个A的至少一个,以及任选地包含多于一个B(以及任选地包含其它要素)的至少一个;等。
还应当理解,除非明确相反地指出,否则在本文要求保护的包含多于一个步骤或动作的任何方法中,方法的步骤或动作的顺序不一定限于叙述方法的步骤或动作的顺序。
序列表
<110> 阿伯生物技术公司(Arbor Biotechnologies, Inc.)
<120> 包括CRISPR核酸酶的基因编辑系统和其用途
<130> 116928-0042-0001WO00
<140> 尚未指定
<141> 与此同时
<150> US 63/299,695
<151> 2022-01-14
<150> US 63/272,937
<151> 2021-10-28
<150> US 63/236,047
<151> 2021-08-23
<150> US 63/195,621
<151> 2021-06-01
<160> 259
<170> PatentIn第3.5版
<210> 1
<211> 3162
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 1
atgagcagcg cgatcaaaag ctacaagagc gttctgcgtc cgaacgagcg taagaaccaa 60
ctgctgaaaa gcaccattca gtgcctggaa gacggtagcg cgttcttttt caagatgctg 120
caaggcctgt ttggtggcat caccccggag attgttcgtt tcagcaccga acaggagaaa 180
cagcaacagg atatcgcgct gtggtgcgcg gttaactggt tccgtccggt gagccaagac 240
agcctgaccc acaccattgc gagcgataac ctggtggaga agtttgagga atactatggt 300
ggcaccgcga gcgacgcgat caaacagtac ttcagcgcga gcattggcga aagctactat 360
tggaacgact gccgtcaaca gtactatgat ctgtgccgtg agctgggtgt tgaggtgagc 420
gacctgaccc atgatctgga gatcctgtgc cgtgaaaagt gcctggcggt tgcgaccgag 480
agcaaccaga acaacagcat cattagcgtt ctgtttggca ccggcgaaaa agaggaccgt 540
agcgtgaaac tgcgtatcac caagaaaatt ctggaggcga tcagcaacct gaaagaaatc 600
ccgaagaacg ttgcgccgat tcaagagatc attctgaacg tggcgaaagc gaccaaggaa 660
accttccgtc aggtgtatgc gggtaacctg ggtgcgccga gcaccctgga gaaatttatc 720
gcgaaggacg gccaaaaaga gttcgatctg aagaaactgc agaccgacct gaagaaagtt 780
attcgtggta aaagcaagga gcgtgattgg tgctgccagg aagagctgcg tagctacgtg 840
gagcaaaaca ccatccagta tgacctgtgg gcgtggggcg aaatgttcaa caaagcgcac 900
accgcgctga aaatcaagag cacccgtaac tacaactttg cgaagcaacg tctggaacag 960
ttcaaagaga ttcagagcct gaacaacctg ctggttgtga agaagctgaa cgactttttc 1020
gatagcgaat ttttcagcgg cgaggaaacc tacaccatct gcgttcacca tctgggtggc 1080
aaggacctga gcaaactgta taaggcgtgg gaggatgatc cggcggaccc ggaaaacgcg 1140
attgtggttc tgtgcgacga tctgaaaaac aactttaaga aagagccgat ccgtaacatt 1200
ctgcgttaca tcttcaccat tcgtcaagaa tgcagcgcgc aggacatcct ggcggcggcg 1260
aagtacaacc aacagctgga tcgttataaa agccaaaagg cgaacccgag cgttctgggt 1320
aaccagggct ttacctggac caacgcggtg atcctgccgg agaaggcgca gcgtaacgac 1380
cgtccgaaca gcctggatct gcgtatttgg ctgtacctga aactgcgtca cccggacggt 1440
cgttggaaga aacaccatat cccgttctac gatacccgtt tcttccaaga aatttatgcg 1500
gcgggcaaca gcccggttga cacctgccag tttcgtaccc cgcgtttcgg ttatcacctg 1560
ccgaaactga ccgatcagac cgcgatccgt gttaacaaga aacatgtgaa agcggcgaag 1620
accgaggcgc gtattcgtct ggcgatccaa cagggcaccc tgccggtgag caacctgaag 1680
atcaccgaaa ttagcgcgac catcaacagc aaaggtcaag tgcgtattcc ggttaagttt 1740
gacgtgggtc gtcaaaaagg caccctgcag atcggtgacc gtttctgcgg ctacgatcaa 1800
aaccagaccg cgagccacgc gtatagcctg tgggaagtgg ttaaagaggg tcaataccat 1860
aaagagctgg gctgctttgt tcgtttcatc agcagcggtg acatcgtgag cattaccgag 1920
aaccgtggca accaatttga tcagctgagc tatgaaggtc tggcgtaccc gcaatatgcg 1980
gactggcgta agaaagcgag caagttcgtg agcctgtggc agatcaccaa gaaaaacaag 2040
aaaaaggaaa tcgtgaccgt tgaagcgaaa gagaagtttg acgcgatctg caagtaccag 2100
ccgcgtctgt ataaattcaa caaggagtac gcgtatctgc tgcgtgatat tgttcgtggc 2160
aaaagcctgg tggaactgca acagattcgt caagagatct ttcgtttcat tgaacaggac 2220
tgcggtgtta cccgtctggg cagcctgagc ctgagcaccc tggaaaccgt gaaagcggtt 2280
aagggtatca tttacagcta ttttagcacc gcgctgaacg cgagcaagaa caacccgatc 2340
agcgacgaac agcgtaaaga gtttgatccg gaactgttcg cgctgctgga aaagctggag 2400
ctgattcgta cccgtaaaaa gaaacaaaaa gtggaacgta tcgcgaacag cctgattcag 2460
acctgcctgg agaacaacat caagttcatt cgtggtgaag gcgacctgag caccaccaac 2520
aacgcgacca agaaaaaggc gaacagccgt agcatggatt ggttggcgcg tggtgttttt 2580
aacaaaatcc gtcaactggc gccgatgcac aacattaccc tgttcggttg cggcagcctg 2640
tacaccagcc accaggaccc gctggtgcat cgtaacccgg ataaagcgat gaagtgccgt 2700
tgggcggcga tcccggttaa ggacattggc gattgggtgc tgcgtaagct gagccaaaac 2760
ctgcgtgcga aaaacatcgg caccggcgag tactatcacc aaggtgttaa agagttcctg 2820
agccattatg aactgcagga cctggaggaa gagctgctga agtggcgtag cgatcgtaaa 2880
agcaacattc cgtgctgggt gctgcagaac cgtctggcgg agaagctggg caacaaagaa 2940
gcggtggttt acatcccggt tcgtggtggc cgtatttatt ttgcgaccca caaggtggcg 3000
accggtgcgg tgagcatcgt tttcgaccaa aaacaagtgt gggtttgcaa cgcggatcat 3060
gttgcggcgg cgaacatcgc gctgaccgtg aagggtattg gcgaacaaag cagcgacgaa 3120
gagaacccgg atggtagccg tatcaaactg cagctgacca gc 3162
<210> 2
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 2
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Asp Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Ile Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Val Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 3
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 3
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Arg Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 4
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 4
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 5
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 5
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 6
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 6
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg
610 615 620
Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 7
<211> 1054
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 7
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys His His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg
610 615 620
Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser
<210> 8
<211> 1093
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 8
Met Ser Asn Lys Glu Lys Asn Ala Ser Glu Thr Arg Lys Ala Tyr Thr
1 5 10 15
Thr Lys Met Ile Pro Arg Ser His Asp Arg Met Lys Leu Leu Gly Asn
20 25 30
Phe Met Asp Tyr Leu Met Asp Gly Thr Pro Ile Phe Phe Glu Leu Trp
35 40 45
Asn Gln Phe Gly Gly Gly Ile Asp Arg Asp Ile Ile Ser Gly Thr Ala
50 55 60
Asn Lys Asp Lys Ile Ser Asp Asp Leu Leu Leu Ala Val Asn Trp Phe
65 70 75 80
Lys Val Met Pro Ile Asn Ser Lys Pro Gln Gly Val Ser Pro Ser Asn
85 90 95
Leu Ala Asn Leu Phe Gln Gln Tyr Ser Gly Ser Glu Pro Asp Ile Gln
100 105 110
Ala Gln Glu Tyr Phe Ala Ser Asn Phe Asp Thr Glu Lys His Gln Trp
115 120 125
Lys Asp Met Arg Val Glu Tyr Glu Arg Leu Leu Ala Glu Leu Gln Leu
130 135 140
Ser Arg Ser Asp Met His His Asp Leu Lys Leu Met Tyr Lys Glu Lys
145 150 155 160
Cys Ile Gly Leu Ser Leu Ser Thr Ala His Tyr Ile Thr Ser Val Met
165 170 175
Phe Gly Thr Gly Ala Lys Asn Asn Arg Gln Thr Lys His Gln Phe Tyr
180 185 190
Ser Lys Val Ile Gln Leu Leu Glu Glu Ser Thr Gln Ile Asn Ser Val
195 200 205
Glu Gln Leu Ala Ser Ile Ile Leu Lys Ala Gly Asp Cys Asp Ser Tyr
210 215 220
Arg Lys Leu Arg Ile Arg Cys Ser Arg Lys Gly Ala Thr Pro Ser Ile
225 230 235 240
Leu Lys Ile Val Gln Asp Tyr Glu Leu Gly Thr Asn His Asp Asp Glu
245 250 255
Val Asn Val Pro Ser Leu Ile Ala Asn Leu Lys Glu Lys Leu Gly Arg
260 265 270
Phe Glu Tyr Glu Cys Glu Trp Lys Cys Met Glu Lys Ile Lys Ala Phe
275 280 285
Leu Ala Ser Lys Val Gly Pro Tyr Tyr Leu Gly Ser Tyr Ser Ala Met
290 295 300
Leu Glu Asn Ala Leu Ser Pro Ile Lys Gly Met Thr Thr Lys Asn Cys
305 310 315 320
Lys Phe Val Leu Lys Gln Ile Asp Ala Lys Asn Asp Ile Lys Tyr Glu
325 330 335
Asn Glu Pro Phe Gly Lys Ile Val Glu Gly Phe Phe Asp Ser Pro Tyr
340 345 350
Phe Glu Ser Asp Thr Asn Val Lys Trp Val Leu His Pro His His Ile
355 360 365
Gly Glu Ser Asn Ile Lys Thr Leu Trp Glu Asp Leu Asn Ala Ile His
370 375 380
Ser Lys Tyr Glu Glu Asp Ile Ala Ser Leu Ser Glu Asp Lys Lys Glu
385 390 395 400
Lys Arg Ile Lys Val Tyr Gln Gly Asp Val Cys Gln Thr Ile Asn Thr
405 410 415
Tyr Cys Glu Glu Val Gly Lys Glu Ala Lys Thr Pro Leu Val Gln Leu
420 425 430
Leu Arg Tyr Leu Tyr Ser Arg Lys Asp Asp Ile Ala Val Asp Lys Ile
435 440 445
Ile Asp Gly Ile Thr Phe Leu Ser Lys Lys His Lys Val Glu Lys Gln
450 455 460
Lys Ile Asn Pro Val Ile Gln Lys Tyr Pro Ser Phe Asn Phe Gly Asn
465 470 475 480
Asn Ser Lys Leu Leu Gly Lys Ile Ile Ser Pro Lys Asp Lys Leu Lys
485 490 495
His Asn Leu Lys Cys Asn Arg Asn Gln Val Asp Asn Tyr Ile Trp Ile
500 505 510
Glu Ile Lys Val Leu Asn Thr Lys Thr Met Arg Trp Glu Lys His His
515 520 525
Tyr Ala Leu Ser Ser Thr Arg Phe Leu Glu Glu Val Tyr Tyr Pro Ala
530 535 540
Thr Ser Glu Asn Pro Pro Asp Ala Leu Ala Ala Arg Phe Arg Thr Lys
545 550 555 560
Thr Asn Gly Tyr Glu Gly Lys Pro Ala Leu Ser Ala Glu Gln Ile Glu
565 570 575
Gln Ile Arg Ser Ala Pro Val Gly Leu Arg Lys Val Lys Lys Arg Gln
580 585 590
Met Arg Leu Glu Ala Ala Arg Gln Gln Asn Leu Leu Pro Arg Tyr Thr
595 600 605
Trp Gly Lys Asp Phe Asn Ile Asn Ile Cys Lys Arg Gly Asn Asn Phe
610 615 620
Glu Val Thr Leu Ala Thr Lys Val Lys Lys Lys Lys Glu Lys Asn Tyr
625 630 635 640
Lys Val Val Leu Gly Tyr Asp Ala Asn Ile Val Arg Lys Asn Thr Tyr
645 650 655
Ala Ala Ile Glu Ala His Ala Asn Gly Asp Gly Val Ile Asp Tyr Asn
660 665 670
Asp Leu Pro Val Lys Pro Ile Glu Ser Gly Phe Val Thr Val Glu Ser
675 680 685
Gln Val Arg Asp Lys Ser Tyr Asp Gln Leu Ser Tyr Asn Gly Val Lys
690 695 700
Leu Leu Tyr Cys Lys Pro His Val Glu Ser Arg Arg Ser Phe Leu Glu
705 710 715 720
Lys Tyr Arg Asn Gly Thr Met Lys Asp Asn Arg Gly Asn Asn Ile Gln
725 730 735
Ile Asp Phe Met Lys Asp Phe Glu Ala Ile Ala Asp Asp Glu Thr Ser
740 745 750
Leu Tyr Tyr Phe Asn Met Lys Tyr Cys Lys Leu Leu Gln Ser Ser Ile
755 760 765
Arg Asn His Ser Ser Gln Ala Lys Glu Tyr Arg Glu Glu Ile Phe Glu
770 775 780
Leu Leu Arg Asp Gly Lys Leu Ser Val Leu Lys Leu Ser Ser Leu Ser
785 790 795 800
Asn Leu Ser Phe Val Met Phe Lys Val Ala Lys Ser Leu Ile Gly Thr
805 810 815
Tyr Phe Gly His Leu Leu Lys Lys Pro Lys Asn Ser Lys Ser Asp Val
820 825 830
Lys Ala Pro Pro Ile Thr Asp Glu Asp Lys Gln Lys Ala Asp Pro Glu
835 840 845
Met Phe Ala Leu Arg Leu Ala Leu Glu Glu Lys Arg Leu Asn Lys Val
850 855 860
Lys Ser Lys Lys Glu Val Ile Ala Asn Lys Ile Val Ala Lys Ala Leu
865 870 875 880
Glu Leu Arg Asp Lys Tyr Gly Pro Val Leu Ile Lys Gly Glu Asn Ile
885 890 895
Ser Asp Thr Thr Lys Lys Gly Lys Lys Ser Ser Thr Asn Ser Phe Leu
900 905 910
Met Asp Trp Leu Ala Arg Gly Val Ala Asn Lys Val Lys Glu Met Val
915 920 925
Met Met His Gln Gly Leu Glu Phe Val Glu Val Asn Pro Asn Phe Thr
930 935 940
Ser His Gln Asp Pro Phe Val His Lys Asn Pro Glu Asn Thr Phe Arg
945 950 955 960
Ala Arg Tyr Ser Arg Cys Thr Pro Ser Glu Leu Thr Glu Lys Asn Arg
965 970 975
Lys Glu Ile Leu Ser Phe Leu Ser Asp Lys Pro Ser Lys Arg Pro Thr
980 985 990
Asn Ala Tyr Tyr Asn Glu Gly Ala Met Ala Phe Leu Ala Thr Tyr Gly
995 1000 1005
Leu Lys Lys Asn Asp Val Leu Gly Val Ser Leu Glu Lys Phe Lys
1010 1015 1020
Gln Ile Met Ala Asn Ile Leu His Gln Arg Ser Glu Asp Gln Leu
1025 1030 1035
Leu Phe Pro Ser Arg Gly Gly Met Phe Tyr Leu Ala Thr Tyr Lys
1040 1045 1050
Leu Asp Ala Asp Ala Thr Ser Val Asn Trp Asn Gly Lys Gln Phe
1055 1060 1065
Trp Val Cys Asn Ala Asp Leu Val Ala Ala Tyr Asn Val Gly Leu
1070 1075 1080
Val Asp Ile Gln Lys Asp Phe Lys Lys Lys
1085 1090
<210> 9
<211> 1074
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 9
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Glu
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Gly Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Val
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Glu Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 10
<211> 1074
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 10
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys His His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 11
<211> 1098
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 11
Met Ser Ile Ser Asn Asn Asn Ile Leu Pro Tyr Asn Pro Lys Leu Leu
1 5 10 15
Pro Asp Asp Arg Lys His Lys Met Leu Val Asp Thr Phe Asn Gln Leu
20 25 30
Asp Leu Ile Arg Asn Asn Leu His Asp Met Ile Ile Ala Leu Tyr Gly
35 40 45
Ala Leu Lys Tyr Asp Asn Ile Lys Gln Phe Ala Ser Lys Glu Lys Pro
50 55 60
His Ile Ser Ala Asp Ala Leu Cys Ser Ile Asn Trp Phe Arg Leu Val
65 70 75 80
Lys Thr Asn Glu Arg Lys Pro Ala Ile Glu Ser Asn Gln Ile Ile Ser
85 90 95
Lys Phe Ile Gln Tyr Ser Gly His Thr Pro Asp Lys Tyr Ala Leu Ser
100 105 110
His Ile Thr Gly Asn His Glu Pro Ser His Lys Trp Ile Asp Cys Arg
115 120 125
Glu Tyr Ala Ile Asn Tyr Ala Arg Ile Met His Leu Ser Phe Ser Gln
130 135 140
Phe Gln Asp Leu Ala Thr Ala Cys Leu Asn Cys Lys Ile Leu Ile Leu
145 150 155 160
Asn Gly Thr Leu Thr Ser Ser Trp Ala Trp Gly Ala Asn Ser Ala Leu
165 170 175
Phe Gly Gly Ser Asp Lys Glu Asn Phe Ser Val Lys Ala Lys Ile Leu
180 185 190
Asn Ser Phe Ile Glu Asn Leu Lys Asp Glu Met Asn Thr Thr Lys Phe
195 200 205
Gln Val Val Glu Lys Val Cys Gln Gln Ile Gly Ser Ser Asp Ala Ala
210 215 220
Asp Leu Phe Asp Leu Tyr Arg Ser Thr Val Lys Asp Gly Asn Arg Gly
225 230 235 240
Pro Ala Thr Gly Arg Asn Pro Lys Val Met Asn Leu Phe Ser Gln Asp
245 250 255
Gly Glu Ile Ser Ser Glu Gln Arg Glu Asp Phe Ile Glu Ser Phe Gln
260 265 270
Lys Val Met Gln Glu Lys Asn Ser Lys Gln Ile Ile Pro His Leu Asp
275 280 285
Lys Leu Lys Tyr His Leu Val Lys Gln Ser Gly Leu Tyr Asp Ile Tyr
290 295 300
Ser Trp Ala Ala Ala Ile Lys Asn Ala Asn Ser Thr Ile Val Ala Ser
305 310 315 320
Asn Ser Ser Asn Leu Asn Thr Ile Leu Asn Lys Thr Glu Lys Gln Gln
325 330 335
Thr Phe Glu Glu Leu Arg Lys Asp Glu Lys Ile Val Ala Cys Ser Lys
340 345 350
Ile Leu Leu Ser Val Asn Asp Thr Leu Pro Glu Asp Leu His Tyr Asn
355 360 365
Pro Ser Thr Ser Asn Leu Gly Lys Asn Leu Asp Val Phe Phe Asp Leu
370 375 380
Leu Asn Glu Asn Ser Val His Thr Ile Glu Asn Lys Glu Glu Lys Asn
385 390 395 400
Lys Ile Val Lys Glu Cys Val Asn Gln Tyr Met Glu Glu Cys Lys Gly
405 410 415
Leu Asn Lys Pro Pro Met Pro Val Leu Leu Thr Phe Ile Ser Asp Tyr
420 425 430
Ala His Lys His Gln Ala Gln Asp Phe Leu Ser Ala Ala Lys Met Asn
435 440 445
Phe Ile Asp Leu Lys Ile Lys Ser Ile Lys Val Val Pro Thr Val His
450 455 460
Gly Ser Ser Pro Tyr Thr Trp Ile Ser Asn Leu Ser Lys Lys Asn Lys
465 470 475 480
Asp Gly Lys Met Ile Arg Thr Pro Asn Ser Ser Leu Ile Gly Trp Ile
485 490 495
Ile Pro Pro Glu Glu Ile His Asp Gln Lys Phe Ala Gly Gln Asn Pro
500 505 510
Ile Ile Trp Ala Val Leu Arg Val Tyr Cys Asn Asn Lys Trp Glu Met
515 520 525
His His Phe Pro Phe Ser Asp Ser Arg Phe Phe Thr Glu Val Tyr Ala
530 535 540
Tyr Lys Pro Asn Leu Pro Tyr Leu Pro Gly Gly Glu Asn Arg Ser Lys
545 550 555 560
Arg Phe Gly Tyr Arg His Ser Thr Asn Leu Ser Asn Glu Ser Arg Gln
565 570 575
Ile Leu Leu Asp Lys Ser Lys Tyr Ala Lys Ala Asn Lys Ser Val Leu
580 585 590
Arg Cys Met Glu Asn Met Thr His Asn Val Val Phe Asp Pro Lys Thr
595 600 605
Ser Leu Asn Ile Arg Ile Lys Thr Asp Lys Asn Asn Ser Pro Val Leu
610 615 620
Asp Asp Lys Gly Arg Ile Thr Phe Val Met Gln Ile Asn His Arg Ile
625 630 635 640
Leu Glu Lys Tyr Asn Asn Thr Lys Ile Glu Ile Gly Asp Arg Ile Leu
645 650 655
Ala Tyr Asp Gln Asn Gln Ser Glu Asn His Thr Tyr Ala Ile Leu Gln
660 665 670
Arg Thr Glu Glu Gly Ser His Ala His Gln Phe Asn Gly Trp Tyr Val
675 680 685
Arg Val Leu Glu Thr Gly Lys Val Thr Ser Ile Val Gln Gly Leu Ser
690 695 700
Gly Pro Ile Asp Gln Leu Asn Tyr Asp Gly Met Pro Val Thr Ser His
705 710 715 720
Lys Phe Asn Cys Trp Gln Ala Asp Arg Ser Ala Phe Val Ser Gln Phe
725 730 735
Ala Ser Leu Lys Ile Ser Glu Thr Glu Thr Phe Asp Glu Ala Tyr Gln
740 745 750
Ala Ile Asn Ala Gln Gly Ala Tyr Thr Trp Asn Leu Phe Tyr Leu Arg
755 760 765
Ile Leu Arg Lys Ala Leu Arg Val Cys His Met Glu Asn Ile Asn Gln
770 775 780
Phe Arg Glu Glu Ile Leu Ala Ile Ser Lys Asn Arg Leu Ser Pro Met
785 790 795 800
Ser Leu Gly Ser Leu Ser Gln Asn Ser Leu Lys Met Ile Arg Ala Phe
805 810 815
Lys Ser Ile Ile Asn Cys Tyr Met Ser Arg Met Ser Phe Val Asp Glu
820 825 830
Leu Gln Lys Lys Glu Gly Asp Leu Glu Leu His Thr Ile Met Arg Leu
835 840 845
Thr Asp Asn Lys Leu Asn Asp Lys Arg Val Glu Lys Ile Asn Arg Ala
850 855 860
Ser Ser Phe Leu Thr Asn Lys Ala His Ser Met Gly Cys Lys Met Ile
865 870 875 880
Val Gly Glu Ser Asp Leu Pro Val Ala Asp Ser Lys Thr Ser Lys Lys
885 890 895
Gln Asn Val Asp Arg Met Asp Trp Cys Ala Arg Ala Leu Ser His Lys
900 905 910
Val Glu Tyr Ala Cys Lys Leu Met Gly Leu Ala Tyr Arg Gly Ile Pro
915 920 925
Ala Tyr Met Ser Ser His Gln Asp Pro Leu Val His Leu Val Glu Ser
930 935 940
Lys Arg Ser Val Leu Arg Pro Arg Phe Val Val Ala Asp Lys Ser Asp
945 950 955 960
Val Lys Gln His His Leu Asp Asn Leu Arg Arg Met Leu Asn Ser Lys
965 970 975
Thr Lys Val Gly Thr Ala Val Tyr Tyr Arg Glu Ala Val Glu Leu Met
980 985 990
Cys Glu Glu Leu Gly Ile His Lys Thr Asp Met Ala Lys Gly Lys Val
995 1000 1005
Ser Leu Ser Asp Phe Val Asp Lys Phe Ile Gly Glu Lys Ala Ile
1010 1015 1020
Phe Pro Gln Arg Gly Gly Arg Phe Tyr Met Ser Thr Lys Arg Leu
1025 1030 1035
Thr Thr Gly Ala Lys Leu Ile Cys Tyr Ser Gly Ser Asp Val Trp
1040 1045 1050
Leu Ser Asp Ala Asp Glu Ile Ala Ala Ile Asn Ile Gly Met Phe
1055 1060 1065
Val Val Cys Asp Gln Thr Gly Ala Phe Lys Lys Lys Lys Lys Glu
1070 1075 1080
Lys Leu Asp Asp Glu Glu Cys Asp Ile Leu Pro Phe Arg Pro Met
1085 1090 1095
<210> 12
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 12
guuggaauga cuaauuuuug ugcccaccgu uggcac 36
<210> 13
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 13
aauuuuugug cccaucguug gcac 24
<210> 14
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 14
auuuuugugc ccaucguugg cac 23
<210> 15
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 15
guugcaaaac ccaagaaauc cgucuuucau ugacgg 36
<210> 16
<211> 34
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 16
gcaacaccua agaaauccgu cuuucauuga cggg 34
<210> 17
<211> 23
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 17
agaaauccgu cuuucauuga cgg 23
<210> 18
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 18
cuagcaauga ccuaauagug uguccuuagu ugacau 36
<210> 19
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 19
ccuacaauac cuaagaaauc cguccuaagu ugacgg 36
<210> 20
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 20
auaguguguc cuuaguugac au 22
<210> 21
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 21
guuggaauga cuaauuuuug ugcccaccgu uggcac 36
<210> 22
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 22
cccacaauac cugagaaauc cguccuacgu ugacgg 36
<210> 23
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 23
ucucaacgau agucagacau guguccucag ugacac 36
<210> 24
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 24
agacaugugu ccucagugac ac 22
<210> 25
<211> 1798
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 25
Met Ser Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu
1 5 10 15
Arg Lys Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly
20 25 30
Ser Ala Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr
35 40 45
Pro Glu Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp
50 55 60
Ile Ala Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp
65 70 75 80
Ser Leu Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu
85 90 95
Glu Tyr Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser
100 105 110
Ala Ser Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr
115 120 125
Tyr Asp Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His
130 135 140
Asp Leu Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu
145 150 155 160
Ser Asn Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu
165 170 175
Lys Glu Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu
180 185 190
Ala Ile Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln
195 200 205
Glu Ile Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln
210 215 220
Val Tyr Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile
225 230 235 240
Ala Lys Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp
245 250 255
Leu Lys Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys
260 265 270
Gln Glu Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp
275 280 285
Leu Trp Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys
290 295 300
Ile Lys Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln
305 310 315 320
Phe Lys Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu
325 330 335
Asn Asp Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr
340 345 350
Ile Cys Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys
355 360 365
Ala Trp Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu
370 375 380
Cys Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
385 390 395 400
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile
405 410 415
Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln
420 425 430
Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn
435 440 445
Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser
450 455 460
Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly
465 470 475 480
Arg Trp Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln
485 490 495
Glu Ile Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg
500 505 510
Thr Pro Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala
515 520 525
Ile Arg Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg
530 535 540
Ile Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
545 550 555 560
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile
565 570 575
Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly
580 585 590
Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr
595 600 605
Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly
610 615 620
Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
625 630 635 640
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr
645 650 655
Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu
660 665 670
Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu
675 680 685
Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr
690 695 700
Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly
705 710 715 720
Lys Ser Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe
725 730 735
Ile Glu Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser
740 745 750
Thr Leu Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe
755 760 765
Ser Thr Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln
770 775 780
Arg Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
785 790 795 800
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn
805 810 815
Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly
820 825 830
Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn
835 840 845
Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg
850 855 860
Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
865 870 875 880
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala
885 890 895
Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp
900 905 910
Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr
915 920 925
Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu
930 935 940
Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys
945 950 955 960
Ser Asn Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu
965 970 975
Gly Asn Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile
980 985 990
Tyr Phe Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe
995 1000 1005
Asp Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala
1010 1015 1020
Ala Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser
1025 1030 1035
Asp Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr
1040 1045 1050
Ser Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1055 1060 1065
Lys Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr
1070 1075 1080
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser
1085 1090 1095
Ser Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His
1100 1105 1110
Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu
1115 1120 1125
Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu
1130 1135 1140
Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser
1145 1150 1155
Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg
1160 1165 1170
Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile
1175 1180 1185
Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val
1190 1195 1200
Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg
1205 1210 1215
Glu Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn
1220 1225 1230
Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr
1235 1240 1245
Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His
1250 1255 1260
Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu
1265 1270 1275
Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
1280 1285 1290
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp
1295 1300 1305
Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln
1310 1315 1320
Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys
1325 1330 1335
Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly
1340 1345 1350
Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val
1355 1360 1365
Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr
1370 1375 1380
Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr
1385 1390 1395
Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg
1400 1405 1410
Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro
1415 1420 1425
Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln
1430 1435 1440
Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala
1445 1450 1455
Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp
1460 1465 1470
Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly
1475 1480 1485
Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro
1490 1495 1500
Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile
1505 1510 1515
Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
1520 1525 1530
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln
1535 1540 1545
Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln
1550 1555 1560
Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val
1565 1570 1575
Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu
1580 1585 1590
Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg
1595 1600 1605
Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp
1610 1615 1620
Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala
1625 1630 1635
Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala
1640 1645 1650
Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu
1655 1660 1665
Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr
1670 1675 1680
Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu
1685 1690 1695
Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile
1700 1705 1710
Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu
1715 1720 1725
Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly
1730 1735 1740
His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala
1745 1750 1755
Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
1760 1765 1770
Ile Glu Asn Ser Ser Pro Met Lys Arg Thr Ala Asp Gly Ser Glu
1775 1780 1785
Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1790 1795
<210> 26
<211> 1798
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 26
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr
20 25 30
Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe
35 40 45
Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln
50 55 60
Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile
65 70 75 80
Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His
85 90 95
Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro
100 105 110
Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr
115 120 125
Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile
130 135 140
His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro
145 150 155 160
Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys
165 170 175
Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg
180 185 190
Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro
195 200 205
Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg
210 215 220
Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln
225 230 235 240
Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln
245 250 255
Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg
260 265 270
Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu
275 280 285
Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys
290 295 300
Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg
305 310 315 320
Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe
325 330 335
Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu
340 345 350
Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln
355 360 365
Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro
370 375 380
Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu
385 390 395 400
Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys
405 410 415
Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val
420 425 430
Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly
435 440 445
Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys
450 455 460
Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln
465 470 475 480
Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala
485 490 495
Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His
500 505 510
Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu
515 520 525
Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly
530 535 540
Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr
545 550 555 560
Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser
565 570 575
Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala
580 585 590
Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala
595 600 605
Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr
610 615 620
Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu
625 630 635 640
Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly
645 650 655
His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp
660 665 670
Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr
675 680 685
Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Ser Gly Gly Ser
690 695 700
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
705 710 715 720
Ser Gly Gly Ser Ser Gly Gly Ser Met Ser Ser Ala Ile Lys Ser Tyr
725 730 735
Lys Ser Val Leu Arg Pro Asn Glu Arg Lys Asn Gln Leu Leu Lys Ser
740 745 750
Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala Phe Phe Phe Lys Met Leu
755 760 765
Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu Ile Val Arg Phe Ser Thr
770 775 780
Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala Leu Trp Cys Ala Val Asn
785 790 795 800
Trp Phe Arg Pro Val Ser Gln Asp Ser Leu Thr His Thr Ile Ala Ser
805 810 815
Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr Tyr Gly Gly Thr Ala Ser
820 825 830
Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser Ile Gly Glu Ser Tyr Tyr
835 840 845
Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp Leu Cys Arg Glu Leu Gly
850 855 860
Val Glu Val Ser Asp Leu Thr His Asp Leu Glu Ile Leu Cys Arg Glu
865 870 875 880
Lys Cys Leu Ala Val Ala Thr Glu Ser Asn Gln Asn Asn Ser Ile Ile
885 890 895
Ser Val Leu Phe Gly Thr Gly Glu Lys Glu Asp Arg Ser Val Lys Leu
900 905 910
Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile Ser Asn Leu Lys Glu Ile
915 920 925
Pro Lys Asn Val Ala Pro Ile Gln Glu Ile Ile Leu Asn Val Ala Lys
930 935 940
Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr Ala Gly Asn Leu Gly Ala
945 950 955 960
Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys Asp Gly Gln Lys Glu Phe
965 970 975
Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys Lys Val Ile Arg Gly Lys
980 985 990
Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu Glu Leu Arg Ser Tyr Val
995 1000 1005
Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp Ala Trp Gly Glu Met
1010 1015 1020
Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys Ser Thr Arg Asn
1025 1030 1035
Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys Glu Ile Gln
1040 1045 1050
Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp Phe Phe
1055 1060 1065
Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys Val
1070 1075 1080
His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
1085 1090 1095
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys
1100 1105 1110
Asp Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile
1115 1120 1125
Leu Arg Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp
1130 1135 1140
Ile Leu Ala Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys
1145 1150 1155
Ser Gln Lys Ala Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr
1160 1165 1170
Trp Thr Asn Ala Val Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp
1175 1180 1185
Arg Pro Asn Ser Leu Asp Leu Arg Ile Trp Leu Tyr Leu Lys Leu
1190 1195 1200
Arg His Pro Asp Gly Arg Trp Lys Lys Ala His Ile Pro Phe Tyr
1205 1210 1215
Asp Thr Arg Phe Phe Gln Glu Ile Tyr Ala Ala Gly Asn Ser Pro
1220 1225 1230
Val Asp Thr Cys Gln Phe Arg Thr Pro Arg Phe Gly Tyr His Leu
1235 1240 1245
Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg Val Asn Lys Lys His
1250 1255 1260
Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg Leu Ala Ile Gln
1265 1270 1275
Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr Glu Ile Ser
1280 1285 1290
Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val Lys Phe
1295 1300 1305
Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg Phe
1310 1315 1320
Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu
1325 1330 1335
Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly Cys
1340 1345 1350
Phe Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu
1355 1360 1365
Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala
1370 1375 1380
Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val
1385 1390 1395
Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val
1400 1405 1410
Thr Val Glu Ala Lys Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln
1415 1420 1425
Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr Ala Tyr Leu Leu Arg
1430 1435 1440
Asp Ile Val Arg Gly Lys Ser Leu Val Glu Leu Gln Gln Ile Arg
1445 1450 1455
Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp Cys Gly Val Thr Arg
1460 1465 1470
Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu Thr Val Lys Ala Val
1475 1480 1485
Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr Ala Leu Asn Ala Ser
1490 1495 1500
Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys Glu Phe Asp Pro
1505 1510 1515
Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile Arg Thr Arg
1520 1525 1530
Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu Ile Gln
1535 1540 1545
Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly Asp
1550 1555 1560
Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg
1565 1570 1575
Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln
1580 1585 1590
Leu Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu
1595 1600 1605
Tyr Thr Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys
1610 1615 1620
Ala Met Lys Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly
1625 1630 1635
Asp Trp Val Leu Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn
1640 1645 1650
Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly Val Lys Glu Phe Leu
1655 1660 1665
Ser His Tyr Glu Leu Gln Asp Leu Glu Glu Glu Leu Leu Lys Trp
1670 1675 1680
Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys Trp Val Leu Gln Asn
1685 1690 1695
Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu Ala Val Val Tyr Ile
1700 1705 1710
Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala Thr His Lys Val Ala
1715 1720 1725
Thr Gly Ala Val Ser Ile Val Phe Asp Gln Lys Gln Val Trp Val
1730 1735 1740
Cys Asn Ala Asp His Val Ala Ala Ala Asn Ile Ala Leu Thr Gly
1745 1750 1755
Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu Glu Asn Pro Asp Gly
1760 1765 1770
Ser Arg Ile Lys Leu Gln Leu Thr Ser Lys Arg Pro Ala Ala Thr
1775 1780 1785
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1790 1795
<210> 27
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 27
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43
<210> 28
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(4)
<223> 用硫代磷酸酯改性
<220>
<221> misc_feature
<222> (40)..(43)
<223> 用硫代磷酸酯改性
<400> 28
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43
<210> 29
<211> 678
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 29
Met Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His Asn Cys
485 490 495
Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu Thr Asp
500 505 510
Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly Ser Ser
515 520 525
Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu
530 535 540
Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln
545 550 555 560
Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly
565 570 575
Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala
580 585 590
His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
595 600 605
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala
610 615 620
Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln
625 630 635 640
Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala
645 650 655
Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu
660 665 670
Ile Glu Asn Ser Ser Pro
675
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 30
gtagcctctc ccgctctggt 20
<210> 31
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(3)
<223> 用2'-O-甲基化改性
<220>
<221> misc_feature
<222> (40)..(42)
<223> 用2'-O-甲基化改性
<400> 31
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 32
gggaagtggt tggtcagcat 20
<210> 33
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(4)
<223> 用硫代磷酸酯改性
<220>
<221> misc_feature
<222> (1)..(3)
<223> 用2'-O-甲基化改性
<220>
<221> misc_feature
<222> (40)..(42)
<223> 用2'-O-甲基化改性
<220>
<221> misc_feature
<222> (40)..(43)
<223> 用硫代磷酸酯改性
<400> 33
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 34
gagccagtgt tgctagtcaa 20
<210> 35
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 35
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 36
aatcctccac cagtcatggt 20
<210> 37
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(4)
<223> 用硫代磷酸酯改性
<220>
<221> misc_feature
<222> (87)..(90)
<223> 用硫代磷酸酯改性
<400> 37
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 38
ttaaactctc catggaccag 20
<210> 39
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(3)
<223> 用2'-O-甲基化改性
<220>
<221> misc_feature
<222> (87)..(89)
<223> 用2'-O-甲基化改性
<400> 39
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 40
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 40
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60
cuccccgagu gguucagggc ccagcuaggg auccagaucu gggugauuua ggcucccucu 120
gucuggauca guccucc 137
<210> 41
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 41
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60
cuccccgagu gguucagggc ccagcuaggg auccagaucu gggugau 107
<210> 42
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 42
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugcacccc cauaaggggg 60
gacauucuuu guagccucuc cccgaguggu ucagggccca gcuaggg 107
<210> 43
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 43
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60
cuccccgagu gguucagggc ccagcuaggg 90
<210> 44
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 44
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60
cucccagcgg cucugguuca gggcccagcu aggg 94
<210> 45
<211> 86
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 45
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggugacauuc uuuguagccu 60
cucccugguu cagggcccag cuaggg 86
<210> 46
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(4)
<223> 用硫代磷酸酯改性
<220>
<221> misc_feature
<222> (1)..(3)
<223> 用2'-O-甲基化改性
<220>
<221> misc_feature
<222> (87)..(89)
<223> 用2'-O-甲基化改性
<220>
<221> misc_feature
<222> (87)..(90)
<223> 用硫代磷酸酯改性
<400> 46
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 47
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 47
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 48
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(4)
<223> 用硫代磷酸酯改性
<220>
<221> misc_feature
<222> (104)..(107)
<223> 用硫代磷酸酯改性
<400> 48
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 49
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(3)
<223> 用2'-O-甲基化改性
<220>
<221> misc_feature
<222> (104)..(106)
<223> 用2'-O-甲基化改性
<400> 49
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 50
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(4)
<223> 用硫代磷酸酯改性
<220>
<221> misc_feature
<222> (1)..(3)
<223> 用2'-O-甲基化改性
<220>
<221> misc_feature
<222> (104)..(106)
<223> 用2'-O-甲基化改性
<220>
<221> misc_feature
<222> (104)..(107)
<223> 用硫代磷酸酯改性
<400> 50
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 51
<211> 1074
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 51
Met Ala Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala
1 5 10 15
Arg Lys Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly
20 25 30
Gln Arg Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr
35 40 45
Leu Glu Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val
50 55 60
Cys Ala Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys
65 70 75 80
Asp Gly Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser
85 90 95
Gly Lys Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser
100 105 110
Ser Asp Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe
115 120 125
Gln Arg Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met
130 135 140
Leu Phe Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr
145 150 155 160
Ala Ala Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser
165 170 175
Lys Lys Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn
180 185 190
Glu Asn Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu
195 200 205
Asn Ala Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala
210 215 220
Gly Gly Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met
225 230 235 240
Val Ser Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val
245 250 255
Leu Lys Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu
260 265 270
Lys Gln Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val
275 280 285
Tyr Ser Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr
290 295 300
Thr Arg Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu
305 310 315 320
Leu Lys Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val
325 330 335
Leu Asn Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe
340 345 350
Asn Ile Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser
355 360 365
Lys Leu Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly
370 375 380
Ile Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
385 390 395 400
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser
405 410 415
Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys
420 425 430
Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp
435 440 445
Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys
450 455 460
Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg
465 470 475 480
Ala Glu Leu His Tyr Asp Gly Lys Lys Ala Lys Ala His Leu Pro Phe
485 490 495
Tyr Asn Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val
500 505 510
Ala Glu Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly
515 520 525
Lys Asp Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr
530 535 540
Lys Lys Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala
545 550 555 560
Asn Thr Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys
565 570 575
Arg Glu Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg
580 585 590
Asp Arg Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp
595 600 605
Arg Asn Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro
610 615 620
Pro Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
625 630 635 640
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser
645 650 655
Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg
660 665 670
Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile
675 680 685
Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile
690 695 700
Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val
705 710 715 720
Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala
725 730 735
Lys Lys Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser
740 745 750
Lys Asp Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp
755 760 765
Ala Ser Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr
770 775 780
Phe Asn Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn
785 790 795 800
Pro Val Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn
805 810 815
Lys Arg Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu
820 825 830
Ala Leu Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly
835 840 845
Glu Val Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp
850 855 860
Trp Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
865 870 875 880
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln
885 890 895
Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala
900 905 910
Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg
915 920 925
Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr
930 935 940
Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His
945 950 955 960
Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys
965 970 975
Ile Leu Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly
980 985 990
Gly Arg Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro
995 1000 1005
Ile Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu
1010 1015 1020
Val Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser
1025 1030 1035
Lys Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys
1040 1045 1050
Ala Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr
1055 1060 1065
Ser Gln Leu Pro Gln Lys
1070
<210> 52
<211> 1832
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 52
Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ala
1 5 10 15
Ser Ile Ser Arg Pro Tyr Gly Thr Lys Leu Arg Pro Asp Ala Arg Lys
20 25 30
Lys Glu Met Leu Asp Lys Phe Phe Asn Thr Leu Thr Lys Gly Gln Arg
35 40 45
Val Phe Ala Asp Leu Ala Leu Cys Ile Tyr Gly Ser Leu Thr Leu Glu
50 55 60
Met Ala Lys Ser Leu Glu Pro Glu Ser Asp Ser Glu Leu Val Cys Ala
65 70 75 80
Ile Gly Trp Phe Arg Leu Val Asp Lys Thr Ile Trp Ser Lys Asp Gly
85 90 95
Ile Lys Gln Glu Asn Leu Val Lys Gln Tyr Glu Ala Tyr Ser Gly Lys
100 105 110
Glu Ala Ser Glu Val Val Lys Thr Tyr Leu Asn Ser Pro Ser Ser Asp
115 120 125
Lys Tyr Val Trp Ile Asp Cys Arg Gln Lys Phe Leu Arg Phe Gln Arg
130 135 140
Glu Leu Gly Thr Arg Asn Leu Ser Glu Asp Phe Glu Cys Met Leu Phe
145 150 155 160
Glu Gln Tyr Ile Arg Leu Thr Lys Gly Glu Ile Glu Gly Tyr Ala Ala
165 170 175
Ile Ser Asn Met Phe Gly Asn Gly Glu Lys Glu Asp Arg Ser Lys Lys
180 185 190
Arg Met Tyr Ala Thr Arg Met Lys Asp Trp Leu Glu Ala Asn Glu Asn
195 200 205
Ile Thr Trp Glu Gln Tyr Arg Glu Ala Leu Lys Asn Gln Leu Asn Ala
210 215 220
Lys Asn Leu Glu Gln Val Val Ala Asn Tyr Lys Gly Asn Ala Gly Gly
225 230 235 240
Ala Asp Pro Phe Phe Lys Tyr Ser Phe Ser Lys Glu Gly Met Val Ser
245 250 255
Lys Lys Glu His Ala Gln Gln Leu Asp Lys Phe Lys Thr Val Leu Lys
260 265 270
Asn Lys Ala Arg Asp Leu Asn Phe Pro Asn Lys Glu Lys Leu Lys Gln
275 280 285
Tyr Leu Glu Ala Glu Ile Gly Ile Pro Val Asp Ala Asn Val Tyr Ser
290 295 300
Gln Met Phe Ser Asn Gly Val Ser Glu Val Gln Pro Lys Thr Thr Arg
305 310 315 320
Asn Met Ser Phe Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu Leu Lys
325 330 335
Asp Leu Asn Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val Leu Asn
340 345 350
Gly Phe Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe Asn Ile
355 360 365
Thr Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser Lys Leu
370 375 380
Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly Ile Gln
385 390 395 400
Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro Ile Arg
405 410 415
Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val Ser Ala Glu
420 425 430
Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu Glu Lys Ile Ser
435 440 445
Arg Val Lys Ala His Pro Ile Val Ile Ser Asn Arg Tyr Trp Ala Phe
450 455 460
Gly Thr Ser Ala Leu Val Gly Asn Ile Met Pro Ala Asp Lys Arg His
465 470 475 480
Gln Gly Glu Tyr Ala Gly Gln Asn Phe Lys Met Trp Leu Arg Ala Glu
485 490 495
Leu His Tyr Asp Gly Lys Lys Ala Lys Ala His Leu Pro Phe Tyr Asn
500 505 510
Ala Arg Phe Phe Glu Glu Val Tyr Cys Tyr His Pro Ser Val Ala Glu
515 520 525
Ile Thr Pro Phe Lys Thr Lys Gln Phe Gly Cys Glu Ile Gly Lys Asp
530 535 540
Ile Pro Asp Tyr Val Ser Val Ala Leu Lys Asp Asn Pro Tyr Lys Lys
545 550 555 560
Ala Thr Lys Arg Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala Asn Thr
565 570 575
Thr Arg Val Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys Arg Glu
580 585 590
Asn Asp Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg Asp Arg
595 600 605
Pro Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp Arg Asn
610 615 620
Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro Pro Gly
625 630 635 640
Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr Ile Lys
645 650 655
Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn Ser Thr Thr
660 665 670
Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser Glu Arg Phe Lys
675 680 685
Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg Lys Leu Ile Arg Gln
690 695 700
Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly Gln Asp Tyr Ile Pro Glu
705 710 715 720
Asn Pro Ser Ser Phe Asp Val Arg Gly Glu Thr Leu Tyr Val Phe Asn
725 730 735
Ser Asn Tyr Leu Lys Ala Leu Val Ser Lys His Arg Lys Ala Lys Lys
740 745 750
Pro Val Glu Gly Ile Leu Asp Glu Ile Glu Ala Trp Thr Ser Lys Asp
755 760 765
Lys Asp Ser Cys Ser Leu Met Arg Leu Ser Ser Leu Ser Asp Ala Ser
770 775 780
Met Gln Gly Ile Ala Ser Leu Lys Ser Leu Ile Asn Ser Tyr Phe Asn
785 790 795 800
Lys Asn Gly Cys Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn Pro Val
805 810 815
Leu Tyr Ala Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn Lys Arg
820 825 830
Ser Glu Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu Ala Leu
835 840 845
Leu Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly Glu Val
850 855 860
Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp Trp Cys
865 870 875 880
Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe His Gly
885 890 895
Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His Gln Asp Pro
900 905 910
Phe Glu His Arg Arg Val Ala Asp His Ile Val Met Arg Ala Arg Phe
915 920 925
Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp His Val Arg Asn Phe
930 935 940
Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr Gly Leu Tyr Tyr Lys Gln
945 950 955 960
Ala Thr Met Asp Phe Leu Lys His Tyr Gly Leu Glu Glu His Ala Glu
965 970 975
Gly Leu Glu Asn Lys Lys Ile Lys Phe Tyr Asp Phe Arg Lys Ile Leu
980 985 990
Glu Asp Lys Asn Leu Thr Ser Val Ile Ile Pro Lys Arg Gly Gly Arg
995 1000 1005
Ile Tyr Met Ala Thr Asn Pro Val Thr Ser Asp Ser Thr Pro Ile
1010 1015 1020
Thr Tyr Ala Gly Lys Thr Tyr Asn Arg Cys Asn Ala Asp Glu Val
1025 1030 1035
Ala Ala Ala Asn Ile Val Ile Ser Val Leu Ala Pro Arg Ser Lys
1040 1045 1050
Lys Asn Arg Glu Gln Asp Asp Ile Pro Leu Ile Thr Lys Lys Ala
1055 1060 1065
Glu Ser Lys Ser Pro Pro Lys Asp Arg Lys Arg Ser Lys Thr Ser
1070 1075 1080
Gln Leu Pro Gln Lys Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1085 1090 1095
Gln Ala Lys Lys Lys Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser
1100 1105 1110
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1115 1120 1125
Ser Gly Gly Ser Ser Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu
1130 1135 1140
Tyr Arg Leu His Glu Thr Ser Lys Glu Pro Asp Val Ser Leu Gly
1145 1150 1155
Ser Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly
1160 1165 1170
Gly Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu
1175 1180 1185
Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser
1190 1195 1200
Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu
1205 1210 1215
Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro
1220 1225 1230
Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val
1235 1240 1245
Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
1250 1255 1260
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser
1265 1270 1275
His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys
1280 1285 1290
Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp
1295 1300 1305
Arg Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg
1310 1315 1320
Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala
1325 1330 1335
Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu
1340 1345 1350
Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser
1355 1360 1365
Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu
1370 1375 1380
Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys
1385 1390 1395
Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln
1400 1405 1410
Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro
1415 1420 1425
Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala
1430 1435 1440
Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu Met Ala Ala
1445 1450 1455
Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly
1460 1465 1470
Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu
1475 1480 1485
Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
1490 1495 1500
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr
1505 1510 1515
Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys
1520 1525 1530
Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met
1535 1540 1545
Val Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr
1550 1555 1560
Met Gly Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala
1565 1570 1575
Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met
1580 1585 1590
Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe
1595 1600 1605
Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro
1610 1615 1620
Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala
1625 1630 1635
His Gly Thr Arg Pro Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala
1640 1645 1650
Asp His Thr Trp Tyr Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly
1655 1660 1665
Gln Arg Lys Ala Gly Ala Ala Val Thr Thr Glu Thr Glu Val Ile
1670 1675 1680
Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu
1685 1690 1695
Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala Glu Gly Lys Lys
1700 1705 1710
Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala Thr Ala His
1715 1720 1725
Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu
1730 1735 1740
Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys
1745 1750 1755
Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly
1760 1765 1770
His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala
1775 1780 1785
Asp Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr
1790 1795 1800
Ser Thr Leu Leu Ile Glu Asn Ser Ser Pro Met Lys Arg Thr Ala
1805 1810 1815
Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1820 1825 1830
<210> 53
<211> 1818
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 53
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr
20 25 30
Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe
35 40 45
Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln
50 55 60
Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile
65 70 75 80
Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His
85 90 95
Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro
100 105 110
Trp Asn Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr
115 120 125
Arg Pro Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile
130 135 140
His Pro Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro
145 150 155 160
Ser His Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys
165 170 175
Leu Arg Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg
180 185 190
Asp Pro Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro
195 200 205
Gln Gly Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg
210 215 220
Asp Leu Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln
225 230 235 240
Tyr Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln
245 250 255
Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg
260 265 270
Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu
275 280 285
Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys
290 295 300
Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg
305 310 315 320
Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe
325 330 335
Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu
340 345 350
Phe Asn Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln
355 360 365
Ala Leu Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro
370 375 380
Phe Glu Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu
385 390 395 400
Thr Gln Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys
405 410 415
Lys Leu Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val
420 425 430
Ala Ala Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly
435 440 445
Gln Pro Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys
450 455 460
Gln Pro Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln
465 470 475 480
Ala Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala
485 490 495
Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln His
500 505 510
Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro Asp Leu
515 520 525
Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr Thr Asp Gly
530 535 540
Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly Ala Ala Val Thr
545 550 555 560
Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu Pro Ala Gly Thr Ser
565 570 575
Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr Gln Ala Leu Lys Met Ala
580 585 590
Glu Gly Lys Lys Leu Asn Val Tyr Thr Asp Ser Arg Tyr Ala Phe Ala
595 600 605
Thr Ala His Ile His Gly Glu Ile Tyr Arg Arg Arg Gly Trp Leu Thr
610 615 620
Ser Glu Gly Lys Glu Ile Lys Asn Lys Asp Glu Ile Leu Ala Leu Leu
625 630 635 640
Lys Ala Leu Phe Leu Pro Lys Arg Leu Ser Ile Ile His Cys Pro Gly
645 650 655
His Gln Lys Gly His Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp
660 665 670
Gln Ala Ala Arg Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr
675 680 685
Leu Leu Ile Glu Asn Ser Ser Pro Ser Gly Gly Ser Ser Gly Gly Ser
690 695 700
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
705 710 715 720
Ser Gly Gly Ser Ser Gly Gly Ser Met Ala Ser Ile Ser Arg Pro Tyr
725 730 735
Gly Thr Lys Leu Arg Pro Asp Ala Arg Lys Lys Glu Met Leu Asp Lys
740 745 750
Phe Phe Asn Thr Leu Thr Lys Gly Gln Arg Val Phe Ala Asp Leu Ala
755 760 765
Leu Cys Ile Tyr Gly Ser Leu Thr Leu Glu Met Ala Lys Ser Leu Glu
770 775 780
Pro Glu Ser Asp Ser Glu Leu Val Cys Ala Ile Gly Trp Phe Arg Leu
785 790 795 800
Val Asp Lys Thr Ile Trp Ser Lys Asp Gly Ile Lys Gln Glu Asn Leu
805 810 815
Val Lys Gln Tyr Glu Ala Tyr Ser Gly Lys Glu Ala Ser Glu Val Val
820 825 830
Lys Thr Tyr Leu Asn Ser Pro Ser Ser Asp Lys Tyr Val Trp Ile Asp
835 840 845
Cys Arg Gln Lys Phe Leu Arg Phe Gln Arg Glu Leu Gly Thr Arg Asn
850 855 860
Leu Ser Glu Asp Phe Glu Cys Met Leu Phe Glu Gln Tyr Ile Arg Leu
865 870 875 880
Thr Lys Gly Glu Ile Glu Gly Tyr Ala Ala Ile Ser Asn Met Phe Gly
885 890 895
Asn Gly Glu Lys Glu Asp Arg Ser Lys Lys Arg Met Tyr Ala Thr Arg
900 905 910
Met Lys Asp Trp Leu Glu Ala Asn Glu Asn Ile Thr Trp Glu Gln Tyr
915 920 925
Arg Glu Ala Leu Lys Asn Gln Leu Asn Ala Lys Asn Leu Glu Gln Val
930 935 940
Val Ala Asn Tyr Lys Gly Asn Ala Gly Gly Ala Asp Pro Phe Phe Lys
945 950 955 960
Tyr Ser Phe Ser Lys Glu Gly Met Val Ser Lys Lys Glu His Ala Gln
965 970 975
Gln Leu Asp Lys Phe Lys Thr Val Leu Lys Asn Lys Ala Arg Asp Leu
980 985 990
Asn Phe Pro Asn Lys Glu Lys Leu Lys Gln Tyr Leu Glu Ala Glu Ile
995 1000 1005
Gly Ile Pro Val Asp Ala Asn Val Tyr Ser Gln Met Phe Ser Asn
1010 1015 1020
Gly Val Ser Glu Val Gln Pro Lys Thr Thr Arg Asn Met Ser Phe
1025 1030 1035
Ser Asn Glu Lys Leu Asp Leu Leu Thr Glu Leu Lys Asp Leu Asn
1040 1045 1050
Lys Gly Asp Gly Phe Glu Tyr Ala Arg Glu Val Leu Asn Gly Phe
1055 1060 1065
Phe Asp Ser Glu Leu His Thr Thr Glu Asp Lys Phe Asn Ile Thr
1070 1075 1080
Ser Arg Tyr Leu Gly Gly Asp Lys Ser Asn Arg Leu Ser Lys Leu
1085 1090 1095
Tyr Lys Ile Trp Lys Lys Glu Gly Val Asp Cys Glu Glu Gly Ile
1100 1105 1110
Gln Gln Phe Cys Glu Ala Val Lys Asp Lys Met Gly Gln Ile Pro
1115 1120 1125
Ile Arg Asn Val Leu Lys Tyr Leu Trp Gln Phe Arg Glu Thr Val
1130 1135 1140
Ser Ala Glu Asp Phe Glu Ala Ala Ala Lys Ala Asn His Leu Glu
1145 1150 1155
Glu Lys Ile Ser Arg Val Lys Ala His Pro Ile Val Ile Ser Asn
1160 1165 1170
Arg Tyr Trp Ala Phe Gly Thr Ser Ala Leu Val Gly Asn Ile Met
1175 1180 1185
Pro Ala Asp Lys Arg His Gln Gly Glu Tyr Ala Gly Gln Asn Phe
1190 1195 1200
Lys Met Trp Leu Arg Ala Glu Leu His Tyr Asp Gly Lys Lys Ala
1205 1210 1215
Lys Ala His Leu Pro Phe Tyr Asn Ala Arg Phe Phe Glu Glu Val
1220 1225 1230
Tyr Cys Tyr His Pro Ser Val Ala Glu Ile Thr Pro Phe Lys Thr
1235 1240 1245
Lys Gln Phe Gly Cys Glu Ile Gly Lys Asp Ile Pro Asp Tyr Val
1250 1255 1260
Ser Val Ala Leu Lys Asp Asn Pro Tyr Lys Lys Ala Thr Lys Arg
1265 1270 1275
Ile Leu Arg Ala Ile Tyr Asn Pro Val Ala Asn Thr Thr Arg Val
1280 1285 1290
Asp Lys Thr Thr Asn Cys Ser Phe Met Ile Lys Arg Glu Asn Asp
1295 1300 1305
Glu Tyr Lys Leu Val Ile Asn Arg Lys Ile Ser Arg Asp Arg Pro
1310 1315 1320
Lys Arg Ile Glu Val Gly Arg Thr Ile Met Gly Tyr Asp Arg Asn
1325 1330 1335
Gln Thr Ala Ser Asp Thr Tyr Trp Ile Gly Arg Leu Val Pro Pro
1340 1345 1350
Gly Thr Arg Gly Ala Tyr Arg Ile Gly Glu Trp Ser Val Gln Tyr
1355 1360 1365
Ile Lys Ser Gly Pro Val Leu Ser Ser Thr Gln Gly Val Asn Asn
1370 1375 1380
Ser Thr Thr Asp Gln Leu Val Tyr Asn Gly Met Pro Ser Ser Ser
1385 1390 1395
Glu Arg Phe Lys Ala Trp Lys Lys Ala Arg Met Ala Phe Ile Arg
1400 1405 1410
Lys Leu Ile Arg Gln Leu Asn Asp Glu Gly Leu Glu Ser Lys Gly
1415 1420 1425
Gln Asp Tyr Ile Pro Glu Asn Pro Ser Ser Phe Asp Val Arg Gly
1430 1435 1440
Glu Thr Leu Tyr Val Phe Asn Ser Asn Tyr Leu Lys Ala Leu Val
1445 1450 1455
Ser Lys His Arg Lys Ala Lys Lys Pro Val Glu Gly Ile Leu Asp
1460 1465 1470
Glu Ile Glu Ala Trp Thr Ser Lys Asp Lys Asp Ser Cys Ser Leu
1475 1480 1485
Met Arg Leu Ser Ser Leu Ser Asp Ala Ser Met Gln Gly Ile Ala
1490 1495 1500
Ser Leu Lys Ser Leu Ile Asn Ser Tyr Phe Asn Lys Asn Gly Cys
1505 1510 1515
Lys Thr Ile Glu Asp Lys Glu Lys Phe Asn Pro Val Leu Tyr Ala
1520 1525 1530
Lys Leu Val Glu Val Glu Gln Arg Arg Thr Asn Lys Arg Ser Glu
1535 1540 1545
Lys Val Gly Arg Ile Ala Gly Ser Leu Glu Gln Leu Ala Leu Leu
1550 1555 1560
Asn Gly Val Glu Val Val Ile Gly Glu Ala Asp Leu Gly Glu Val
1565 1570 1575
Glu Lys Gly Lys Ser Lys Lys Gln Asn Ser Arg Asn Met Asp Trp
1580 1585 1590
Cys Ala Lys Gln Val Ala Gln Arg Leu Glu Tyr Lys Leu Ala Phe
1595 1600 1605
His Gly Ile Gly Tyr Phe Gly Val Asn Pro Met Tyr Thr Ser His
1610 1615 1620
Gln Asp Pro Phe Glu His Arg Arg Val Ala Asp His Ile Val Met
1625 1630 1635
Arg Ala Arg Phe Glu Glu Val Asn Val Glu Asn Ile Ala Glu Trp
1640 1645 1650
His Val Arg Asn Phe Ser Asn Tyr Leu Arg Ala Asp Ser Gly Thr
1655 1660 1665
Gly Leu Tyr Tyr Lys Gln Ala Thr Met Asp Phe Leu Lys His Tyr
1670 1675 1680
Gly Leu Glu Glu His Ala Glu Gly Leu Glu Asn Lys Lys Ile Lys
1685 1690 1695
Phe Tyr Asp Phe Arg Lys Ile Leu Glu Asp Lys Asn Leu Thr Ser
1700 1705 1710
Val Ile Ile Pro Lys Arg Gly Gly Arg Ile Tyr Met Ala Thr Asn
1715 1720 1725
Pro Val Thr Ser Asp Ser Thr Pro Ile Thr Tyr Ala Gly Lys Thr
1730 1735 1740
Tyr Asn Arg Cys Asn Ala Asp Glu Val Ala Ala Ala Asn Ile Val
1745 1750 1755
Ile Ser Val Leu Ala Pro Arg Ser Lys Lys Asn Arg Glu Gln Asp
1760 1765 1770
Asp Ile Pro Leu Ile Thr Lys Lys Ala Glu Ser Lys Ser Pro Pro
1775 1780 1785
Lys Asp Arg Lys Arg Ser Lys Thr Ser Gln Leu Pro Gln Lys Lys
1790 1795 1800
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1805 1810 1815
<210> 54
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 54
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120
uccugggcag cccgaga 137
<210> 55
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 55
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc cccagcuuug ccuuguu 107
<210> 56
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 56
agaaauccgu cuuucauuga cgggggaagu gguuggucag caugcacccc cauaaggggg 60
cagcuacuuu gggaaguggu ugcgaggcau ggauuauagc cgaaggc 107
<210> 57
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 57
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc 90
<210> 58
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 58
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugagcgg ucagcaugga uuauagccga aggc 94
<210> 59
<211> 86
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 59
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguuggcaug gauuauagcc gaaggc 86
<210> 60
<211> 42
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 60
agacaugugu ccucagugac acgggaagug guuggucagc au 42
<210> 61
<211> 95
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 61
agacaugugu ccucagugac acgggaagug guuggucagc auugauucca gcuacucugg 60
gaagugguug cagugcaugg auuauagccg aaggc 95
<210> 62
<211> 149
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 62
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120
ucauugacgg gacgcuacua uagcugcac 149
<210> 63
<211> 149
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 63
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120
ucauugacgg gacgcuacua uagcugcac 149
<210> 64
<211> 149
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 64
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120
ucauugacgg gacgcuacua uagcugcac 149
<210> 65
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 65
gattccagct actttgggaa gtggttggtc agcatggatt atagccgaag gccccag 57
<210> 66
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 66
ctaaggtcga tgaaaccctt caccaaccag tcgtacctaa tatcggcttc cggggtc 57
<210> 67
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 67
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguuggucag cauggauuau agccgaaggc 90
<210> 68
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 68
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguugcgagu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120
ucuccuuccu gaaggac 137
<210> 69
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 69
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguugcgagu caagggcagc augcugggcc cgucccacua caggcca 107
<210> 70
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 70
agaaauccgu cuuucauuga cgggagccag uguugcuagu caagcacccc cauaaggggg 60
uuccuucuuu gagccagugu ugcgagucaa gggcagcaug cugggcc 107
<210> 71
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 71
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguugcgagu caagggcagc augcugggcc 90
<210> 72
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 72
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguugagcgc uagucaaggg cagcaugcug ggcc 94
<210> 73
<211> 86
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 73
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguugucaag ggcagcaugc ugggcc 86
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 74
gggaagtggt tggtcagcat 20
<210> 75
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 75
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguuggucag cauggauuau agccgaaggc 90
<210> 76
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 76
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc 90
<210> 77
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 77
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugagcgg ucagcaugga uuauagccga aggc 94
<210> 78
<211> 86
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 78
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguuggcaug gauuauagcc gaaggc 86
<210> 79
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 79
agaaauccgu cuuucauuga cgggggaagu gguuggucag caugcacccc cauaaggggg 60
cagcuacuuu gggaaguggu ugcgaggcau ggauuauagc cgaaggc 107
<210> 80
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 80
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc 90
<210> 81
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 81
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60
caccacgagu ggugacaacc ccaagcagcc cacacauuuu caagugcccc caggaugcgu 120
ggagggaggg gucugug 137
<210> 82
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 82
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60
caccacgagu ggugacaacc ccaagcagcc cacacauuuu caagugc 107
<210> 83
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 83
agaaauccgu cuuucauuga cggaauccuc caccagucau ggugcacccc cauaaggggg 60
agauaccuuu aauccuccac cacgaguggu gacaacccca agcagcc 107
<210> 84
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 84
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60
caccacgagu ggugacaacc ccaagcagcc 90
<210> 85
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 85
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60
caccaagcgg ucauggugac aaccccaagc agcc 94
<210> 86
<211> 86
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 86
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uuuaauccuc 60
caccauggug acaaccccaa gcagcc 86
<210> 87
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 87
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcgagg cauggauuau agccgaaggc 90
<210> 88
<211> 96
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 88
ugggaagugg uuggucagca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgc 96
<210> 89
<211> 29
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 89
ggcuauaauc caugcaagug accaaccac 29
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 90
gggaagtggt tgcagtgcat 20
<210> 91
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 91
gagccagtgt tggatctcaa 20
<210> 92
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 92
ttaaactctc caacctccag 20
<210> 93
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 93
uaauuucuac uguuguagau 20
<210> 94
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 94
agaaaugcau gguucucaug c 21
<210> 95
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 95
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccacgagc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120
ggacucucuc caagaga 137
<210> 96
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 96
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uuuuuaaacu 60
cuccacgagc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 97
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 97
agaaauccgu cuuucauuga cgguuaaacu cuccauggac caggcacccc cauaaggggg 60
aaaagacuuu uuaaacucuc cacgagccag gcucauccag cuuccca 107
<210> 98
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 98
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60
cuccacgagc caggcucauc cagcuuccca 90
<210> 99
<211> 94
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 99
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60
cuccaagcgu ggaccaggcu cauccagcuu ccca 94
<210> 100
<211> 86
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 100
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uguuuaaacu 60
cuccaccagg cucauccagc uuccca 86
<210> 101
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 101
aaaauuaccu aguaauuagg u 21
<210> 102
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 102
ggauuucuac uuuuguagau 20
<210> 103
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 103
aaauuucuac uuuuguagau 20
<210> 104
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 104
cgcgcccacg cggggcgcga c 21
<210> 105
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 105
uaauuucuac ucuuguagau 20
<210> 106
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 106
gaauuucuac uauuguagau 20
<210> 107
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 107
gaaucucuac ucuuuguaga u 21
<210> 108
<211> 19
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 108
uaauuucuac uuuguagau 19
<210> 109
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 109
aaauuucuac uguuuguaga u 21
<210> 110
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 110
agaaauccgu cuuucauuga cggguagccu cucccgcucu ggu 43
<210> 111
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 111
gaauuucuac uuuuguagau 20
<210> 112
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 112
agaaauccgu cuuucauuga cgggggaagu gguuggucag cau 43
<210> 113
<211> 21
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 113
uaauuucuac uaaguguaga u 21
<210> 114
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 114
agaaauccgu cuuucauuga cgggagccag uguugcuagu caa 43
<210> 115
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 115
uaauuucuac uauuguagau 20
<210> 116
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 116
agaaauccgu cuuucauuga cggaauccuc caccagucau ggu 43
<210> 117
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 117
uaauuucuac uucgguagau 20
<210> 118
<211> 43
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 118
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cag 43
<210> 119
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 119
uaauuucuac uauuguagau 20
<210> 120
<211> 1368
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 120
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 121
<211> 1368
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 121
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 122
<211> 1053
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 122
Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 123
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 123
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc 90
<210> 124
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 124
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguu 107
<210> 125
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 125
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120
uccugggcag cccgaga 137
<210> 126
<211> 133
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 126
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc agaaauccgu cuuucauuga cgggcacacg 120
acgauguaau cgc 133
<210> 127
<211> 150
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 127
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120
ucauugacgg gcacacgacg auguaaucgc 150
<210> 128
<211> 180
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 128
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120
uccugggcag cccgagaaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180
<210> 129
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 129
cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcaga aauccgucuu 60
ucauugacgg gggaaguggu uggucagcau 90
<210> 130
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 130
cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcccc agcuuugccu 60
uguuagaaau ccgucuuuca uugacggggg aagugguugg ucagcau 107
<210> 131
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 131
cagcuacuau gggaaguggu ugcagugcau ggauuauagc cgaaggcccc agcuuugccu 60
uguucuagca guuccacucc ugggcagccc gagaagaaau ccgucuuuca uugacggggg 120
aagugguugg ucagcau 137
<210> 132
<211> 133
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 132
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc agaaauccgu cuuucauuga cgggggaagu 120
gguuggucag cau 133
<210> 133
<211> 150
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 133
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguuaga aauccgucuu 120
ucauugacgg gggaaguggu uggucagcau 150
<210> 134
<211> 180
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 134
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgccagcuac uaugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120
uccugggcag cccgagaaga aauccgucuu ucauugacgg gggaaguggu uggucagcau 180
<210> 135
<211> 139
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 135
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60
ggaagugguu gcagugcaug gauuauagcc gaaggcagaa auccgucuuu cauugacggg 120
ggaagugguu ggucagcau 139
<210> 136
<211> 156
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 136
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60
ggaagugguu gcagugcaug gauuauagcc gaaggcccca gcuuugccuu guuagaaauc 120
cgucuuucau ugacggggga agugguuggu cagcau 156
<210> 137
<211> 186
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 137
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcugauucc agcuacuaug 60
ggaagugguu gcagugcaug gauuauagcc gaaggcccca gcuuugccuu guucuagcag 120
uuccacuccu gggcagcccg agaagaaauc cgucuuucau ugacggggga agugguuggu 180
cagcau 186
<210> 138
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 138
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc 90
<210> 139
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 139
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggcca 107
<210> 140
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 140
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120
ucuccuuccu gaaggac 137
<210> 141
<211> 133
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 141
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc agaaauccgu cuuucauuga cgggcacacg 120
acgauguaau cgc 133
<210> 142
<211> 150
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 142
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120
ucauugacgg gcacacgacg auguaaucgc 150
<210> 143
<211> 180
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 143
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120
ucuccuuccu gaaggacaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180
<210> 144
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 144
uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggccaga aauccgucuu 60
ucauugacgg gagccagugu ugcuagucaa 90
<210> 145
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 145
uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggcccgu cccacuacag 60
gccaagaaau ccgucuuuca uugacgggag ccaguguugc uagucaa 107
<210> 146
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 146
uuccuucuau gagccagugu uggaucucaa gggcagcaug cugggcccgu cccacuacag 60
gccaauguga ccgucagucu ccuuccugaa ggacagaaau ccgucuuuca uugacgggag 120
ccaguguugc uagucaa 137
<210> 147
<211> 133
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 147
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc agaaauccgu cuuucauuga cgggagccag 120
uguugcuagu caa 133
<210> 148
<211> 150
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 148
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaga aauccgucuu 120
ucauugacgg gagccagugu ugcuagucaa 150
<210> 149
<211> 180
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 149
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcuuccuuc uaugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120
ucuccuuccu gaaggacaga aauccgucuu ucauugacgg gagccagugu ugcuagucaa 180
<210> 150
<211> 139
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 150
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60
agccaguguu ggaucucaag ggcagcaugc ugggccagaa auccgucuuu cauugacggg 120
agccaguguu gcuagucaa 139
<210> 151
<211> 156
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 151
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60
agccaguguu ggaucucaag ggcagcaugc ugggcccguc ccacuacagg ccaagaaauc 120
cgucuuucau ugacgggagc caguguugcu agucaa 156
<210> 152
<211> 186
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 152
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaagcuu uccuucuaug 60
agccaguguu ggaucucaag ggcagcaugc ugggcccguc ccacuacagg ccaaugugac 120
cgucagucuc cuuccugaag gacagaaauc cgucuuucau ugacgggagc caguguugcu 180
agucaa 186
<210> 153
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 153
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc 90
<210> 154
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 154
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugc 107
<210> 155
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 155
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120
ggagggaggg gucugug 137
<210> 156
<211> 133
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 156
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc agaaauccgu cuuucauuga cgggcacacg 120
acgauguaau cgc 133
<210> 157
<211> 150
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 157
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120
ucauugacgg gcacacgacg auguaaucgc 150
<210> 158
<211> 180
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 158
agaaauccgu cuuucauuga cggaauccuc caccagucau gguagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120
ggagggaggg gucugugaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180
<210> 159
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 159
agauaccuau aauccuccac cacaguuggu gacaacccca agcagccaga aauccgucuu 60
ucauugacgg aauccuccac cagucauggu 90
<210> 160
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 160
agauaccuau aauccuccac cacaguuggu gacaacccca agcagcccac acauucucaa 60
gugcagaaau ccgucuuuca uugacggaau ccuccaccag ucauggu 107
<210> 161
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 161
agauaccuau aauccuccac cacaguuggu gacaacccca agcagcccac acauucucaa 60
gugcccccag gaugcgugga gggagggguc ugugagaaau ccgucuuuca uugacggaau 120
ccuccaccag ucauggu 137
<210> 162
<211> 133
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 162
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc agaaauccgu cuuucauuga cggaauccuc 120
caccagucau ggu 133
<210> 163
<211> 150
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 163
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcaga aauccgucuu 120
ucauugacgg aauccuccac cagucauggu 150
<210> 164
<211> 180
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 164
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcagauacc uauaauccuc 60
caccacaguu ggugacaacc ccaagcagcc cacacauucu caagugcccc caggaugcgu 120
ggagggaggg gucugugaga aauccgucuu ucauugacgg aauccuccac cagucauggu 180
<210> 165
<211> 139
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 165
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60
auccuccacc acaguuggug acaaccccaa gcagccagaa auccgucuuu cauugacgga 120
auccuccacc agucauggu 139
<210> 166
<211> 156
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 166
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60
auccuccacc acaguuggug acaaccccaa gcagcccaca cauucucaag ugcagaaauc 120
cgucuuucau ugacggaauc cuccaccagu cauggu 156
<210> 167
<211> 186
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 167
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaauacua gauaccuaua 60
auccuccacc acaguuggug acaaccccaa gcagcccaca cauucucaag ugcccccagg 120
augcguggag ggaggggucu gugagaaauc cgucuuucau ugacggaauc cuccaccagu 180
cauggu 186
<210> 168
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 168
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 169
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 169
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 170
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 170
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120
ggacucucuc caagaga 137
<210> 171
<211> 133
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 171
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca agaaauccgu cuuucauuga cgggcacacg 120
acgauguaau cgc 133
<210> 172
<211> 150
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 172
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaaga aauccgucuu 120
ucauugacgg gcacacgacg auguaaucgc 150
<210> 173
<211> 180
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 173
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120
ggacucucuc caagagaaga aauccgucuu ucauugacgg gcacacgacg auguaaucgc 180
<210> 174
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 174
aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaga aauccgucuu 60
ucauugacgg uuaaacucuc cauggaccag 90
<210> 175
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 175
aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaac aaagccccca 60
agaaagaaau ccgucuuuca uugacgguua aacucuccau ggaccag 107
<210> 176
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 176
aaaagacuac uuaaacucuc caaccuccag gcucauccag cuucccaaac aaagccccca 60
agaagggggg gcacucagga cucucuccaa gagaagaaau ccgucuuuca uugacgguua 120
aacucuccau ggaccag 137
<210> 177
<211> 133
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 177
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca agaaauccgu cuuucauuga cgguuaaacu 120
cuccauggac cag 133
<210> 178
<211> 150
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 178
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaaga aauccgucuu 120
ucauugacgg uuaaacucuc cauggaccag 150
<210> 179
<211> 180
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 179
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaaaagac uacuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120
ggacucucuc caagagaaga aauccgucuu ucauugacgg uuaaacucuc cauggaccag 180
<210> 180
<211> 139
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 180
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60
uaaacucucc aaccuccagg cucauccagc uucccaagaa auccgucuuu cauugacggu 120
uaaacucucc auggaccag 139
<210> 181
<211> 156
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 181
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60
uaaacucucc aaccuccagg cucauccagc uucccaaaca aagcccccaa gaaagaaauc 120
cgucuuucau ugacgguuaa acucuccaug gaccag 156
<210> 182
<211> 186
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 182
agaaauccgu cuuucauuga cgggcacacg acgauguaau cgcaacacca aaagacuacu 60
uaaacucucc aaccuccagg cucauccagc uucccaaaca aagcccccaa gaaggggggg 120
cacucaggac ucucuccaag agaagaaauc cgucuuucau ugacgguuaa acucuccaug 180
gaccag 186
<210> 183
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 183
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau 80
<210> 184
<211> 85
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 184
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau agccg 85
<210> 185
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 185
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau agccgaaggc 90
<210> 186
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 186
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguu 107
<210> 187
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 187
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau agccgaaggc cccagcuuug ccuuguucua gcaguuccac 120
uccugggcag cccgaga 137
<210> 188
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 188
agaaauccgu cuuucauuga cgggggaagu gguuggucag cauugcagug cauggauuau 60
agccgaaggc 70
<210> 189
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 189
agaaauccgu cuuucauuga cgggggaagu gguuggucag caugggaagu gguugcagug 60
cauggauuau agccgaaggc 80
<210> 190
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 190
agaaauccgu cuuucauuga cgggggaagu gguuggucag caucagcuac uuugggaagu 60
gguugcagug cauggauuau agccgaaggc 90
<210> 191
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 191
agaaauccgu cuuucauuga cgggggaagu gguuggucag caugugauga uuccagcuac 60
uuugggaagu gguugcagug cauggauuau agccgaaggc 100
<210> 192
<211> 110
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 192
agaaauccgu cuuucauuga cgggggaagu gguuggucag caugguggga aaggugauga 60
uuccagcuac uuugggaagu gguugcagug cauggauuau agccgaaggc 110
<210> 193
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 193
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc 80
<210> 194
<211> 85
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 194
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc augcu 85
<210> 195
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 195
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc augcugggcc 90
<210> 196
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 196
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggcca 107
<210> 197
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 197
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc augcugggcc cgucccacua caggccaaug ugaccgucag 120
ucuccuuccu gaaggac 137
<210> 198
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 198
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauggaucu caagggcagc 60
augcugggcc 70
<210> 199
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 199
agaaauccgu cuuucauuga cgggagccag uguugcuagu caagagccag uguuggaucu 60
caagggcagc augcugggcc 80
<210> 200
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 200
agaaauccgu cuuucauuga cgggagccag uguugcuagu caauuccuuc uuugagccag 60
uguuggaucu caagggcagc augcugggcc 90
<210> 201
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 201
agaaauccgu cuuucauuga cgggagccag uguugcuagu caaauccaaa gcuuuccuuc 60
uuugagccag uguuggaucu caagggcagc augcugggcc 100
<210> 202
<211> 110
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 202
agaaauccgu cuuucauuga cgggagccag uguugcuagu caaugaaguc gccauccaaa 60
gcuuuccuuc uuugagccag uguuggaucu caagggcagc augcugggcc 110
<210> 203
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 203
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc 80
<210> 204
<211> 85
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 204
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc cagcu 85
<210> 205
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 205
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 206
<211> 107
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 206
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaa 107
<210> 207
<211> 137
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 207
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca aacaaagccc ccaagaaggg ggggcacuca 120
ggacucucuc caagaga 137
<210> 208
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 208
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagcaaccuc caggcucauc 60
cagcuuccca 70
<210> 209
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 209
agaaauccgu cuuucauuga cgguuaaacu cuccauggac caguuaaacu cuccaaccuc 60
caggcucauc cagcuuccca 80
<210> 210
<211> 90
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 210
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagaaaagac uucuuaaacu 60
cuccaaccuc caggcucauc cagcuuccca 90
<210> 211
<211> 100
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 211
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagagguaac accaaaagac 60
uucuuaaacu cuccaaccuc caggcucauc cagcuuccca 100
<210> 212
<211> 110
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 212
agaaauccgu cuuucauuga cgguuaaacu cuccauggac cagccccauu accagguaac 60
accaaaagac uucuuaaacu cuccaaccuc caggcucauc cagcuuccca 110
<210> 213
<211> 141
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 213
tccatgtctc gttatacgct gtggttcgcc aacaacacta gtactactga taaattaccc 60
cccaagtccc tcacctctcc aaagctgccc atactactac actagtttga cagctagctc 120
agtcctaggt ataatgctag c 141
<210> 214
<211> 141
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 214
tccatgtctc gttatacgct gtggttcgcc aacatatagt tcactactag catgctgccc 60
ttgactagca acactggctc aaagaaggaa agactactta tagttcttga cagctagctc 120
agtcctaggt ataatgctag c 141
<210> 215
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 215
tccatgtctc gttatacgct gtggttcgcc aacgcaggaa cgacactact agctggatga 60
gcctggtcca tggagagttt aaaaagtctt ttggactact ggaacgactt gacagctagc 120
tcagtcctag gtataatgct agc 143
<210> 216
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 216
agaaatccgt ctttcattga cggggagagg tgagggactt ggg 43
<210> 217
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 217
agaaatccgt ctttcattga cgggagccag tgttgctagt caa 43
<210> 218
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 218
agaaatccgt ctttcattga cggttaaact ctccatggac cag 43
<210> 219
<211> 1812
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 219
Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser
1 5 10 15
Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys
20 25 30
Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala
35 40 45
Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu
50 55 60
Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala
65 70 75 80
Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu
85 90 95
Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr
100 105 110
Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser
115 120 125
Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp
130 135 140
Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu
145 150 155 160
Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn
165 170 175
Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu
180 185 190
Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile
195 200 205
Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile
210 215 220
Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr
225 230 235 240
Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys
245 250 255
Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys
260 265 270
Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu
275 280 285
Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp
290 295 300
Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys
305 310 315 320
Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys
325 330 335
Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp
340 345 350
Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys
355 360 365
Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
370 375 380
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp
385 390 395 400
Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg
405 410 415
Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala
420 425 430
Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala
435 440 445
Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val
450 455 460
Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp
465 470 475 480
Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp
485 490 495
Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile
500 505 510
Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro
515 520 525
Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg
530 535 540
Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg
545 550 555 560
Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr
565 570 575
Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val
580 585 590
Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg
595 600 605
Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu
610 615 620
Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Gly Cys Phe
625 630 635 640
Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg
645 650 655
Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln
660 665 670
Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln
675 680 685
Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys
690 695 700
Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe
705 710 715 720
Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser
725 730 735
Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu
740 745 750
Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu
755 760 765
Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr
770 775 780
Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys
785 790 795 800
Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile
805 810 815
Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu
820 825 830
Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly
835 840 845
Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg
850 855 860
Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu
865 870 875 880
Ala Pro Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr
885 890 895
Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys
900 905 910
Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu
915 920 925
Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu
930 935 940
Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln
945 950 955 960
Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn
965 970 975
Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn
980 985 990
Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe
995 1000 1005
Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp
1010 1015 1020
Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1025 1030 1035
Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser Asp
1040 1045 1050
Glu Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser
1055 1060 1065
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1070 1075 1080
Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro
1085 1090 1095
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser
1100 1105 1110
Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu
1115 1120 1125
Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser
1130 1135 1140
Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala
1145 1150 1155
Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr
1160 1165 1170
Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu
1175 1180 1185
Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu
1190 1195 1200
Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys
1205 1210 1215
Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu
1220 1225 1230
Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro
1235 1240 1245
Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr
1250 1255 1260
Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro
1265 1270 1275
Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met
1280 1285 1290
Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe
1295 1300 1305
Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
1310 1315 1320
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr
1325 1330 1335
Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln
1340 1345 1350
Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr
1355 1360 1365
Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys
1370 1375 1380
Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu
1385 1390 1395
Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro
1400 1405 1410
Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu
1415 1420 1425
Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu
1430 1435 1440
Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys
1445 1450 1455
Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu
1460 1465 1470
Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu
1475 1480 1485
Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro
1490 1495 1500
Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val
1505 1510 1515
Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala
1520 1525 1530
Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu
1535 1540 1545
Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
1550 1555 1560
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala
1565 1570 1575
Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala
1580 1585 1590
Leu Asn Pro Ala Thr Leu Leu Pro Leu Pro Glu Glu Gly Leu Gln
1595 1600 1605
His Asn Cys Leu Asp Ile Leu Ala Glu Ala His Gly Thr Arg Pro
1610 1615 1620
Asp Leu Thr Asp Gln Pro Leu Pro Asp Ala Asp His Thr Trp Tyr
1625 1630 1635
Thr Asp Gly Ser Ser Leu Leu Gln Glu Gly Gln Arg Lys Ala Gly
1640 1645 1650
Ala Ala Val Thr Thr Glu Thr Glu Val Ile Trp Ala Lys Ala Leu
1655 1660 1665
Pro Ala Gly Thr Ser Ala Gln Arg Ala Glu Leu Ile Ala Leu Thr
1670 1675 1680
Gln Ala Leu Lys Met Ala Glu Gly Lys Lys Leu Asn Val Tyr Thr
1685 1690 1695
Asp Ser Arg Tyr Ala Phe Ala Thr Ala His Ile His Gly Glu Ile
1700 1705 1710
Tyr Arg Arg Arg Gly Trp Leu Thr Ser Glu Gly Lys Glu Ile Lys
1715 1720 1725
Asn Lys Asp Glu Ile Leu Ala Leu Leu Lys Ala Leu Phe Leu Pro
1730 1735 1740
Lys Arg Leu Ser Ile Ile His Cys Pro Gly His Gln Lys Gly His
1745 1750 1755
Ser Ala Glu Ala Arg Gly Asn Arg Met Ala Asp Gln Ala Ala Arg
1760 1765 1770
Lys Ala Ala Ile Thr Glu Thr Pro Asp Thr Ser Thr Leu Leu Ile
1775 1780 1785
Glu Asn Ser Ser Pro Met Lys Arg Thr Ala Asp Gly Ser Glu Phe
1790 1795 1800
Glu Ser Pro Lys Lys Lys Arg Lys Val
1805 1810
<210> 220
<211> 1620
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 220
Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser
1 5 10 15
Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys
20 25 30
Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala
35 40 45
Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu
50 55 60
Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala
65 70 75 80
Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu
85 90 95
Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr
100 105 110
Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser
115 120 125
Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp
130 135 140
Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu
145 150 155 160
Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn
165 170 175
Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu
180 185 190
Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile
195 200 205
Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile
210 215 220
Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr
225 230 235 240
Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys
245 250 255
Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys
260 265 270
Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu
275 280 285
Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp
290 295 300
Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys
305 310 315 320
Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys
325 330 335
Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp
340 345 350
Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys
355 360 365
Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
370 375 380
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp
385 390 395 400
Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg
405 410 415
Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala
420 425 430
Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala
435 440 445
Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val
450 455 460
Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp
465 470 475 480
Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp
485 490 495
Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile
500 505 510
Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro
515 520 525
Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg
530 535 540
Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg
545 550 555 560
Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr
565 570 575
Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val
580 585 590
Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg
595 600 605
Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu
610 615 620
Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg Cys Arg
625 630 635 640
Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg
645 650 655
Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln
660 665 670
Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln
675 680 685
Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys
690 695 700
Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe
705 710 715 720
Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser
725 730 735
Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu
740 745 750
Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu
755 760 765
Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr
770 775 780
Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys
785 790 795 800
Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile
805 810 815
Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu
820 825 830
Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly
835 840 845
Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg
850 855 860
Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu
865 870 875 880
Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr
885 890 895
Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys
900 905 910
Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu
915 920 925
Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu
930 935 940
Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln
945 950 955 960
Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn
965 970 975
Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn
980 985 990
Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe
995 1000 1005
Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp
1010 1015 1020
Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1025 1030 1035
Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp
1040 1045 1050
Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser
1055 1060 1065
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1070 1075 1080
Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro
1085 1090 1095
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser
1100 1105 1110
Gly Gly Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu
1115 1120 1125
Thr Ser Lys Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser
1130 1135 1140
Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala
1145 1150 1155
Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr
1160 1165 1170
Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala Arg Leu
1175 1180 1185
Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile Leu
1190 1195 1200
Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys
1205 1210 1215
Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu
1220 1225 1230
Val Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro
1235 1240 1245
Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr
1250 1255 1260
Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro
1265 1270 1275
Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met
1280 1285 1290
Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe
1295 1300 1305
Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
1310 1315 1320
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr
1325 1330 1335
Val Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln
1340 1345 1350
Gln Gly Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr
1355 1360 1365
Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys
1370 1375 1380
Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu
1385 1390 1395
Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro Lys Thr Pro
1400 1405 1410
Arg Gln Leu Arg Glu Phe Leu Gly Lys Ala Gly Phe Cys Arg Leu
1415 1420 1425
Phe Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro Leu
1430 1435 1440
Thr Lys Pro Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys
1445 1450 1455
Ala Tyr Gln Glu Ile Lys Gln Ala Leu Leu Thr Ala Pro Ala Leu
1460 1465 1470
Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu
1475 1480 1485
Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro
1490 1495 1500
Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val
1505 1510 1515
Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala
1520 1525 1530
Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro Leu
1535 1540 1545
Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
1550 1555 1560
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala
1565 1570 1575
Leu Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala
1580 1585 1590
Leu Asn Pro Ala Thr Leu Leu Pro Met Lys Arg Thr Ala Asp Gly
1595 1600 1605
Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1610 1615 1620
<210> 221
<211> 1562
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 221
Met Lys Ile Glu Glu Gly Lys Gly His His His His His His Met Ser
1 5 10 15
Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys
20 25 30
Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala
35 40 45
Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu
50 55 60
Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala
65 70 75 80
Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu
85 90 95
Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr
100 105 110
Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser
115 120 125
Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp
130 135 140
Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu
145 150 155 160
Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn
165 170 175
Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu
180 185 190
Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile
195 200 205
Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile
210 215 220
Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr
225 230 235 240
Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys
245 250 255
Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys
260 265 270
Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu
275 280 285
Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp
290 295 300
Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys
305 310 315 320
Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys
325 330 335
Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp
340 345 350
Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys
355 360 365
Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
370 375 380
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp
385 390 395 400
Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg
405 410 415
Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala
420 425 430
Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala
435 440 445
Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val
450 455 460
Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp
465 470 475 480
Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp
485 490 495
Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile
500 505 510
Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro
515 520 525
Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg
530 535 540
Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile Arg
545 550 555 560
Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys Ile Thr
565 570 575
Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg Ile Pro Val
580 585 590
Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln Ile Gly Asp Arg
595 600 605
Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser His Ala Tyr Ser Leu
610 615 620
Trp Glu Val Val Lys Glu Gly Gln Tyr His Lys Glu Leu Arg Cys Arg
625 630 635 640
Val Arg Phe Ile Ser Ser Gly Asp Ile Val Ser Ile Thr Glu Asn Arg
645 650 655
Gly Asn Gln Phe Asp Gln Leu Ser Tyr Glu Gly Leu Ala Tyr Pro Gln
660 665 670
Tyr Ala Asp Trp Arg Lys Lys Ala Ser Lys Phe Val Ser Leu Trp Gln
675 680 685
Ile Thr Lys Lys Asn Lys Lys Lys Glu Ile Val Thr Val Glu Ala Lys
690 695 700
Glu Lys Phe Asp Ala Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe
705 710 715 720
Asn Lys Glu Tyr Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser
725 730 735
Leu Val Glu Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu
740 745 750
Gln Asp Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu
755 760 765
Glu Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr
770 775 780
Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg Lys
785 790 795 800
Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu Leu Ile
805 810 815
Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala Asn Ser Leu
820 825 830
Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile Arg Gly Glu Gly
835 840 845
Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys Lys Ala Asn Ser Arg
850 855 860
Ser Met Asp Trp Leu Ala Arg Gly Val Phe Asn Lys Ile Arg Gln Leu
865 870 875 880
Ala Thr Met His Asn Ile Thr Leu Phe Gly Cys Gly Ser Leu Tyr Thr
885 890 895
Ser His Gln Asp Pro Leu Val His Arg Asn Pro Asp Lys Ala Met Lys
900 905 910
Cys Arg Trp Ala Ala Ile Pro Val Lys Asp Ile Gly Asp Trp Val Leu
915 920 925
Arg Lys Leu Ser Gln Asn Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu
930 935 940
Tyr Tyr His Gln Gly Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln
945 950 955 960
Asp Leu Glu Glu Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn
965 970 975
Ile Pro Cys Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn
980 985 990
Lys Glu Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe
995 1000 1005
Ala Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp
1010 1015 1020
Gln Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala
1025 1030 1035
Asn Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp
1040 1045 1050
Glu Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser
1055 1060 1065
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1070 1075 1080
Lys Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro
1085 1090 1095
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser
1100 1105 1110
Gly Gly Ser Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser
1115 1120 1125
Ser Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys
1130 1135 1140
Gly Ala Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu
1145 1150 1155
His Leu Ala Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr
1160 1165 1170
Arg Lys Tyr Lys Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys
1175 1180 1185
Pro Asp Gly Gly Val Arg Asn Leu Gly Val Pro Thr Val Thr Asp
1190 1195 1200
Arg Phe Ile Gln Gln Ala Ile Ala Gln Val Leu Thr Pro Ile Tyr
1205 1210 1215
Glu Glu Gln Phe His Asp His Ser Tyr Gly Phe Arg Pro Asn Arg
1220 1225 1230
Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn Ile Met Asn Asp
1235 1240 1245
Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys Phe Phe Asp
1250 1255 1260
Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg Thr Ile
1265 1270 1275
Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val Ser
1280 1285 1290
Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr
1295 1300 1305
Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu
1310 1315 1320
Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val
1325 1330 1335
Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser
1340 1345 1350
Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys
1355 1360 1365
Leu Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro
1370 1375 1380
Ser Gly Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg
1385 1390 1395
Ala His Gln Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys
1400 1405 1410
Phe Lys Lys Arg Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val
1415 1420 1425
Ser Asn Ser Tyr Lys Val Glu Lys Leu Asn Gln Leu Ile Arg Gly
1430 1435 1440
Trp Ile Asn Tyr Phe Lys Ile Gly Ser Met Lys Thr Leu Cys Lys
1445 1450 1455
Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu Arg Met Cys Ile Trp
1460 1465 1470
Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys Asn Leu Val Lys
1475 1480 1485
Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala Tyr Thr Gly
1490 1495 1500
Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn Val Ala
1505 1510 1515
Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met Leu
1520 1525 1530
Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Met Lys Arg Thr Ala
1535 1540 1545
Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys Arg Lys Val
1550 1555 1560
<210> 222
<211> 1548
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 222
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser
20 25 30
Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala
35 40 45
Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala
50 55 60
Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys
65 70 75 80
Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val
85 90 95
Arg Asn Leu Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala
100 105 110
Ile Ala Gln Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His
115 120 125
Ser Tyr Gly Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr
130 135 140
Ala Leu Asn Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp
145 150 155 160
Leu Glu Lys Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu
165 170 175
Ile Gly Arg Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys
180 185 190
Tyr Leu Val Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile
195 200 205
Val Gly Thr Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile
210 215 220
Met Leu Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe
225 230 235 240
Val Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser
245 250 255
Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu
260 265 270
Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly
275 280 285
Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln
290 295 300
Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg
305 310 315 320
Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys
325 330 335
Val Glu Lys Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys
340 345 350
Ile Gly Ser Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg
355 360 365
Tyr Arg Leu Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn
370 375 380
Gln Glu Lys Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg
385 390 395 400
Arg Val Ala Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly
405 410 415
Ala Val Asn Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu
420 425 430
Ile Ser Met Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Ser Gly
435 440 445
Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
450 455 460
Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ser
465 470 475 480
Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys
485 490 495
Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala
500 505 510
Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu
515 520 525
Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala
530 535 540
Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu
545 550 555 560
Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr
565 570 575
Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser
580 585 590
Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp
595 600 605
Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu
610 615 620
Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn
625 630 635 640
Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu
645 650 655
Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile
660 665 670
Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile
675 680 685
Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr
690 695 700
Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys
705 710 715 720
Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys
725 730 735
Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu
740 745 750
Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp
755 760 765
Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys
770 775 780
Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys
785 790 795 800
Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp
805 810 815
Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys
820 825 830
Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
835 840 845
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp
850 855 860
Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg
865 870 875 880
Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala
885 890 895
Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala
900 905 910
Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val
915 920 925
Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp
930 935 940
Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp
945 950 955 960
Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile
965 970 975
Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro
980 985 990
Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg
995 1000 1005
Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile
1010 1015 1020
Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
1025 1030 1035
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg
1040 1045 1050
Ile Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln
1055 1060 1065
Ile Gly Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser
1070 1075 1080
His Ala Tyr Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His
1085 1090 1095
Lys Glu Leu Gly Cys Phe Val Arg Phe Ile Ser Ser Gly Asp Ile
1100 1105 1110
Val Ser Ile Thr Glu Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser
1115 1120 1125
Tyr Glu Gly Leu Ala Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys
1130 1135 1140
Ala Ser Lys Phe Val Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys
1145 1150 1155
Lys Lys Glu Ile Val Thr Val Glu Ala Lys Glu Lys Phe Asp Ala
1160 1165 1170
Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr
1175 1180 1185
Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser Leu Val Glu
1190 1195 1200
Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp
1205 1210 1215
Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu
1220 1225 1230
Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr
1235 1240 1245
Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg
1250 1255 1260
Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
1265 1270 1275
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala
1280 1285 1290
Asn Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile
1295 1300 1305
Arg Gly Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys
1310 1315 1320
Lys Ala Asn Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe
1325 1330 1335
Asn Lys Ile Arg Gln Leu Ala Pro Met His Asn Ile Thr Leu Phe
1340 1345 1350
Gly Cys Gly Ser Leu Tyr Thr Ser His Gln Asp Pro Leu Val His
1355 1360 1365
Arg Asn Pro Asp Lys Ala Met Lys Cys Arg Trp Ala Ala Ile Pro
1370 1375 1380
Val Lys Asp Ile Gly Asp Trp Val Leu Arg Lys Leu Ser Gln Asn
1385 1390 1395
Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly
1400 1405 1410
Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln Asp Leu Glu Glu
1415 1420 1425
Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys
1430 1435 1440
Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu
1445 1450 1455
Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala
1460 1465 1470
Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp Gln
1475 1480 1485
Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala Asn
1490 1495 1500
Ile Ala Leu Thr Gly Lys Gly Ile Gly Glu Gln Ser Ser Asp Glu
1505 1510 1515
Glu Asn Pro Asp Gly Ser Arg Ile Lys Leu Gln Leu Thr Ser Lys
1520 1525 1530
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1535 1540 1545
<210> 223
<211> 1548
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 223
Met Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys Lys
1 5 10 15
Arg Lys Val Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser
20 25 30
Asp Asn Leu Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala
35 40 45
Glu Gly Val Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala
50 55 60
Lys Asn Gly Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys
65 70 75 80
Pro Gln Pro Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val
85 90 95
Arg Asn Leu Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala
100 105 110
Ile Ala Gln Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His
115 120 125
Ser Tyr Gly Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr
130 135 140
Ala Leu Asn Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp
145 150 155 160
Leu Glu Lys Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu
165 170 175
Ile Gly Arg Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys
180 185 190
Tyr Leu Val Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile
195 200 205
Val Gly Thr Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile
210 215 220
Met Leu Asn Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe
225 230 235 240
Val Arg Tyr Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser
245 250 255
Ala Asn Arg Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu
260 265 270
Gly Leu Lys Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly
275 280 285
Leu Lys Tyr Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln
290 295 300
Phe Lys Ala Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg
305 310 315 320
Met Lys Glu Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys
325 330 335
Val Glu Lys Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys
340 345 350
Ile Gly Ser Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg
355 360 365
Tyr Arg Leu Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn
370 375 380
Gln Glu Lys Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg
385 390 395 400
Arg Val Ala Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly
405 410 415
Ala Val Asn Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu
420 425 430
Ile Ser Met Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys Ser Gly
435 440 445
Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu
450 455 460
Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ser
465 470 475 480
Ser Ala Ile Lys Ser Tyr Lys Ser Val Leu Arg Pro Asn Glu Arg Lys
485 490 495
Asn Gln Leu Leu Lys Ser Thr Ile Gln Cys Leu Glu Asp Gly Ser Ala
500 505 510
Phe Phe Phe Lys Met Leu Gln Gly Leu Phe Gly Gly Ile Thr Pro Glu
515 520 525
Ile Val Arg Phe Ser Thr Glu Gln Glu Lys Gln Gln Gln Asp Ile Ala
530 535 540
Leu Trp Cys Ala Val Asn Trp Phe Arg Pro Val Ser Gln Asp Ser Leu
545 550 555 560
Thr His Thr Ile Ala Ser Asp Asn Leu Val Glu Lys Phe Glu Glu Tyr
565 570 575
Tyr Gly Gly Thr Ala Ser Asp Ala Ile Lys Gln Tyr Phe Ser Ala Ser
580 585 590
Ile Gly Glu Ser Tyr Tyr Trp Asn Asp Cys Arg Gln Gln Tyr Tyr Asp
595 600 605
Leu Cys Arg Glu Leu Gly Val Glu Val Ser Asp Leu Thr His Asp Leu
610 615 620
Glu Ile Leu Cys Arg Glu Lys Cys Leu Ala Val Ala Thr Glu Ser Asn
625 630 635 640
Gln Asn Asn Ser Ile Ile Ser Val Leu Phe Gly Thr Gly Glu Lys Glu
645 650 655
Asp Arg Ser Val Lys Leu Arg Ile Thr Lys Lys Ile Leu Glu Ala Ile
660 665 670
Ser Asn Leu Lys Glu Ile Pro Lys Asn Val Ala Pro Ile Gln Glu Ile
675 680 685
Ile Leu Asn Val Ala Lys Ala Thr Lys Glu Thr Phe Arg Gln Val Tyr
690 695 700
Ala Gly Asn Leu Gly Ala Pro Ser Thr Leu Glu Lys Phe Ile Ala Lys
705 710 715 720
Asp Gly Gln Lys Glu Phe Asp Leu Lys Lys Leu Gln Thr Asp Leu Lys
725 730 735
Lys Val Ile Arg Gly Lys Ser Lys Glu Arg Asp Trp Cys Cys Gln Glu
740 745 750
Glu Leu Arg Ser Tyr Val Glu Gln Asn Thr Ile Gln Tyr Asp Leu Trp
755 760 765
Ala Trp Gly Glu Met Phe Asn Lys Ala His Thr Ala Leu Lys Ile Lys
770 775 780
Ser Thr Arg Asn Tyr Asn Phe Ala Lys Gln Arg Leu Glu Gln Phe Lys
785 790 795 800
Glu Ile Gln Ser Leu Asn Asn Leu Leu Val Val Lys Lys Leu Asn Asp
805 810 815
Phe Phe Asp Ser Glu Phe Phe Ser Gly Glu Glu Thr Tyr Thr Ile Cys
820 825 830
Val His His Leu Gly Gly Lys Asp Leu Ser Lys Leu Tyr Lys Ala Trp
835 840 845
Glu Asp Asp Pro Ala Asp Pro Glu Asn Ala Ile Val Val Leu Cys Asp
850 855 860
Asp Leu Lys Asn Asn Phe Lys Lys Glu Pro Ile Arg Asn Ile Leu Arg
865 870 875 880
Tyr Ile Phe Thr Ile Arg Gln Glu Cys Ser Ala Gln Asp Ile Leu Ala
885 890 895
Ala Ala Lys Tyr Asn Gln Gln Leu Asp Arg Tyr Lys Ser Gln Lys Ala
900 905 910
Asn Pro Ser Val Leu Gly Asn Gln Gly Phe Thr Trp Thr Asn Ala Val
915 920 925
Ile Leu Pro Glu Lys Ala Gln Arg Asn Asp Arg Pro Asn Ser Leu Asp
930 935 940
Leu Arg Ile Trp Leu Tyr Leu Lys Leu Arg His Pro Asp Gly Arg Trp
945 950 955 960
Lys Lys Ala His Ile Pro Phe Tyr Asp Thr Arg Phe Phe Gln Glu Ile
965 970 975
Tyr Ala Ala Gly Asn Ser Pro Val Asp Thr Cys Gln Phe Arg Thr Pro
980 985 990
Arg Phe Gly Tyr His Leu Pro Lys Leu Thr Asp Gln Thr Ala Ile Arg
995 1000 1005
Val Asn Lys Lys His Val Lys Ala Ala Lys Thr Glu Ala Arg Ile
1010 1015 1020
Arg Leu Ala Ile Gln Gln Gly Thr Leu Pro Val Ser Asn Leu Lys
1025 1030 1035
Ile Thr Glu Ile Ser Ala Thr Ile Asn Ser Lys Gly Gln Val Arg
1040 1045 1050
Ile Pro Val Lys Phe Arg Val Gly Arg Gln Lys Gly Thr Leu Gln
1055 1060 1065
Ile Gly Asp Arg Phe Cys Gly Tyr Asp Gln Asn Gln Thr Ala Ser
1070 1075 1080
His Ala Tyr Ser Leu Trp Glu Val Val Lys Glu Gly Gln Tyr His
1085 1090 1095
Lys Glu Leu Arg Cys Arg Val Arg Phe Ile Ser Ser Gly Asp Ile
1100 1105 1110
Val Ser Ile Thr Glu Asn Arg Gly Asn Gln Phe Asp Gln Leu Ser
1115 1120 1125
Tyr Glu Gly Leu Ala Tyr Pro Gln Tyr Ala Asp Trp Arg Lys Lys
1130 1135 1140
Ala Ser Lys Phe Val Ser Leu Trp Gln Ile Thr Lys Lys Asn Lys
1145 1150 1155
Lys Lys Glu Ile Val Thr Val Glu Ala Lys Glu Lys Phe Asp Ala
1160 1165 1170
Ile Cys Lys Tyr Gln Pro Arg Leu Tyr Lys Phe Asn Lys Glu Tyr
1175 1180 1185
Ala Tyr Leu Leu Arg Asp Ile Val Arg Gly Lys Ser Leu Val Glu
1190 1195 1200
Leu Gln Gln Ile Arg Gln Glu Ile Phe Arg Phe Ile Glu Gln Asp
1205 1210 1215
Cys Gly Val Thr Arg Leu Gly Ser Leu Ser Leu Ser Thr Leu Glu
1220 1225 1230
Thr Val Lys Ala Val Lys Gly Ile Ile Tyr Ser Tyr Phe Ser Thr
1235 1240 1245
Ala Leu Asn Ala Ser Lys Asn Asn Pro Ile Ser Asp Glu Gln Arg
1250 1255 1260
Lys Glu Phe Asp Pro Glu Leu Phe Ala Leu Leu Glu Lys Leu Glu
1265 1270 1275
Leu Ile Arg Thr Arg Lys Lys Lys Gln Lys Val Glu Arg Ile Ala
1280 1285 1290
Asn Ser Leu Ile Gln Thr Cys Leu Glu Asn Asn Ile Lys Phe Ile
1295 1300 1305
Arg Gly Glu Gly Asp Leu Ser Thr Thr Asn Asn Ala Thr Lys Lys
1310 1315 1320
Lys Ala Asn Ser Arg Ser Met Asp Trp Leu Ala Arg Gly Val Phe
1325 1330 1335
Asn Lys Ile Arg Gln Leu Ala Thr Met His Asn Ile Thr Leu Phe
1340 1345 1350
Gly Cys Gly Ser Leu Tyr Thr Ser His Gln Asp Pro Leu Val His
1355 1360 1365
Arg Asn Pro Asp Lys Ala Met Lys Cys Arg Trp Ala Ala Ile Pro
1370 1375 1380
Val Lys Asp Ile Gly Asp Trp Val Leu Arg Lys Leu Ser Gln Asn
1385 1390 1395
Leu Arg Ala Lys Asn Arg Gly Thr Gly Glu Tyr Tyr His Gln Gly
1400 1405 1410
Val Lys Glu Phe Leu Ser His Tyr Glu Leu Gln Asp Leu Glu Glu
1415 1420 1425
Glu Leu Leu Lys Trp Arg Ser Asp Arg Lys Ser Asn Ile Pro Cys
1430 1435 1440
Trp Val Leu Gln Asn Arg Leu Ala Glu Lys Leu Gly Asn Lys Glu
1445 1450 1455
Ala Val Val Tyr Ile Pro Val Arg Gly Gly Arg Ile Tyr Phe Ala
1460 1465 1470
Thr His Lys Val Ala Thr Gly Ala Val Ser Ile Val Phe Asp Gln
1475 1480 1485
Lys Gln Val Trp Val Cys Asn Ala Asp His Val Ala Ala Ala Asn
1490 1495 1500
Ile Ala Leu Thr Gly Lys Gly Ile Gly Arg Gln Ser Ser Asp Glu
1505 1510 1515
Glu Asn Pro Asp Gly Gly Arg Ile Lys Leu Gln Leu Thr Ser Lys
1520 1525 1530
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1535 1540 1545
<210> 224
<211> 486
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 224
Ser Thr Leu Asn Ile Glu Asp Glu Tyr Arg Leu His Glu Thr Ser Lys
1 5 10 15
Glu Pro Asp Val Ser Leu Gly Ser Thr Trp Leu Ser Asp Phe Pro Gln
20 25 30
Ala Trp Ala Glu Thr Gly Gly Met Gly Leu Ala Val Arg Gln Ala Pro
35 40 45
Leu Ile Ile Pro Leu Lys Ala Thr Ser Thr Pro Val Ser Ile Lys Gln
50 55 60
Tyr Pro Met Ser Gln Glu Ala Arg Leu Gly Ile Lys Pro His Ile Gln
65 70 75 80
Arg Leu Leu Asp Gln Gly Ile Leu Val Pro Cys Gln Ser Pro Trp Asn
85 90 95
Thr Pro Leu Leu Pro Val Lys Lys Pro Gly Thr Asn Asp Tyr Arg Pro
100 105 110
Val Gln Asp Leu Arg Glu Val Asn Lys Arg Val Glu Asp Ile His Pro
115 120 125
Thr Val Pro Asn Pro Tyr Asn Leu Leu Ser Gly Leu Pro Pro Ser His
130 135 140
Gln Trp Tyr Thr Val Leu Asp Leu Lys Asp Ala Phe Phe Cys Leu Arg
145 150 155 160
Leu His Pro Thr Ser Gln Pro Leu Phe Ala Phe Glu Trp Arg Asp Pro
165 170 175
Glu Met Gly Ile Ser Gly Gln Leu Thr Trp Thr Arg Leu Pro Gln Gly
180 185 190
Phe Lys Asn Ser Pro Thr Leu Phe Asn Glu Ala Leu His Arg Asp Leu
195 200 205
Ala Asp Phe Arg Ile Gln His Pro Asp Leu Ile Leu Leu Gln Tyr Val
210 215 220
Asp Asp Leu Leu Leu Ala Ala Thr Ser Glu Leu Asp Cys Gln Gln Gly
225 230 235 240
Thr Arg Ala Leu Leu Gln Thr Leu Gly Asn Leu Gly Tyr Arg Ala Ser
245 250 255
Ala Lys Lys Ala Gln Ile Cys Gln Lys Gln Val Lys Tyr Leu Gly Tyr
260 265 270
Leu Leu Lys Glu Gly Gln Arg Trp Leu Thr Glu Ala Arg Lys Glu Thr
275 280 285
Val Met Gly Gln Pro Thr Pro Lys Thr Pro Arg Gln Leu Arg Glu Phe
290 295 300
Leu Gly Lys Ala Gly Phe Cys Arg Leu Phe Ile Pro Gly Phe Ala Glu
305 310 315 320
Met Ala Ala Pro Leu Tyr Pro Leu Thr Lys Pro Gly Thr Leu Phe Asn
325 330 335
Trp Gly Pro Asp Gln Gln Lys Ala Tyr Gln Glu Ile Lys Gln Ala Leu
340 345 350
Leu Thr Ala Pro Ala Leu Gly Leu Pro Asp Leu Thr Lys Pro Phe Glu
355 360 365
Leu Phe Val Asp Glu Lys Gln Gly Tyr Ala Lys Gly Val Leu Thr Gln
370 375 380
Lys Leu Gly Pro Trp Arg Arg Pro Val Ala Tyr Leu Ser Lys Lys Leu
385 390 395 400
Asp Pro Val Ala Ala Gly Trp Pro Pro Cys Leu Arg Met Val Ala Ala
405 410 415
Ile Ala Val Leu Thr Lys Asp Ala Gly Lys Leu Thr Met Gly Gln Pro
420 425 430
Leu Val Ile Leu Ala Pro His Ala Val Glu Ala Leu Val Lys Gln Pro
435 440 445
Pro Asp Arg Trp Leu Ser Asn Ala Arg Met Thr His Tyr Gln Ala Leu
450 455 460
Leu Leu Asp Thr Asp Arg Val Gln Phe Gly Pro Val Val Ala Leu Asn
465 470 475 480
Pro Ala Thr Leu Leu Pro
485
<210> 225
<400> 225
000
<210> 226
<400> 226
000
<210> 227
<400> 227
000
<210> 228
<400> 228
000
<210> 229
<400> 229
000
<210> 230
<211> 487
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 230
Met Thr Trp Leu Ser Asp Phe Pro Gln Ala Trp Ala Glu Thr Gly Gly
1 5 10 15
Met Gly Leu Ala Val Arg Gln Ala Pro Leu Ile Ile Pro Leu Lys Ala
20 25 30
Thr Ser Thr Pro Val Ser Ile Lys Gln Tyr Pro Met Ser Gln Glu Ala
35 40 45
Arg Leu Gly Ile Lys Pro His Ile Gln Arg Leu Leu Asp Gln Gly Ile
50 55 60
Leu Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu Pro Val Lys
65 70 75 80
Lys Pro Gly Thr Asn Asp Tyr Arg Pro Val Gln Asp Leu Arg Glu Val
85 90 95
Asn Lys Arg Val Glu Asp Ile His Pro Thr Val Pro Asn Pro Tyr Asn
100 105 110
Leu Leu Ser Gly Leu Pro Pro Ser His Gln Trp Tyr Thr Val Leu Asp
115 120 125
Leu Lys Asp Ala Phe Phe Cys Leu Arg Leu His Pro Thr Ser Gln Pro
130 135 140
Leu Phe Ala Phe Glu Trp Arg Asp Pro Glu Met Gly Ile Ser Gly Gln
145 150 155 160
Leu Thr Trp Thr Arg Leu Pro Gln Gly Phe Lys Asn Ser Pro Thr Leu
165 170 175
Phe Asp Glu Ala Leu His Arg Asp Leu Ala Asp Phe Arg Ile Gln His
180 185 190
Pro Asp Leu Ile Leu Leu Gln Tyr Val Asp Asp Leu Leu Leu Ala Ala
195 200 205
Thr Ser Glu Leu Asp Cys Gln Gln Gly Thr Arg Ala Leu Leu Gln Thr
210 215 220
Leu Gly Asn Leu Gly Tyr Arg Ala Ser Ala Lys Lys Ala Gln Ile Cys
225 230 235 240
Gln Lys Gln Val Lys Tyr Leu Gly Tyr Leu Leu Lys Glu Gly Gln Arg
245 250 255
Trp Leu Thr Glu Ala Arg Lys Glu Thr Val Met Gly Gln Pro Thr Pro
260 265 270
Lys Thr Pro Arg Gln Leu Arg Glu Phe Leu Gly Thr Ala Gly Phe Cys
275 280 285
Arg Leu Trp Ile Pro Gly Phe Ala Glu Met Ala Ala Pro Leu Tyr Pro
290 295 300
Leu Thr Lys Thr Gly Thr Leu Phe Asn Trp Gly Pro Asp Gln Gln Lys
305 310 315 320
Ala Tyr Gln Glu Ile Leu Gln Ala Leu Leu Thr Ala Pro Ala Leu Gly
325 330 335
Leu Pro Asp Leu Thr Lys Pro Phe Glu Leu Phe Val Asp Glu Lys Gln
340 345 350
Gly Tyr Ala Lys Gly Val Leu Thr Gln Lys Leu Gly Pro Trp Arg Arg
355 360 365
Pro Val Ala Tyr Leu Ser Lys Lys Leu Asp Pro Val Ala Ala Gly Trp
370 375 380
Pro Pro Cys Leu Arg Met Val Ala Ala Ile Ala Val Leu Thr Lys Asp
385 390 395 400
Ala Gly Lys Leu Thr Met Gly Gln Pro Leu Val Ile Leu Ala Pro His
405 410 415
Ala Val Glu Ala Leu Val Lys Gln Pro Pro Asp Arg Trp Leu Ser Asn
420 425 430
Ala Arg Met Thr His Tyr Gln Ala Leu Leu Leu Asp Thr Asp Arg Val
435 440 445
Gln Phe Gly Pro Val Val Ala Leu Asn Pro Ala Thr Leu Leu Pro Leu
450 455 460
Pro Glu Glu Gly Leu Gln His Asn Cys Leu Asp Ile Leu Ala Glu Ala
465 470 475 480
His Gly Thr Arg Pro Asp Leu
485
<210> 231
<211> 231
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 231
Met Leu Gln Leu Gly His Leu Glu Glu Ser Asn Ser Pro Trp Asn Thr
1 5 10 15
Pro Val Phe Val Ile Lys Lys Lys Ser Gly Lys Trp Arg Leu Leu Gln
20 25 30
Asp Leu Arg Ala Val Asn Ala Thr Met His Asp Met Gly Ala Leu Gln
35 40 45
Pro Gly Leu Pro Ser Pro Val Ala Val Pro Lys Gly Trp Glu Ile Ile
50 55 60
Ile Ile Asp Leu Gln Asp Cys Phe Phe Asn Ile Lys Leu His Pro Glu
65 70 75 80
Asp Cys Lys Arg Phe Ala Phe Ser Val Pro Ser Pro Asn Phe Lys Arg
85 90 95
Pro Tyr Gln Arg Phe Gln Trp Lys Val Leu Pro Gln Gly Met Lys Asn
100 105 110
Ser Pro Thr Leu Cys Gln Lys Phe Val Asp Lys Ala Ile Leu Thr Val
115 120 125
Arg Asp Lys Tyr Gln Asp Ser Tyr Ile Val His Tyr Met Asp Asp Ile
130 135 140
Leu Leu Ala His Pro Ser Arg Ser Ile Val Asp Glu Ile Leu Thr Ser
145 150 155 160
Met Ile Gln Ala Leu Asn Lys His Gly Leu Val Val Ser Thr Glu Lys
165 170 175
Ile Gln Lys Tyr Asp Asn Leu Lys Tyr Leu Gly Thr His Ile Gln Gly
180 185 190
Asp Ser Val Ser Tyr Gln Lys Leu Gln Ile Arg Thr Asp Lys Leu Arg
195 200 205
Thr Leu Asn Asp Phe Gln Lys Leu Leu Gly Asn Ile Asn Trp Ile Arg
210 215 220
Pro Phe Leu Lys Leu Thr Thr
225 230
<210> 232
<211> 427
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 232
Met Asp Thr Ser Asn Leu Met Glu Gln Ile Leu Ser Ser Asp Asn Leu
1 5 10 15
Asn Arg Ala Tyr Leu Gln Val Val Arg Asn Lys Gly Ala Glu Gly Val
20 25 30
Asp Gly Met Lys Tyr Thr Glu Leu Lys Glu His Leu Ala Lys Asn Gly
35 40 45
Glu Thr Ile Lys Gly Gln Leu Arg Thr Arg Lys Tyr Lys Pro Gln Pro
50 55 60
Ala Arg Arg Val Glu Ile Pro Lys Pro Asp Gly Gly Val Arg Asn Leu
65 70 75 80
Gly Val Pro Thr Val Thr Asp Arg Phe Ile Gln Gln Ala Ile Ala Gln
85 90 95
Val Leu Thr Pro Ile Tyr Glu Glu Gln Phe His Asp His Ser Tyr Gly
100 105 110
Phe Arg Pro Asn Arg Cys Ala Gln Gln Ala Ile Leu Thr Ala Leu Asn
115 120 125
Ile Met Asn Asp Gly Asn Asp Trp Ile Val Asp Ile Asp Leu Glu Lys
130 135 140
Phe Phe Asp Thr Val Asn His Asp Lys Leu Met Thr Leu Ile Gly Arg
145 150 155 160
Thr Ile Lys Asp Gly Asp Val Ile Ser Ile Val Arg Lys Tyr Leu Val
165 170 175
Ser Gly Ile Met Ile Asp Asp Glu Tyr Glu Asp Ser Ile Val Gly Thr
180 185 190
Pro Gln Gly Gly Asn Leu Ser Pro Leu Leu Ala Asn Ile Met Leu Asn
195 200 205
Glu Leu Asp Lys Glu Met Glu Lys Arg Gly Leu Asn Phe Val Arg Tyr
210 215 220
Ala Asp Asp Cys Ile Ile Met Val Gly Ser Glu Met Ser Ala Asn Arg
225 230 235 240
Val Met Arg Asn Ile Ser Arg Phe Ile Glu Glu Lys Leu Gly Leu Lys
245 250 255
Val Asn Met Thr Lys Ser Lys Val Asp Arg Pro Ser Gly Leu Lys Tyr
260 265 270
Leu Gly Phe Gly Phe Tyr Phe Asp Pro Arg Ala His Gln Phe Lys Ala
275 280 285
Lys Pro His Ala Lys Ser Val Ala Lys Phe Lys Lys Arg Met Lys Glu
290 295 300
Leu Thr Cys Arg Ser Trp Gly Val Ser Asn Ser Tyr Lys Val Glu Lys
305 310 315 320
Leu Asn Gln Leu Ile Arg Gly Trp Ile Asn Tyr Phe Lys Ile Gly Ser
325 330 335
Met Lys Thr Leu Cys Lys Glu Leu Asp Ser Arg Ile Arg Tyr Arg Leu
340 345 350
Arg Met Cys Ile Trp Lys Gln Trp Lys Thr Pro Gln Asn Gln Glu Lys
355 360 365
Asn Leu Val Lys Leu Gly Ile Asp Arg Asn Thr Ala Arg Arg Val Ala
370 375 380
Tyr Thr Gly Lys Arg Ile Ala Tyr Val Cys Asn Lys Gly Ala Val Asn
385 390 395 400
Val Ala Ile Ser Asn Lys Arg Leu Ala Ser Phe Gly Leu Ile Ser Met
405 410 415
Leu Asp Tyr Tyr Ile Glu Lys Cys Val Thr Cys
420 425
<210> 233
<211> 774
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 233
Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15
Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30
Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr
50 55 60
Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val
65 70 75 80
Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95
Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125
Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val
165 170 175
Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205
Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220
Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu
275 280 285
Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His
370 375 380
Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400
Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415
Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430
Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445
Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460
Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480
Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr
485 490 495
Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510
Val Ile Ala Trp Gly Arg Glu Tyr Leu Thr Met Thr Ile Lys Glu Ile
515 520 525
Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe
530 535 540
Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560
Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu
565 570 575
Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys
580 585 590
Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605
Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620
Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val
625 630 635 640
Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655
Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp
660 665 670
Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685
Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700
Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720
Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Lys Gln
725 730 735
Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys
740 745 750
Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg
755 760 765
Leu Lys Pro Lys Gly Thr
770
<210> 234
<211> 774
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 234
Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15
Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30
Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Gly Thr Val Val Thr
50 55 60
Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Pro Val
65 70 75 80
Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95
Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125
Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Phe Asp Ile Glu Thr
130 135 140
Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val Ile Thr Trp Lys Asn Val
165 170 175
Asp Leu Pro Tyr Val Asp Val Val Ser Thr Glu Arg Glu Met Ile Lys
180 185 190
Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205
Tyr Asp Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220
Lys Leu Gly Ile Asn Phe Ala Leu Gly Arg Asp Gly Ser Glu Pro Lys
225 230 235 240
Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Ile Asn Leu Pro Thr
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu
275 280 285
Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Leu Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His
370 375 380
Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400
Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415
Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430
Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445
Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460
Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480
Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr
485 490 495
Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510
Val Ile Ala Trp Gly Arg Glu Tyr Leu Thr Met Thr Ile Lys Glu Ile
515 520 525
Glu Glu Lys Tyr Gly Phe Lys Val Ile Tyr Ser Asp Thr Asp Gly Phe
530 535 540
Phe Ala Thr Ile Pro Gly Ala Asp Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560
Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu
565 570 575
Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys
580 585 590
Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605
Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620
Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val
625 630 635 640
Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655
Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp
660 665 670
Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685
Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700
Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720
Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Lys Gln
725 730 735
Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Phe Gly Tyr Arg Lys
740 745 750
Glu Asp Leu Arg Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg
755 760 765
Leu Lys Pro Lys Gly Thr
770
<210> 235
<211> 774
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 235
Met Ile Leu Asp Thr Asp Tyr Ile Thr Glu Asp Gly Lys Pro Val Ile
1 5 10 15
Arg Ile Phe Lys Lys Glu Asn Gly Glu Phe Lys Ile Glu Tyr Asp Arg
20 25 30
Thr Phe Glu Pro Tyr Leu Tyr Ala Leu Leu Lys Asp Asp Ser Ala Ile
35 40 45
Glu Glu Val Lys Lys Ile Thr Ala Glu Arg His Ser Thr Val Val Thr
50 55 60
Val Lys Arg Val Glu Lys Val Gln Lys Lys Phe Leu Gly Arg Ser Val
65 70 75 80
Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gln Asp Val Pro Ala Ile
85 90 95
Met Asp Lys Ile Arg Glu His Pro Ala Val Ile Asp Ile Tyr Glu Tyr
100 105 110
Asp Ile Pro Phe Ala Ile Arg Tyr Leu Ile Asp Lys Gly Leu Val Pro
115 120 125
Met Glu Gly Asp Glu Glu Leu Lys Leu Leu Ala Leu Asp Ile Gly Thr
130 135 140
Pro Cys His Glu Gly Glu Val Phe Ala Glu Gly Pro Ile Leu Met Ile
145 150 155 160
Ser Tyr Ala Asp Glu Glu Gly Thr Arg Val Ile Thr Trp Arg Asn Val
165 170 175
Asp Leu Pro Tyr Val Asp Val Leu Ser Thr Glu Arg Glu Met Ile Gln
180 185 190
Arg Phe Leu Arg Val Val Lys Glu Lys Asp Pro Asp Val Leu Ile Thr
195 200 205
Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Cys Glu
210 215 220
Lys Leu Gly Ile Asn Phe Thr Leu Gly Arg Glu Gly Ser Glu Pro Lys
225 230 235 240
Ile Gln Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg Ile
245 250 255
His Phe Asp Leu Tyr Pro Val Ile Arg Arg Thr Val Asn Leu Pro Ile
260 265 270
Tyr Thr Leu Glu Ala Val Tyr Glu Ala Val Phe Gly Gln Pro Lys Glu
275 280 285
Lys Val Tyr Ala Glu Glu Ile Thr Thr Ala Trp Glu Thr Gly Glu Asn
290 295 300
Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr
305 310 315 320
Glu Leu Gly Lys Glu Phe Met Pro Met Glu Ala Gln Leu Ser Arg Leu
325 330 335
Ile Gly Gln Ser Leu Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu
340 345 350
Val Glu Trp Phe Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala
355 360 365
Pro Asn Lys Pro Asp Glu Lys Glu Leu Ala Arg Arg His Gln Ser His
370 375 380
Glu Gly Gly Tyr Ile Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn Ile
385 390 395 400
Val Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser Ile Ile Ile Thr His
405 410 415
Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Lys Glu Tyr Asp
420 425 430
Val Ala Pro Gln Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe
435 440 445
Ile Pro Ser Leu Leu Gly Asp Leu Leu Glu Glu Arg Gln Lys Ile Lys
450 455 460
Lys Arg Met Lys Ala Thr Ile Asp Pro Ile Glu Arg Lys Leu Leu Asp
465 470 475 480
Tyr Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser Leu Tyr Gly Tyr
485 490 495
Tyr Gly Tyr Ala Arg Ala Arg Trp Tyr Cys Lys Glu Cys Ala Glu Ser
500 505 510
Val Ile Ala Trp Gly Arg Glu Tyr Ile Thr Met Thr Ile Lys Glu Ile
515 520 525
Glu Glu Lys Tyr Gly Phe Lys Leu Ile Tyr Ser Asp Thr Asp Gly Phe
530 535 540
Phe Ala Thr Ile Pro Gly Ala Glu Ala Glu Thr Val Lys Lys Lys Ala
545 550 555 560
Met Glu Phe Leu Lys Tyr Ile Asn Ala Lys Leu Pro Gly Ala Leu Glu
565 570 575
Leu Glu Tyr Glu Gly Phe Tyr Lys Arg Gly Leu Phe Val Thr Lys Lys
580 585 590
Lys Tyr Ala Val Ile Asp Glu Glu Gly Lys Ile Thr Thr Arg Gly Leu
595 600 605
Glu Ile Val Arg Arg Asp Trp Ser Glu Ile Ala Lys Glu Thr Gln Ala
610 615 620
Arg Val Leu Glu Ala Leu Leu Lys Asp Gly Asp Val Glu Lys Ala Val
625 630 635 640
Arg Ile Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro
645 650 655
Pro Glu Lys Leu Val Ile His Lys Gln Ile Thr Arg Asp Leu Lys Asp
660 665 670
Tyr Lys Ala Thr Gly Pro His Val Ala Val Ala Lys Arg Leu Ala Ala
675 680 685
Arg Gly Val Lys Ile Arg Pro Gly Thr Val Ile Ser Tyr Ile Val Leu
690 695 700
Lys Gly Ser Gly Arg Ile Val Asp Arg Ala Ile Pro Phe Asp Glu Phe
705 710 715 720
Asp Pro Thr Lys His Lys Tyr Asp Ala Glu Tyr Tyr Ile Glu Asn Gln
725 730 735
Val Leu Pro Ala Val Glu Arg Ile Leu Arg Ala Tyr Gly Tyr Arg Lys
740 745 750
Glu Asp Leu Trp Tyr Gln Lys Thr Arg Gln Val Gly Leu Ser Ala Arg
755 760 765
Leu Lys Pro Lys Gly Thr
770
<210> 236
<211> 683
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 236
Met Asp His Leu Leu Leu Lys Thr Gln Thr Gln Thr Glu Gln Val Met
1 5 10 15
Asn Val Thr Asn Pro Asn Ser Ile Tyr Ile Lys Gly Arg Leu Tyr Phe
20 25 30
Lys Gly Tyr Lys Lys Ile Glu Leu His Cys Phe Val Asp Thr Gly Ala
35 40 45
Ser Leu Cys Ile Ala Ser Lys Phe Val Ile Pro Glu Glu His Trp Val
50 55 60
Asn Ala Glu Arg Pro Ile Met Val Lys Ile Ala Asp Gly Ser Ser Ile
65 70 75 80
Thr Ile Ser Lys Val Cys Lys Asp Ile Asp Leu Ile Ile Ala Gly Glu
85 90 95
Ile Phe Arg Ile Pro Thr Val Tyr Gln Gln Glu Ser Gly Ile Asp Phe
100 105 110
Ile Ile Gly Asn Asn Phe Cys Gln Leu Tyr Glu Pro Phe Ile Gln Phe
115 120 125
Thr Asp Arg Val Ile Phe Thr Lys Asn Lys Ser Tyr Pro Val His Ile
130 135 140
Ala Lys Leu Thr Arg Ala Val Arg Val Gly Thr Glu Gly Phe Leu Glu
145 150 155 160
Ser Met Lys Lys Arg Ser Lys Thr Gln Gln Pro Glu Pro Val Asn Ile
165 170 175
Ser Thr Asn Lys Ile Glu Asn Pro Leu Glu Glu Ile Ala Ile Leu Ser
180 185 190
Glu Gly Arg Arg Leu Ser Glu Glu Lys Leu Phe Ile Thr Gln Gln Arg
195 200 205
Met Gln Lys Ile Glu Glu Leu Leu Glu Lys Val Cys Ser Glu Asn Pro
210 215 220
Leu Asp Pro Asn Lys Thr Lys Gln Trp Met Lys Ala Ser Ile Lys Leu
225 230 235 240
Ser Asp Pro Ser Lys Ala Ile Lys Val Lys Pro Met Lys Tyr Ser Pro
245 250 255
Met Asp Arg Glu Glu Phe Asp Lys Gln Ile Lys Glu Leu Leu Asp Leu
260 265 270
Lys Val Ile Lys Pro Ser Lys Ser Pro His Met Ala Pro Ala Phe Leu
275 280 285
Val Asn Asn Glu Ala Glu Lys Arg Arg Gly Lys Lys Arg Met Val Val
290 295 300
Asn Tyr Lys Ala Met Asn Lys Ala Thr Val Gly Asp Ala Tyr Asn Leu
305 310 315 320
Pro Asn Lys Asp Glu Leu Leu Thr Leu Ile Arg Gly Lys Lys Ile Phe
325 330 335
Ser Ser Phe Asp Cys Lys Ser Gly Phe Trp Gln Val Leu Leu Asp Gln
340 345 350
Glu Ser Arg Pro Leu Thr Ala Phe Thr Cys Pro Gln Gly His Tyr Glu
355 360 365
Trp Asn Val Val Pro Phe Gly Leu Lys Gln Ala Pro Ser Ile Phe Gln
370 375 380
Arg His Met Asp Glu Ala Phe Arg Val Phe Arg Lys Phe Cys Cys Val
385 390 395 400
Tyr Val Asp Asp Ile Leu Val Phe Ser Asn Asn Glu Glu Asp His Leu
405 410 415
Leu His Val Ala Met Ile Leu Gln Lys Cys Asn Gln His Gly Ile Ile
420 425 430
Leu Ser Lys Lys Lys Ala Gln Leu Phe Lys Lys Lys Ile Asn Phe Leu
435 440 445
Gly Leu Glu Ile Asp Glu Gly Thr His Lys Pro Gln Gly His Ile Leu
450 455 460
Glu His Ile Asn Lys Phe Pro Asp Thr Leu Glu Asp Lys Lys Gln Leu
465 470 475 480
Gln Arg Phe Leu Gly Ile Leu Thr Tyr Ala Ser Asp Tyr Ile Pro Lys
485 490 495
Leu Ala Gln Ile Arg Lys Pro Leu Gln Ala Lys Leu Lys Glu Asn Val
500 505 510
Pro Trp Arg Trp Thr Lys Glu Asp Thr Leu Tyr Met Gln Lys Val Lys
515 520 525
Lys Asn Leu Gln Gly Phe Pro Pro Leu His His Pro Leu Pro Glu Glu
530 535 540
Lys Leu Ile Ile Glu Thr Asp Ala Ser Asp Asp Tyr Trp Gly Gly Met
545 550 555 560
Leu Lys Ala Ile Lys Ile Asn Glu Gly Thr Asn Thr Glu Leu Ile Cys
565 570 575
Arg Tyr Ala Ser Gly Ser Phe Lys Ala Ala Glu Lys Asn Tyr His Ser
580 585 590
Asn Asp Lys Glu Thr Leu Ala Val Ile Asn Thr Ile Lys Lys Phe Ser
595 600 605
Ile Tyr Leu Thr Pro Val His Phe Leu Ile Arg Thr Asp Asn Thr His
610 615 620
Phe Lys Ser Phe Val Asn Leu Asn Tyr Lys Gly Asp Ser Lys Leu Gly
625 630 635 640
Arg Asn Ile Arg Trp Gln Ala Trp Leu Ser His Tyr Ser Phe Asp Val
645 650 655
Glu His Ile Lys Gly Thr Asp Asn His Phe Ala Asp Phe Leu Ser Arg
660 665 670
Glu Phe Asn Lys Val Asn Ser Ser Gly Gly Ser
675 680
<210> 237
<211> 329
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 237
Met Gly Ile His Gly Val Pro Ala Ala Met Lys Ser Ala Glu Tyr Leu
1 5 10 15
Asn Thr Phe Arg Leu Arg Asn Leu Gly Leu Pro Val Met Asn Asn Leu
20 25 30
His Asp Met Ser Lys Ala Thr Arg Ile Ser Val Glu Thr Leu Arg Leu
35 40 45
Leu Ile Tyr Thr Ala Asp Phe Arg Tyr Arg Ile Tyr Thr Val Glu Lys
50 55 60
Lys Gly Pro Glu Lys Arg Met Arg Thr Ile Tyr Gln Pro Ser Arg Glu
65 70 75 80
Leu Lys Ala Leu Gln Gly Trp Val Leu Arg Asn Ile Leu Asp Lys Leu
85 90 95
Ser Ser Ser Pro Phe Ser Ile Gly Phe Glu Lys His Gln Ser Ile Leu
100 105 110
Asn Asn Ala Thr Pro His Ile Gly Ala Asn Phe Ile Leu Asn Ile Asp
115 120 125
Leu Glu Asp Phe Phe Pro Ser Leu Thr Ala Asn Lys Val Phe Gly Val
130 135 140
Phe His Ser Leu Gly Tyr Asn Arg Leu Ile Ser Ser Val Leu Thr Lys
145 150 155 160
Ile Cys Cys Tyr Lys Asn Leu Leu Pro Gln Gly Ala Pro Ser Ser Pro
165 170 175
Lys Leu Ala Asn Leu Ile Cys Ser Lys Leu Asp Tyr Arg Ile Gln Gly
180 185 190
Tyr Ala Gly Ser Arg Gly Leu Ile Tyr Thr Arg Tyr Ala Asp Asp Leu
195 200 205
Thr Leu Ser Ala Gln Ser Met Lys Lys Val Val Lys Ala Arg Asp Phe
210 215 220
Leu Phe Ser Ile Ile Pro Ser Glu Gly Leu Val Ile Asn Ser Lys Lys
225 230 235 240
Thr Cys Ile Ser Gly Pro Arg Ser Gln Arg Lys Val Thr Gly Leu Val
245 250 255
Ile Ser Gln Glu Lys Val Gly Ile Gly Arg Glu Lys Tyr Lys Glu Ile
260 265 270
Arg Ala Lys Ile His His Ile Phe Cys Gly Lys Ser Ser Glu Ile Glu
275 280 285
His Val Arg Gly Trp Leu Ser Phe Ile Leu Ser Val Asp Ser Lys Ser
290 295 300
His Arg Arg Leu Ile Thr Tyr Ile Ser Lys Leu Glu Lys Lys Tyr Gly
305 310 315 320
Lys Asn Pro Leu Asn Lys Ala Lys Thr
325
<210> 238
<211> 235
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 238
Met Glu Lys Glu Gly Gln Leu Glu Glu Ala Pro Pro Thr Asn Pro Tyr
1 5 10 15
Asn Thr Pro Thr Phe Ala Ile Lys Lys Lys Asp Lys Asn Lys Trp Arg
20 25 30
Met Leu Ile Asp Phe Arg Glu Leu Asn Lys Val Thr Gln Asp Phe Thr
35 40 45
Glu Ile Gln Leu Gly Ile Pro His Pro Ala Gly Leu Ala Lys Lys Arg
50 55 60
Arg Ile Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Ile Pro Leu
65 70 75 80
His Glu Asp Phe Arg Pro Tyr Thr Ala Phe Thr Leu Pro Ser Val Asn
85 90 95
Asn Ala Glu Pro Gly Lys Arg Tyr Ile Tyr Lys Val Leu Pro Gln Gly
100 105 110
Trp Lys Gly Ser Pro Ala Ile Phe Gln His Thr Met Arg Gln Val Leu
115 120 125
Glu Pro Phe Arg Lys Ala Asn Lys Asp Val Ile Ile Ile Gln Tyr Met
130 135 140
Asp Asp Ile Leu Ile Ala Ser Asp Arg Thr Asp Leu Glu His Asp Arg
145 150 155 160
Val Val Leu Gln Leu Lys Glu Leu Leu Asn Gly Leu Gly Phe Ser Thr
165 170 175
Pro Asp Glu Lys Phe Gln Lys Asp Pro Pro Ile His Trp Met Gly Tyr
180 185 190
Glu Leu Trp Pro Thr Lys Trp Lys Leu Gln Lys Ile Gln Leu Pro Gln
195 200 205
Lys Glu Ile Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Val Leu
210 215 220
Asn Trp Ala Ala Gln Leu Tyr Pro Gly Ile Lys
225 230 235
<210> 239
<211> 235
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 239
Met Glu Glu Glu Gly Lys Ile Ser Lys Ile Gly Pro Glu Asn Pro Tyr
1 5 10 15
Asn Thr Pro Val Phe Ala Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg
20 25 30
Lys Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp
35 40 45
Glu Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys Lys Lys
50 55 60
Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro Leu
65 70 75 80
Asp Glu Ser Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile Asn
85 90 95
Asn Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly
100 105 110
Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu
115 120 125
Glu Pro Phe Arg Ile Lys Asn Pro Glu Ile Val Ile Tyr Gln Tyr Met
130 135 140
Asp Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg Thr
145 150 155 160
Lys Ile Glu Glu Leu Arg Ala His Leu Leu Ser Trp Gly Phe Thr Thr
165 170 175
Pro Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr
180 185 190
Glu Leu His Pro Asp Arg Trp Thr Val Gln Pro Ile Asp Leu Pro Glu
195 200 205
Lys Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Lys Leu
210 215 220
Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys
225 230 235
<210> 240
<211> 441
<212> PRT
<213> 人工序列
<220>
<223> 合成
<400> 240
Met Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro Gly
1 5 10 15
Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Glu Glu Lys Ile
20 25 30
Lys Ala Leu Val Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile
35 40 45
Ser Lys Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Val Phe Ala Ile
50 55 60
Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg Glu
65 70 75 80
Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile Pro
85 90 95
His Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val
100 105 110
Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Glu Asp Phe Arg Lys Tyr
115 120 125
Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile Arg
130 135 140
Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala Ile
145 150 155 160
Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys Gln Asn
165 170 175
Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly Ser
180 185 190
Asp Leu Glu Ile Gly Gln His Arg Thr Lys Ile Glu Glu Leu Arg Gln
195 200 205
His Leu Leu Arg Trp Gly Leu Thr Thr Pro Asp Lys Lys His Gln Lys
210 215 220
Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys Trp
225 230 235 240
Thr Val Gln Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Thr Val Asn
245 250 255
Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr
260 265 270
Pro Gly Ile Lys Val Arg Gln Leu Cys Lys Leu Leu Arg Gly Thr Lys
275 280 285
Ala Leu Thr Glu Val Ile Pro Leu Thr Glu Glu Ala Glu Leu Glu Leu
290 295 300
Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Val His Gly Val Tyr Tyr
305 310 315 320
Asp Pro Ser Lys Asp Leu Ile Ala Glu Ile Gln Lys Gln Gly Gln Gly
325 330 335
Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro Phe Lys Asn Leu Lys Thr
340 345 350
Gly Lys Tyr Ala Arg Met Arg Gly Ala His Thr Asn Asp Val Lys Gln
355 360 365
Leu Thr Glu Ala Val Gln Lys Ile Thr Thr Glu Ser Ile Val Ile Trp
370 375 380
Gly Lys Thr Pro Lys Phe Lys Leu Pro Ile Gln Lys Glu Thr Trp Glu
385 390 395 400
Thr Trp Trp Thr Glu Tyr Trp Gln Ala Thr Trp Ile Pro Glu Trp Glu
405 410 415
Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu Lys
420 425 430
Glu Pro Ile Val Gly Ala Glu Thr Phe
435 440
<210> 241
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 241
aauagcggcc cuaagaaauc cgucuuucau ugacgg 36
<210> 242
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 242
auuggaacug gcgagaaauc cgucuuucau ugacgg 36
<210> 243
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 243
ccagcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 244
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 244
cggcgcucga auaggaaauc cgucuuucau ugacgg 36
<210> 245
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 245
guggcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 246
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 246
guugcaacac cuaagaaauc cgucuuucau ugacgg 36
<210> 247
<211> 36
<212> RNA
<213> 人工序列
<220>
<223> 合成
<400> 247
guugcaaugc cuaagaaauc cgucuuucau ugacgg 36
<210> 248
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 248
gggaagtggt tggtcagcat 20
<210> 249
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 249
gggaagtggt tgcgaggcat 20
<210> 250
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 250
gggaagtggt tgagcggtca 20
<210> 251
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 251
gggaagtggt tggcat 16
<210> 252
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 252
gagccagtgt tgctagtcaa 20
<210> 253
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 253
gagccagtgt tgcgagtcaa 20
<210> 254
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 254
gagccagtgt tgagcgctag 20
<210> 255
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 255
gagccagtgt tgtcaa 16
<210> 256
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 256
ttaaactctc catggaccag 20
<210> 257
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 257
ttaaactctc cacgagccag 20
<210> 258
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 258
ttaaactctc caagcgtgga 20
<210> 259
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 259
ttaaactctc caccag 16

Claims (88)

1.一种基因编辑系统,其包括:
(a)V型CRISPR核酸酶多肽或编码所述V型CRISPR核酸酶多肽的第一核酸;
(b)逆转录酶(RT)多肽或编码所述RT多肽的第二核酸;
(c)向导RNA(gRNA)或编码所述gRNA的第三核酸,其中所述gRNA包括一个或多个可被V型CRISPR核酸酶识别的结合位点(CRISPR核酸酶结合位点)和对所关注的基因组位点内的靶序列具有特异性的间隔子序列,所述靶序列与原间隔子相邻基序(PAM)相邻;以及
(d)逆转录供体RNA(RT供体RNA)或编码所述RT供体RNA的第四核酸,其中所述RT供体RNA包括引物结合位点(PBS)和模板序列。
2.根据权利要求1所述的基因编辑系统,其中所述V型CRISPR核酸酶多肽是Cas12多肽。
3.根据权利要求2所述的基因编辑系统,其中所述Cas12多肽是Cas12i多肽,所述Cas12i多肽任选地是Cas12i2多肽。
4.根据权利要求3所述的基因编辑系统,其中所述Cas12i多肽是Cas12i2多肽,所述Cas12i2多肽包括与SEQ ID NO:2至少95%相同的氨基酸序列。
5.根据权利要求4所述的基因编辑系统,其中所述Cas12i2多肽包括位于SEQ ID NO:2的位置D581、G624、F626、P868、I926、V1030、E1035和/或S1046处的一个或多个突变。
6.根据权利要求5所述的基因编辑系统,其中所述一个或多个突变是氨基酸取代,所述氨基酸取代任选地是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R、S1046G或其组合。
7.根据权利要求5所述的基因编辑系统,其中所述Cas12i2多肽包括:
(i)位于位置D581、D911、I926和V1030处的突变,所述突变任选地是D581R、D911R、I926R和V1030G的氨基酸取代;
(ii)位于位置D581、I926和V1030处的突变,所述突变任选地是D581R、I926R和V1030G的氨基酸取代;
(iii)位于位置D581、I926、V1030和S1046处的突变,所述突变任选地是D581R、I926R、V1030G和S1046G的氨基酸取代;
(iv)位于位置D581、G624、F626、I926、V1030、E1035和S1046处的突变,所述突变任选地是D581R、G624R、F626R、I926R、V1030G、E1035R和S1046G的氨基酸取代;或
(v)位于位置D581、G624、F626、P868、I926、V1030、E1035和S1046处的突变,所述突变任选地是D581R、G624R、F626R、P868T、I926R、V1030G、E1035R和S1046G的氨基酸取代。
8.根据权利要求7所述的基因编辑系统,其中所述Cas12i2多肽包括SEQ ID NO:3-7中的任一者,任选地SEQ ID NO:4或SEQ ID NO:7的氨基酸序列。
9.根据权利要求4或权利要求5所述的基因编辑系统,其中所述Cas12i多肽具有降低的crRNA处理活性,任选地其中所述Cas12i多肽包括位于SEQ ID NO:2的位置H485和/或位置H486处的突变。
10.根据权利要求1至9中任一项所述的基因编辑系统,其中所述系统包括所述V型CRISPR核酸酶多肽。
11.根据权利要求1至10中任一项所述的基因编辑系统,其中所述系统包括编码所述V型CRISPR核酸酶多肽的所述第一核酸。
12.根据权利要求11所述的基因编辑系统,其中所述第一核酸位于第一载体中,所述第一载体任选地是第一病毒载体。
13.根据权利要求11所述的基因编辑系统,其中所述第一核酸是第一信使RNA(mRNA)。
14.根据权利要求1至13中任一项所述的基因编辑系统,其中所述RT多肽是莫洛尼鼠类白血病病毒(Moloney Murine Leukemia Virus,MMLV)-RT、小鼠乳腺肿瘤病毒(MMTV)-RT、Marathon-RT或RTx-RT。
15.根据权利要求1至14中任一项所述的基因编辑系统,其中所述系统包括所述RT多肽。
16.根据权利要求1至14中任一项所述的基因编辑系统,其中所述系统包括编码所述RT多肽的所述第二核酸。
17.根据权利要求16所述的基因编辑系统,其中所述第二核酸位于第二载体中,所述第二载体任选地是第二病毒载体。
18.根据权利要求17所述的基因编辑系统,其中所述第二载体与所述第一载体相同。
19.根据权利要求16所述的基因编辑系统,其中所述第二核酸是第二mRNA。
20.根据权利要求17所述的基因编辑系统,其中所述第一mRNA和所述第二mRNA位于单个RNA分子上。
21.根据权利要求1至15中任一项所述的基因编辑系统,其中所述基因编辑系统包括融合多肽,所述融合多肽包括所述V型CRISPR核酸酶多肽和所述RT多肽。
22.根据权利要求1至15中任一项所述的基因编辑系统,其中所述V型CRISPR核酸酶多肽和所述RT多肽是单独的多肽。
23.根据权利要求1至22中任一项所述的基因编辑系统,其中所述间隔子序列的长度为20-30个核苷酸,任选地长度为20个核苷酸。
24.根据权利要求3至23中任一项所述的基因编辑系统,其中所述PAM包括任选地位于所述靶序列的5'的5'-TTN-3'的基序。
25.根据权利要求3至24中任一项所述的基因编辑系统,其中一个或多个CRISPR核酸酶结合位点是直接重复序列。
26.根据权利要求25所述的基因编辑系统,其中每个直接重复序列的长度为23-36个核苷酸,任选地长度为23个核苷酸。
27.根据权利要求26所述的基因编辑系统,其中所述直接重复序列与SEQ ID NO:15-17和241-247中的任一者或其长度为至少23个核苷酸的片段至少90%相同。
28.根据权利要求27所述的基因编辑系统,其中所述直接重复序列是SEQ ID NO:15-17和241-247中的任一者,或其长度为至少23个核苷酸的片段;任选地其中所述直接重复序列是SEQ ID NO:17。
29.根据权利要求1至28中任一项所述的基因编辑系统,其中所述系统包括所述gRNA。
30.根据权利要求1至28中任一项所述的基因编辑系统,其中所述系统包括编码所述gRNA的所述第三核酸。
31.根据权利要求30所述的基因编辑系统,其中所述第三核酸位于第三载体中,所述第三载体任选地是病毒载体。
32.根据权利要求31所述的基因编辑系统,其中所述第三载体与所述第一载体和/或所述第二载体相同。
33.根据权利要求1至32中任一项所述的基因编辑系统,其中所述PBS的长度为5-100个核苷酸,任选地长度为10-60个核苷酸,优选地长度为10-30个核苷酸。
34.根据权利要求1至33中任一项所述的基因编辑系统,其中所述PBS与和所述靶序列的互补区相邻的靶向PBS的位点结合,并且其中所述靶向PBS的位点位于所述靶序列的所述互补区的上游。
35.根据权利要求34所述的基因编辑系统,其中所述靶向PBS的位点是位于所述靶序列的所述互补区的上游的3-10个核苷酸。
36.根据权利要求1至33中任一项所述的基因编辑系统,其中所述靶向PBS的位点与所述靶序列的所述互补区重叠。
37.根据权利要求1至33中任一项所述的基因编辑系统,其中所述靶向PBS的位点与所述靶序列相邻或重叠。
38.根据权利要求1至37中任一项所述的基因编辑系统,其中所述模板序列的长度为5-100个核苷酸,任选地长度为30-50个核苷酸。
39.根据权利要求1至38中任一项所述的基因编辑系统,其中所述模板序列与所述所关注的基因组位点同源,并且包括相对于所述所关注的基因组位点的一个或多个核苷酸变异。
40.根据权利要求39所述的基因编辑系统,其中至少一个核苷酸变异位于所述靶序列内。
41.根据权利要求39或权利要求40所述的基因编辑系统,其中至少一个核苷酸变异位于所述PAM中。
42.根据权利要求1至41中任一项所述的基因编辑系统,其中所述系统包括所述RT供体RNA。
43.根据权利要求1至41中任一项所述的基因编辑系统,其中所述系统包括编码所述RT供体RNA的所述第四核酸。
44.根据权利要求43所述的基因编辑系统,其中所述第四核酸位于第四载体中,所述第四载体任选地是第四病毒载体。
45.根据权利要求44所述的基因编辑系统,其中四个载体与所述第一载体、所述第二载体和/或所述第三载体相同。
46.根据权利要求1至45中任一项所述的基因编辑系统,其中所述gRNA和所述RT供体RNA位于单个RNA分子上,所述单个RNA分子包括所述CRISPR核酸酶结合位点、所述间隔子序列、所述PBS和所述模板序列。
47.根据权利要求46所述的基因编辑系统,其中所述单个RNA分子进一步包括位于所述gRNA与所述RT供体RNA之间的接头。
48.根据权利要求47所述的基因编辑系统,其中所述接头包括发夹。
49.根据权利要求46至48中任一项所述的基因编辑系统,其中所述单个RNA分子从5'至3'包括:
(i)所述CRISPR核酸酶结合位点、所述间隔子序列、所述模板序列和所述PBS;
(ii)所述CRISPR核酸酶结合位点、所述间隔子序列、所述接头、所述模板序列和所述PBS;
(iii)所述模板序列、所述PBS、所述CRISPR核酸酶结合位点和所述间隔子序列;或者
(iv)所述模板序列、所述PBS、所述接头、所述CRISPR核酸酶结合位点和所述间隔子序列。
50.根据权利要求46至49中任一项所述的基因编辑系统,其中所述单个RNA分子进一步包括5'端保护片段、3'端保护片段或两者,所述5'端保护片段和所述3'端保护片段中的每一个形成次级结构,所述次级结构任选地是发夹、假结或三链体结构。
51.根据权利要求50所述的基因编辑系统,其中所述5'端保护片段和/或所述3'端保护片段是核糖核酸外切酶抗性RNA(xrRNA)、转移RNA(tRNA)或截短的tRNA。
52.根据权利要求50所述的基因编辑系统,其中所述5'端保护片段和/或所述3'端保护片段包括所述CRISPR核酸酶结合位点中的一个或多个CRISPR核酸酶结合位点,以及任选地一个或多个与任何人序列不同源的区段。
53.根据权利要求1至45中任一项所述的基因编辑系统,其中所述gRNA和所述RT供体RNA是两种单独的RNA分子。
54.根据权利要求53所述的基因编辑系统,其中所述gRNA、所述RT供体RNA或两者进一步包括5'端保护片段和/或3'端保护片段。
55.根据权利要求54所述的基因编辑系统,其中所述5'端保护片段和/或所述3'端保护片段形成次级结构,所述次级结构任选地是发夹、假结或三链体结构,或者其中所述5'端保护片段和/或所述3'端保护片段是核糖核酸外切酶抗性RNA(xrRNA)、转移RNA(tRNA)或截短的tRNA。
56.根据权利要求54所述的基因编辑系统,其中所述5'端保护片段和/或所述3'端保护片段包括所述CRISPR核酸酶结合位点中的一个或多个CRISPR核酸酶结合位点,以及任选地一个或多个与任何人序列不同源的区段。
57.根据权利要求1至56中任一项所述的基因编辑系统,其中所述系统包括涵盖要素(a)、(b)、(c)、(d)或其任何组合的一个或多个脂质纳米颗粒(LNP)。
58.根据权利要求1至57中任一项所述的基因编辑系统,其中所述系统包括(i)共同涵盖(a)-(d)的至多三个要素的一个或多个脂质纳米颗粒(LNP),以及(ii)一种或多种载体。
59.根据权利要求58所述的基因编辑系统,其中所述一种或多种载体是一种或多种病毒载体,所述一种或多种病毒载体任选地是腺相关病毒(AAV)载体。
60.根据权利要求1至56中任一项所述的基因编辑系统,其中所述系统包括所述V型CRISPR核酸酶多肽、所述RT多肽、所述gRNA和所述RT供体RNA。
61.根据权利要求60所述的基因编辑系统,其中所述V型CRISPR核酸酶多肽和/或所述RT多肽与所述gRNA和/或所述RT供体RNA形成复合物。
62.一种药物组合物,其包括根据权利要求1至61中任一项所述的系统。
63.一种试剂盒,其包括根据权利要求1至61中任一项所述的系统的(a)-(d)的要素。
64.一种用于对细胞进行基因编辑的方法,所述方法包括使宿主细胞与根据权利要求1至61中任一项所述的基因编辑系统或根据权利要求62所述的药物组合物接触,以对所述宿主细胞进行基因编辑。
65.根据权利要求64所述的方法,其中所述宿主细胞在体外培养。
66.根据权利要求65所述的方法,其中接触步骤是通过向包括所述宿主细胞的受试者施用所述基因编辑系统来进行的。
67.一种经基因修饰的细胞群体,所述经基因修饰的细胞由根据权利要求1至61中任一项所述的基因编辑系统产生。
68.根据权利要求67所述的经基因修饰的细胞群体,其包括不可由所述基因编辑系统编辑的经基因修饰的细胞。
69.根据权利要求68所述的经基因修饰的细胞群体,其中所述经基因修饰的细胞包括所述PAM中、所述靶序列中或两者中的一个或多个修饰。
70.一种基因编辑RNA分子,其包括:
(i)一个或多个可被V型CRISPR核酸酶识别的结合位点(CRISPR核酸酶结合位点);
(ii)对基因位点内的靶序列具有特异性的间隔子序列,所述靶序列与原间隔子相邻基序(PAM)相邻;
(iii)引物结合位点(PBS);以及
(iv)模板序列。
71.根据权利要求70所述的基因编辑RNA分子,其进一步包括一个或多个接头。
72.根据权利要求70或权利要求71所述的基因编辑RNA分子,其中所述RNA分子从5'至3'包括:
(i)所述CRISPR核酸酶结合位点、所述间隔子序列、所述模板序列和所述PBS;
(ii)所述CRISPR核酸酶结合位点、所述间隔子序列、所述接头、所述模板序列和所述PBS;
(iii)所述模板序列、所述PBS、所述CRISPR核酸酶结合位点和所述间隔子序列;或者
(iv)所述模板序列、所述PBS、所述接头、所述CRISPR核酸酶结合位点和所述间隔子序列。
73.根据权利要求70至72中任一项所述的基因编辑RNA分子,其进一步包括5'端保护片段、3'端保护片段或两者。
74.根据权利要求73所述的基因编辑RNA分子,其中所述5'端保护片段和/或所述3'端保护片段形成次级结构,所述次级结构任选地是发夹、假结或三链体结构,或者其中所述5'端保护片段和/或所述3'端保护片段是核糖核酸外切酶抗性RNA(xrRNA)、转移RNA(tRNA)或截短的tRNA。
75.根据权利要求73所述的基因编辑RNA分子,其中所述5'端保护片段和/或所述3'端保护片段包括所述CRISPR核酸酶结合位点中的一个或多个CRISPR核酸酶结合位点,以及任选地一个或多个与任何人序列不同源的区段。
76.一种基因编辑RNA分子集合,其包括:
(i)向导RNA,所述向导RNA包括一个或多个可被V型CRISPR核酸酶识别的结合位点(CRISPR核酸酶结合位点)和对基因位点内的靶序列具有特异性的间隔子序列,所述靶序列与原间隔子相邻基序(PAM)相邻;以及
(ii)逆转录供体RNA(RT供体RNA)或编码所述RT供体RNA的第四核酸,其中所述RT供体RNA包括引物结合位点(PBS)和模板序列。
77.根据权利要求76所述的基因编辑RNA分子集合,其中所述gRNA、所述RT供体RNA或两者进一步包括5'端保护片段和/或3'端保护片段。
78.根据权利要求77所述的基因编辑RNA分子集合,其中所述5'端保护片段和/或所述3'端保护片段形成次级结构,所述次级结构任选地是发夹、假结或三链体结构,或者其中所述5'端保护片段和/或所述3'端保护片段是核糖核酸外切酶抗性RNA(xrRNA)、转移RNA(tRNA)或截短的tRNA。
79.根据权利要求77所述的基因编辑RNA分子集合,其中所述5'端保护片段和/或所述3'端保护片段包括所述CRISPR核酸酶结合位点中的一个或多个CRISPR核酸酶结合位点,以及任选地一个或多个与任何人序列不同源的区段。
80.根据权利要求70至75中任一项所述的基因编辑RNA分子或根据权利要求76至79中任一项所述的基因编辑RNA分子集合,其中:
(i)所述V型CRISPR核酸酶结合位点在权利要求25至28中的任一项中示出;
(ii)所述间隔子序列在权利要求23至24中的任一项中示出;
(iii)所述PBS在权利要求33至37中的任一项中示出;和/或
(iv)所述模板序列在权利要求38至41中的任一项中示出。
81.一种DNA分子或DNA分子集合,其编码根据权利要求70至80中任一项所述的基因编辑RNA分子或基因编辑RNA分子集合。
82.根据权利要求81所述的DNA分子或DNA分子集合,其包含在载体或载体集合中,任选地其中所述载体或所述载体集合是病毒载体。
83.一种融合多肽,其包括CRISPR核酸酶和逆转录酶。
84.根据权利要求83所述的融合多肽,其中所述CRISPR核酸酶是V型CRISPR核酸酶,所述V型CRISPR核酸酶任选地是Cas12i多肽。
85.根据权利要求84所述的融合多肽,其中所述Cas12i多肽是Cas12i2多肽,所述Cas12i2多肽任选地在权利要求4至9中的任一项中示出。
86.根据权利要求85所述的融合多肽,其包括SEQ ID NO:25-26和219-223中的任一者的氨基酸序列。
87.一种核酸,其包括编码根据权利要求83至86中任一项所述的融合多肽的核苷酸序列。
88.根据权利要求87所述的核酸,其是载体,任选地表达载体。
CN202280050146.XA 2021-06-01 2022-06-01 包括crispr核酸酶的基因编辑系统和其用途 Pending CN117813379A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US63/195,621 2021-06-01
US63/236,047 2021-08-23
US63/272,937 2021-10-28
US202263299695P 2022-01-14 2022-01-14
US63/299,695 2022-01-14
PCT/US2022/031821 WO2022256440A2 (en) 2021-06-01 2022-06-01 Gene editing systems comprising a crispr nuclease and uses thereof

Publications (1)

Publication Number Publication Date
CN117813379A true CN117813379A (zh) 2024-04-02

Family

ID=90433492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280050146.XA Pending CN117813379A (zh) 2021-06-01 2022-06-01 包括crispr核酸酶的基因编辑系统和其用途

Country Status (1)

Country Link
CN (1) CN117813379A (zh)

Similar Documents

Publication Publication Date Title
US11560555B2 (en) Engineered proteins
CN115698278A (zh) 包含Cas12i2变体多肽的组合物及其用途
US20230203539A1 (en) Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof
US20230287456A1 (en) Compositions comprising a cas12i polypeptide and uses thereof
US20230407343A1 (en) Compositions comprising an rna guide targeting pdcd1 and uses thereof
CN117813379A (zh) 包括crispr核酸酶的基因编辑系统和其用途
US20240102007A1 (en) Gene editing systems comprising a crispr nuclease and uses thereof
US11939607B2 (en) Gene editing systems comprising an RNA guide targeting lactate dehydrogenase a (LDHA) and uses thereof
US11821012B2 (en) Gene editing systems comprising an RNA guide targeting hydroxyacid oxidase 1 (HAO1) and uses thereof
US20230193243A1 (en) Compositions comprising a cas12i2 polypeptide and uses thereof
TW202334421A (zh) 包含靶向ciita之rna引導之組合物及其用途
CN117813382A (zh) 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途
JP2023548588A (ja) Tracを標的とするrnaガイドを含む組成物及びその使用
KR20230093328A (ko) B2m을 표적화하는 rna 가이드를 포함하는 조성물 및 이의 용도
JP2023549080A (ja) Bcl11aを標的とするrnaガイドを含む組成物及びその使用
CN116648505A (zh) 包含靶向b2m的rna指导物的组合物及其用途
WO2023122433A1 (en) Gene editing systems targeting hydroxyacid oxidase 1 (hao1) and lactate dehydrogenase a (ldha)
WO2024118747A1 (en) Reverse transcriptase-mediated genetic editing of transthyretin (ttr) and uses thereof
WO2023018856A1 (en) Gene editing systems comprising an rna guide targeting polypyrimidine tract binding protein 1 (ptbp1) and uses thereof
CA3189662A1 (en) Compositions comprising a nuclease and uses thereof
CN117120607A (zh) 工程化2类v型crispr系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination