CN113906134A

CN113906134A - Tau蛋白病模型

Info

Publication number: CN113906134A
Application number: CN202080039253.3A
Authority: CN
Inventors: 约翰·麦克沃特; 阿里吉特·博米克; 马林·普里塞特; 马修·高斯; 马蒂厄·德科洛; 大卫·弗伦杜威; 布莱恩·扎姆布罗维兹; 克劳迪娅·拉乔皮
Original assignee: Regeneron Pharmaceuticals Inc
Current assignee: Regeneron Pharmaceuticals Inc
Priority date: 2019-06-14
Filing date: 2020-06-12
Publication date: 2022-01-07
Also published as: JP2022536606A; US20210009949A1; AU2020290509A1; CA3137765A1; EP3813522A1; US11845957B2; US20240076613A1; WO2020252340A1; KR20220024053A

Abstract

BANF1、PPP2CA和ANKLE2被认为是当被破坏时促进tau聚集的基因。提供了改进的tau蛋白病模型，如在BANF1和/或PPP2CA和/或ANKLE2中具有突变或抑制BANF1和/或PPP2CA和/或ANKLE2的表达的细胞、组织或动物。还提供了使用此类改进的tau蛋白病模型来评估用于治疗tau蛋白病的治疗剂候选物的方法、制备所述改进的tau蛋白病模型的方法以及加速或加剧tau蛋白病模型中的tau聚集的方法。

Description

TAU蛋白病模型

相关申请的交叉引用

本申请要求于2019年6月14日提交的美国申请第62/861,553号的权益，所述美国申请出于所有目的通过引用整体并入本文。

序列表的引用通过EFS WEB作为文本文件提交

写入文件548673SEQLIST.txt中的序列表为203千字节，创建于2020年6月12日，并且特此通过引用并入。

背景技术

如tau等蛋白质的异常聚集或纤维化是许多疾病的定义性特征，所述疾病值得注意地包含多种神经变性疾病，如阿尔茨海默氏病(Alzheimer's disease，AD)、额颞痴呆(FTD)等。在许多这些疾病中，某些蛋白质纤维化成不溶性聚集体不仅是疾病的标志，而且还被认为是神经毒性的致病因素。此外，这些疾病的特征是聚集病理学按照刻板模式通过中枢神经系统传播，这一过程与疾病进展相关。因此，鉴定修饰异常蛋白质聚集过程或聚集体细胞间增殖过程的基因和基因途径对于更好地理解神经变性疾病的病因以及制定治疗干预策略方面具有重要价值。

发明内容

本文提供了非人动物、动物组织和动物细胞群，所述非人动物、动物组织和动物细胞群是改进的tau蛋白病模型，以及制备和使用此类模型的方法。此类改进的tau蛋白病模型可以具有BANF1、PPP2CA和ANKLE2中的一种或多种或全部中的分别降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的基因修饰，和/或可以包括降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部在一个或多个细胞中的表达的一种或多种药剂。一些此类改进的tau蛋白病模型还可以包括微管相关蛋白tau编码序列(例如，内源性或外源性)。一些此类改进的tau蛋白病模型还可以包括外源性微管相关蛋白tau编码序列(例如，外源性人微管相关蛋白tau编码序列)。可替代地，一些此类改进的tau蛋白病模型可以包括tau编码序列(内源性或外源性)，其编码包括tau蛋白病相关突变或tau致病突变的tau蛋白。

一方面，提供了一种非人动物、动物组织或动物细胞群，其包括：(a)一个或多个细胞中的微管相关蛋白tau编码序列；以及(b)(i)BANF1、PPP2CA和ANKLE2中的一种或多种或全部中的分别降低BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部在所述一个或多个细胞中的表达的基因修饰；和/或(ii)降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部在所述一个或多个细胞中的表达的一种或多种药剂。任选地，所述微管相关蛋白tau编码序列是人微管相关蛋白tau编码序列。任选地，所述微管相关蛋白tau编码序列是外源性人微管相关蛋白tau编码序列。一方面，提供了一种非人动物、动物组织或动物细胞群，其包括：(a)一个或多个细胞中的外源性人微管相关蛋白tau编码序列；以及(b)(i)BANF1、PPP2CA和ANKLE2中的一种或多种或全部中的分别降低BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部在所述一个或多个细胞中的表达的基因修饰；和/或(ii)降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部在所述一个或多个细胞中的表达的一种或多种药剂。任选地，所述一个或多个细胞是神经元细胞。

在一些此类非人动物、动物组织或动物细胞群中，所述外源性人微管相关蛋白tau编码序列是经基因组整合的。在一些此类非人动物、动物组织或动物细胞群中，所述外源性人微管相关蛋白tau编码序列包括互补DNA(cDNA)序列。在一些此类非人动物、动物组织或动物细胞群中，所述外源性人微管相关蛋白tau编码序列针对在所述非人动物、所述动物组织或所述动物细胞群中的表达进行了密码子优化。

在一些此类非人动物、动物组织或动物细胞群中，所述外源性人微管相关蛋白tau编码序列与异源启动子可操作地连接。任选地，所述异源启动子是小鼠朊病毒蛋白启动子。任选地，所述异源启动子是神经元特异性启动子。任选地，所述神经元特异性启动子是突触蛋白-1启动子。

在一些此类非人动物、动物组织或动物细胞群中，所述微管相关蛋白tau包括tau蛋白病相关突变。在一些此类非人动物、动物组织或动物细胞群中，所述tau蛋白病相关突变包括P301S突变。任选地，所述微管相关蛋白tau包括SEQ ID NO:98中所示的序列。在一些此类非人动物、动物组织或动物细胞群中，所述tau蛋白病变相关突变包括A152T/P301L/S320F三重突变。任选地，所述微管相关蛋白tau编码序列包括SEQ ID NO:83中所示的序列或所述微管相关蛋白tau包括SEQ ID NO:84中所示的序列。

在一些此类非人动物、动物组织或动物细胞群中，所述外源性人微管相关蛋白tau包括tau蛋白病相关突变。在一些此类非人动物、动物组织或动物细胞群中，所述tau蛋白病相关突变包括P301S突变。任选地，所述外源性人微管相关蛋白tau包括SEQ ID NO:98中所示的序列。在一些此类非人动物、动物组织或动物细胞群中，所述tau蛋白病变相关突变包括A152T/P301L/S320F三重突变。任选地，所述外源性人微管相关蛋白tau编码序列包括SEQID NO:83中所示的序列或所述外源性人微管相关蛋白tau包括SEQ ID NO:84中所示的序列。

在一些此类非人动物、动物组织或动物细胞群中，所述非人动物、所述动物组织或所述动物细胞群包括BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部中的分别降低BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部在所述一个或多个细胞中的表达的所述基因修饰。在一些此类非人动物、动物组织或动物细胞群中，所述非人动物、所述动物组织或所述动物细胞群包括降低BANF1、Ppp2ca和ANKLE2中的所述一种或多种或全部在所述一个或多个细胞中的表达的所述一种或多种药剂。

在一些此类非人动物、动物组织或动物细胞群中，所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的核酸酶药剂或编码所述核酸酶药剂的核酸。在一些此类非人动物、动物组织或动物细胞群中，所述核酸酶药剂是锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)或成簇规律间隔短回文重复序列(CRISPR)相关(Cas)蛋白和向导RNA。任选地，所述核酸酶药剂是所述Cas蛋白和所述向导RNA。任选地，所述Cas蛋白是Cas9蛋白。任选地，所述Cas蛋白是有催化活性的Cas蛋白。任选地，所述Cas蛋白是与转录阻遏因子结构域融合的无催化活性的Cas蛋白，任选地其中所述转录阻遏因子结构域是Krüppel相关盒(KRAB)结构域。在一些此类非人动物、动物组织或动物细胞群中，所述向导RNA靶向小鼠Banf1并且包括SEQ ID NO:44-46中所示的序列中的任何序列或所述向导RNA靶向人BANF1并且包括SEQ ID NO:27-30中所示的序列中的任何序列。在一些此类非人动物、动物组织或动物细胞群中，所述向导RNA靶向小鼠Ppp2ca并且包括SEQ ID NO:47-49中所示的序列中的任何序列或所述向导RNA靶向人PPP2CA并且包括SEQ ID NO:31-32中所示的序列中的任何序列。在一些此类非人动物、动物组织或动物细胞群中，所述向导RNA靶向小鼠Ankle2并且包括SEQ ID NO:50-52中所示的序列中的任何序列或所述向导RNA靶向人ANKLE2并且包括SEQ ID NO:38中所示的序列。

在一些此类非人动物、动物组织或动物细胞群中，所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的转录阻遏因子或编码所述转录阻遏因子的核酸。任选地，所述转录阻遏因子包括与转录阻遏因子结构域融合的无催化活性的Cas蛋白(例如，Cas9蛋白)，任选地其中所述转录阻遏因子结构域是Krüppel相关盒(KRAB)结构域。在一些此类非人动物、动物组织或动物细胞群中，所述向导RNA靶向小鼠Banf1并且包括SEQ ID NO:44-46中所示的序列中的任何序列或所述向导RNA靶向人BANF1并且包括SEQ ID NO:27-30中所示的序列中的任何序列。在一些此类非人动物、动物组织或动物细胞群中，所述向导RNA靶向小鼠Ppp2ca并且包括SEQ ID NO:47-49中所示的序列中的任何序列或所述向导RNA靶向人PPP2CA并且包括SEQ ID NO:31-32中所示的序列中的任何序列。在一些此类非人动物、动物组织或动物细胞群中，所述向导RNA靶向小鼠Ankle2并且包括SEQ ID NO:50-52中所示的序列中的任何序列或所述向导RNA靶向人ANKLE2并且包括SEQ ID NO:38中所示的序列。

在一些此类非人动物、动物组织或动物细胞群中，所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的反义寡核苷酸、反义RNA、小干扰RNA(siRNA)或短发夹RNA(shRNA)。在一些此类非人动物、动物组织或动物细胞群中，所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的反义寡核苷酸或RNAi药剂或编码所述反义寡核苷酸或所述RNAi药剂的核酸。任选地，所述反义寡核苷酸或RNAi药剂包括SEQ ID NO:105-324中任一个中所示的序列或其修饰形式。任选地，所述反义寡核苷酸或RNAi药剂包括以下中任一个中所示的序列或其修饰形式：SEQ ID NO:105、106、110-113、115、120-122、124、125、130、133、136、137、150、152、153、155、158-160、162、165、166、169、171-173、175、177、181-184、187、194、197、211、213、215、216、220-223、225、230-232、234、235、240、243、246、247、260、262、263、265、268-270、272、275、276、279、281-283、285、287、291-294、297、304、307、321和323。任选地，所述反义寡核苷酸或RNAi药剂包括一个或多个硫代磷酸酯键和/或一个或多个2'-甲氧基乙基修饰的碱基。任选地，所述反义寡核苷酸是包括以下的5-10-5缺口体：硫代磷酸酯主链、由2'-甲氧基乙基修饰的碱基构成的5'翼、DNA的中央10-核苷酸核心和由2'-甲氧基乙基修饰的碱基构成的3'翼。

在一些此类非人动物、动物组织或动物细胞群中，相对于不包括BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部中的所述基因修饰或不包括降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂的非人动物、动物组织或动物细胞群，所述非人动物、所述动物组织或所述动物细胞群的tau蛋白病的至少一种体征或症状增加。任选地，所述至少一种体征或症状包括tau过度磷酸化或tau聚集。任选地，所述至少一种体征或症状包括tau过度磷酸化和tau聚集。任选地，所述至少一种症状的体征包括：细胞分级分离后，不溶性级分中的tau和/或磷酸化tau(phospho-tau)增加；神经元的体树突状区室(somatodendritic compartment)中的磷酸化tau增加；神经元的核周区中的磷酸化tau增加；神经元中的核孔复合物蛋白Nup98-Nup96(Nup98)核质比降低；神经元中的GTP结合核蛋白Ran(Ran)核质比降低；神经元中的Ran GTP酶活化蛋白1(RanGAP1)核质比降低；或其任何组合。

在一些此类动物细胞群中，所述细胞在体内。在一些此类动物细胞群中，所述细胞在体外。在一些此类动物细胞群中，所述细胞是人细胞。在一些此类动物细胞群中，所述细胞是啮齿动物细胞，任选地其中所述啮齿动物细胞是小鼠细胞或大鼠细胞。任选地，所述细胞是小鼠细胞。在一些此类动物细胞群中，所述细胞包括神经元细胞。任选地，所述神经元细胞包括源自人诱导性多能干细胞的神经元。任选地，所述神经元细胞包括源自小鼠胚胎干细胞的神经元。任选地，所述神经元细胞包括原代小鼠神经元。

在一些此类动物组织中，所述组织在体内。在一些此类动物组织中，所述组织是离体的。在一些此类动物组织中，所述动物是啮齿动物，任选地其中所述啮齿动物是小鼠或大鼠。任选地，所述动物是所述小鼠。在一些此类动物组织中，所述组织是神经系统组织。任选地，所述组织是脑片(例如，器官型脑片培养物)。

在一些此类非人动物中，所述非人动物是啮齿动物，任选地其中所述啮齿动物是小鼠或大鼠。任选地，所述非人动物是所述小鼠。任选地，所述小鼠是PS19转基因小鼠，所述PS19转基因小鼠进一步包括BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部中的分别降低BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部在所述一个或多个细胞中的表达的所述基因修饰；和/或进一步包括降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部在所述一个或多个细胞中的表达的所述一种或多种药剂。

另一方面，提供了用于评估用于使用任何上述非人动物、动物组织和动物细胞群来治疗tau蛋白病的治疗剂候选物的方法。一些此类方法包括：(a)向任何上述非人动物、动物组织和动物细胞群施用候选药剂；(b)进行一项或多项测定，以确定所述候选药剂是否对与所述tau蛋白病相关的一种或多种体征或症状具有影响；以及(c)将对与所述tau蛋白病相关的一种或多种体征或症状具有影响的所述候选药剂鉴定为治疗剂候选物。在一些此类方法中，所述一种或多种体征或症状包括tau过度磷酸化或tau聚集。任选地，所述一种或多种体征或症状包括tau过度磷酸化或tau聚集。在一些此类方法中，所述一种或多种体征或症状包括：细胞分级分离后，不溶性级分中的tau和/或磷酸化tau增加；神经元的体树突状区室中的磷酸化tau增加；神经元的核周区中的磷酸化tau增加；神经元中的核孔复合物蛋白Nup98-Nup96(Nup98)核质比降低；神经元中的GTP结合核蛋白Ran(Ran)核质比降低；神经元中的Ran GTP酶活化蛋白1(RanGAP1)核质比降低；或其组合。

在一些此类方法中，所述候选药剂是向所述非人动物施用的。在一些此类方法中，所述候选药剂是向所述动物组织离体施用的。在一些此类方法中，所述候选药剂是向所述动物细胞群外施用的。

另一方面，提供了制备任何上述非人动物、动物组织和动物细胞群的方法。一些此类方法包括：(a)将降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂引入到包括所述微管相关蛋白tau编码序列的非人动物、动物组织或动物细胞群中；以及(b)对所述非人动物、所述动物组织或所述动物细胞群进行筛选，以确认所述一种或多种药剂的存在。一些此类方法包括：(a)将降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂引入到包括所述外源性人微管相关蛋白tau编码序列的非人动物、动物组织或动物细胞群中；以及(b)对所述非人动物、所述动物组织或所述动物细胞群进行筛选，以确认所述一种或多种药剂的存在。一些此类方法包括：(a)将以下引入到非人动物、动物组织或动物细胞群中：(i)外源性人微管相关蛋白tau编码序列；以及(ii)降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂；以及(b)对所述非人动物、所述动物组织或所述动物细胞群进行筛选，以确认所述一种或多种药剂和所述外源性人微管相关蛋白tau编码序列的存在。任选地，所述外源性人微管相关蛋白tau编码序列是通过腺相关病毒、慢病毒或脂质纳米颗粒递送的。

在一些此类方法中，所述一种或多种药剂是通过腺相关病毒、慢病毒或脂质纳米颗粒递送的。在一些此类方法中，所述方法用于制备所述非人动物，并且所述一种或多种药剂是通过鞘内注射、颅内注射或脑室内注射向所述非人动物施用的。任选地，所述方法用于制备所述非人动物，并且所述一种或多种药剂是通过立体定位注射到脑或脑区域(例如，海马体)中来向所述非人动物施用的。任选地，所述方法用于制备所述非人动物，并且所述一种或多种药剂是通过立体定位注射到海马体中来向所述非人动物施用的。

另一方面，提供了用于加速或加剧tau蛋白病模型非人动物、tau蛋白病模型动物组织或tau蛋白病模型动物细胞群中的tau聚集的方法。一些此类方法包括将降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的一种或多种药剂引入到所述tau蛋白病模型非人动物、所述tau蛋白病模型动物组织或所述tau蛋白病模型动物细胞群中。

在一些此类方法中，所述tau蛋白病模型非人动物、所述tau蛋白病模型动物组织或所述tau蛋白病模型动物细胞群包括外源性人微管相关蛋白tau编码序列。在一些此类方法中，所述外源性人微管相关蛋白tau编码序列是经基因组整合的。在一些此类方法中，所述外源性人微管相关蛋白tau编码序列包括互补DNA(cDNA)序列。在一些此类方法中，所述外源性人微管相关蛋白tau编码序列针对在所述非人动物、所述动物组织或所述动物细胞群中的表达进行了密码子优化。

在一些此类方法中，所述外源性人微管相关蛋白tau编码序列与异源启动子可操作地连接。任选地，所述异源启动子是小鼠朊病毒蛋白启动子。任选地，所述异源启动子是神经元特异性启动子。任选地，所述神经元特异性启动子是突触蛋白-1启动子。

在一些此类方法中，所述外源性人微管相关蛋白tau包括tau蛋白病相关突变。在一些此类方法中，所述tau蛋白病相关突变包括P301S突变。任选地，所述外源性人微管相关蛋白tau包括SEQ ID NO:98中所示的序列。在一些此类方法中，所述tau蛋白病相关突变包括A152T/P301L/S320F三重突变。任选地，所述外源性人微管相关蛋白tau编码序列包括SEQID NO:83中所示的序列或所述外源性人微管相关蛋白tau包括SEQ ID NO:84中所示的序列。

在一些此类方法中，所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的核酸酶药剂或编码所述核酸酶药剂的核酸。在一些此类方法中，所述核酸酶药剂是锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)或成簇规律间隔短回文重复序列(CRISPR)相关(Cas)蛋白和向导RNA。任选地，所述核酸酶药剂是所述Cas蛋白和所述向导RNA。任选地，所述Cas蛋白是Cas9蛋白。任选地，所述Cas蛋白是有催化活性的Cas蛋白。任选地，所述Cas蛋白是与转录阻遏因子结构域融合的无催化活性的Cas蛋白，任选地其中所述转录阻遏因子结构域是Krüppel相关盒(KRAB)结构域。在一些此类方法中，所述向导RNA靶向小鼠Banf1并且包括SEQ ID NO:44-46中所示的序列中的任何序列或所述向导RNA靶向人BANF1并且包括SEQ ID NO:27-30中所示的序列中的任何序列。在一些此类方法中，所述向导RNA靶向小鼠Ppp2ca并且包括SEQ ID NO:47-49中所示的序列中的任何序列或所述向导RNA靶向人PPP2CA并且包括SEQ ID NO:31-32中所示的序列中的任何序列。在一些此类方法中，所述向导RNA靶向小鼠Ankle2并且包括SEQ ID NO:50-52中所示的序列中的任何序列或所述向导RNA靶向人ANKLE2并且包括SEQ ID NO:38中所示的序列。

在一些此类方法中，所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的转录阻遏因子或编码所述转录阻遏因子的核酸。任选地，所述转录阻遏因子包括与转录阻遏因子结构域融合的无催化活性的Cas蛋白(例如，Cas9蛋白)，任选地其中所述转录阻遏因子结构域是Krüppel相关盒(KRAB)结构域。在一些此类非人动物、动物组织或动物细胞群中，所述向导RNA靶向小鼠Banf1并且包括SEQ ID NO:44-46中所示的序列中的任何序列或所述向导RNA靶向人BANF1并且包括SEQ ID NO:27-30中所示的序列中的任何序列。在一些此类非人动物、动物组织或动物细胞群中，所述向导RNA靶向小鼠Ppp2ca并且包括SEQ ID NO:47-49中所示的序列中的任何序列或所述向导RNA靶向人PPP2CA并且包括SEQ ID NO:31-32中所示的序列中的任何序列。在一些此类非人动物、动物组织或动物细胞群中，所述向导RNA靶向小鼠Ankle2并且包括SEQ ID NO:50-52中所示的序列中的任何序列或所述向导RNA靶向人ANKLE2并且包括SEQ ID NO:38中所示的序列。

在一些此类方法中，所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的反义寡核苷酸、反义RNA、小干扰RNA(siRNA)或短发夹RNA(shRNA)。在一些此类方法中，所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的反义寡核苷酸或RNAi药剂或编码所述反义寡核苷酸或所述RNAi药剂的核酸。任选地，所述反义寡核苷酸或RNAi药剂包括SEQ ID NO:105-324中任一个中所示的序列或其修饰形式。任选地，所述反义寡核苷酸或RNAi药剂包括以下中任一个中所示的序列或其修饰形式：SEQ ID NO:105、106、110-113、115、120-122、124、125、130、133、136、137、150、152、153、155、158-160、162、165、166、169、171-173、175、177、181-184、187、194、197、211、213、215、216、220-223、225、230-232、234、235、240、243、246、247、260、262、263、265、268-270、272、275、276、279、281-283、285、287、291-294、297、304、307、321和323。任选地，所述反义寡核苷酸或RNAi药剂包括一个或多个硫代磷酸酯键和/或一个或多个2'-甲氧基乙基修饰的碱基。任选地，所述反义寡核苷酸是包括以下的5-10-5缺口体：硫代磷酸酯主链、由2'-甲氧基乙基修饰的碱基构成的5'翼、DNA的中央10-核苷酸核心和由2'-甲氧基乙基修饰的碱基构成的3'翼。

在一些此类方法中，所述一种或多种药剂是通过腺相关病毒、慢病毒或脂质纳米颗粒递送的。在一些此类方法中，所述一种或多种药剂是通过鞘内注射、颅内注射或脑室内注射向所述非人动物施用的，任选地其中所述一种或多种药剂是通过立体定位注射到脑或脑区域(例如，海马体)中向所述非人动物施用的，并且任选地其中所述一种或多种药剂是通过立体定位注射到海马体中向所述非人动物施用的。

在一些此类方法中，相对于不包括降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂的非人动物、动物组织或动物细胞群，所述非人动物、所述动物组织或所述动物细胞群的tau蛋白病的至少一种体征或症状增加。任选地，所述至少一种体征或症状包括tau过度磷酸化或tau聚集。任选地，所述至少一种体征或症状包括tau过度磷酸化和tau聚集。任选地，所述至少一种体征或症状包括：细胞分级分离后，不溶性级分中的tau和/或磷酸化tau增加；神经元的体树突状区室中的磷酸化tau增加；神经元的核周区中的磷酸化tau增加；神经元中的核孔复合物蛋白Nup98-Nup96(Nup98)核质比降低；神经元中的GTP结合核蛋白Ran(Ran)核质比降低；神经元中的Ran GTP酶活化蛋白1(RanGAP1)核质比降低；或其任何组合。

在一些此类方法中，所述细胞在体内。在一些此类方法中，所述细胞在体外。在一些此类方法中，所述细胞是人细胞。在一些此类方法中，所述细胞是啮齿动物细胞，任选地其中所述啮齿动物细胞是小鼠细胞或大鼠细胞。任选地，所述细胞是小鼠细胞。在一些此类方法中，所述细胞包括神经元细胞。任选地，所述神经元细胞包括源自人诱导性多能干细胞的神经元。任选地，所述神经元细胞包括源自小鼠胚胎干细胞的神经元。任选地，所述神经元细胞包括原代小鼠神经元。

在一些此类方法中，所述组织在体内。在一些此类方法中，所述组织是离体的。在一些此类方法中，所述动物组织是啮齿动物组织，任选地其中所述啮齿动物是小鼠或大鼠。任选地，所述动物组织是小鼠组织。在一些此类方法中，所述组织是神经系统组织。任选地，所述组织是脑片(例如，器官型脑片培养物)。

在一些此类方法中，所述非人动物是啮齿动物，任选地其中所述啮齿动物是小鼠或大鼠。任选地，所述非人动物是所述小鼠。任选地，所述小鼠是PS19转基因小鼠，所述PS19转基因小鼠进一步包括降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂。

另一方面，提供了一种非人动物基因组，其包括外源性人微管相关蛋白tau编码序列和Banf1、Ppp2ca和Ankle2中的一种或多种或全部中的分别降低Banf1、Ppp2ca和Ankle2的一种或多种或全部的表达的基因修饰。

另一方面，提供了一种降低或抑制BANF1、PPP2CA或Ankle2在细胞中的表达的药剂或编码所述药剂的核酸，任选地其中所述药剂是靶向BANF1、PPP2CA或ANKLE2的核酸酶药剂或反义寡核苷酸、反义RNA、小干扰RNA(siRNA)或短发夹RNA(shRNA)。任选地，所述药剂是靶向BANF1、PPP2CA或ANKLE2的核酸酶药剂或反义寡核苷酸或RNAi药剂。任选地，所述反义寡核苷酸或RNAi药剂包括SEQ ID NO:105-324中任一个中所示的序列或其修饰形式。任选地，所述反义寡核苷酸或RNAi药剂包括以下中任一个中所示的序列或其修饰形式：SEQ ID NO:105、106、110-113、115、120-122、124、125、130、133、136、137、150、152、153、155、158-160、162、165、166、169、171-173、175、177、181-184、187、194、197、211、213、215、216、220-223、225、230-232、234、235、240、243、246、247、260、262、263、265、268-270、272、275、276、279、281-283、285、287、291-294、297、304、307、321和323。任选地，所述反义寡核苷酸或RNAi药剂包括一个或多个硫代磷酸酯键和/或一个或多个2'-甲氧基乙基修饰的碱基。任选地，所述反义寡核苷酸是包括以下的5-10-5缺口体：硫代磷酸酯主链、由2'-甲氧基乙基修饰的碱基构成的5'翼、DNA的中央10-核苷酸核心和由2'-甲氧基乙基修饰的碱基构成的3'翼。

附图说明

图1(未按比例绘制)示出了tau同种型2N4R的示意图。tau生物传感器细胞系仅包含tau4RD-YFP和tau4RD-CFP作为转基因，而不是完整的2N4R。

图2示出了如何通过荧光共振能量转移(FRET)在tau生物传感器细胞系中监测聚集体形成的示意图。tau^4RD-CFP蛋白被紫光激发并发射蓝光。tau^4RD-YFP融合蛋白被蓝光激发并发射黄光。如果不存在聚集，那么由紫光进行的激发不会导致FRET。如果存在tau聚集，那么由紫光进行的激发将导致FRET和黄光发射。

图3A示出了用慢病毒Cas9表达构建体转导的tau^4RD-CFP/tau^4RD-YFP(TCY)生物传感器细胞克隆中相对于克隆Cas9H1的相对Cas9 mRNA表达，所述克隆是先前分离的Cas9表达TCY克隆表现不佳的对照。

图3B示出了分别在用靶向PERK和SNCA的sgRNA转导之后三天和七天，Cas9 TCY克隆中PERK基因座和SNCA基因座处的切割效率。

图4示出了用于使用全基因组CRISPR/Cas9 sgRNA文库破坏Cas9 TCY生物传感器细胞中的靶基因的策略的示意图。

图5是示出了当用tau^4RD原纤维接种tau^4RD-YFP细胞时，含有稳定传播的tau聚集体的tau^4RD-YFP Agg[+]亚克隆的衍生的示意图。还示出了具有tau聚集体的亚克隆的荧光显微镜图像。

图6是示出了来自tau^4RD-YFP Agg[+]亚克隆的在汇合细胞上收集三天后的条件培养基可以提供tau聚集活性的来源，而来自tau^4RD-YFP Agg[-]亚克隆的培养基那么不能的示意图。将条件培养基作为75％条件培养基和25％新鲜培养基施加于接受者细胞。每个都示出了荧光激活细胞分选(FACS)分析图像。x轴示出了CFP(405nm激光激发)，并且y轴示出了FRET(来自CFP发射的激发)。右上象限是FRET[+]，右下象限是CFP[+]，并且左下象限是双阴性。

图7是示出了用于鉴定促进tau聚集的修饰基因的全基因组CRISPR核酸酶(CRISPRn)筛选策略的示意图。

图8是示出了用于使用全基因组CRISPRn筛选进行下一代测序(NGS)分析的丰度和富集概念的示意图。

图9示出了二次筛选在全基因组筛选促进tau聚集的修饰基因中鉴定的靶基因1-14的示意图。

图10是示出了在用靶向靶基因1-14的sgRNA的慢病毒表达构建体转导的Cas9 TCY生物传感器细胞中tau聚集条件培养基诱导FRET的图。二次筛选证实，靶基因2(BANF1)和8(PPP2CA)调节细胞对tau接种/聚集的敏感性。

图11示出了用BANF1 gRNA1、PPP2CA gRNA5、非靶向gRNA和无gRNA的慢病毒表达构建体转导的Cas9 TCY生物传感器细胞的FACS分析图像。细胞在条件培养基或新鲜培养基中培养。x轴示出了CFP(405nm激光激发)，并且y轴示出了FRET(来自CFP发射的激发)。右上象限是FRET[+]，右下象限是CFP[+]，并且左下象限是双阴性。响应于tau聚集体条件培养基而不是新鲜培养基，BANF1或PPP2CA的破坏会增加tau聚集体的形成。

图12示出了在用靶向BANF1和PPP2CA的sgRNA的慢病毒表达构建体转导的Cas9TCY生物传感器细胞中进行二次筛选(包含mRNA表达分析、蛋白质表达分析和FRET分析)的示意图。两种sgRNA用于对抗BANF1(g1和g3)，一种sgRNA用于对抗PPP2CA(g5)，并且非靶向sgRNA(g3)用作非靶向对照。

图13示出了如在用慢病毒sgRNA表达构建体转导后第6天通过qRT-PCR评估的，BANF1和PPP2CA在Cas9 TCY生物传感器细胞中的相对表达。

图14示出了如在用慢病毒sgRNA表达构建体转导后第13天通过蛋白质印迹评估的，BANF1蛋白和PPP2CA蛋白在Cas9 TCY生物传感器细胞中的表达。

图15示出了在用慢病毒sgRNA表达构建体转导后第10天通过Cas9 TCY生物传感器细胞中的FRET[+]细胞百分比测量的tau聚集。没有使用脂质体。

图16示出了如通过蛋白质印迹评估的，BANF1和PPP2CA在敲低Cas9 TCY细胞克隆中的表达。

图17示出了如通过蛋白质印迹评估的，tau在敲低Cas9 TCY细胞克隆中的表达以及如通过蛋白质印迹评估的那些克隆中位置S262和S356处的tau磷酸化。

图18示出了如通过FRET评估的在BANF1和PPP2CA敲低Cas9 TCY细胞克隆中的tau聚集。

图19示出了如通过FRET评估的在BANF1、VRK1、CDK5、PPP2CA、PPP2R2A、ANKLE2、EMD、LEMD2、LEMD3/MAN1和TMPO/LAP2敲低Cas9 TCY细胞克隆中的tau聚集。

图20示出了在用靶向ANKLE2、EMD或VRK1的慢病毒sgRNA表达构建体转导后，通过Cas9 TCY生物传感器细胞中的FRET[+]细胞百分比测量的tau聚集。

图21A示出了如在用慢病毒sgRNA表达构建体转导后通过qRT-PCR评估的，Banf1在Cas9准备好的小鼠胚胎干细胞中的相对表达。

图21B示出了如在用慢病毒sgRNA表达构建体转导后通过qRT-PCR评估的，Ppp2ca在Cas9准备好的小鼠胚胎干细胞中的相对表达。

图22A示出了如在用慢病毒sgRNA表达构建体(包含Cas9的一体式(AIO)构建体或单独的sgRNA)转导后通过qRT-PCR评估的，Ankle2在F1H4小鼠胚胎干细胞中的相对表达。

图22B示出了如在用慢病毒sgRNA表达构建体(包含Cas9的一体式(AIO)构建体或单独的sgRNA)转导后通过qRT-PCR评估的，Banf1在F1H4小鼠胚胎干细胞中的相对表达。

图22C示出了如在用慢病毒sgRNA表达构建体(包含Cas9的一体式(AIO)构建体或单独的sgRNA)转导后通过qRT-PCR评估的，Ppp2ca在F1H4小鼠胚胎干细胞中的相对表达。

图23示出了BANF1/PPP2CA相互作用体。

图24A示出了tau-CFP/tau-YFP(TCY)dCas-KRAB克隆(BANF1或ANKLE2的靶向敲低或非靶向的)中的ANKLE2相对表达。图24B示出了tau-CFP/tau-YFP(TCY)dCas-KRAB克隆(BANF1或ANKLE2的靶向敲低或非靶向的)中的BANF1相对表达。

图25示出了如通过用条件培养基tau-YFP Agg[+]三天的tau-CFP/tau-YFP(TCY)dCas-KRAB克隆(BANF1或ANKLE2的靶向敲低)中的FRET[+]细胞百分比测量的tau聚集。

图26示出了ΔBANF1和ΔANKLE2克隆的细胞分级分离能够在用tau-YFP Agg[+]细胞裂解物两天后检测不溶性级分中的tau和磷酸tau(丝氨酸356)。

图27示出了通过RNA-seq分析(BANF1KD对非靶向对照、BANF1KD对亲本、ANKLE2KD对非靶向对照以及ANKLE2KD对亲本)在四个比较中显著基因的基因列表大小(变化倍数大于或等于1.5)。

图28示出了用于测试cDNA互补以拯救ΔBANF1和ΔANKLE2敲低细胞中增加的tau聚集的示意图。

图29示出了在用tau-YFP Agg[+]细胞裂解物(2μg)2天的tau-CFP/tau-YFP dCas-KRABΔBANF1和ΔANKLE2敲低细胞的cDNA互补后通过FRET[+]细胞百分比测量的tau聚集。No_KRAB_gRNA是指没有施用gRNA的阴性对照样品。

图30A示出了非靶向小鼠原代皮质神经元中以及ΔBANF1和ΔANKLE2突变皮质神经元中的DAPI+细胞核的计数。图30B示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中如通过荧光强度所测量的体细胞中的MAP2强度。使用双尾未配对学生t测试(ns＝不显著；误差条表示s.e.m.)。

图31A示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中体细胞中的磷酸化tau S356强度(如通过荧光强度测量的)。图31B示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中的核周磷酸化tau S356强度(如通过荧光强度测量的)。使用双尾未配对学生t测试(***＝p<0.004，****＝p<0.0001；误差条表示s.e.m.)。

图32A示出了非靶向小鼠原代皮质神经元中以及ΔBANF1和ΔANKLE2突变皮质神经元中的DAPI+细胞核的计数。图32B示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中如通过荧光强度所测量的体细胞中的MAP2强度。图32C示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中如通过荧光强度所测量的体细胞中的总tau强度。使用双尾未配对学生t测试(ns＝不显著；误差条表示s.e.m.)。

图33A示出了非靶向小鼠原代皮质神经元中以及ΔBANF1和ΔANKLE2和ΔPPP2CA突变皮质神经元中的细胞核的计数。图33B示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2和ΔPPP2CA突变皮质神经元中如通过荧光强度所测量的体细胞中的MAP2强度。图33C示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2和ΔPPP2CA突变皮质神经元中如通过荧光强度测量的体细胞中的磷酸化tau AT8(S202，T205)强度。图33D示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2和ΔPPP2CA突变皮质神经元中如通过荧光强度测量的核周结构域中的磷酸化tau AT8(S202，T205)强度。图33E示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2和ΔPPP2CA突变皮质神经元中如通过荧光强度所测量的体细胞中的总tau强度。

图34A示出了非靶向小鼠原代皮质神经元中以及ΔBANF1和ΔANKLE2突变皮质神经元中的DAPI+细胞核的计数。图34B示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中的Nup98核/细胞质比率。图34C示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中体细胞中的磷酸化tau S356强度(如通过荧光强度测量的)。图34D示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中的核周磷酸化tau S356强度(如通过荧光强度测量的)。使用双尾未配对学生t测试(*＝p<0.05；误差条表示s.e.m.)。

图35A示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中的RanGAP1核/细胞质比率。图35B示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中的总RanGAP1水平。图35C示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中的Ran核/细胞质比率。图35D示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中的总Ran水平。使用双尾未配对学生t测试(**＝p<0.002-ns，不显著；误差条表示s.e.m.)。

图36A示出了当添加tau-cDNA 3MUT时，在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中的DAPI+细胞核的计数。图36B示出了当添加tau-cDNA3MUT时，在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中体细胞中的磷酸化tau S356强度(如通过荧光强度测量的)。图36C示出了当添加tau-cDNA3MUT时，在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中的核周磷酸化tau S356强度(如通过荧光强度测量的)。图36D示出了当添加tau-cDNA 3MUT时，在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中体细胞中的MAP2强度(如通过荧光强度测量的)。使用双尾未配对学生t测试(*＝p<0.05，**＝p<0.002-ns，不显著；误差条表示s.e.m.)。

图37A示出了当添加tau-cDNA 3MUT时，在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中的DAPI+细胞核的计数。图37B示出了当添加tau-cDNA3MUT时，在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中体细胞中的总tau强度(如通过荧光强度测量的)。图37C示出了当添加tau-cDNA 3MUT时，在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔANKLE2突变皮质神经元中体细胞中的MAP2强度(如通过荧光强度测量的)。使用双尾未配对学生t测试(ns＝不显著；误差条表示s.e.m.)。

图38A示出了非靶向小鼠原代皮质神经元中以及ΔBANF1和ΔPPP2CA突变皮质神经元中的DAPI+细胞核的计数。图38B示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔPPP2CA突变皮质神经元中如通过荧光强度测量的核周结构域中的磷酸化tau(S356)强度。图38C示出了磷酸化tau(S356)强度与ΔPPP2CA突变皮质神经元中体细胞中的错误折叠的tau的增加的检测的相关性。图38D示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔPPP2CA突变皮质神经元中如通过荧光强度测量的细胞中的磷酸化tau(S356)强度。图38E在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔPPP2CA突变皮质神经元中细胞中的聚集体检测试剂(ADR)强度。图38F示出了磷酸化tau(S356)强度与ΔBANF1突变皮质神经元中体细胞中的错误折叠的tau的增加的检测的相关性。使用双尾未配对学生t测试(*＝p<0.05；**＝p<0.02；***＝p<0.004；误差条表示s.e.m.；皮尔逊相关性(Pearson correlation)(ρ)–R平方-双尾P值<0.05)。

图39A示出了非靶向小鼠原代皮质神经元中以及ΔBANF1和ΔPPP2CA突变皮质神经元中的DAPI+细胞核的计数。图39B示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔPPP2CA突变皮质神经元中如通过荧光强度测量的核周结构域中的磷酸化tauAT8(S202，T205)强度。图39C示出了磷酸化tau AT8(S202，T205)强度与ΔPPP2CA突变皮质神经元中体细胞中的错误折叠的tau的增加的检测的相关性。图39D示出了在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔPPP2CA突变皮质神经元中如通过荧光强度测量的体细胞中的磷酸化tau AT8(S202，T205)强度。图39E在非靶向小鼠原代皮质神经元中以及在ΔBANF1和ΔPPP2CA突变皮质神经元中体细胞中的聚集体检测试剂(ADR)强度。图39F示出了磷酸化tau AT8(S202，T205)强度与ΔBANF1突变皮质神经元中体细胞中的错误折叠的tau的增加的检测的相关性。使用双尾未配对学生t测试(*＝p<0.05；**＝p<0.02；***＝p<0.004；ns＝不显著；误差条表示s.e.m.；皮尔逊相关性(ρ)–R平方-双尾P值<0.05)。

图40示出了ASO设计的一般示意图，其中ASO被设计为具有硫代磷酸酯主链、在每个翼中使用的2'甲氧基乙基修饰的碱基(来自两个末端的5个核苷酸)以及未经修饰的DNA碱基的10个核苷酸核心的5-10-5缺口体。

图41A-41C示出了用ASO转染后72小时，在小鼠NSC34细胞中筛选mAnkle2 ASO的qPCR结果。将靶标的总mRNA的敲低与未经处理的细胞进行比较。图41A示出了在100nM ASO浓度下进行的初步筛选的结果(两个复制品；上虚线指示75％敲低)；图41B示出了在50nMASO浓度下进行的二次筛选的结果(两个复制品；最低虚线指示75％敲低)，并且图41C示出了在5nM ASO浓度下进行的二次筛选的结果(两个复制品；中间虚线指示25％敲低)。

图42A-42C示出了用ASO转染后72小时，在小鼠NSC34细胞中筛选mPpp2ca ASO的qPCR结果。将靶标的总mRNA的敲低与未经处理的细胞进行比较。图42A示出了在100nM ASO浓度下进行的初步筛选的结果(虚线指示75％敲低)，图42B示出了在50nM ASO浓度下进行的二次筛选的结果(三个复制品；较低虚线指示75％敲低)，并且图42C示出了在5nM ASO浓度下进行的二次筛选的结果(三个复制品；较低虚线指示40％敲低)。

图43示出了用100nM浓度的ASO转染后72小时，在小鼠NSC34细胞中筛选mBanf1ASO的qPCR结果(两个复制品)。将靶标的总mRNA的敲低与未经处理的细胞进行比较。虚线表示75％敲低。

定义

本文可互换使用的术语“蛋白质”、“多肽”、和“肽”包含任何长度的聚合形式的氨基酸，包含编码氨基酸和非编码氨基酸以及以化学方式或生物化学方式修饰的氨基酸或以化学方式或生物化学方式衍生的氨基酸。这些术语还包含已经修饰的聚合物，如具有经修饰的肽骨架的多肽。术语“结构域”是指具有特定功能或结构的蛋白质或多肽的任何部分。

蛋白质被视为具有“N端”和“C端”。术语“N端”涉及蛋白质或多肽的开始，其终止于具有游离胺基(-NH2)的氨基酸。术语“C端”是指氨基酸链(蛋白质或多肽)的末端，其终止于游离羧基(-COOH)。

本文可互换使用的术语“核酸”和“多核苷酸”包含任何长度的聚合形式的核苷酸，包含核糖核苷酸、脱氧核糖核苷酸、或其类似物或经过修饰的形式。所述核苷酸包含单链、双链和多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体、和包括嘌呤碱基、嘧啶碱基或其它天然的、以化学方式修饰的、以生物化学方式修饰的、非天然的或衍生的核苷酸碱基的聚合物。

核酸被视为具有“5'末端”和“3'末端”，因为以使得一个单核苷酸戊糖环的5'磷酸通过磷酸二酯键在一个方向上与其相邻的单核苷酸戊糖环的3'氧附着的方式使单核苷酸反应以形成寡核苷酸。如果寡核苷酸的5'磷酸不与单核苷酸戊糖环的3'氧相连，那么将寡核苷酸的端称为“5'末端”。如果寡核苷酸的3'氧不与另一个单核苷酸戊糖环的5'磷酸相连，那么将寡核苷酸的端称为“3'末端”。即使核酸序列处于更大的寡核苷酸的内部，所述核酸序列也可以被视为具有5'末端和3'末端。在线性或环状DNA分子中，离散元件被称为“下游”或3'元件的“上游”或5'。

术语“基因组整合的”是指已被引入到细胞中使得核苷酸序列整合到细胞的基因组中的核酸。可以使用任何方案用于将核酸稳定地掺入到细胞的基因组中。

术语“靶向载体”是指可以通过同源重组、非同源末端连接介导的连结或任何其它重组方式引入到细胞基因组中的靶位置的重组核酸。

术语“病毒载体”是指包含至少一种病毒来源元素并包含足以或允许包装成病毒载体颗粒的元素的重组核酸。载体和/或颗粒可以用于在体外、离体或在体内将DNA、RNA或其它核酸转移到细胞中的目的。许多形式的病毒载体是已知的。

关于细胞、组织(例如，脑片)、蛋白质和核酸的术语“分离的”包含相对于其它细菌、病毒、细胞或通常可能原位存在的其它组分而言相对纯化的细胞、组织(例如，脑片)、蛋白质和核酸，直至并包含细胞、组织(例如，脑片)、蛋白质和核酸的基本上纯的调配物。术语“分离的”还包含不具有天然存在的对应物、已经被化学合成并且因此基本上未被其它细胞、组织(例如，脑片)、蛋白质和核酸污染或者已经从其天然伴随的大多数其它组分(例如，细胞组分)(例如，其它细胞蛋白、多核苷酸或细胞组分)中分离或纯化的细胞、组织(例如，脑片)、蛋白质和核酸。

术语“野生型”包含具有在正常(与突变、患病、改变等相比)状态或情况下发现的结构和/或活性的实体。野生型基因和多肽通常以多种不同形式(例如，等位基因)存在。

术语“内源性序列”是指天然存在于细胞或生物体内的核酸序列。例如，细胞或生物体的内源性MAPT序列是指天然存在于细胞或生物体中的MAPT基因座处的天然MAPT序列。

“外源性”分子或序列包含通常不以所述形式存在于细胞中的分子或序列。正常存在包含关于细胞的特定发育阶段和环境条件的存在。外源性分子或序列例如可以包含细胞内的对应内源性序列的突变形式，如内源性序列的人源化形式，或可以包含与细胞内但呈不同形式(即，不在染色体内或在染色体中的不同位置或在不同染色体中，如随机插入到除了内源形MAPT基因座之外的基因组基因座中的人tau转基因)的内源性序列的序列。相比之下，内源性分子或序列包含在特定环境条件下在特定发育阶段在特定细胞中通常以所述形式存在的分子或序列。

当在核酸或蛋白质的上下文中使用时，术语“异源的”表示核酸或蛋白质包括在同一分子中并非天然地一起存在的至少两个区段。例如，当关于核酸的段或蛋白质的段使用时，术语“异源的”指示核酸或蛋白质包括在自然界中未发现彼此处于相同关系(例如，连接在一起)的两个或更多个子序列。举例来说，核酸载体的“异源”区域是在自然界中未发现与其它分子缔合的另一个核酸分子内或与其附着的核酸片段。例如，核酸载体的异源区域可以包含侧接有在自然界中未发现与编码序列缔合的序列的编码序列。同样地，蛋白质的“异源”区域是在自然界中未发现与其它肽分子缔合的另一个肽分子(例如，融合蛋白或具有标签的蛋白质)内或与其附着的氨基酸的片段。相似地，核酸或蛋白质可以包括异源标记或异源分泌或定位序列。

“密码子优化”利用密码子的简并性，如指定氨基酸的三碱基对密码子组合的多样性所展示的，并且通常包含通过用宿主细胞的基因中更频繁或最频繁使用的密码子置换天然序列的至少一个密码子同时维持天然氨基酸序列来修饰核酸序列以在特定宿主细胞中增强表达的过程。例如，可以修饰对tau蛋白进行编码的核酸以取代与天然存在的核酸序列相比在给定原核或真核细胞(包含细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞或任何其它宿主细胞)中具有更高使用频率的密码子。密码子使用表例如在“密码子使用数据库”处很容易获得。这些表可以通过多种方式进行修改。参见Nakamura等人(2000),《核酸研究(Nucleic Acids Res.)》28:292，所述文献出于所有目的通过引用整体并入本文。也可获得用于在特定宿主中表达的特定序列的密码子优化的计算机算法(参见例如，《基因伪造(Gene Forge)》)。

术语“基因座”是指基因(或显著序列)、DNA序列、多肽编码序列或生物体的基因组的染色体上的位置的特异性定位。例如，“MAPT基因座”可以指MAPT基因、MAPT DNA序列、微管相关蛋白tau编码序列或生物体的基因组的染色体上的已被鉴定为此类序列所在位置的MAPT位置的特异性定位。“MAPT基因座”可以包括MAPT基因的调控元件，包含例如增强子、启动子、5'和/或3'非翻译区(UTR)或其组合。

术语“基因”是指染色体中的DNA序列，所述染色体如果天然存在可以含有至少一个编码区和至少一个非编码区。染色体中编码产物(例如但不限于RNA产物和/或多肽产物)的DNA序列可以包含被非编码内含子中断的编码区和在5'和3'末端两者上邻近编码区定位使得基因对应于全长mRNA的序列(包含5'和3'非翻译序列)。另外，其它非编码序列，包含调控序列(例如但不限于启动子、增强子和转录因子结合位点)、聚腺苷酸化信号、内部核糖体进入位点、沉默子、绝缘序列和基质附着区可以存在于基因中。这些序列可以接近基因的编码区(例如但不限于在10kb内)或位于远处位点，并且这些序列会影响基因的转录和翻译水平或速率。

术语“等位基因”是指基因的变体形式。一些基因具有多种不同的形式，所述基因定位于染色体上的相同位置或基因位点处。二倍体生物体在每个基因座处具有两个等位基因。每对等位基因表示特异性基因座的基因型。如果在特定基因座处有两个相同的等位基因，则基因型被描述为纯合的，如果两个等位基因不同，则基因型被描述为杂合的。

“启动子”是DNA的调控区，其通常包括能够指导RNA聚合酶II在特定多核苷酸序列的适当转录起始位点处起始RNA合成的TATA盒。启动子可以另外包括影响转录起始速率的其它区域。本文所公开的启动子序列调节可操作连接的多核苷酸的转录。启动子可以在本文所公开的细胞类型(例如，人细胞、多能性细胞、单细胞期胚胎、分化细胞或其组合)中的一种或多种细胞类型中具有活性。启动子可以是例如组成型活性启动子、条件型启动子、诱导型启动子、时间受限启动子(例如，发育调节型启动子)或空间受限启动子(例如，细胞特异性或组织特异性启动子，如神经元特异性启动子，如突触蛋白-1启动子)。启动子的实例可以例如在WO 2013/176772中找到，所述文献出于所有目的通过引用整体并入本文。

“可操作的连接”或“可操作地连接”包含将两种或多种组分(例如启动子和另一种序列元件)并置使得两种组分正常发挥功能，并使得至少一种组分能够介导施加在至少一种其它组分上的功能。例如，如果启动子响应于存在或不存在一种或多种转录调控因子而控制编码序列的转录水平，则所述启动子可以与编码序列可操作地连接。可操作的连接可以包含这些彼此相邻或以反式作用的序列(例如，调控序列可以在一定距离处起作用以控制编码序列的转录)。

术语“变体”是指与群体中最普遍的序列不同(例如，相差一个核苷酸)的核苷酸序列或与群体中最普遍的序列不同(例如，相差一个氨基酸)的蛋白质序列。

当提及蛋白质时，术语“片段”意指比全长蛋白质更短或具有更少氨基酸的蛋白质。当提及核酸时，术语“片段”意指比全长核酸更短或具有更少核苷酸的核酸。当提及蛋白质片段时，片段可以是例如N端片段(即，去除蛋白质的C末端的一部分)、C端片段(即，去除蛋白质的N末端的一部分)或内部片段(即，去除蛋白质的N末端和C末端中的每个末端的一部分)。当提及核酸片段时，片段可以是例如5'片段(即，去除核酸的3'末端的一部分)、3'片段(即，去除核酸的5'末端的一部分)或内部片段(即，去除核酸的5'末端和3'末端中的每个段的一部分)。

在两个多核苷酸或多肽序列的上下文中，“序列同一性”或“同一性”是指当在指定的比较窗口上针对最大对应性进行比对时两个序列中相同的残基。当提及蛋白质的序列同一性的百分比时，不相同的残基位置通常因保守性氨基酸取代而不同，其中氨基酸残基被具有相似化学性质(例如，电荷或疏水性)的其它氨基酸残基取代，因此不改变分子的功能性质。当序列的保守性取代不同时，可以将百分比序列同一性向上调整以校正取代的保守性质。因此类保守性取代而不同的序列被视为具有“序列相似性”或“相似性。”用于进行这种调整的方法众所周知。通常，这涉及将保守性取代计为部分错配而不是完全错配，从而增加百分比序列同一性。因此，例如，当相同氨基酸的所得得分为1，非保守性取代的所得得分为零时，保守性取代的所得得分介于零与1之间。例如，通过在项目PC/GENE(加利福尼亚州山景城的Intelligenetics公司(Intelligenetics,Mountain View,California))中的实施方式计算保守性取代的得分。

“序列同一性百分比”包含通过在比较窗口上比较两个最佳比对序列测定的值(完全匹配残基的最大数量)，其中在比较窗口中的多核苷酸序列部分与参考序列(不包括添加物或缺失部分)相比可以包括添加物或缺失部分(即缺口)，以实现两个序列的最佳比对。通过测定在两个序列中出现相同核酸碱基或氨基酸残基的位置数计算百分比来得到匹配位置数，用匹配位置数除以比较窗口中的位置总数，并将结果乘以100以得到序列同一性的百分比。除非另有说明(例如，较短的序列包含连接的异源序列)，否则所述比较窗口为两个所比较序列中较短序列的全长。

除非另有说明，否则序列同一性/相似性值包含使用以下参数使用第10版GAP获得的值：使用GAP权重50、长度权重3以及nwsgapdna.cmp得分矩阵的核苷酸序列的同一性百分比和相似性百分比；使用GAP权重8和长度权重2以及BLOSUM62得分矩阵的氨基酸序列的同一性百分比和相似性百分比；或其任何等效程序。“等效程序”包含当与第10版GAP生成的对应比对进行比较时针对所讨论的任何两个序列产生具有相同核苷酸或氨基酸残基匹配和相同百分比序列同一性的比对的任何序列比较程序。

术语“保守性氨基酸取代”是指用具有相似大小、电荷或极性的不同氨基酸取代序列中正常存在的氨基酸。保守性取代的实例包含用非极性(疏水性)残基(如异亮氨酸、缬氨酸或亮氨酸)取代另一种非极性残基。同样地，保守性取代的实例包含用一种极性(亲水性)残基取代另一种极性残基，如精氨酸与赖氨酸之间的极性残基、谷氨酰胺与天冬酰胺之间的极性残基或甘氨酸与丝氨酸之间的极性残基。另外，用碱性残基(如赖氨酸、精氨酸或组氨酸)取代另一种碱性残基或者用一种酸性残基(如天冬氨酸或谷氨酸)取代另一种酸性残基是保守性取代另外的实例。非保守性取代的实例包含用非极性(疏水性)氨基酸残基(如异亮氨酸、缬氨酸、亮氨酸、丙氨酸或甲硫氨酸)取代极性(亲水性)残基(如半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸)和/或用极性残基取代非极性残基。典型的氨基酸分类总结如下。

表1：氨基酸分类。

“同源”序列(例如，核酸序列)包含与已知参考序列相同或基本上相似的序列，使得其例如与已知参考序列具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、至少99％或100％同一性。同源序列可以包含例如直系同源序列和旁系同源序列。例如，同源基因通常通过物种形成事件(直系同源基因)或基因复制事件(旁系同源基因)从共同的祖先DNA序列下降。“直系同源”基因包含不同物种中通过物种形成从共同祖先基因进化而来的基因。直系同源物通常在进化过程中保留相同的功能。“旁系同源”基因包含通过基因组内的复制相关的基因。旁系同源物可以在进化过程中进化出新的功能。

术语“体外(in vitro)”包含人工环境以及在人工环境(例如，试管或分离的细胞或细胞系)内发生的过程或反应。术语“体内(in vivo)”包含自然环境(例如，细胞、生物体或身体)以及在自然环境内发生的过程或反应。术语“离体(ex vivo)”包含已经从个体的身体去除的细胞或组织(例如，脑片培养物，如器官型脑片培养物)以及在此类细胞内发生的过程或反应。

术语“报告基因”是指具有对基因产物(通常是酶)进行编码的序列的核酸，当包括与异源启动子和/或增强子元件可操作地连接的报告基因序列的构建体被引入到含有(或可以制成含有)启动子和/或增强子元件活化所必需的因子的细胞中时，所述序列可容易且可定量地测定。报告基因的实例包含但不限于对β-半乳糖苷酶(lacZ)进行编码的基因、细菌氯霉素乙酰转移酶(cat)基因、萤火虫荧光素酶基因、对β-葡萄糖醛酸酶(GUS)进行编码的基因和对荧光蛋白进行编码的基因。“报告蛋白”是指由报告基因编码的蛋白质。

如本文所使用的，术语“荧光报告蛋白”意指基于荧光可检测的报告蛋白，其中荧光可以直接来自报告蛋白、报告蛋白在荧光底物上的活性，或对与荧光标记的化合物结合具有亲和力的蛋白质。荧光蛋白的实例包含绿色荧光蛋白(例如，GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿(Emerald)、Azami绿、单体Azami绿、CopGFP、AceGFP和ZsGreenl)、黄色荧光蛋白(例如，YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP和ZsYellowl)、蓝色荧光蛋白(例如，BFP、eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色和T-天蓝色(T-sapphire))、青色荧光蛋白(例如CFP、eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl和Midoriishi-青色)、红色荧光蛋白(例如，RFP、mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry和Jred)、橙色荧光蛋白(例如，mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine和tdTomato)，以及可以通过流式细胞术方法检测到细胞中存在的任何其它合适的荧光蛋白。

“包括(comprising)”或“包含(including)”一个或多个所列举的元件的组合物或方法可以包含其它未具体列举的元件。例如，“包括”或“包含”蛋白质的组合物可以单独含有蛋白质或与其它成分组合的蛋白质。过渡短语“基本上由……组成”意指权利要求的范围应被解释为涵盖权利要求中所列举的指定要素以及对要求保护的发明的基本和新颖特性没有实质性影响的那些要素。因此，当在本发明的权利要求中使用时，术语“基本上由……组成”不应被解释为等效于“包括”。

“任选的(Optional)”或“任选地(optionally)”是指随后描述的事件或情况可能发生或可能不发生并且此描述包含其中所述事件或情况发生的实例以及其中所述事件或情况不发生的实例。

数值范围的指定包含所述范围内或定义所述范围的所有整数以及由所述范围内的整数定义的所有子范围。

除非从上下文中明显看出，否则术语“约”涵盖规定值的标准测量误差范围(例如，SEM)内的值。

术语“和/或”是指并且涵盖关联的所列项中的一个或多个所列项的任何和所有可能组合以及在以替代性方案(“或”)解释时组合的缺少。

术语“或”是指特定列表中的任何一个成员，并且还包含所述列表成员的任何组合。

除非上下文另外明确指明，否则本文中的单数形式“一个(a)”、“一种(an)”和“所述(the)”包含复数个提及物。例如，术语“蛋白质”或“至少一种蛋白质”可以包含多种蛋白质，包含其混合物。

统计学上显著意指p≤0.05。

具体实施方式

I.概述

tau蛋白病是一组以脑中异常tau蛋白沉积为特征的异质性神经变性病状。例如，在患有阿尔茨海默氏病的个体的脑中，tau异常地过度磷酸化并且似乎纤维化成表现为神经原纤维缠结(NFT)的成对螺旋纤丝(PHF)。因此，过度磷酸化tau在NFT中的胞内聚集是tau蛋白病的神经病理学标志。

进行全基因组筛选，以鉴定当被破坏时促进tau聚集的修饰基因。对于两个基因BANF1和PPP2CA出现高置信度命中，其有助于维持核被膜完整性的过程。通过对参与这一生物学过程的其它蛋白质的检查，鉴定了一个另外的基因ANKLE2，所述基因当被破坏时也增强tau聚集。

自整合障碍因子蛋白(BANF1/BAF)将染色质连接到核被膜，并且丝氨酸/苏氨酸-蛋白磷酸酶2A催化亚基α同种型(PPP2CA)调节BANF1功能。BANF1是一种小的(10kDa)、丰富的、高度保守的DNA结合蛋白。BANF1涉及多种途径，包含有丝分裂、核组装、病毒感染、染色质和基因调节以及DNA损伤应答。BANF1将染色质连接到核被膜并且以序列非依赖性方式与DNA结合。BANF1还与内核膜(INM)蛋白的一个LEM(LAP2/Emerin/MAN1)结构域结合。BANF1的定位在细胞周期期间发生改变。

在有丝分裂期间，核被膜的分解和重新组装受蛋白质磷酸化控制。在进入有丝分裂时，VRK1对BANF1的磷酸化破坏了染色质、BANF1与LEM蛋白之间的连接。BANF1均匀分布在整个细胞中。在核被膜重组后，锚蛋白重复序列和含LEM结构域的蛋白2(ANKLE2)抑制VRK1酶活性。ANKLE2还与PPP2CA结合并且促进其去磷酸化BANF1的活性，使得其可以与LEM蛋白、染色质和核被膜再缔合。PPP2CA是主要的tau磷酸酶。PPP2CA可以结合tau-4RD并且已经与阿尔茨海默氏病相关。

这里揭示了tau聚集的新模型用于tau蛋白病的离体和体内研究。这些新模型例如可以将BANF1和/或PPP2CA和/或ANKLE2的表达中的突变或减少/抑制与现有的tau蛋白病模型组合。本文公开了改进的tau蛋白病模型(例如，非人动物、动物组织或动物细胞)、使用此类改进的tau蛋白病模型来评估用于治疗tau蛋白病的治疗剂候选物的方法、制备所述改进的tau蛋白病模型的方法以及加速或加剧tau蛋白病模型中的tau聚集的方法。

II.改进的tau蛋白病模型

本文公开了tau蛋白病模型，其包括BANF1、PPP2CA或ANKLE2的基因改变或降低/抑制的表达，以便加速tau聚集体在细胞和动物中的形成。此类tau蛋白病模型可以包括例如包括微管相关蛋白tau编码序列的基因组、细胞、组织或动物，以及BANF1、PPP2CA或ANKLE2的基因改变或降低/抑制的表达，以加速tau聚集体在细胞和动物中的形成，从而允许更好地开发tau蛋白病的体外、离体和体内模型。作为具体实例，动物(例如，非人动物)、动物组织(例如，非人动物组织)或动物细胞或动物细胞群(例如，一个或多个非人动物细胞)可以包括(a)一个或多个细胞中的微管相关蛋白tau编码序列；以及(b)(i)BANF1、PPP2CA和ANKLE2中的一种或多种或全部中的分别降低BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部在所述一个或多个细胞中的表达的基因修饰；和/或(ii)降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部在所述一个或多个细胞中的表达的一种或多种药剂。所述一个或多个细胞可以是任何类型的细胞。在一个实例中，所述一个或多个细胞是神经元细胞。

相对于不包括BANF1、PPP2CA和ANKLE2中的一种或多种或全部中的基因修饰或不包括降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的一种或多种药剂的动物、组织或细胞群，所述动物、组织或细胞群可以具有增加的tau蛋白病的至少一种体征或症状。此类体征和症状在本文其它地方进行更详细地讨论，并且可以包含例如tau过度磷酸化和tau聚集。其它体征或症状可以包含例如细胞分级分离后，不溶性级分中的tau和/或磷酸化tau增加、神经元的体树突状区室中的磷酸化tau增加、神经元的核周区中的磷酸化tau增加、神经元中的核孔复合物蛋白Nup98-Nup96(Nup98)核质比降低、神经元中的GTP结合核蛋白Ran(Ran)核质比降低或神经元中的Ran GTP酶活化蛋白1(RanGAP1)核质比降低。磷酸化tau可以是例如磷酸化tau(S356)或磷酸化tau AT8(S202，T205)。

微管相关蛋白tau编码序列是在一个或多个细胞中表达的编码序列。tau编码序列可以是内源性或外源性的，并且所述编码序列可以编码野生型tau蛋白或包括突变(例如，包括tau蛋白病相关突变或tau致病突变)的tau蛋白。tau编码序列可以编码人微管相关蛋白tau，如外源性人微管相关蛋白tau。编码序列可以包括编码序列和非编码序列(例如，外显子和内含子)两者，或所述编码序列可以包括互补DNA(cDNA)序列。编码序列可以任选地针对在动物、组织或细胞中的表达进行了密码子优化(例如，针对在人或小鼠细胞中的表达进行了密码子优化)。

tau编码序列可以是经基因组整合的或可以是染色体外的。如果经基因组整合，则编码序列可以随机整合到基因组中(转基因的)或所述编码序列可以以靶向的方式整合到靶向基因组基因座中。编码序列可以存在于或基因组整合于动物、组织或细胞群中的所有细胞中，或所述编码序列可以存在于或基因组整合于细胞的一部分(例如，神经元)中。包括经基因组整合的序列的动物可以在其种系中包括经基因组整合的序列。

tau编码序列可以与启动子，如异源启动子可操作地连接。启动子在细胞、组织或动物中可以是内源性的，或者所述启动子可以是外源性的。作为一个具体实例，启动子可以是朊病毒蛋白启动子，如小鼠朊病毒蛋白启动子。作为另一个实例，启动子可以是神经元特异性启动子。神经元特异性启动子的实例是众所周知的，并且包含例如突触蛋白-1启动子(例如，人突触蛋白-1启动子或小鼠突触蛋白-1启动子)。

微管相关蛋白tau可以是任何tau同种型。在一个具体实例中，tau编码序列编码1N4R同种型。微管相关蛋白tau可以是野生型tau蛋白或其可以包括一个或突变，如tau蛋白病相关突变或tau致病突变。此类突变的实例是众所周知的，并且在本文其它地方进行更详细地讨论。在一个具体实例中，tau包括P301S突变(任选地其中tau编码序列与小鼠朊病毒蛋白启动子可操作地连接)。在另一个具体实例中，tau包括A152T/P301L/S320F三重突变(任选地其中tau编码序列与突触蛋白-1启动子可操作地连接)。3MUT Tau 1N4R(A152T、P301L、S320F)的DNA和蛋白序列分别示出于SEQ ID NO:83和84中。

可以降低BANF1、PPP2CA或ANKLE2的表达的药剂的实例包含核酸酶药剂(例如，ZFN、TALEN或CRISPR/Cas)、与转录阻遏因子融合的DNA结合蛋白(例如，转录阻遏因子，如与KRAB融合的无催化活性Cas(dCas-KRAB))或反义寡核苷酸、siRNA、shRNA或反义RNA。这些药剂的实例在本文其它地方进行更详细地讨论。

BANF1(也被称为BAF、BCRG1、BCRP1和L2BP1)编码自整合障碍因子蛋白(也被称为断裂点簇区蛋白1和LAP2结合蛋白1)。其在核组装、染色质组织、基因表达和性腺发育中起着根本性作用，并且其可以有效地压缩染色质结构并且涉及在核组装期间的膜募集和染色质解凝。示例性人自整合障碍因子蛋白蛋白被指定为登录号NP_001137457.1和NP_003851.1(NCBI)和O75531(UniProt)。示例性人BANF1 mRNA由NCBI登录号NM_001143985.1和NM_003860.3指定。示例性人BANF1编码序列由CCDS ID CCDS8125.1指定。示例性人BANF1基因由NCBI RefSeq GeneID 8815指定。示例性小鼠自整合障碍因子蛋白蛋白被指定为登录号NP_001033320.1、NP_001273537.1和NP_035923.1(NCBI)以及O54962(UniProt)。示例性小鼠Banf1 mRNA由NCBI登录号NM_001038231.2、NM_001286608.1和NM_011793.3指定。示例性小鼠Banf1编码序列由CCDS ID CCDS29458.1指定。示例性小鼠Banf1基因由NCBIRefSeq GeneID 23825指定。示例性大鼠自整合障碍因子蛋白蛋白被指定为登录号NP_446083.1(NCBI)和Q9R1T1(UniProt)。示例性大鼠Banf1 mRNA由NCBI登录号NM_053631.3指定。示例性大鼠Banf1基因由NCBI RefSeq GeneID 114087指定。

PPP2CA编码丝氨酸/苏氨酸-蛋白磷酸酶2A催化亚基α同种型(也被称为PP2A-α、复制蛋白C、RP-C、蛋白磷酸酶2、蛋白磷酸酶2A或PP2A)。PP2A是微管相关蛋白(MAP)的主要磷酸酶。PP2A可以调节磷酸化酶B激酶酪蛋白激酶2、促分裂原刺激的S6激酶和MAP-2激酶的活性。示例性人丝氨酸/苏氨酸-蛋白磷酸酶2A催化亚基α同种型蛋白被指定为登录号NP_002706.1(NCBI)和P67775(UniProt)。示例性人PPP2CA mRNA由NCBI登录号NM_002715.2指定。示例性人PPP2CA编码序列由CCDS ID CCDS4173.1指定。示例性人PPP2CA基因由NCBIRefSeq GeneID 5515指定。示例性小鼠丝氨酸/苏氨酸-蛋白磷酸酶2A催化亚基α同种型蛋白被指定为登录号NP_062284.1(NCBI)和P63330(UniProt)。示例性小鼠Ppp2ca mRNA由NCBI登录号NM_019411.4指定。示例性小鼠Ppp2ca编码序列由CCDS ID CCDS24666.1指定。示例性小鼠Ppp2ca基因由NCBI RefSeq GeneID 19052指定。示例性大鼠丝氨酸/苏氨酸-蛋白磷酸酶2A催化亚基α同种型蛋白被指定为登录号NP_058735.1(NCBI)和P63331(UniProt)。示例性大鼠Ppp2ca mRNA由NCBI登录号NM_017039.2指定。示例性大鼠Ppp2ca基因由NCBI RefSeq GeneID 24672和103694903指定。

ANKLE2(也被称为KIAA0692、LEM4和D5Ertd585e)编码锚蛋白重复序列和含LEM结构域的蛋白2(也被称为含LEM结构域的蛋白4和肝脏再生相关蛋白LRRG057)。其通过在有丝分裂退出期间促进BAF/BANF1的去磷酸化而涉及有丝分裂核被膜的重新组装。其通过抑制VRK1激酶并且通过蛋白磷酸酶2A(PP2A)促进BAF/BANF1的去磷酸化来协调对BAF/BANF1去磷酸化的控制，由此促进核被膜组装。示例性人锚蛋白重复序列和含LEM结构域的蛋白2蛋白被指定为登录号NP_055929.1(NCBI)和Q86XL3(UniProt)。示例性人ANKLE2 mRNA由NCBI登录号NM_015114.2指定。示例性人ANKLE2编码序列由CCDS ID CCDS41869.1指定。示例性人ANKLE2基因由NCBI RefSeq GeneID 23141指定。示例性小鼠锚蛋白重复序列和含LEM结构域的蛋白2蛋白被指定为登录号NP_001240743.1和NP_082198.1(NCBI)以及Q6P1H6(UniProt)。示例性小鼠Ankle2 mRNA由NCBI登录号NM_001253814.1和NM_027922.2指定。示例性小鼠Ankle2编码序列由CCDS ID CCDS57372.1和CCDS80360.1指定。示例性小鼠Ankle2基因由NCBI RefSeq GeneID 71782指定。示例性大鼠锚蛋白重复序列和含LEM结构域的蛋白2蛋白被指定为登录号NP_001041366.1(NCBI)和Q7TP65(UniProt)。示例性大鼠Ankle2mRNA由NCBI登录号NM_001047901.1指定。示例性大鼠Ankle2基因由NCBI RefSeq GeneID360829指定。

已经开发了各种tau蛋白病模型。这些模型中的任何模型可以如本文所公开的通过突变或抑制/降低BANF1和/或PPP2CA和/或ANKLE2的表达来适配。这些模型包含细胞/细胞培养模型(非神经元细胞系、如PC12、SY5Y和CN1.4细胞等神经元细胞系或原代神经元细胞)、组织模型(例如，脑片培养物，如器官型脑片培养物)和全动物转基因模型(例如，秀丽隐杆线虫(C.elegans)、果蝇(Drosophila)、斑马鱼(zebrafish)或小鼠)。参见例如，Hall等人(2005),《生物化学与生物物理学报(Biochim.Biophys.Acta)》1739:224-239；Brandt等人(2005),《生物化学与生物物理学报》1739:331-354；以及Lee等人(2005),《生物化学与生物物理学报》1739:251-259，所述文献中的每个文献出于所有目的通过引用整体并入本文。通常，此类模型是转基因模型，其中野生型或突变人tau同种型在各种启动子的控制下过表达，以产生神经原纤维病理。基于细胞的模型具有更容易操作和灵活性的优点，而整个动物模型(例如，转基因小鼠模型)更完全并且更直接地与人疾病相关。

动物、组织或细胞群可以是雄性或雌性。细胞群可以是体外的、离体的或体内的。同样地，组织可以是离体的或体内的。在一个具体实例中，组织可以是脑片(例如，脑片培养物，如器官型脑片培养物)。

细胞群可以是任何类型的细胞。细胞可以是单克隆细胞系或细胞群。细胞可以来自任何来源。此类细胞可以来自模式生物体，如秀丽隐杆线虫、果蝇或斑马鱼。此类细胞可以是鱼类细胞或鸟类细胞，或者此类细胞可以是哺乳动物细胞，如人细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞或大鼠细胞。哺乳动物包含例如人、非人灵长类动物、猴子、猿、猫、狗、马、公牛、鹿、野牛、绵羊、啮齿动物(例如，小鼠、大鼠、仓鼠、豚鼠)、家畜(例如，牛物种，如奶牛和食用公牛；羊物种，如绵羊和山羊；以及猪物种，如猪和野猪)。鸟类包含例如鸡、火鸡、鸵鸟、鹅和鸭。还包含家养动物和农业动物。术语“非人动物”不包含人。在具体实例中，细胞是人细胞(例如，HEK293T细胞或神经元细胞)或小鼠细胞(例如，神经元细胞)。

细胞可以是例如全能性细胞或多能性细胞(例如，胚胎干(ES)细胞，如啮齿动物ES细胞、小鼠ES细胞或大鼠ES细胞)。全能性细胞包含可以产生任何细胞类型的未分化细胞，并且多能性细胞包含具有发育成超过一种分化细胞类型的能力的未分化细胞。此类多能和/或全能性细胞可以是例如ES细胞或ES样细胞，如诱导性多能干(iPS)细胞。ES细胞包含在引入到胚胎中时能够对发育胚胎的任何组织做出贡献的胚胎源性全能或多能性细胞。ES细胞可以源自囊胚的内细胞团，并且能够分化成三种脊椎动物胚层(内胚层、外胚层和中胚层)中的任何层的细胞。

细胞也可以是原代体细胞，或不是原代体细胞的细胞。体细胞可以包含不是配子、生殖细胞、配子细胞或未分化干细胞的任何细胞。细胞也可以是原代细胞。原代细胞包含直接从生物体、器官或组织中分离的细胞或细胞培养物。原代细胞包含既不转化也不永生的细胞。所述原代细胞包含从生物体、器官或组织中获得的任何细胞，所述细胞先前未在组织培养物中进行传代，或者先前已经在组织培养物中进行传代但不能无限期地在组织培养中进行传代。此类细胞可以通过常规技术分离并且包含例如神经元。例如，原代细胞可以源自神经系统组织(例如，原代神经元，如原代小鼠神经元)。

此类细胞还包含通常不会无限增殖但由于突变或改变而逃避正常细胞衰老而可以继续进行分裂的细胞。此类突变或改变可以天然存在或有意诱导。永生化细胞的实例包含中国仓鼠卵巢(CHO)细胞、人胚胎肾细胞(例如，HEK293T细胞)和小鼠胚胎成纤维细胞(例如，3T3细胞)。多种类型的永生化细胞是众所周知的。永生化或原代细胞包含通常用于培养或表达重组基因或蛋白质的细胞。神经元细胞系的实例包含大鼠PC12嗜铬细胞瘤细胞、人SH-SY5Y成神经细胞瘤细胞、人N-Tera2(NTERA-2或NT2)畸胎癌细胞、H4人神经胶质瘤细胞、人神经元BE(2)-M17D细胞、C1.4小鼠皮质神经元或HCN2A人皮质神经元。

细胞也可以是分化细胞，如神经元细胞(例如，人神经元细胞)。此类神经元细胞可以是原代神经元细胞(例如，小鼠原代神经元细胞)、源自如人iPS细胞等诱导性多能干(iPS)细胞的神经元或源自胚胎干(ES)细胞(例如，小鼠ES细胞)的神经元。例如，细胞可以是iCELL GABA神经元，其是源自iPS细胞的人神经元的高纯群体。所述细胞是有丝分裂后神经亚型的混合物，主要由GABA能神经元构成，具有典型的生理特性和应答。

如本文所述的非人动物可以通过本文其它地方描述的方法来制备。术语“动物”包含动物界的任何成员，包含例如哺乳动物、鱼类、爬行动物、两栖动物、鸟类和蠕虫。动物可以是例如果蝇、秀丽隐杆线虫或斑马鱼。在具体实例中，非人动物是非人哺乳动物。非人哺乳动物包含例如非人灵长类动物、猴子、猿、猩猩、猫、狗、马、公牛、鹿、野牛、绵羊、兔、啮齿动物(例如，小鼠、大鼠、仓鼠和豚鼠)和家畜(例如，牛物种，如奶牛和食用公牛；羊物种，如绵羊和山羊；以及猪物种，如猪和野猪)。鸟类包含例如鸡、火鸡、鸵鸟、鹅和鸭。还包含家养动物和农业动物。术语“非人动物”不包含人。优选的非人动物包含例如啮齿动物，如小鼠和大鼠。

非人动物可以来自任何基因背景。例如，合适的小鼠可以来自129品系、C57BL/6品系、129和C57BL/6的混合、BALB/c品系或Swiss Webster品系。129品系的实例包含129P1、129P2、129P3、129X1、129S1(例如，129S1/SV，129S1/Svlm)、129S2、129S4、129S5、129S9/SvEvH、129S6(129/SvEvTac)、129S7、129S8、129T1和129T2。参见例如，Festing等人(1999),《哺乳动物基因组(Mammalian Genome)》10:836，所述文献出于所有目的通过引用整体并入本文。C57BL品系的实例包含C57BL/A、C57BL/An、C57BL/GrFa、C57BL/Kal_wN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola。合适的小鼠还可以来自上述129品系和上述C57BL/6品系的混合(例如，50％129和50％C57BL/6)。同样地，合适的小鼠可以来自上述129品系的混合或上述BL/6品系的混合(例如，129S6(129/SvEvTac)品系)。

相似地，大鼠可以来自任何大鼠品系，包含例如ACI大鼠品系、黑刺鼠(DA)大鼠品系、威斯塔(Wistar)大鼠品系、LEA大鼠品系、斯泼累格多雷(Sprague Dawley，SD)大鼠品系或费舍尔(Fischer)大鼠品系，如费舍尔F344或费舍尔F6。大鼠还可以从源自上述两种或更多种品系的混合品系中获得。例如，合适的大鼠可以来自DA品系或ACI品系。ACI大鼠品系的特征在于具有腹部和足部呈白色的黑刺鼠以及RT1^av1单倍型。此类品系可从多种来源获得，包含哈兰实验室(Harlan Laboratories)。黑刺鼠(DA)大鼠品系的特征在于具有刺鼠皮毛和RT1^av1单倍型。此类大鼠可从多种来源获得，包含查尔斯河和哈兰实验室(Charles Riverand Harlan Laboratories)。一些合适的大鼠可以来自近交大鼠品系。参见例如US 2014/0235933，所述文献出于所有目的通过引用整体并入本文。

在一个具体实例中，小鼠品系是PS19(tau P301S(系PS19)；PS19Tg；B6；C3-Tg(Prnp-MAPT*P301S)PS19Vle/J)系。这种品系的基因背景是C57BL/6x C3H。PS19转基因小鼠表达由小鼠朊病毒蛋白(Prnp)启动子驱动的突变人微管相关蛋白tau，MAPT。转基因编码疾病相关P301S突变，并且包含四个微管结合结构域和一个N-端插入物(4R/1N)。在Chr3:140354280-140603283处插入转基因(构建GRCm38/mm10)，从而引起不会影响任何已知基因的249Kb缺失。参见Goodwin等人(2019),《基因组研究(Genome Res.)》29(3):494-505，所述文献出于所有目的通过引用整体并入本文。突变人tau的表达比内源性小鼠蛋白的表达高五倍。参见Yoshiyama等人(2007),《神经元(Neuron)》53(3):337-351，所述文献出于所有目的通过引用整体并入本文。PS19小鼠在八个月年龄时患有神经元丢失和脑萎缩。所述小鼠还在新皮质、杏仁核、海马体、脑干和脊髓中形成广泛分布的tau聚集体，称为神经原纤维缠结样包涵体。参见Yoshiyama等人(2007)。在通过组织学方法出现明显的tau病理之前，显示这些小鼠的脑表现出tau接种活性。也就是说，存在于脑匀浆中的tau聚集体可能引起另外的tau聚集，推测是通过朊病毒样机制。参见Holmes(2014),《美国国家科学院院刊(Proc.Natl.Acad.Sci.U.S.A.)》111(41):E4376-E4385，所述文献出于所有目的通过引用整体并入本文。

A.tau和tau蛋白病

微管相关蛋白tau(也被称为神经原纤维缠结蛋白、成对螺旋纤丝-tau(PHF-tau)或tau)是促进微管组装和稳定性的蛋白质，并且主要在神经元中表达，其中其优先定位于轴突区室。tau由MAPT基因(也称为MAPTL、MTBT1、TAU或MTAPT)编码。tau具有稳定神经元微管的作用，并且因此促进轴突生长。在人中，其表现为一组六种同种型，其是从位于17号染色体上的单个基因的转录物差异地剪接而成的。每个tau同种型含有一系列3/4串联重复单元(取决于同种型)，所述串联重复单元与微管结合并且用于使其稳定。tau的微管结合重复区侧接有富含丝氨酸/苏氨酸的区域，所述富含丝氨酸/苏氨酸的区域可以被多种激酶磷酸化并且与阿尔茨海默氏病(AD)和被称为tau蛋白病的相关神经变性疾病家族中的tau过度磷酸化相关。

本文公开的模型和方法中的tau蛋白可以是来自任何动物或哺乳动物，如人、小鼠或大鼠的tau蛋白。在一个具体实例中，tau是人tau蛋白。示例性人tau蛋白被指定为UniProt登录号P10636和GeneID 4137。示例性小鼠tau蛋白被指定为UniProt登录号P10637和GeneID17762。示例性大鼠tau蛋白被指定为UniProt登录号P19332。

tau蛋白是从单个基因交替剪接的产物，所述单个基因在人中被称为MAPT(微管相关蛋白tau)。tau重复结构域携带负责聚集的序列基序(即，所述重复结构域是来自tau的易聚集结构域)。根据剪接，tau蛋白的重复结构域具有三个或四个重复区域，所述重复区域构成蛋白质的易聚集核心，其通常被称为重复结构域(RD)。具体地，tau的重复结构域表示微管结合区域的核心，并且具有R2和R3中的负责tau聚集的六肽基序。在人大脑中，存在长度在352到441个氨基酸的范围内的六种tau同种型。除了氨基端处存在或不存在一个或两个插入结构域之外，这些同种型在羧基端根据三个重复结构域或四个重复结构域(R1-R4)的存在而变化。定位于tau羧基端一半的重复结构域被认为对于微管结合以及tau病理性聚集成成对螺旋丝(PHF)很重要，所述PHF是蛋白病中发现的神经原纤维缠结的核心成分。四个重复结构域(R1-R4)的示例性序列分别在SEQ ID NO:88-91中提供。四个重复结构域(R1-R4)的示例性编码序列在SEQ ID NO:92-95中提供。tau四重复结构域的示例性序列在SEQID NO:96中提供。tau四重复结构域的示例性编码序列在SEQ ID NO:97中提供。具有P301S突变的tau四重复结构域的示例性序列在SEQ ID NO:98中提供。具有P301S突变的tau四重复结构域的示例性编码序列在SEQ ID NO:99中提供。

tau蛋白病是一组以脑中异常tau沉积为特征的异质性神经变性病状。这些包含例如阿尔茨海默氏病、唐氏综合征(Down's syndrome)、皮克氏病(Pick's disease)、进行性核上性麻痹(PSP)、皮质基底节变性(CBD)以及具有与17号染色体相关的帕金森氏综合征的额颞痴呆(FTDP-17)。在AD和其它tau蛋白病中，tau蛋白异常地过度磷酸化并且聚集成丝状体束(成对螺旋丝状体)，所述丝状体束表现为神经原纤维缠结。

存在若干种与tau蛋白病相关(例如，与之分离)或引起tau蛋白病的tau致病突变，如促聚集突变。致病性tau突变(可以是外显子突变或内含子突变)通常会改变tau同种型的相对产生，并且可以导致微管组装和/或tau聚集倾向发生变化。作为一个实例，这种突变可以是使tau对接种敏化但不会导致tau自身容易地聚集的聚集敏化突变。例如，突变可以是疾病相关P301S突变。P301S突变意指人tau P301S突变或当与人tau蛋白最佳比对时另一种tau蛋白中的对应突变。其它致病性tau突变包含例如A152T、G272V、K280del、P301L、S320F、V337M、R406W、P301L/V337M、K280del/I227P/I308P、G272V/P301L/R406W和A152T/P301L/S320F。参见alzforum.org/mutations/mapt，Brandt等人(2005),《生物化学与生物物理学报》1739:331-354以及Wolfe(2009),《生物化学杂志(J.Biol.Chem.)》284(10):6021-6025，所述文献中的每个文献出于所有目的通过引用整体并入本文。野生型tau 1N4R的DNA和蛋白序列分别示出于SEQ ID NO:81和82中。3MUT Tau 1N4R(A152T、P301L、S320F)的DNA和蛋白序列分别示出于SEQ ID NO:83和84中。

细胞水平的tau蛋白病的体征和症状的一些实例包含tau过度磷酸化(例如，在神经元的体树突状区室中，因为尽管通常被认为是轴突蛋白，但tau被发现于退化神经元的树突区室中，并且这种再分布被认为是阿尔茨海默氏病中的神经退化的触发因素)、tau聚集、核纤层的异常形状以及受损的核质转运。生物体水平的其它体征和症状可以包含神经原纤维缠结(例如，在新皮质、杏仁核、海马体、脑干或脊髓中)、神经元丢失(例如，在海马体、杏仁核或新皮质中)、小胶质细胞增生、突触丢失、认知损伤或运动缺陷。其它体征或症状可以包含例如细胞分级分离后，不溶性级分中的tau和/或磷酸化tau增加、神经元的体树突状区室中的磷酸化tau增加、神经元的核周区中的磷酸化tau增加、神经元中的核孔复合物蛋白Nup98-Nup96(Nup98)核质比降低、神经元中的GTP结合核蛋白Ran(Ran)核质比降低或神经元中的Ran GTP酶活化蛋白1(RanGAP1)核质比降低。磷酸化tau可以是例如磷酸化tau(S356)或磷酸化tau AT8(S202，T205)。

B.用于降低BANF1、PPP2CA或ANKLE2的表达的药剂

任何合适的药剂可以用于降低或抑制BANF1、PPP2CA或ANKLE2的表达。可以降低BANF1、PPP2CA或ANKLE2的表达的药剂的实例包含核酸酶药剂(例如，ZFN、TALEN或CRISPR/Cas)、与转录阻遏因子融合的DNA结合蛋白(例如，转录阻遏因子，如与KRAB结构域融合的无催化活性或死亡的Cas(dCas)(dCas-KRAB))或反义寡核苷酸、siRNA、shRNA或反义RNA。可以降低BANF1、PPP2CA或ANKLE2的表达的药剂的其它实例包含编码核酸酶药剂(例如，ZFN、TALEN或CRISPR/Cas)的核酸、与转录阻遏因子融合的DNA结合蛋白(例如，转录阻遏因子，如与KRAB结构域融合的无催化活性/死亡的Cas(dCas)(dCas-KRAB))或反义寡核苷酸、siRNA、shRNA或反义RNA。下文更详细地讨论了这些药剂的实例。

1.核酸酶药剂和转录阻遏因子

核酸酶药剂可以用于降低BANF1、PPP2CA或ANKLE2的表达。例如，此类核酸酶药剂可以被设计成靶向和切割BANF1、PPP2CA或ANKLE2基因的将破坏BANF1、PPP2CA或ANKLE2基因的表达的区域。作为具体实例，核酸酶药剂可以被设计成切割BANF1、PPP2CA或ANKLE2的在起始密码子附近的区域。例如，靶序列可以位于起始密码子的约10个、20个、30个、40个、50个、100个、200个、300个、400个、500个或1,000个核苷酸内，并且由核酸酶药剂进行的切割可能破坏起始密码子。可替代地，可以使用被设计成切割起始密码子和终止密码子附近的区域的核酸酶药剂，以便缺失这两个核酸酶靶序列之间的编码序列。与转录阻遏因子结构域融合的DNA结合蛋白还可以用于降低BANF1、PPP2CA或ANKLE2的表达。例如，与转录阻遏因子结构域融合的DNA结合蛋白(例如，与KRAB转录阻遏因子结构域融合的无催化活性Cas)可以被设计成靶向BANF1、PPP2CA或ANKLE2的在起始密码子附近的区域，例如位于起始密码子的约10个、20个、30个、40个、50个、100个、200个、300个、400个、500个或1,000个核苷酸内)。

核酸酶药剂的切割可以导致可以通过非同源末端连接(NHEJ)修复的双链断裂。NHEJ包含通过将断裂末端彼此直接连接或与外源性序列直接连接来修复核酸中的双链断裂，而无需同源模板。NHEJ连接非连续序列通常会导致双链断裂位点附近的缺失、插入或易位。这些插入和缺失(indel)可以通过例如移码突变或起始密码子的破坏来破坏靶基因的表达。

可以在本文所公开的方法和组合物中使用将切口或双链断裂诱导成期望识别位点的任何核酸酶药剂。可以采用天然存在的或天然的核酸酶药剂，只要所述核酸酶药剂在期望识别位点中诱导切口或双链断裂即可。可替代地，可以采用经修饰的或工程化核酸酶药剂。“工程化核酸酶药剂”包含从其天然形式工程化(进行修饰或源自所述天然形式)以在期望识别位点中特异性地识别和诱导切口或双链断裂的核酸酶。因此，工程化核酸酶药剂可以源自天然的、天然存在的核酸酶药剂，或者可以人工产生或合成。工程化核酸酶可以在例如识别位点中诱导切口或双链断裂，其中识别位点不是由天然(非工程化或未经修饰的)核酸酶药剂识别的序列。核酸酶药剂的修饰可以少至蛋白质切割剂中的一个氨基酸或核酸切割剂中的一个核苷酸。在识别位点或其它DNA中产生缺口或双链断裂在本文中可以被称为“切割(cutting)”或“切割(cleaving)”识别位点或其它DNA。

还提供了例示性识别位点的活性变体和片段。此类活性变体可以包括与给定识别位点具有至少65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的序列同一性，其中活性变体保留生物活性并且因此能够以序列特异性方式被核酸酶药剂识别和切割。通过核酸酶药剂测量识别位点的双链断裂的测定是本领域已知的(例如，

qPCR测定，Frendewey等人(2010),《酶学方法(Methods inEnzymology)》476:295-307，所述文献出于所述目的通过引用整体并入本文)。

核酸酶药剂的识别位点可以定位在靶基因座中或附近的任何位置。识别位点可以位于基因的编码区内或位于影响基因表达的调控区内(例如，在起始密码子附近)。核酸酶药剂的识别位点可以位于内含子、外显子、启动子、增强子、调控区或任何非蛋白质编码区中。可替代地，识别位点可以定位在对选择标志物进行编码的多核苷酸内。这种位置可以定位在选择标志物的编码区内或调节区内，这会影响选择标志物的表达。因此，核酸酶药剂的识别位点可以位于选择标志物的内含子、启动子、增强子、调控区或多核苷酸的对选择标志物进行编码的任何非蛋白质编码区中。识别位点处的切口或双链断裂会破坏选择标志物的活性，并且用于测定功能性选择标志物存在与否的方法是已知的。

一种类型的核酸酶药剂是转录激活因子样效应物核酸酶(TALEN)。TAL效应物核酸酶是一类序列特异性核酸酶，其可以用于在原核或真核生物基因组中的具体靶序列处使双链断裂。通过将自然或工程化转录激活因子样(TAL)效应物或其功能部分与例如FokI等核酸内切酶的催化结构域融合来产生TAL效应物核酸酶。独特的模块化TAL效应子DNA结合结构域允许设计具有潜在任何给定DNA识别特异性的蛋白质。因此，TAL效应子核酸酶的DNA结合结构域可以被工程化以识别特定的DNA靶位点，并且因此用于在期望的靶序列处进行双链断裂。参见WO 2010/079430；Morbitzer等人(2010),《美国国家科学院院刊》107(50):21617-21622；Scholze和Boch(2010),《毒力(Virulence)》1:428-432；Christian等人,《基因学(Genetics)》(2010)186:757-761；Li等人(2010),《核酸研究》(2011)39(1):359-372；以及Miller等人(2011),《自然生物技术(Nature Biotechnology)》29:143-148，所述文献中的每个文献出于所有目的通过引用整体并入本文。

合适的TAL核酸酶的实例和用于制备合适的TAL核酸酶的方法公开于例如US2011/0239315 A1、US 2011/0269234 A1、US 2011/0145940 A1、US 2003/0232410 A1、US2005/0208489 A1、US 2005/0026157 A1、US 2005/0064474 A1、US 2006/0188987 A1和US2006/0063231 A1中，所述文献中的每个文献出于所有目的通过引用整体并入本文。在各个实施例中，TAL效应物核酸酶被工程化为在例如所关注的基因座或所关注的基因组基因座中的靶核酸序列中或附近切断，其中靶核酸序列位于将由靶向载体修饰的序列处或附近。适合与本文所提供的各种方法和组合物一起使用的TAL核酸酶包含那些专门设计成在将由如本文所述的靶向载体修饰的靶核酸序列处或附近结合的核酸酶。

在一些TALEN中，TALEN的每个单体包括通过两个高变残基识别单个碱基对的33-35个TAL重复序列。在一些TALEN中，核酸酶药剂是包括与如FokI核酸内切酶等独立核酸酶可操作地连接的基于TAL重复序列的DNA结合结构域的嵌合蛋白。例如，核酸酶药剂可以包括第一基于TAL重复序列的DNA结合结构域和第二基于TAL重复序列的DNA结合结构域，其中第一和第二基于TAL重复序列的DNA结合结构域中的每一个与FokI核酸酶可操作地连接，其中第一和第二基于TAL重复序列的DNA结合结构域识别由不同长度(12-20bp)的间隔子序列分开的靶DNA序列的每条链中的两个连续靶DNA序列，并且其中FokI核酸酶亚基二聚化以产生使靶序列上的双链断裂的活性核酸酶。

在本文所公开的各种方法和组合物中采用的核酸酶药剂可以进一步包括锌指核酸酶(ZFN)。在一些ZFN中，ZFN的每个单体包括3个或更多个基于锌指的DNA结合结构域，其中每个基于锌指的DNA结合结构域与3bp亚位点结合。在其它ZFN中，ZFN是包括基于锌指的DNA结合结构域的嵌合蛋白，所述结合结构域与如FokI核酸内切酶等独立的核酸酶可操作地连接。例如，核酸酶药剂可以包括第一ZFN和第二ZFN，其中第一ZFN和第二ZFN各自与FokI核酸酶亚基可操作地连接，其中第一ZFN和第二ZFN识别由约5-7bp间隔子分开的靶DNA序列中的每条链中的两个连续靶DNA序列，并且其中FokI核酸酶亚基二聚化以产生使双链断裂的活性核酸酶。参见例如，US20060246567；US20080182332；US20020081614；US20030021776；WO/2002/057308A2；US20130123484；US20100291048；WO/2011/017293A2；以及Gaj等人(2013)《生物技术趋势(Trends in Biotechnology)》31(7):397-405，所述文献中的每个文献出于所有目的通过引用整体并入本文。

还提供了核酸酶药剂(即，工程化核酸酶药剂)的活性变体和片段。此类活性变体可以包括与天然核酸酶药剂具有至少65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性，其中活性变体保留在期望识别位点处切割的能力并且因此保留切口或双链断裂诱导活性。例如，本文所述的核酸酶药剂中的任何核酸酶药剂都可以从天然核酸内切酶序列进行修饰，并且被设计成在未被天然核酸酶药剂识别的识别位点处识别和诱导切口或双链断裂。因此，一些工程化核酸酶具有在不同于对应的天然核酸酶药剂识别位点的识别位点处诱导切口或双链断裂的特异性。对切口或双链断裂诱导活性的测定是已知的，并且通常测量核酸内切酶对含有识别位点的DNA底物的总体活性和特异性。

核酸酶药剂可以通过任何已知的方式引入到细胞中。对核酸酶药剂进行编码的多肽可以被直接引入到细胞中。可替代地，对核酸酶药剂进行编码的多核苷酸可以被引入到细胞中。当对核酸酶药剂进行编码的多核苷酸被引入到细胞中时，核酸酶药剂可以在细胞内瞬时地、有条件地或组成性地表达。因此，对核酸酶药剂进行编码的多核苷酸可以包含在表达盒中并且可操作地连接到条件型启动子、诱导型启动子、组成型启动子或组织特异性启动子。此类所关注的启动子在本文别处进一步详细讨论。可替代地，核酸酶药剂作为对核酸酶药剂进行编码的mRNA被引入到细胞中。

对核酸酶药剂进行编码的多核苷酸可以稳定地整合在细胞的基因组中，并且可操作地连接到在细胞中具有活性的启动子。可替代地，对核酸酶药剂进行编码的多核苷酸可以在靶向载体中(例如，包括插入多核苷酸的靶向载体，或者在从包括插入多核苷酸的靶向载体中分离出的载体或质粒中)。

当通过引入对核酸酶药剂进行编码的多核苷酸向细胞提供核酸酶药剂时，可以修饰这种对核酸酶药剂进行编码的多核苷酸以取代与对核酸酶药剂进行编码的天然存在的多核苷酸序列相比在所关注的细胞中具有更高使用频率的密码子。例如，可以修饰对核酸酶药剂进行编码的多核苷酸以取代与天然存在的多核多核苷酸序列相比在包含细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它所关注的宿主细胞的给定所关注原核或真核细胞中具有更高使用频率的密码子。

CRISPR/Cas系统：本文公开的方法和组合物可以利用成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关(Cas)系统或此类系统的组分来修饰基因组或改变基因在细胞内的表达。CRISPR/Cas系统包含转录本和涉及Cas基因表达或指导其活性的其它元件。CRISPR/Cas系统可以是例如I型、II型、III型系统或V型系统(例如，V-A亚型或V-B亚型)。本文公开的方法和组合物可以通过利用CRISPR复合物(包括与Cas蛋白复合的向导RNA(gRNA))用于核酸的定点结合或切割来采用CRISPR/Cas系统。

在本文公开的组合物和方法中使用的CRISPR/Cas系统可以是非天然存在的。“非天然存在的”系统包含表明涉及人工的任何事物，如系统的一种或多种组分从其自然存在的状态改变或突变，至少基本上不含所述组分在自然界中与其天然相关的至少一种其它组分或与所述组分不与其天然相关的至少一种其它组分相关。例如，一些CRISPR/Cas系统采用包括非天然一起存在的gRNA和Cas蛋白的非天然存在的CRISPR复合物，采用非天然存在的Cas蛋白，或者采用非天然存在的gRNA。

Cas蛋白：Cas蛋白通常包括可以与向导RNA相互作用的至少一个RNA识别或结合结构域。Cas蛋白还可以包括核酸酶结构域(例如，DNase结构域或RNase结构域)、DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域、二聚化结构域和其它结构域。一些此类结构域(例如，DNase结构域)可以来自天然Cas蛋白。可以添加其它此类结构域以制备经修饰的Cas蛋白。核酸酶结构域对核酸切割(其包含核酸分子共价键的断裂)具有催化活性。切割可以产生平末端或交错末端，并且其可以是单链或双链的。例如，野生型Cas9蛋白通常将产生钝性切割产物。可替代地，野生型Cpf1蛋白(例如，FnCpf1)可以产生具有5个核苷酸5'突出端的切割产物，其中切割发生在非靶向链上的PAM序列的第18个碱基对之后和靶向链上的第23个碱基之后。Cas蛋白可以具有完整的切割活性以在靶基因组基因座处产生双链断裂(例如，具有平末端的双链断裂)，或者其可以是在靶基因组基因座处产生单链断裂的切口酶。

Cas蛋白的实例包含Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1或Csx12)、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966以及其同源物或经修饰的形式。

示例性Cas蛋白是Cas9蛋白或源自Cas9蛋白的蛋白。Cas9蛋白来自II型CRISPR/Cas系统，并且通常共享具有保守结构的四个关键基序。基序1、2和4是类似RuvC的基序，并且基序3是HNH基序。示例性Cas9蛋白来自酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌(Streptococcus sp.)、金黄色葡萄球菌(Staphylococcus aureus)、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿产色链霉菌(Streptomycesviridochromogenes)、绿产色链霉菌(Streptomyces viridochromogenes)、链孢囊菌(Streptosporangium roseum)、链孢囊菌(Streptosporangium roseum)、酸热脂环酸杆菌(Alicyclobacillus acidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、硒化芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacteriumsibiricum)、德氏乳酸杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillussalivarius)、海洋微颤菌(Microscilla marina)、伯克氏菌目细菌(Burkholderialesbacterium)、食萘极地单胞菌(Polaromonas naphthalenivorans)、极地单胞菌(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝丝菌(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻(Synechococcus sp.)、阿拉伯糖醋酸杆菌(Acetohalobium arabaticum)、德根斯产氨菌(Ammonifex degensii)、热解纤维素菌(Caldicelulosiruptor becscii)、候选金矿菌(Candidatus Desulforudis)、肉毒杆菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、丙酸降解菌(Pelotomaculum thermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillus ferrooxidans)、异色变色菌(Allochromatiumvinosum)、海杆菌(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、沃森亚硝化球菌(Nitrosococcus watsoni)、嗜盐假交替单胞菌(Pseudoalteromonashaloplanktis)、雷氏纤线杆菌(Ktedonobacter racemifer)、伊芙氏甲烷盐菌(Methanohalobium evestigatum)、鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻(Nostoc sp.)、节旋藻(Arthrospira maxima)、盘状节旋藻(Arthrospira platensis)、节旋藻(Arthrospira sp.)、鞘丝藻(Lyngbya sp.)、原型微鞘藻(Microcoleus chthonoplastes)、颤蓝细菌(Oscillatoria sp.)、运动石袍菌(Petrotoga mobilis)、非洲栖热腔菌(Thermosipho africanus)、深海阿卡罗虎尾草(Acaryochloris marina)、脑膜炎奈瑟氏菌(Neisseria meningitidis)或空肠弯曲杆菌(Campylobacter jejuni)。Cas9家族成员的另外实例在WO 2014/131833中进行描述，所述文献出于所有目的通过引用整体并入本文。来自酿脓链球菌的Cas9(SpCas9)(指定SwissProt登录号Q99ZW2)是示例性Cas9蛋白。来自金黄色葡萄球菌的Cas9(SaCas9)(指定UniProt登录号J7RUA5)是另一示例性Cas9蛋白。来自空肠弯曲杆菌的Cas9(CjCas9)(指定UniProt登录号Q0P897)是另一种示例性Cas9蛋白。参见例如，Kim等人(2017),《自然通讯(Nat.Commun.)》8:14500，所述文献出于所有目的通过引用整体并入本文。SaCas9小于SpCas9，并且CjCas9小于SaCas9和SpCas9两者。SpCas9的示例性DNA和蛋白序列分别示出于SEQ ID NO:86和87中。来自脑膜炎奈瑟氏球菌的Cas9(Nme2Cas9)是另一种示例性Cas9蛋白。参见例如Edraki等人(2019),《分子细胞(Mol.Cell)》73(4):714-726，所述文献出于所有目的通过引用整体并入本文。来自嗜热链球菌的Cas9蛋白(例如，由CRISPR1基因座编码的嗜热链球菌LMD-9Cas9(St1Cas9)或来自CRISPR3基因座的嗜热链球菌Cas9(St3Cas9))是其它例示性Cas9蛋白。来自新凶手弗朗西丝氏菌(Francisella novicida)的Cas9(FnCas9)或识别替代性PAM(E1369R/E1449H/R1556A取代)的RHA新凶手弗朗西丝氏菌Cas9变体是其它示例性Cas9蛋白。这些和其它示例性Cas9蛋白例如在Cebrian-Serrano和Davies(2017),《哺乳动物基因组(Mamm.Genome)》28(7):247-261中综述，所述文献出于所有目的通过引用整体并入本文。

Cas蛋白的另一个实例是Cpf1(来自普雷沃氏菌(Prevotella)和弗朗西斯氏菌(Francisella)1的CRISPR)蛋白。Cpf1是含有与Cas9的对应结构域同源的RuvC样核酸酶结构域以及与特征性富含精氨酸的Cas9簇的对应物的大蛋白质(约1300个氨基酸)。然而，Cpf1缺乏Cas9蛋白中存在的HNH核酸酶结构域，并且RuvC样结构域在Cpf1序列中是连续的，而Cas9则相反，其含有包含HNH结构域的长插入物。参见例如，Zetsche等人(2015),《细胞》163(3):759-771，所述文献出于所有目的通过引用整体并入本文。示例性Cpf1蛋白来自土拉弗朗西斯菌(Francisella tularensis)1、土拉弗朗西丝菌新凶手亚种(Francisellatularensis subsp.novicida)、易北河普雷沃氏菌(Prevotella albensis)、毛螺菌科细菌(Lachnospiraceae bacterium)MC2017 1、解蛋白丁酸弧菌(Butyrivibrioproteoclasticus)、异域菌门细菌(Peregrinibacteria bacterium)GW2011_GWA2_33_10、俭菌超门细菌(Parcubacteria bacterium)GW2011_GWC2_44_17、史密斯氏菌属(Smithellasp.)SCADC、氨基酸球菌属(Acidaminococcus sp.)BV3L6、毛螺菌科细菌(Lachnospiraceaebacterium)MA2020、候选白蚁甲烷支原体(Candidatus Methanoplasma termitum)、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉氏菌(Moraxella bovoculi)237、稻田氏钩端螺旋体(Leptospira inadai)、毛螺菌科细菌(Lachnospiraceae bacterium)ND2006、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)3、解糖胨普雷沃氏菌(Prevotella disiens)和猕猴卟啉单胞菌(Porphyromonas macacae)。来自新凶手弗朗西丝氏菌(Francisellanovicida)U112的Cpf1(FnCpf1；指定UniProt登录号A0Q7Q2)是示例性Cpf1蛋白。

Cas蛋白可以是野生型蛋白(即，自然界中存在的那些蛋白)、经修饰的Cas蛋白(即，Cas蛋白变体)或野生型或经修饰的Cas蛋白的片段。就野生型或经修饰的Cas蛋白的催化活性而言，Cas蛋白也可以是活性变体或片段。就催化活性而言，活性变体或片段可以包括与野生型或经修饰的Cas蛋白或其部分具有至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的序列同一性，其中活性变体保留在期望的切割位点处切割的能力，并因此保留切口诱导或双链断裂诱导活性。对切口诱导或双链断裂诱导活性的测定是已知的，并且通常测量Cas蛋白对含有切割位点的DNA底物的总体活性和特异性。

经修饰的Cas蛋白的一个实例是经修饰的SpCas9-HF1蛋白，其是具有设计成减少非特异性DNA接触的改变(N497A/R661A/Q695A/Q926A)的酿脓链球菌Cas9的高保真变体。参见例如，Kleinstiver等人(2016),《自然(Nature)》529(7587):490-495，所述文献出于所有目的通过引用整体并入本文。经修饰Cas蛋白的另一个实例是被设计成减少脱靶效应的经修饰的eSpCas9变体(K848A/K1003A/R1060A)。参见例如，Slaymaker等人(2016),《科学(Science)》351(6268):84-88，所述文献出于所有目的通过引用整体并入本文。其它SpCas9变体包含K855A和K810A/K1003A/R1060A。这些和其它经修饰的Cas蛋白例如在Cebrian-Serrano和Davies(2017),《哺乳动物基因组》28(7):247-261中综述，所述文献出于所有目的通过引用整体并入本文。另一种经修饰Cas9蛋白的实例是xCas9，其是可以识别扩大范围的PAM序列的SpCas9变体。参见例如Hu等人(2018),《自然(Nature)》556:57-63，所述文献出于所有目的通过引用整体并入本文。

可以修饰Cas蛋白以增加或减少核酸结合亲和力、核酸结合特异性和酶活性中的一种或多种。也可以修饰Cas蛋白以改变蛋白质的任何其它活性或性质，如稳定性。例如，Cas蛋白的一个或多个核酸酶结构域可以是经修饰的、缺失的或失活的，或者可以截断Cas蛋白以去除对蛋白质功能不必要的结构域或优化(例如，增强或减少)Cas蛋白的活性或性质。

Cas蛋白可以包括至少一个核酸酶结构域，如DNase结构域。例如，野生型Cpf1蛋白通常包括切割靶DNA的两条链的RuvC样结构域，其可能呈二聚体构型。Cas蛋白还可以包括至少两个核酸酶结构域，如DNase结构域。例如，野生型Cas9蛋白通常包括RuvC样核酸酶结构域和HNH样核酸酶结构域。RuvC结构域和HNH结构域可以各自切割双链DNA的不同的链以在DNA中产生双链断裂。参见例如，Jinek等人(2012),《科学》337:816-821，所述文献出于所有目的通过引用整体并入本文。

核酸酶结构域中的一个或多个或所有核酸酶结构域可以缺失或突变，使得其不再具有功能或具有降低的核酸酶活性。例如，如果Cas9蛋白中的核酸酶结构域之一进行缺失或突变，则所得Cas9蛋白可以被称为切口酶，并且可以在双链靶DNA内产生单链断裂，但不会产生双链断裂(即，其可以切割互补链或非互补链，但不能同时切割两者)。如果两个核酸酶结构域都缺失或突变，则所得Cas蛋白(例如，Cas9)切割双链DNA(例如，核酸酶无效或核酸酶失活的Cas蛋白，或催化死亡的Cas蛋白(dCas))的两条链的能力将降低。将Cas9转化为切口酶的突变的实例是来自酿脓链球菌的Cas9的RuvC结构域中的D10A(在Cas9的位置10处天冬氨酸转化为丙氨酸)突变。同样地，来自酿脓链球菌的Cas9的HNH结构域中的H939A(在氨基酸位置839处组氨酸到丙氨酸)、H840A(在氨基酸位置840处组氨酸到丙氨酸)或N863A(在氨基酸位置N863处天冬酰胺到丙氨酸)可以将Cas9转化为切口酶。将Cas9转化为切口酶的突变的其它实例包含来自嗜热链球菌的Cas9的对应突变。参见例如，Sapranauskas等人(2011),《核酸研究》39:9275-9282和WO 2013/141680，所述文献中的每个文献出于所有目的通过引用整体并入本文。可以使用如定点诱变、PCR介导的诱变或总基因合成等方法产生此类突变。产生切口酶的其它突变实例可以在例如WO 2013/176772和WO2013/142578中找到，所述文献中的每个文献出于所有目的通过引用整体并入本文。如果Cas蛋白中的所有核酸酶结构域都缺失或突变(例如，Cas9蛋白中的两个核酸酶结构域都缺失或突变)，则所得Cas蛋白(例如，Cas9)切割双链DNA(例如，核酸酶无效或核酸酶失活的Cas蛋白)的两条链的能力将降低。一个具体实例是D10A/H840A酿脓链球菌Cas9双突变体或者当与酿脓链球菌Cas9最佳比对时来自另一物种的Cas9中的对应双突变体。另一个具体实例是D10A/N863A酿脓链球菌Cas9双突变体或者当与酿脓链球菌Cas9最佳比对时来自另一物种的Cas9中的对应双突变体。

xCas9的催化结构域中的失活突变的实例与上述针对SpCas9的突变相同。金黄色葡萄球菌Cas9蛋白催化结构域中的失活突变的实例也是已知的。例如，金黄色葡萄球菌Cas9酶(SaCas9)可以包括用于产生核酸酶失活Cas蛋白的位置N580处的取代(例如，N580A取代)和位置D10处的取代(例如，D10A取代)。参见例如，WO 2016/106236，所述文献出于所有目的通过引用整体并入本文。Nme2Cas9的催化结构域中的失活突变的实例也是已知的(例如，D16A和H588A的组合)。St1Cas9的催化结构域中的失活突变的实例也是已知的(例如，D9A、D598A、H599A和N622A的组合)。St3Cas9的催化结构域中的失活突变的实例也是已知的(例如，D10A和N870A的组合)。CjCas9的催化结构域中的失活突变的实例也是已知的(例如，D8A和H559A的组合)。FnCas9和RHAFnCas9的催化结构域中的失活突变的实例也是已知的(例如，N995A)。

Cpf1蛋白的催化结构域中的失活突变的实例也是已知的。参考来自新凶手弗朗西丝氏菌U112(FnCpf1)、氨基酸球菌BV3L6(AsCpf1)、毛螺科菌ND2006(LbCpf1)和牛眼莫拉氏菌237(MbCpf1 Cpf1)的Cpf1蛋白，此类突变可以包含AsCpf1的位置908、993或1263处或Cpf1直系同源物中的对应位置处，或LbCpf1的位置832、925、947或1180或Cpf1直系同源物中的对应位置处的突变。此类突变可以包含例如AsCpf1的突变D908A、E993A和D1263A或Cpf1直系同源物中的对应突变或LbCpf1的D832A、E925A、D947A和D1180A或Cpf1直系同源物中的对应突变中的一种或多种突变。参见例如US 2016/0208243，所述文献出于所有目的通过引用整体并入本文。

Cas蛋白也可以作为融合蛋白与异源多肽可操作地连接。例如，Cas蛋白可以与切割结构域、表观遗传修饰结构域或转录阻遏因子结构域融合。参见WO 2014/089290，所述文献出于所有目的通过引用整体并入本文。转录阻遏因子结构域的实例包含诱导型cAMP早期阻遏因子(ICER)结构域、克鲁贝尔相关盒(Kruppel-associated box)A(KRAB-A)(或克鲁贝尔相关盒(KRAB))阻遏因子结构域、富含YY1甘氨酸的阻遏因子结构域、Sp1样阻遏因子、E(spl)阻遏因子、ΙκΒ阻遏因子和MeCP2。其它实例包含来自A/B、KOX、TGF-β诱导型早期基因(TIEG)、v-erbA、SID、SID4X、MBD2、MBD3、DNMT1、DNMG3A、DNMT3B、Rb、ROM2的转录阻遏因子结构域，参见例如，EP3045537和WO 2011/146121，所述文献中的每个文献出于所有目的通过引用整体并入。Cas蛋白也可以与异源多肽融合，提供增加或减少的稳定性。融合结构域或异源多肽可以定位于N端、C端或Cas蛋白内部。

举例来说，Cas蛋白可以与提供亚细胞定位的一种或多种异源多肽融合。此类异源多肽可以包含例如一种或多种核定位信号(NLS)，如用于靶向细胞核的单分SV40 NLS和/或双分α-输入蛋白NLS、用于靶向线粒体的线粒体定位信号、ER保留信号等。参见例如，Lange等人(2007),《生物化学杂志(J.Biol.Chem.)》282:5101-5105，所述文献出于所有目的通过引用整体并入本文。此类亚细胞定位信号可以定位于N端、C端或Cas蛋白内的任何位置。NLS可以包括碱性氨基酸段，并且可以是单分序列或双分序列。任选地，Cas蛋白可以包括两个或更多个NLS，包含N端处的NLS(例如，α-输入蛋白NLS或单分NLS)和C端处的NLS(例如，SV40NLS或双分NLS)。Cas蛋白还可以包括N端处的两个或更多个NLS和/或C端处的两个或更多个NLS。

Cas蛋白也可以与细胞穿透性结构域或蛋白质转导结构域可操作地连接。例如，细胞穿透性结构域可以源自HIV-1 TAT蛋白、来自人乙型肝炎病毒的TLM细胞穿透基序、MPG、Pep-1、VP22、来自单纯疱疹病毒的细胞穿透性肽或聚精氨酸肽序列。参见例如WO 2014/089290和WO 2013/176772，所述文献中的每个文献出于所有目的通过引用整体并入本文。细胞穿透性结构域可以定位于N端、C端或Cas蛋白内的任何位置。

Cas蛋白也可以与异源多肽可操作地连接以便于进行追踪或纯化，如荧光蛋白、纯化标签或表位标签。荧光蛋白的实例包含绿色荧光蛋白(例如，GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿、Azami绿、单体Azami绿、CopGFP、AceGFP、ZsGreenl)、黄色荧光蛋白(例如，YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP、ZsYellowl)、蓝色荧光蛋白(例如，eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色、T-天蓝色(T-sapphire))、青色荧光蛋白(例如，eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl、Midoriishi-青色)、红色荧光蛋白(例如，mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred)、橙色荧光蛋白(例如，mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine、tdTomato)和任何其它合适的荧光蛋白。标签的实例包含谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、多(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血球凝集素(HA)、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP)和钙调蛋白。

Cas蛋白还可以与经标记的核酸栓系。这种栓系(即，物理连接)可以通过共价相互作用或非共价相互作用来实现，并且栓系可以是直接的(例如，通过直接融合或化学缀合，这可以通过蛋白质上的半胱氨酸或赖氨酸残基的修饰或内含子修饰来实现)，或者可以通过如链霉亲和素或适配子等一个或多个中间连接子或衔接子分子来实现。参见例如，Pierce等人(2005),《药物化学短评(Mini Rev.Med.Chem.)》5(1):41-55；Duckworth等人(2007),《德国应用化学会刊(Angew.Chem.Int.Ed.Engl.)》46(46):8819-8822；Schaeffer和Dixon(2009),《澳大利亚化学杂志(Australian J.Chem.)》62(10):1328-1332；Goodman等人(2009),《生物化学(Chembiochem.)》10(9):1551-1557；以及Khatwani等人(2012)《生物有机化学与医药化学(Bioorg.Med.Chem.)》20(14):4532-4539，所述文献中的每个文献出于所有目的通过引用整体并入本文。用于合成蛋白质-核酸缀合物的非共价策略包含生物素-链霉亲和素和镍-组氨酸方法。可以通过使用多种化学反应连接适当功能化的核酸和蛋白质来合成共价蛋白质-核酸缀合物。这些化学反应中的一些化学反应涉及将寡核苷酸直接附着到蛋白质表面上的氨基酸残基(例如，赖氨酸胺或半胱氨酸硫醇)，而其它更复杂的方案需要蛋白质的翻译后修饰或者催化或反应蛋白结构域的参与。用于蛋白质与核酸共价附着的方法可以包含例如寡核苷酸与蛋白质赖氨酸或半胱氨酸残基的化学交联、表达的蛋白质连接、化学酶法和光适体的使用。经标记的核酸可以与Cas蛋白内的C端、N端或内部区域栓系。在一个实例中，经标记的核酸与Cas蛋白的C端或N端栓系。同样地，Cas蛋白可以与经标记的核酸内的5'末端、3'末端或内部区域栓系。也就是说，经标记的核酸可以以任何取向和极性拴系。例如，Cas蛋白可以与经标记的核酸的5'末端或3'末端栓系。

Cas蛋白可以以任何形式提供。例如，Cas蛋白可以以蛋白质的形式提供，如与gRNA复合的Cas蛋白。可替代地，可以以对Cas蛋白进行编码的核酸形式提供Cas蛋白，如RNA(例如，信使RNA(mRNA))或DNA。任选地，可以对编码Cas蛋白的核酸进行密码子优化以在特定细胞或生物体中有效翻译成蛋白质。例如，与天然存在的多核苷酸序列相比，可以修饰对Cas蛋白进行编码的核酸以取代在细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它所关注宿主细胞中具有更高使用频率的密码子。当对Cas蛋白进行编码的核酸被引入到细胞中时，Cas蛋白可以在细胞中进行瞬时、条件性或组成性表达。

可以对作为mRNA提供的Cas蛋白进行修饰以提高稳定性和/或免疫原性性质。可以对mRNA内的一种或多种核苷进行修饰。对mRNA核碱基进行化学修饰的实例包含假尿苷、1-甲基-假尿苷和5-甲基-胞苷。例如，可以使用含有N1-甲基假尿苷的加帽和聚腺苷酸化CasmRNA。同样地，Cas mRNA可以通过使用同义密码子对尿苷进行缺失来修饰。

对Cas蛋白进行编码的核酸可以稳定地整合在细胞的基因组中，并且与在细胞中具有活性的启动子可操作地连接。可替代地，对Cas蛋白进行编码的核酸可以与表达构建体中的启动子可操作地连接。表达构建体包含能够指导基因或其它所关注核酸序列(例如，Cas基因)的表达并且可以将此类所关注核酸序列转移到靶细胞的任何核酸构建体。例如，对Cas蛋白进行编码的核酸可以在包括对gRNA进行编码的DNA的载体中。可替代地，其可以在与包括对gRNA进行编码的DNA的载体分离的载体或质粒中。可以用于表达构建体的启动子包含在例如真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、多能性细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导性多能干(iPS)细胞或单细胞期胚胎中的一种或多种细胞中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。任选地，启动子可以是在一个方向上驱动Cas蛋白的表达并且在另一个方向上驱动向导RNA的表达的双向启动子。此类双向启动子可以由以下组成：(1)含有3个外部控制元件：远侧序列元件(DSE)、近侧端序列元件(PSE)和TATA框的完整的、常规的、单向的Pol III启动子；(2)包含在相反取向上与DSE的5'端融合PSE和TATA盒的第二基本Pol III启动子。例如，在H1启动子中，DSE邻近PSE和TATA框，并且可以通过产生杂合启动子使启动子双向化，其中通过源自U6启动子的附加PSE和TATA盒来控制反向转录。参见例如US 2016/0074535，所述文献出于所有目的通过引用整体并入本文。使用双向启动子同时表达对Cas蛋白和向导RNA进行编码的基因允许生成紧凑表达盒以促进递送。

向导RNA：“向导RNA”或“gRNA”是与Cas蛋白(例如，Cas9蛋白)结合并将Cas蛋白靶向靶DNA内的特定位置的RNA分子。向导RNA可以包括两个片段：“DNA靶向片段”和“蛋白质结合片段”。“片段”包含分子的一部分或区域，如RNA中的连续核苷酸段。一些gRNA，如Cas9的那些，可以包括两个单独的RNA分子：“激活因子RNA”(例如，tracrRNA)和“靶向因子RNA”(例如，CRISPR RNA或crRNA)。其它gRNA是单个RNA分子(单个RNA多核苷酸)，所述单个RNA分子也可以被称为“单分子gRNA”、“单向导RNA”或“sgRNA”。参见例如WO 2013/176772、WO 2014/065596、WO 2014/089290、WO 2014/093622、WO 2014/099750、WO 2013/142578和WO 2014/131833，所述文献中的每个文献出于所有目的通过引用整体并入本文。例如，对于Cas9，单向导RNA可以包括(例如，通过接头)与tracrRNA融合的crRNA。例如，对于Cpf1，只需要crRNA就可以实现与靶序列的结合。术语“向导RNA”和“gRNA”包含双分子(即，模块化)gRNA和单分子gRNA两者。

示例性双分子gRNA包括crRNA样(“CRISPR RNA”或“靶向因子RNA”或“crRNA”或“crRNA重复序列”)分子和对应的tracrRNA样(“反式作用CRISPR RNA”或“激活因子RNA”或“tracrRNA”)分子。crRNA包括gRNA的DNA靶向片段(单链)和核苷酸段，所述核苷酸段形成gRNA的蛋白质结合片段的dsRNA双链体的一半。定位在DNA靶向区段下游(3')的crRNA尾部的实例包括GUUUUAGAGCUAUGCU(SEQ ID NO:65)、基本上由其组成或由其组成。本文所公开的DNA靶向区段(向导序列)中的任何区段可以与SEQ ID NO:65的5'末端连接以形成crRNA。此类DNA靶向区段包含例如SEQ ID NO:44-46(小鼠Banf1)、SEQ ID NO:27-30(人BANF1)、SEQ ID NO:47-49(小鼠Ppp2ca)、SEQ ID NO:31-32(人PPP2CA)、SEQ ID NO:50-52(小鼠Ankle2)和SEQ ID NO:38(人ANKLE2)。

对应的tracrRNA(激活因子RNA)包括形成gRNA的蛋白质结合片段的dsRNA双链体的另一半的核苷酸段。crRNA的核苷酸段与tracrRNA的核苷酸段互补并且与其杂交，以形成gRNA的蛋白质结合结构域的dsRNA双链体。因此，每个crRNA可以被视为具有对应的tracrRNA。tracrRNA序列的实例包括

AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:66)、

AAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:100)或

GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:101)、基本上由其组成或由其组成。

在需要crRNA和tracrRNA两者的系统中，crRNA和对应的tracrRNA杂交以形成gRNA。在需要仅crRNA的系统中，crRNA可以是gRNA。crRNA另外提供与靶DNA的互补链杂交的单链DNA靶向片段。如果用于细胞内的修饰，则给定的crRNA或tracrRNA分子的确切序列可以被设计成对将使用RNA分子的物种具有特异性。参见例如，Mali等人(2013),《科学》339:823-826；Jinek等人(2012),《科学》337:816-821；Hwang等人(2013),《自然生物技术》31:227-229；Jiang等人(2013),《自然生物技术》31:233-239；以及Cong等人(2013),《科学》339:819-823，所述文献中的每个文献出于所有目的通过引用整体并入本文。

给定gRNA的DNA靶向片段(crRNA)包括与靶DNA的互补链上的序列互补的核苷酸序列，如下文更详细地描述的。gRNA的DNA靶向片段通过杂交(即，碱基配对)以序列特异性方式与靶DNA相互作用。因此，DNA靶向片段的核苷酸序列可以不同，并且测定gRNA和靶DNA将与其相互作用的靶DNA内的定位。可以修饰主题gRNA的DNA靶向片段以与靶DNA内的任何期望序列杂交。天然存在的crRNA因CRISPR/Cas系统和生物体而不同，但通常含有长度为21到72个核苷酸的侧接有长度为21到46个核苷酸的两个直接重复序列(DR)的靶向片段(参见例如，WO 2014/131833，所述文献出于所有目的通过引用整体并入本文)。在酿脓链球菌的情况下，DR的长度为36个核苷酸，并且靶向片段的长度为30个核苷酸。定位于3'的DR与对应的tracrRNA互补并杂交，后者进而与Cas蛋白结合。

DNA靶向区段的长度可以例如为至少约12个、15个、17个、18个、19个、20个、25个、30个、35个或40个核苷酸。此类DNA靶向区段的长度可以例如为约12个到约100个、约12个到约80个、约12个到约50个、约12个到约40个、约12个到约30个、约12个到约25个或约12个到约20个核苷酸。例如，DNA靶向区段可以为约15个到约25个核苷酸(例如，约17个到约20个核苷酸或约17个、18个、19个或20个核苷酸)。参见例如US2016/0024523，所述文献出于所有目的通过引用整体并入本文。对于来自酿脓链球菌的Cas9，典型的DNA靶向片段的长度介于16与20个核苷酸之间或长度介于17与20个核苷酸之间。对于来自金黄色葡萄球菌的Cas9，典型的DNA靶向片段的长度介于21与23个核苷酸之间。对于Cpf1，典型的DNA靶向区段的长度为至少16个核苷酸或长度为至少18个核苷酸。

TracrRNA可以呈任何形式(例如，全长tracrRNA或活性部分tracrRNA)并具有不同长度。TracrRNA可以包含初级转录本或经处理的形式。例如，tracrRNA(作为单向导RNA的一部分或作为作为双分子gRNA的一部分的单独分子)可以包括野生型tracrRNA序列(例如，野生型tracrRNA序列的约或超过约20、26、32、45、48、54、63、67、85或更多个核苷酸)、基本上由其组成或由其组成。来自酿脓链球菌的野生型tracrRNA序列的实例包含171-核苷酸、89-核苷酸、75-核苷酸和65-核苷酸形式。参见例如，Deltcheva等人(2011),《自然》471:602-607；WO 2014/093661，所述文献中的每个文献出于所有目的通过引用整体并入本文。单向导RNA(sgRNA)内的tracrRNA的实例包含在+48、+54、+67和+85形式的sgRNA中发现的tracrRNA片段，其中“+n”表示在sgRNA中包含野生型tracrRNA的至多+n个核苷酸。参见US8,697,359，所述文献出于所有目的通过引用整体并入本文。

向导RNA的DNA靶向片段与靶DNA的互补链之间的互补性百分比可以为至少60％(例如，至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少98％、至少99％或100％)。DNA靶向片段与靶DNA的互补链之间的互补性百分比在约20个连续核苷酸上可以为至少60％。举例来说，DNA靶向片段与靶DNA的互补链之间的互补性百分比在靶DNA的互补链的5'末端处的14个连续的核苷酸上可以为100％并且在其余部分上低至0％。在此类情况下，DNA靶向片段可以被视为长度为14个核苷酸。作为另一个实例，DNA靶向片段与靶DNA的互补链之间的互补性百分比在靶DNA的互补链的5'末端处的七个连续的核苷酸上可以为100％并且在其余部分上低至0％。在此类情况下，DNA靶向片段可以被视为长度为7个核苷酸。在一些向导RNA中，DNA靶向段内的至少17个核苷酸与靶DNA的互补链互补。例如，DNA靶向段的长度可以是20个核苷酸并且可以包括与靶DNA的互补链的1个、2个或3个失配。在一个实例中，失配不邻近对应于原间隔子相邻基序(PAM)序列的互补链的区域(即，PAM序列的反向补体)(例如，失配位于向导RNA的DNA靶向段的5'末端，或失配距离对应于PAM序列的互补链的区域至少2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个或19个碱基对)。

gRNA的蛋白质结合片段可以包括彼此互补的两个核苷酸段。蛋白质结合片段的互补核苷酸杂交形成双链RNA双链体(dsRNA)。主题gRNA的蛋白质结合片段与Cas蛋白相互作用，并且gRNA通过DNA靶向片段将结合的Cas蛋白引导到靶DNA内的特异性核苷酸序列。

单向导RNA可以包括DNA靶向区段和支架序列(即，向导RNA的蛋白质结合或Cas结合序列)。例如，此类向导RNA可以具有与3'支架序列连接的5'DNA靶向区段。示例性支架序列包括以下、基本上由以下组成或由以下组成：

GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(版本1；SEQ ID NO:67)；

GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本2；SEQ ID NO:68)；

GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本3；SEQ ID NO:69)；

GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本4；SEQ ID NO:70)；

GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(版本5；SEQ ID NO:102)；

GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(版本6；SEQ ID NO:103)；或

GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUU(版本7；SEQ ID NO:104)。靶向本文所公开的向导RNA靶序列中的任何向导RNA靶序列的向导RNA可以包含例如与向导RNA的3'末端上的示例性向导RNA支架序列中的任何支架序列融合的向导RNA的5'末端上的DNA靶向区段。也就是说，本文所公开的DNA靶向区段(向导序列)中的任何区段可以与上述支架序列中的任何一个支架序列的5'末端连接以形成单个向导RNA(嵌合向导RNA)。此类DNA靶向区段包含例如SEQ ID NO:44-46(小鼠Banf1)、SEQ ID NO:27-30(人BANF1)、SEQ ID NO:47-49(小鼠Ppp2ca)、SEQ ID NO:31-32(人PPP2CA)、SEQ ID NO:50-52(小鼠Ankle2)和SEQ ID NO:38(人ANKLE2)。

向导RNA可以包含提供另外的期望特征的修饰或序列(例如，经修饰或经调控的稳定性；亚细胞靶向；用荧光标记追踪；蛋白质或蛋白质复合物的结合位点；等等)。此类修饰的实例包含例如5'帽(例如，7-甲基鸟苷酸帽(m7G))；3'聚腺苷酸化尾部(即，3'poly(A)尾部)；核糖开关序列(例如，以允许调控稳定性和/或调控蛋白质和/或蛋白质复合物的可及性)；稳定性控制序列；形成dsRNA双链体(即，发夹)的序列；将RNA靶向亚细胞位置(例如，细胞核、线粒体、叶绿体等)的修饰或序列；提供用于追踪的修饰或序列(例如，与荧光分子直接缀合、与促进荧光检测的部分缀合、允许荧光检测的序列等)；为蛋白质(例如，作用于DNA的蛋白质，包含转录激活因子、转录阻遏因子、DNA甲基转移酶、DNA去甲基化酶、组蛋白乙酰转移酶、组蛋白去乙酰化酶等)提供结合位点的修饰或序列；和其组合。修饰的其它实例包含工程化茎环双链体结构、工程化凸起区、茎环双链体结构的工程化发夹3'或其任何组合。参见例如US 2015/0376586，所述文献出于所有目的通过引用整体并入本文。凸起可以是由crRNA样区域和最小tracrRNA样区域构成的双链体内的核苷酸的未配对区域。凸起在双链体的一侧可以包括未配对的5'-XXXY-3'，其中X是任何嘌呤，并且Y可以包括可以与相对链上的核苷酸形成摇摆对的核苷酸；并且在双链体的另一侧包括未配对核苷酸区。

未经修饰的核酸可能易于降解。外源性核酸也可以诱导先天免疫应答。修饰可以有助于引入稳定性并降低免疫原性。向导RNA可以包括经修饰的核苷和经修饰的核苷酸，包含例如以下中的一种或多种：(1)磷酸二酯骨架键中的非连接磷酸氧中的一个或两个和/或连接磷酸氧中的一个或多个的改变或替代；(2)核糖成分的改变或替代，如核糖上的2'羟基的改变或替代；(3)用脱磷连接子替代磷酸部分；(4)天然存在的核碱基的修饰或替代；(5)核糖磷酸骨架的替代或修饰；(6)寡核苷酸3'末端或5'末端的修饰(例如，末端磷酸基团的去除、修饰或替代或部分的缀合)；以及(7)糖的修饰。其它可能的向导RNA修饰包含尿嘧啶或聚尿嘧啶束的修饰或替代。参见例如WO 2015/048577和US 2016/0237455，所述文献中的每个文献出于所有目的通过引用整体并入本文。可以对Cas编码核酸如Cas mRNA进行相似的修饰。例如，可以通过使用同义密码子耗尽尿苷来修饰Cas mRNA。

举例来说，向导RNA的5'末端或3'末端的核苷酸可以包含硫代磷酸酯键(例如，碱基可以具有经修饰的磷酸酯基，所述经修饰的磷酸酯基是硫代磷酸酯基)。例如，向导RNA可以包含向导RNA的5'或3'末端处的2、3或4个末端核苷酸之间的硫代磷酸酯键。作为另一个实例，向导RNA的5'和/或3'末端的核苷酸可以具有2'-O-甲基修饰。例如，向导RNA可以包含向导RNA的5'和/或3'末端(例如，5'末端)的2、3或4个端核苷酸处的2'-O-甲基修饰。参见例如WO 2017/173054 A1和Finn等人(2018),《细胞报告(Cell Rep.)》22(9):2227-2235，所述文献中的每个文献出于所有目的通过引用整体并入本文。其它可能的修饰在本文其它地方进行更详细地描述。在具体实例中，向导RNA包含前三个5'和3'末端RNA残基处的2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。此类化学修饰可以例如提供更大的稳定性和防止核酸外切酶向导RNA，允许所述向导RNA比未经修饰的向导RNA在细胞内持续更长时间。例如，此类化学修饰还可以防止先天的细胞内免疫应答，所述先天的细胞内免疫应答可以主动降解RNA或触发导致细胞死亡的免疫级联反应。

可以以任何形式提供向导RNA。例如，gRNA可以以RNA的形式提供，作为两个分子(单独的crRNA和tracrRNA)或作为一个分子(sgRNA)，并且任选地以与Cas蛋白的复合物的形式提供。gRNA也可以以对gRNA进行编码的DNA的形式提供。对gRNA进行编码的DNA可以编码单个RNA分子(sgRNA)或单独的RNA分子(例如，单独的crRNA和tracrRNA)。在后一种情况下，对gRNA进行编码的DNA可以作为一个DNA分子或作为分别对crRNA和tracrRNA进行编码的单独DNA分子提供。

当gRNA以DNA的形式提供时，gRNA可以在细胞中瞬时、有条件或组成型表达。对gRNA进行编码的DNA可以稳定地整合到细胞的基因组中，并且与在细胞中具有活性的启动子可操作地连接。可替代地，对gRNA进行编码的DNA可以与表达构建体中的启动子可操作地连接。例如，对gRNA进行编码的DNA可以处于包括异源核酸如对Cas蛋白进行编码的核酸的载体中。可替代地，对gRNA进行编码的DNA可以处于与包括对Cas蛋白进行编码的核酸的载体分开的载体或质粒中。可以用于此类表达构建体的启动子包含在例如真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、多能细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导性多能干(iPS)细胞或单细胞期胚胎中的一种或多种细胞中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。此类启动子也可以是例如双向启动子。合适启动子的具体实例包含RNA聚合酶III启动子，如人U6启动子、大鼠U6聚合酶III启动子或小鼠U6聚合酶III启动子。

可替代地，可以通过各种其它方法制备gRNA。例如，可以使用例如T7 RNA聚合酶通过体外转录制备gRNA(参见例如，WO 2014/089290和WO 2014/065596，所述文献中的每个文献出于所有目的通过引用整体并入本文)。向导RNA也可以是通过化学合成制备的合成产生的分子。例如，向导RNA可以化学合成为包含前三个5'和3'端RNA残基处的2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。

向导RNA(或对向导RNA进行编码的核酸)可以在包括一个或多个向导RNA(例如，1个、2个、3个、4个或更多个向导RNA)和增加向导RNA稳定性(例如，延长在给定储存条件(例如，-20℃、4℃或环境温度)下降解产物保持在阈值以下的时间，如低于起始核酸或蛋白质重量的0.5％；或增加体内稳定性)的载体的组合物中。此类载体的非限制性实例包含聚(乳酸)(PLA)微球、聚(D,L-乳酸-共乙醇酸)(PLGA)微球、质脂体、胶束、反胶束、脂质螺旋体和脂质微管。此类组合物可以进一步包括Cas蛋白，如Cas9蛋白，或对Cas蛋白进行编码的核酸。

向导RNA靶序列：用于向导RNA的靶DNA包含存在于DNA中的核酸序列，gRNA的DNA靶向片段将与其结合，前提是存在足够的结合条件。合适的DNA/RNA结合条件包含细胞中通常存在的生理条件。其它合适的DNA/RNA结合条件(例如，无细胞系统中的条件)是本领域已知的(参见例如，《分子克隆：实验室手册》,第3版(Sambrook等人,海港实验室出版社(HarborLaboratory Press)2001)，所述文献出于所有目的通过引用整体并入本文)。与gRNA互补并杂交的靶DNA的链可以被称为“互补链”，并且与“互补链”互补(并且因此不与Cas蛋白或gRNA互补)的靶DNA的链可以称为“非互补链”或“模板链”。

靶DNA包含与向导RNA杂交的互补链上的序列和非互补链上的对应序列(例如，与前间区序列邻近基序(PAM)邻近)。如本文所使用的，术语“向导RNA靶序列”具体指非互补链上的与向导RNA在互补链上与其杂交的序列相对应(即，其反向补体)的序列。即，向导RNA靶序列是指非互补链上的与PAM相邻(例如，在Cas9的情况下，PAM的上游或5')的序列。向导RNA靶序列等同于向导RNA的DNA靶向区段，但具有胸腺嘧啶而不是尿嘧啶。举例来说，SpCas9酶的向导RNA靶序列可以指非互补链上的5'-NGG-3'PAM上游的序列。向导RNA被设计成与靶DNA的互补链互补，其中向导RNA的DNA靶向区段与靶DNA的互补链之间的杂交促进了CRISPR复合物的形成。不一定需要完全互补，条件是存在足够的互补性来引起杂交并促进CRISPR复合物的形成。如果向导RNA在本文中被称为靶向向导RNA靶序列，则意味着向导RNA与靶DNA的互补链序列杂交，所述互补链序列是非互补链上的向导RNA靶序列的反向补体。

靶DNA或向导RNA靶序列可以包括任何多核苷酸，并且可以定位于例如细胞的细胞核或细胞质中或细胞的细胞器如线粒体或叶绿体内。靶DNA或向导RNA靶序列可以是细胞内源性或外源性的任何核酸序列。向导RNA靶序列可以是编码基因产物(例如，蛋白质)的序列或非编码序列(例如，调节序列)或者可以包含两者。

Cas蛋白对靶DNA的位点特异性结合和切割可以发生在由(i)向导RNA与靶DNA的互补链之间的碱基配对互补性和(ii)靶DNA的非互补链中的短基序(被称为原型间隔子相邻基序(PAM))两者测定的定位处。PAM可以侧接向导RNA靶序列。任选地，向导RNA靶序列可以在3'末端上侧接有PAM(例如，对于Cas9)。可替代地，向导RNA靶序列可以在5'末端上侧接有PAM(例如，对于Cpf1)。例如，Cas蛋白的切割位点可以是PAM序列上游或下游(例如，向导RNA靶序列内)的约1到约10或约2到约5个碱基对(例如，3个碱基对)。在SpCas9的情况下，PAM序列(即，非互补链上)可以是5'-N₁GG-3'，其中N₁是任何DNA核苷酸，并且PAM紧接着靶DNA的非互补链上的向导RNA靶序列的3'。因此，对应于互补链上的PAM的序列(即，反向补体)将是5'-CCN₂-3'，其中N₂是任何DNA核苷酸并且紧接着向导RNA的DNA靶向片段在靶DNA的互补链上与其杂交的序列的5'。在一些此类情况下，N₁和N₂可以是互补的，并且N₁-N₂碱基对可以是任何碱基对(例如，N₁＝C并且N₂＝G；N₁＝G并且N₂＝C；N₁＝A并且N₂＝T；或N₁＝T并且N₂＝A)。在来自金黄色葡萄球菌的Cas9的情况下，PAM可以是NNGRRT或NNGRR，其中N可以A、G、C或T，并且R可以是G或A。在来自空肠弯曲杆菌的Cas9的情况下，PAM可以是例如NNNNACAC或NNNNRYAC，其中N可以是A、G、C或T，并且R可以是G或A。在一些情况下(例如，对于FnCpf1)，PAM序列可以位于5'末端上游并且具有序列5'-TTN-3'。

向导RNA靶序列的实例是紧接在SpCas9蛋白识别的NGG基序之前的20个核苷酸的DNA序列。例如，向导RNA靶序列加PAM的两个实例是GN₁₉NGG(SEQ ID NO:71)或N₂₀NGG(SEQID NO:72)。参见例如，WO 2014/165825，所述文献出于所有目的通过引用整体并入本文。5'末端处的鸟嘌呤可以促进细胞中RNA聚合酶的转录。向导RNA靶序列加PAM的其它实例可以包含5'末端处的两个鸟嘌呤核苷酸(例如，GGN₂₀NGG；SEQ ID NO:73)以促进体外T7聚合酶的高效转录。参见例如，WO 2014/065596，所述文献出于所有目的通过引用整体并入本文。其它向导RNA靶序列加PAM可以具有4-22个核苷酸长度的SEQ ID NO:71-73，包含5'G或GG和3'GG或NGG。又其它向导RNA靶序列加PAM可以具有长度介于14与20个核苷酸之间的SEQ IDNO:71-73。用于BANF1、PPP2CA和ANKLE2的向导RNA靶序列的实例包含SEQ ID NO:1-4(人BANF1)、SEQ ID NO:5-6(人PPP2CA)、SEQ ID NO:12(人ANKLE2)、SEQ ID NO:18-20(小鼠Banf1)、SEQ ID NO:21-23(小鼠Ppp2ca)和SEQ ID NO:24-26(小鼠Ankle2)。

与靶DNA杂交的CRISPR复合物的形成可以导致在对应于向导RNA靶序列(即，靶DNA的非互补链上的向导RNA靶序列和互补链上的向导RNA与其杂交的反向补体)的区域内或附近的靶DNA的一条或两条链的切割。例如，切割位点可以处于向导RNA靶序列内(例如，处于相对于PAM序列的所定义的定位处)。“切割位点”包含Cas蛋白产生单链断裂或双链断裂的靶DNA的位置。切割位点可以仅在双链DNA的一条链上(例如，当使用切口酶时)或在两条链上。切割位点可以在两条链上的相同位置处(产生平端；例如，Cas9))或可以在每条链上的不同位点处(产生交错末端(即，突出端)；例如，Cpf1)。例如，可以通过使用两种Cas蛋白产生交错末端，其中每一种在不同链的不同切割位点处产生单链断裂，从而产生双链断裂。例如，第一切口酶可以在双链DNA(dsDNA)的第一条链上产生单链断裂，并且第二切口酶可以在dsDNA的第二条链上产生单链断裂，使得产生突出序列。在一些情况下，第一链上的切口酶的向导RNA靶序列或切割位点与第二链上的切口酶的向导RNA靶序列或切割位点相隔至少2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、40个、50个、75个、100个、250个、500个或1,000个碱基对。

2.反义寡核苷酸、反义RNA、siRNA或shRNA

反义寡核苷酸、反义RNA、小干扰RNA(siRNA)或短发夹RNA(shRNA)也可以用于降低BANF1、PPP2CA或ANKLE2的表达。此类反义RNA、siRNA或shRNA可以被设计成靶向BANF1、PPP2CA或ANKLE2 mRNA的任何区域。

术语“反义RNA”是指与在细胞中转录的信使RNA链互补的单链RNA。术语“小干扰RNA(siRNA)”是指诱导RNA干扰(RNAi)途径的典型双链RNA分子。这些分子的长度可以变化(通常介于18-30个碱基对之间)并且含有与其反义链中的靶mRNA的不同程度的互补性。一些但不是全部siRNA在有义链和/或反义链的5'末端或3'末端上具有未配对的突出碱基。术语“siRNA”包含两条单独的链的双链体，以及可以形成包括双链体区的发夹结构的单链。双链结构的长度可以例如小于20个、25个、30个、35个、40个、45个或50个核苷酸。例如，双链结构的长度可以为约21-23个核苷酸、约19-25个核苷酸或约19-23个核苷酸。术语“短发夹RNA(shRNA)”是指在发夹结构中自杂交并且可以在加工时诱导RNA干扰(RNAi)途径的单链RNA碱基。这些分子的长度可以变化(通常长度为约50-90个核苷酸，或在一些情况下长度至多大于250个核苷酸，例如对于微RNA适应的shRNA)。shRNA分子在细胞内被加工以形成siRNA，其进而可以敲低基因表达。shRNA可以整合到载体中。术语“shRNA”还指可以从中转录短的发夹RNA分子的DNA分子。

反义寡核苷酸和RNAi药剂还可以用于降低BANF1、PPP2CA或ANKLE2的表达。此类反义寡核苷酸或RNAi药剂可以被设计成靶向BANF1、PPP2CA或ANKLE2 mRNA的任何区域。

“RNAi药剂”是包括能够以序列特异性方式促进如信使RNA(mRNA)等靶RNA的翻译的降级或抑制的小双链RNA或RNA样(例如，化学修饰的RNA)寡核苷酸分子的组合物。RNAi药剂中的寡核苷酸是经连接的核苷的聚合物，所述经连接的核苷中的每个核苷可以是独立地修饰的或未经修饰的。RNAi药剂通过RNA干扰机制起作用(即，通过与哺乳动物细胞的RNA干扰途径机制(RNA诱导的沉默复合物或RISC)相互作用来诱导RNA干扰)。虽然如本文所使用的术语RNAi药剂被认为主要通过RNA干扰机制起作用，但所公开的RNAi药剂不受任何特定途径或作用机制的约束或限制。本文所公开的RNAi药剂包括有义链和反义链，并且包含但不限于短干扰RNA(siRNA)、双链RNA(dsRNA)、微RNA(miRNA)、短发夹RNA(shRNA)和dicer底物。本文所述的RNAi药剂的反义链至少部分地与靶RNA中的序列(即，连续或有序的核碱基或核苷酸，使用标准命名法用连续字母描述)互补。

单链反义寡核苷酸(ASO)和RNA干扰(RNAi)共享的基本原理在于寡核苷酸通过沃森-克里克碱基配对(Watson-Crick base pairing)结合靶RNA。不希望受理论束缚，在RNAi期间，小RNA双链体(RNAi药剂)与RNA诱导的沉默复合物(RISC)相关联，一条链(随从链)丢失，并且剩下的链(引导链)与RISC协同结合互补RNA。然后，RISC的催化组分Argonaute 2(Ago2)切割靶RNA。引导链总是与互补的有义链或蛋白质(RISC)相关联。相比之下，ASO必须存活下来并作为单链发挥作用。ASO与靶RNA结合并阻断核糖体或如剪接因子等其它因子与RNA结合或者募集如核酸酶等蛋白质。根据期望的作用机制为ASO选择不同的修饰和靶区域。Gapmer是在每个端上侧接DNA的中央8-10个碱基空位的含有2-5个化学修饰的核苷酸(例如，LNA或2'-MOE)的ASO寡核苷酸。在与靶RNA结合之后，DNA-RNA杂交体充当RNase H的底物。

ASO是DNA寡聚物，通常15-25个碱基长，被设计成相对于所关注RNA呈反义取向。ASO与靶RNA的杂交介导RNA的RNase H切割，这可以防止mRNA的蛋白质翻译。为了增加核酸酶抗性，可以将硫代磷酸酯(PS)修饰添加到寡核苷酸。硫代磷酸酯键还促进与血清蛋白的结合，这增加了ASO的生物利用度并且促进生产性细胞摄取。在硫代磷酸酯中，硫原子替代寡磷酸酯主链中的非桥氧。ASO可以是包括DNA和经修饰的RNA碱基两者的嵌合体。在嵌合反义设计中使用经修饰的RNA，如2'-O-甲氧基-乙基(2'-MOE)RNA、2'-O-甲基(2'OMe)RNA或亲和力加锁定核酸碱基增加了核酸酶稳定性和反义寡核苷酸对靶RNA的亲和力(T_m)两者。然而，这些修饰不激活RNase H切割(即，ASO完全由经糖修饰的RNA样核苷酸(如2'-MOE)构成)，然而，不支持互补RNA的RNase H切割)。因此，一种反义策略是“缺口体(gapmer)”设计，其将2'-O-修饰的RNA或亲和力加锁定核酸碱基掺入保留RNase-H激活结构域的嵌合反义寡核苷酸中。标准缺口体保留了足以诱导RNase H切割的PS修饰的DNA碱基的中心区。这些碱基在两侧上侧接有2'修饰的将增加与靶标的结合亲和力的嵌段。例如，缺口体可以含有脱氧核苷酸的允许诱导RNase H切割的中心区段，其中中心部分侧接有保护中心区段免于核酸酶降解的2'-O-烷基修饰的核糖核苷酸的嵌段。一旦递送到细胞，ASO进入细胞核并且与其互补的内源性RNA靶标结合。ASO缺口体与靶RNA的杂交在中心区域中形成DNA:RNA异源双链体，其变为用于被酶RNase H1切割的底物。

在一个实例中，使用作为5-10-5缺口体的ASO，其含有侧接DNA的中心10个核苷酸核心的5个化学修饰的核苷酸的5'和3'翼。在具体实例中，使用作为5-10-5缺口体的ASO，其含有硫代磷酸酯主链、在翼中的2'甲氧基乙基修饰的碱基(来自两个末端的5个核苷酸)以及未经修饰的DNA碱基的10个核苷酸核心。参见例如图40。

在一个实例中，靶向mBanf1的ASO可以包括SEQ ID NO:215-236中任一个中所示的亲本反义RNA序列的修饰形式。在另一个实例中，靶向mBanf1的ASO可以包括SEQ ID NO:215、216、220-223、225、230-232、234和235中任一个中所示的亲本反义RNA序列的修饰形式。此类修饰可以包括例如以下中的一种或多种：用一个或多个DNA碱基替代一个或多个RNA碱基，添加一个或多个硫代磷酸酯键或用经修饰的RNA碱基，如2'-O-甲氧基-乙基(2'-MOE)RNA、2'-O-甲基(2'OMe)RNA或亲和力加锁定核酸替代一个或多个碱基。在一个实例中，靶向mBanf1的ASO可以包括SEQ ID NO:105-126中任一个中所示的序列或其修改形式。在另一个实例中，靶向mBanf1的ASO可以包括SEQ ID NO：105、106、110-113、115、120-122、124和125中任一个中所示的序列或其修改形式。此类修饰可以包括例如，添加一个或多个硫代磷酸酯键和/或用经修饰的RNA碱基，如2'-O-甲氧基-乙基(2'-MOE)RNA、2'-O-甲基(2'OMe)RNA或亲和力加锁定核酸替代一个或多个碱基。在另一个实例中，靶向mBanf1的ASO可以包括表13中所示的任何序列和/或修改模式。在任何上述序列中，前5个或最后5个核苷酸中的任何“T”可以被“U”替代。

在一个实例中，靶向mPpp2ca的ASO可以包括SEQ ID NO:237-278中任一个中所示的亲本反义RNA序列的修饰形式。在另一个实例中，靶向mPpp2ca的ASO可以包括SEQ ID NO:240、243、246、247、260、262、263、265、268-270、272、275和276中任一个中所示的亲本反义RNA序列的修饰形式。此类修饰可以包括例如以下中的一种或多种：用一个或多个DNA碱基替代一个或多个RNA碱基，添加一个或多个硫代磷酸酯键或用经修饰的RNA碱基，如2'-O-甲氧基-乙基(2'-MOE)RNA、2'-O-甲基(2'OMe)RNA或亲和力加锁定核酸替代一个或多个碱基。在一个实例中，靶向mPpp2ca的ASO可以包括SEQ ID NO:127-168中任一个中所示的序列或其修改形式。在另一个实例中，靶向mPpp2ca的ASO可以包括SEQ ID NO:130、133、136、137、150、152、153、155、158-160、162、165和166中任一个中所示的序列或其修改形式。此类修饰可以包括例如，添加一个或多个硫代磷酸酯键和/或用经修饰的RNA碱基，如2'-O-甲氧基-乙基(2'-MOE)RNA、2'-O-甲基(2'OMe)RNA或亲和力加锁定核酸替代一个或多个碱基。在另一个实例中，靶向mPpp2ca的ASO可以包括表14中所示的任何序列和/或修改模式。在任何上述序列中，前5个或最后5个核苷酸中的任何“T”可以被“U”替代。

在一个实例中，靶向mAnkle2的ASO可以包括SEQ ID NO:279-324中任一个中所示的亲本反义RNA序列的修饰形式。在另一个实例中，靶向mAnkle2的ASO可以包括SEQ ID NO:279、281-283、285、287、291-294、297、304、307、321和323中任一个中所示的亲本反义RNA序列的修饰形式。此类修饰可以包括例如以下中的一种或多种：用一个或多个DNA碱基替代一个或多个RNA碱基，添加一个或多个硫代磷酸酯键或用经修饰的RNA碱基，如2'-O-甲氧基-乙基(2'-MOE)RNA、2'-O-甲基(2'OMe)RNA或亲和力加锁定核酸替代一个或多个碱基。在一个实例中，靶向mAnkle2的ASO可以包括SEQ ID NO:169-214中任一个中所示的序列或其修改形式。在另一个实例中，靶向mAnkle2的ASO可以包括SEQ ID NO:169、171-173、175、177、181-184、187、194、197、211和213中任一个中所示的序列或其修饰形式。此类修饰可以包括例如，添加一个或多个硫代磷酸酯键和/或用经修饰的RNA碱基，如2'-O-甲氧基-乙基(2'-MOE)RNA、2'-O-甲基(2'OMe)RNA或亲和力加锁定核酸替代一个或多个碱基。在另一个实例中，靶向mAnkle2的ASO可以包括表15中所示的任何序列和/或修改模式。在任何上述序列中，前5个或最后5个核苷酸中的任何“T”可以被“U”替代。

III.制备改进的Tau蛋白病模型的方法和用于加速Tau蛋白病模型中的Tau聚集的方法

还提供了制备在本文其它地方详细公开的改进的tau蛋白病模型的方法。此类方法可以开始于预先存在的tau蛋白病模型(例如，包括外源性人tau编码序列的转基因细胞、组织或动物)。也就是说，此类方法可以是用于加速或加剧预先存在的tau蛋白病模型(例如，tau蛋白病模型非人动物、tau蛋白病模型动物组织或tau蛋白病模型动物细胞)中的tau聚集的方法。例如，此类方法可以包括将降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的一种或多种药剂引入到预先存在的tau蛋白病模型细胞、组织或动物(例如，包括外源性人微管相关蛋白tau编码序列的非人动物、动物组织或动物细胞群)中。可以使用在本文其它地方更详细地讨论的任何tau蛋白病模型。

已经开发了各种tau蛋白病模型。这些模型包含细胞/细胞培养模型(非神经元细胞系、如PC12、SY5Y和CN1.4细胞等神经元细胞系、原代神经元细胞)、组织模型(例如，脑片培养物，如器官型脑片培养物)和全动物转基因模型(例如，秀丽隐杆线虫、果蝇、斑马鱼或小鼠)。参见例如，Hall等人(2005),《生物化学与生物物理学报》1739:224-239；Brandt等人(2005),《生物化学与生物物理学报》1739:331-354；以及Lee等人(2005),《生物化学与生物物理学报》1739:251-259，所述文献中的每个文献出于所有目的通过引用整体并入本文。通常，此类模型是转基因模型，其中野生型或突变人tau同种型在各种启动子的控制下过表达，以产生神经原纤维病理。基于细胞的模型具有更容易操作和灵活性的优点，而整个动物模型(例如，转基因小鼠模型)更完全并且更直接地与人疾病相关。

一种特异性tau蛋白病模型是PS19(Tau P301S(系PS19)；PS19Tg；B6；C3-Tg(Prnp-MAPT*P301S)PS19Vle/J)小鼠系。这种品系的基因背景是C57BL/6x C3H。PS19转基因小鼠表达由小鼠朊病毒蛋白(Prnp)启动子驱动的突变人微管相关蛋白tau，MAPT。转基因编码疾病相关P301S突变，并且包含四个微管结合结构域和一个N-端插入物(4R/1N)。在Chr3:140354280-140603283处插入转基因(构建GRCm38/mm10)，从而引起不会影响任何已知基因的249Kb缺失。参见Goodwin等人(2019),《基因组研究》29(3):494-505，所述文献出于所有目的通过引用整体并入本文。突变人tau的表达比内源性小鼠蛋白的表达高五倍。参见Yoshiyama等人(2007),《神经元》53(3):337-351，所述文献出于所有目的通过引用整体并入本文。PS19小鼠在八个月年龄时患有神经元丢失和脑萎缩。所述小鼠还在新皮质、杏仁核、海马体、脑干和脊髓中形成广泛分布的tau聚集体，称为神经原纤维缠结样包涵体。参见Yoshiyama等人(2007)。在通过组织学方法出现明显的tau病理之前，显示这些小鼠的脑表现出tau接种活性。也就是说，存在于脑匀浆中的tau聚集体可能引起另外的tau聚集，推测是通过朊病毒样机制。参见Holmes(2014),《美国国家科学院院刊》111(41):E4376-E4385，所述文献出于所有目的通过引用整体并入本文。

其它此类方法不仅可以包括将降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的一种或多种药剂引入到非人动物、动物组织或动物细胞群中，而且还引入外源性微管相关蛋白tau编码序列(例如，外源性人微管相关蛋白tau编码序列)。此类编码序列的实例在本文其它地方更详细地讨论，如在关于改进的tau蛋白病模型的部分中。可以使用任何此类序列。

药剂(以及任选的tau编码序列)可以通过任何已知方式引入。“引入”包含以使得序列获得进入组织或动物内的细胞或细胞内部的方式向细胞或动物呈递药剂(例如，核酸或蛋白质)。本文提供的方法不依赖于用于引入药剂的特定方法，只要核酸或蛋白质获得进入至少一个细胞内部即可。用于将核酸和蛋白质引入到各种细胞类型中的方法是已知的，包含例如稳定转染方法、瞬时转染方法和病毒介导的方法。

引入到非人动物或细胞中的分子(例如，Cas蛋白或向导RNA或RNAi药剂或ASO)可以在包括增加所引入分子的稳定性(例如，延长在给定储存条件(例如，-20℃、4℃或环境温度)下降解产物保持在阈值以下的时间，如低于起始核酸或蛋白质重量的0.5％；或增加体内稳定性)的载体的组合物中。此类载体的非限制性实例包含聚(乳酸)(PLA)微球、聚(D,L-乳酸-乙醇酸共聚物)(PLGA)微球、质脂体、胶束、反胶束、脂质螺旋体和脂质微管。

本文提供了允许将分子(例如，核酸或蛋白质)引入到细胞或非人动物中的各种方法和组合物。用于将分子引入到各种细胞类型中的方法是已知的，并且包含例如稳定转染方法、瞬时转染方法和病毒介导的方法。

转染方案以及用于将分子(例如，核酸或蛋白质)引入到细胞中的方案可以不同。非限制性转染方法包含使用以下的基于化学的转染方法：脂质体；纳米颗粒；磷酸钙(Graham等人(1973),《病毒学(Virology)52(2):456-67；Bacchetti等人(1977),《美国国家科学院院刊》74(4):1590-4；以及Kriegler,M(1991).《转移和表达：实验室手册(Transferand Expression:ALaboratory Manual.)》纽约：W.H.弗里曼出版社(W.H.Freeman andCompany),第96-97页，所述文献中的每个文献出于所有目的通过引用整体并入本文)；树枝状聚合物；或阳离子聚合物，如DEAE葡聚糖或聚乙烯亚胺。非化学方法包含电穿孔、声穿孔和光转染。基于颗粒的转染包含使用基因枪或磁体辅助的转染(Bertram(2006),《当今药物生物技术(Current Pharmaceutical Biotechnology)》7,277-28)，所述文献出于所有目的通过引用整体并入本文。病毒方法也可以用于转染。

也可以通过电穿孔、胞质内注射、病毒感染、腺病毒、腺相关病毒、慢病毒、逆转录病毒、转染、脂质介导的转染或核转染来介导将分子(例如，核酸或蛋白质)引入到细胞中。核转染是使核酸底物不仅能够被递送到细胞质，而且能够通过核膜进入到细胞核中的改善的电穿孔技术。另外，在本文公开的方法中使用核转染通常需要比常规电穿孔少得多的细胞(例如，与常规电穿孔的700万相比，仅约200万)。在一个实例中，使用

NUCLEOFECTOR^TM系统进行核转染。

也可以通过显微注射将分子(例如，核酸或蛋白质)引入到细胞中。mRNA的显微注射优选地进入到细胞质中(例如，以将mRNA直接递送到翻译机器)，而蛋白质或对蛋白质进行编码的DNA的显微注射优选地进入到细胞核中。可替代地，可以通过注射到细胞核和细胞质两者中来进行显微注射：可以首先将针引入到细胞核中，并且注射第一量，并且在将针从细胞中去除时，可以将第二量注射到细胞质中。用于进行显微注射的方法是众所周知的。参见例如，Nagy等人(Nagy A、Gertsenstein M、Vintersten K、Behringer R.,2003,《操纵小鼠胚胎(Manipulating the Mouse Embryo.)》纽约冷泉港：冷泉港实验室出版社)；Meyer等人(2010),《美国国家科学院院刊》107:15022-15026和Meyer等人(2012),《美国国家科学院院刊》109:9354-9359，所述文献中的每个文献出于所有目的通过引用整体并入本文。

用于将分子(例如，核酸或蛋白质)引入到细胞中的其它方法可以包含例如载体递送、颗粒介导的递送、外泌体介导的递送、脂质纳米颗粒介导的递送、细胞穿透性肽介导的递送或可植入装置介导的递送。向受试者施用核酸或蛋白质以在体内修饰细胞的方法在本文其它地方公开。作为具体实例，可以将分子(例如，核酸或蛋白质)以如聚(乳酸)(PLA)微球体、聚(D,L-乳酸-乙醇酸共聚物)(PLGA)微球体、脂质体、胶束、反胶束、脂质螺旋体或脂质微管等载体引入到细胞或非人动物中。向非人动物递送的一些具体实例包含流体动力学递送、病毒介导的递送(例如，腺相关病毒(AAV)介导的递送)和脂质纳米颗粒介导的递送。

在一个实例中，药剂(以及任选地tau编码序列)可以通过如慢病毒转导或腺相关病毒转导等病毒转导来引入。

在一些方法中，CRISPR/Cas系统的组分被引入到非人动物或细胞中。可以将向导RNA以RNA的形式(例如，体外转录的RNA)或对向导RNA进行编码的DNA的形式引入到非人动物或细胞中。当以DNA的形式引入时，对向导RNA进行编码的DNA可以与在非人动物的细胞中具有活性的启动子可操作地连接。例如，向导RNA可以通过AAV递送，并在U6启动子下在体内表达。此类DNA可以在一种或多种表达构建体中。例如，此类表达构建体可以是单个核酸分子的组分。可替代地，其可以在两个或多个核酸分子之间以任何组合分离(即，对一种或多种CRISPR RNA进行编码的DNA和对一种或多种tracrRNA进行编码的DNA可以是单独的核酸分子的组分)。

同样地，Cas蛋白可以以任何形式提供。例如，Cas蛋白可以以蛋白质的形式提供，如与gRNA复合的Cas蛋白。可替代地，可以以对Cas蛋白进行编码的核酸形式提供Cas蛋白，如RNA(例如，信使RNA(mRNA))或DNA。任选地，可以对编码Cas蛋白的核酸进行密码子优化以在特定细胞或生物体中有效翻译成蛋白质。例如，可以修饰对Cas蛋白进行编码的核酸以取代与天然存在的多核苷酸序列相比在哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它所关注宿主细胞中具有更高使用频率的密码子。当对Cas蛋白进行编码的核酸被引入到非人动物中时，Cas蛋白可以在非人动物的细胞中瞬时地、有条件地或组成性地表达。

对Cas蛋白或向导RNA进行编码的核酸可以与表达构建体中的启动子可操作地连接。表达构建体包含能够指导基因或其它所关注核酸序列(例如，Cas基因)的表达并且可以将此类所关注核酸序列转移到靶细胞的任何核酸构建体。例如，对Cas蛋白进行编码的核酸可以在包括编码一种或多种gRNA的DNA的载体中。可替代地，其可以在与包括对一种或多种gRNA进行编码的DNA的载体分离的载体或质粒中。可以用于表达构建体的合适的启动子包含例如在真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能性细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导性多能干(iPS)细胞或单细胞期胚胎中的一个或多个中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。任选地，启动子可以是在一个方向上驱动Cas蛋白的表达并且在另一个方向上驱动向导RNA的表达的双向启动子。此类双向启动子可以由以下组成：(1)含有3个外部控制元件：远侧序列元件(DSE)、近侧端序列元件(PSE)和TATA框的完整的、常规的、单向的Pol III启动子；(2)包含在相反取向上与DSE的5'端融合PSE和TATA盒的第二基本Pol III启动子。例如，在H1启动子中，DSE邻近PSE和TATA框，并且可以通过产生杂合启动子使启动子双向化，其中通过源自U6启动子的附加PSE和TATA盒来控制反向转录。参见例如US 2016/0074535，所述文献出于所有目的通过引用整体并入本文。使用双向启动子同时表达对Cas蛋白和向导RNA进行编码的基因允许生成紧凑表达盒以促进递送。

核酸酶药剂的引入也可以通过如AAV介导的递送或慢病毒介导的递送等病毒介导的递送来完成。其它示例性病毒/病毒性载体包含逆转录病毒、腺病毒、牛痘病毒、痘病毒和单纯疱疹病毒。病毒可以感染分裂细胞、非分裂细胞或分裂细胞和非分裂细胞两者。病毒可以整合到宿主基因组中，或者可替代地不整合到宿主基因组中。此类病毒还可以被工程化为具有降低的免疫力。病毒可能具有复制能力，也可能具有复制缺陷(例如，在另外轮次的病毒粒子复制和/或包装所必需的一个或多个基因中存在缺陷)。病毒可以引起瞬时表达、长期表达(例如，至少1周、2周、1个月、2个月或3个月)或永久表达(例如，Cas9和/或gRNA)。示例性病毒滴度(例如，AAV滴度)包含约10¹²个、约10¹³个、约10¹⁴个、约10¹⁵个和约10¹⁶个载体基因组/毫升。其它示例性病毒滴度(例如，AAV滴度)包含约10¹²个、约10¹³个、约10¹⁴个、约10¹⁵个和约10¹⁶个载体基因组(vg)/kg体重。

ssDNAAAV基因组由两个开放阅读框Rep和Cap组成，其侧接有允许合成互补DNA链的两个反向末端重复序列。当构建AAV转移质粒时，转基因放置在两个ITR之间，并且Rep和Cap可以反式提供。除了Rep和Cap之外，AAV还可能需要含有腺病毒基因的辅助质粒。这些基因(E4、E2a和VA)介导AAV复制。例如，转移质粒、Rep/Cap和辅助质粒可以转染到含有腺病毒基因E1+的HEK293细胞中，以产生感染性AAV颗粒。可替代地，将Rep、Cap和腺病毒辅助基因可以组合成单个质粒。相似的包装细胞和方法可以用于其它病毒，如逆转录病毒。

已经鉴定了AAV的多种血清型。这些血清型在其感染的细胞类型(即，其趋向性)方面不同，允许优先转导特定细胞类型。CNS组织的血清型包含AAV1、AAV2、AAV4、AAV5、AAV8和AAV9。心脏组织的血清型包含AAV1、AAV8和AAV9。肾组织的血清型包含AAV2。肺组织的血清型包含AAV4、AAV5、AAV6和AAV9。胰腺组织的血清型包含AAV8。感光细胞的血清型包含AAV2、AAV5和AAV8。视网膜色素上皮组织的血清型包含AAV1、AAV2、AAV4、AAV5和AAV8。骨骼肌组织的血清型包含AAV1、AAV6、AAV7、AAV8和AAV9。肝组织的血清型包含AAV7、AAV8和AAV9，并且特别是AAV8。AAV血清型在神经元中用于基因递送的选择性例如在Hammond等人(2017),《公共科学图书馆·综合(PLoS One)》12(12):e0188830中进行了讨论，所述文献出于所有目的通过引用整体并入本文。

趋向性可以通过假型进一步细化，所述假型即混合来自不同病毒血清型的衣壳和基因组。例如，AAV2/5指示包装在来自血清型5的衣壳中的含有血清型2基因组的病毒。使用假型病毒可以提高转导效率以及改变趋向性。源自不同血清型的杂交衣壳也可以用于改变病毒趋向性。例如，AAV-DJ含有来自八种血清型的杂交衣壳，并在广泛的体内细胞类型中表现出高感染性。AAV-DJ8是显示AAV-DJ性质的另一个实例，但具有增强的脑摄取。AAV血清型还可以通过突变进行修饰。AAV2突变修饰的实例包含Y444F、Y500F、Y730F和S662V。AAV3突变修饰的实例包含Y705F、Y731F和T492V。AAV6突变修饰的实例包含S663V和T492V。其它假型的/经修饰的AAV变体包含AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5、AAV8.2和AAV/SASTG。

为了加速转基因表达，可以使用自身互补型AAV(scAAV)变体。由于AAV依赖于细胞的DNA复制机制来合成AAV单链DNA基因组的互补链，因此转基因表达可能会延迟。为了解决这种延迟问题，可以使用含有能够在感染后自发退火的互补序列的scAAV，从而消除对宿主细胞DNA合成的需要。然而，也可以使用单链AAV(ssAAV)载体。

为了提高包装能力，可以将较长的转基因在两个AAV转移质粒之间拆分，第一个具有3'剪接供体并且第二个具有5'剪接受体。在细胞共感染后，这些病毒形成多联体，拼接在一起，并且全长转基因可以被表达。虽然这允许更长的转基因表达，但表达效率较低。用于增加容量的相似方法利用同源重组。例如，转基因可以在两个转移质粒之间分开但是具大量的序列重叠，使得共表达诱导全长转基因的同源重组和表达。

核酸和蛋白质的引入也可以通过脂质纳米颗粒(LNP)介导的递送来完成。例如，LNP介导的递送可以用于递送Cas mRNA和向导RNA的组合或Cas蛋白和向导RNA的组合。通过此类方法递送可以导致瞬时Cas表达，并且可生物降解脂质可以提高清除率、提高耐受性并降低免疫原性。脂质调配物可以保护生物分子免于降解，同时改善其细胞摄取。脂质纳米颗粒是包括通过分子间力彼此物理相关的多个脂质分子的颗粒。这些颗粒包含微球体(包含单层和多层囊泡，例如，脂质体)、乳液中的分散相、胶束或悬浮液中的内相。此类脂质纳米颗粒可以用于封装一个或多个核酸或蛋白质以供递送。含有阳离子脂质的调配物可用于递送如核酸等聚阴离子。其它可以包含在内的脂质是中性脂质(即，不带电荷或两性离子脂质)、阴离子脂质、增强转染的辅助脂质和增加纳米颗粒可以在体内存在的时间长度的隐形脂质。合适的阳离子脂质、中性脂质、阴离子脂质、辅助脂质和隐形脂质的实例可以在WO2016/010840 A1中找到，所述文献出于所有目的通过引用整体并入本文。示例性脂质纳米颗粒可以包括阳离子脂质和一种或多种其它组分。在一个实例中，其它组分可以包括如胆固醇等辅助脂质。在另一个实例中，其它组分可以包括如胆固醇等辅助脂质和如DSPC等中性脂质。在另一个实例中，其它组分可以包括如胆固醇等辅助脂质、如DSPC等任选的中性脂质以及如S010、S024、S027、S031或S033等隐形脂质。

LNP可以含有以下中的一种或多种或全部：(i)用于封装和用于内体逃逸的脂质；(ii)用于稳定的中性脂质；(iii)用于稳定的辅助脂质；(iv)隐形脂质。参见例如，Finn等人(2018),《细胞报告》22(9):2227-2235和WO 2017/173054 A1，所述文献中的每个文献出于所有目的通过引用整体并入本文。在某些LNP中，负荷物可以包含向导RNA或对向导RNA进行编码的核酸。在某些LNP中，负荷物可以包含对如Cas9等Cas核酸酶进行编码的mRNA以及向导RNA或对向导RNA进行编码的核酸。

用于包封和内体逃逸的脂质可以是阳离子脂质。脂质还可以是可生物降解脂质，如可生物降解可电离脂质。合适的脂质的一个实例是脂质A或LP01，即(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八-9,12-二烯酸酯，也被称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八-9,12-二烯酸酯。参见例如，Finn等人(2018),《细胞报告》22(9):2227-2235和WO 2017/173054 A1，所述文献中的每个文献出于所有目的通过引用整体并入本文。合适的脂质的另一个实例是脂质B，即((5-((二甲氨基)甲基)-1,3-亚苯基)双(氧))双(辛烷-8,1-二基)双(癸酸酯)，也被称为((5-((二甲氨基)甲基)-1,3-亚苯基)双(氧基))双(辛烷-8,1-二基)双(癸酸酯)。合适的脂质的另一个实例是脂质C，即2-((4-(((3-(二甲氨基)丙氧基)羰基)氧基)十六酰基)氧基)丙烷-1,3-二基(9Z,9'Z,12Z,12'Z)-双(十八-9,12-二烯酸酯)。合适的脂质的另一个实例是脂质D，即3-(((3-(二甲氨基)丙氧基)羰基)氧基)-13-(辛酰氧基)十三烷基3-辛基十一烷酸酯。其它合适的脂质包含三十七-6,9,28,31-四烯-19-基4-(二甲氨基)丁酸酯(也被称为Dlin-MC3-DMA(MC3))。

适用于本文所述的LNP的一些此类脂质在体内是生物可降解的。例如，包括此类脂质的LNP包含在8小时、10小时、12小时、24小时或48小时或3天、4天、5天、6天、7天或10天内从血浆中清除脂质的至少75％的那些。作为另一个实例，LNP的至少50％在8小时、10小时、12小时、24小时或48小时或3天、4天、5天、6天、7天或10天内从血浆中清除。

根据其所在的介质的pH值，此类脂质可以是可电离的。例如，在微酸性介质中，脂质可以被质子化并且因此带有正电荷。相反，在弱碱性介质中，例如在pH大约为7.35的血液中，脂质可能不会被质子化并且因此不带电荷。在一些实施例中，脂质可以在至少约9、9.5或10的pH下质子化。这种脂质带电荷的能力与其固有pKa有关。例如，脂质的pKa可以独立地处于约5.8到约6.2的范围内。

中性脂质的作用是稳定和改善LNP的处理。合适的中性脂质的实例包含各种中性、不带电荷或两性离子脂质。适用于本公开的中性磷脂的实例包含但不限于5-十七烷基苯-1,3-二醇(间苯二酚)、二棕榈酰磷脂酰胆碱(DPPC)、二硬脂酰磷脂酰胆碱(DSPC)、磷酸胆碱(DOPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、磷脂酰胆碱(PLPC)、1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(DAPC)、磷脂酰乙醇胺(PE)、卵磷脂酰胆碱(EPC)、二月桂酰磷脂酰胆碱(DLPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、1-肉豆蔻酰-2-棕榈酰磷脂酰胆碱(MPPC)、1-棕榈酰-2-肉豆蔻酰磷脂酰胆碱(PMPC)、1-棕榈酰-2-硬脂酰磷脂酰胆碱(PSPC)、1,2-二花生酰-sn-甘油-3-磷酸胆碱(DBPC)、1-硬脂酰-2-棕榈酰磷脂酰胆碱(SPPC)、1,2-二二十碳烯酰-sn-甘油-3-磷酸胆碱(DEPC)、棕榈酰油酰磷脂酰胆碱(POPC)、溶血磷脂酰胆碱、二油酰磷脂酰乙醇胺(DOPE)、二亚油酰磷脂酰胆碱二硬脂酰磷脂酰乙醇胺(DSPE)、二肉豆蔻酰磷脂酰乙醇胺(DMPE)、二棕榈酰磷脂酰乙醇胺(DPPE)、棕榈酰油酰磷脂酰乙醇胺(POPE)、溶血磷脂酰乙醇胺和其组合。例如，中性磷脂可以选自由二硬脂酰磷脂酰胆碱(DSPC)和二肉豆蔻酰磷脂酰乙醇胺(DMPE)组成的组。

辅助脂质包含增强转染的脂质。辅助脂质增强转染的机制可以包含增强颗粒稳定性。在某些情况下，辅助脂质可以增强膜融合性。辅助脂质包含类固醇、甾醇和烷基间苯二酚。合适的辅助脂质的实例包含胆固醇、5-十七烷基间苯二酚和胆固醇半琥珀酸酯。在一个实例中，辅助脂质可以是胆固醇或胆固醇半琥珀酸酯。

隐形脂质包含改变纳米颗粒可以在体内存在的时间长度的脂质。隐形脂质可以通过例如减少颗粒聚集和控制粒度来帮助调配过程。隐形脂质可以调节LNP的药代动力学性质。合适的隐形脂质包含具有连接到脂质部分的亲水性头部基团的脂质。

隐形脂质的亲水性头部基团可以包括例如选自基于PEG(有时称为聚(环氧乙烷))、聚(噁唑啉)、聚(乙烯醇)、聚(甘油)、聚(N-乙烯基吡咯烷酮)、聚氨基酸和聚N-(2-羟丙基)甲基丙烯酰胺的聚合物的聚合物部分。术语PEG意指任何聚乙二醇或其它聚亚烷基醚聚合物。在某些LNP调配物中，PEG是PEG-2K，也被称为PEG 2000，其平均分子量为约2,000道尔顿。参见例如WO 2017/173054 A1，所述文献出于所有目的通过引用整体并入本文。

隐形脂质的脂质部分可以衍生自例如二酰基甘油或二烷基甘酰胺，其包含包括二烷基甘油或二烷基甘酰胺基团的那些，所述二烷基甘油或二烷基甘酰胺基团具有独立地包括约C4到约C40个饱和或不饱和碳原子的烷基链长度，其中链可以包括一个或多个官能团，例如酰胺或酯。二酰基甘油或二烷基甘酰胺基团可以进一步包括一个或多个经取代的烷基。

作为一个实例，隐形脂质可以选自PEG-二月桂酸甘油酯、PEG-二肉豆蔻酰甘油(PEG-DMG)、PEG-二棕榈酰甘油、PEG-二硬脂酰甘油(PEG-DSPE)、PEG-二月桂甘酰胺、PEG-二肉豆蔻甘酰胺、PEG-二棕榈酰甘酰胺和PEG-二硬脂酰甘酰胺、PEG-胆固醇(l-[8'-(胆甾-5-en-3[β]-氧基)甲酰胺基-3',6'-二氧杂辛基]氨甲酰基-[ω]-甲基-聚(乙二醇)、PEG-DMB(3,4-二十四烷基苄基-[ω]-甲基-聚(乙二醇)醚)、1,2-二肉豆蔻酰-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG)、1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE)、1,2-二硬脂酰-sn-甘油、甲氧基聚乙烯乙二醇(PEG2k-DSG)、聚(乙二醇)-2000-二甲基丙烯酸酯(PEG2k-DMA)和1,2-二硬脂氧基丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一个特定实例中，隐形脂质可以是PEG2k-DMG。

LNP可以包括调配物中相应摩尔比的组分脂质。CCD脂质的mol-％可以为例如约30mol-％到约60mol-％、约35mol-％到约55mol-％、约40mol-％到约50mol-％、约42mol-％到约47mol-％或约45％。辅助脂质的mol-％可以为例如约30mol-％到约60mol-％、约35mol-％到约55mol-％、约40mol-％到约50mol-％、约41mol-％到约46mol-％或约44mol-％。中性脂质的mol-％可以为例如约1mol-％到约20mol-％、约5mol-％到约15mol-％、约7mol-％到约12mol-％或约9mol-％。隐形脂质的mol-％可以为例如约1mol-％到约10mol-％、约1mol-％到约5mol-％、约1mol-％到约3mol-％、约2mol-％或约1mol-％。

LNP在生物可降解脂质(N)的带正电荷的胺基团与待封装的核酸的带负电荷的磷酸基团(P)之间可以具有不同的比率。这可以由等式N/P在数学上表示。例如，N/P比率可以为约0.5到约100、约1到约50、约1到约25、约1到约10、约1到约7、约3到约5、约4到约5、约4、约4.5或约5。N/P比率也可以是约4到约7或约4.5到约6。在具体实例中，N/P比率可以为4.5或者可以为6。

在一些LNP中，货物可以包括Cas mRNA和gRNA。Cas mRNA和gRNA的比率可以不同。例如，LNP调配物的Cas mRNA与gRNA核酸的比率的范围可以为约25:1到约1:25、约10:1到约1:10、约5:1到约1:5或为约1:1。可替代地，LNP调配物的Cas mRNA与gRNA核酸的比率可以为约1:1到约1:5或约10:1。可替代地，LNP调配物的Cas mRNA与gRNA核酸的比率可以为约1:10、25:1、10:1、5:1、3:1、1:1、1:3、1:5、1:10或1:25。可替代地，LNP调配物可以包含约1:1到约1:2的Cas mRNA与gRNA核酸的比率。在具体实例中，Cas mRNA与gRNA的比率可以为约1:1或约1:2。

使用LNP递送到脑的具体实例公开于Nabhan等人(2016),《科学报告(Sci.Rep.)》6:20019中，所述文献出于所有目的通过引用整体并入本文。

体内施用可以通过任何合适的途径，包含例如肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌肉内施用。全身施用方式包含例如口服和肠胃外途径。肠胃外途径的实例包含静脉内、动脉内、骨内、肌肉内、皮内、皮下、鼻内和腹膜内途径。具体的实例是静脉输液。鼻滴注和玻璃体内注射是其它具体实例。局部施用方式包含例如鞘内、脑室内、脑实质内(例如，局部脑实质内递送到纹状体(例如，进入尾状核或进入壳核种)、大脑皮层、中央前回、海马体(例如，进入齿状回或CA3区域)、颞叶皮层、杏仁核、额叶皮层、丘脑、小脑、髓质、下丘脑、顶盖、被盖或黑质)、眼内、眶内、结膜下、玻璃体内、视网膜下和经巩膜途径。与全身施用(例如，静脉内)相比，当局部施用(例如，脑实质内或玻璃体内)时，显著更少量的组分(与全身方法相比)可以发挥作用。局部施用方式还可以降低或消除当全身施用治疗有效量的组分时可能发生的潜在毒副作用的发生率。在具体实例中，向动物进行的施用是通过鞘内注射或通过颅内注射(例如，用于在海马体和其它脑区中注射的立体定向手术或脑室内注射)来进行的。

施用频率和剂量数可以取决于药剂的半衰期和施用途径等因素。将核酸或蛋白质引入到细胞或非人动物中可以在一段时间内执行一次或多次。例如，引入可以按以下频率执行：一段时间内至少两次、一段时间内至少三次、一段时间内至少四次、一段时间内至少五次、一段时间内至少六次、一段时间内至少七次、一段时间内至少八次、一段时间内至少九次、一段时间内至少十次、至少十一次、一段时间内至少十二次、一段时间内至少十三次、一段时间内至少十四次、一段时间内至少十五次、一段时间内至少十六次、一段时间内至少十七次、一段时间内至少十八次、一段时间内至少十九次或一段时间内至少二十次。

此类方法可以进一步包括对细胞、组织或动物进行筛选，以确认一种或多种药剂(以及任选地tau编码序列)的存在。可以通过任何已知方式对包括药剂(以及任选地tau编码序列)的细胞、组织或动物进行筛选。

举例来说，报告基因可以用于筛选具有药剂(或任选地tau编码序列)的细胞。例如，tau编码序列可以编码与如荧光蛋白等报道基因融合的tau蛋白。示例性报告基因包含对以下进行编码的那些报告基因：荧光素酶、β-半乳糖苷酶、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)、蓝色荧光蛋白(BFP)、增强型蓝色荧光蛋白(eBFP)、DsRed、ZsGreen、MmGFP、mPlum、mCherry、tdTomato、mStrawberry、J-Red、mOrange、mKO、mCitrine、Venus、YPet、祖母绿、CyPet、天蓝、T-蓝宝石和碱性磷酸酶。例如，如果第一报告基因和第二报告基因是荧光蛋白(例如，CFP和YFP)，则可以通过流式细胞术选择包括这些报告基因的细胞以选择双阳性细胞。然后可以将双阳性细胞组合以产生多克隆系，或者可以从单个双阳性细胞产生单克隆系。

作为另一个实例，选择标志物可以用于筛选具有药剂(或任选地tau编码序列)的细胞。示例性选择标志物包含新霉素磷酸转移酶(neo^r)、潮霉素B磷酸转移酶(hyg^r)、嘌呤霉素-N-乙酰转移酶(puro^r)、杀稻瘟素S脱氨酶(bsr^r)、黄嘌呤/鸟嘌呤磷酸核糖转移酶(gpt)或单纯疱疹病毒胸苷激酶(HSV-k)。

然后可以通过任何合适的方法用tau聚集体接种细胞或组织。这可以例如在引入一种或多种药剂(以及任选地tau编码序列)后在培养物中约1天、约2天、约3天、约4天、约5天、约6天、约1周、约2周或约3周(例如，在培养物中约1周)之后进行。可替代地，可以在引入一种或多种药剂(以及任选地tau编码序列)之前用tau聚集体接种细胞或组织。例如，细胞或组织可以用重组纤维化tau(例如，重组纤维化tau重复结构域)处理以接种由这些细胞稳定表达的tau重复结构域蛋白的聚集。tau细胞间传播也可能是由含有聚集体的细胞分泌的tau聚集活性引起的。例如，可以使用从经培养的tau聚集阳性细胞中收获的条件培养基培养细胞或组织，其中tau重复结构域以聚集状态稳定地存在。条件培养基是指从经培养的细胞中采集的用过的培养基。所述条件培养基含有由经培养的细胞分泌到培养基中的代谢物、生长因子和细胞外基质蛋白。举例来说，条件培养基可以通过收集已经在汇合的tau聚集阳性Agg[+]细胞上的培养基来产生。培养基可以已经处于汇合的Agg[+]细胞上持续约12小时、约24小时、约2天、约3天、约4天、约5天、约6天、约7天、约8天、约9天或约10天。例如，培养基可以已经处于汇合的Agg[+]细胞上持续约1到约7天、约2到约6天、约3到约5天或约4天。然后可以将条件培养基与新鲜培养基组合应用于细胞或组织。条件培养基与新鲜培养基的比率可以是例如约10:1、约9:1、约8:1、约7:1、约6:1、约5:1、约4:1、约3:1、约2:1、约1:1、约1:2、约1:3、约1:4、约1:5、约1:6、约1:7、约1:8、约1:9或约1:10。例如，条件培养基与新鲜培养基的比率可以是约5:1到约1:1、约4:1到约2:1或约3:1。例如，条件培养基的使用可以包括在以下中培养经基因修饰的细胞群：约90％条件培养基和约10％新鲜培养基、约85％条件培养基和约15％新鲜培养基、约80％条件培养基和约20％新鲜培养基、约75％条件培养基和约25％新鲜培养基、约70％条件培养基和约30％新鲜培养基、约65％条件培养基和约35％新鲜培养基、约60％条件培养基和约40％新鲜培养基、约55％条件培养基和约45％新鲜培养基、约50％条件培养基和约50％新鲜培养基、约45％条件培养基和约55％新鲜培养基、约40％条件培养基和约60％新鲜培养基、约35％条件培养基和约65％新鲜培养基、约30％条件培养基和约70％新鲜培养基、约25％条件培养基和约75％新鲜培养基、约20％条件培养基和约80％新鲜培养基、约15％条件培养基和约85％新鲜培养基或约10％条件培养基和约90％新鲜培养基。在一个实例中，条件培养基的使用可以包括在包括至少约50％条件培养基和不超过约50％新鲜培养基的培养基中培养经基因修饰的细胞群。在具体实例中，条件培养基的使用可以包括在约75％条件培养基和约25％新鲜培养基中培养经基因修饰的细胞群。

可以在不共培养的情况下使用条件培养基。不具有共培养的条件培养基之前没有在此上下文中用作接种剂。然而，条件培养基对于大规模全基因组筛选特别有用，因为体外产生的tau纤维是有限的资源。另外，条件培养基更具有生理相关性，因为其是由细胞产生，而不是体外产生。如本文所描述的条件培养基的使用提供了tau接种活性的增强(例如，如本文别处公开的通过FRET诱导测量的约0.1％)以使细胞对tau聚集敏化。

然后可以通过任何合适的方式评估tau蛋白病的一种或多种体征或症状。此类体征和症状的实例在本文其它地方进行更详细地讨论，并且包含例如tau过度磷酸化或tau聚集。其它体征或症状可以包含例如细胞分级分离后，不溶性级分中的tau和/或磷酸化tau增加、神经元的体树突状区室中的磷酸化tau增加、神经元的核周区中的磷酸化tau增加、神经元中的核孔复合物蛋白Nup98-Nup96(Nup98)核质比降低、神经元中的GTP结合核蛋白Ran(Ran)核质比降低或神经元中的Ran GTP酶活化蛋白1(RanGAP1)核质比降低。磷酸化tau可以是例如磷酸化tau(S356)或磷酸化tau AT8(S202，T205)。这可以例如在tau接种之后或在引入一种或多种药剂(以及任选地tau编码序列)之后约1周、约2周、约3周、约4周、约5周、约6周或更长时间进行。例如，可以在tau接种之后或在引入一种或多种药剂(以及任选地tau编码序列)之后约2周到约6周或约3周到约5周进行评估。

IV.测试候选物tau蛋白病治疗剂的方法

提供了用于使用在本文其它地方详细公开的改进的tau蛋白病模型来鉴定或评估用于治疗tau蛋白病的治疗剂候选物的各种方法。此类方法可以包括例如向如在本文其它地方公开的改进的tau蛋白病模型(例如，如在本文其它地方公开的动物、组织或细胞)施用候选药剂；进行一项或多项测定以确定候选药剂是否对与tau蛋白病相关的一种或多种体征或症状具有影响；以及如果候选药剂对与tau蛋白病相关的一种或多种体征或症状具有影响，则将候选药剂鉴定为治疗剂候选物。

可以测试任何候选药剂。此类候选物可以包括例如如siRNA、抗体或CRISPR/CasgRNA等大分子或小分子。可以通过任何方式通过任何合适的途径，向非人动物或非人动物细胞施用候选药剂。

可以使用测量与tau蛋白病相关的体征或症状的任何测定。此类体征和症状的实例公开于本文其它地方。作为第一实例，体征或症状可以是tau过度磷酸化(例如，如实例中所示的AT8染色)。作为第二实例，体征或症状可以是tau聚集(例如，如实例中所示的硫黄素S染色)。其它体征或症状可以包含例如细胞分级分离后，不溶性级分中的tau和/或磷酸化tau增加、神经元的体树突状区室中的磷酸化tau增加、神经元的核周区中的磷酸化tau增加、神经元中的核孔复合物蛋白Nup98-Nup96(Nup98)核质比降低、神经元中的GTP结合核蛋白Ran(Ran)核质比降低或神经元中的Ran GTP酶活化蛋白1(RanGAP1)核质比降低。磷酸化tau可以是例如磷酸化tau(S356)或磷酸化tau AT8(S202，T205)。

可以向动物体内施用候选药剂，并且可以在动物中进行一项或多项测定。可替代地，可以向动物体内施用候选药剂，并且一项或多项测定可以在施用候选药剂之后在从动物分离的细胞中在体外进行。可替代地，候选药剂可以在体外施用于细胞(例如，神经元)或离体施用于组织(例如，脑片，如器官型脑片培养物)，并且这些测定可以在体外在细胞中或离体在组织中进行。

任选地，在施用候选药剂之前或之后，可以通过任何合适的方式用tau聚集体接种细胞或组织。例如，细胞或组织可以用重组纤维化tau(例如，重组纤维化tau重复结构域)处理以接种由这些细胞稳定表达的tau重复结构域蛋白的聚集。tau细胞间传播也可能是由含有聚集体的细胞分泌的tau聚集活性引起的。例如，可以使用从经培养的tau聚集阳性细胞中收获的条件培养基培养细胞或组织，其中tau重复结构域以聚集状态稳定地存在。条件培养基是指从经培养的细胞中采集的用过的培养基。所述条件培养基含有由经培养的细胞分泌到培养基中的代谢物、生长因子和细胞外基质蛋白。举例来说，条件培养基可以通过收集已经在汇合的tau聚集阳性Agg[+]细胞上的培养基来产生。培养基可以已经处于汇合的Agg[+]细胞上持续约12小时、约24小时、约2天、约3天、约4天、约5天、约6天、约7天、约8天、约9天或约10天。例如，培养基可以已经处于汇合的Agg[+]细胞上持续约1到约7天、约2到约6天、约3到约5天或约4天。然后可以将条件培养基与新鲜培养基组合应用于细胞或组织。条件培养基与新鲜培养基的比率可以是例如约10:1、约9:1、约8:1、约7:1、约6:1、约5:1、约4:1、约3:1、约2:1、约1:1、约1:2、约1:3、约1:4、约1:5、约1:6、约1:7、约1:8、约1:9或约1:10。例如，条件培养基与新鲜培养基的比率可以是约5:1到约1:1、约4:1到约2:1或约3:1。例如，条件培养基的使用可以包括在以下中培养经基因修饰的细胞群：约90％条件培养基和约10％新鲜培养基、约85％条件培养基和约15％新鲜培养基、约80％条件培养基和约20％新鲜培养基、约75％条件培养基和约25％新鲜培养基、约70％条件培养基和约30％新鲜培养基、约65％条件培养基和约35％新鲜培养基、约60％条件培养基和约40％新鲜培养基、约55％条件培养基和约45％新鲜培养基、约50％条件培养基和约50％新鲜培养基、约45％条件培养基和约55％新鲜培养基、约40％条件培养基和约60％新鲜培养基、约35％条件培养基和约65％新鲜培养基、约30％条件培养基和约70％新鲜培养基、约25％条件培养基和约75％新鲜培养基、约20％条件培养基和约80％新鲜培养基、约15％条件培养基和约85％新鲜培养基或约10％条件培养基和约90％新鲜培养基。在一个实例中，条件培养基的使用可以包括在包括至少约50％条件培养基和不超过约50％新鲜培养基的培养基中培养经基因修饰的细胞群。在具体实例中，条件培养基的使用可以包括在约75％条件培养基和约25％新鲜培养基中培养经基因修饰的细胞群。

然后可以在接种之后或在施用候选药剂之后的任何合适的时间通过任何合适的方式评估tau蛋白病的一种或多种体征或症状。这可以例如在tau接种之后或在施用候选药剂之后约1周、约2周、约3周、约4周、约5周、约6周或更长时间进行。例如，可以在tau接种之后或在施用候选药剂之后约2周到约6周或约3周到约5周进行评估。

出于所有目的，上文或下文引用的所有专利申请、网站、其它出版物、登录号等都通过引用整体并入，其程度如同每个单独的项目被单独并且具体地指出通过引用的方式并入。如果序列的不同版本与不同时间的登录号相关联，则意指在本申请的有效提交日期与登录号相关联的版本。有效提交日期是指实际提交日期或提及登记号的优先权申请的提交日期(在适用情况下)中较早的日期。同样地，如果出版物、网站等的不同版本在不同时间发布，除非另有说明，否则指在申请的有效提交日期最近发布的版本。除非另外具体说明，否则本发明的任何特征、步骤、元件、实施例或方面都可以与任何其它特征、步骤、元件、实施例或方面结合使用。尽管为了清楚和理解起见，已通过图解和实例方式详细地对本发明进行了描述，但显而易见的是，可以在所附权利要求的范围内进行某些改变和修改。

序列简要说明

使用核苷酸碱基的标准字母缩写和氨基酸的三字母代码示出随附序列表中列出的核苷酸和氨基酸序列。核苷酸序列遵循从序列的5'末端开始并且向前(即，在每行中从左到右)到达3'末端的标准惯例。每个核苷酸序列仅示出一条链，但任何提及的显示链均应理解为包含互补链。当提供对氨基酸序列进行编码的核苷酸序列时，应当理解的是还提供了其对相同氨基酸序列进行编码的密码子简并变体。氨基酸序列遵循从序列的氨基端开始并且向前(即，在每行中从左到右)到达羧基端的标准惯例。

表2：序列描述。

实例

实例1：用于鉴定tau聚集的基因修饰物的全基因组CRISPR/Cas9筛选平台的开发

蛋白质的异常聚集或纤维化是许多疾病的定义性特征，所述疾病值得注意地包含多种神经变性疾病，如阿尔茨海默氏病(AD)、帕金森氏病(Parkinson's disease，PD)、额颞痴呆(FTD)、肌萎缩性侧索硬化(ALS)、慢性创伤性脑病(CTE)、克雅氏病(Creutzfeldt-Jakob disease，CJD)等。在许多这些疾病中，某些蛋白质纤维化成不溶性聚集体不仅是疾病的标志，而且还被认为是神经毒性的致病因素。此外，这些疾病的特征是聚集病理学按照刻板模式通过中枢神经系统传播，这一过程与疾病进展相关。因此，鉴定修饰异常蛋白质聚集过程或聚集体细胞间增殖过程的基因和基因途径对于更好地理解神经变性疾病的病因以及制定治疗干预策略方面具有重要价值。

为了鉴定修饰异常tau蛋白聚集过程的基因和途径，开发了一种用于利用CRISPR核酸酶(CRISPRn)sgRNA文库进行全基因组筛选以鉴定调节细胞被tau疾病相关蛋白聚集体“接种”的潜力的基因(即当暴露于tau纤维化蛋白来源时，基因被破坏时会导致细胞更容易形成tau聚集体)的平台。此类基因的鉴定可以阐明tau细胞至细胞聚集体增殖的机制和在神经变性疾病的背景下控制神经元形成tau聚集体的易感性的基因途径。

筛选采用了由稳定表达tau四个重复序列结构域tau_4RD的HEK293T细胞组成的tau生物传感器人细胞系，所述结构域包括与CFP或YFP融合的具有P301S致病突变的tau微管结合结构域(MBD)。也就是说，HEK293T细胞系含有稳定地表达与荧光蛋白CFP或荧光蛋白YFP融合的疾病相关蛋白变体的两种转基因：tau^4RD-CFP/tau^4RD-YFP(TCY)，其中tau重复序列结构域(4RD)包括P301S致病突变。参见图1。在这些生物传感器细胞系中，tau-CFP/tau-YFP蛋白聚集产生FRET信号，这是荧光能量从供体CFP转移到受体YFP的结果。参见图2。含有tau聚集体的FRET阳性细胞可以通过流式细胞术分选和分离。在基线时，未经刺激的细胞以稳定、可溶性状态表达报告基因，其中FRET信号最小。在刺激(例如，种子颗粒的质脂体转染)时，报告蛋白形成聚集体，产生FRET信号。可以通过FACS分离含有聚集体的细胞。稳定地繁殖的含有聚集体的细胞系Agg[+]可以通过Agg[-]细胞系的克隆连续稀释来分离。

对此tau生物传感器细胞系进行了若干修饰，使其可用于进行基因筛选。首先，通过经由慢病毒载体引入表达Cas9的转基因(SpCas9)来修饰这些tau生物传感器细胞。用杀稻瘟素选择表达Cas9的克隆转基因细胞系，并且通过克隆系列稀释分离以获得单细胞衍生的克隆。通过qRT-PCR(图3A)评估克隆的Cas9表达水平并且通过数字PCR(图3B)评估DNA切割活性。表3中也示出了相对Cas9表达水平。

表3：相对Cas9表达水平。

具体地，在针对两个所选靶基因转导编码gRNA的慢病毒之后3天和7天，通过数字PCR评估Cas9突变效率。切割效率受到低表达克隆中Cas9水平的限制。需要具有足够Cas9表达水平的克隆来实现最大活性。具有较低Cas9表达的若干衍生克隆无法有效切割靶序列，而具有较高表达的克隆(包含用于筛选的克隆)能够在培养三天之后以大约80％的效率在基因PERK和SNCA中的靶序列处产生突变。在gRNA转导之后3天已经观察到有效切割，其中7天之后仅略有改善。克隆7B10-C3被选择作为用于后续文库筛选的高性能克隆。

其次，开发了使细胞对tau接种活性敏化的试剂和方法。tau细胞间传播可能是由含有聚集体的细胞分泌的tau聚集活性引起的。为了研究tau聚集的细胞增殖，获得了tau-YFP细胞系的亚克隆，所述细胞系由稳定地表达tau重复结构域tau_4RD的HEK293T细胞组成，所述重复结构域包括具有P301S致病突变的与YFP融合的tau微管结合结构域(MBD)。参见图5。通过用与脂质体试剂混合的重组纤维化tau处理这些tau-YFP细胞来获得其中tau-YFP蛋白以聚集状态(Agg[+])稳定地存在的细胞，以便接种这些细胞稳定地表达的tau-YFP蛋白的聚集。然后将“经接种的”细胞连续稀释以获得单细胞衍生的克隆。然后扩增这些克隆以鉴定克隆细胞系，其中tau-YFP聚集体在所有细胞中稳定地存在，其中随时间推移生长并多次传代。这些tau-YFP_Agg[+]克隆之一Clone_18用于通过收集已经处于汇合的tau-YFP_Agg[+]细胞上持续四天的培养基来产生条件培养基。然后将条件培养基(CM)以3:1CM:新鲜培养基的比率施加于原初生物传感器tau-CFP/Tau-YFP细胞上，使得在这些接受者细胞的一小部分中诱导tau聚集。没有使用脂质体。不使用脂质体以便进行尽可能符合生理学的测定，而不使用脂质体诱使接受者细胞以强制/增加tau聚集。如通过使用流式细胞术评估产生FRET信号的细胞百分比作为聚集的量度所测量的，条件培养基在大约0.1％的细胞中始终诱导FRET。参见图6。总之，tau-YFP_Agg[+]细胞不能产生FRET信号，但所述细胞可以提供tau种子的来源。

实例2.进行全基因组CRISPR/Cas9筛选以鉴定Tau聚集的基因修饰因子

为了揭示作为FRET(+)细胞中富集的sgRNA的tau聚集的修饰基因，使用慢病毒递送方法用两个全人基因组的CRISPR sgRNA文库转导无聚集体(Agg[–])的表达Cas9的tau-CFP/tau-YFP生物传感器细胞，以在每个靶基因处引入敲除突变。参见图4。每个CRISPRsgRNA文库靶向5'组成型外显子进行功能性敲除，其中每个基因的平均覆盖率为约3个sgRNA(在组合的两个文库中每个基因总共有6个gRNA)。每个文库的读段计数分布(即，文库中每个gRNA的表示)是正常且相似的。sgRNA被设计成通过避免与脱靶基因组序列有两个或更少错配的sgRNA来避免脱靶效应。所述文库涵盖19,050个人基因和1864个miRNA，以及1000个非靶向对照sgRNA。文库以<0.3的感染复数(MOI)转导，其中每个sgRNA的覆盖率>300个细胞。tau生物传感器细胞在嘌呤霉素选择下生长，以选择整合和表达独特sgRNA的细胞。嘌呤霉素选择在1μg/mL转导之后24小时开始。初步筛选中使用了五个独立的筛选复制品。

在转导后第3天和第6天的细胞传代时收集完整的转导细胞群的样品。在第6天传代之后，细胞在条件培养基中生长以使所述细胞对接种活性敏化。在第10天，使用荧光辅助细胞分选(FACS)具体分离FRET[+]细胞亚群。参见图7。筛选由五个复制的实验组成。整合sgRNA构建体的DNA分离和PCR扩增允许在每个时间点通过下一代测序(NGS)对sgRNA库进行表征。

与较早时间点第3天和第6天的sgRNA库相比，NGS数据的统计分析能够鉴定在五个实验的第10天FRET[+]亚群中富集的sgRNA。NGS分析的相对丰度和富集的概念在图8中例示。用于鉴定潜在tau修饰因子的第一策略是使用DNA测序在每个样品中使用DESeq算法产生sgRNA读段计数，以找到在第10天对第3天或第10天对第6天中但不是在第6天对第3天中更丰富的sgRNA(倍数变化(fc)≥1.5并且负二项试验p<0.01)。Fc≥1.5意指(第10天计数的平均值)/(第3天或第6天计数的平均值)的比率≥1.5。P<0.01意指第10天与第3天或第6天计数之间没有统计差异的机会<0.01。DESeq算法是用于“序列计数数据的差异表达分析”的广泛使用的算法。参见例如，Anders等人(2010)《基因组生物学(Genome Biology)》11:R106，所述文献出于所有目的通过引用整体并入本文。

具体地，在每个库中使用了两个比较来鉴定显著的sgRNA：第10天对第3天，以及第10天对第6天。对于这四个比较中的每个比较，都使用了DESeq算法，并且被视为显著的截止阈值是倍数变化≥1.5以及负二项试验p<0.01。一旦在每个文库的这些比较中的每个比较中鉴定了显著向导，如果基因满足以下两个标准之一，那么所述基因被视为是显著的：(1)对应于所述基因的至少两个sgRNA被视为在一个比较(第10天对第3天或第10天对第6天)中是显著的；以及(2)至少一种sgRNA在两个比较(第10天对第3天和第10天对第6天)中都是显著的。使用此算法，从第一文库中鉴定出五个基因是显著的，并且从第二文库中鉴定出四个基因。参见表4。

表4：使用策略#1鉴定的基因。

然而，第一策略要求每个实验组内的读段计数同质性水平可能过于严格。对于相同的sgRNA，许多因素会在每个实验组(第3天、第6天或第10天样品)内的样品之间产生读段计数可变性，如筛选文库中的初始病毒计数、感染或基因编辑效率以及基因编辑后的相对生长速率。因此，还基于第10天(选择后)每个样品中每个基因的向导的阳性出现(读段计数>30)而不是确切读段计数使用了第二策略。给定文库大小(x)、每个基因的向导数量(n)和选择后样品(m)中的阳性向导的总数，计算正式统计p值以积极观察选择后样品(n')中的多个向导(“数字”指的是sgRNA类型(即，独特向导RNA序列)，而不是读段计数)(p_n'＝nCn'*(x-n')C(m-n)/xCm)。基因g偶然存在n'个或更多个向导的概率计算如下：

与预选择相比，选择后基因读段计数的总体富集被用作用于鉴定阳性基因的另外的参数：(相对丰度＝[基因的读段计数]/[所有基因的读段计数]并且选择后富集＝[选择后相对丰度]/[相对丰度预选择])。

更具体地，第二策略是用于CRISPR阳性选择的新的更灵敏的分析方法。CRISPR阳性选择的目标是使用DNA测序来鉴定由sgRNA进行的扰动与表型相关的基因。为了降低噪声背景，这些实验中通常使用同一基因的多个sgRNA以及实验复制品。然而，要求同一基因的sgRNA之间以及技术重复之间具有一定程度的同质性/一致性的目前常用的统计分析方法效果不佳。这是因为由于许多可能的原因(例如，不同的感染或基因编辑效率、筛选文库中的初始病毒计数以及具有相同表型的其它sgRNA的存在)，这些方法无法处理sgRNA和同一基因的重复之间的巨大差异。相比之下，开发了一种对大变化具有鲁棒性的方法。所述方法基于单独的实验中每个基因的向导的阳性出现次数，而不是每个sgRNA的确切读段计数。给定文库大小、每个基因的sgRNA数量以及每个实验中阳性sgRNA的总数，计算正式统计p值以在实验重复中积极观察sgRNA数量。表型选择之前和之后的相对sgRNA序列读段富集也用作参数。所述方法比目前广泛使用的方法(包含DESeq、MAGECK以及其它)表现得更好。具体地，所述方法包含以下步骤：

(1)对于每个实验，鉴定具有阳性表型的细胞中的任何存在的向导。

(2)在基因水平，计算每个实验中存在向导的随机机会：nCn'*(x-n')C(m-n)/xCm，其中x是表型选择之前向导的种类，m是表型选择之后向导的种类，n是表型选择之前基因的向导的种类，并且n'是表型选择之后基因的向导种类。通过乘以从每个实验获得的以上计算的概率来计算在多个实验之间存在的总体机会。

(3)计算基因水平的向导平均富集：富集得分＝后选择的相对丰度/预选择的相对丰度。相对丰度＝基因的向导读段计数/所有向导的读段计数。

(4)选择显著低于所存在的随机机会以及高于特定富集得分的基因。

由两种不同方法(一种方法或两种方法)鉴定为富集在FRET[+]细胞中的十四个靶基因被选择作为最佳候选基因，以在基于读段计数数据进行视觉检查后进行进一步验证。参见表5。在二次筛选中测试了三十个单独的sgRNA以进行验证。二次筛选的示意图在图9中示出并且结果在图10中示出。多个经测试的sgRNA破坏BANF1或PPP2CA增加了细胞响应于tau接种活性的来源(条件培养基)而形成tau聚集体的敏感性。在破坏这两个靶标中的任一靶标的细胞中，FRET信号的诱导增加了15-20倍。这两个靶基因的破坏增加了响应条件培养基而不是新鲜培养基的tau聚集体的形成。参见图11。

表5：鉴定的靶标。

然后用BANF1和PPP2CA进行另外的实验，以进一步验证每个基因的靶向促进tau聚集。参见图12。测试针对BANF1的两种不同的sgRNA并且使用针对PPP2CA的一种sgRNA。非靶向sgRNA用作阴性对照。在第0天对每个向导RNA进行了四次独立的慢病毒转导。在第6天，在有或没有脂质体的情况下用条件培养基接种tau，并且收集样品用于qRT-PCR。图13中示出了qRT-PCR数据。靶向BANF1的两种sgRNA中的每一种降低BANF1 mRNA表达，并且靶向PPP2CA的gRNA降低PPP2CA表达。在第10天，进行FACS分析以评估FRET信号的诱导。通过靶向BANF1的两种sgRNA和靶向PPP2CA的gRNA中的每一种增加tau聚集。参见图15。在第13天，收集样品用于蛋白质印迹分析。图14中示出了蛋白质印迹结果。表6中示出了所使用的抗体。相似于评估mRNA表达的qRT-PCR实验，自整合障碍因子蛋白(BANF1)蛋白的表达通过靶向BANF1的两种sgRNA减少，并且丝氨酸/苏氨酸-蛋白磷酸酶2A催化亚基α(PPP2CA)蛋白的表达通过靶向PPP2CA的sgRNA减少。

表6：用于蛋白质印迹的抗体。

靶标	供应商	目录编号	用于WB的稀释度
				BANF1	艾博抗公司(abcam)	ab129074	1:1,000
PPP2CA	蛋白质技术公司(proteintech)	13482-1-AP	1:1,000
				磷-tau S356	艾博抗公司	ab75603	1:1,000
磷酸化tau S262	艾博抗公司	ab131354	1:10,000
				组蛋白H3	蛋白质技术公司	17168-1-AP	1:10,000
总tau	dako	A0024	1:150,000

通过分离用于验证的单独的BANF1敲低克隆和单独的PPP2CA敲低克隆，进一步验证BANF1和PPP2CA作为tau聚集的修饰物。用表达BANF1 sgRNA 1、PPP2CA sgRNA5或非靶向sgRNA的慢病毒转导无聚集体的表达Cas9的tau-CFP/tau-YFP生物传感器细胞(Agg[–])。然后进行连续克隆稀释以选择单独的克隆。通过qRT-PCR(获自赛默飞世尔科技公司(ThermoFisher)的TaqMan qRT-PCR测定，测定ID Hs00427805_g1和Hs00427260_m1)评估BANF1 mRNA和PPP2CA mRNA的水平，并且通过蛋白质印迹评估自整合障碍因子蛋白(BANF1)蛋白和丝氨酸/苏氨酸-蛋白磷酸酶2A催化亚基α(PPP2CA)蛋白的水平。每个BANF1 sgRNA克隆具有降低的BANF1 mRNA表达(数据未显示)和自整合障碍因子蛋白(BANF1)蛋白表达(图16)，并且每个PPP2CA sgRNA克隆具有降低的PPP2CA mRNA表达(数据未显示)和丝氨酸/苏氨酸-蛋白磷酸酶2A催化亚基α(PPP2CA)蛋白表达(图16)。

还通过蛋白质印迹在每个克隆中评估tau表达和tau磷酸化。PPP2CA敲低通过磷酸化tau和tau水平而增加。参见图17。

接下来，每个克隆用条件培养基接种3天，并且进行FRET分析以评估tau聚集。敲低克隆验证BANF1和PPP2CA作为tau聚集的修饰物。参见图18。FRET增强与BANF1和PPP2CA突变克隆中的基因编辑程度直接相关。

然后通过下一代测序进一步表征单独的克隆，以确定对BANF1和PPP2CA基因座进行了哪些修饰。下表7中概括了这些修饰。几乎所有的突变克隆都含有某种百分比的野生型等位基因。FRET(+)细胞的百分比(tau聚集活性)与由切割位点处的非同源末端连接引起的插入/缺失的百分比相关(即，tau聚集与野生型等位基因的百分比反相关—野生型等位基因的百分比越低，Fret(+)细胞的百分比越高)。参见图16和表7。

表7：BANF1和PPP2CA克隆的表征。

使用String(一种基于蛋白质-蛋白质相互作用网络的软件程序)研究了BANF1和PPP2CA是否参与相同的生物途径或功能。参见Szklarczyk等人(2015),《核酸研究》43(数据库特辑):D447-D452，所述文献出于所有目的通过引用整体并入本文。使用BANF1和PPP2CA作为输入，基于Reactome通路发现BANF1与PPP2CA之间的“催化”关系。参见图23。BANF1还与在核被膜的生物学中发挥重要作用的若干蛋白质相互作用。这些靶标作为tau聚集的潜在修饰物进行测试。

用含有靶向这些所关注基因的sgRNA的慢病毒载体转导表达Cas9的tau生物传感器细胞。表8中提供了这些sgRNA的靶序列。24小时后开始进行抗生素选择。培养一周后，将在汇合的tau-YFP(Agg[+])上3天后收集的条件培养基(CM)作为75％CM/25％新鲜培养基应用于经转导的细胞，并且以FRET[+]细胞的百分比评估接种活性。通过qRT-PCR评估特异性靶敲低。如所预期的，BANF1或PPP2CA的破坏增强了tau聚集。破坏ANKLE2还增强了tau聚集。参见图19。ANKLE2是唯一既定位于内质网又定位于内核膜的LEM结构域蛋白。

表8：图19和图20中使用的sgRNA靶序列。

然后进一步评估BANF1/PPP2CA相互作用网络中的基因。具体地，评估ANKLE2、EMD和VRK1。为了评估BANF1/PPP2CA相互作用网络中的基因，在非靶向克隆4-1和4-19中测试了靶向ANKLE2、EMD或VRK1的sgRNA。在条件培养基3天后评估FRET[+]细胞的百分比。BANF1/PPP2CA相互作用网络中的基因的破坏揭示了ANKLE2作为tau聚集的修饰物(参见图20)并且VRK1作为BANF1诱导的聚集的增强子(数据未示出)。

这进一步支持了tau聚集与调控核被膜完整性的BANF1/PPP2CA通路之间的链接。与此一致，层粘连蛋白染色揭示BANF1和ANKLE2敲低表达dCas9-KRAB的tau生物传感器细胞克隆相对于非靶向克隆的异常核被膜，并且在BANF1和ANKLE2表达突变Cas9的tau生物传感器细胞克隆中相对于非靶向克隆观察到相似结果(数据未示出)。BANF1与核纤层的两个主要组分，层粘连蛋白A/C和层粘连蛋白B1相互作用。最近的研究已经将核纤层的异常形态学与FTD和AD中的神经变性过程联系起来。在果蝇tau蛋白病模型中层粘连蛋白核骨架的破坏引起异染色质松弛和神经元细胞死亡。层粘连蛋白病理学在死后AD脑中是保守的。在转导表达dCas9-KRAB的tau生物传感器细胞之后，分离了BANF1和ANKLE2的敲低克隆。层粘连蛋白染色揭示，相对于转导和选择非靶向sgRNA的克隆，在这些BANF1和ANKLE2敲低克隆中的异常核被膜(数据未示出)。核纤层形状的显著异常相似于最近报道的FTD神经元中的异常。

核孔复合物(NPC)的异常和所得核质转运(NCT)缺陷促成小鼠tau蛋白病模型中的发病机制。NPC和功能性核转运的破坏还可以存在于人神经元中含有过度磷酸化tau的细胞中，以及小鼠和细胞tau蛋白病模型中。核孔和核被膜缺陷可能存在ALS/FTD和亨廷顿氏病(Huntington's disease)中的神经变性的常见机制。

GTP结合核蛋白Ran(Ran)、Ran GTP酶活化蛋白1(RanGAP1)和染色体缩合调节剂(RCC1)的免疫染色可以用于探询细胞中NCT的破坏。Ran蛋白梯度对于通过NPC的活性转运是重要的。大多数Ran蛋白位于细胞核内部，其主要含有Ran-GTP。RanGAP1定位于NPC的细胞质侧并且将Ran-GTP转化为Ran-GDP。RCC1定位于细胞核并且将Ran-GDP转化为Ran-GTP。

为了确定亚细胞定位，对神经元进行tau、磷酸化tau、Ran、RanGAP1、RCC1、核孔复合物蛋白Nup98-Nup96(Nup98)(其与磷酸化tau相互作用)和核孔糖蛋白p62(Nup62)(可以形成水凝胶的NPC核心组分)以及TAR DNA结合蛋白43(TDP-43)(N末端)、RNA结合蛋白FUS(FUS)和异质核核糖核蛋白A1(HNRNPA1)染色。TDP-43、HNRNPA1和FUS从细胞核到细胞质的错误定位与ALS/FTD有关。

此验证证实了初次筛选方法在鉴定基因中的价值，所述基因可以调节细胞在暴露于tau接种活性的外部来源时对tau接种的敏感性。因此，通过筛选鉴定的靶标可能是神经退行性疾病上下文中tau病理学细胞间传播的相关靶标，并且将被进一步探索。在FRET生物传感器细胞系中对tau聚集修饰物的全基因组筛选鉴定出参与核被膜完整性的多个靶标(BANF1、PPP2CA和ANKLE2)。BANF1和ANKLE2突变克隆表现出核纤层形状的显著异常，所述异常相似于FTD神经元和阿尔茨海默氏病死后神经元中报道的异常。

实例3：靶向小鼠细胞中的Ankle2、Banf1和Ppp2ca

为了验证小鼠tau蛋白病模型中的假定的tau修饰基因，首先有必要验证可以修饰这些基因在小鼠细胞中的表达的CRISPR工具。在小鼠ES细胞中测试靶向小鼠基因Ankle2、Banf1和Ppp2ca的sgRNA以及不与任何基因组序列相匹配的非靶向(NT)对照sgRNA。随后通过qRT-PCR(使用来自赛默飞世尔科技公司的TaqMan测定，归一化为管家基因Drosha的表达)评估这些基因的表达。

在第一实验中，将以下含有sgRNA的质粒(获得自金思特科技公司(GenScript))包装到慢病毒(LV)中并且转导到Cas9准备好的小鼠ES细胞系(2600A-A3)中，其中Cas9表达从Rosa26基因座驱动。表9中提供了sgRNA靶序列。

表9：小鼠sgRNA靶序列。

通过嘌呤霉素选择(1.5μg/mL)选择表达。在存在聚凝胺(64μg/mL)的情况下，将小鼠ES细胞用单独的LV在MOI为600下进行转导。细胞在嘌呤霉素选择下无饲养细胞生长10天。从细胞中收集RNA，并且通过qRT-PCR评估靶基因的表达。在这个实验中，用Banf1 g2或Banf1 g3靶向细胞引起Banf1表达相对于NT对照特异性降低大约35％。参见图21A。同样地，用Ppp2ca g2靶向细胞引起Ppp2ca表达相对于NT对照特异性降低约65％。参见图21B。

为了进一步评估靶向这些小鼠基因的sgRNA，将以下质粒(获自金思特科技公司)包装到LV中并且在F1H4小鼠ES细胞中进行转导，所述细胞是杂交基因背景(50％C57BL/6NTac 50％129S6/SvEvTac)下的野生型小鼠ES细胞。pLentiCRISPR-v2质粒构建体在单个“一体式”(AIO)载体中含有Cas9编码序列和特异性sgRNA的序列两者，其中Cas9和sgRNA两者的表达可由嘌呤霉素选择。作为另外的阴性对照，还使用靶向pLentiGuide-puro载体(含有sgRNA但缺乏Cas9)中的Banf1或Ppp2ca的sgRNA。表10中示出了载体。

表10：小鼠sgRNA靶序列。

在这个实验中，在存在聚凝胺的情况下，将小鼠ES细胞再次用LV在MOI为600下进行转导，在嘌呤霉素选择下生长10天。提取RNA，并且进行qRT-PCR分析(获自赛默飞世尔科技公司的TaqMan qRT-PCR测定，测定ID Mm01205802_m1、Mm01231514_g1和Mm00479816_m1)。证实先前实验的结果，Ppp2ca g2再次引起Ppp2ca表达的特异性急剧降低，在这种情况下>80％，从而证实这种sgRNA的特异性作用。参见图22C。更显著地，在这个实验中，选择表达若干sgRNA(Ankle2 g1、Ankle2 g3、Banf1 g1、Banf1 g2、Banf1 g3和Ppp2ca g3)引起广泛的细胞死亡和所有细胞的损失，使得RNA收集是不可能的。参见图22A-22C。值得注意地，在一体式载体中用NT对照sgRNA进行转导不会引起细胞死亡，这表明来自此构建体的Cas9表达对细胞不具有固有毒性。此外，Banf1和Ppp2ca靶向的sgRNA在pLentiGuide-puro载体(缺乏Cas9)中的表达同样不会引起细胞死亡。因此，得出的结论是，这些sgRNA的引起其靶基因特异性破坏的Cas9介导的活性是这些细胞中细胞死亡的原因，这表明sgRNA可能有效击中其靶标。这个结果并不是完全令人惊讶的，因为据报道BANF1和PPP2CA对于ES细胞的活力和/或多能性至关重要。

实例4：改善tau蛋白病模型

tau包涵体是tau蛋白病的病理学标志，包含AD、进行性核上性麻痹、皮质基底节变性、皮克氏病以及具有与17号染色体相关的帕金森氏综合征的额颞痴呆(FTDP-17)。tau包涵体由多种形式的聚集的翻译后修饰的tau构成，包含高度磷酸化、切割的和乙酰化物种。接下来，着手开发新的筛选平台，所述筛选平台在源自人诱导性多能干(iPS)细胞的神经元(例如，iCELL GABA神经元)、源自小鼠胚胎干(ES)细胞的神经元和原代小鼠神经元(分离的小鼠皮质神经元)中体外重现tau过度磷酸化和tau聚集。对于人iPS源性神经元，使用已经有丝分裂后且准备使用的人iPS源性神经元。按照针对

GABANeurons的所建立方案将细胞解冻并铺板。

首先，产生若干构建体以在人突触蛋白1启动子的控制下表达人tau cDNA(1N4R)。这些构建体经密码子优化以与人或小鼠神经元一起使用。产生了七种构建体：(1)pSynapsin1-GFP(SEQ ID NO:74)；(2)pSynapsin1-hTAU WT(SEQ ID NO:75)；(3)pSynapsin1-hTAU WT-GFP(SEQ ID NO:76)；(4)pSynapsin1-GFP-hTAU WT(SEQ ID NO:77)；(5)pSynapsin1-hTAU 3MUT(A152T、P301L、S320F)(SEQ ID NO:78)；(6)pSynapsin1-hTAU3MUT(A152T、P301L、S320F)-GFP(SEQ ID NO:79)；和(7)pSynapsin1-GFP-hTAU 3MUT(A152T、P301L、S320F)(SEQ ID NO:80)。突触蛋白1基因启动子赋予神经元特异性表达。这些构建体可以包装在慢病毒或腺相关病毒中进行递送。野生型tau 1N4R的DNA和蛋白序列分别示出于SEQ ID NO:81和82中。3MUT Tau 1N4R(A152T、P301L、S320F)的DNA和蛋白序列分别示出于SEQ ID NO:83和84中。

TaqMan测定被设计成特异性地检测人tau cDNA在人或小鼠神经元中的转基因表达。使用用于检测野生型(WT)和突变(MUT)TAU cDNA的经密码子优化的序列的特异性引物和探针，进行定量逆转录聚合酶链反应(qRT-PCR)以检测转基因人TAU。根据制造商的方案(Zymo研究公司(Zymo Research))，使用Direct-zol RNA Miniprep加试剂盒分离总RNA。根据制造商的方案(英杰公司(Invitrogen))，使用无Turbo DNA的试剂盒用DNase处理总RNA，并且稀释到20ng/μL。在一步反应中用Quantitect探针RT-PCR试剂盒(凯杰公司(Qiagen))进行逆转录(RT)和PCR。qRT-PCR反应含有2μL RNA和8μL混合物(含有RT-PCR Master混合物、ROX染料、RT-混合物和基因特异性引物-探针混合物)，最终体积为10μL。在逆转录后，将PCR反应溶液重构为8μL的最终体积(含有3μL cDNA和5μL PCR混合物、探针和基因特异性引物)。除非另外指出，否则最终引物和探针浓度分别是0.5μM和0.25μM。在ViiA^TM7实时PCR检测系统(赛默飞世尔科技公司)上进行qPCR qRT-PCR。在光学384孔板中在以下条件下一式四份地进行PCR反应：95℃10分钟和95℃3秒、60℃30秒(其中RT步骤45℃10分钟，随后95℃10分钟)以及2步循环(95℃5秒、60℃30秒)，持续45个循环。在下表11中提供了每个分析中所使用的引物和探针的序列。

表11：用于人tau的引物和探针。

将神经元铺板于6孔板(约300,000个细胞/孔)中进行生物化学测定，并且将神经元铺板于96孔板(约15,000个神经元/孔)中进行免疫染色，随后进行高含量成像和图像分析。将神经元用单独的或与在特定启动子(例如，EF1α启动子)以及BANF1、PPP2CA、ANKLE2或非靶向sgRNA(例如，在U6启动子的控制下)下表达Cas9转基因的一体式病毒(SEQ ID NO:85)组合的人tau构建体进行转导。Cas9的DNA和蛋白序列分别示出于SEQ ID NO:86和87中。

培养约一周后，将细胞暴露于50％条件培养基tau-YFP(Agg[+])并保持在培养物中。最后将96孔板中的细胞固定并且用特异性抗体进行免疫染色以检测以下：tau过度磷酸化和tau聚集(用亚细胞定位(轴突、体树突状区室)检测tau过度磷酸化的AT8和S356抗体)；核纤层的异常形态学和受损的核质转运(层粘连蛋白A/C、层粘连蛋白B1、FUS、TDP-43、HNRPA1、NPC和NPT)；以及与非靶向sgRNA相比，在用BANF1、PPP2CA或ANKLE2 sgRNA转导的细胞中的细胞存活(DAPI/NeuN/MAP2)。硫磺素S还用于染色和可视化β-淀粉样蛋白结构。还评估了神经元功能(神经突收缩、突触损失、钙稳态异常和神经递质释放失衡)。高含量成像器Phenix Opera(96孔格式)用于细胞存活测定(DAPI/NeuN/MAP2)、磷酸化tau测定(AT8，S356)和硫黄素S测定。收集6孔板中的细胞以进行细胞分级分离测定，并且揭示不溶性且错误定位的tau的存在。

然后着手开发新的筛选平台，所述筛选平台在小鼠脑片培养物中体外重现tau过度磷酸化和tau聚集。脑片测定是众所周知的。参见例如，Polleux等人(2002),《科学STKE(Sci.STKE)》2002(136)pl9(doi:10.1126/stke.2002.136.pl9)，所述文献出于所有目的通过引用整体并入本文。

将小鼠新生儿的脑片培养物用一体式慢病毒或腺相关病毒(诱导Cas9以及特异性sgRNA的表达)或反义寡核苷酸(ASO)进行转导，并且将所述脑片培养物暴露于条件培养基tau-YFP(Agg[+])并保持在培养物中。最后，切片被固定以揭示如上所述的tau过度磷酸化和tau聚集。还收集切片以揭示不溶性tau的存在。

然后着手开发在体内重现tau过度磷酸化和tau聚集的筛选平台。通过颅内(立体定向外科手术，用于在海马体和其它脑区中注射或脑室内注射)或鞘内(在脊髓中)注射向成年PS19小鼠(6-8周)注射：(1)具有Cas9 mRNA和sgRNA的脂质纳米颗粒(LNP)；(2)具有siRNA的LNP；(3)一体式慢病毒(LV)(Cas9+sgRNA)；(4)一体式腺相关病毒(AAV)(Cas9+sgRNA)；或(5)反义寡核苷酸(ASO)。使用PS19小鼠(可在jax.org/strain/008169获得，其出于所有目的通过引用整体并入本文)。

sgRNA、siRNA和反义寡核苷酸靶向基因Banf1、Ppp2ca、Ankle2或由非靶向对照序列组成。在对大脑进行切片和染色后，处死动物以揭示如上所述的tau过度磷酸化(AT8染色)和tau聚集。还收集大脑以揭示不溶性且错误定位的tau的存在(硫黄素S染色)。

由于BANF1/PPP2CA/ANKLE2在有丝分裂细胞中至关重要，因此假设敲低策略将使人们更好地理解这种与tau聚集的新联系。在tau生物传感器细胞中引入转录阻遏的dCas9-KRAB CRISPRi系统并且转导特异性sgRNA、靶向紧邻转录起始位点之前的启动子区域。参见图24A和24B。通过克隆连续稀释法分离ΔBANF1和ΔANKLE2敲低克隆，所述敲低克隆可以在用条件培养基tau-YFP(Agg[+])处理后诱导tau聚集。参见图25。这表明CRISPRi dCas9-KRABΔBANF1和ΔANKLE2靶向敲低克隆可以诱导tau聚集。

接下来，对ΔBANF1和ΔANKLE2克隆进行细胞分级分离，这使得能够在两天后用tau-YFP Agg[+]细胞裂解物检测不溶性级分中的tau和磷酸化tau(丝氨酸356)，从而提供具有tau不溶性和丝氨酸356处的磷酸化的ΔBANF1与ΔANKLE2克隆之间的联系的功能证据。参见图26。

还从ΔBANF1和ΔANKLE2克隆以及两个对照组(非靶向和亲本)收集RNA。RNA-seq分析表征了ΔBANF1和ΔANKLE2敲低克隆与两个对照组的显著差异。对CRISPRi敲低克隆的RNA-seq分析揭示，ΔBANF1敲低样品与ΔANKLE2或非靶向组的样品更加不同。参见图27。验证了这些组之间的10个转录差异(数据未示出)。这十个靶基因在ΔBANF1和ΔANKLE2敲低克隆两者中的表达降低。

然后通过添加BANF1 cDNA(用荧光素酶cDNA作为对照)采取cDNA互补方法。图28中示出了cDNA互补实验设计的示意图。

将BANF1 cDNA亚克隆到pLVX-EF1a质粒中并且包装用于在ΔBANF1敲低细胞、ΔANKLE2敲低细胞和非靶向对照细胞中cDNA的慢病毒转导。具体地，测试cDNA以拯救ΔBANF1和ΔANKLE2敲低细胞中增加的tau聚集。用tau-YFP Agg[+]细胞裂解物处理表达cDNA的细胞，持续两天。结果显示，BANF1 cDNA可以拯救ΔBANF1和ΔANKLE2敲低细胞中的tau聚集，从而提供BANF1/ANKLE2与tau聚集之间的另一个功能联系。参见图29。

接下来，使用小鼠皮质神经元的原代培养物在有丝分裂后细胞中研究ΔBANF1和ΔANKLE2突变对tau磷酸化、错误折叠和不溶性的影响。将皮质神经元用表达Cas9和sgRNA(Banf1_g3、Ankle2_g3或Ppp2ca_g2)两者的先前已验证在小鼠ESC中有效的All_In_One慢病毒(AIO_LV、LV_Cas9_sgRNA)进行转导。在用AIO_LV铺板后两天对小鼠原代皮质神经元进行转导，并且在培养物中保持14天，进行荧光免疫染色和蛋白质印迹研究(使用ProteinSimple公司的WES技术)。对于免疫荧光，将C57BL/6小鼠原代皮质神经元(可商购获得的)在第0天以每孔25,000个神经元的密度铺板在96孔聚-D赖氨酸包被的板中。在第2天，将神经元用针对Banf1_g3或Ankle2_g3或Ppp2ca_g2或非靶向_gRNA对照的AIO_LV，以每个神经元40,000个病毒基因组的感染复数进行转导。每3-4天更换一次培养基。在第16天，将神经元用4％的多聚甲醛(PFA)溶液固定并且通过荧光免疫染色进行研究。对于蛋白质印迹研究，将400,000个神经元铺板于聚-D赖氨酸6孔中，并且用AIO-LV进行转导(每个神经元25,000VG)。每3-4天更换一次培养基。培养14天后收集神经元，并且制备神经元用于蛋白质研究。

14天后，还收集了经AIO_LV转导的神经元，以确定基因编辑的程度(INDEL％)。发现使用Banf1_g3 sgRNA的基因编辑始终高于使用Ankle2_g3的基因编辑。参见表12。

表12：基因编辑。

对于荧光免疫染色研究，专注于已经与tau蛋白病相关的异常表型，如tau过度磷酸化(在体树突状结构域中)、核孔复合物完整性(Nup98错误定位)和核质转运损伤(Ran/RanGAP1核质比降低)。

使用了将Opera Phenix高含量共聚焦成像器(珀金埃尔默(Perkin Elmer))与Harmony软件(珀金埃尔默)相结合进行图像数据分析的自动化且无偏置成像分析方法。对于每个实验，对六个生物重复品求平均值，在每个孔中对大约70个视野进行成像并且针对每个生物重复品进行分析，并且将荧光缀合的二级抗体用于标记一级抗体。二级抗体与Alexa-488nm(绿色)、-568nm(橙色)和-647nm(远红色)缀合。4',6-二脒基-2-苯基吲哚(DAPI)用于核染色。

对于每个视野，首先对DAPI⁺神经元的数量进行计数。其次，使用微管相关蛋白-2(Map2)(一种体树突状结构域的神经元标志物)的荧光强度来分割包含体树突状结构域的细胞质并且对健康神经元的数量进行计数。第三，在包含细胞质、细胞核以及细胞核周围的核周区的若干细胞区室中确定不同细胞标志物(磷酸化tau S356、磷酸化tau AT8(S202、T205)、总tau、Nup98、LaminB1、Ran、RanGAP1)的荧光强度。第四，计算每个孔中的平均荧光强度(生物重复品)，包含每个孔中所有视野的所有细胞的平均值。

开发了图像分析方法来对以下组合中的标志物强度进行定量：磷酸化tau和总tau；磷酸化tau和LaminB1或核孔复合物(NPC)；以及Nup98、Ran和RanGAP1的核质比和磷酸化tau强度。

ΔBanf1和ΔAnkle2突变小鼠皮质神经元显示出与非靶向皮质神经元相似的Map2体树突状染色强度。参见图30A和30B。这表明Banf1和Ankle2的破坏不影响14天后有丝分裂后皮质神经元的神经元存活。

与非靶向皮质神经元相比，ΔBanf1(p值<0.004)和ΔAnkle2(p值<0.001)突变皮质神经元的体树突状区室中的磷酸化tau(丝氨酸356)染色增加。参见图31A。这使人想起阿尔茨海默氏病的观察结果，其中蛋白质tau在体树突状结构域中形成过度磷酸化的聚集体。值得注意地，发现增加的磷酸化tau染色强度在核周区中特别显著。参见图31B。数据表示为平均值±平均值的标准误差(SEM)，并且每个实验条件的生物重复品的数量表示为点。当在两个样品之间进行比较时(即，ΔBanf1对非靶向皮质神经元)，通过未配对学生t测试分析数据。

作为对照实验，确定了与非靶向皮质神经元相比，ΔBanf1和ΔAnkle2突变体的体树突状区室中的总tau染色强度未增加。参见图32A-32C。

如图33A-33E所示，与非靶向皮质神经元相比，ΔBanf1和ΔAnkle2突变神经元的体树突状区室中的磷酸化tau AT8(S202、T205)染色增加。

病理性tau可以损害tau过表达性转基因小鼠和人AD脑组织中的核输入和输出。磷酸化tau破坏核孔复合物扩散屏障功能。核孔复合物蛋白核孔蛋白Nup98在一些带有缠结的神经元的细胞体中积聚，并且可以促进tau体外聚集。观察了Nup98的亚细胞定位，并且发现与非靶向皮质神经元相比，其在ΔBanf1和ΔAnkle2突变体的体细胞中富集。Nup98核质比降低。参见图34A-34D。

另外，与非靶向皮质神经元相比，降低的Ran和RanGAP1核质比提供了ΔBanf1和ΔAnkle2突变体中核孔复合物活性转运受损的证据。参见图35A-35D。

在用AIO_LV_NT、AIO_LV_Banf1_g3和AIO_LV_Ppp2ca_g2铺板后两天对小鼠原代皮质神经元进行转导，并且在培养物中保持14天进行荧光磷酸化tau免疫染色(在丝氨酸356和丝氨酸202/苏氨酸205处，也被称为AT8抗体)以及错误折叠的tau检测。通过ENZO使用

聚集体检测试剂盒作为稳健且定量的方法来检测错误折叠的蛋白质聚集体(aggregate/aggresome)，所述方法已经针对抗体共定位研究用聚集体检测试剂(ADR)进行了优化。

染料特异性地插入到通常在错误折叠和聚集的蛋白质中发现的四元蛋白质结构的交叉β脊中，这将抑制染料的旋转并且导致强荧光。在第16天，将神经元用4％的多聚甲醛(PFA)溶液固定并且进行研究用于荧光免疫染色。与非靶向皮质神经元相比，在突变皮质神经元中揭示了在ΔBanf1(p值<0.026)和ΔPpp2ca(p值<0.0087)的体树突状区室中丝氨酸356上的tau的磷酸化增加。参见图38D。值得注意地，发现增加的磷酸化tau染色强度在紧邻细胞核周围的细胞质区域中是特别显著的，所述细胞质区域被定义为核周区(ΔBanf1 p值<0.002并且ΔPpp2ca p值<0.04)。参见图38B。相似地，与非靶向皮质神经元相比，在突变皮质神经元中观察到ΔBanf1(p值<0.026)和ΔPpp2ca(p值<0.0087)的核周区中的磷酸化tau(丝氨酸202/苏氨酸205)增加。参见图39B和39D。数据表示为平均值±平均值的标准误差(SEM)，并且每个实验条件的生物重复品的数量表示为点。当在两个样品之间进行比较时(即，ΔBanf1对非靶向皮质神经元)，通过未配对学生t测试分析数据。与非靶向相比，丝氨酸356上的tau磷酸化(对于ΔBanf1，皮尔逊相关性(ρ)＝0.85–R平方＝0.72；对于ΔPpp2ca，ρ＝0.92–R平方＝0.85)以及丝氨酸202和苏氨酸205上的tau磷酸化(对于ΔBanf1，ρ＝0.86–R平方＝0.74；对于ΔPpp2ca，ρ＝0.94–R平方＝0.89)的增加与突变神经元的体细胞中错误折叠的tau的检测增加相关。参见图38A-38F和39A-39F。使用皮尔逊参数测试进行相关分析。P值<0.05被视为是显著的。现已证实，Banf1、Ankle2或Ppp2ca的破坏可以增加tau的磷酸化以及错误折叠。

接下来使用来自用tau cDNA 3MUT或P301S转导的小鼠的脑细胞裂解物在突变皮质神经元中使用tau接种进行实验。当添加tau-cDNA 3MUT时，与非靶向皮质神经元相比，ΔBanf1和ΔAnkle2突变体的体树突状结构域中的磷酸化tau(丝氨酸356)染色增加。参见图36A-36D。然而，当添加tau-cDNA 3MUT时，与非靶向皮质神经元相比，ΔBanf1和ΔAnkle2突变体的体树突状结构域中的总tau染色未增加。参见图37A-37C。

器官型脑片培养物然后用于验证Banf1、Ankle2和Ppp2ca作为tau聚集的基因修饰物。从野生型C57BL/6小鼠制备器官型脑片培养物并且在第0天在10¹⁰VG下用包含Cas9_Banf1_g3、Cas9_Ankle2_g3、Cas9_Ppp2ca_g2和Cas9_非靶向_g3的LV-All-In-One(AIO)构建体进行转导。可替代地，从野生型C57BL/6小鼠制备器官型脑片培养物并且在第0天用靶向Ankle2、Ppp2ca或Banf1的ASO转导。在第14天，收集样品进行NGS分析(INDEL％)、磷酸化tau染色(S356和AT8)和错误折叠的tau的ThS染色。

小鼠海马体中的立体定向AIO-LV注射然后用于验证Banf1、Ankle2和Ppp2ca作为tau聚集的基因修饰物。向总共24只C57BL/6野生型动物进行注射(NT、AIO Cas9_Banf1、AIOCas9_Ankle2和AIO Cas9_Ppp2ca)。注射后7天取出两只动物(对于每种情况)。NGS揭示了显著编辑(如INDEL％约>15％；数据未示出)。之后，取出动物进行蛋白质印迹分析(磷酸化tau、错误折叠的tau、总tau)并且进行tau生物传感器细胞中的海马体裂解物的tau接种测定。然后使用dCas9-KRAB加靶向Banf1、Ankle2或Ppp2ca的gRNA在小鼠海马体中的立体定向AIO-LV注射来验证Banf1、Ankle2和Ppp2ca作为tau聚集的基因修饰物。

然后使用ASO在小鼠海马体中的立体定位注射来验证Banf1、Ankle2和Ppp2ca作为tau聚集的基因修饰物。表13中示出了靶向小鼠Banf1的ASO的实例。表14中示出了靶向小鼠Ppp2ca的ASO的实例。表15中示出了靶向小鼠Ankle2的ASO的实例。表16中示出了用于设计表13-15中的ASO的亲本反义RNA序列。

表13：mBanf1 ASO。

*表示硫代磷酸酯键；2MOEr表示2'甲氧基乙基修饰的碱基；i表示内部碱基；5/3表示在5'和3'末端处的碱基

表14：mPpp2ca ASO。

表15：mAnkle2 ASO。

表16：用于设计mBanf1、mPpp2ca和mAnkle2 ASO的亲本反义RNA序列。

所有ASO均被设计为具有硫代磷酸酯主链的5-10-5缺口体。在翼中使用2'甲氧基乙基修饰的碱基(来自两个末端的5个核苷酸)，并且10个核苷酸核具有未经修饰的DNA碱基。参见图40。初次筛选首先在NSC34细胞中以100nM ASO浓度进行。使用lipofectamineRNAiMAx转染所有ASO，并且在收获用于TaqMan qPCR的RNA之前将细胞温育72小时。将靶标的总mRNA的敲低与未经处理的细胞进行比较。基于初步筛选数据，以50nM和5nM选择第二次筛选的命中。转染和TaqMan qPCR分析以与初步筛选相似的方式进行。图41A中示出了针对mAnkle2的初步筛选结果，并且图41B和41C中示出了针对mAnkle2的二次筛选结果。图42A中示出了针对mPpp2ca的初步筛选结果，并且图42B和42C中示出了针对mPpp2ca的二次筛选结果。图43中示出了mBanf1的初步筛选结果。如这些结果所示，靶向Banf1或Ankle2或Ppp2ca的ASO已经在NSC34细胞中得到验证，并且显示表达降低>75％。

总之，已经开发三种方法来在体外(小鼠皮质神经元的原代培养物)、离体(器官型脑片培养物)和体内(海马体的立体定位注射)将Banf1、Ankle2和Ppp2ca验证为tau聚集的调节剂。提出了对Banf1、Ankle2和/或Ppp2ca的破坏可以用于开发新型小鼠tau蛋白病模型。

序列表

<110> 瑞泽恩制药公司（Regeneron Pharmaceuticals, Inc.）

<120> tau蛋白病模型

<130> 057766/548673

<150> US 62/861,553

<151> 2019-06-14

<160> 324

<170> PatentIn版本3.5

<210> 1

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 1

ttgcaggcct atgttgtcct 20

<210> 2

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 2

gcttcggatg ccttcgagag 20

<210> 3

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 3

tttcctccag cttcttgccc 20

<210> 4

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 4

cgccaacgcc aagcagtccc 20

<210> 5

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 5

gagctctaga caccaacgtg 20

<210> 6

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 6

caagcagctg tccgagtccc 20

<210> 7

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 7

cttcgacgcc atcgtgctca 20

<210> 8

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 8

cgcctctcac gtgtaggctt 20

<210> 9

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 9

tttaaggaac ccagtgacaa 20

<210> 10

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 10

ggccttgaac acagttccgt 20

<210> 11

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 11

tagagttgtc atctttcaac 20

<210> 12

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 12

aaggagccgc ccctgtacta 20

<210> 13

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 13

tccggccagg atcaactcgt 20

<210> 14

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 14

tacttacggc tatatattct 20

<210> 15

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 15

aagaacgctt tctgttcaag 20

<210> 16

<211> 20

<212> DNA

<213> 智人（Homo sapiens）

<400> 16

gtgaaatacg gagtgaatcc 20

<210> 17

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 17

atagccgccg ctcattactt 20

<210> 18

<211> 20

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 18

atgaagacct cttccgagaa 20

<210> 19

<211> 20

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 19

atcccggcca ggctccccac 20

<210> 20

<211> 20

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 20

ttggtgacgt cctgagcaag 20

<210> 21

<211> 20

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 21

ccgagcactc gatcgcctac 20

<210> 22

<211> 20

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 22

acatcgaacc tcttgaacgt 20

<210> 23

<211> 20

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 23

gggatatctc ctcggggagc 20

<210> 24

<211> 20

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 24

gatacaggtc aacaacgtag 20

<210> 25

<211> 20

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 25

ttcgacagct ttccgcagct 20

<210> 26

<211> 20

<212> DNA

<213> 小家鼠（Mus musculus）

<400> 26

ccagaaccaa ttagatatcg 20

<210> 27

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 27

uugcaggccu auguuguccu 20

<210> 28

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 28

gcuucggaug ccuucgagag 20

<210> 29

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 29

uuuccuccag cuucuugccc 20

<210> 30

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 30

cgccaacgcc aagcaguccc 20

<210> 31

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 31

gagcucuaga caccaacgug 20

<210> 32

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 32

caagcagcug uccgaguccc 20

<210> 33

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 33

cuucgacgcc aucgugcuca 20

<210> 34

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 34

cgccucucac guguaggcuu 20

<210> 35

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 35

uuuaaggaac ccagugacaa 20

<210> 36

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 36

ggccuugaac acaguuccgu 20

<210> 37

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 37

uagaguuguc aucuuucaac 20

<210> 38

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 38

aaggagccgc cccuguacua 20

<210> 39

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 39

uccggccagg aucaacucgu 20

<210> 40

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 40

uacuuacggc uauauauucu 20

<210> 41

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 41

aagaacgcuu ucuguucaag 20

<210> 42

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 42

gugaaauacg gagugaaucc 20

<210> 43

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 43

auagccgccg cucauuacuu 20

<210> 44

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 44

augaagaccu cuuccgagaa 20

<210> 45

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 45

aucccggcca ggcuccccac 20

<210> 46

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 46

uuggugacgu ccugagcaag 20

<210> 47

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 47

ccgagcacuc gaucgccuac 20

<210> 48

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 48

acaucgaacc ucuugaacgu 20

<210> 49

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 49

gggauaucuc cucggggagc 20

<210> 50

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 50

gauacagguc aacaacguag 20

<210> 51

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 51

uucgacagcu uuccgcagcu 20

<210> 52

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 52

ccagaaccaa uuagauaucg 20

<210> 53

<211> 21

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 53

agaatctgaa gcatcaaccg g 21

<210> 54

<211> 22

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 54

ggtttgtaaa cgatctgcac tg 22

<210> 55

<211> 24

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 55

aatatcaagc acgtccctgg aggc 24

<210> 56

<211> 21

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 56

ccgaaaatct caagcatcag c 21

<210> 57

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 57

acacaatctg tacgcttccg 20

<210> 58

<211> 24

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 58

tgcacgttag acaggtccag cttc 24

<210> 59

<211> 24

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 59

ggcggtaagg tccaaattat aaac 24

<210> 60

<211> 22

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 60

ggtttgtaaa cgatctgaac gg 22

<210> 61

<211> 24

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 61

aatgtccaaa gcaagtgtgg cagc 24

<210> 62

<211> 22

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 62

ggtagtacag agaacctgaa gc 22

<210> 63

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 63

ctttgctccc acatttgctc 20

<210> 64

<211> 24

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 64

cggtggtggt aaggtccaga tcat 24

<210> 65

<211> 16

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 65

guuuuagagc uaugcu 16

<210> 66

<211> 67

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 66

agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60

gugcuuu 67

<210> 67

<211> 77

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 67

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugcu 77

<210> 68

<211> 82

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 68

guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60

aaaaguggca ccgagucggu gc 82

<210> 69

<211> 76

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 69

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugc 76

<210> 70

<211> 86

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 70

guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60

uugaaaaagu ggcaccgagu cggugc 86

<210> 71

<211> 23

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (2)..(21)

<223> n是a、c、g或t

<400> 71

gnnnnnnnnn nnnnnnnnnn ngg 23

<210> 72

<211> 23

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(21)

<223> n是a、c、g或t

<400> 72

nnnnnnnnnn nnnnnnnnnn ngg 23

<210> 73

<211> 25

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (3)..(23)

<223> n是a、c、g或t

<400> 73

ggnnnnnnnn nnnnnnnnnn nnngg 25

<210> 74

<211> 9099

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(635)

<223> LTR

<220>

<221> misc_feature

<222> (636)..(653)

<223> PBS

<220>

<221> misc_feature

<222> (685)..(822)

<223> 包装\信号

<220>

<221> misc_feature

<222> (1303)..(1536)

<223> RRE

<220>

<221> misc_feature

<222> (2028)..(2151)

<223> cPPT

<220>

<221> misc_feature

<222> (2185)..(2668)

<223> 人突触蛋白启动子

<220>

<221> misc_feature

<222> (2675)..(2686)

<223> MCS

<220>

<221> misc_feature

<222> (2687)..(3403)

<223> GFP

<220>

<221> misc_feature

<222> (3415)..(3420)

<223> MCS

<220>

<221> misc_feature

<222> (3421)..(4019)

<223> IRES

<220>

<221> misc_feature

<222> (4020)..(5054)

<223> HygR

<220>

<221> misc_feature

<222> (5068)..(5659)

<223> WPRE

<220>

<221> misc_feature

<222> (5862)..(6498)

<223> LTR

<220>

<221> misc_feature

<222> (6967)..(7640)

<223> pUC\起点

<220>

<221> misc_feature

<222> (7785)..(8781)

<223> AmpR

<400> 74

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgatctgcag agggccctgc gtatgagtgc aagtgggttt 2220

taggaccagg atgaggcggg gtgggggtgc ctacctgacg accgaccccg acccactgga 2280

caagcaccca acccccattc cccaaattgc gcatccccta tcagagaggg ggaggggaaa 2340

caggatgcgg cgaggcgcgt gcgcactgcc agcttcagca ccgcggacag tgccttcgcc 2400

cccgcctggc ggcgcgcgcc accgccgcct cagcactgaa ggcgcgctga cgtcactcgc 2460

cggtcccccg caaactcccc ttcccggcca ccttggtcgc gtccgcgccg ccgccggccc 2520

agccggaccg caccacgcga ggcgcgagat aggggggcac gggcgcgacc atctgcgctg 2580

cggcgccggc gactcagcgc tgcctcagtc tgcggtgggc agcggaggag tcgtgtcgtg 2640

cctgagagcg cagggatcta tttccggtga attcctcgag actagtatgg tgagcaaggg 2700

cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg 2760

ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct 2820

gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct 2880

gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt 2940

caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg 3000

caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga 3060

gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa 3120

ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa 3180

cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca 3240

gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca 3300

gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt 3360

gaccgccgcc gggatcactc tcggcatgga cgagctgtac aagtaagcgg ccgcggatcc 3420

cgcccctctc cctccccccc ccctaacgtt actggccgaa gccgcttgga ataaggccgg 3480

tgtgcgtttg tctatatgtt attttccacc atattgccgt cttttggcaa tgtgagggcc 3540

cggaaacctg gccctgtctt cttgacgagc attcctaggg gtctttcccc tctcgccaaa 3600

ggaatgcaag gtctgttgaa tgtcgtgaag gaagcagttc ctctggaagc ttcttgaaga 3660

caaacaacgt ctgtagcgac cctttgcagg cagcggaacc ccccacctgg cgacaggtgc 3720

ctctgcggcc aaaagccacg tgtataagat acacctgcaa aggcggcaca accccagtgc 3780

cacgttgtga gttggatagt tgtggaaaga gtcaaatggc tctcctcaag cgtattcaac 3840

aaggggctga aggatgccca gaaggtaccc cattgtatgg gatctgatct ggggcctcgg 3900

tgcacatgct ttacatgtgt ttagtcgagg ttaaaaaaac gtctaggccc cccgaaccac 3960

ggggacgtgg ttttcctttg aaaaacacga tgataagctt gccacaaccc gtaccaaaga 4020

tggatagatc cggaaagcct gaactcaccg cgacgtctgt cgagaagttt ctgatcgaaa 4080

agttcgacag cgtctccgac ctgatgcagc tctcggaggg cgaagaatct cgtgctttca 4140

gcttcgatgt aggagggcgt ggatatgtcc tgcgggtaaa tagctgcgcc gatggtttct 4200

acaaagatcg ttatgtttat cggcactttg catcggccgc gctcccgatt ccggaagtgc 4260

ttgacattgg ggaattcagc gagagcctga cctattgcat ctcccgccgt gcacagggtg 4320

tcacgttgca agacctgcct gaaaccgaac tgcccgctgt tctgcagccg gtcgcggagg 4380

ccatggatgc gatcgctgcg gccgatctta gccagacgag cgggttcggc ccattcggac 4440

cgcaaggaat cggtcaatac actacatggc gtgatttcat atgcgcgatt gctgatcccc 4500

atgtgtatca ctggcaaact gtgatggacg acaccgtcag tgcgtccgtc gcgcaggctc 4560

tcgatgagct gatgctttgg gccgaggact gccccgaagt ccggcacctc gtgcacgcgg 4620

atttcggctc caacaatgtc ctgacggaca atggccgcat aacagcggtc attgactgga 4680

gcgaggcgat gttcggggat tcccaatacg aggtcgccaa catcttcttc tggaggccgt 4740

ggttggcttg tatggagcag cagacgcgct acttcgagcg gaggcatccg gagcttgcag 4800

gatcgccgcg gctccgggcg tatatgctcc gcattggtct tgaccaactc tatcagagct 4860

tggttgacgg caatttcgat gatgcagctt gggcgcaggg tcgatgcgac gcaatcgtcc 4920

gatccggagc cgggactgtc gggcgtacac aaatcgcccg cagaagcgcg gccgtctgga 4980

ccgatggctg tgtagaagta ctcgccgata gtggaaaccg acgccccagc actcgtccga 5040

gggcaaagga atagacgcgt ctggaacaat caacctctgg attacaaaat ttgtgaaaga 5100

ttgactggta ttcttaacta tgttgctcct tttacgctat gtggatacgc tgctttaatg 5160

cctttgtatc atgctattgc ttcccgtatg gctttcattt tctcctcctt gtataaatcc 5220

tggttgctgt ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc 5280

actgtgtttg ctgacgcaac ccccactggt tggggcattg ccaccacctg tcagctcctt 5340

tccgggactt tcgctttccc cctccctatt gccacggcgg aactcatcgc cgcctgcctt 5400

gcccgctgct ggacaggggc tcggctgttg ggcactgaca attccgtggt gttgtcgggg 5460

aagctgacgt cctttccatg gctgctcgcc tgtgttgcca cctggattct gcgcgggacg 5520

tccttctgct acgtcccttc ggccctcaat ccagcggacc ttccttcccg cggcctgctg 5580

ccggctctgc ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg gatctccctt 5640

tgggccgcct ccccgcctgg aattaattct gcagtcgaga cctagaaaaa catggagcaa 5700

tcacaagtag caatacagca gctaccaatg ctgattgtgc ctggctagaa gcacaagagg 5760

aggaggaggt gggttttcca gtcacacctc aggtaccttt aagaccaatg acttacaagg 5820

cagctgtaga tcttagccac tttttaaaag aaaagagggg actggaaggg ctaattcact 5880

cccaacgaag acaagatatc cttgatctgt ggatctacca cacacaaggc tacttccctg 5940

attagcagaa ctacacacca gggccagggg tcagatatcc actgaccttt ggatggtgct 6000

acaagctagt accagttgag ccagataagg tagaagaggc caataaagga gagaacacca 6060

gcttgttaca ccctgtgagc ctgcatggga tggatgaccc ggagagagaa gtgttagagt 6120

ggaggtttga cagccgccta gcatttcatc acgtggcccg agagctgcat ccggagtact 6180

tcaagaactg ctgatatcga gcttgctaca agggactttc cgctggggac tttccaggga 6240

ggcgtggcct gggcgggact ggggagtggc gagccctcag atcctgcata taagcagctg 6300

ctttttgcct gtactgggtc tctctggtta gaccagatct gagcctggga gctctctggc 6360

taactaggga acccactgct taagcctcaa taaagcttgc cttgagtgct tcaagtagtg 6420

tgtgcccgtc tgttgtgtga ctctggtaac tagagatccc tcagaccctt ttagtcagtg 6480

tggaaaatct ctagcagtag tagttcatgt catcttatta ttcagtattt ataacttgca 6540

aagaaatgaa tatcagagag tgagaggcct tgacattgct agcgtttacc gtcgacctct 6600

agctagagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc 6660

acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga 6720

gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg 6780

tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg 6840

cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 6900

gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 6960

aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 7020

gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 7080

aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 7140

gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 7200

ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 7260

cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 7320

ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 7380

actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 7440

tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca 7500

gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 7560

ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 7620

cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 7680

ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 7740

tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 7800

agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 7860

gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 7920

ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 7980

gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 8040

cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 8100

acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 8160

cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 8220

cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 8280

ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 8340

tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 8400

atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 8460

tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 8520

actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 8580

aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 8640

ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 8700

ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 8760

cgaaaagtgc cacctgacgt cgacggatcg ggagatcaac ttgtttattg cagcttataa 8820

tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca 8880

ttctagttgt ggtttgtcca aactcatcaa tgtatcttat catgtctgga tcaactggat 8940

aactcaagct aaccaaaatc atcccaaact tcccacccca taccctatta ccactgccaa 9000

ttacctgtgg tttcatttac tctaaacctg tgattcctct gaattatttt cattttaaag 9060

aaattgtatt tgttaaatat gtactacaaa cttagtagt 9099

<210> 75

<211> 9636

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(635)

<223> LTR

<220>

<221> misc_feature

<222> (636)..(653)

<223> PBS

<220>

<221> misc_feature

<222> (685)..(822)

<223> 包装\信号

<220>

<221> misc_feature

<222> (1303)..(1536)

<223> RRE

<220>

<221> misc_feature

<222> (2028)..(2151)

<223> cPPT

<220>

<221> misc_feature

<222> (2185)..(2668)

<223> 人突触蛋白启动子

<220>

<221> misc_feature

<222> (2681)..(3919)

<223> hTau-412 (1N4R) WT

<220>

<221> misc_feature

<222> (3926)..(3957)

<223> MCS

<220>

<221> misc_feature

<222> (3958)..(4556)

<223> IRES

<220>

<221> misc_feature

<222> (4557)..(5591)

<223> HygR

<220>

<221> misc_feature

<222> (5605)..(6196)

<223> WPRE

<220>

<221> misc_feature

<222> (6399)..(7035)

<223> LTR

<220>

<221> misc_feature

<222> (7504)..(8177)

<223> pUC\起点

<220>

<221> misc_feature

<222> (8322)..(9318)

<223> AmpR

<400> 75

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgatctgcag agggccctgc gtatgagtgc aagtgggttt 2220

taggaccagg atgaggcggg gtgggggtgc ctacctgacg accgaccccg acccactgga 2280

caagcaccca acccccattc cccaaattgc gcatccccta tcagagaggg ggaggggaaa 2340

caggatgcgg cgaggcgcgt gcgcactgcc agcttcagca ccgcggacag tgccttcgcc 2400

cccgcctggc ggcgcgcgcc accgccgcct cagcactgaa ggcgcgctga cgtcactcgc 2460

cggtcccccg caaactcccc ttcccggcca ccttggtcgc gtccgcgccg ccgccggccc 2520

agccggaccg caccacgcga ggcgcgagat aggggggcac gggcgcgacc atctgcgctg 2580

cggcgccggc gactcagcgc tgcctcagtc tgcggtgggc agcggaggag tcgtgtcgtg 2640

cctgagagcg cagggatcta tttccggtga attcgccacc atggctgagc cccgacagga 2700

gttcgaggta atggaggatc acgcagggac gtatggtctg ggagacagga aggatcaagg 2760

cggctatacg atgcaccagg atcaggaggg cgataccgat gcgggcctca aagagtcccc 2820

gcttcaaaca ccaactgagg atgggagtga ggagccagga agtgagacaa gcgacgcgaa 2880

atcaacccct actgccgaag cggaggaggc cgggatcgga gatacaccat ctctcgaaga 2940

cgaagctgct ggccacgtga cgcaagcacg aatggtgtcc aaaagcaaag acggtacagg 3000

ttctgacgac aaaaaggcga agggggcaga tgggaaaact aaaatcgcca cgccccgggg 3060

tgcggcgccg cctgggcaga aagggcaagc aaatgcgacg cgaatacctg ccaagacgcc 3120

tccggctcct aagaccccac catcatctgg tgaaccgcct aaaagcgggg atcgaagcgg 3180

ttattcatca ccgggtagtc cgggtacgcc aggctctagg agcagaactc cttcactgcc 3240

cacgcccccc acgcgcgaac ctaagaaagt ggcagtggtg cgaacacccc caaaaagccc 3300

ctcaagtgca aaatcacggc tccagactgc acccgtaccg atgcccgatc tcaaaaacgt 3360

gaaatctaag ataggtagta cagagaatct gaagcatcaa ccgggaggtg gaaaggtgca 3420

gattatcaat aagaaacttg acctgagtaa cgttcaatcc aagtgtggat caaaagataa 3480

tatcaagcac gtccctggag gcggttcagt gcagatcgtt tacaaacctg ttgatcttag 3540

caaggtgact tccaagtgcg ggtctctggg caacattcat cacaaacctg gtggagggca 3600

agttgaggtc aaaagcgaaa agctcgactt caaagatcga gttcagagca agataggcag 3660

ccttgataat attacccatg tccccggcgg agggaacaag aagattgaga ctcataagtt 3720

gacgttcaga gaaaatgcta aagcgaaaac ggatcatggc gcagaaatag tttataaatc 3780

tcctgtggtc agtggtgaca cttcacccag gcacctctca aacgtgtcat caacgggctc 3840

aatcgacatg gtggattctc cccaactcgc aacacttgct gatgaggtaa gtgccagcct 3900

cgcaaagcaa ggactctaaa attcgctcga gactagttct agagcggccg cggatcccgc 3960

ccctctccct cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt 4020

gcgtttgtct atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg 4080

aaacctggcc ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga 4140

atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa 4200

acaacgtctg tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc 4260

tgcggccaaa agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac 4320

gttgtgagtt ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag 4380

gggctgaagg atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc 4440

acatgcttta catgtgttta gtcgaggtta aaaaaacgtc taggcccccc gaaccacggg 4500

gacgtggttt tcctttgaaa aacacgatga taagcttgcc acaacccgta ccaaagatgg 4560

atagatccgg aaagcctgaa ctcaccgcga cgtctgtcga gaagtttctg atcgaaaagt 4620

tcgacagcgt ctccgacctg atgcagctct cggagggcga agaatctcgt gctttcagct 4680

tcgatgtagg agggcgtgga tatgtcctgc gggtaaatag ctgcgccgat ggtttctaca 4740

aagatcgtta tgtttatcgg cactttgcat cggccgcgct cccgattccg gaagtgcttg 4800

acattgggga attcagcgag agcctgacct attgcatctc ccgccgtgca cagggtgtca 4860

cgttgcaaga cctgcctgaa accgaactgc ccgctgttct gcagccggtc gcggaggcca 4920

tggatgcgat cgctgcggcc gatcttagcc agacgagcgg gttcggccca ttcggaccgc 4980

aaggaatcgg tcaatacact acatggcgtg atttcatatg cgcgattgct gatccccatg 5040

tgtatcactg gcaaactgtg atggacgaca ccgtcagtgc gtccgtcgcg caggctctcg 5100

atgagctgat gctttgggcc gaggactgcc ccgaagtccg gcacctcgtg cacgcggatt 5160

tcggctccaa caatgtcctg acggacaatg gccgcataac agcggtcatt gactggagcg 5220

aggcgatgtt cggggattcc caatacgagg tcgccaacat cttcttctgg aggccgtggt 5280

tggcttgtat ggagcagcag acgcgctact tcgagcggag gcatccggag cttgcaggat 5340

cgccgcggct ccgggcgtat atgctccgca ttggtcttga ccaactctat cagagcttgg 5400

ttgacggcaa tttcgatgat gcagcttggg cgcagggtcg atgcgacgca atcgtccgat 5460

ccggagccgg gactgtcggg cgtacacaaa tcgcccgcag aagcgcggcc gtctggaccg 5520

atggctgtgt agaagtactc gccgatagtg gaaaccgacg ccccagcact cgtccgaggg 5580

caaaggaata gacgcgtctg gaacaatcaa cctctggatt acaaaatttg tgaaagattg 5640

actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 5700

ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 5760

ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact 5820

gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca gctcctttcc 5880

gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc ctgccttgcc 5940

cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt gtcggggaag 6000

ctgacgtcct ttccatggct gctcgcctgt gttgccacct ggattctgcg cgggacgtcc 6060

ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg cctgctgccg 6120

gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat ctccctttgg 6180

gccgcctccc cgcctggaat taattctgca gtcgagacct agaaaaacat ggagcaatca 6240

caagtagcaa tacagcagct accaatgctg attgtgcctg gctagaagca caagaggagg 6300

aggaggtggg ttttccagtc acacctcagg tacctttaag accaatgact tacaaggcag 6360

ctgtagatct tagccacttt ttaaaagaaa agaggggact ggaagggcta attcactccc 6420

aacgaagaca agatatcctt gatctgtgga tctaccacac acaaggctac ttccctgatt 6480

agcagaacta cacaccaggg ccaggggtca gatatccact gacctttgga tggtgctaca 6540

agctagtacc agttgagcca gataaggtag aagaggccaa taaaggagag aacaccagct 6600

tgttacaccc tgtgagcctg catgggatgg atgacccgga gagagaagtg ttagagtgga 6660

ggtttgacag ccgcctagca tttcatcacg tggcccgaga gctgcatccg gagtacttca 6720

agaactgctg atatcgagct tgctacaagg gactttccgc tggggacttt ccagggaggc 6780

gtggcctggg cgggactggg gagtggcgag ccctcagatc ctgcatataa gcagctgctt 6840

tttgcctgta ctgggtctct ctggttagac cagatctgag cctgggagct ctctggctaa 6900

ctagggaacc cactgcttaa gcctcaataa agcttgcctt gagtgcttca agtagtgtgt 6960

gcccgtctgt tgtgtgactc tggtaactag agatccctca gaccctttta gtcagtgtgg 7020

aaaatctcta gcagtagtag ttcatgtcat cttattattc agtatttata acttgcaaag 7080

aaatgaatat cagagagtga gaggccttga cattgctagc gtttaccgtc gacctctagc 7140

tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 7200

attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 7260

agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 7320

tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 7380

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 7440

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 7500

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 7560

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 7620

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 7680

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 7740

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 7800

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 7860

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 7920

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 7980

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 8040

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 8100

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 8160

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 8220

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 8280

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 8340

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 8400

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 8460

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 8520

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 8580

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 8640

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 8700

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 8760

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 8820

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 8880

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 8940

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 9000

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 9060

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 9120

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 9180

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 9240

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 9300

aaagtgccac ctgacgtcga cggatcggga gatcaacttg tttattgcag cttataatgg 9360

ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 9420

tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac 9480

tcaagctaac caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta 9540

cctgtggttt catttactct aaacctgtga ttcctctgaa ttattttcat tttaaagaaa 9600

ttgtatttgt taaatatgta ctacaaactt agtagt 9636

<210> 76

<211> 10350

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(635)

<223> LTR

<220>

<221> misc_feature

<222> (636)..(653)

<223> PBS

<220>

<221> misc_feature

<222> (685)..(822)

<223> 包装\信号

<220>

<221> misc_feature

<222> (1303)..(1536)

<223> RRE

<220>

<221> misc_feature

<222> (2028)..(2151)

<223> cPPT

<220>

<221> misc_feature

<222> (2185)..(2668)

<223> 人突触蛋白启动子

<220>

<221> misc_feature

<222> (2681)..(3916)

<223> hTau-412 (1N4R) WT

<220>

<221> misc_feature

<222> (3917)..(4630)

<223> eGFP

<220>

<221> misc_feature

<222> (4640)..(4671)

<223> MCS

<220>

<221> misc_feature

<222> (4672)..(5270)

<223> IRES

<220>

<221> misc_feature

<222> (5271)..(6305)

<223> HygR

<220>

<221> misc_feature

<222> (6319)..(6910)

<223> WPRE

<220>

<221> misc_feature

<222> (7113)..(7749)

<223> LTR

<220>

<221> misc_feature

<222> (8218)..(8891)

<223> pUC\起点

<220>

<221> misc_feature

<222> (9036)..(10032)

<223> AmpR

<400> 76

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgatctgcag agggccctgc gtatgagtgc aagtgggttt 2220

taggaccagg atgaggcggg gtgggggtgc ctacctgacg accgaccccg acccactgga 2280

caagcaccca acccccattc cccaaattgc gcatccccta tcagagaggg ggaggggaaa 2340

caggatgcgg cgaggcgcgt gcgcactgcc agcttcagca ccgcggacag tgccttcgcc 2400

cccgcctggc ggcgcgcgcc accgccgcct cagcactgaa ggcgcgctga cgtcactcgc 2460

cggtcccccg caaactcccc ttcccggcca ccttggtcgc gtccgcgccg ccgccggccc 2520

agccggaccg caccacgcga ggcgcgagat aggggggcac gggcgcgacc atctgcgctg 2580

cggcgccggc gactcagcgc tgcctcagtc tgcggtgggc agcggaggag tcgtgtcgtg 2640

cctgagagcg cagggatcta tttccggtga attcgccacc atggctgagc cccgacagga 2700

gttcgaggta atggaggatc acgcagggac gtatggtctg ggagacagga aggatcaagg 2760

cggctatacg atgcaccagg atcaggaggg cgataccgat gcgggcctca aagagtcccc 2820

gcttcaaaca ccaactgagg atgggagtga ggagccagga agtgagacaa gcgacgcgaa 2880

atcaacccct actgccgaag cggaggaggc cgggatcgga gatacaccat ctctcgaaga 2940

cgaagctgct ggccacgtga cgcaagcacg aatggtgtcc aaaagcaaag acggtacagg 3000

ttctgacgac aaaaaggcga agggggcaga tgggaaaact aaaatcgcca cgccccgggg 3060

tgcggcgccg cctgggcaga aagggcaagc aaatgcgacg cgaatacctg ccaagacgcc 3120

tccggctcct aagaccccac catcatctgg tgaaccgcct aaaagcgggg atcgaagcgg 3180

ttattcatca ccgggtagtc cgggtacgcc aggctctagg agcagaactc cttcactgcc 3240

cacgcccccc acgcgcgaac ctaagaaagt ggcagtggtg cgaacacccc caaaaagccc 3300

ctcaagtgca aaatcacggc tccagactgc acccgtaccg atgcccgatc tcaaaaacgt 3360

gaaatctaag ataggtagta cagagaatct gaagcatcaa ccgggaggtg gaaaggtgca 3420

gattatcaat aagaaacttg acctgagtaa cgttcaatcc aagtgtggat caaaagataa 3480

tatcaagcac gtccctggag gcggttcagt gcagatcgtt tacaaacctg ttgatcttag 3540

caaggtgact tccaagtgcg ggtctctggg caacattcat cacaaacctg gtggagggca 3600

agttgaggtc aaaagcgaaa agctcgactt caaagatcga gttcagagca agataggcag 3660

ccttgataat attacccatg tccccggcgg agggaacaag aagattgaga ctcataagtt 3720

gacgttcaga gaaaatgcta aagcgaaaac ggatcatggc gcagaaatag tttataaatc 3780

tcctgtggtc agtggtgaca cttcacccag gcacctctca aacgtgtcat caacgggctc 3840

aatcgacatg gtggattctc cccaactcgc aacacttgct gatgaggtaa gtgccagcct 3900

cgcaaagcaa ggactcgtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 3960

ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 4020

cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt 4080

gccctggccc accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc 4140

cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga 4200

gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga 4260

gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa 4320

catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga 4380

caagcagaag aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag 4440

cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct 4500

gcccgacaac cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg 4560

cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga 4620

gctgtacaag tgaaattcgc tcgagactag ttctagagcg gccgcggatc ccgcccctct 4680

ccctcccccc cccctaacgt tactggccga agccgcttgg aataaggccg gtgtgcgttt 4740

gtctatatgt tattttccac catattgccg tcttttggca atgtgagggc ccggaaacct 4800

ggccctgtct tcttgacgag cattcctagg ggtctttccc ctctcgccaa aggaatgcaa 4860

ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag cttcttgaag acaaacaacg 4920

tctgtagcga ccctttgcag gcagcggaac cccccacctg gcgacaggtg cctctgcggc 4980

caaaagccac gtgtataaga tacacctgca aaggcggcac aaccccagtg ccacgttgtg 5040

agttggatag ttgtggaaag agtcaaatgg ctctcctcaa gcgtattcaa caaggggctg 5100

aaggatgccc agaaggtacc ccattgtatg ggatctgatc tggggcctcg gtgcacatgc 5160

tttacatgtg tttagtcgag gttaaaaaaa cgtctaggcc ccccgaacca cggggacgtg 5220

gttttccttt gaaaaacacg atgataagct tgccacaacc cgtaccaaag atggatagat 5280

ccggaaagcc tgaactcacc gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca 5340

gcgtctccga cctgatgcag ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg 5400

taggagggcg tggatatgtc ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc 5460

gttatgttta tcggcacttt gcatcggccg cgctcccgat tccggaagtg cttgacattg 5520

gggaattcag cgagagcctg acctattgca tctcccgccg tgcacagggt gtcacgttgc 5580

aagacctgcc tgaaaccgaa ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg 5640

cgatcgctgc ggccgatctt agccagacga gcgggttcgg cccattcgga ccgcaaggaa 5700

tcggtcaata cactacatgg cgtgatttca tatgcgcgat tgctgatccc catgtgtatc 5760

actggcaaac tgtgatggac gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc 5820

tgatgctttg ggccgaggac tgccccgaag tccggcacct cgtgcacgcg gatttcggct 5880

ccaacaatgt cctgacggac aatggccgca taacagcggt cattgactgg agcgaggcga 5940

tgttcgggga ttcccaatac gaggtcgcca acatcttctt ctggaggccg tggttggctt 6000

gtatggagca gcagacgcgc tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc 6060

ggctccgggc gtatatgctc cgcattggtc ttgaccaact ctatcagagc ttggttgacg 6120

gcaatttcga tgatgcagct tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag 6180

ccgggactgt cgggcgtaca caaatcgccc gcagaagcgc ggccgtctgg accgatggct 6240

gtgtagaagt actcgccgat agtggaaacc gacgccccag cactcgtccg agggcaaagg 6300

aatagacgcg tctggaacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt 6360

attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 6420

catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 6480

tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 6540

gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 6600

ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 6660

tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaagctgacg 6720

tcctttccat ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 6780

tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 6840

cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 6900

tccccgcctg gaattaattc tgcagtcgag acctagaaaa acatggagca atcacaagta 6960

gcaatacagc agctaccaat gctgattgtg cctggctaga agcacaagag gaggaggagg 7020

tgggttttcc agtcacacct caggtacctt taagaccaat gacttacaag gcagctgtag 7080

atcttagcca ctttttaaaa gaaaagaggg gactggaagg gctaattcac tcccaacgaa 7140

gacaagatat ccttgatctg tggatctacc acacacaagg ctacttccct gattagcaga 7200

actacacacc agggccaggg gtcagatatc cactgacctt tggatggtgc tacaagctag 7260

taccagttga gccagataag gtagaagagg ccaataaagg agagaacacc agcttgttac 7320

accctgtgag cctgcatggg atggatgacc cggagagaga agtgttagag tggaggtttg 7380

acagccgcct agcatttcat cacgtggccc gagagctgca tccggagtac ttcaagaact 7440

gctgatatcg agcttgctac aagggacttt ccgctgggga ctttccaggg aggcgtggcc 7500

tgggcgggac tggggagtgg cgagccctca gatcctgcat ataagcagct gctttttgcc 7560

tgtactgggt ctctctggtt agaccagatc tgagcctggg agctctctgg ctaactaggg 7620

aacccactgc ttaagcctca ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt 7680

ctgttgtgtg actctggtaa ctagagatcc ctcagaccct tttagtcagt gtggaaaatc 7740

tctagcagta gtagttcatg tcatcttatt attcagtatt tataacttgc aaagaaatga 7800

atatcagaga gtgagaggcc ttgacattgc tagcgtttac cgtcgacctc tagctagagc 7860

ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 7920

cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 7980

ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 8040

ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 8100

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 8160

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 8220

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 8280

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 8340

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 8400

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 8460

gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 8520

ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 8580

cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 8640

aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 8700

tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 8760

ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 8820

tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 8880

ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 8940

agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 9000

atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 9060

cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 9120

ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 9180

ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 9240

agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 9300

agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 9360

gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 9420

cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 9480

gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 9540

tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 9600

tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 9660

aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 9720

cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 9780

cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 9840

aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 9900

ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 9960

tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 10020

ccacctgacg tcgacggatc gggagatcaa cttgtttatt gcagcttata atggttacaa 10080

ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 10140

tggtttgtcc aaactcatca atgtatctta tcatgtctgg atcaactgga taactcaagc 10200

taaccaaaat catcccaaac ttcccacccc ataccctatt accactgcca attacctgtg 10260

gtttcattta ctctaaacct gtgattcctc tgaattattt tcattttaaa gaaattgtat 10320

ttgttaaata tgtactacaa acttagtagt 10350

<210> 77

<211> 10350

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(635)

<223> LTR

<220>

<221> misc_feature

<222> (636)..(653)

<223> PBS

<220>

<221> misc_feature

<222> (685)..(822)

<223> 包装\信号

<220>

<221> misc_feature

<222> (1303)..(1536)

<223> RRE

<220>

<221> misc_feature

<222> (2028)..(2151)

<223> cPPT

<220>

<221> misc_feature

<222> (2185)..(2668)

<223> 人突触蛋白启动子

<220>

<221> misc_feature

<222> (2681)..(3397)

<223> eGFP

<220>

<221> misc_feature

<222> (3398)..(4633)

<223> hTau-412 (1NR4) WT

<220>

<221> misc_feature

<222> (4640)..(4671)

<223> MCS

<220>

<221> misc_feature

<222> (4672)..(5270)

<223> IRES

<220>

<221> misc_feature

<222> (5271)..(6305)

<223> HygR

<220>

<221> misc_feature

<222> (6319)..(6910)

<223> WPRE

<220>

<221> misc_feature

<222> (7113)..(7749)

<223> LTR

<220>

<221> misc_feature

<222> (8218)..(8891)

<223> pUC\起点

<220>

<221> misc_feature

<222> (9036)..(10032)

<223> AmpR

<400> 77

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgatctgcag agggccctgc gtatgagtgc aagtgggttt 2220

taggaccagg atgaggcggg gtgggggtgc ctacctgacg accgaccccg acccactgga 2280

caagcaccca acccccattc cccaaattgc gcatccccta tcagagaggg ggaggggaaa 2340

caggatgcgg cgaggcgcgt gcgcactgcc agcttcagca ccgcggacag tgccttcgcc 2400

cccgcctggc ggcgcgcgcc accgccgcct cagcactgaa ggcgcgctga cgtcactcgc 2460

cggtcccccg caaactcccc ttcccggcca ccttggtcgc gtccgcgccg ccgccggccc 2520

agccggaccg caccacgcga ggcgcgagat aggggggcac gggcgcgacc atctgcgctg 2580

cggcgccggc gactcagcgc tgcctcagtc tgcggtgggc agcggaggag tcgtgtcgtg 2640

cctgagagcg cagggatcta tttccggtga attcgccacc atggtgagca agggcgagga 2700

gctgttcacc ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa 2760

gttcagcgtg tccggcgagg gcgagggcga tgccacctac ggcaagctga ccctgaagtt 2820

catctgcacc accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccctgaccta 2880

cggcgtgcag tgcttcagcc gctaccccga ccacatgaag cagcacgact tcttcaagtc 2940

cgccatgccc gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta 3000

caagacccgc gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa 3060

gggcatcgac ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa 3120

cagccacaac gtctatatca tggccgacaa gcagaagaac ggcatcaagg tgaacttcaa 3180

gatccgccac aacatcgagg acggcagcgt gcagctcgcc gaccactacc agcagaacac 3240

ccccatcggc gacggccccg tgctgctgcc cgacaaccac tacctgagca cccagtccgc 3300

cctgagcaaa gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc 3360

cgccgggatc actctcggca tggacgagct gtacaaggct gagccccgac aggagttcga 3420

ggtaatggag gatcacgcag ggacgtatgg tctgggagac aggaaggatc aaggcggcta 3480

tacgatgcac caggatcagg agggcgatac cgatgcgggc ctcaaagagt ccccgcttca 3540

aacaccaact gaggatggga gtgaggagcc aggaagtgag acaagcgacg cgaaatcaac 3600

ccctactgcc gaagcggagg aggccgggat cggagataca ccatctctcg aagacgaagc 3660

tgctggccac gtgacgcaag cacgaatggt gtccaaaagc aaagacggta caggttctga 3720

cgacaaaaag gcgaaggggg cagatgggaa aactaaaatc gccacgcccc ggggtgcggc 3780

gccgcctggg cagaaagggc aagcaaatgc gacgcgaata cctgccaaga cgcctccggc 3840

tcctaagacc ccaccatcat ctggtgaacc gcctaaaagc ggggatcgaa gcggttattc 3900

atcaccgggt agtccgggta cgccaggctc taggagcaga actccttcac tgcccacgcc 3960

ccccacgcgc gaacctaaga aagtggcagt ggtgcgaaca cccccaaaaa gcccctcaag 4020

tgcaaaatca cggctccaga ctgcacccgt accgatgccc gatctcaaaa acgtgaaatc 4080

taagataggt agtacagaga atctgaagca tcaaccggga ggtggaaagg tgcagattat 4140

caataagaaa cttgacctga gtaacgttca atccaagtgt ggatcaaaag ataatatcaa 4200

gcacgtccct ggaggcggtt cagtgcagat cgtttacaaa cctgttgatc ttagcaaggt 4260

gacttccaag tgcgggtctc tgggcaacat tcatcacaaa cctggtggag ggcaagttga 4320

ggtcaaaagc gaaaagctcg acttcaaaga tcgagttcag agcaagatag gcagccttga 4380

taatattacc catgtccccg gcggagggaa caagaagatt gagactcata agttgacgtt 4440

cagagaaaat gctaaagcga aaacggatca tggcgcagaa atagtttata aatctcctgt 4500

ggtcagtggt gacacttcac ccaggcacct ctcaaacgtg tcatcaacgg gctcaatcga 4560

catggtggat tctccccaac tcgcaacact tgctgatgag gtaagtgcca gcctcgcaaa 4620

gcaaggactc taaaattcgc tcgagactag ttctagagcg gccgcggatc ccgcccctct 4680

ccctcccccc cccctaacgt tactggccga agccgcttgg aataaggccg gtgtgcgttt 4740

gtctatatgt tattttccac catattgccg tcttttggca atgtgagggc ccggaaacct 4800

ggccctgtct tcttgacgag cattcctagg ggtctttccc ctctcgccaa aggaatgcaa 4860

ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag cttcttgaag acaaacaacg 4920

tctgtagcga ccctttgcag gcagcggaac cccccacctg gcgacaggtg cctctgcggc 4980

caaaagccac gtgtataaga tacacctgca aaggcggcac aaccccagtg ccacgttgtg 5040

agttggatag ttgtggaaag agtcaaatgg ctctcctcaa gcgtattcaa caaggggctg 5100

aaggatgccc agaaggtacc ccattgtatg ggatctgatc tggggcctcg gtgcacatgc 5160

tttacatgtg tttagtcgag gttaaaaaaa cgtctaggcc ccccgaacca cggggacgtg 5220

gttttccttt gaaaaacacg atgataagct tgccacaacc cgtaccaaag atggatagat 5280

ccggaaagcc tgaactcacc gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca 5340

gcgtctccga cctgatgcag ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg 5400

taggagggcg tggatatgtc ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc 5460

gttatgttta tcggcacttt gcatcggccg cgctcccgat tccggaagtg cttgacattg 5520

gggaattcag cgagagcctg acctattgca tctcccgccg tgcacagggt gtcacgttgc 5580

aagacctgcc tgaaaccgaa ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg 5640

cgatcgctgc ggccgatctt agccagacga gcgggttcgg cccattcgga ccgcaaggaa 5700

tcggtcaata cactacatgg cgtgatttca tatgcgcgat tgctgatccc catgtgtatc 5760

actggcaaac tgtgatggac gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc 5820

tgatgctttg ggccgaggac tgccccgaag tccggcacct cgtgcacgcg gatttcggct 5880

ccaacaatgt cctgacggac aatggccgca taacagcggt cattgactgg agcgaggcga 5940

tgttcgggga ttcccaatac gaggtcgcca acatcttctt ctggaggccg tggttggctt 6000

gtatggagca gcagacgcgc tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc 6060

ggctccgggc gtatatgctc cgcattggtc ttgaccaact ctatcagagc ttggttgacg 6120

gcaatttcga tgatgcagct tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag 6180

ccgggactgt cgggcgtaca caaatcgccc gcagaagcgc ggccgtctgg accgatggct 6240

gtgtagaagt actcgccgat agtggaaacc gacgccccag cactcgtccg agggcaaagg 6300

aatagacgcg tctggaacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt 6360

attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 6420

catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 6480

tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 6540

gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 6600

ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 6660

tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaagctgacg 6720

tcctttccat ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 6780

tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 6840

cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 6900

tccccgcctg gaattaattc tgcagtcgag acctagaaaa acatggagca atcacaagta 6960

gcaatacagc agctaccaat gctgattgtg cctggctaga agcacaagag gaggaggagg 7020

tgggttttcc agtcacacct caggtacctt taagaccaat gacttacaag gcagctgtag 7080

atcttagcca ctttttaaaa gaaaagaggg gactggaagg gctaattcac tcccaacgaa 7140

gacaagatat ccttgatctg tggatctacc acacacaagg ctacttccct gattagcaga 7200

actacacacc agggccaggg gtcagatatc cactgacctt tggatggtgc tacaagctag 7260

taccagttga gccagataag gtagaagagg ccaataaagg agagaacacc agcttgttac 7320

accctgtgag cctgcatggg atggatgacc cggagagaga agtgttagag tggaggtttg 7380

acagccgcct agcatttcat cacgtggccc gagagctgca tccggagtac ttcaagaact 7440

gctgatatcg agcttgctac aagggacttt ccgctgggga ctttccaggg aggcgtggcc 7500

tgggcgggac tggggagtgg cgagccctca gatcctgcat ataagcagct gctttttgcc 7560

tgtactgggt ctctctggtt agaccagatc tgagcctggg agctctctgg ctaactaggg 7620

aacccactgc ttaagcctca ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt 7680

ctgttgtgtg actctggtaa ctagagatcc ctcagaccct tttagtcagt gtggaaaatc 7740

tctagcagta gtagttcatg tcatcttatt attcagtatt tataacttgc aaagaaatga 7800

atatcagaga gtgagaggcc ttgacattgc tagcgtttac cgtcgacctc tagctagagc 7860

ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 7920

cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 7980

ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 8040

ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 8100

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 8160

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 8220

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 8280

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 8340

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 8400

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 8460

gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 8520

ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 8580

cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 8640

aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 8700

tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 8760

ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 8820

tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 8880

ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 8940

agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 9000

atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 9060

cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 9120

ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 9180

ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 9240

agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 9300

agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 9360

gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 9420

cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 9480

gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 9540

tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 9600

tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 9660

aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 9720

cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 9780

cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 9840

aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 9900

ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 9960

tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 10020

ccacctgacg tcgacggatc gggagatcaa cttgtttatt gcagcttata atggttacaa 10080

ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 10140

tggtttgtcc aaactcatca atgtatctta tcatgtctgg atcaactgga taactcaagc 10200

taaccaaaat catcccaaac ttcccacccc ataccctatt accactgcca attacctgtg 10260

gtttcattta ctctaaacct gtgattcctc tgaattattt tcattttaaa gaaattgtat 10320

ttgttaaata tgtactacaa acttagtagt 10350

<210> 78

<211> 9636

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(635)

<223> LTR

<220>

<221> misc_feature

<222> (636)..(653)

<223> PBS

<220>

<221> misc_feature

<222> (685)..(822)

<223> 包装\信号

<220>

<221> misc_feature

<222> (1303)..(1536)

<223> RRE

<220>

<221> misc_feature

<222> (2028)..(2151)

<223> cPPT

<220>

<221> misc_feature

<222> (2185)..(2668)

<223> 人突触蛋白启动子

<220>

<221> misc_feature

<222> (2681)..(3919)

<223> CoHu hTau-412(1N4R) 3MUT

<220>

<221> misc_feature

<222> (3926)..(3957)

<223> MCS

<220>

<221> misc_feature

<222> (3958)..(4556)

<223> IRES

<220>

<221> misc_feature

<222> (4557)..(5591)

<223> HygR

<220>

<221> misc_feature

<222> (5605)..(6196)

<223> WPRE

<220>

<221> misc_feature

<222> (6399)..(7035)

<223> LTR

<220>

<221> misc_feature

<222> (7504)..(8177)

<223> pUC\起点

<220>

<221> misc_feature

<222> (8322)..(9318)

<223> AmpR

<400> 78

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgatctgcag agggccctgc gtatgagtgc aagtgggttt 2220

taggaccagg atgaggcggg gtgggggtgc ctacctgacg accgaccccg acccactgga 2280

caagcaccca acccccattc cccaaattgc gcatccccta tcagagaggg ggaggggaaa 2340

caggatgcgg cgaggcgcgt gcgcactgcc agcttcagca ccgcggacag tgccttcgcc 2400

cccgcctggc ggcgcgcgcc accgccgcct cagcactgaa ggcgcgctga cgtcactcgc 2460

cggtcccccg caaactcccc ttcccggcca ccttggtcgc gtccgcgccg ccgccggccc 2520

agccggaccg caccacgcga ggcgcgagat aggggggcac gggcgcgacc atctgcgctg 2580

cggcgccggc gactcagcgc tgcctcagtc tgcggtgggc agcggaggag tcgtgtcgtg 2640

cctgagagcg cagggatcta tttccggtga attcgccacc atggcagagc cccggcagga 2700

gttcgaggtt atggaggatc acgccgggac ctatggattg ggcgatagga aagatcaggg 2760

cgggtatact atgcatcagg accaggaagg cgacacggac gctggtctca aggaaagccc 2820

acttcagacg ccgacagagg acgggtctga ggaacctggg agtgaaactt ctgacgctaa 2880

gtctacgcct actgcggagg cggaggaggc aggaatagga gacacaccat cacttgaaga 2940

cgaggcagca ggacacgtaa cccaagcgag aatggtttct aagtccaaag atggaaccgg 3000

atccgatgac aaaaaggcca agggagcaga tggcaaaaca aaaataacga caccgagggg 3060

tgcggctccc cccggtcaaa agggacaggc aaatgccacg cgcatccctg ctaaaacacc 3120

cccggcgccg aaaacccccc cttcatccgg agagccaccc aagtctggtg atagaagcgg 3180

gtatagttcc cccggtagtc cggggactcc aggatcacgc agcagaacgc catccctgcc 3240

aaccccaccc actagagagc ccaaaaaggt cgcagtcgtt cgcactccgc caaaaagccc 3300

ttcctcagcg aaaagccgcc tgcagacggc acctgtcccc atgcctgacc ttaaaaatgt 3360

taaaagcaaa atcggtagta ccgaaaatct caagcatcag ccaggagggg ggaaggttca 3420

gatcatcaat aagaagctgg acctgtctaa cgtgcagagc aagtgtggaa gcaaagataa 3480

cataaagcac gttttggggg gcggaagcgt acagattgtg tataagccgg tggacctctc 3540

aaaagtaaca ttcaagtgtg ggagtctggg caacatccat cacaaacccg ggggcggtca 3600

ggtagaggtg aaaagcgaaa agctcgattt taaggatagg gtacagagta aaattgggtc 3660

tctggacaac ataacacacg taccaggcgg aggcaataag aagatagaaa cgcataaact 3720

cacgttccga gagaacgcta aagcaaagac tgaccacggg gctgagattg tatacaagag 3780

tccggtcgtc tctggggaca cttccccccg acacctttct aacgttagtt ccactggtag 3840

tattgacatg gtcgacagcc ctcaacttgc cactttggca gacgaggtca gtgctagtct 3900

tgcaaagcag ggcttgtgaa attcgctcga gactagttct agagcggccg cggatcccgc 3960

ccctctccct cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt 4020

gcgtttgtct atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg 4080

aaacctggcc ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga 4140

atgcaaggtc tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa 4200

acaacgtctg tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc 4260

tgcggccaaa agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac 4320

gttgtgagtt ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag 4380

gggctgaagg atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc 4440

acatgcttta catgtgttta gtcgaggtta aaaaaacgtc taggcccccc gaaccacggg 4500

gacgtggttt tcctttgaaa aacacgatga taagcttgcc acaacccgta ccaaagatgg 4560

atagatccgg aaagcctgaa ctcaccgcga cgtctgtcga gaagtttctg atcgaaaagt 4620

tcgacagcgt ctccgacctg atgcagctct cggagggcga agaatctcgt gctttcagct 4680

tcgatgtagg agggcgtgga tatgtcctgc gggtaaatag ctgcgccgat ggtttctaca 4740

aagatcgtta tgtttatcgg cactttgcat cggccgcgct cccgattccg gaagtgcttg 4800

acattgggga attcagcgag agcctgacct attgcatctc ccgccgtgca cagggtgtca 4860

cgttgcaaga cctgcctgaa accgaactgc ccgctgttct gcagccggtc gcggaggcca 4920

tggatgcgat cgctgcggcc gatcttagcc agacgagcgg gttcggccca ttcggaccgc 4980

aaggaatcgg tcaatacact acatggcgtg atttcatatg cgcgattgct gatccccatg 5040

tgtatcactg gcaaactgtg atggacgaca ccgtcagtgc gtccgtcgcg caggctctcg 5100

atgagctgat gctttgggcc gaggactgcc ccgaagtccg gcacctcgtg cacgcggatt 5160

tcggctccaa caatgtcctg acggacaatg gccgcataac agcggtcatt gactggagcg 5220

aggcgatgtt cggggattcc caatacgagg tcgccaacat cttcttctgg aggccgtggt 5280

tggcttgtat ggagcagcag acgcgctact tcgagcggag gcatccggag cttgcaggat 5340

cgccgcggct ccgggcgtat atgctccgca ttggtcttga ccaactctat cagagcttgg 5400

ttgacggcaa tttcgatgat gcagcttggg cgcagggtcg atgcgacgca atcgtccgat 5460

ccggagccgg gactgtcggg cgtacacaaa tcgcccgcag aagcgcggcc gtctggaccg 5520

atggctgtgt agaagtactc gccgatagtg gaaaccgacg ccccagcact cgtccgaggg 5580

caaaggaata gacgcgtctg gaacaatcaa cctctggatt acaaaatttg tgaaagattg 5640

actggtattc ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct 5700

ttgtatcatg ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg 5760

ttgctgtctc tttatgagga gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact 5820

gtgtttgctg acgcaacccc cactggttgg ggcattgcca ccacctgtca gctcctttcc 5880

gggactttcg ctttccccct ccctattgcc acggcggaac tcatcgccgc ctgccttgcc 5940

cgctgctgga caggggctcg gctgttgggc actgacaatt ccgtggtgtt gtcggggaag 6000

ctgacgtcct ttccatggct gctcgcctgt gttgccacct ggattctgcg cgggacgtcc 6060

ttctgctacg tcccttcggc cctcaatcca gcggaccttc cttcccgcgg cctgctgccg 6120

gctctgcggc ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat ctccctttgg 6180

gccgcctccc cgcctggaat taattctgca gtcgagacct agaaaaacat ggagcaatca 6240

caagtagcaa tacagcagct accaatgctg attgtgcctg gctagaagca caagaggagg 6300

aggaggtggg ttttccagtc acacctcagg tacctttaag accaatgact tacaaggcag 6360

ctgtagatct tagccacttt ttaaaagaaa agaggggact ggaagggcta attcactccc 6420

aacgaagaca agatatcctt gatctgtgga tctaccacac acaaggctac ttccctgatt 6480

agcagaacta cacaccaggg ccaggggtca gatatccact gacctttgga tggtgctaca 6540

agctagtacc agttgagcca gataaggtag aagaggccaa taaaggagag aacaccagct 6600

tgttacaccc tgtgagcctg catgggatgg atgacccgga gagagaagtg ttagagtgga 6660

ggtttgacag ccgcctagca tttcatcacg tggcccgaga gctgcatccg gagtacttca 6720

agaactgctg atatcgagct tgctacaagg gactttccgc tggggacttt ccagggaggc 6780

gtggcctggg cgggactggg gagtggcgag ccctcagatc ctgcatataa gcagctgctt 6840

tttgcctgta ctgggtctct ctggttagac cagatctgag cctgggagct ctctggctaa 6900

ctagggaacc cactgcttaa gcctcaataa agcttgcctt gagtgcttca agtagtgtgt 6960

gcccgtctgt tgtgtgactc tggtaactag agatccctca gaccctttta gtcagtgtgg 7020

aaaatctcta gcagtagtag ttcatgtcat cttattattc agtatttata acttgcaaag 7080

aaatgaatat cagagagtga gaggccttga cattgctagc gtttaccgtc gacctctagc 7140

tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta tccgctcaca 7200

attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc ctaatgagtg 7260

agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg 7320

tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc 7380

tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 7440

tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 7500

aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 7560

tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 7620

tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 7680

cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 7740

agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 7800

tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 7860

aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 7920

ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 7980

cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt 8040

accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 8100

ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 8160

ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 8220

gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt 8280

aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt 8340

gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc 8400

gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg 8460

cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc 8520

gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg 8580

gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca 8640

ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 8700

tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 8760

ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg 8820

cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca 8880

accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata 8940

cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct 9000

tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact 9060

cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa 9120

acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc 9180

atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga 9240

tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga 9300

aaagtgccac ctgacgtcga cggatcggga gatcaacttg tttattgcag cttataatgg 9360

ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc 9420

tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctggatca actggataac 9480

tcaagctaac caaaatcatc ccaaacttcc caccccatac cctattacca ctgccaatta 9540

cctgtggttt catttactct aaacctgtga ttcctctgaa ttattttcat tttaaagaaa 9600

ttgtatttgt taaatatgta ctacaaactt agtagt 9636

<210> 79

<211> 10350

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(635)

<223> LTR

<220>

<221> misc_feature

<222> (636)..(653)

<223> PBS

<220>

<221> misc_feature

<222> (685)..(822)

<223> 包装\信号

<220>

<221> misc_feature

<222> (1303)..(1536)

<223> RRE

<220>

<221> misc_feature

<222> (2028)..(2151)

<223> cPPT

<220>

<221> misc_feature

<222> (2185)..(2668)

<223> 人突触蛋白启动子

<220>

<221> misc_feature

<222> (2681)..(3916)

<223> CoHu hTau-412(1N4R) 3MUT

<220>

<221> misc_feature

<222> (3917)..(4630)

<223> eGFP

<220>

<221> misc_feature

<222> (4640)..(4671)

<223> MCS

<220>

<221> misc_feature

<222> (4672)..(5270)

<223> IRES

<220>

<221> misc_feature

<222> (5271)..(6305)

<223> HygR

<220>

<221> misc_feature

<222> (6319)..(6910)

<223> WPRE

<220>

<221> misc_feature

<222> (7113)..(7749)

<223> LTR

<220>

<221> misc_feature

<222> (8218)..(8891)

<223> pUC\起点

<220>

<221> misc_feature

<222> (9036)..(10032)

<223> AmpR

<400> 79

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgatctgcag agggccctgc gtatgagtgc aagtgggttt 2220

taggaccagg atgaggcggg gtgggggtgc ctacctgacg accgaccccg acccactgga 2280

caagcaccca acccccattc cccaaattgc gcatccccta tcagagaggg ggaggggaaa 2340

caggatgcgg cgaggcgcgt gcgcactgcc agcttcagca ccgcggacag tgccttcgcc 2400

cccgcctggc ggcgcgcgcc accgccgcct cagcactgaa ggcgcgctga cgtcactcgc 2460

cggtcccccg caaactcccc ttcccggcca ccttggtcgc gtccgcgccg ccgccggccc 2520

agccggaccg caccacgcga ggcgcgagat aggggggcac gggcgcgacc atctgcgctg 2580

cggcgccggc gactcagcgc tgcctcagtc tgcggtgggc agcggaggag tcgtgtcgtg 2640

cctgagagcg cagggatcta tttccggtga attcgccacc atggcagagc cccggcagga 2700

gttcgaggtt atggaggatc acgccgggac ctatggattg ggcgatagga aagatcaggg 2760

cgggtatact atgcatcagg accaggaagg cgacacggac gctggtctca aggaaagccc 2820

acttcagacg ccgacagagg acgggtctga ggaacctggg agtgaaactt ctgacgctaa 2880

gtctacgcct actgcggagg cggaggaggc aggaatagga gacacaccat cacttgaaga 2940

cgaggcagca ggacacgtaa cccaagcgag aatggtttct aagtccaaag atggaaccgg 3000

atccgatgac aaaaaggcca agggagcaga tggcaaaaca aaaataacga caccgagggg 3060

tgcggctccc cccggtcaaa agggacaggc aaatgccacg cgcatccctg ctaaaacacc 3120

cccggcgccg aaaacccccc cttcatccgg agagccaccc aagtctggtg atagaagcgg 3180

gtatagttcc cccggtagtc cggggactcc aggatcacgc agcagaacgc catccctgcc 3240

aaccccaccc actagagagc ccaaaaaggt cgcagtcgtt cgcactccgc caaaaagccc 3300

ttcctcagcg aaaagccgcc tgcagacggc acctgtcccc atgcctgacc ttaaaaatgt 3360

taaaagcaaa atcggtagta ccgaaaatct caagcatcag ccaggagggg ggaaggttca 3420

gatcatcaat aagaagctgg acctgtctaa cgtgcagagc aagtgtggaa gcaaagataa 3480

cataaagcac gttttggggg gcggaagcgt acagattgtg tataagccgg tggacctctc 3540

aaaagtaaca ttcaagtgtg ggagtctggg caacatccat cacaaacccg ggggcggtca 3600

ggtagaggtg aaaagcgaaa agctcgattt taaggatagg gtacagagta aaattgggtc 3660

tctggacaac ataacacacg taccaggcgg aggcaataag aagatagaaa cgcataaact 3720

cacgttccga gagaacgcta aagcaaagac tgaccacggg gctgagattg tatacaagag 3780

tccggtcgtc tctggggaca cttccccccg acacctttct aacgttagtt ccactggtag 3840

tattgacatg gtcgacagcc ctcaacttgc cactttggca gacgaggtca gtgctagtct 3900

tgcaaagcag ggcttggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 3960

ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 4020

cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt 4080

gccctggccc accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc 4140

cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga 4200

gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga 4260

gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa 4320

catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga 4380

caagcagaag aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag 4440

cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct 4500

gcccgacaac cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg 4560

cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga 4620

gctgtacaag tgaaattcgc tcgagactag ttctagagcg gccgcggatc ccgcccctct 4680

ccctcccccc cccctaacgt tactggccga agccgcttgg aataaggccg gtgtgcgttt 4740

gtctatatgt tattttccac catattgccg tcttttggca atgtgagggc ccggaaacct 4800

ggccctgtct tcttgacgag cattcctagg ggtctttccc ctctcgccaa aggaatgcaa 4860

ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag cttcttgaag acaaacaacg 4920

tctgtagcga ccctttgcag gcagcggaac cccccacctg gcgacaggtg cctctgcggc 4980

caaaagccac gtgtataaga tacacctgca aaggcggcac aaccccagtg ccacgttgtg 5040

agttggatag ttgtggaaag agtcaaatgg ctctcctcaa gcgtattcaa caaggggctg 5100

aaggatgccc agaaggtacc ccattgtatg ggatctgatc tggggcctcg gtgcacatgc 5160

tttacatgtg tttagtcgag gttaaaaaaa cgtctaggcc ccccgaacca cggggacgtg 5220

gttttccttt gaaaaacacg atgataagct tgccacaacc cgtaccaaag atggatagat 5280

ccggaaagcc tgaactcacc gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca 5340

gcgtctccga cctgatgcag ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg 5400

taggagggcg tggatatgtc ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc 5460

gttatgttta tcggcacttt gcatcggccg cgctcccgat tccggaagtg cttgacattg 5520

gggaattcag cgagagcctg acctattgca tctcccgccg tgcacagggt gtcacgttgc 5580

aagacctgcc tgaaaccgaa ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg 5640

cgatcgctgc ggccgatctt agccagacga gcgggttcgg cccattcgga ccgcaaggaa 5700

tcggtcaata cactacatgg cgtgatttca tatgcgcgat tgctgatccc catgtgtatc 5760

actggcaaac tgtgatggac gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc 5820

tgatgctttg ggccgaggac tgccccgaag tccggcacct cgtgcacgcg gatttcggct 5880

ccaacaatgt cctgacggac aatggccgca taacagcggt cattgactgg agcgaggcga 5940

tgttcgggga ttcccaatac gaggtcgcca acatcttctt ctggaggccg tggttggctt 6000

gtatggagca gcagacgcgc tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc 6060

ggctccgggc gtatatgctc cgcattggtc ttgaccaact ctatcagagc ttggttgacg 6120

gcaatttcga tgatgcagct tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag 6180

ccgggactgt cgggcgtaca caaatcgccc gcagaagcgc ggccgtctgg accgatggct 6240

gtgtagaagt actcgccgat agtggaaacc gacgccccag cactcgtccg agggcaaagg 6300

aatagacgcg tctggaacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt 6360

attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 6420

catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 6480

tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 6540

gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 6600

ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 6660

tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaagctgacg 6720

tcctttccat ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 6780

tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 6840

cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 6900

tccccgcctg gaattaattc tgcagtcgag acctagaaaa acatggagca atcacaagta 6960

gcaatacagc agctaccaat gctgattgtg cctggctaga agcacaagag gaggaggagg 7020

tgggttttcc agtcacacct caggtacctt taagaccaat gacttacaag gcagctgtag 7080

atcttagcca ctttttaaaa gaaaagaggg gactggaagg gctaattcac tcccaacgaa 7140

gacaagatat ccttgatctg tggatctacc acacacaagg ctacttccct gattagcaga 7200

actacacacc agggccaggg gtcagatatc cactgacctt tggatggtgc tacaagctag 7260

taccagttga gccagataag gtagaagagg ccaataaagg agagaacacc agcttgttac 7320

accctgtgag cctgcatggg atggatgacc cggagagaga agtgttagag tggaggtttg 7380

acagccgcct agcatttcat cacgtggccc gagagctgca tccggagtac ttcaagaact 7440

gctgatatcg agcttgctac aagggacttt ccgctgggga ctttccaggg aggcgtggcc 7500

tgggcgggac tggggagtgg cgagccctca gatcctgcat ataagcagct gctttttgcc 7560

tgtactgggt ctctctggtt agaccagatc tgagcctggg agctctctgg ctaactaggg 7620

aacccactgc ttaagcctca ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt 7680

ctgttgtgtg actctggtaa ctagagatcc ctcagaccct tttagtcagt gtggaaaatc 7740

tctagcagta gtagttcatg tcatcttatt attcagtatt tataacttgc aaagaaatga 7800

atatcagaga gtgagaggcc ttgacattgc tagcgtttac cgtcgacctc tagctagagc 7860

ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 7920

cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 7980

ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 8040

ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 8100

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 8160

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 8220

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 8280

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 8340

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 8400

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 8460

gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 8520

ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 8580

cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 8640

aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 8700

tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 8760

ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 8820

tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 8880

ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 8940

agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 9000

atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 9060

cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 9120

ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 9180

ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 9240

agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 9300

agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 9360

gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 9420

cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 9480

gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 9540

tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 9600

tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 9660

aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 9720

cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 9780

cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 9840

aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 9900

ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 9960

tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 10020

ccacctgacg tcgacggatc gggagatcaa cttgtttatt gcagcttata atggttacaa 10080

ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 10140

tggtttgtcc aaactcatca atgtatctta tcatgtctgg atcaactgga taactcaagc 10200

taaccaaaat catcccaaac ttcccacccc ataccctatt accactgcca attacctgtg 10260

gtttcattta ctctaaacct gtgattcctc tgaattattt tcattttaaa gaaattgtat 10320

ttgttaaata tgtactacaa acttagtagt 10350

<210> 80

<211> 10350

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (1)..(635)

<223> LTR

<220>

<221> misc_feature

<222> (636)..(653)

<223> PBS

<220>

<221> misc_feature

<222> (685)..(822)

<223> 包装\信号

<220>

<221> misc_feature

<222> (1303)..(1536)

<223> RRE

<220>

<221> misc_feature

<222> (2028)..(2151)

<223> cPPT

<220>

<221> misc_feature

<222> (2185)..(2668)

<223> 人突触蛋白启动子

<220>

<221> misc_feature

<222> (2681)..(3397)

<223> eGFP

<220>

<221> misc_feature

<222> (3398)..(4633)

<223> CoHu hTau-412 (1NR4) 3MUT

<220>

<221> misc_feature

<222> (4640)..(4671)

<223> MCS

<220>

<221> misc_feature

<222> (4672)..(5270)

<223> IRES

<220>

<221> misc_feature

<222> (5271)..(6305)

<223> HygR

<220>

<221> misc_feature

<222> (6319)..(6910)

<223> WPRE

<220>

<221> misc_feature

<222> (7113)..(7749)

<223> LTR

<220>

<221> misc_feature

<222> (8218)..(8891)

<223> pUC\起点

<220>

<221> misc_feature

<222> (9036)..(10032)

<223> AmpR

<400> 80

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgatctgcag agggccctgc gtatgagtgc aagtgggttt 2220

taggaccagg atgaggcggg gtgggggtgc ctacctgacg accgaccccg acccactgga 2280

caagcaccca acccccattc cccaaattgc gcatccccta tcagagaggg ggaggggaaa 2340

caggatgcgg cgaggcgcgt gcgcactgcc agcttcagca ccgcggacag tgccttcgcc 2400

cccgcctggc ggcgcgcgcc accgccgcct cagcactgaa ggcgcgctga cgtcactcgc 2460

cggtcccccg caaactcccc ttcccggcca ccttggtcgc gtccgcgccg ccgccggccc 2520

agccggaccg caccacgcga ggcgcgagat aggggggcac gggcgcgacc atctgcgctg 2580

cggcgccggc gactcagcgc tgcctcagtc tgcggtgggc agcggaggag tcgtgtcgtg 2640

cctgagagcg cagggatcta tttccggtga attcgccacc atggtgagca agggcgagga 2700

gctgttcacc ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa 2760

gttcagcgtg tccggcgagg gcgagggcga tgccacctac ggcaagctga ccctgaagtt 2820

catctgcacc accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccctgaccta 2880

cggcgtgcag tgcttcagcc gctaccccga ccacatgaag cagcacgact tcttcaagtc 2940

cgccatgccc gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta 3000

caagacccgc gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa 3060

gggcatcgac ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa 3120

cagccacaac gtctatatca tggccgacaa gcagaagaac ggcatcaagg tgaacttcaa 3180

gatccgccac aacatcgagg acggcagcgt gcagctcgcc gaccactacc agcagaacac 3240

ccccatcggc gacggccccg tgctgctgcc cgacaaccac tacctgagca cccagtccgc 3300

cctgagcaaa gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc 3360

cgccgggatc actctcggca tggacgagct gtacaaggca gagccccggc aggagttcga 3420

ggttatggag gatcacgccg ggacctatgg attgggcgat aggaaagatc agggcgggta 3480

tactatgcat caggaccagg aaggcgacac ggacgctggt ctcaaggaaa gcccacttca 3540

gacgccgaca gaggacgggt ctgaggaacc tgggagtgaa acttctgacg ctaagtctac 3600

gcctactgcg gaggcggagg aggcaggaat aggagacaca ccatcacttg aagacgaggc 3660

agcaggacac gtaacccaag cgagaatggt ttctaagtcc aaagatggaa ccggatccga 3720

tgacaaaaag gccaagggag cagatggcaa aacaaaaata acgacaccga ggggtgcggc 3780

tccccccggt caaaagggac aggcaaatgc cacgcgcatc cctgctaaaa cacccccggc 3840

gccgaaaacc cccccttcat ccggagagcc acccaagtct ggtgatagaa gcgggtatag 3900

ttcccccggt agtccgggga ctccaggatc acgcagcaga acgccatccc tgccaacccc 3960

acccactaga gagcccaaaa aggtcgcagt cgttcgcact ccgccaaaaa gcccttcctc 4020

agcgaaaagc cgcctgcaga cggcacctgt ccccatgcct gaccttaaaa atgttaaaag 4080

caaaatcggt agtaccgaaa atctcaagca tcagccagga ggggggaagg ttcagatcat 4140

caataagaag ctggacctgt ctaacgtgca gagcaagtgt ggaagcaaag ataacataaa 4200

gcacgttttg gggggcggaa gcgtacagat tgtgtataag ccggtggacc tctcaaaagt 4260

aacattcaag tgtgggagtc tgggcaacat ccatcacaaa cccgggggcg gtcaggtaga 4320

ggtgaaaagc gaaaagctcg attttaagga tagggtacag agtaaaattg ggtctctgga 4380

caacataaca cacgtaccag gcggaggcaa taagaagata gaaacgcata aactcacgtt 4440

ccgagagaac gctaaagcaa agactgacca cggggctgag attgtataca agagtccggt 4500

cgtctctggg gacacttccc cccgacacct ttctaacgtt agttccactg gtagtattga 4560

catggtcgac agccctcaac ttgccacttt ggcagacgag gtcagtgcta gtcttgcaaa 4620

gcagggcttg tgaaattcgc tcgagactag ttctagagcg gccgcggatc ccgcccctct 4680

ccctcccccc cccctaacgt tactggccga agccgcttgg aataaggccg gtgtgcgttt 4740

gtctatatgt tattttccac catattgccg tcttttggca atgtgagggc ccggaaacct 4800

ggccctgtct tcttgacgag cattcctagg ggtctttccc ctctcgccaa aggaatgcaa 4860

ggtctgttga atgtcgtgaa ggaagcagtt cctctggaag cttcttgaag acaaacaacg 4920

tctgtagcga ccctttgcag gcagcggaac cccccacctg gcgacaggtg cctctgcggc 4980

caaaagccac gtgtataaga tacacctgca aaggcggcac aaccccagtg ccacgttgtg 5040

agttggatag ttgtggaaag agtcaaatgg ctctcctcaa gcgtattcaa caaggggctg 5100

aaggatgccc agaaggtacc ccattgtatg ggatctgatc tggggcctcg gtgcacatgc 5160

tttacatgtg tttagtcgag gttaaaaaaa cgtctaggcc ccccgaacca cggggacgtg 5220

gttttccttt gaaaaacacg atgataagct tgccacaacc cgtaccaaag atggatagat 5280

ccggaaagcc tgaactcacc gcgacgtctg tcgagaagtt tctgatcgaa aagttcgaca 5340

gcgtctccga cctgatgcag ctctcggagg gcgaagaatc tcgtgctttc agcttcgatg 5400

taggagggcg tggatatgtc ctgcgggtaa atagctgcgc cgatggtttc tacaaagatc 5460

gttatgttta tcggcacttt gcatcggccg cgctcccgat tccggaagtg cttgacattg 5520

gggaattcag cgagagcctg acctattgca tctcccgccg tgcacagggt gtcacgttgc 5580

aagacctgcc tgaaaccgaa ctgcccgctg ttctgcagcc ggtcgcggag gccatggatg 5640

cgatcgctgc ggccgatctt agccagacga gcgggttcgg cccattcgga ccgcaaggaa 5700

tcggtcaata cactacatgg cgtgatttca tatgcgcgat tgctgatccc catgtgtatc 5760

actggcaaac tgtgatggac gacaccgtca gtgcgtccgt cgcgcaggct ctcgatgagc 5820

tgatgctttg ggccgaggac tgccccgaag tccggcacct cgtgcacgcg gatttcggct 5880

ccaacaatgt cctgacggac aatggccgca taacagcggt cattgactgg agcgaggcga 5940

tgttcgggga ttcccaatac gaggtcgcca acatcttctt ctggaggccg tggttggctt 6000

gtatggagca gcagacgcgc tacttcgagc ggaggcatcc ggagcttgca ggatcgccgc 6060

ggctccgggc gtatatgctc cgcattggtc ttgaccaact ctatcagagc ttggttgacg 6120

gcaatttcga tgatgcagct tgggcgcagg gtcgatgcga cgcaatcgtc cgatccggag 6180

ccgggactgt cgggcgtaca caaatcgccc gcagaagcgc ggccgtctgg accgatggct 6240

gtgtagaagt actcgccgat agtggaaacc gacgccccag cactcgtccg agggcaaagg 6300

aatagacgcg tctggaacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt 6360

attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 6420

catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 6480

tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 6540

gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 6600

ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 6660

tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaagctgacg 6720

tcctttccat ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 6780

tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 6840

cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 6900

tccccgcctg gaattaattc tgcagtcgag acctagaaaa acatggagca atcacaagta 6960

gcaatacagc agctaccaat gctgattgtg cctggctaga agcacaagag gaggaggagg 7020

tgggttttcc agtcacacct caggtacctt taagaccaat gacttacaag gcagctgtag 7080

atcttagcca ctttttaaaa gaaaagaggg gactggaagg gctaattcac tcccaacgaa 7140

gacaagatat ccttgatctg tggatctacc acacacaagg ctacttccct gattagcaga 7200

actacacacc agggccaggg gtcagatatc cactgacctt tggatggtgc tacaagctag 7260

taccagttga gccagataag gtagaagagg ccaataaagg agagaacacc agcttgttac 7320

accctgtgag cctgcatggg atggatgacc cggagagaga agtgttagag tggaggtttg 7380

acagccgcct agcatttcat cacgtggccc gagagctgca tccggagtac ttcaagaact 7440

gctgatatcg agcttgctac aagggacttt ccgctgggga ctttccaggg aggcgtggcc 7500

tgggcgggac tggggagtgg cgagccctca gatcctgcat ataagcagct gctttttgcc 7560

tgtactgggt ctctctggtt agaccagatc tgagcctggg agctctctgg ctaactaggg 7620

aacccactgc ttaagcctca ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt 7680

ctgttgtgtg actctggtaa ctagagatcc ctcagaccct tttagtcagt gtggaaaatc 7740

tctagcagta gtagttcatg tcatcttatt attcagtatt tataacttgc aaagaaatga 7800

atatcagaga gtgagaggcc ttgacattgc tagcgtttac cgtcgacctc tagctagagc 7860

ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 7920

cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 7980

ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 8040

ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 8100

gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 8160

cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 8220

tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 8280

cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 8340

aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 8400

cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 8460

gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 8520

ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 8580

cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 8640

aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 8700

tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc 8760

ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 8820

tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 8880

ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 8940

agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 9000

atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 9060

cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 9120

ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 9180

ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 9240

agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 9300

agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 9360

gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 9420

cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 9480

gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 9540

tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 9600

tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 9660

aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 9720

cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 9780

cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 9840

aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 9900

ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 9960

tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 10020

ccacctgacg tcgacggatc gggagatcaa cttgtttatt gcagcttata atggttacaa 10080

ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg 10140

tggtttgtcc aaactcatca atgtatctta tcatgtctgg atcaactgga taactcaagc 10200

taaccaaaat catcccaaac ttcccacccc ataccctatt accactgcca attacctgtg 10260

gtttcattta ctctaaacct gtgattcctc tgaattattt tcattttaaa gaaattgtat 10320

ttgttaaata tgtactacaa acttagtagt 10350

<210> 81

<211> 1236

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 81

gctgagcccc gacaggagtt cgaggtaatg gaggatcacg cagggacgta tggtctggga 60

gacaggaagg atcaaggcgg ctatacgatg caccaggatc aggagggcga taccgatgcg 120

ggcctcaaag agtccccgct tcaaacacca actgaggatg ggagtgagga gccaggaagt 180

gagacaagcg acgcgaaatc aacccctact gccgaagcgg aggaggccgg gatcggagat 240

acaccatctc tcgaagacga agctgctggc cacgtgacgc aagcacgaat ggtgtccaaa 300

agcaaagacg gtacaggttc tgacgacaaa aaggcgaagg gggcagatgg gaaaactaaa 360

atcgccacgc cccggggtgc ggcgccgcct gggcagaaag ggcaagcaaa tgcgacgcga 420

atacctgcca agacgcctcc ggctcctaag accccaccat catctggtga accgcctaaa 480

agcggggatc gaagcggtta ttcatcaccg ggtagtccgg gtacgccagg ctctaggagc 540

agaactcctt cactgcccac gccccccacg cgcgaaccta agaaagtggc agtggtgcga 600

acacccccaa aaagcccctc aagtgcaaaa tcacggctcc agactgcacc cgtaccgatg 660

cccgatctca aaaacgtgaa atctaagata ggtagtacag agaatctgaa gcatcaaccg 720

ggaggtggaa aggtgcagat tatcaataag aaacttgacc tgagtaacgt tcaatccaag 780

tgtggatcaa aagataatat caagcacgtc cctggaggcg gttcagtgca gatcgtttac 840

aaacctgttg atcttagcaa ggtgacttcc aagtgcgggt ctctgggcaa cattcatcac 900

aaacctggtg gagggcaagt tgaggtcaaa agcgaaaagc tcgacttcaa agatcgagtt 960

cagagcaaga taggcagcct tgataatatt acccatgtcc ccggcggagg gaacaagaag 1020

attgagactc ataagttgac gttcagagaa aatgctaaag cgaaaacgga tcatggcgca 1080

gaaatagttt ataaatctcc tgtggtcagt ggtgacactt cacccaggca cctctcaaac 1140

gtgtcatcaa cgggctcaat cgacatggtg gattctcccc aactcgcaac acttgctgat 1200

gaggtaagtg ccagcctcgc aaagcaagga ctctaa 1236

<210> 82

<211> 411

<212> PRT

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 82

Ala Glu Pro Arg Gln Glu Phe Glu Val Met Glu Asp His Ala Gly Thr

1 5 10 15

Tyr Gly Leu Gly Asp Arg Lys Asp Gln Gly Gly Tyr Thr Met His Gln

20 25 30

Asp Gln Glu Gly Asp Thr Asp Ala Gly Leu Lys Glu Ser Pro Leu Gln

35 40 45

Thr Pro Thr Glu Asp Gly Ser Glu Glu Pro Gly Ser Glu Thr Ser Asp

50 55 60

Ala Lys Ser Thr Pro Thr Ala Glu Ala Glu Glu Ala Gly Ile Gly Asp

65 70 75 80

Thr Pro Ser Leu Glu Asp Glu Ala Ala Gly His Val Thr Gln Ala Arg

85 90 95

Met Val Ser Lys Ser Lys Asp Gly Thr Gly Ser Asp Asp Lys Lys Ala

100 105 110

Lys Gly Ala Asp Gly Lys Thr Lys Ile Ala Thr Pro Arg Gly Ala Ala

115 120 125

Pro Pro Gly Gln Lys Gly Gln Ala Asn Ala Thr Arg Ile Pro Ala Lys

130 135 140

Thr Pro Pro Ala Pro Lys Thr Pro Pro Ser Ser Gly Glu Pro Pro Lys

145 150 155 160

Ser Gly Asp Arg Ser Gly Tyr Ser Ser Pro Gly Ser Pro Gly Thr Pro

165 170 175

Gly Ser Arg Ser Arg Thr Pro Ser Leu Pro Thr Pro Pro Thr Arg Glu

180 185 190

Pro Lys Lys Val Ala Val Val Arg Thr Pro Pro Lys Ser Pro Ser Ser

195 200 205

Ala Lys Ser Arg Leu Gln Thr Ala Pro Val Pro Met Pro Asp Leu Lys

210 215 220

Asn Val Lys Ser Lys Ile Gly Ser Thr Glu Asn Leu Lys His Gln Pro

225 230 235 240

Gly Gly Gly Lys Val Gln Ile Ile Asn Lys Lys Leu Asp Leu Ser Asn

245 250 255

Val Gln Ser Lys Cys Gly Ser Lys Asp Asn Ile Lys His Val Pro Gly

260 265 270

Gly Gly Ser Val Gln Ile Val Tyr Lys Pro Val Asp Leu Ser Lys Val

275 280 285

Thr Ser Lys Cys Gly Ser Leu Gly Asn Ile His His Lys Pro Gly Gly

290 295 300

Gly Gln Val Glu Val Lys Ser Glu Lys Leu Asp Phe Lys Asp Arg Val

305 310 315 320

Gln Ser Lys Ile Gly Ser Leu Asp Asn Ile Thr His Val Pro Gly Gly

325 330 335

Gly Asn Lys Lys Ile Glu Thr His Lys Leu Thr Phe Arg Glu Asn Ala

340 345 350

Lys Ala Lys Thr Asp His Gly Ala Glu Ile Val Tyr Lys Ser Pro Val

355 360 365

Val Ser Gly Asp Thr Ser Pro Arg His Leu Ser Asn Val Ser Ser Thr

370 375 380

Gly Ser Ile Asp Met Val Asp Ser Pro Gln Leu Ala Thr Leu Ala Asp

385 390 395 400

Glu Val Ser Ala Ser Leu Ala Lys Gln Gly Leu

405 410

<210> 83

<211> 1236

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 83

gcagagcccc ggcaggagtt cgaggttatg gaggatcacg ccgggaccta tggattgggc 60

gataggaaag atcagggcgg gtatactatg catcaggacc aggaaggcga cacggacgct 120

ggtctcaagg aaagcccact tcagacgccg acagaggacg ggtctgagga acctgggagt 180

gaaacttctg acgctaagtc tacgcctact gcggaggcgg aggaggcagg aataggagac 240

acaccatcac ttgaagacga ggcagcagga cacgtaaccc aagcgagaat ggtttctaag 300

tccaaagatg gaaccggatc cgatgacaaa aaggccaagg gagcagatgg caaaacaaaa 360

ataacgacac cgaggggtgc ggctcccccc ggtcaaaagg gacaggcaaa tgccacgcgc 420

atccctgcta aaacaccccc ggcgccgaaa accccccctt catccggaga gccacccaag 480

tctggtgata gaagcgggta tagttccccc ggtagtccgg ggactccagg atcacgcagc 540

agaacgccat ccctgccaac cccacccact agagagccca aaaaggtcgc agtcgttcgc 600

actccgccaa aaagcccttc ctcagcgaaa agccgcctgc agacggcacc tgtccccatg 660

cctgacctta aaaatgttaa aagcaaaatc ggtagtaccg aaaatctcaa gcatcagcca 720

ggagggggga aggttcagat catcaataag aagctggacc tgtctaacgt gcagagcaag 780

tgtggaagca aagataacat aaagcacgtt ttggggggcg gaagcgtaca gattgtgtat 840

aagccggtgg acctctcaaa agtaacattc aagtgtggga gtctgggcaa catccatcac 900

aaacccgggg gcggtcaggt agaggtgaaa agcgaaaagc tcgattttaa ggatagggta 960

cagagtaaaa ttgggtctct ggacaacata acacacgtac caggcggagg caataagaag 1020

atagaaacgc ataaactcac gttccgagag aacgctaaag caaagactga ccacggggct 1080

gagattgtat acaagagtcc ggtcgtctct ggggacactt ccccccgaca cctttctaac 1140

gttagttcca ctggtagtat tgacatggtc gacagccctc aacttgccac tttggcagac 1200

gaggtcagtg ctagtcttgc aaagcagggc ttgtga 1236

<210> 84

<211> 411

<212> PRT

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 84

Ala Glu Pro Arg Gln Glu Phe Glu Val Met Glu Asp His Ala Gly Thr

1 5 10 15

Tyr Gly Leu Gly Asp Arg Lys Asp Gln Gly Gly Tyr Thr Met His Gln

20 25 30

Asp Gln Glu Gly Asp Thr Asp Ala Gly Leu Lys Glu Ser Pro Leu Gln

35 40 45

Thr Pro Thr Glu Asp Gly Ser Glu Glu Pro Gly Ser Glu Thr Ser Asp

50 55 60

Ala Lys Ser Thr Pro Thr Ala Glu Ala Glu Glu Ala Gly Ile Gly Asp

65 70 75 80

Thr Pro Ser Leu Glu Asp Glu Ala Ala Gly His Val Thr Gln Ala Arg

85 90 95

Met Val Ser Lys Ser Lys Asp Gly Thr Gly Ser Asp Asp Lys Lys Ala

100 105 110

Lys Gly Ala Asp Gly Lys Thr Lys Ile Thr Thr Pro Arg Gly Ala Ala

115 120 125

Pro Pro Gly Gln Lys Gly Gln Ala Asn Ala Thr Arg Ile Pro Ala Lys

130 135 140

Thr Pro Pro Ala Pro Lys Thr Pro Pro Ser Ser Gly Glu Pro Pro Lys

145 150 155 160

Ser Gly Asp Arg Ser Gly Tyr Ser Ser Pro Gly Ser Pro Gly Thr Pro

165 170 175

Gly Ser Arg Ser Arg Thr Pro Ser Leu Pro Thr Pro Pro Thr Arg Glu

180 185 190

Pro Lys Lys Val Ala Val Val Arg Thr Pro Pro Lys Ser Pro Ser Ser

195 200 205

Ala Lys Ser Arg Leu Gln Thr Ala Pro Val Pro Met Pro Asp Leu Lys

210 215 220

Asn Val Lys Ser Lys Ile Gly Ser Thr Glu Asn Leu Lys His Gln Pro

225 230 235 240

Gly Gly Gly Lys Val Gln Ile Ile Asn Lys Lys Leu Asp Leu Ser Asn

245 250 255

Val Gln Ser Lys Cys Gly Ser Lys Asp Asn Ile Lys His Val Leu Gly

260 265 270

Gly Gly Ser Val Gln Ile Val Tyr Lys Pro Val Asp Leu Ser Lys Val

275 280 285

Thr Phe Lys Cys Gly Ser Leu Gly Asn Ile His His Lys Pro Gly Gly

290 295 300

Gly Gln Val Glu Val Lys Ser Glu Lys Leu Asp Phe Lys Asp Arg Val

305 310 315 320

Gln Ser Lys Ile Gly Ser Leu Asp Asn Ile Thr His Val Pro Gly Gly

325 330 335

Gly Asn Lys Lys Ile Glu Thr His Lys Leu Thr Phe Arg Glu Asn Ala

340 345 350

Lys Ala Lys Thr Asp His Gly Ala Glu Ile Val Tyr Lys Ser Pro Val

355 360 365

Val Ser Gly Asp Thr Ser Pro Arg His Leu Ser Asn Val Ser Ser Thr

370 375 380

Gly Ser Ile Asp Met Val Asp Ser Pro Gln Leu Ala Thr Leu Ala Asp

385 390 395 400

Glu Val Ser Ala Ser Leu Ala Lys Gln Gly Leu

405 410

<210> 85

<211> 14873

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<220>

<221> misc_feature

<222> (217)..(397)

<223> LTR

<220>

<221> misc_feature

<222> (444)..(569)

<223> HIV-1 Psi

<220>

<221> misc_feature

<222> (1062)..(1295)

<223> RRE

<220>

<221> misc_feature

<222> (1822)..(1939)

<223> cPPT/CTS

<220>

<221> misc_feature

<222> (4120)..(4195)

<223> gRNA支架

<220>

<221> misc_feature

<222> (4487)..(4496)

<223> Kozak

<220>

<221> misc_feature

<222> (4493)..(8596)

<223> Cas9 CDS

<220>

<221> misc_feature

<222> (8597)..(8644)

<223> NLS

<220>

<221> misc_feature

<222> (8645)..(8668)

<223> FLAG

<220>

<221> misc_feature

<222> (8678)..(8734)

<223> P2A

<220>

<221> misc_feature

<222> (8735)..(9331)

<223> PuroR

<220>

<221> misc_feature

<222> (9347)..(9935)

<223> WPRE

<220>

<221> misc_feature

<222> (9818)..(9829)

<223> 因子Xa位点

<220>

<221> misc_feature

<222> (10007)..(10240)

<223> LTR

<220>

<221> misc_feature

<222> (10542)..(10970)

<223> F1起点

<220>

<221> misc_feature

<222> (11164)..(11299)

<223> SV40起点

<220>

<221> misc_feature

<222> (11427)..(11801)

<223> BleoR

<220>

<221> misc_feature

<222> (12125)..(12141)

<223> Lac操纵基因

<220>

<221> misc_feature

<222> (12194)..(12215)

<223> CAP结合位点

<220>

<221> misc_feature

<222> (12503)..(13091)

<223> 起点

<220>

<221> misc_feature

<222> (13262)..(14122)

<223> AmpR

<400> 85

tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc 60

caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact 120

ttccaaaatg tcgtaacaac tccgccccat tgacgcaaat gggcggtagg cgtgtacggt 180

gggaggtcta tataagcagc gcgttttgcc tgtactgggt ctctctggtt agaccagatc 240

tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca ataaagcttg 300

ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa ctagagatcc 360

ctcagaccct tttagtcagt gtggaaaatc tctagcagtg gcgcccgaac agggacttga 420

aagcgaaagg gaaaccagag gagctctctc gacgcaggac tcggcttgct gaagcgcgca 480

cggcaagagg cgaggggcgg cgactggtga gtacgccaaa aattttgact agcggaggct 540

agaaggagag agatgggtgc gagagcgtca gtattaagcg ggggagaatt agatcgcgat 600

gggaaaaaat tcggttaagg ccagggggaa agaaaaaata taaattaaaa catatagtat 660

gggcaagcag ggagctagaa cgattcgcag ttaatcctgg cctgttagaa acatcagaag 720

gctgtagaca aatactggga cagctacaac catcccttca gacaggatca gaagaactta 780

gatcattata taatacagta gcaaccctct attgtgtgca tcaaaggata gagataaaag 840

acaccaagga agctttagac aagatagagg aagagcaaaa caaaagtaag accaccgcac 900

agcaagcggc cgctgatctt cagacctgga ggaggagata tgagggacaa ttggagaagt 960

gaattatata aatataaagt agtaaaaatt gaaccattag gagtagcacc caccaaggca 1020

aagagaagag tggtgcagag agaaaaaaga gcagtgggaa taggagcttt gttccttggg 1080

ttcttgggag cagcaggaag cactatgggc gcagcgtcaa tgacgctgac ggtacaggcc 1140

agacaattat tgtctggtat agtgcagcag cagaacaatt tgctgagggc tattgaggcg 1200

caacagcatc tgttgcaact cacagtctgg ggcatcaagc agctccaggc aagaatcctg 1260

gctgtggaaa gatacctaaa ggatcaacag ctcctgggga tttggggttg ctctggaaaa 1320

ctcatttgca ccactgctgt gccttggaat gctagttgga gtaataaatc tctggaacag 1380

atttggaatc acacgacctg gatggagtgg gacagagaaa ttaacaatta cacaagctta 1440

atacactcct taattgaaga atcgcaaaac cagcaagaaa agaatgaaca agaattattg 1500

gaattagata aatgggcaag tttgtggaat tggtttaaca taacaaattg gctgtggtat 1560

ataaaattat tcataatgat agtaggaggc ttggtaggtt taagaatagt ttttgctgta 1620

ctttctatag tgaatagagt taggcaggga tattcaccat tatcgtttca gacccacctc 1680

ccaaccccga ggggacccga caggcccgaa ggaatagaag aagaaggtgg agagagagac 1740

agagacagat ccattcgatt agtgaacgga tcggcactgc gtgcgccaat tctgcagaca 1800

aatggcagta ttcatccaca attttaaaag aaaagggggg attggggggt acagtgcagg 1860

ggaaagaata gtagacataa tagcaacaga catacaaact aaagaattac aaaaacaaat 1920

tacaaaaatt caaaattttc gggtttatta cagggacagc agagatccag tttggttaat 1980

taaggtaccg agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 2040

gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 2100

tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 2160

gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 2220

tggaaaggac gaaacaccgg agacggttgt aaatgagcac acaaaataca catgctaaaa 2280

tattatattc tatgaccttt ataaaatcaa ccaaaatctt ctttttaata actttagtat 2340

caataattag aatttttatg ttcctttttg caaactttta ataaaaatga gcaaaataaa 2400

aaaacgctag ttttagtaac tcgcgttgtt ttcttcacct ttaataatag ctactccacc 2460

acttgttcct aagcggtcag ctcctgcttc aatcattttt tgagcatctt caaatgttct 2520

aactccacca gctgctttaa ctaaagcatt gtctttaaca actgacttca ttagtttaac 2580

atcttcaaat gttgcacctg attttgaaaa tcctgttgat gttttaacaa attctaatcc 2640

agcttcaaca gctatttcac aagctttcat gatttcttct tttgttaata aacaattttc 2700

cataatacat ttaacaacat gtgatccagc tgcttttttt acagctttca tgtcttctaa 2760

aactaattca taatttttgt cttttaatgc accaatattt aataccatat caatttctgt 2820

tgcaccatct ttaattgctt cagaaacttc gaatgctttt gtagctgttg tgcatgcacc 2880

tagaggaaaa cctacaacat ttgttattcc tacatttgtg ccttttaata attctttaca 2940

atagcttgtt caatatgaat taacacaaac tgttgcaaaa tcaaattcaa ttgcttcatc 3000

acataattgt ttaatttcag ctttcgtagc atcttgtttt aataatgtgt gatctatata 3060

tttgtttagt ttcatttttt ctcctatata ttcattttta attttaattc tttaataatt 3120

tcgtctactt taactttagc gttttgaaca gattcaccaa cacctataaa ataaattttt 3180

agtttaggtt cagttccact tgggcgaaca gcaaatcatg acttatcttc taaataaaat 3240

tttagtaagt cttgtcctgg catattatac attccatcga tgtagtcttc aacattaaca 3300

actttaagtc cagcaatttg agttaagggt gttgctctca atgatttcat taatggttca 3360

atttttaatt tcttttcttc tggtttaaaa ttcaagttta aagtgaaagt gtaatatgca 3420

cccatttctt taaataaatc ttctaaatag tctactaatg ttttattttg ttttttataa 3480

aatcaagcag cctctgctat taatatagaa gcttgtattc catctttatc tctagctgag 3540

tcatcaatta catatccata actttcttca taagcaaaaa caaaatttaa tccgttatct 3600

tcttctttag caatttctct acccattcat ttaaatccag ttaaagtttt tacaatatta 3660

actccatatt tttcatgagc gattctatca cccaaatcac ttgttacaaa acttgaatat 3720

agagccggat tttttggaat gctatttaag cgttttagat ttgataattt tcaatcaatt 3780

aaaattggtc ctgtttgatt tccatctaat cttacaaaat gaccatcatg ttttattgcc 3840

attccaaatc tgtcagcatc tgggtcattc ataataataa tatctgcatc atgtttaata 3900

ccatattcaa gcggtatttt tcatgcagga tcaaattctg gatttggatt tacaacattt 3960

ttaaatgttt catcttcaaa tgcatgctct tcaacctcaa taacgttata tcctgattca 4020

cgtaatattt ttggggtaaa tttagttcct gttccattaa ctgcgctaaa aataattttt 4080

aaatcttttt tagcttcttg ctcttttttg tacgtctctg ttttagagct agaaatagca 4140

agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt 4200

tgaattcgct agctaggtct tgaaaggagt gggaattggc tccggtgccc gtcagtgggc 4260

agagcgcaca tcgcccacag tccccgagaa gttgggggga ggggtcggca attgatccgg 4320

tgcctagaga aggtggcgcg gggtaaactg ggaaagtgat gtcgtgtact ggctccgcct 4380

ttttcccgag ggtgggggag aaccgtatat aagtgcagta gtcgccgtga acgttctttt 4440

tcgcaacggg tttgccgcca gaacacagga ccggttctag agcgctgcca ccatggacaa 4500

gaagtacagc atcggcctgg acatcggcac caactctgtg ggctgggccg tgatcaccga 4560

cgagtacaag gtgcccagca agaaattcaa ggtgctgggc aacaccgacc ggcacagcat 4620

caagaagaac ctgatcggag ccctgctgtt cgacagcggc gaaacagccg aggccacccg 4680

gctgaagaga accgccagaa gaagatacac cagacggaag aaccggatct gctatctgca 4740

agagatcttc agcaacgaga tggccaaggt ggacgacagc ttcttccaca gactggaaga 4800

gtccttcctg gtggaagagg ataagaagca cgagcggcac cccatcttcg gcaacatcgt 4860

ggacgaggtg gcctaccacg agaagtaccc caccatctac cacctgagaa agaaactggt 4920

ggacagcacc gacaaggccg acctgcggct gatctatctg gccctggccc acatgatcaa 4980

gttccggggc cacttcctga tcgagggcga cctgaacccc gacaacagcg acgtggacaa 5040

gctgttcatc cagctggtgc agacctacaa ccagctgttc gaggaaaacc ccatcaacgc 5100

cagcggcgtg gacgccaagg ccatcctgtc tgccagactg agcaagagca gacggctgga 5160

aaatctgatc gcccagctgc ccggcgagaa gaagaatggc ctgttcggaa acctgattgc 5220

cctgagcctg ggcctgaccc ccaacttcaa gagcaacttc gacctggccg aggatgccaa 5280

actgcagctg agcaaggaca cctacgacga cgacctggac aacctgctgg cccagatcgg 5340

cgaccagtac gccgacctgt ttctggccgc caagaacctg tccgacgcca tcctgctgag 5400

cgacatcctg agagtgaaca ccgagatcac caaggccccc ctgagcgcct ctatgatcaa 5460

gagatacgac gagcaccacc aggacctgac cctgctgaaa gctctcgtgc ggcagcagct 5520

gcctgagaag tacaaagaga ttttcttcga ccagagcaag aacggctacg ccggctacat 5580

tgacggcgga gccagccagg aagagttcta caagttcatc aagcccatcc tggaaaagat 5640

ggacggcacc gaggaactgc tcgtgaagct gaacagagag gacctgctgc ggaagcagcg 5700

gaccttcgac aacggcagca tcccccacca gatccacctg ggagagctgc acgccattct 5760

gcggcggcag gaagattttt acccattcct gaaggacaac cgggaaaaga tcgagaagat 5820

cctgaccttc cgcatcccct actacgtggg ccctctggcc aggggaaaca gcagattcgc 5880

ctggatgacc agaaagagcg aggaaaccat caccccctgg aacttcgagg aagtggtgga 5940

caagggcgct tccgcccaga gcttcatcga gcggatgacc aacttcgata agaacctgcc 6000

caacgagaag gtgctgccca agcacagcct gctgtacgag tacttcaccg tgtataacga 6060

gctgaccaaa gtgaaatacg tgaccgaggg aatgagaaag cccgccttcc tgagcggcga 6120

gcagaaaaag gccatcgtgg acctgctgtt caagaccaac cggaaagtga ccgtgaagca 6180

gctgaaagag gactacttca agaaaatcga gtgcttcgac tccgtggaaa tctccggcgt 6240

ggaagatcgg ttcaacgcct ccctgggcac ataccacgat ctgctgaaaa ttatcaagga 6300

caaggacttc ctggacaatg aggaaaacga ggacattctg gaagatatcg tgctgaccct 6360

gacactgttt gaggacagag agatgatcga ggaacggctg aaaacctatg cccacctgtt 6420

cgacgacaaa gtgatgaagc agctgaagcg gcggagatac accggctggg gcaggctgag 6480

ccggaagctg atcaacggca tccgggacaa gcagtccggc aagacaatcc tggatttcct 6540

gaagtccgac ggcttcgcca acagaaactt catgcagctg atccacgacg acagcctgac 6600

ctttaaagag gacatccaga aagcccaggt gtccggccag ggcgatagcc tgcacgagca 6660

cattgccaat ctggccggca gccccgccat taagaagggc atcctgcaga cagtgaaggt 6720

ggtggacgag ctcgtgaaag tgatgggccg gcacaagccc gagaacatcg tgatcgaaat 6780

ggccagagag aaccagacca cccagaaggg acagaagaac agccgcgaga gaatgaagcg 6840

gatcgaagag ggcatcaaag agctgggcag ccagatcctg aaagaacacc ccgtggaaaa 6900

cacccagctg cagaacgaga agctgtacct gtactacctg cagaatgggc gggatatgta 6960

cgtggaccag gaactggaca tcaaccggct gtccgactac gatgtggacc atatcgtgcc 7020

tcagagcttt ctgaaggacg actccatcga caacaaggtg ctgaccagaa gcgacaagaa 7080

ccggggcaag agcgacaacg tgccctccga agaggtcgtg aagaagatga agaactactg 7140

gcggcagctg ctgaacgcca agctgattac ccagagaaag ttcgacaatc tgaccaaggc 7200

cgagagaggc ggcctgagcg aactggataa ggccggcttc atcaagagac agctggtgga 7260

aacccggcag atcacaaagc acgtggcaca gatcctggac tcccggatga acactaagta 7320

cgacgagaat gacaagctga tccgggaagt gaaagtgatc accctgaagt ccaagctggt 7380

gtccgatttc cggaaggatt tccagtttta caaagtgcgc gagatcaaca actaccacca 7440

cgcccacgac gcctacctga acgccgtcgt gggaaccgcc ctgatcaaaa agtaccctaa 7500

gctggaaagc gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc 7560

caagagcgag caggaaatcg gcaaggctac cgccaagtac ttcttctaca gcaacatcat 7620

gaactttttc aagaccgaga ttaccctggc caacggcgag atccggaagc ggcctctgat 7680

cgagacaaac ggcgaaaccg gggagatcgt gtgggataag ggccgggatt ttgccaccgt 7740

gcggaaagtg ctgagcatgc cccaagtgaa tatcgtgaaa aagaccgagg tgcagacagg 7800

cggcttcagc aaagagtcta tcctgcccaa gaggaacagc gataagctga tcgccagaaa 7860

gaaggactgg gaccctaaga agtacggcgg cttcgacagc cccaccgtgg cctattctgt 7920

gctggtggtg gccaaagtgg aaaagggcaa gtccaagaaa ctgaagagtg tgaaagagct 7980

gctggggatc accatcatgg aaagaagcag cttcgagaag aatcccatcg actttctgga 8040

agccaagggc tacaaagaag tgaaaaagga cctgatcatc aagctgccta agtactccct 8100

gttcgagctg gaaaacggcc ggaagagaat gctggcctct gccggcgaac tgcagaaggg 8160

aaacgaactg gccctgccct ccaaatatgt gaacttcctg tacctggcca gccactatga 8220

gaagctgaag ggctcccccg aggataatga gcagaaacag ctgtttgtgg aacagcacaa 8280

gcactacctg gacgagatca tcgagcagat cagcgagttc tccaagagag tgatcctggc 8340

cgacgctaat ctggacaaag tgctgtccgc ctacaacaag caccgggata agcccatcag 8400

agagcaggcc gagaatatca tccacctgtt taccctgacc aatctgggag cccctgccgc 8460

cttcaagtac tttgacacca ccatcgaccg gaagaggtac accagcacca aagaggtgct 8520

ggacgccacc ctgatccacc agagcatcac cggcctgtac gagacacgga tcgacctgtc 8580

tcagctggga ggcgacaagc gacctgccgc cacaaagaag gctggacagg ctaagaagaa 8640

gaaagattac aaagacgatg acgataaggg atccggcgca acaaacttct ctctgctgaa 8700

acaagccgga gatgtcgaag agaatcctgg accgaccgag tacaagccca cggtgcgcct 8760

cgccacccgc gacgacgtcc ccagggccgt acgcaccctc gccgccgcgt tcgccgacta 8820

ccccgccacg cgccacaccg tcgatccgga ccgccacatc gagcgggtca ccgagctgca 8880

agaactcttc ctcacgcgcg tcgggctcga catcggcaag gtgtgggtcg cggacgacgg 8940

cgccgcggtg gcggtctgga ccacgccgga gagcgtcgaa gcgggggcgg tgttcgccga 9000

gatcggcccg cgcatggccg agttgagcgg ttcccggctg gccgcgcagc aacagatgga 9060

aggcctcctg gcgccgcacc ggcccaagga gcccgcgtgg ttcctggcca ccgtcggagt 9120

ctcgcccgac caccagggca agggtctggg cagcgccgtc gtgctccccg gagtggaggc 9180

ggccgagcgc gccggggtgc ccgccttcct ggagacctcc gcgccccgca acctcccctt 9240

ctacgagcgg ctcggcttca ccgtcaccgc cgacgtcgag gtgcccgaag gaccgcgcac 9300

ctggtgcatg acccgcaagc ccggtgcctg aacgcgttaa gtcgacaatc aacctctgga 9360

ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 9420

tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 9480

ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 9540

gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 9600

caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 9660

actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 9720

ttccgtggtg ttgtcgggga aatcatcgtc ctttccttgg ctgctcgcct gtgttgccac 9780

ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 9840

tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 9900

gacgagtcgg atctcccttt gggccgcctc cccgcgtcga ctttaagacc aatgacttac 9960

aaggcagctg tagatcttag ccacttttta aaagaaaagg ggggactgga agggctaatt 10020

cactcccaac gaagacaaga tctgcttttt gcttgtactg ggtctctctg gttagaccag 10080

atctgagcct gggagctctc tggctaacta gggaacccac tgcttaagcc tcaataaagc 10140

ttgccttgag tgcttcaagt agtgtgtgcc cgtctgttgt gtgactctgg taactagaga 10200

tccctcagac ccttttagtc agtgtggaaa atctctagca gggcccgttt aaacccgctg 10260

atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 10320

ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 10380

atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa 10440

gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc 10500

tgaggcggaa agaaccagct ggggctctag ggggtatccc cacgcgccct gtagcggcgc 10560

attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct 10620

agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg 10680

tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga 10740

ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt 10800

ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg 10860

aacaacactc aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc 10920

ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt aattctgtgg 10980

aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa 11040

agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc cccagcaggc 11100

agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc cctaactccg 11160

cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg ctgactaatt 11220

ttttttattt atgcagaggc cgaggccgcc tctgcctctg agctattcca gaagtagtga 11280

ggaggctttt ttggaggcct aggcttttgc aaaaagctcc cgggagcttg tatatccatt 11340

ttcggatctg atcagcacgt gttgacaatt aatcatcggc atagtatatc ggcatagtat 11400

aatacgacaa ggtgaggaac taaaccatgg ccaagttgac cagtgccgtt ccggtgctca 11460

ccgcgcgcga cgtcgccgga gcggtcgagt tctggaccga ccggctcggg ttctcccggg 11520

acttcgtgga ggacgacttc gccggtgtgg tccgggacga cgtgaccctg ttcatcagcg 11580

cggtccagga ccaggtggtg ccggacaaca ccctggcctg ggtgtgggtg cgcggcctgg 11640

acgagctgta cgccgagtgg tcggaggtcg tgtccacgaa cttccgggac gcctccgggc 11700

cggccatgac cgagatcggc gagcagccgt gggggcggga gttcgccctg cgcgacccgg 11760

ccggcaactg cgtgcacttc gtggccgagg agcaggactg acacgtgcta cgagatttcg 11820

attccaccgc cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct 11880

ggatgatcct ccagcgcggg gatctcatgc tggagttctt cgcccacccc aacttgttta 11940

ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 12000

ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 12060

gtataccgtc gacctctagc tagagcttgg cgtaatcatg gtcatagctg tttcctgtgt 12120

gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag 12180

cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt 12240

tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 12300

gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 12360

ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 12420

caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 12480

aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 12540

atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 12600

cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 12660

ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 12720

gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 12780

accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 12840

cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 12900

cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 12960

gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 13020

aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 13080

aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 13140

actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 13200

taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 13260

gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 13320

tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 13380

ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 13440

accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 13500

agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 13560

acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 13620

tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 13680

cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 13740

tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 13800

ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 13860

gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 13920

tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 13980

ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 14040

gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 14100

cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 14160

gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 14220

ttccgcgcac atttccccga aaagtgccac ctgacgtcga cggatcggga gatctcccga 14280

tcccctatgg tgcactctca gtacaatctg ctctgatgcc gcatagttaa gccagtatct 14340

gctccctgct tgtgtgttgg aggtcgctga gtagtgcgcg agcaaaattt aagctacaac 14400

aaggcaaggc ttgaccgaca attgcatgaa gaatctgctt agggttaggc gttttgcgct 14460

gcttcgcgat gtacgggcca gatatacgcg ttgacattga ttattgacta gttattaata 14520

gtaatcaatt acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact 14580

tacggtaaat ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat 14640

gacgtatgtt cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta 14700

tttacggtaa actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc 14760

tattgacgtc aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg 14820

ggactttcct acttggcagt acatctacgt attagtcatc gctattacca tgg 14873

<210> 86

<211> 4104

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 86

atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60

atcaccgacg agtacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120

cacagcatca agaagaacct gatcggagcc ctgctgttcg acagcggcga aacagccgag 180

gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240

tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300

ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360

aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420

aaactggtgg acagcaccga caaggccgac ctgcggctga tctatctggc cctggcccac 480

atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540

gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggaaaacccc 600

atcaacgcca gcggcgtgga cgccaaggcc atcctgtctg ccagactgag caagagcaga 660

cggctggaaa atctgatcgc ccagctgccc ggcgagaaga agaatggcct gttcggaaac 720

ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780

gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840

cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900

ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgcctct 960

atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020

cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080

ggctacattg acggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140

gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200

aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260

gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320

gagaagatcc tgaccttccg catcccctac tacgtgggcc ctctggccag gggaaacagc 1380

agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440

gtggtggaca agggcgcttc cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500

aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560

tataacgagc tgaccaaagt gaaatacgtg accgagggaa tgagaaagcc cgccttcctg 1620

agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680

gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgactc cgtggaaatc 1740

tccggcgtgg aagatcggtt caacgcctcc ctgggcacat accacgatct gctgaaaatt 1800

atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860

ctgaccctga cactgtttga ggacagagag atgatcgagg aacggctgaa aacctatgcc 1920

cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980

aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040

gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100

agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg cgatagcctg 2160

cacgagcaca ttgccaatct ggccggcagc cccgccatta agaagggcat cctgcagaca 2220

gtgaaggtgg tggacgagct cgtgaaagtg atgggccggc acaagcccga gaacatcgtg 2280

atcgaaatgg ccagagagaa ccagaccacc cagaagggac agaagaacag ccgcgagaga 2340

atgaagcgga tcgaagaggg catcaaagag ctgggcagcc agatcctgaa agaacacccc 2400

gtggaaaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaatgggcgg 2460

gatatgtacg tggaccagga actggacatc aaccggctgt ccgactacga tgtggaccat 2520

atcgtgcctc agagctttct gaaggacgac tccatcgaca acaaggtgct gaccagaagc 2580

gacaagaacc ggggcaagag cgacaacgtg ccctccgaag aggtcgtgaa gaagatgaag 2640

aactactggc ggcagctgct gaacgccaag ctgattaccc agagaaagtt cgacaatctg 2700

accaaggccg agagaggcgg cctgagcgaa ctggataagg ccggcttcat caagagacag 2760

ctggtggaaa cccggcagat cacaaagcac gtggcacaga tcctggactc ccggatgaac 2820

actaagtacg acgagaatga caagctgatc cgggaagtga aagtgatcac cctgaagtcc 2880

aagctggtgt ccgatttccg gaaggatttc cagttttaca aagtgcgcga gatcaacaac 2940

taccaccacg cccacgacgc ctacctgaac gccgtcgtgg gaaccgccct gatcaaaaag 3000

taccctaagc tggaaagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcggaag 3060

atgatcgcca agagcgagca ggaaatcggc aaggctaccg ccaagtactt cttctacagc 3120

aacatcatga actttttcaa gaccgagatt accctggcca acggcgagat ccggaagcgg 3180

cctctgatcg agacaaacgg cgaaaccggg gagatcgtgt gggataaggg ccgggatttt 3240

gccaccgtgc ggaaagtgct gagcatgccc caagtgaata tcgtgaaaaa gaccgaggtg 3300

cagacaggcg gcttcagcaa agagtctatc ctgcccaaga ggaacagcga taagctgatc 3360

gccagaaaga aggactggga ccctaagaag tacggcggct tcgacagccc caccgtggcc 3420

tattctgtgc tggtggtggc caaagtggaa aagggcaagt ccaagaaact gaagagtgtg 3480

aaagagctgc tggggatcac catcatggaa agaagcagct tcgagaagaa tcccatcgac 3540

tttctggaag ccaagggcta caaagaagtg aaaaaggacc tgatcatcaa gctgcctaag 3600

tactccctgt tcgagctgga aaacggccgg aagagaatgc tggcctctgc cggcgaactg 3660

cagaagggaa acgaactggc cctgccctcc aaatatgtga acttcctgta cctggccagc 3720

cactatgaga agctgaaggg ctcccccgag gataatgagc agaaacagct gtttgtggaa 3780

cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttctc caagagagtg 3840

atcctggccg acgctaatct ggacaaagtg ctgtccgcct acaacaagca ccgggataag 3900

cccatcagag agcaggccga gaatatcatc cacctgttta ccctgaccaa tctgggagcc 3960

cctgccgcct tcaagtactt tgacaccacc atcgaccgga agaggtacac cagcaccaaa 4020

gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gacacggatc 4080

gacctgtctc agctgggagg cgac 4104

<210> 87

<211> 1368

<212> PRT

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 87

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 88

<211> 31

<212> PRT

<213> 智人（Homo sapiens）

<400> 88

Gln Thr Ala Pro Val Pro Met Pro Asp Leu Lys Asn Val Lys Ser Lys

1 5 10 15

Ile Gly Ser Thr Glu Asn Leu Lys His Gln Pro Gly Gly Gly Lys

20 25 30

<210> 89

<211> 31

<212> PRT

<213> 智人（Homo sapiens）

<400> 89

Val Gln Ile Ile Asn Lys Lys Leu Asp Leu Ser Asn Val Gln Ser Lys

1 5 10 15

Cys Gly Ser Lys Asp Asn Ile Lys His Val Pro Gly Gly Gly Ser

20 25 30

<210> 90

<211> 31

<212> PRT

<213> 智人（Homo sapiens）

<400> 90

Val Gln Ile Val Tyr Lys Pro Val Asp Leu Ser Lys Val Thr Ser Lys

1 5 10 15

Cys Gly Ser Leu Gly Asn Ile His His Lys Pro Gly Gly Gly Gln

20 25 30

<210> 91

<211> 32

<212> PRT

<213> 智人（Homo sapiens）

<400> 91

Val Glu Val Lys Ser Glu Lys Leu Asp Phe Lys Asp Arg Val Gln Ser

1 5 10 15

Lys Ile Gly Ser Leu Asp Asn Ile Thr His Val Pro Gly Gly Gly Asn

20 25 30

<210> 92

<211> 93

<212> DNA

<213> 智人（Homo sapiens）

<400> 92

cagacagccc ccgtgcccat gccagacctg aagaatgtca agtccaagat cggctccact 60

gagaacctga agcaccagcc gggaggcggg aag 93

<210> 93

<211> 93

<212> DNA

<213> 智人（Homo sapiens）

<400> 93

gtgcagataa ttaataagaa gctggatctt agcaacgtcc agtccaagtg tggctcaaag 60

gataatatca aacacgtccc gggaggcggc agt 93

<210> 94

<211> 93

<212> DNA

<213> 智人（Homo sapiens）

<400> 94

gtgcaaatag tctacaaacc agttgacctg agcaaggtga cctccaagtg tggctcatta 60

ggcaacatcc atcataaacc aggaggtggc cag 93

<210> 95

<211> 96

<212> DNA

<213> 智人（Homo sapiens）

<400> 95

gtggaagtaa aatctgagaa gcttgacttc aaggacagag tccagtcgaa gattgggtcc 60

ctggacaata tcacccacgt ccctggcgga ggaaat 96

<210> 96

<211> 133

<212> PRT

<213> 智人（Homo sapiens）

<400> 96

Leu Gln Thr Ala Pro Val Pro Met Pro Asp Leu Lys Asn Val Lys Ser

1 5 10 15

Lys Ile Gly Ser Thr Glu Asn Leu Lys His Gln Pro Gly Gly Gly Lys

20 25 30

Val Gln Ile Ile Asn Lys Lys Leu Asp Leu Ser Asn Val Gln Ser Lys

35 40 45

Cys Gly Ser Lys Asp Asn Ile Lys His Val Pro Gly Gly Gly Ser Val

50 55 60

Gln Ile Val Tyr Lys Pro Val Asp Leu Ser Lys Val Thr Ser Lys Cys

65 70 75 80

Gly Ser Leu Gly Asn Ile His His Lys Pro Gly Gly Gly Gln Val Glu

85 90 95

Val Lys Ser Glu Lys Leu Asp Phe Lys Asp Arg Val Gln Ser Lys Ile

100 105 110

Gly Ser Leu Asp Asn Ile Thr His Val Pro Gly Gly Gly Asn Lys Lys

115 120 125

Ile Glu Thr His Lys

130

<210> 97

<211> 399

<212> DNA

<213> 智人（Homo sapiens）

<400> 97

ctgcagacag cccccgtgcc catgccagac ctgaagaatg tcaagtccaa gatcggctcc 60

actgagaacc tgaagcacca gccgggaggc gggaaggtgc agataattaa taagaagctg 120

gatcttagca acgtccagtc caagtgtggc tcaaaggata atatcaaaca cgtcccggga 180

ggcggcagtg tgcaaatagt ctacaaacca gttgacctga gcaaggtgac ctccaagtgt 240

ggctcattag gcaacatcca tcataaacca ggaggtggcc aggtggaagt aaaatctgag 300

aagcttgact tcaaggacag agtccagtcg aagattgggt ccctggacaa tatcacccac 360

gtccctggcg gaggaaataa aaagattgaa acccacaag 399

<210> 98

<211> 133

<212> PRT

<213> 智人（Homo sapiens）

<400> 98

Leu Gln Thr Ala Pro Val Pro Met Pro Asp Leu Lys Asn Val Lys Ser

1 5 10 15

Lys Ile Gly Ser Thr Glu Asn Leu Lys His Gln Pro Gly Gly Gly Lys

20 25 30

Val Gln Ile Ile Asn Lys Lys Leu Asp Leu Ser Asn Val Gln Ser Lys

35 40 45

Cys Gly Ser Lys Asp Asn Ile Lys His Val Ser Gly Gly Gly Ser Val

50 55 60

Gln Ile Val Tyr Lys Pro Val Asp Leu Ser Lys Val Thr Ser Lys Cys

65 70 75 80

Gly Ser Leu Gly Asn Ile His His Lys Pro Gly Gly Gly Gln Val Glu

85 90 95

Val Lys Ser Glu Lys Leu Asp Phe Lys Asp Arg Val Gln Ser Lys Ile

100 105 110

Gly Ser Leu Asp Asn Ile Thr His Val Pro Gly Gly Gly Asn Lys Lys

115 120 125

Ile Glu Thr His Lys

130

<210> 99

<211> 399

<212> DNA

<213> 智人（Homo sapiens）

<400> 99

ctgcagacag cccccgtgcc catgccagac ctgaagaatg tcaagtccaa gatcggctcc 60

actgagaacc tgaagcacca gccgggaggc gggaaggtgc agataattaa taagaagctg 120

gatcttagca acgtccagtc caagtgtggc tcaaaggata atatcaaaca cgtctcggga 180

ggcggcagtg tgcaaatagt ctacaaacca gttgacctga gcaaggtgac ctccaagtgt 240

ggctcattag gcaacatcca tcataaacca ggaggtggcc aggtggaagt aaaatctgag 300

aagcttgact tcaaggacag agtccagtcg aagattgggt ccctggacaa tatcacccac 360

gtccctggcg gaggaaataa aaagattgaa acccacaag 399

<210> 100

<211> 72

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 100

aaacagcaua gcaaguuaaa auaaggcuag uccguuauca acuugaaaaa guggcaccga 60

gucggugcuu uu 72

<210> 101

<211> 82

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 101

guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60

aaaaguggca ccgagucggu gc 82

<210> 102

<211> 83

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 102

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugcuuuu uuu 83

<210> 103

<211> 80

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 103

guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60

ggcaccgagu cggugcuuuu 80

<210> 104

<211> 92

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 104

guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60

uugaaaaagu ggcaccgagu cggugcuuuu uu 92

<210> 105

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 105

tgggaggttg tcatcgtgat 20

<210> 106

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 106

cagcctcttg ctcaggacgt 20

<210> 107

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 107

cataagcctt gtcaaagccc 20

<210> 108

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 108

ggaccacata agccttgtca 20

<210> 109

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 109

catctttctt tagcaccaga 20

<210> 110

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 110

ggtcttcatc tttctttagc 20

<210> 111

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 111

ccattctcgg aagaggtctt 20

<210> 112

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 112

tcagccattc tcggaagagg 20

<210> 113

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 113

catgtatcct tcagccattc 20

<210> 114

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 114

tgcttggcat tggcaccaca 20

<210> 115

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 115

ggactgcttg gcattggcac 20

<210> 116

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 116

gaaggcaccc aaagcagtcc 20

<210> 117

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 117

tcgaaggcac ccaaagcagt 20

<210> 118

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 118

tctcgaaggc acccaaagca 20

<210> 119

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 119

attctcgaag gcacccaaag 20

<210> 120

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 120

caccattctc gaaggcaccc 20

<210> 121

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 121

cacaccattc tcgaaggcac 20

<210> 122

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 122

atcacaccat tctcgaaggc 20

<210> 123

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 123

agagaacact acaagaaggc 20

<210> 124

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 124

tgcagactct ggaaactgtg 20

<210> 125

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 125

ccatagaccc tggagtacat 20

<210> 126

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 126

gaaacgatcc cagaaagatt 20

<210> 127

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 127

gggactcggc tttctgtaat 20

<210> 128

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 128

caacttctcg tccatgatgc 20

<210> 129

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 129

tgctcgatcc actggtccag 20

<210> 130

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 130

ctcggagagc tgcttgcact 20

<210> 131

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 131

cttgacctgg gactcggaga 20

<210> 132

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 132

ccttctcgca gaggctcttg 20

<210> 133

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 133

gtcaggattt ctttagcctt 20

<210> 134

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 134

gacatcgaac ctcttgaacg 20

<210> 135

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 135

agtgactgga catcgaacct 20

<210> 136

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 136

gtacatctcc acacacagtg 20

<210> 137

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 137

caggtaattt gtatctggtg 20

<210> 138

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 138

gtctcccata aacaggtaat 20

<210> 139

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 139

ctctcggtaa cgaaccttaa 20

<210> 140

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 140

gtgatgcgct ctcggtaacg 20

<210> 141

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 141

attccctcgg agtatggtga 20

<210> 142

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 142

ctctcgtgat tccctcggag 20

<210> 143

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 143

gaacccataa acctgtgtga 20

<210> 144

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 144

tcgtcgtaga acccataaac 20

<210> 145

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 145

aaggtctgtg aagtatttcc 20

<210> 146

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 146

gtgagaggaa gatagtcaaa 20

<210> 147

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 147

ccaaggcagt gagaggaaga 20

<210> 148

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 148

accaccgtgt agacagaaga 20

<210> 149

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 149

cagtgtgtct atggatggtg 20

<210> 150

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 150

tcgagtgctc ggatgtgatc 20

<210> 151

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 151

gtcacacatt ggaccctcat 20

<210> 152

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 152

ccaccacggt catctggatc 20

<210> 153

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 153

gccaaaggta taaccagctc 20

<210> 154

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 154

tgaggccatt ggcatgatta 20

<210> 155

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 155

tggacaccaa cgtgaggcca 20

<210> 156

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 156

gttatatccc tccatcacca 20

<210> 157

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 157

tggcaccagt tatatccctc 20

<210> 158

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 158

acgttccggt catggcacca 20

<210> 159

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 159

ttgttactac gttccggtca 20

<210> 160

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 160

agcaatagtt tggagcactg 20

<210> 161

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 161

taccacaacg atagcaatag 20

<210> 162

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 162

agcttggtta ccacaacgat 20

<210> 163

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 163

agtgtcgtca agttccatga 20

<210> 164

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 164

gctgggtcaa actgcaagaa 20

<210> 165

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 165

acggttcatg gcaatactgt 20

<210> 166

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 166

gtcaatatac ggttcatggc 20

<210> 167

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 167

tgttgctctt cccatttcca 20

<210> 168

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 168

tttggtccgt gtgaaaacaa 20

<210> 169

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 169

caagagtttc agtcgagcca 20

<210> 170

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 170

gtcatctgga ttcaagagtt 20

<210> 171

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 171

agtccttgag gtgccctgga 20

<210> 172

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 172

ggcctgctga gtttgtttcc 20

<210> 173

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 173

agggttcaag cccacactgt 20

<210> 174

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 174

tgggtggaca ctggatgcta 20

<210> 175

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 175

gtggttgtca ttcctggtag 20

<210> 176

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 176

agggccatcc tcatatactg 20

<210> 177

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 177

ctcatgtctc acagggccat 20

<210> 178

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 178

taagggcgta gttttgttgg 20

<210> 179

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 179

ttcagccagg cacaagccat 20

<210> 180

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 180

gtaactgttt gctcgttctt 20

<210> 181

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 181

ggaagcctgg ttctctttgg 20

<210> 182

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 182

acgcataaac tcagggttct 20

<210> 183

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 183

catgttgtca tctgggtaca 20

<210> 184

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 184

gtcaacaacg tagaggatgc 20

<210> 185

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 185

caggagtggc acatagtagt 20

<210> 186

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 186

agtatttgag gcttcagctt 20

<210> 187

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 187

aggtcccacg aaagctctca 20

<210> 188

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 188

atcttctgct ttggatggac 20

<210> 189

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 189

tttctttcga ggtggagttt 20

<210> 190

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 190

aatgcctcgt tctgggtcag 20

<210> 191

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 191

tccaactctc tcaatgcctc 20

<210> 192

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 192

ttcccagtat tcaacccagg 20

<210> 193

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 193

acatcccaga aattcccagt 20

<210> 194

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 194

gcagccttca ttttctcgta 20

<210> 195

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 195

ctttccactg ccaaaatctg 20

<210> 196

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 196

cacggagatg gagttgctgt 20

<210> 197

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 197

gggctgactc tgacttggaa 20

<210> 198

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 198

agaggtttgg aacttatcag 20

<210> 199

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 199

agttccaact gaggtttctc 20

<210> 200

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 200

gtcactgtct gctgcaccct 20

<210> 201

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 201

agatgccagc aagtcactgt 20

<210> 202

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 202

agtgttggtc ctgacttgct 20

<210> 203

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 203

gagtataggt tccagaccag 20

<210> 204

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 204

ggtggaatct accgtggcag 20

<210> 205

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 205

ttttgatggt tcctctccag 20

<210> 206

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 206

cgcacactca agagctgcta 20

<210> 207

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 207

tgggtacaga ccagggtcaa 20

<210> 208

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 208

gtctgagggc gagtagcaca 20

<210> 209

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 209

cttccctttg agtgcaggac 20

<210> 210

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 210

atgagagcaa tcgagatcca 20

<210> 211

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 211

gccagaagag gaggaggtgt 20

<210> 212

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 212

cccatgtgct ggactgtagc 20

<210> 213

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 213

atgaatccca ggagtaagct 20

<210> 214

<211> 20

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 214

ctcacttgtc tatgcctttg 20

<210> 215

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 215

ugggagguug ucaucgugau 20

<210> 216

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 216

cagccucuug cucaggacgu 20

<210> 217

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 217

cauaagccuu gucaaagccc 20

<210> 218

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 218

ggaccacaua agccuuguca 20

<210> 219

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 219

caucuuucuu uagcaccaga 20

<210> 220

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 220

ggucuucauc uuucuuuagc 20

<210> 221

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 221

ccauucucgg aagaggucuu 20

<210> 222

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 222

ucagccauuc ucggaagagg 20

<210> 223

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 223

cauguauccu ucagccauuc 20

<210> 224

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 224

ugcuuggcau uggcaccaca 20

<210> 225

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 225

ggacugcuug gcauuggcac 20

<210> 226

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 226

gaaggcaccc aaagcagucc 20

<210> 227

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 227

ucgaaggcac ccaaagcagu 20

<210> 228

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 228

ucucgaaggc acccaaagca 20

<210> 229

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 229

auucucgaag gcacccaaag 20

<210> 230

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 230

caccauucuc gaaggcaccc 20

<210> 231

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 231

cacaccauuc ucgaaggcac 20

<210> 232

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 232

aucacaccau ucucgaaggc 20

<210> 233

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 233

agagaacacu acaagaaggc 20

<210> 234

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 234

ugcagacucu ggaaacugug 20

<210> 235

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 235

ccauagaccc uggaguacau 20

<210> 236

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 236

gaaacgaucc cagaaagauu 20

<210> 237

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 237

gggacucggc uuucuguaau 20

<210> 238

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 238

caacuucucg uccaugaugc 20

<210> 239

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 239

ugcucgaucc acugguccag 20

<210> 240

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 240

cucggagagc ugcuugcacu 20

<210> 241

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 241

cuugaccugg gacucggaga 20

<210> 242

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 242

ccuucucgca gaggcucuug 20

<210> 243

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 243

gucaggauuu cuuuagccuu 20

<210> 244

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 244

gacaucgaac cucuugaacg 20

<210> 245

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 245

agugacugga caucgaaccu 20

<210> 246

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 246

guacaucucc acacacagug 20

<210> 247

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 247

cagguaauuu guaucuggug 20

<210> 248

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 248

gucucccaua aacagguaau 20

<210> 249

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 249

cucucgguaa cgaaccuuaa 20

<210> 250

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 250

gugaugcgcu cucgguaacg 20

<210> 251

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 251

auucccucgg aguaugguga 20

<210> 252

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 252

cucucgugau ucccucggag 20

<210> 253

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 253

gaacccauaa accuguguga 20

<210> 254

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 254

ucgucguaga acccauaaac 20

<210> 255

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 255

aaggucugug aaguauuucc 20

<210> 256

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 256

gugagaggaa gauagucaaa 20

<210> 257

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 257

ccaaggcagu gagaggaaga 20

<210> 258

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 258

accaccgugu agacagaaga 20

<210> 259

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 259

cagugugucu auggauggug 20

<210> 260

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 260

ucgagugcuc ggaugugauc 20

<210> 261

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 261

gucacacauu ggacccucau 20

<210> 262

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 262

ccaccacggu caucuggauc 20

<210> 263

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 263

gccaaaggua uaaccagcuc 20

<210> 264

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 264

ugaggccauu ggcaugauua 20

<210> 265

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 265

uggacaccaa cgugaggcca 20

<210> 266

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 266

guuauauccc uccaucacca 20

<210> 267

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 267

uggcaccagu uauaucccuc 20

<210> 268

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 268

acguuccggu cauggcacca 20

<210> 269

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 269

uuguuacuac guuccgguca 20

<210> 270

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 270

agcaauaguu uggagcacug 20

<210> 271

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 271

uaccacaacg auagcaauag 20

<210> 272

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 272

agcuugguua ccacaacgau 20

<210> 273

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 273

agugucguca aguuccauga 20

<210> 274

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 274

gcugggucaa acugcaagaa 20

<210> 275

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 275

acgguucaug gcaauacugu 20

<210> 276

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 276

gucaauauac gguucauggc 20

<210> 277

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 277

uguugcucuu cccauuucca 20

<210> 278

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 278

uuugguccgu gugaaaacaa 20

<210> 279

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 279

caagaguuuc agucgagcca 20

<210> 280

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 280

gucaucugga uucaagaguu 20

<210> 281

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 281

aguccuugag gugcccugga 20

<210> 282

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 282

ggccugcuga guuuguuucc 20

<210> 283

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 283

aggguucaag cccacacugu 20

<210> 284

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 284

uggguggaca cuggaugcua 20

<210> 285

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 285

gugguuguca uuccugguag 20

<210> 286

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 286

agggccaucc ucauauacug 20

<210> 287

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 287

cucaugucuc acagggccau 20

<210> 288

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 288

uaagggcgua guuuuguugg 20

<210> 289

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 289

uucagccagg cacaagccau 20

<210> 290

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 290

guaacuguuu gcucguucuu 20

<210> 291

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 291

ggaagccugg uucucuuugg 20

<210> 292

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 292

acgcauaaac ucaggguucu 20

<210> 293

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 293

cauguuguca ucuggguaca 20

<210> 294

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 294

gucaacaacg uagaggaugc 20

<210> 295

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 295

caggaguggc acauaguagu 20

<210> 296

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 296

aguauuugag gcuucagcuu 20

<210> 297

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 297

aggucccacg aaagcucuca 20

<210> 298

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 298

aucuucugcu uuggauggac 20

<210> 299

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 299

uuucuuucga gguggaguuu 20

<210> 300

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 300

aaugccucgu ucugggucag 20

<210> 301

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 301

uccaacucuc ucaaugccuc 20

<210> 302

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 302

uucccaguau ucaacccagg 20

<210> 303

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 303

acaucccaga aauucccagu 20

<210> 304

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 304

gcagccuuca uuuucucgua 20

<210> 305

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 305

cuuuccacug ccaaaaucug 20

<210> 306

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 306

cacggagaug gaguugcugu 20

<210> 307

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 307

gggcugacuc ugacuuggaa 20

<210> 308

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 308

agagguuugg aacuuaucag 20

<210> 309

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 309

aguuccaacu gagguuucuc 20

<210> 310

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 310

gucacugucu gcugcacccu 20

<210> 311

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 311

agaugccagc aagucacugu 20

<210> 312

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 312

aguguugguc cugacuugcu 20

<210> 313

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 313

gaguauaggu uccagaccag 20

<210> 314

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 314

gguggaaucu accguggcag 20

<210> 315

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 315

uuuugauggu uccucuccag 20

<210> 316

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 316

cgcacacuca agagcugcua 20

<210> 317

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 317

uggguacaga ccagggucaa 20

<210> 318

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 318

gucugagggc gaguagcaca 20

<210> 319

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 319

cuucccuuug agugcaggac 20

<210> 320

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 320

augagagcaa ucgagaucca 20

<210> 321

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 321

gccagaagag gaggaggugu 20

<210> 322

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 322

cccaugugcu ggacuguagc 20

<210> 323

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 323

augaauccca ggaguaagcu 20

<210> 324

<211> 20

<212> RNA

<213> 人工序列（Artificial Sequence）

<220>

<223> 合成

<400> 324

cucacuuguc uaugccuuug 20

Claims

1.一种非人动物、动物组织或动物细胞群，其包括：

(a)一个或多个细胞中的微管相关蛋白tau编码序列；以及

(b)(i)BANF1、PPP2CA和ANKLE2中的一种或多种或全部中的分别降低BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部在所述一个或多个细胞中的表达的基因修饰；和/或(ii)降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部在所述一个或多个细胞中的表达的一种或多种药剂。

2.根据权利要求1所述的非人动物、动物组织或动物细胞群，其中所述一个或多个细胞是神经元细胞。

3.根据权利要求1或2所述的非人动物、动物组织或动物细胞群，其中所述微管相关蛋白tau编码序列是外源性人微管相关蛋白tau编码序列。

4.根据权利要求3所述的非人动物、动物组织或动物细胞群，其中所述外源性人微管相关蛋白tau编码序列是经基因组整合的。

5.根据权利要求3或4所述的非人动物、动物组织或动物细胞群，其中所述外源性人微管相关蛋白tau编码序列包括互补DNA(cDNA)序列。

6.根据权利要求3到5中任一项所述的非人动物、动物组织或动物细胞群，其中所述外源性人微管相关蛋白tau编码序列针对在所述非人动物、所述动物组织或所述动物细胞群中的表达进行了密码子优化。

7.根据权利要求3到6中任一项所述的非人动物、动物组织或动物细胞群，其中所述外源性人微管相关蛋白tau编码序列与异源启动子可操作地连接。

8.根据权利要求7所述的非人动物、动物组织或动物细胞群，其中所述异源启动子是小鼠朊病毒蛋白启动子。

9.根据权利要求7所述的非人动物、动物组织或动物细胞群，其中所述异源启动子是神经元特异性启动子。

10.根据权利要求9所述的非人动物、动物组织或动物细胞群，其中所述神经元特异性启动子是突触蛋白-1启动子。

11.根据前述权利要求中任一项所述的非人动物、动物组织或动物细胞群，其中所述微管相关蛋白tau包括tau蛋白病相关突变。

12.根据权利要求11所述的非人动物、动物组织或动物细胞群，其中所述tau蛋白病相关突变包括P301S突变。

13.根据权利要求11所述的非人动物、动物组织或动物细胞群，其中所述微管相关蛋白tau包括SEQ ID NO:98中所示的序列。

14.根据权利要求11所述的非人动物、动物组织或动物细胞群，其中所述tau蛋白病相关突变包括A152T/P301L/S320F三重突变。

15.根据权利要求14所述的非人动物、动物组织或动物细胞群，其中所述微管相关蛋白tau编码序列包括SEQ ID NO:83中所示的序列或所述微管相关蛋白tau包括SEQ ID NO:84中所示的序列。

16.根据前述权利要求中任一项所述的非人动物、动物组织或动物细胞群，其中所述非人动物、所述动物组织或所述动物细胞群包括BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部中的分别降低BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部在所述一个或多个细胞中的表达的所述基因修饰。

17.根据前述权利要求中任一项所述的非人动物、动物组织或动物细胞群，其中所述非人动物、所述动物组织或所述动物细胞群包括降低BANF1、Ppp2ca和ANKLE2中的所述一种或多种或全部在所述一个或多个细胞中的表达的所述一种或多种药剂。

18.根据前述权利要求中任一项所述的非人动物、动物组织或动物细胞群，其中所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的核酸酶药剂或编码所述核酸酶药剂的核酸。

19.根据权利要求18所述的非人动物、动物组织或动物细胞群，其中所述核酸酶药剂是锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)或成簇规律间隔短回文重复序列(CRISPR)相关(Cas)蛋白和向导RNA。

20.根据权利要求19所述的非人动物、动物组织或动物细胞群，其中所述核酸酶药剂是所述Cas蛋白和所述向导RNA。

21.根据权利要求20所述的非人动物、动物组织或动物细胞群，其中所述Cas蛋白是Cas9蛋白。

22.根据权利要求20或21所述的非人动物、动物组织或动物细胞群，其中所述Cas蛋白是有催化活性的Cas蛋白。

23.根据权利要求1到17中任一项所述的非人动物、动物组织或动物细胞群，其中所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的转录阻遏因子或编码所述转录阻遏因子的核酸。

24.根据权利要求23所述的非人动物、动物组织或动物细胞群，其中所述转录阻遏因子包括向导RNA和与转录阻遏因子结构域融合的无催化活性的Cas蛋白，任选地其中所述转录阻遏因子结构域是Krüppel相关盒(KRAB)结构域。

25.根据权利要求20到24中任一项所述的非人动物、动物组织或动物细胞群，其中所述向导RNA靶向小鼠Banf1并且包括SEQ ID NO:44-46中所示的序列中的任何序列或所述向导RNA靶向人BANF1并且包括SEQ ID NO:27-30中所示的序列中的任何序列。

26.根据权利要求20到24中任一项所述的非人动物、动物组织或动物细胞群，其中所述向导RNA靶向小鼠Ppp2ca并且包括SEQ ID NO:47-49中所示的序列中的任何序列或所述向导RNA靶向人PPP2CA并且包括SEQ ID NO:31-32中所示的序列中的任何序列。

27.根据权利要求20到24中任一项所述的非人动物、动物组织或动物细胞群，其中所述向导RNA靶向小鼠Ankle2并且包括SEQ ID NO:50-52中所示的序列中的任何序列或所述向导RNA靶向人ANKLE2并且包括SEQ ID NO:38中所示的序列。

28.根据权利要求1到17中任一项所述的非人动物、动物组织或动物细胞群，其中所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的反义寡核苷酸或RNAi药剂或编码所述反义寡核苷酸或所述RNAi药剂的核酸。

29.根据权利要求28所述的非人动物、动物组织或动物细胞群，其中所述反义寡核苷酸包括SEQ ID NO:105-324中任一个中所示的序列或其修饰形式。

30.根据权利要求29所述的非人动物、动物组织或动物细胞群，其中所述反义寡核苷酸包括以下中任一个中所示的序列或其修饰形式：SEQ ID NO:105、106、110-113、115、120-122、124、125、130、133、136、137、150、152、153、155、158-160、162、165、166、169、171-173、175、177、181-184、187、194、197、211、213、215、216、220-223、225、230-232、234、235、240、243、246、247、260、262、263、265、268-270、272、275、276、279、281-283、285、287、291-294、297、304、307、321和323。

31.根据权利要求29或30所述的非人动物、动物组织或动物细胞群，其中所述反义寡核苷酸包括一个或多个硫代磷酸酯键和/或一个或多个2'-甲氧基乙基修饰的碱基。

32.根据权利要求31所述的非人动物、动物组织或动物细胞群，其中所述反义寡核苷酸是包括以下的5-10-5缺口体：硫代磷酸酯主链、由2'-甲氧基乙基修饰的碱基构成的5'翼、DNA的中央10-核苷酸核心和由2'-甲氧基乙基修饰的碱基构成的3'翼。

33.根据前述权利要求中任一项所述的非人动物、动物组织或动物细胞群，其中相对于不包括BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部中的所述基因修饰或不包括降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂的非人动物、动物组织或动物细胞群，所述非人动物、所述动物组织或所述动物细胞群的tau蛋白病的至少一种体征或症状增加。

34.根据权利要求33所述的非人动物、动物组织或动物细胞群，其中所述至少一种体征或症状包括tau过度磷酸化或tau聚集。

35.根据权利要求33或34所述的非人动物、动物组织或动物细胞群，其中所述至少一种体征或症状包括：细胞分级分离后，不溶性级分中的tau和/或磷酸化tau(phospho-tau)增加；神经元的体树突状区室(somatodendritic compartment)中的磷酸化tau增加；神经元的核周区中的磷酸化tau增加；神经元中的核孔复合物蛋白Nup98-Nup96(Nup98)核质比降低；神经元中的GTP结合核蛋白Ran(Ran)核质比降低；或神经元中的Ran GTP酶活化蛋白1(RanGAP1)核质比降低。

36.根据前述权利要求中任一项所述的动物细胞群，其中所述细胞在体内。

37.根据权利要求1到35中任一项所述的动物细胞群，其中所述细胞在体外。

38.根据前述权利要求中任一项所述的动物细胞群，其中所述细胞是人细胞。

39.根据权利要求1到37中任一项所述的动物细胞群，其中所述细胞是啮齿动物细胞，任选地其中所述啮齿动物细胞是小鼠细胞或大鼠细胞。

40.根据权利要求39所述的动物细胞群，其中所述细胞是小鼠细胞。

41.根据前述权利要求中任一项所述的动物细胞群，其中所述细胞包括神经元细胞。

42.根据权利要求41所述的动物细胞群，其中所述神经元细胞包括源自人诱导性多能干细胞的神经元。

43.根据权利要求41所述的动物细胞群，其中所述神经元细胞包括源自小鼠胚胎干细胞的神经元。

44.根据权利要求41所述的动物细胞群，其中所述神经元细胞包括原代小鼠神经元。

45.根据权利要求1到35中任一项所述的动物组织，其中所述组织在体内。

46.根据权利要求1到35中任一项所述的动物组织，其中所述组织是离体的。

47.根据权利要求1到35和45到46中任一项所述的动物组织，其中所述动物是啮齿动物，任选地其中所述啮齿动物是小鼠或大鼠。

48.根据权利要求47所述的动物组织，其中所述动物是所述小鼠。

49.根据权利要求1到35和45到48中任一项所述的动物组织，其中所述组织是神经系统组织。

50.根据权利要求49所述的动物组织，其中所述组织包括脑片。

51.根据权利要求1到35中任一项所述的非人动物，其中BANF1、PPP2CA和ANKLE2中的一种或多种或全部中的所述基因修饰位于一个或多个神经元细胞中，和/或其中降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂位于一个或多个神经元细胞中，任选地其中所述一个或多个神经元细胞位于海马体中。

52.根据权利要求1到35和51中任一项所述的非人动物，其中所述非人动物是啮齿动物，任选地其中所述啮齿动物是小鼠或大鼠。

53.根据权利要求52所述的非人动物，其中所述非人动物是所述小鼠。

54.根据权利要求53所述的非人动物，其中所述小鼠是PS19转基因小鼠，所述PS19转基因小鼠进一步包括BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部中的分别降低BANF1、PPP2CA和ANKLE2中的所述一种或多种或全部在所述一个或多个细胞中的表达的所述基因修饰；和/或进一步包括降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部在所述一个或多个细胞中的表达的所述一种或多种药剂。

55.一种用于评估用于治疗tau蛋白病的治疗剂候选物的方法，所述方法包括：

(a)向根据权利要求1到35和51到54中任一项所述的非人动物、根据权利要求1到35和45到50中任一项所述的动物组织或根据权利要求1到44中任一项所述的动物细胞群施用候选药剂；

(b)进行一项或多项测定，以确定所述候选药剂是否对与所述tau蛋白病相关的一种或多种体征或症状具有影响；以及

(c)将对与所述tau蛋白病相关的一种或多种体征或症状具有影响的所述候选药剂鉴定为治疗剂候选物。

56.根据权利要求55所述的方法，其中所述一种或多种体征或症状包括tau过度磷酸化或tau聚集。

57.根据权利要求55或56所述的方法，其中所述一种或多种体征或症状包括：细胞分级分离后，不溶性级分中的tau和/或磷酸化tau增加；神经元的体树突状区室中的磷酸化tau增加；神经元的核周区中的磷酸化tau增加；神经元中的核孔复合物蛋白Nup98-Nup96(Nup98)核质比降低；神经元中的GTP结合核蛋白Ran(Ran)核质比降低；或神经元中的RanGTP酶活化蛋白1(RanGAP1)核质比降低。

58.根据权利要求55到57中任一项所述的方法，其中所述候选药剂是向所述非人动物施用的。

59.根据权利要求55到57中任一项所述的方法，其中所述候选药剂是向所述动物组织离体施用的。

60.根据权利要求55到57中任一项所述的方法，其中所述候选药剂是向所述动物细胞群体外施用的。

61.一种制备根据权利要求1到35和51到54中任一项所述的非人动物、根据权利要求1到35和45到50中任一项所述的动物组织或根据权利要求1到44中任一项所述的动物细胞群的方法，所述方法包括：

(a)将降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂引入到包括所述微管相关蛋白tau编码序列的非人动物、动物组织或动物细胞群中；以及

(b)对所述非人动物、所述动物组织或所述动物细胞群进行筛选，以确认所述一种或多种药剂的存在。

62.一种制备根据权利要求1到35和51到54中任一项所述的非人动物、根据权利要求1到35和45到50中任一项所述的动物组织或根据权利要求1到44中任一项所述的动物细胞群的方法，所述方法包括：

(a)将以下引入到非人动物、动物组织或动物细胞群中：

(i)外源性人微管相关蛋白tau编码序列；以及

(ii)降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂；以及

(b)对所述非人动物、所述动物组织或所述动物细胞群进行筛选，以确认所述一种或多种药剂和所述外源性人微管相关蛋白tau编码序列的存在。

63.根据权利要求62所述的方法，其中所述外源性人微管相关蛋白tau编码序列是通过腺相关病毒、慢病毒或脂质纳米颗粒递送的。

64.根据权利要求61到63中任一项所述的方法，其中所述一种或多种药剂是通过腺相关病毒、慢病毒或脂质纳米颗粒递送的。

65.根据权利要求61到64中任一项所述的方法，其中所述方法用于制备所述非人动物，并且所述一种或多种药剂是通过鞘内注射、颅内注射或脑室内注射向所述非人动物施用的，任选地其中所述一种或多种药剂是通过立体定位注射到脑中而向所述非人动物施用的。

66.一种用于加速或加剧tau蛋白病模型非人动物、tau蛋白病模型动物组织或tau蛋白病模型动物细胞群中的tau聚集的方法，所述方法包括将降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的一种或多种药剂引入到所述tau蛋白病模型非人动物、所述tau蛋白病模型动物组织或所述tau蛋白病模型动物细胞群中。

67.根据权利要求66所述的方法，其中所述tau蛋白病模型非人动物、所述tau蛋白病模型动物组织或所述tau蛋白病模型动物细胞群包括外源性人微管相关蛋白tau编码序列。

68.根据权利要求67所述的方法，其中所述外源性人微管相关蛋白tau编码序列是经基因组整合的。

69.根据权利要求67或68所述的方法，其中所述外源性人微管相关蛋白tau编码序列包括互补DNA(cDNA)序列。

70.根据权利要求67到69中任一项所述的方法，其中所述外源性人微管相关蛋白tau编码序列针对在所述非人动物、所述动物组织或所述动物细胞群中的表达进行了密码子优化。

71.根据权利要求67到70中任一项所述的方法，其中所述外源性人微管相关蛋白tau编码序列与异源启动子可操作地连接。

72.根据权利要求71所述的方法，其中所述异源启动子是小鼠朊病毒蛋白启动子。

73.根据权利要求71所述的方法，其中所述异源启动子是神经元特异性启动子。

74.根据权利要求73所述的方法，其中所述神经元特异性启动子是突触蛋白-1启动子。

75.根据权利要求67到74中任一项所述的方法，其中所述外源性人微管相关蛋白tau包括tau蛋白病相关突变。

76.根据权利要求75所述的方法，其中所述tau蛋白病相关突变包括P301S突变。

77.根据权利要求76所述的方法，其中所述外源性人微管相关蛋白tau包括SEQ ID NO:98中所示的序列。

78.根据权利要求75所述的方法，其中所述tau蛋白病相关突变包括A152T/P301L/S320F三重突变。

79.根据权利要求78所述的方法，其中所述外源性人微管相关蛋白tau编码序列包括SEQ ID NO:83中所示的序列或所述外源性人微管相关蛋白tau包括SEQ ID NO:84中所示的序列。

80.根据权利要求66到79中任一项所述的方法，其中所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的核酸酶药剂或编码所述核酸酶药剂的核酸。

81.根据权利要求80所述的方法，其中所述核酸酶药剂是锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN)或成簇规律间隔短回文重复序列(CRISPR)相关(Cas)蛋白和向导RNA。

82.根据权利要求81所述的方法，其中所述核酸酶药剂是所述Cas蛋白和所述向导RNA。

83.根据权利要求82所述的方法，其中所述Cas蛋白是Cas9蛋白。

84.根据权利要求82或83所述的方法，其中所述Cas蛋白是有催化活性的Cas蛋白。

85.根据权利要求66到79中任一项所述的方法，其中所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的转录阻遏因子或编码所述转录阻遏因子的核酸。

86.根据权利要求85所述的方法，其中所述转录阻遏因子包括向导RNA和与转录阻遏因子结构域融合的无催化活性的Cas蛋白，任选地其中所述转录阻遏因子结构域是Krüppel相关盒(KRAB)结构域。

87.根据权利要求82到86中任一项所述的方法，其中所述向导RNA靶向小鼠Banf1并且包括SEQ ID NO:44-46中所示的序列中的任何序列或所述向导RNA靶向人BANF1并且包括SEQ ID NO:27-30中所示的序列中的任何序列。

88.根据权利要求82到86中任一项所述的方法，其中所述向导RNA靶向小鼠Ppp2ca并且包括SEQ ID NO:47-49中所示的序列中的任何序列或所述向导RNA靶向人PPP2CA并且包括SEQ ID NO:31-32中所示的序列中的任何序列。

89.根据权利要求82到86中任一项所述的方法，其中所述向导RNA靶向小鼠Ankle2并且包括SEQ ID NO:50-52中所示的序列中的任何序列或所述向导RNA靶向人ANKLE2并且包括SEQ ID NO:38中所示的序列。

90.根据权利要求66到79中任一项所述的方法，其中所述一种或多种药剂包括靶向BANF1、PPP2CA或ANKLE2的反义寡核苷酸或RNAi药剂或编码所述反义寡核苷酸或所述RNAi药剂的核酸。

91.根据权利要求90所述的方法，其中所述反义寡核苷酸包括SEQ ID NO:105-324中任一个中所示的序列或其修饰形式。

92.根据权利要求91所述的方法，其中所述反义寡核苷酸包括以下中任一个中所示的序列或其修饰形式：SEQ ID NO:105、106、110-113、115、120-122、124、125、130、133、136、137、150、152、153、155、158-160、162、165、166、169、171-173、175、177、181-184、187、194、197、211、213、215、216、220-223、225、230-232、234、235、240、243、246、247、260、262、263、265、268-270、272、275、276、279、281-283、285、287、291-294、297、304、307、321和323。

93.根据权利要求91或92所述的方法，其中所述反义寡核苷酸包括一个或多个硫代磷酸酯键和/或一个或多个2'-甲氧基乙基修饰的碱基。

94.根据权利要求93所述的方法，其中所述反义寡核苷酸是包括以下的5-10-5缺口体：硫代磷酸酯主链、由2'-甲氧基乙基修饰的碱基构成的5'翼、DNA的中央10-核苷酸核心和由2'-甲氧基乙基修饰的碱基构成的3'翼。

95.根据权利要求66到94中任一项所述的方法，其中所述一种或多种药剂是通过腺相关病毒、慢病毒或脂质纳米颗粒递送的。

96.根据权利要求66到95中任一项所述的方法，其中所述一种或多种药剂是通过鞘内注射、颅内注射或脑室内注射向所述非人动物施用的，任选地其中所述一种或多种药剂是通过立体定位注射到脑中而向所述非人动物施用的。

97.根据权利要求66到96中任一项所述的方法，其中相对于不包括降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂的非人动物、动物组织或动物细胞群，所述非人动物、所述动物组织或所述动物细胞群的tau蛋白病的至少一种体征或症状增加。

98.根据权利要求97所述的方法，其中所述至少一种体征或症状包括tau过度磷酸化或tau聚集。

99.根据权利要求97或98所述的方法，其中所述至少一种体征或症状包括：细胞分级分离后，不溶性级分中的tau和/或磷酸化tau增加；神经元的体树突状区室中的磷酸化tau增加；神经元的核周区中的磷酸化tau增加；神经元中的核孔复合物蛋白Nup98-Nup96(Nup98)核质比降低；神经元中的GTP结合核蛋白Ran(Ran)核质比降低；或神经元中的Ran GTP酶活化蛋白1(RanGAP1)核质比降低。

100.根据权利要求66到99中任一项所述的方法，其中所述细胞在体内。

101.根据权利要求66到99中任一项所述的方法，其中所述细胞在体外。

102.根据权利要求66到101中任一项所述的方法，其中所述细胞是人细胞。

103.根据权利要求66到101中任一项所述的方法，其中所述细胞是啮齿动物细胞，任选地其中所述啮齿动物细胞是小鼠细胞或大鼠细胞。

104.根据权利要求103所述的方法，其中所述细胞是小鼠细胞。

105.根据权利要求66到104中任一项所述的方法，其中所述细胞包括神经元细胞。

106.根据权利要求105所述的方法，其中所述神经元细胞包括源自人诱导性多能干细胞的神经元。

107.根据权利要求105所述的方法，其中所述神经元细胞包括源自小鼠胚胎干细胞的神经元。

108.根据权利要求105所述的方法，其中所述神经元细胞包括原代小鼠神经元。

109.根据权利要求66到99中任一项所述的方法，其中所述组织在体内。

110.根据权利要求66到99中任一项所述的方法，其中所述组织是离体的。

111.根据权利要求66到99和109到110中任一项所述的方法，其中所述动物组织是啮齿动物组织，任选地其中所述啮齿动物是小鼠或大鼠。

112.根据权利要求111所述的方法，其中所述动物组织是小鼠组织。

113.根据权利要求66到99和109到112中任一项所述的方法，其中所述组织是神经系统组织。

114.根据权利要求113所述的方法，其中所述组织包括脑片。

115.根据权利要求66到99中任一项所述的方法，其中所述非人动物是啮齿动物，任选地其中所述啮齿动物是小鼠或大鼠。

116.根据权利要求115所述的方法，其中所述非人动物是所述小鼠。

117.根据权利要求116所述的方法，其中所述小鼠是PS19转基因小鼠，所述PS19转基因小鼠进一步包括降低BANF1、PPP2CA和ANKLE2中的一种或多种或全部的表达的所述一种或多种药剂。

118.一种非人动物基因组，其包括外源性人微管相关蛋白tau编码序列和Banf1、Ppp2ca和Ankle2中的一种或多种或全部中的分别降低Banf1、Ppp2ca和Ankle2的一种或多种或全部的表达的基因修饰。

119.一种降低或抑制BANF1、PPP2CA或ANKLE2在细胞中的表达的药剂或编码所述药剂的核酸，任选地其中所述药剂是核酸酶药剂或反义寡核苷酸或靶向BANF1、PPP2CA或ANKLE2的RNAi药剂。

120.根据权利要求119所述的药剂，其中所述反义寡核苷酸包括SEQ ID NO:105-324中任一个中所示的序列或其修饰形式。

121.根据权利要求120所述的药剂，其中所述反义寡核苷酸包括以下中任一个中所示的序列或其修饰形式：SEQ ID NO:105、106、110-113、115、120-122、124、125、130、133、136、137、150、152、153、155、158-160、162、165、166、169、171-173、175、177、181-184、187、194、197、211、213、215、216、220-223、225、230-232、234、235、240、243、246、247、260、262、263、265、268-270、272、275、276、279、281-283、285、287、291-294、297、304、307、321和323。

122.根据权利要求120或121所述的药剂，其中所述反义寡核苷酸包括一个或多个硫代磷酸酯键和/或一个或多个2'-甲氧基乙基修饰的碱基。

123.根据权利要求122所述的药剂，其中所述反义寡核苷酸是包括以下的5-10-5缺口体：硫代磷酸酯主链、由2'-甲氧基乙基修饰的碱基构成的5'翼、DNA的中央10-核苷酸核心和由2'-甲氧基乙基修饰的碱基构成的3'翼。