CN116529381A

CN116529381A - 利用孤儿基序和CpG密度的组合来控制异源转基因的表达

Info

Publication number: CN116529381A
Application number: CN202180080972.4A
Authority: CN
Inventors: D·舒伯勒; R·格兰德; M·勒布克
Original assignee: Friedrich Miescher Institute for Biomedical Research
Current assignee: Friedrich Miescher Institute for Biomedical Research
Priority date: 2020-12-03
Filing date: 2021-12-02
Publication date: 2023-08-01
Also published as: US20240035034A1; WO2022118237A1; EP4256058A1; JP2023552535A

Abstract

本发明提供了分离的核酸，其包含超过220bp，选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列，和在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的N个碱基对(bp)和/或之后的N个bp中的大于0.6的CpG观察值与估计值比率(O/E比率)，其中该CpG O/E比率通过以下确定：对选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的至少一个或多个拷贝的序列周围的N个bp长序列中的CpG二核苷酸的数量进行计数，并通过将CpG二核苷酸的计数数量乘以N并将结果除以该N个bp中存在的C数量和G数量的乘积来计算该O/E比率(N*CpG/(C*G))，其中N在50和1000之间并且是紧接在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前或紧跟其后的序列的长度，以bp计。

Description

利用孤儿基序和CpG密度的组合来控制异源转基因的表达

技术领域

本发明涉及核酸序列，该核酸序列导致与其可操作地连接的异源转基因的受控表达。

背景技术

将遗传物质(例如，异源核酸)递送至靶细胞以增加所希望的基因产物表达的基因疗法方法支持治疗目的。病毒已经进化到能够高效地将核酸递送到特定的细胞类型，同时避免受感染宿主的免疫监视(Robbins等人,(1998)Pharmacol.Ther.[药物学与治疗学],80(1):35-47)。这些特性使病毒作为用于基因疗法的递送媒介物或载体具有吸引力。几种类型的病毒(包括逆转录病毒、腺病毒、腺相关病毒(AAV)和单纯疱疹病毒)已在实验室中进行了修饰以用于基因疗法应用(Lunstrom等人,(2018)Diseases[疾病],6(2):42)。特别地，衍生自腺相关病毒(AAV)的载体可以有效地递送遗传物质，因为(i)它们能够感染(转导)包括肌纤维和神经元在内的多种非分裂和分裂细胞类型；(ii)它们缺乏病毒结构基因，从而消除了天然宿主细胞对病毒感染的应答，例如干扰素介导的应答；(iii)野生型病毒从未与人类的任何病理相关；(iv)与能够整合到宿主细胞基因组中的野生型AAV相比，复制缺陷型AAV载体通常作为附加体持续存在，从而限制了插入诱变或癌基因激活的风险；并且(v)与其他载体系统相比，AAV载体不触发显著的免疫应答，从而允许例如一种或多种治疗性异源核酸的长期表达(Wold等人,(2013)Curr.Gene Ther.[当前基因疗法],13(6):421-33；Lee等人,(2017)Genes Dis.[基因与疾病],4(2):43–63)。

AAV为细小病毒科(parvoviridae)家族的成员。AAV基因组包含线性单链DNA分子，该线性单链DNA分子典型地含有约4.7千碱基(kb)和编码非结构性Rep(复制)及结构性Cap(衣壳)蛋白的两个主要开放阅读框。两个顺式作用反向末端重复(ITR)序列与AAV编码区侧接，这些反向末端重复序列的长度典型地为约145个核苷酸，并具有间杂的回文序列，这些回文序列可折叠成发夹结构，其在DNA复制的起始期间充当引物。除他们在DNA复制中的作用以外，已证实ITR序列有助于病毒整合、自宿主基因组的拯救及病毒核酸衣壳化成为成熟病毒粒子(Muzyczka等人,(1992)Curr.Top.Micro.Immunol.[微生物学和免疫学当前主题],158:97-129)。

虽然AAV因其转导多种细胞类型并将异源核酸递送至多种靶组织类型的能力而令人满意，但是将异源核酸递送至不需要异源核酸表达的组织以及在需要的地方高表达转基因仍然是一个挑战。仔细校准所需组织中的基因表达可以提供治疗益处。含有CAG启动子的AAV载体已用于许多基因疗法的临床试验，例如用于CNS疾病(Hoequemiller等人,(2016)Hum.Gene Ther.[人类基因疗法],27(7):478-96)。

仍然需要开发在特定组织中获得异源核酸高表达的方法。因此，需要改善治疗性蛋白(例如抗体或功能性结合片段、酶等)和核酸(例如用于CRISPR的shRNA、siRNA、gRNA等)的组织特异性表达。

更广泛地使用病毒载体进行基因递送的另一个障碍是载体的包装能力。例如，AAV载体基因组典型地限于单链(ssAAV)的约4.7kb和自互补(scAAV)载体的2.4kb，这限制了可以递送的遗传有效载荷的大小(Wu等人,(2010)Mol.Ther.[分子疗法],18(1):80-86)。由于遗传有效载载包括调节元件(例如启动子、终止信号等)，这进一步限制了可被包装的异源核酸的大小。因此，需要提供长度缩短的调节元件，以允许插入编码更大蛋白质的异源核酸序列，例如，插入用于基因疗法的AAV衍生载体中。

发明内容

本发明人先前已经发现哺乳动物中迄今的孤儿调节基序当被蛋白质BANP结合时充当强转录激活剂，也是CpG岛启动子的激活剂。当超过一个拷贝的基序存在于异源转基因前面时，这种强激活效协同增强。

经过进一步研究，本发明人发现孤儿调节基序附近CpG位点的数量影响该基序的活性。可利用这种效应调节与所述基序可操作地连接的基因的表达。例如，一个表达载体可以包含多于一个异源转基因，每个都受其各自的BANP基序的控制，但这些基序中的每个周围都有不同的CpG密度。这将导致每个转基因的不同的、受控的表达，尽管它们在相同的载体上并且由相同的转录因子结合的相同基序控制。

本发明的另一个优点是，富含CpG的基序通常受细胞高度控制，并且如果构建体意外掺入宿主细胞的基因组，将导致转基因表达的关闭。

因此，本发明提供了分离的核酸分子，其包含超过220bp，选自SEQ ID NO:1、SEQID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列，和在所述选自SEQ ID NO:1、SEQ IDNO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的N个碱基对(bp)和/或之后的N个bp中的大于0.6的CpG观察值与估计值比率(O/E比率)，其中该CpG O/E比率通过以下确定：对选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的至少一个或多个拷贝的序列周围的N个bp长序列中的CpG二核苷酸的数量进行计数，并通过将CpG二核苷酸的计数数量乘以N并将结果除以该N个bp中存在的C数量和G数量的乘积来计算该O/E比率(N*CpG/(C*G))，其中N在50和1000之间并且是紧接在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前或紧跟其后的序列的长度，以bp计。为了清楚起见，声明技术人员熟知C代表胞嘧啶核苷酸，G代表鸟苷核苷酸并且CpG(或CG)代表5'—C—磷酸—G—3'，即胞嘧啶和鸟嘌呤仅被一个磷酸基团隔开(磷酸将DNA中的任意两个核苷连接在一起)。

在一些实施例中，CpG存在于紧接选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的50-1000bp中，并且异源转基因直接或不直接位于所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之后。

在一些实施例中，CpG存在于紧接选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之后的50-1000bp中。

在一些实施例中，CpG存在于紧接选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的50-1000bp中且在该一个或多个拷贝的序列之后的50-1000bp中。

在一些实施例中，N为约50。在一些实施例中，N为约100。在一些实施例中，N为约150。在一些实施例中，N为约200。在一些实施例中，N为约250。在一些实施例中，N为约500。在一些实施例中，N为约800。在一些实施例中，N为约1000。

本发明的序列的核酸序列为：

SEQ ID NO:1BMYCGCGRBV

SEQ ID NO:2YMYCGCGRKV

SEQ ID NO:3TCTCGCGAGA

在一些实施例中，本发明的分离的核酸进一步包含编码蛋白质BANP或其活性片段或变体的另一个序列，该序列可操作地连接至组成型启动子或诱导型启动子。

在一些实施例中，本发明的分离的核酸的异源转基因是嵌合抗原受体。

本发明还提供了载体，该载体包含本发明的分离的核酸。在一些实施例中，该载体是质粒、DNA载体、RNA载体、病毒载体、腺病毒载体、腺相关病毒载体、慢病毒载体、逆转录病毒载体、γ逆转录病毒载体或HSV载体。在一些实施例中，本发明的分离的核酸小于8Kb。在一些实施例中，本发明的分离的核酸小于5Kb。

本发明还提供了试剂盒或组合物，该试剂盒或组合物包含本发明的分离的核酸和第二分离的核酸分子，该第二分离的核酸分子包含编码蛋白质BANP或其活性片段或变体的序列，该序列可操作地连接至组成型启动子或诱导型启动子。在这样的试剂盒中，本发明的分离的核酸可以在同一载体内或在不同载体内。

本发明还提供了本发明的分离的核酸、本发明的载体或本发明的试剂盒或本发明的组合物用于优选在细胞中瞬时体外、离体或体内表达异源转基因的用途。在一些实施例中，与在相同条件下与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的单拷贝可操作地连接时的异源转基因的表达相比，该用途使异源转基因的表达增加大于二的倍数。在一些实施例中，异源转基因的表达通过报道基因活性、报道基因荧光、定量逆转录酶PCR或基因组学方法例如RNA测序来测量。

本发明进一步提供了体外、离体或体内在细胞中产生异源转基因的方法，该方法为将本发明的任何分离的核酸或权利要求书中本发明的载体引入细胞，培养该细胞(或细胞群)，并纯化重组表达的异源转基因。在一些实施例中，细胞是干细胞。

本发明还提供了分离的细胞，其包含本发明的分离的核酸。在该细胞或多个细胞中，包含选自SEQ ID NO:1、SEQ ID NO:2和/或SEQ ID NO:3的组的至少两个拷贝的序列的分离的核酸序列和异源转基因可以稳定地整合到所述细胞的基因组中。

附图说明

图1：可以通过调整人工Banp启动子的CpG密度来调整荧光素酶报道基因的活性

A)克隆在萤火虫荧光素酶报道基因上游的一个或多个Banp基序指示周围人工启动子序列中的CpG二核苷酸及其突变为ApG二核苷酸以降低O/E CpG密度。

B)在瞬时转染到mESC中后，具有降低的O/E CpG密度的人工Banp启动子相对于乱序基序对照对萤火虫荧光素酶活性的倍数诱导。在稳定的基因组整合后，可以将用灰色星号突出显示的启动子的活性与图2中同一启动子的活性进行比较。显示的是至少一个克隆的三个生物学重复的平均值，含标准偏差在内。数字0到100表示突变为ApG的CpG的百分比。

图2：在CpG密度降低50％的人工Banp启动子的稳定基因组整合后，荧光素酶报道基因活性受到抑制

A)具有三个包含不同CpG密度的完整或乱序基序的人工Banp启动子稳定地整合到mESC的β-珠蛋白基因座中。

B)稳定整合的启动子的萤火虫荧光素酶报道基因活性。在瞬时转染后，可以将用灰色星号突出显示的启动子的活性与图1中同一启动子的活性进行比较。数字0到100表示突变为ApG的CpG的百分比。绘制的是四个生物学重复的平均值。误差条表示标准偏差。

具体实施方式

本发明的序列的核酸序列为：

SEQ ID NO:1BMYCGCGRBV

SEQ ID NO:2YMYCGCGRKV

SEQ ID NO:3TCTCGCGAGA

如本文所用，术语“启动子”是指任何顺式调控元件，包括增强子、沉默子、绝缘子和启动子。启动子是DNA的通常位于需要转录的基因上游(朝向5'区域)的区域。启动子容许正确激活或抑制其控制的基因。在本发明的上下文中，启动子导致与它们可操作地连接的基因在表达胶质原纤维酸性蛋白的细胞中的特异性表达。外源基因的“特异性表达”，也称为“仅在某种类型的细胞中表达”意指至少超过75％，优选地超过85％、超过90％或超过95％的表达目的外源基因的细胞具有指定的类型，即在本案中为表达胶质原纤维酸性蛋白的细胞。

典型地将表达盒引入载体中，该载体有助于表达盒进入宿主细胞并在宿主细胞中维持表达盒。此类载体是常用的并且是本领域技术人员熟知的。许多此类载体可例如从英杰公司(Invitrogen)、斯特吉公司(Stratagene)、宝日医公司(Clontech)等商购获得，并且在许多指南中有描述，例如Ausubel、Guthrie、Strathem或Berger，全部同上。此类载体典型地包括启动子、多腺苷酸化信号等，连同多个克隆位点，以及其他元件，例如复制起点、选择性标记基因(例如LEU2、URA3、TRP 1、HIS3、GFP)、着丝粒序列等。为了清楚起见，对于技术人员而言显而易见的是，本发明还包括具有与权利要求中定义的序列互补的序列的分离的核酸。

适于本发明的病毒载体是本领域熟知的。例如，AAV、PRV或慢病毒适于将基因靶向并递送至细胞。

如本文所用，术语“动物”在本文中用于包括所有动物。在本发明的一些实施例中，非人动物为脊椎动物。动物的实例为人、小鼠、大鼠、牛、猪、马、鸡、鸭、鹅、猫、狗等。术语“动物”还包括处于所有发育期(包括胚胎和胎儿期)的个体动物。“经遗传修饰的动物”是含有一种或多种下述细胞的任何动物，这些细胞带有通过在亚细胞水平上的有意遗传操作，例如通过靶向重组、显微注射或重组病毒感染而直接或间接改变或接收的遗传信息。术语“经遗传修饰的动物”无意涵盖经典杂交或体外受精，而是意在涵盖其中一种或多种细胞被重组DNA分子改变或接收该重组DNA分子的动物。该重组DNA分子可以特异性地靶向限定的遗传基因座，可以随机整合到染色体内，或者可以是染色体外复制DNA。术语“种系经遗传修饰的动物”是指其中将遗传改变或遗传信息引入种系细胞中，从而赋予将遗传信息传递给其后代的能力的经遗传修饰的动物。如果这样的后代实际上具有该改变或遗传信息中的一些或全部，则它们也是经遗传修饰的动物。

该改变或遗传信息对于受者所属的动物物种可能是外来的，或者仅对于特定的个体受者是外来的，或者可以是受者已经具有的遗传信息。在最后一种情况下，该改变或引入的基因可以与天然基因不同地表达，或者根本不表达。

用于改变靶基因的基因可以通过多种技术获得，这些技术包括但不限于从基因组来源分离、由分离的mRNA模板制备cDNA、直接合成或其组合。

用于引入转基因的一类靶细胞是ES细胞。ES细胞可以从体外培养的植入前胚胎获得并与胚胎融合(Evans等人(1981),Nature[自然]292:154-156；Bradley等人(1984),Nature[自然]309:255-258；Gossler等人(1986),Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]83:9065-9069；Robertson等人(1986),Nature[自然]322:445-448；Wood等人(1993),Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:4582-4584)。可以通过标准技术例如使用电穿孔进行DNA转染或通过逆转录病毒介导的转导，将转基因有效地引入ES细胞中。之后可以通过聚集将得到的转化ES细胞与桑椹胚组合或注射到来自非人动物的囊胚中。之后所引入的ES细胞定殖于胚胎并产生所得嵌合动物的种系(Jaenisch(1988),Science[科学]240:1468-1474)。基因靶向的ES细胞在产生基因靶向遗传修饰小鼠中的用途在1987年进行了描述(Thomas等人(1987),Cell[细胞]51:503-512)并且在其他地方进行了综述(Frohman等人(1989),Cell[细胞]56:145-147；Capecchi(1989),Trends in Genet.[遗传学趋势]5:70-76；Baribault等人(1989),Mol.Biol.Med.[分子生物学与医学]6:481-492；Wagner(1990),EMBO J.[欧洲分子生物学学会杂志]9:3025-3032；Bradley等人(1992),Bio/Technology[生物技术]10:534-539)。

有技术可用于通过使用靶向同源重组将特定变化插入染色体等位基因中，而使任何遗传区失活或改变成任何所需的突变。

如本文所用，“靶向基因”是通过人为干预(包括但不限于本文所述的方法)引入非人动物种系中的DNA序列。本发明的靶向基因包括被设计成特异性改变同源内源性等位基因的DNA序列。

在本发明中，“分离的”是指从其原始环境(例如，如果它是天然存在的，则为天然环境)中移出的材料，并因此“通过人工”从其天然状态改变。例如，分离的多核苷酸可以是载体或物质组合物的一部分，或者可以包含在细胞内，并且仍然是“分离的”，因为该载体、物质组合物或特定细胞不是多核苷酸的原始环境。术语“分离的”不是指基因组或cDNA文库、全细胞总体或mRNA制剂、基因组DNA制剂(包括通过电泳分离并转移到印迹上的那些)、剪切的全细胞基因组DNA制剂或其中本领域并未显示出本发明的多核苷酸/序列的区别性特征的其他组合物。分离的DNA分子的进一步实例包括保持在异源宿主细胞中的重组DNA分子或溶液中的纯化(部分或基本上)DNA分子。分离的RNA分子包括本发明的DNA分子的体内或体外RNA转录物。然而，出于本发明的目的，作为某文库(例如，基因组或cDNA文库)的成员但尚未与该文库的其他成员分离(例如，呈含有克隆和该文库的其他成员的均一溶液的形式)的克隆中所含的核酸，或从细胞或细胞裂解液中移出的染色体(例如，“染色体分散”，如在核型中)，或随机剪切的基因组DNA的制剂，或经一种或多种限制酶切割的基因组DNA的制剂不是“分离的”。如本文进一步讨论的，根据本发明的分离的核酸分子可以是以天然、重组或合成方式产生的。

“多核苷酸”可以由单链和双链DNA、作为单链和双链区混合物的DNA、单链和双链RNA、以及作为单链和双链区混合物的RNA、包含可为单链或更典型地为双链的或为单链和双链区混合物的DNA和RNA的杂交分子组成。另外，多核苷酸可由包含RNA或DNA或者RNA和DNA两者的三链区组成。多核苷酸还可以含有一个或多个经修饰的碱基或出于稳定性或其他原因而修饰的DNA或RNA主链。“经修饰的”碱基包括例如三苯甲基化碱基和稀有碱基，如肌苷。可以对DNA和RNA进行多种修饰；因此，“多核苷酸”包括以化学、酶促或代谢方式修饰的形式。

表述“编码多肽的多核苷酸”涵盖仅包括该多肽的编码序列的多核苷酸以及包括另外的编码序列和/或非编码序列的多核苷酸。

“严格杂交条件”是指在42℃下在包含50％甲酰胺、5x SSC(750mM NaCl、75mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5x邓哈特氏溶液(Denhardt's solution)、10％硫酸葡聚糖和20μg/ml变性的剪切鲑精DNA的溶液中过夜孵育，然后在约50℃下在0.1x SSC中洗涤过滤器。杂交和信号检测严格性的改变主要通过控制甲酰胺浓度(较低的甲酰胺百分比导致严格性降低)；盐条件或温度实现。例如，中等高严格性条件包括于37℃下在包含6X SSPE(20XSSPE＝3M NaCl；0.2MNaH₂PO₄；0.02M EDTA，pH 7.4)、0.5％ SDS、30％甲酰胺、100μg/ml阻断DNA的鲑精的溶液中过夜孵育；之后用1XSSPE，0.1％ SDS于50℃下洗涤。另外，为了达到甚至更低的严格性，严格杂交后进行的洗涤可以在更高的盐浓度(例如5X SSC)下进行。上述条件的变化可以通过包含和/或替换用于抑制杂交实验中的背景的替代性阻断试剂来实现。典型的阻断试剂包括邓哈特氏试剂(Denhardt's reagent)、BLOTTO、肝素、变性鲑精DNA和可商购获得专利配制品。由于相容性问题，包含特定的阻断试剂可能需要修改上述杂交条件。

当涉及多肽时，术语“片段”、“衍生物”和“类似物”意指保留与此类多肽基本上相同的生物学功能或活性的多肽。类似物包括前蛋白(pro-protein)，它可以通过裂解前蛋白部分而激活以产生活性成熟多肽。

术语“基因”意指参与产生多肽链的DNA区段；它包括编码区之前和之后的区域“前导区和尾区”以及各个编码区段(外显子)之间的间插序列(内含子)。

多肽可以由通过肽键或修饰的肽键彼此连接的氨基酸组成，即肽等排体，并且可以含有除20种基因编码的氨基酸之外的氨基酸。多肽可以通过天然过程(如翻译后加工)或通过本领域熟知的化学修饰技术进行修饰。此类修饰在基础教科书和更详细的专著以及大量研究文献中有充分描述。修饰可以发生在多肽中的任何地方，包括肽主链、氨基酸侧链和氨基末端或羧基末端。应当认识到，相同类型的修饰可以在给定多肽中的几个位点以相同或不同的程度存在。而且，给定多肽可以含有许多类型的修饰。例如，多肽可以例如由于泛素化而分支，并且它们可以是环状的，有或没有分支。环状、分支和分支环状多肽可以由翻译后的天然过程产生，或者可以通过合成方法制备。修饰包括但不限于乙酰化、酰化、生物素化、ADP-核糖基化、酰胺化、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、通过已知的保护/阻断基团衍生化、二硫键形成、去甲基化、共价交联的形成、半胱氨酸的形成、焦谷氨酸的形成、甲酰化、γ-羧化、糖基化、GPI锚形成、羟基化、碘化、与抗体分子或其他分子配体连接、甲基化、豆蔻酰化、氧化、聚乙二醇化、蛋白水解加工(例如，裂解)、磷酸化、异戊烯化、外消旋化、硒化、硫酸化、转运RNA介导的向蛋白质添加氨基酸(如精氨酸化)和泛素化。(参见，例如，PROTEINS-STRUCTURE AND MOLECULAR PROPERTIES[蛋白质-结构和分子特性],第2版,T.E.Creighton,W.H.Freeman and Company,New York[纽约W.H.弗里曼公司](1993)；POSTTRANSLATIONAL COVALENT MODIFICATION OF PROTEINS[蛋白质翻译后共价修饰],B.C.Johnson编,Academic Press[学术出版社],纽约,第I-12页(1983)；Seifter等人,Meth Enzymol[酶学方法]182:626-646(1990)；Rattan等人,Ann NY Acad Sci[纽约科学院年鉴]663:48-62(1992))。

“具有生物活性”的多肽片段是指表现出与原始多肽(包括成熟形式)的活性相似但不一定相同的活性的多肽，如在特定生物学测定法中所测量的，具有或不具有剂量依赖性。在确实存在剂量依赖性的情况下，它不需要与该多肽的剂量依赖性相同，而是与原始多肽相比与给定活性中的剂量依赖性基本上相似(即，相对于原始多肽，候选多肽将表现出更强的活性或低不超过约25倍且在一些实施例中，低不超过约十倍的活性，或低不超过约三倍的活性。)

可以通过以下方式分离和鉴定物种同源物：由本文提供的序列制备合适的探针或引物，以及针对所需同源物对合适的核酸来源进行筛选。

“变体”是指与原始多核苷酸或多肽不同但保留其基本特性的多核苷酸或多肽。通常，变体与原始多核苷酸或多肽总体上非常相似，并且在许多区域中，与原始多核苷酸或多肽相同。

实际上，可以使用已知的计算机程序以常规方式测定任何特定核酸分子或多肽是否与本发明的核苷酸序列具有至少80％、85％、90％、92％、95％、96％、97％、98％、99％或100％同一性。用于测定查询序列(本发明的序列)与目标序列之间的最佳总体匹配的优选方法，也称为全局序列比对，可以使用基于Brutlag等人(Comp.App.Blosci.[计算机生物科学应用](1990)6:237-245)的算法的FASTDB计算机程序来确定。在序列比对中，查询序列和目标序列都是DNA序列。可以通过将U转换为T来比较RNA序列。所述全局序列比对的结果是百分比同一性。用于DNA序列的FASTDB比对以计算百分比同一性的优选参数是：矩阵(Matrix)＝酉(Unitary)，k-元组(k-tuple)＝4，错配罚分(Mismatch Penalty)--1，连接罚分(Joining Penalty)--30，随机分组长度(Randomization Group Length)＝0，截止得分(Cutoff Score)＝l，空位罚分(Gap Penalty)--5，空位大小罚分(Gap Size Penalty)0.05，窗口大小(Window Size)＝500或目标核苷酸序列的长度(以较短者为准)。如果目标序列由于5'或3'缺失，而不是因为内部缺失而比查询序列短，则必须对结果进行人工校正。这是因为FASTDB程序在计算百分比同一性时不考虑目标序列的5'和3'截短。对于相对于查询序列在5'或3'末端截短的目标序列，通过计算查询序列中在目标序列5'和3'而未匹配/对齐的碱基数占查询序列总碱基数的百分比来校正百分比同一性。通过FASTDB序列比对的结果确定核苷酸是否匹配/对齐。然后从上述FASTDB程序使用指定参数计算的百分比同一性中减去该百分比，以得出最终的百分比同一性得分。该校正后的得分是用于本发明目的的得分。为了人工调整百分比同一性得分，仅计算目标序列5'和3'碱基外(如通过FASTDB比对展示的)未与查询序列匹配/对齐的碱基。例如，将90个碱基的目标序列与100个碱基的查询序列比对以确定百分比同一性。缺失发生在目标序列的5'末端，因此，FASTDB比对未显示5'末端前10个碱基的匹配/对齐。这10个受损碱基占序列的10％(5'和3'末端未匹配的碱基数/查询序列中的碱基总数)，所以从通过FASTDB程序计算的百分比同一性得分中减去10％。如果剩余的90个碱基完全匹配，则最终的百分比同一性为90％。在另一个实例中，将90个碱基的目标序列与100个碱基的查询序列进行比较。这次缺失是内部缺失，所以在目标序列的5'或3'上没有与查询序列不匹配/对齐的碱基。在这种情况下，通过FASTDB计算的百分比同一性不进行人工校正。再次，仅人工校正目标序列5'和3'处与查询序列不匹配/对齐的碱基。

所谓具有与本发明的查询氨基酸序列具有至少(例如)95％“同一性”的氨基酸序列的多肽，旨在表示除了以下方面外，目标多肽的氨基酸序列与查询序列相同：目标多肽序列可以在查询氨基酸序列的每100个氨基酸中包括最多五个氨基酸改变。换言之，为了获得具有与查询氨基酸序列具有至少95％同一性的氨基酸序列的多肽，目标序列中最多5％的氨基酸残基可以插入、缺失或用另一种氨基酸取代。参考序列的这些改变可以发生在参考氨基酸序列的氨基或羧基末端位置或那些末端位置之间的任何位置，单独散布在参考序列中的残基之间或参考序列内的一个或多个连续组中。

实际上，可以使用已知的计算机程序以常规方式测定任何特定多肽是否与例如序列中所示的氨基酸序列或与保藏DNA克隆所编码的氨基酸序列具有至少80％、85％、90％、92％、95％、96％、97％、98％、99％或100％同一性。用于测定查询序列(本发明的序列)与目标序列之间的最佳总体匹配的优选方法，也称为全局序列比对，可以使用基于Brutlag等人(Comp.App.Biosci.[计算机生物科学应用](1990)6:237-245)的算法的FASTDB计算机程序来确定。在序列比对中，查询序列和目标序列均为核苷酸序列或均为氨基酸序列。所述全局序列比对的结果是百分比同一性。用于FASTDB氨基酸比对的优选参数是：矩阵＝PAM 0，k-元组＝2，错配罚分--I，连接罚分＝20，随机分组长度＝0，截止得分＝I，窗口大小＝序列长度，空位罚分--5，空位大小罚分--0.05，窗口大小＝500或目标氨基酸序列的长度(以较短者为准)。如果目标序列由于N-或C-端缺失，而不是因为内部缺失而比查询序列短，则必须对结果进行人工校正。这是因为FASTDB程序在计算全局百分比同一性时不考虑目标序列的N-和C-端截短。对于相对于查询序列在N-和C-端截短的目标序列，通过计算查询序列中在目标序列N-和C-端而未与相应目标残基匹配/对齐的残基数占查询序列总碱基数的百分比来校正百分比同一性。通过FASTDB序列比对的结果确定残基是否匹配/对齐。然后从上述FASTDB程序使用指定参数计算的百分比同一性中减去该百分比，以得出最终的百分比同一性得分。该最终百分比同一性得分是用于本发明目的的得分。为了人工调整百分比同一性得分，仅考虑目标序列N-和C-端未与查询序列匹配/对齐的碱基。也就是说，仅查询位于目标序列的最远N-和C-端残基外的残基位置。仅人工校正目标序列N-端和C-端外(如FASTDB比对中所展示的)与查询序列不匹配/对齐的残基位置。出于本发明的目的，不需要进行其他人工校正。

天然存在的蛋白质变体称为“等位基因变体”，并且是指占据生物体染色体上的给定基因座的基因的几种替代性形式之一。(Genes[基因]11,Lewin,B.编,John Wiley&Sons,New York[纽约约翰威利国际出版公司](1985))。这些等位基因变体可以在多核苷酸和/或多肽水平上变化。替代性地，非天然存在的变体可以通过诱变技术或通过直接合成而产生。

如本文所用，包含“异源核酸序列”或“异源转基因”的分离的核酸是指包含在天然背景下发现通常不与分离的核酸的其余部分可操作地连接的部分(即，异源核酸部分)的分离的核酸。例如，异源核酸可以包含最初未在天然衍生出分离的核酸的其他组分(例如，启动子)的细胞、细菌细胞、病毒、或生物体中发现的核酸序列，或其中未发现分离的核酸的其他组分(例如，启动子)与细胞、细菌细胞、病毒、或生物体中的异源核酸天然地可操作地连接的核酸序列。在一些实施例中，异源核酸序列编码人蛋白。在一些实施例中，异源核酸序列编码RNA序列，例如shRNA。

“编码”特定RNA的DNA序列或DNA多核苷酸序列是能够转录为RNA的DNA的序列。DNA多核苷酸可以编码翻译成蛋白质的RNA(mRNA)，或者DNA多核苷酸可以编码不翻译成蛋白质的RNA(例如，tRNA、rRNA、或指导RNA；也称为“非编码”RNA或“ncRNA”)。DNA序列或DNA多核苷酸序列也可以“编码”特定的多肽或蛋白序列，其中，例如，DNA直接编码可翻译成多肽或蛋白序列的mRNA。“蛋白质编码序列”或编码特定蛋白质或多肽的序列是当置于适当的调节序列的控制下时能够在体外或体内转录为mRNA(在DNA的情况下)和翻译(在mRNA的情况下)成多肽的核酸序列。编码序列的边界可以由5’端(N-端)处的起始密码子和3’端(C-端)处的翻译终止无义密码子确定。编码序列可以包括但不限于来自原核或真核生物mRNA的cDNA、来自原核或真核生物DNA的基因组DNA序列、以及合成核酸。转录终止序列将通常位于编码序列的3’。

在本文中可互换使用的术语“DNA调节序列”、“控制元件”和“调节元件”是指提供和/或调节非编码序列(例如，短发夹RNA)或编码序列(例如，PGRN)的转录和/或调节编码多肽的翻译的转录和翻译控制序列，如启动子、增强子、多腺苷酸化信号、终止子、蛋白降解信号等。

术语“多腺苷酸化(polyA)信号序列”和“多腺苷酸化序列”是指为转录终止和向RNA转录物的3’末端添加腺苷均聚链提供信号的调节元件。多腺苷酸化信号可以包含终止信号(例如，AAUAAA序列或其他非经典序列)和任选地侧接的辅助元件(例如，富含GU的元件)和/或与有效切割和多腺苷酸化相关的其他元件。多腺苷酸化序列可以包含一系列通过多腺苷酸化附接到mRNA的3’末端的腺苷。特定的polyA信号序列可以包括表1的poly(A)信号(SEQ ID NO:5)。在一些实施例中，DNA调节序列或控制元件是组织特异性调节序列。

术语“转录后调节元件”(“PRE”)是指当转录为mRNA时，在mRNA转录水平调节基因表达的一个或多个调节元件。此类转录后调节元件的实例可以包括编码微小RNA结合位点、RNA结合蛋白结合位点等的序列。可与本文披露的病毒载体一起使用的转录后调节元件的实例包括土拨鼠肝炎转录后调节元件(WPRE)、肝炎转录后调节元件(HPRE)。

术语“内含子”是指一个或多个核酸序列，例如在开放阅读框中的那些，该一个或多个核酸序列不编码从核酸表达的蛋白质的一个或多个氨基酸。内含子序列可以从DNA转录为RNA，但可以例如通过剪接在蛋白质表达之前被去除。在一些实施例中，将内含子序列添加到异源核酸序列以增加基因表达的总体效率和输出。可与本文披露的病毒载体一起使用的内含子的实例包括SV40内含子、β珠蛋白内含子、鸡β-肌动蛋白内含子等。

如本文所用，“体外”进行的过程是指在正常生物环境之外进行的过程，例如在试管、烧瓶、培养皿、人工培养基中进行的研究。“体内”进行的过程是指在活生物体或细胞内进行的过程，例如，在细胞培养物或小鼠中进行的研究。“离体”进行的过程是指在外部环境(例如，具有对自然条件的最小改变)中在来自生物体的组织中或对来自生物体的组织进行的过程，例如，允许在比体内实验更受控的条件下操作生物体的细胞或组织。

如本文所用，如应用于例如核酸、多肽、细胞、或生物体的术语“天然存在”或“未修饰”，是自然界中发现的核酸、多肽、细胞、或生物体。例如，存在于生物体(如病毒)中的多肽或多核苷酸序列是天然存在的，无论是存在于该生物体中还是从该生物体的一种或多种组分中分离的。

在一些实施例中，“载体”是任何遗传元件(例如，DNA、RNA、或其混合物)，该遗传元件含有能够在宿主细胞中表达的目的核酸，例如，在适用于递送至细胞、组织和/或生物体的较大核酸序列或结构中的目的核酸，如质粒、噬菌体、转座子、粘粒、染色体、病毒、病毒粒子等。例如，载体可以包含插入物(例如，编码待表达的基因或该基因的开放阅读框的异源核酸)以及一个或多个另外的元件，例如适用于递送或控制该插入物的表达的元件。例如当与适当的控制元件相关时，载体可以能够复制和/或表达，并且其可以能够在细胞之间转移遗传信息。在一些实施例中，载体可以是适用于在宿主细胞中表达的载体，例如AAV载体。在一些实施例中，载体可以是适用于例如在细胞或生物反应器中表达和/或复制的质粒。在一些实施例中，特别地设计用于在靶细胞中表达异源核酸序列(例如，编码目的蛋白、shRNA等的异源核酸)的载体可以称为表达载体，并且通常具有驱动该异源核酸序列表达的启动子序列。在其他实施例中，载体(例如，转录载体)可以能够被转录但不能被翻译：他们可以在靶细胞中复制但不能表达。转录载体可以用于扩增他们的插入物。

术语“表达载体”是指包含多核苷酸的载体，该多核苷酸包含与待表达的核苷酸序列可操作地连接的表达控制序列。单独或与宿主细胞提供的或在体外表达系统中的其他用于表达的元件组合，表达载体可以包含足够的用于表达的顺式作用元件。表达载体包括例如掺入重组多核苷酸的粘粒、质粒(例如，裸露的或包含在脂质体中)和病毒(例如，慢病毒、逆转录病毒、腺病毒和腺相关病毒)。

术语“质粒”是指包含完整“复制子”的非染色体(并且典型地为双链)DNA序列，使得质粒在宿主细胞中复制。质粒可以是环状核酸。当将质粒放置在单细胞生物体内时，该质粒的DNA导致该生物体的特征发生改变或转化。例如，携带四环素抗性(TcR)基因的质粒将先前对四环素敏感的细胞转化为对其具有抗性的细胞。

如本文所用，术语“重组病毒”旨在意指包含基因或其他异源核酸的非野生型和/或人工产生的重组病毒(例如，细小病毒、腺病毒、慢病毒或腺相关病毒等)。重组病毒可以包含包装在病毒(例如：AAV)衣壳内的重组病毒基因组(例如，包含编码目的基因的核酸)。重组病毒的特定类型可以是“重组腺相关病毒”或“rAAV”。包装在病毒衣壳中的重组病毒基因组可以是病毒载体。在一些实施例中，本文披露的重组病毒包含病毒载体。病毒载体的实例包括但不限于腺相关病毒(AAV)载体、嵌合AAV载体、腺病毒载体、逆转录病毒载体、慢病毒载体、DNA病毒载体、单纯疱疹病毒载体、杆状病毒载体、或其任何突变体或衍生物。

在另一实施例中，术语“转染”用以指细胞对外来DNA的摄取，使得一旦已将外源DNA引入细胞膜内侧，这些细胞就已被“转染”了。参见例如，Graham等人,(1973)Virology[病毒学],52:456；Sambrook等人,(1989)Molecular Cloning,a laboratory manual[分子克隆：实验室手册],Cold Spring Harbor Laboratories[冷泉港实验室],纽约；Davis等人,(1986)Basic Methods in Molecular Biology[分子生物学基本方法],Elsevier[爱思唯尔]；Chu等人,(1981)Gene[基因],13:197。此类技术可用于将一个或多个外源DNA部分引入适合的宿主细胞中。在一些实施例中，术语“转导”用以指细胞对外来DNA的摄取，其中该外来DNA由病毒或病毒载体提供。因此，当已将外源DNA引入细胞膜内侧时，细胞就已被“转导”。在一些实施例中，术语“转化”用以指细菌细胞对外来DNA的摄取。

如本文所用，术语“细胞系”是指能够在体外继续或延长生长和分裂的细胞群。在某些情况下，在储存或转移此类克隆群期间，核型可能发生自发或诱导的变化。因此，衍生自所指细胞系的细胞可能与祖先细胞或培养物不完全相同，并且所指细胞系包括此类变体。

术语“可操作地连接”是指两个或更多个多核苷酸(例如，DNA)区段之间的功能性关系。典型地，该术语是指转录调节序列与待转录序列的功能性关系。例如，如果启动子或增强子序列例如在适当的宿主细胞或其他表达系统中刺激或调节编码序列的转录，则启动子或增强子序列与编码序列可操作地连接。通常，与序列可操作地连接的启动子转录调节序列与该序列邻接或由短间隔子序列分开，即他们是顺式作用的。然而，一些转录调节序列例如增强子不需要在物理上邻接或位于极为接近这些转录调节序列增强其转录的编码序列的位置。

如本文所用，术语“AAV载体”是指衍生自或包含腺相关病毒血清型的一个或多个核酸序列的载体，包括但不限于AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8或AAV-9病毒载体。AAV载体可具有一个或多个AAV野生型基因的整体或部分缺失，例如rep和/或cap基因，同时保留例如功能性侧接反向末端重复(“ITR”)序列。在一些实施例中，AAV载体可以包装在例如包含一个或多个AAV衣壳蛋白的蛋白壳或衣壳中，该外壳或衣壳可提供用于将载体核酸递送至靶细胞的细胞核的媒介物。在一些实施例中，AAV载体包含一个或多个AAV ITR序列(例如，AAV2 ITR序列)。在一些实施例中，AAV载体包含一个或多个AAV ITR序列(例如，AAV2 ITR序列)，但不含有任何另外的病毒核酸序列。这些载体构建体的实施例提供于例如WO/2019/094253(PCT/US2018/058744)中，将其通过引用以其全文并入本文。

在一些实施例中，“scAAV”是自互补的腺相关病毒(scAAV)。scAAV被称为“自互补”，因为scAAV的载体的至少一部分(例如，编码区的至少一部分)形成分子内双链DNA。在一些实施例中，rAAV是scAAV。在一些实施例中，病毒载体从天然存在的腺相关病毒(AAV)工程化以提供用于基因疗法的scAAV。这些载体构建体的实施例以及其制备和纯化方法提供于例如WO/2019/094253(PCT/US2018/058744)中，将其通过引用以其全文并入本文。

如本文所用，“病毒”或“病毒粒子”指示包含病毒载体(例如，单独或与一种或多种另外的组分(如一种或多种病毒衣壳)组合)的病毒颗粒。例如，AAV病毒可以包含例如与AAV衣壳蛋白外壳相关的线性单链AAV核酸基因组。

在一些实施例中，术语如“病毒”、“病毒粒子”、“AAV病毒”、“重组AAV病毒粒子”、“rAAV病毒粒子”、“AAV载体颗粒”、“完全衣壳”及“完全颗粒”等是指感染性、复制缺陷型病毒，例如包含AAV蛋白壳的那些，该AAV蛋白壳包裹例如在一侧或两侧上由AAV ITR侧接的病毒载体中的目的异源核苷酸序列。rAAV病毒粒子可以在适合的宿主细胞中产生，该适合的宿主细胞包含单独或与编码AAV辅助功能和附带功能(如cap基因)的核酸组合(例如在相同或另外的质粒上)的指定AAV载体的序列(例如一个或多个质粒)。在一些实施例中，使得宿主细胞能够编码AAV多肽，这些多肽用于实现将AAV载体(含有目的重组核苷酸序列)包装至感染性重组病毒粒子颗粒中以用于后续基因递送。

术语“反向末端重复”或“ITR”是指可以例如在腺相关病毒(AAV)和/或重组腺相关病毒载体(rAAV)中形成T形回文结构的一段核苷酸序列。Muzyczka等人,(2001)FieldsVirology[费氏病毒学],第29章,Lippincott Williams&Wilkins[利平科特、威廉姆斯和威尔金斯出版社]。在重组AAV载体中，这些序列在基因组包装和第二链合成中发挥功能性作用。

术语“宿主细胞”表示包含目的外源核酸的细胞，例如，一种或多种微生物、酵母细胞、昆虫细胞、或哺乳动物细胞。例如，宿主细胞可以包含AAV辅助构建体、AAV载体质粒、附带功能载体、和/或其他转移DNA。该术语包括已转染的原始细胞的子代。由于自然的、偶然的或故意的突变，单个亲本细胞的子代在形态或基因组或总DNA互补方面不一定与原始亲本完全相同。

术语“AAV辅助功能”是指可被表达以提供AAV基因产物的AAV衍生的编码序列，例如反式发挥功能以用于生产性AAV复制的那些。例如，AAV辅助功能可以包括两种主要的AAV开放阅读框(ORF)：rep和cap。已证明Rep表达产物具有许多功能，其中包括：AAV的DNA复制起点的识别、结合和切断；DNA解旋酶活性；以及来自AAV(或其他异源)启动子的转录的调节。Cap表达产物提供必要的包装功能。在本文中，AAV辅助功能可用于以反式补充AAV载体中缺失的AAV功能。

术语“AAV辅助构建体”一般是指包括提供或编码以下蛋白质或核酸的核苷酸序列的核酸分子，这些蛋白质或核酸提供从AAV载体中缺失的AAV功能，例如，用于将目的核苷酸序列递送至靶细胞或组织的载体。AAV辅助构建体通常用于提供AAV rep和/或cap基因的瞬时表达，以补充AAV复制所缺失的AAV功能。典型地，辅助构建体缺乏AAV ITR，并且既不能复制也不能包装自己。AAV辅助构建体可以是质粒、噬菌体、转座子、粘粒、病毒、或病毒粒子的形式。已经披露了许多AAV辅助构建体，如编码Rep和Cap表达产物的常用质粒pAAV/Ad和plM29+45。参见例如，Samulski等人,(1989)J.Virol.[病毒学杂志],63:3822-3828；McCarty等人,(1991)J.Virol.[病毒学杂志],65:2936-2945。已经披露了许多其他编码Rep和/或Cap表达产物的载体。参见例如，美国专利号5,139,941和6,376,237。这些载体构建体的实施例以及其制备和纯化方法提供于例如WO/2019/094253(PCT/US2018/058744)中，将其通过引用以其全文并入本文。

“标记”是指能够直接地或通过与信号产生系统的一个或多个另外成员相互作用而提供可检测信号的药剂。可直接检测并且可用于本发明的标记包括荧光标记。特定的荧光团包括荧光素、若丹明、BODIPY、花青染料等。

“荧光标记”是指当被另一波长的光激发时能够发射某一波长的光的任何标记。

“荧光”是指任何可检测的荧光信号特征，包括强度、光谱、波长、胞内分布等。

“检测”荧光是指使用定性或定量方法评估细胞的荧光。在本发明的一些实施例中，将以定性方式检测荧光。换言之，是否存在荧光标记，表明重组融合蛋白是否表达。对于其他情况，可以使用定量手段测定荧光，例如，测量荧光强度、光谱或胞内分布，从而允许对不同条件下获得的值进行统计比较。该水平还可以使用定性方法来测定，例如视觉分析和人为对多个样品进行比较，例如，使用荧光显微镜或其他光学检测器(例如，图像分析系统等)检测样品。荧光的“改变”或“调制”是指在特定条件下与另一条件相比，荧光的强度、胞内分布、光谱、波长或其他方面的任何可检测的差异。例如，以定量方式检测“改变”或“调制”，并且差异是统计学上显著的差异。荧光的任何“改变”或“调制”可以使用标准仪器，如荧光显微镜、CCD或任何其他荧光检测器来检测，并且可以使用自动化系统(如集成系统)来检测，或者可以通过人类观察者来反映对改变的主观检测。

“绿色荧光蛋白”(GFP)是一种由238个氨基酸组成的蛋白质(26.9kDa)，该蛋白质最初从水母维多利亚多管发光水母(Aequorea victoria)/水螅水母(Aequoreaaequorea)/肋骨水母(Aequorea forskalea)分离，当暴露于蓝光时发出绿色荧光。来自维多利亚多管发光水母的GFP具有在395nm的波长下的主要激发峰和在475nm处的次要激发峰。其发射峰在509nm处，这处于可见光谱的绿色下部。来自海肾(Renilla reniformis)的GFP具有在498nm处的单个主要激发峰。由于广泛使用的潜力和研究人员不断变化的需求，已经对许多不同的GFP突变体进行工程化。第一个主要的改进是1995年由Roger Tsien在Nature[自然]上报道的单点突变(S65T)。这种突变显著改善了GFP的光谱特征，导致增强的荧光、光稳定性和主要激发峰迀移至488nm而发射峰保持在509nm。将37℃折叠效率(F64L)点突变添加至这个支架产生了增强的GFP(EGFP)。EGFP的消光系数(表示为ε)，也称为其光学截面，为9.13×10-21m²/分子，也作为55,000L/(mol·cm)引述。2006年报道了超级折叠GFP，这是一系列允许GFP即使在与弱折叠肽融合时也快速折叠和成熟的突变。

“黄色荧光蛋白”(YFP)是衍生自维多利亚多管发光水母的绿色荧光蛋白的遗传突变体。其激发峰为514nm且发射峰为527nm。

如本文所用，除非上下文另外明确指出，否则单数形式“一个/种(a/an)”和“该/所述”也包括复数指示物。

“病毒”是不能在宿主细胞外生长或繁殖的亚微观感染因子。每种病毒颗粒或病毒粒子由在称为衣壳的保护性蛋白外壳内的遗传物质DNA或RNA组成。衣壳形状从简单的螺旋和二十面体(多面体或近球形)形式到更复杂的具有尾部或包膜的结构变化。病毒感染细胞生命形式并且根据感染的宿主类型，分为动物、植物和细菌类型。

如本文所用的术语“跨突触病毒”是指能够通过突触从一个神经元迁移到另一个相连神经元的病毒。此类跨突触病毒的实例是弹状病毒，例如狂犬病病毒和α疱疹病毒，例如假狂犬病病毒或单纯疱疹病毒。如本文所用的术语“跨突触病毒”还涵盖自身具有通过突触从一个神经元迁移到另一个相连神经元的能力的病毒亚单位和包含此类亚单位并展示出通过突触从一个神经元迁移到另一个相连神经元的能力的生物载体(如经修饰的病毒)。

跨突触迁移可以是顺行的或逆行的。在逆行迁移期间，病毒将从突触后神经元移动到突触前神经元。因此，在顺行迁移期间，病毒将从突触前神经元移动到突触后神经元。

同源物是指具有共同祖先的蛋白质。类似物没有共同的祖先，但具有一些功能(而非结构)相似性，使得将它们包括在一个类别中(例如胰蛋白酶样丝氨酸蛋白酶和枯草杆菌蛋白酶明显不相关-它们在活性位点外的结构完全不同，但它们具有几何学上几乎相同的活性位点，并因此被认为是趋同进化为类似物的实例)。

同源物有两个亚类-直系同源物和旁系同源物。直系同源物是不同物种中的相同基因(例如细胞色素‘c’)。相同生物体中的两个基因不可能是直系同源物。旁系同源物是基因复制的结果(例如血红蛋白β和δ)。如果两种基因/蛋白质是同源的并且在相同的生物体中，则它们是旁系同源物。

如本文所用，术语“障碍”是指小病、疾病、病痛、临床病症或病理病症。

如本文所用，术语“药学上可接受的载剂”是指不干扰活性成分的生物活性的有效性、是化学惰性的并且对所施用的患者无毒的载剂介质。

如本文所用，术语“药学上可接受的衍生物”是指例如使用本发明的筛选方法鉴定的、对受试者相对无毒的药剂的任何同源物、类似物或片段。

术语“治疗剂”是指有助于预防或治疗障碍或障碍的并发症的任何分子、化合物或治疗。

可以制备配制在相容性药物载剂中的包含这样的药剂的组合物、包装并贴标签以用于治疗。

如果复合物是水溶性的，则可以将其配制在合适的缓冲液中，例如磷酸盐缓冲盐水或其他生理上相容的溶液。

替代性地，如果所得的复合物在水性溶剂中的溶解性差，则可以用非离子表面活性剂如Tween或聚乙二醇配制。因此，组合物及其生理上可接受的溶剂化物可以被配制成通过以下方式施用：吸入或吹入(通过口或鼻)或口服、含服、肠胃外、直肠施用，或者在肿瘤的情况下，直接注射到实体瘤中。

组合物可以被配制成通过注射，例如通过推注或连续输注而进行肠胃外施用。注射用配制品可以以单位剂型呈现，例如，在添加了防腐剂的安瓿中或多剂量容器中。

该组合物可以采取例如处于油性媒介物或水性媒介物的悬浮液、溶液或乳液的形式，并且可以含有配制剂(例如助悬剂、稳定剂和/或分散剂)。替代性地，活性成分可以呈粉末形式，以在使用前用合适的媒介物(例如无菌无热原水)复原。

组合物也可以配制成供局部应用，如霜剂或洗剂。

除了前述配制品之外，组合物还可以被配制为贮库制剂。此类长效型配制品可以通过植入(例如，眼内、皮下或肌内)或通过眼内注射而施用。

因此，例如，组合物可以与合适的聚合物或疏水性材料(例如，作为在可接受的油中的乳液)或离子交换树脂一起配制，或被配制成微溶性衍生物，例如被配制成微溶性盐。脂质体和乳液是用于亲水性药物的递送媒介物或载剂的熟知实例。

如果需要，组合物可以呈现于包装或分配装置中，该包装或分配装置可以含有一个或多个包含活性成分的单位剂型。该包装例如可以包含金属箔或塑料箔，例如泡罩包装。该包装或分配装置可以附有施用说明。

本发明还提供了用于实施本发明的治疗方案的试剂盒。此类试剂盒在一个或多个容器中包含治疗或预防有效量的药学上可接受形式的组合物。

试剂盒的小瓶中的组合物可以呈药学上可接受的溶液的形式，例如与无菌盐水、葡萄糖溶液或缓冲溶液或其他药学上可接受的无菌流体组合。替代性地，复合物可以冻干或脱水；在这种情况下，试剂盒任选地进一步在容器中包含优选地为无菌的药学上可接受的溶液(例如，盐水、葡萄糖溶液等)，以将复合物复原以形成用于注射目的的溶液。

在另一实施例中，试剂盒进一步包含优选地以无菌形式包装以用于注射复合物的针或注射器，和/或包装好的酒精垫。任选地包括供临床医生或患者施用组合物的说明书。

蛋白质BANP，也称为BTG3相关核蛋白、支架/基质相关区域-1-结合蛋白、含BEN结构域的蛋白1、蛋白质BANP、BEND1、SMAR1、Btg3相关核蛋白、含BEN结构域的1蛋白或SMARBP1，是一种在人类中由BANP基因编码的蛋白质(HGNC：13450Entrez基因：54971Ensembl：ENSG00000172530 OMIM：611564UniProtKB：Q8N9N5)。它是人类基因家族“包含BEN结构域的蛋白(BEN-domain containing)”的成员，其中包括其他八个基因：BEND2、BEND3、BEND4、BEND5、BEND6、BEND7、NACC1(BEND8)、和NACC2(BEND9)。

除非另外定义，否则本文所用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。虽然与本文所述的那些方法和材料类似或等同的方法和材料可以用于本发明的实践或测试，但是以下描述合适的方法和材料。在冲突存在的情况下，则以包括定义在内的本说明书为准。此外，材料、方法和实例仅是说明性的而不旨在限制。

实例

瞬时转染后双荧光素酶报道基因测定

将嵌入具有不同CpG二核苷酸密度(0％、25％、50％、75％、或100％突变CpG)的人工启动子序列中的三个Banp基序和乱序对照克隆到萤火虫荧光素酶基因的上游。使用Lipofectamine-2000(赛默飞世尔科技公司(Thermo Fisher Scientific)，L3000008)将萤火虫荧光素酶质粒与海肾荧光素酶对照报道基因质粒(10:1)共转染到24孔板中的小鼠胚胎干细胞(mESC)中。24小时后，执行荧光素酶测定系统(普洛麦格公司(Promega)E1500)。细胞用PBS洗涤一次，并在室温下用被动裂解缓冲液(PLB，100ul)轻轻搅拌裂解15min。将荧光素酶测定试剂II(LAR II，100ul)分配到96孔光度计板中适当数量的孔中。照度计编程为执行2秒的预测量延迟，然后是每个报道基因测定的10秒测量周期。小心地将20μl细胞裂解液转移到含有LAR II的光度计板中，上下移液3次混合，然后测量萤火虫荧光素酶活性。从光度计上取下样品板，加入Stop&Glo试剂(100μl)并短暂涡旋混合。更换光度计中的样品，并测量海肾荧光素酶活性。萤火虫荧光素酶活性标准化为海肾荧光素酶活性，然后相对于含乱序对照基序的构建体来确定含Banp基序的构建体的萤火虫荧光素酶活性的倍数增加。

Banp启动子的稳定基因组整合和荧光素酶报道基因测定

将具有三个完整或乱序的Banp基序的人工Banp启动子-荧光素酶构建体稳定整合到mESC的β-珠蛋白基因座中。选择含有这些Banp启动子中每一个的四个单独的克隆，并在执行荧光素酶测定系统(普洛麦格公司E1500)之前24小时铺板250,000个细胞。简而言之，细胞在250μl1x PLB中裂解，振荡孵育10min，然后转移到冰上管中。将细胞涡旋1秒，在室温下旋转沉降15秒，并将上清液转移到冰上的新管中。将细胞裂解液(20μl)一式两份等分到96孔板中，每孔加入100μl荧光素酶测定试剂，并将混合物上下移液三次。用光度计测量萤火虫荧光素酶信号，每孔1s，没有延迟。

序列表

<110> 弗里德里克-米谢尔生物医学研究所（Friedrich Miescher Institute forBiomedical Research）

<120> 利用孤儿基序和CpG密度的组合来控制异源转基因的表达

<130> PAT059014

<160> 3

<170> PatentIn 3.5版

<210> 1

<211> 10

<212> DNA

<213> 智人（Homo sapiens）

<400> 1

bmycgcgrbv 10

<210> 2

<211> 10

<212> DNA

<213> 智人（Homo sapiens）

<400> 2

ymycgcgrkv 10

<210> 3

<211> 10

<212> DNA

<213> 智人（Homo sapiens）

<400> 3

tctcgcgaga 10

Claims

1.一种分离的核酸分子，其包含：

a.超过220bp，

b.选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列，和

c.在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的N个碱基对(bp)和/或之后的N个bp中的大于0.6的CpG观察值与估计值比率(O/E比率)，

其中所述CpG O/E比率通过以下确定：对选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的至少一个或多个拷贝的序列周围的N个bp长序列中的CpG二核苷酸的数量进行计数，并通过将CpG二核苷酸的计数数量乘以N并将结果除以所述N个bp中存在的C数量和G数量的乘积来计算所述O/E比率(N*CpG/(C*G))，其中N在50和1000之间并且是紧接在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前或紧跟其后的序列的长度，以bp计。

2.如权利要求1所述的分离的核酸，其进一步包含异源转基因。

3.如权利要求1或2所述的分离的核酸，其进一步包含编码蛋白质BANP或其活性片段或变体的另一个序列，所述序列可操作地连接至组成型启动子或诱导型启动子。

4.如前述权利要求中任一项所述的分离的核酸，其中所述异源转基因是嵌合抗原受体。

5.一种载体，其包含如前述权利要求中任一项所述的分离的核酸。

6.如权利要求5所述的载体，其中所述载体是质粒、DNA载体、RNA载体、病毒载体、腺病毒载体、腺相关病毒载体、慢病毒载体、逆转录病毒载体、γ逆转录病毒载体或HSV载体。

7.一种试剂盒或组合物，所述试剂盒或组合物包含如权利要求1-4中任一项所述的分离的核酸和第二分离的核酸分子，所述第二分离的核酸分子包含编码蛋白质BANP或其活性片段或变体的序列，所述序列可操作地连接至组成型启动子或诱导型启动子。

8.如权利要求7所述的试剂盒或组合物，其中两个分离的核酸均在同一载体内。

9.如权利要求7所述的试剂盒或组合物，所述试剂盒或组合物包含至少两个载体，其中两个分离的核酸在不同的载体内。

10.如权利要求1-4中任一项所述的分离的核酸或如权利要求5-6中任一项所述的载体或如权利要求7-9中任一项所述的试剂盒或组合物用于在细胞中表达所述异源转基因的用途。

11.如权利要求10所述的用途，其中与在相同条件下与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的单拷贝可操作地连接时的异源转基因的表达相比，所述异源转基因的表达增加大于二的倍数。

12.如权利要求10-11所述的用途，其中所述表达通过报道基因活性、报道基因荧光、定量逆转录酶PCR或基因组学方法例如RNA测序来测量。

13.一种在细胞中产生异源转基因的方法，所述方法为将如权利要求1-4中任一项所述的分离的核酸或如权利要求5-6中任一项所述的载体引入所述细胞中、培养所述细胞、并纯化重组表达的异源转基因。

14.一种分离的细胞，其包含如权利要求1-4中任一项所述的分离的核酸。

15.如权利要求14所述的细胞，其中包含选自SEQ ID NO:1、SEQ ID NO:2和/或SEQ IDNO:3的组的至少两个拷贝的序列的分离的核酸序列和所述异源转基因稳定地整合到所述细胞的基因组中。