CN116867901A - 功能性核酸分子和方法 - Google Patents

功能性核酸分子和方法 Download PDF

Info

Publication number
CN116867901A
CN116867901A CN202280011408.1A CN202280011408A CN116867901A CN 116867901 A CN116867901 A CN 116867901A CN 202280011408 A CN202280011408 A CN 202280011408A CN 116867901 A CN116867901 A CN 116867901A
Authority
CN
China
Prior art keywords
enhancer
super
synthetic
cells
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280011408.1A
Other languages
English (en)
Inventor
史蒂文·波拉德
犹特·库伯
曼塔斯·马朱塞提斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Edinburgh
Original Assignee
University of Edinburgh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Edinburgh filed Critical University of Edinburgh
Publication of CN116867901A publication Critical patent/CN116867901A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • C12N9/1211Thymidine kinase (2.7.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/01Phosphotransferases with an alcohol group as acceptor (2.7.1)
    • C12Y207/01021Thymidine kinase (2.7.1.21)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/33Fusion polypeptide fusions for targeting to specific cell types, e.g. tissue specific targeting, targeting of a bacterial subspecies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/15Vector systems having a special element relevant for transcription chimeric enhancer/promoter combination

Abstract

本公开涉及由一个或多个转录因子激活的合成超级增强子。具体地,本公开描述了合成超级增强子,其被靶细胞中表达的一个或多个转录因子激活,并在合成超级增强子被转录因子激活时用于表达转基因,例如不利的有效负载。

Description

功能性核酸分子和方法
技术领域
本公开涉及由一个或多个转录因子激活的合成超级增强子。具体地,本公开涉及合成的超级增强子,其由靶细胞中表达的转录因子激活并且与不利的有效负载偶联以便在激活时杀死靶细胞。本公开还涉及由SOX家族的一个或多个转录因子激活的合成超级增强子。
背景技术
人们对鉴定可用于基因治疗的细胞类型特异性增强子和启动子非常感兴趣,特别是当治疗蛋白货物需要以高度细胞选择性的方式表达以确保最大剂量并减少脱靶效应时。然而,当前的策略取得的成功有限,并且必须经常在规模、选择性或强度方面做出妥协。
两种不同但互补的策略可用于鉴定细胞类型特异性增强子。首先,用于目的细胞类型的强且选择性天然增强子可来自于对目的细胞类型或谱系的调控网络的系统的功能遗传剖析。其次,可以基于已知关键转录因子(TF)的人工合成DNA结合基序构建完全合成的增强子。已根据最强结合的生化测定定义了此类基序的数据库(通常约为5-10个碱基对长),例如JASPAR(Jolma等,2013)。可以使用混合文库高通量合成和筛选这些转录因子结合基序(Jolma等,2013)。然而,每种方法都有缺点。单个天然增强子通常强度不足以用于表型测定,或者受到大小限制或不适当的选择性的限制。基于转录因子结合基序的多联体构建的人工启动子可以诱导表达,但不具有适当的“语法”(间隔、顺序和适当的亲和力),其存在于天然增强子序列中,并且是招募合作TF和辅助因子(co-factors)所需(Farley等,2015)。因此,这些将缺乏选择性和鲁棒性(robustness)。
在本领域中描述了启动子序列、增强子序列和鉴定此类序列的方法,但这些具有上述缺点。WO2014066848和US2014/0296218描述了声称可用于调节细胞类型特异性基因的表达的天然超级增强子以及用于鉴定所述超级增强子的方法。WO2017155973描述了用于重组细小病毒的合成增强子,特别是具有减小的大小以能够递送大的遗传有效负载的增强子。WO2012101191描述了通过使用转录因子结合位点基序预测来设计用于基因的的选择性表达的启动子,以基于这些基序创建最小化的启动子。
因此,本领域仍然需要提供具有合适的选择性和活性的增强子以用于治疗方法,例如基因治疗。
发明概述
根据第一方面,提供了由一个或多个转录因子激活的超级增强子,其中所述超级增强子包含源自不同基因组基因座的两个或多个增强子序列,其中每个增强子序列包含所述转录因子的结合位点。在备选的教导中,提供了由一个或多个转录因子激活的合成超级增强子,其中所述合成超级增强子包含源自不同基因组基因座的两个或多个增强子序列,其中每个增强子序列包含转录因子的结合位点以及存在于其基因组基因座中的转录因子的结合位点上游和/或下游20至400个核苷酸。
术语“合成的”可以涵盖超级增强子构建体,其中通常位于不同基因组基因座的两个或多个增强子序列被分离并组合在新构建体中。因此,合成的超级增强子可能不存在于自然界中,并且可以被描述为人工的或“制造的”。因此,本文公开了由一个或多个转录因子激活的构建体,其中所述构建体包含源自不同基因组基因座的两个或多个增强子序列,其中每个增强子序列包含转录因子的结合位点。为了方便起见,术语“合成超级增强子”将用于涵盖本文描述的任何超级增强子/构建体。
根据另一方面,提供了包含本文所述的合成超级增强子的功能性核酸分子,其可操作地连接至转基因。在一个教导中,功能性核酸分子包含如本文所述的超级增强子构建体,其可操作地连接至转基因。
根据另一方面,提供了这样的功能性核酸分子,其包含由靶异常细胞中表达的一个或多个转录因子激活的合成超级增强子和不利的有效负载,其中所述有效负载在转录因子激活合成超级增强子时表达。在另一教导中,提供了功能性核酸分子,其包含由在靶异常细胞中表达的一个或多个转录因子激活的超级增强子构建体和不利的有效负载,其中所述有效负载在转录因子激活超级增强子构建体时表达。
根据另一方面,提供了由SOX家族的一个或多个转录因子激活的合成超级增强子,其中所述合成超级增强子包含两个或多个增强子序列和至少一个SOX基序和/或SOX二聚体基序。在一个教导中,提供了由SOX家族的一个或多个转录因子激活的超级增强子构建体,其中所述超级增强子构建体包含两个或多个增强子序列和至少一个SOX基序和/或SOX二聚体基序。
根据另一方面,提供了由SOX2激活的合成超级增强子,其中所述合成超级增强子包含源自不同基因组基因座的四个增强子序列,并且其中每个增强子序列包含至少一个SOX二聚体基序。在一个教导中,提供了由SOX2激活的超级增强子构建体,其中所述超级增强子构建体包含源自不同基因组座位的四个增强子序列,并且其中每个增强子序列包含至少一个SOX二聚体基序。
根据另一方面,提供了载体,其包含本文所述的合成超级增强子、超级增强子构建体或功能性核酸分子。
根据另一方面,提供了组合物,其包含本文所述的合成超级增强子、超级增强子构建体、功能性核酸分子或载体,以及可接受的载体。
根据另一方面,提供了组合物,其包含本文所述的功能性核酸分子,用于治疗。
根据另一方面,提供了组合物,其包含本文所述的功能性核酸分子,用于治疗癌症。
根据另一方面,提供了试剂盒,其包含功能性核酸分子,所述功能性核酸分子包含本文所述的不利有效负载,其中不利有效负载是自杀基因,所述自杀基因编码能够将无活性前药转化成细胞毒性药物的蛋白质,并且其中该试剂盒还包含用于与功能性核酸分子、载体或组合物一起施用的所述无活性前药。
根据另一方面,提供了治疗癌症的方法,其包括向患者施用本文所述的功能性核酸分子或组合物。
根据另一方面,提供了治疗胶质母细胞瘤的方法,其包括向患者施用功能性核酸分子和无活性前药,
其中所述功能性核酸包含由SOX转录因子激活的合成超级增强子和自杀基因,所述自杀基因编码能够将无活性前药转化为细胞毒性药物的蛋白质,并且
其中所述自杀基因在胶质母细胞瘤细胞中通过SOX转录因子激活合成超级增强子时表达。
在一个教导中,提供了治疗胶质母细胞瘤的方法,其包括向患者施用功能性核酸分子和无活性前药,
其中所述功能性核酸包含由SOX转录因子激活的超级增强子构建体和自杀基因,所述自杀基因编码能够将无活性前药转化为细胞毒性药物的蛋白质,并且
其中所述自杀基因在胶质母细胞瘤细胞中通过SOX转录因子激活超级增强子构建体时表达。
附图说明
图1:从SOX2 ChIP-Seq峰中鉴定出的候选全长增强子可以协同作用并具有选择性活性。(A)由mCMV和候选增强子驱动的构建体的示意图,由候选增强子270说明。当在mCMV上游时GSC7(B)或G328(C)中14个候选增强子的活性;提供全长CMV启动子作为阳性参考对照。(D)HEK293细胞中候选增强子的活性。(E)增强子270聚类的示意图。(F)当4×270个增强子聚集在一起时,增强子活性最高。(G)HEK293细胞中聚集的增强子构建体的活性。(H)区分GSC的选择性概述。(I)SSE-T4活性的流式细胞术(在图K中被称为‘4×Top4’)。(J)图(I)中评分的细胞中SSE-T4(本文也称为SSE-4)活性的活细胞图像。(K)用于测试多个增强子组合的构建体设计的示意图。(L)GSC7中荧光素酶测定中图K构建体的相对活性(未按比例)。配对双因素方差分析,*=p值≤0.05,**=p值≤0.01。每个点代表一个生物学重复。
图2:使用基于平板的荧光素酶报告基因测定阵列对阵列质粒文库(约4000个质粒)进行功能增强子筛选。(A)增强子筛选的实验概述。(B)增强子筛选的结果。(C)NanolucDLR测定中初始筛选的135个命中的验证。(D)大多数命中(比mCMV大10)位于内含子区域。(E)GSC7、(F)GSC328、(G)HEK293、(H)huFb710中前17个命中的mNGreen+细胞的百分比。(I)GSC7、(J)GSC328、(K)HEK293和(L)huFb170中mNGreen+细胞的MFI。
图3:去除限制性内切酶衔接子克隆位点的合成超级增强子的比较。(A)第二代合成超级增强子的设计概要-C1代表第2a代(974bp),Gb1代表第2b代(640bp);A=20bp衔接子,相邻白盒=90bp间隔区;n=3个生物学重复。注意:大小的明显差异是由于6×4bp克隆位点造成的,为简单起见,方案中未考虑该位点。(B)Nanoglo DLR测定以比较第2a代和第2b代合成超级增强子(分别去除和不去除克隆位点/衔接子)。(C)第2a代和第2b代合成超级增强子的mNGreen+细胞的百分比。(D)第2a代和第2b代合成超级增强子中mNGreen+细胞的MFI。(E)第2a代和第2b代合成超级增强子的代表性活细胞图像;20倍放大倍数,比例尺=50μm。
图4:SSE-7对GSC和前脑神经干细胞(NSC)具有选择性。(A)包含SSE的四部分组合的设计示意图(SSE-1到SSE-7;左侧数字)。(B)流式细胞术证实这些都具有与CMV相似水平的活性。(C)在HEK293细胞中,所有SSE均无活性。(D)在人成纤维细胞(huFb170)中,所有SSE均无活性。(E)使用5% FCS进行星形胶质细胞分化过程中SSE-7和对照的活细胞图像。(F)5% FCS中SSE-7和对照的mNGreen+细胞的百分比。(G)SSE-7的mNGreen+细胞的MFI,被归一化为第0天的CMV表达。(H)评估斑马鱼胚胎和幼虫中SSE-7的实验概述。(J)注射对照。(I)用于本实验的构建体的示意图。(K)受精后24小时和48小时(hpf)第2a代质粒C1、C3、C5和C7的活性(注:这些分别对应于后者的衍生物:SSE-1、3、5和7,并包含衔接子序列)。
图5:SSE-7驱动多种蛋白质表达的流式细胞术和蛋白质免疫印迹结果。(a)表达盒的示意图,说明多顺反子转录物(包括P2A自切割肽序列)中自SSE-7的mCherry和HSV-TKv5表达。(b)流式细胞术数据显示通过病毒递送(AAV)递送该核酸后的mCherry表达水平。(c)流式细胞术结果的定量,以评分阳性mCherry表达细胞的百分比,(d、e和f)显示门控策略。(g)蛋白质印迹证实HSV-TK蛋白质表达(使用融合的v5C-末端表位标签进行检测)。(h)(g)中蛋白质印迹结果的定量。
图6:MTT测定和活体Incucyte成像的细胞毒性结果。(a)在200μM GCV、0.2% DMSO(运载体对照)或20% DMSO(阳性对照)存在下,用CMV或SSE-7驱动的TKv5-P2A-mCherry转导或未转导的人GSC7细胞随时间的汇合度变化。(b)在所述条件下GSC7细胞中的MTT测定数据总结。每个点代表生物学重复。MTT值针对运载体对照进行归一化。误差棒代表SD(N=3)。(c)第3天和第8天的GSC7细胞的实时图像,显示在200μM GCV存在下用构建体转导的细胞中的细胞数量和形态变化。(d)第17天的huFB170细胞的实时图像,显示在200μM GCV存在下用构建体转导的细胞中的细胞数量和形态变化。(e)在所述条件下huFB170细胞中的MTT测定数据总结。每个点代表生物学重复。MTT值针对运载体对照进行归一化(N=1)。
图7:SSE-7在一系列GSC中的活性。(A)表达盒的示意图。(B)实验概述。(C)测试的多种细胞系中单个细胞的mCherry表达百分比结果。GSC7是测试的阳性对照细胞系(最初从中筛选片段)。E17、E28(以前称为G328)、E21、E31、E34是指另外五种源自患者的胶质母细胞瘤细胞系。
图8:SOX二聚体基序是活性的主要贡献者,并与SOX2和SOX9两者结合。(A)在我们的数据集中,通过MEME鉴定的SOX二聚体基序在前32个活性片段中富集。(B)来自TRANSFAC数据库的二聚体SOXE基序(Huang等,2015)。(C)通过HOMER在已知基序中发现的最强基序。(D)在我们的数据集中发现的SOX二聚体基序在缺乏转录活性的假定增强子中的映射。(E)将来自(A)的SOX二聚体基序映射到第一代筛选的前51个阳性命中证实该基序以更高的频率被发现。片段的活性显示在左侧。(F)用生物素化引物对DNA进行PCR扩增,并与核提取物孵育。通过质谱分析拉下(pulled down)的洗脱物以鉴定结合的蛋白质。(G)ID1101拉下的蛋白质概述(顶部圆圈代表所有人类转录因子)。SOX2是两个细胞系之间与ID1101相互作用的共有靶点。GSC7和GSC328的11个共有命中中有3个目的蛋白质(NOC2L和DMAP1,其都是组蛋白乙酰转移酶复合物的组分;TFIID,其是基础转录机器的关键组分);还分离出了几种SOX家族成员蛋白质。SOX2选择性地与(H)GSC7和(I)GSC328中的ID1101相互作用。(J)用于研究活性的野生型(WT)序列的SOX二聚体基序变体(S9D1-10)。WT序列包括为SEQ ID NO:83,S9D1-S9D2包括为SEQ ID NO:84-85,并且S9D6-S9D9包括为SEQ ID NO:86-89。(K)GSC7和(L)GSC328中SOX二聚体基序突变体的活性。(M)SOX9选择性地与ID1101和ID2904相互作用。序列599是随机DNA阴性对照。
图9:进行了富含SOX二聚体基序的增强子的第二代筛选,所述SOX二聚体基序具有与脑或神经胶质瘤相关表达的推定靶基因。(A)选择候选增强子用于筛选第二代。(B)SOX二聚体基序。(C)第一和(D)第二次筛选,以基于SOX二聚体基序和候选靶基因鉴定活性增强子。(E)第二代SSE的组装和随后使用报告基因测定进行测量的示意图。(F)在(F)GSC7和(G)huFb170中209个第二代SSE上的筛选。
图10:使用双有效负载使用示例性SSE-7观察到显著的存活和肿瘤清除。细胞毒性和免疫调节有效负载的GBM干细胞选择性表达证明了体内肿瘤细胞选择性清除的概念验证。(A)AAV设计的示意图,其中SSE-7驱动细胞毒性酶/前药有效负载(HSV-TK)与免疫刺激细胞因子IL-12的双重表达。这些是在SSE-7控制的单个顺反子(通过P2A)上生成的,确保组合表达。(B)Kaplan-Meier生存曲线证明使用SSE-7的基因治疗的显著存活优势和经治疗的小鼠的长期生存能力和无毒性。(C和D)活体小鼠的生物发光成像能够追踪肿瘤生长。(C)在具有免疫功能的GBM小鼠模型中,肿瘤生长迅速,并在3-4周内杀死小鼠。(D)如果通过直接注射具有SSE驱动的有效负载的AAV来治疗肿瘤,则肿瘤在几周内完全消失,其在(C)中显示的所有未治疗对照小鼠已死于大肿瘤后大于5周没有可检测到的肿瘤细胞。
图11:SSE活性不需要mCMV启动子。(A)用于探索与SSE相连的mCMV启动子的要求的载体设计示意图,其中mCMV被随机DNA序列取代。(B)对有和没有mCMV的SSE进行流式细胞术分析,证实SSE仍然具有功能并且高度活跃。(C)用于探索随机DNA序列的要求的载体设计示意图,用作将SSE定位在转录起始位点上游的间隔区。(D)活性的流式细胞术分析证实,在没有额外的随机序列进行定位的情况下,SSE仍然可以发挥作用,但活性水平降低。
图12:患者GSC之间SSE-7活性的变异性与神经元分化标志物(例如NEUROG2)的水平相关。本文公开的SSE构建体对于未成熟GBM干细胞样细胞具有高度特异性。SSE的活性随着细胞开始进入可选分化途径(例如NEUROG2驱动的神经元分化或SOX10驱动的少突胶质细胞分化)而降低。(A)火山图显示通过SSE-7-mCherry报告基因高和低细胞的RNA-seq分析鉴定的差异表达基因。表达较低的细胞富含关键转录因子的表达,这些转录因子标志着从干细胞状态退出进入分化。相反,表达最高的细胞具有增加水平的SOX1,其与SOX2关系最密切。(B)(A)中前50个差异表达基因的RNA-seq基因表达模式热图。箭头注释NEUROG2。
图13:一系列第二代SSE在小鼠GSC中均表现出活性。通过流式细胞术评估包含富含SOX基序和SOX二聚体基序的增强子片段的SSE的活性,证实这些都可以在GSC中驱动高水平的表达(与全长CMV相当)。
图14:示例性SSE-7在与慢病毒一起使用时也具有良好的活性。用带有SSE-7-mCherry报告基因的慢病毒转导的GSC中mCherry报告基因水平的流式细胞术定量。用具有SSE-7的慢病毒可实现高水平表达,这证明可以使用广泛的病毒载体(分别使用(A)和(B)中的两种不同的GSC患者系E31和E55)来递送转基因。
发明详述
本公开涉及新型(合成)超级增强子(S)SE)并提供了递送转基因(例如治疗和不利有效负载)的创新方式。基于细胞类型特异性基因调节知识的进步,发明人推断,通过人工(或合成)组装增强子来产生SSE是可能的,这些增强子在全长增强子内保留核心功能元件和转录因子基序。这可能包括利用这些增强子中直接转录因子基序周围的天然和功能性侧翼序列。该策略旨在使得能够保留关键细胞类型特异性TF的天然局部转录因子(TF)结合环境(低亲和力和适当的间隔),但促进高浓度的TF结合以触发强转录,即捕获细胞类型特异性增强子内TF基序的适当语法(共结合蛋白的间距、亲和力和方向),但通过在多部分阵列中组合来提高转录活性。如本文所述,发现使用功能注释的增强子的组合组装来构建SSE,产生强但是高度细胞类型选择性的调节元件,其将具有许多应用,最显著的是在基因治疗中。
合成超级增强子
根据第一方面,提供了由一个或多个转录因子激活的超级增强子,其中所述超级增强子包含源自不同基因组基因座的两个或多个增强子序列,其中每个增强子序列包含所述转录因子的结合位点。在另一教导中,提供了由一个或多个转录因子激活的合成超级增强子,其中所述合成超级增强子包含源自不同基因组基因座的两个或多个增强子序列,其中每个增强子序列包含转录因子的结合位点以及存在于其基因组基因座中的转录因子的结合位点上游和/或下游的20至400个核苷酸。在另一教导中,提供了由一个或多个转录因子激活的超级增强子构建体,其中所述超级增强子构建体包含源自不同基因组基因座的两个或多个增强子序列,其中每个增强子序列包含转录因子的结合位点。
如本文所用,“增强子”是指与蛋白质(例如,转录因子)结合以增强基因转录的DNA序列(例如“增强子序列”)。术语“增强子”可能包含DNA的特定短区域(通常为50-1500bp),该区域与例如转录因子结合。然而,增强子序列还可以包含位于直接转录因子基序侧翼或周围的部分序列。增强子通常作为顺式调节元件,但也可以反式起作用,并且可以激活多于一个的靶基因。由于DNA折叠和构象或通过促进多分子区室(称为转录中心或缩合物,其可能通过相分离形成),它们可以位于远离受调节基因的转录起始位点(TSS)的位置。相反,启动子位于靠近转录起始位点的相同DNA序列上的TSS上游。启动子将结合RNA聚合酶II以启动转录。
H3K27Ac是增强子中常见的组蛋白修饰并可用于预测增强子活性区域。可以使用本领域已知的方法,最通常使用基于质粒的报告测定法来确定序列是否增强基因转录(并且因此可以被称为“增强子”)。
超级增强子还参与转录的激活或调节。实际上,术语“超级增强子”是指含有多个增强子簇的序列,通常跨越5-15kb的区域。与普通增强子相比,这些“超级增强子”被转录共激活子(例如介体复合物)高度占据。它们表现出比普通增强子更大的活性,并且经常参与驱动涉及维持细胞身份或疾病状态的细胞类型特异性基因的表达(参见,例如,US2014/0296218和US2014/0287932,其以其整体通过引用并入本文)。应当理解,本文提及的“超级增强子”、“合成超级增强子”(或“SSE”)或超级增强子构建体是指在自然界中未发现的超级增强子,即为本文所述目的设计的人工构建的超级增强子,其可以表现出与天然超级增强子相关的特征。具体地,SSE是包含两个或多个增强子序列(其可以源自不同基因组基因座)的人工构建体。再次,为了避免疑问,术语“SSE”将用于涵盖本文描述的任何超级增强子、合成超级增强子和/或超级增强子构建体。SSE可能高度富集转录因子基序以刺激转录激活。这使得SSE序列能够比天然超级增强子短,因为与SSE结合的高浓度转录因子可促进转录活性。
在一个实施方案中,本公开提供了通过将转基因与由靶细胞中表达的转录因子或转录因子的独特组合激活的SSE偶联来递送转基因的创新方式。因此,靶细胞中转录因子的内源表达用于以高度选择性的方式启动外源转基因的表达。优选地,转录因子具有细胞类型或谱系特异性的表达模式,因此在除靶细胞之外的细胞中最低程度地表达,即,它不是普遍表达的。这使得细胞类型或细胞状态能够选择性激活SSE,并表达转基因,从而使脱靶毒性最小化。在一个实施方案中,转录因子在靶细胞中差异表达,即与其他细胞类型相比。SSE的使用还提供了转基因的高表达,优选接近或等同于使用强启动子,例如全长巨细胞病毒(CMV)启动子时转基因的表达。SSE选择性高、强且尺寸可能较小(优选小于500个碱基对)。这些为相关开放阅读框/转基因的基因表达提供了从最小表达到非常强表达的“开关”,其具体取决于细胞类型身份或状态。
增强子和超级增强子功能可能涉及启动子的存在,例如最小启动子(例如最小CMV),其含有关键区域以促进转录机器招募并且通常含有TSS。在可选实施方案中,本公开的SSE可以不包含启动子和/或最小CMV启动子。
如本文所用,术语“转录因子”是指与靶基因的调节元件结合以调节,例如增加或减少靶基因的表达的蛋白质。转录因子(TF)通常根据TF中存在的DNA结合结构域的类型进行分组。在真核生物中,最常见的DNA结合结构域是锌指、同源结构域、碱性亮氨酸拉链和碱性螺旋-环-螺旋结构域。具有相同DNA结合结构域的TF旁系同源物通常识别相似的DNA序列。本文所述的合成超级增强子可以与一个或多个转录因子结合,即一个或多个转录因子与SSE结合,其导致激活。激活通过招募RNA聚合酶II而发生,并从而激活相关基因(即转基因)的表达,将转录增强至单独启动子的表达水平以上。转录因子与SSE的结合可能包括相关的转录和染色质调节机器。
在一个实施方案中,转录因子是发育或干细胞隶属转录因子。这些类型的转录因子与干细胞或细胞发育过程中的高水平激活相关。
在一个实施方案中,转录因子是SOX家族的转录因子。SOX(SRY相关HMG盒)转录因子基因家族在人和小鼠基因组包含20个成员,并且全部共有高迁移率组(HMG)盒结构域。将具有高同源性的SOX家族成员分为以下几组:(SoxA、SoxB1、SoxB2、SoxC、SoxD、SoxE、SoxF、SoxG和SoxH)。在一个实施方案中,转录因子是SoxB1(即SOX1、SOX2、SOX3)或SoxE(即SOX8、SOX9、SOX10)转录因子。
SOX2已成为癌症干细胞的关键调节子(Bulstrode等,2017,Gangemi等,2009,Guerra-Rebollo等,2019,Lujan等,2012,D.K.Singh等2017,S.K.Singh等,2004,和Boumahdi等2014)。Suvà等,2014已经报道了胶质母细胞瘤干细胞(GSC)及其分化后代的ChIP-seq数据集,Suvà等对GSC特有的组蛋白H3增强子标记(H3K27ac)标记和SOX2结合进行了记载。具体地,本发明人已经鉴定了在不同患者来源系的GSC中起作用的一组候选SOX2调节增强子。因此,在一个实施方案中,转录因子是SOX2。
转录因子通过转录因子的DNA结合结构域与靶增强子中的特定基序(即转录因子结合位点)结合。通常,转录因子结合位点序列为5-15bp长。
在一个实施方案中,合成超级增强子(SSE)包含至少一种SOX二聚体基序。此类基序对于靶细胞中SSE的功能可能很重要,例如本文描述的许多增强子序列显示含有在胶质母细胞瘤干细胞中保留活性所需的SOX二聚体位点。增强子元件可以含有SOX结合位点(有时是回文序列),其中SOX转录因子可以同源或异源二聚化(heterodimerise)。通常,每个单体结合基序之间的间距约为8-12bp。
在一个实施方案中,SOX二聚体基序包含SEQ ID NO:1:
ACAAAGRGSVBYTKK
其中:
R代表A或G;S代表C或G;V代表A、C或G;B代表C、G或T;Y代表C或T;K代表G或T。
在另一实施方案中,SOX二聚体基序包含SEQ ID NO:2:
RRRRASARAGRRRBBHDDBWH
其中:
R代表A或G;S代表C或G;B代表C、G或T;H代表A、C或T;D代表A、G或T;W代表A或T。
在一个实施方案中,合成超级增强子包含至少一种SOX基序。在另一实施方案中,SOX基序是SOX2基序。
在一个实施方案中,SOX2基序包含SEQ ID NO:3:
WSARAGRSMYMHTBB其中:
W代表A或T;S代表C或G;R代表A或G;M代表A或C;Y代表C或T;H代表A、C或T;B代表C、G或T。
在一个实施方案中,其中合成超级增强子包含选自以下的序列:SOX基序和/或SOX二聚体基序。
如本文所解释的,超级增强子是指增强子序列簇。因此,在一个实施方案中,合成超级增强子包含两个或多个增强子序列。在另一实施方案中,合成超级增强子包含两个至八个增强子序列。在又一实施方案中,合成超级增强子包含四个增强子序列。
可以使用本领域已知的技术来鉴定增强子元件。例如,本文描述的方法使用特定细胞类型的ChIP-seq数据集来鉴定由目的转录因子结合的增强子或使用染色质可及性测定(例如ATAC-seq或MNase分析)。公开可用的资源可用于帮助对多种生物体和细胞类型中的活性增强子进行全基因组鉴定,例如ENCODE或The Cancer Genome Atlas(TCGA)数据集。
优选地,SSE中存在的增强子序列并不全部具有相同的序列(即,SSE不是相同增强子元件的多联体)。因此,在一个实施方案中,SSE包含至少两个不同的增强子序列。在一个实施方案中,每个增强子序列具有不同的序列。在一个实施方案中,每个增强子序列由相同的转录因子激活。
本文呈现的数据显示,将源自不同基因组基因座的增强子组装成4部分阵列(约640bp)令人惊讶地导致其活性增加几个数量级,而不会影响选择性。因此,SSE中使用的每个增强子序列可能源自不同的基因。在另一实施方案中,每个增强子序列源自不同的基因组基因座。这些增强子序列仍然优选地全部由共同转录因子或细胞类型隶属转录因子组激活。在一个实施方案中,每个增强子序列被转录因子激活并且源自不同的基因组基因座。在一个实施方案中,合成的超级增强子包含源自不同基因组基因座的两个或多个增强子序列,例如四个增强子序列。
在一个实施方案中,每个增强子序列包含转录因子的结合位点以及存在于其基因组基因座中的转录因子的结合位点上游和/或下游20至400个核苷酸。这允许转录因子结合位点周围的环境(即直接上游和/或下游)包括在增强子序列中,并因此保留增强子功能。通常存在于保留间隔、顺序、方向和/或亲和力的天然增强子序列中的上游和/或下游序列可用于招募协同转录因子和辅助因子。此外,转录因子结合基序周围的序列环境可能促进结合并协同作用以提高转录效率。本领域技术人员将能够从公开可用的基因组数据库中鉴定/获得目的结合位点上游和/或下游20至400个核苷酸的序列。同一技术人员可以通过功能分析,例如本文所述的报告基因测定或本领域广泛采用的其他方法确定转录因子活性。在一个实施方案中,每个增强子序列包含转录因子的结合位点及其基因组基因座中存在的转录因子的结合位点上游和/或下游20至400个核苷酸,其中所述上游和/或下游序列足以确保增强子保留其功能。在另一实施方案中,增强子序列包含转录因子结合位点上游和/或下游20至400个核苷酸,例如转录因子结合位点上游和/或下游20至300个核苷酸,或优选转录因子结合位点上游和/或下游20至200个核苷酸。在另一实施方案中,增强子序列包含转录因子结合位点上游和/或下游50至400个核苷酸,例如转录因子结合位点上游和/或下游50至300个核苷酸或优选转录因子结合位点上游和/或下游50至200个核苷酸。在另一实施方案中,增强子序列包含转录因子结合位点上游和/或下游80至400个核苷酸,例如转录因子结合位点上游和/或下游80至300个核苷酸或优选转录因子结合位点上游和/或下游80至200个核苷酸。
在一个实施方案中,合成超级增强子内的每个增强子序列小于500个核苷酸长,例如小于450、400、350、300、250或200个核苷酸长。在另一实施方案中,SSE内的每个增强子序列小于300个核苷酸长。在一个实施方案中,合成超级增强子内的每个增强子序列为20至500个核苷酸长,例如50至250个核苷酸长或100至200个核苷酸长。
应当理解,这些实施方案可以组合。因此,在另一实施方案中,增强子序列包含转录因子结合位点上游和/或下游20至400个核苷酸,其中所述增强子序列小于500个核苷酸长。在又一个实施方案中,增强子序列包含转录因子结合位点上游和/或下游20至200个核苷酸,其中所述增强子序列小于300个核苷酸长。
在另一实施方案中,SSE内的每个增强子序列约160个核苷酸长。具体地,选择160个碱基对(bp),因为这为核小体结合提供了足够的大小,并且被认为是功能增强子内语法进化的重要属性。此外,160bp是合成混合(pooled)寡核苷酸文库的合适大小,所述寡核苷酸文库包含20bp末端,用于随后构建阵列质粒文库。
在一个实施方案中,合成超级增强子小于2000个核苷酸长。在另一实施方案中,合成超级增强子小于1500个核苷酸长,例如小于1400、1300、1200、1100、1000、950、900、850、800、750或700个核苷酸长。在一个实施方案中,合成超级增强子小于1200个核苷酸长。在另一实施方案中,合成超级增强子小于700个核苷酸长。优选地,合成超级增强子小于650个核苷酸长,例如640个核苷酸长。
本文描述的基序可以存在于SSE的一个或多个增强子中(例如,参见图8E)。因此,在一个实施方案中,一个或多个增强子包含选自以下的序列:SOX基序和/或SOX二聚体基序。
在一个实施方案中,合成超级增强子内的每个增强子序列包含SOX基序,例如SOX2基序。在一个实施方案中,合成超级增强子内的每个增强子序列包含SOX二聚体基序。
在一个实施方案中,合成超级增强子由SOX2激活,其中所述合成超级增强子包含源自不同基因组基因座的四个增强子序列,并且其中每个增强子序列包含至少一个SOX二聚体基序和/或至少一个SOX二聚体基序。在一个实施方案中,合成超级增强子由SOX2激活,其中所述合成超级增强子包含源自不同基因组基因座的四个增强子序列,并且其中每个增强子序列包含至少一个SOX2基序。在一个实施方案中,合成超级增强子由SOX2激活,其中所述合成超级增强子包含源自不同基因组基因座的四个增强子序列,并且其中每个增强子序列包含至少一个SOX二聚体基序。
在一个实施方案中,所述一个或多个增强子序列包含与选自SEQ ID NO:4-63的序列具有至少80%序列同一性的序列(表1)。在另一实施方案中,一个或多个增强子序列包含与选自SEQ ID NO:4-13和56-63的序列具有至少80%序列同一性的序列。在又一个实施方案中,一个或多个增强子序列与选自SEQ ID NO:4-63(例如SEQ ID NO:4-13和56-63)的序列具有至少85%、90%、95%、97%、99%序列同一性或100%同一性。。本文所述的增强子序列(即表1)可以通过至少一个(例如少于20个、少于10个、少于5个)核苷酸取代、缺失或添加进行修饰,其中所述变体增强子序列基本上保留了序列的功能特征。应当理解,本文提供的增强子序列的变体仍然旨在保留所述增强子序列的功能活性。例如,实施例4显示,当使用Nanoglo DLR测定进行测试时,所述增强子序列比mCMV增加了10倍以上。因此,包括在该范围内的变体增强子序列不应具有低于起始序列活性75%的活性。
在一个实施方案中,合成超级增强子包含表1中呈现的一个或多个增强子序列。因此,SSE可包含选自SEQ ID NO:4-63的一个或多个增强子序列。本文呈现了这样的数据,其显示这些增强子序列在多部分阵列中的排列可以增加转录活性,而不损害细胞特异性。在另一实施方案中,合成超级增强子包含选自表1中呈现的序列的1至8个、2至6个、或3至5个增强子序列。在又一实施方案中,合成超级增强子包含选自表1中呈现的序列的四个增强子序列。
在一个实施方案中,SSE包含选自SEQ ID NO:4-36的一个或多个增强子序列。在可选实施方案中,SSE包含选自SEQ ID NO:37-63,更优选SEQ ID NO:54-63的一个或多个增强子序列。
在一个实施方案中,SSE包含选自SEQ ID NO:4-13和54-63的一个或多个增强子序列。
在另一实施方案中,SSE包含选自SEQ ID NO:4-36,例如4-13,特别是4-8的四个增强子序列。在可选实施方案中,SSE包含选自SEQ ID NO:37-63的四个增强子序列,优选选自SEQ ID NO:54-63的四个增强子序列,更优选选自SEQ ID NO:56-63的四个增强子序列。
SSE可以包含如表2中所述的序列。在一个实施方案中,合成超级增强子包含与选自SEQ ID NO:64-80的序列具有至少80%序列同一性的序列。在另一实施方案中,所述序列与选自SEQ ID NO:64-80的序列具有至少85%、90%、95%、97%、99%序列同一性或100%同一性。在又一个实施方案中,SSE包含SEQ ID NO:70。本文提供的序列的变体仍旨在保留所述SSE的功能活性,即在转录因子激活SSE时转基因表达。
为了比较两个密切相关的多核苷酸序列的目的,第一核苷酸序列和第二核苷酸序列之间的“%序列同一性”可以使用NCBI BLAST v2.0,使用核苷酸序列的标准设置(BLASTN)来计算。为了比较两个密切相关的多肽序列的目的,第一多肽序列和第二多肽序列之间的“%序列同一性”可以使用NCBI BLAST v2.0,使用多肽序列的标准设置(BLASTP)来计算。
如果多肽或多核苷酸序列在其整个长度上具有100%的序列同一性,则认为它们与其他多肽或多核苷酸序列相同或“同一”。序列中的残基从左到右编号,即对于多肽,从N-末端到C-末端;对于多核苷酸,从5'至3'末端。
序列之间的“差异”是指与第一序列相比,第二序列的位置中单个氨基酸残基或核苷酸的插入、缺失或取代。两个多核苷酸序列可以含有一个、两个或多个这样的核苷酸差异。两个多肽序列可以含有一个、两个或多个这样的氨基酸差异。在其他方面与第一序列相同(100%序列同一性)的第二序列中的插入、缺失或取代产生降低的%序列同一性。
或者,为了将第一参考序列与第二比较序列进行比较的目的,可以确定为产生第二序列而对第一序列进行的添加、取代和/或缺失的数量。“添加”是将一个氨基酸残基/核苷酸添加到第一序列中(包括在第一序列的任一末端处的添加)。“取代”是用一个不同的氨基酸残基/核苷酸取代第一序列中的一个氨基酸残基/核苷酸。对于多肽序列,取代可以是保守的或非保守的。在多核苷酸序列的背景下,取代可以是同义的或非同义的。“缺失”是从第一序列中缺失一个氨基酸残基/核苷酸(包括在第一序列的任一末端处的缺失)。
在一个实施方案中,合成超级增强子另外包含转录调节子,即控制基因表达的序列(或编码蛋白质的序列)。
根据另一方面,提供了由SOX家族的一个或多个转录因子激活的合成超级增强子,其中所述合成超级增强子包含两个或多个增强子序列和至少一个SOX基序和/或SOX二聚体基序。应当理解,本文描述的适用于功能性核酸分子的合成超级增强子的实施方案也适用于该方面。
根据另一方面,提供了由SOX2激活的合成超级增强子,其中所述合成超级增强子包含源自不同基因组基因座的四个增强子序列,并且其中每个增强子序列包含至少一个SOX基序和/或SOX二聚体基序。
功能性核酸分子
SSE可以存在于包含形成功能性核酸分子的额外元件的构建体中。因此,根据另一方面,提供了功能性核酸分子,其包含与转基因可操作地连接的本文所述的合成超级增强子。
根据另一方面,提供了功能性核酸分子,其包含由靶异常细胞中表达的一个或多个转录因子激活的合成超级增强子和不利的有效负载,其中所述有效负载在转录因子激活合成超级增强子时表达。
功能性核酸分子可以包含SSE和转基因的额外组分。例如,合成的超级增强子可以可操作地连接至启动子。合适的启动子是本领域已知的。在一个实施方案中,启动子是最小CMV启动子。在一个教导中,SSE可以不与启动子可操作地连接。在可选实施方案中,可操作地连接至超级增强子的启动子不是最小CMV启动子。
转基因
如本文所述,SSE可用于增强转基因的表达。在一个实施方案中,转基因可以是用于在细胞中表达的外源序列。在一个教导中,转基因是编码可用于生物学和医学的产物的序列,例如预防性或治疗性转基因,例如蛋白质或非蛋白质编码寡核苷酸。因此,转基因可以编码治疗有效负载。例如,治疗有效负载可以包括:治疗性蛋白质,例如抗原、抗体、细胞因子(例如,以诱导免疫原性应答)、肿瘤抑制蛋白(例如,天然/未突变的p53)、分化因子(即,以调节或重编程细胞命运或身份),或具有核酸编辑或基因活性调节功能(例如DNA或RNA编辑,或转录调节)或以其他方式改变细胞表型(例如运动性、ECM产生、细胞衰老或静止)的蛋白质。在可选实施方案中,转基因编码非蛋白质编码寡核苷酸,例如RNA(除mRNA之外),例如miRNA、siRNA、shRNA或IncRNA。应当理解,编码非编码RNA的转基因可用于基因沉默方法中。
在一个实施方案中,功能性核酸分子包含一个或多个转基因。因此,本领域技术人员应当理解,可以包括不同的转基因组合。
根据另一方面,提供了在靶细胞中表达转基因的方法,其包括表达可操作地连接至本文所述的合成超级增强子的转基因,其中一个或多个所述转录因子在靶细胞中表达。
不利的有效负载
如本文所述,可操作地连接至SSE的转基因可以编码不利的有效负载。本文使用的术语“不利有效负载”是指对靶细胞具有负面影响的有效负载。负面影响可以是例如对细胞的健康或活力和/或细胞分裂能力的负面影响。不利影响可以直接实现(例如转基因编码对细胞有害的物质,例如促凋亡基因或自杀基因)或间接实现(例如转基因编码招募对细胞引起有害影响的外部因子的物质)。
不利的有效负载可用于刺激对靶细胞具有负面影响的免疫应答。例如,这种反应可能会改变局部免疫微环境。在一个实施方案中,不利的有效负载编码刺激免疫应答的蛋白质,其导致细胞毒性免疫细胞的激活。在一个实施方案中,不利的有效负载选自:趋化因子、细胞因子、抗体或其他免疫调节蛋白。在另一实施方案中,不利的有效负载是促炎细胞因子,例如选自以下的细胞因子:IL-12、IL-10、IL-2、IFN-α和GM-CSF。例如,不利的有效负载可以是细胞因子,例如IL-12,其已显示具有抗癌活性。IL-12通过以下引起IFN-引产生的诱导:静息和激活的CD4+T细胞、CD8+T细胞和自然杀伤(NK)细胞,以及增强激活的T和NK细胞的增殖,增加NK/淋巴因子激活的杀伤细胞的裂解活性,并促进特异性细胞毒性T淋巴细胞(CTL)反应。然而,由于过度毒性,IL-12不能作为全身治疗施用,因此仅在靶细胞内进行表达的靶向治疗将能够递送该有效负载。
“免疫应答”是免疫系统的至少一种细胞、或一种细胞类型、或一种内分泌途径、或一种外分泌途径的可测量的变化(包括但不限于细胞介导的反应、体液反应、细胞因子反应、趋化因子反应)。
“免疫细胞”被定义为免疫系统的细胞,包括但不限于CD34+细胞、B细胞、CD45+(淋巴细胞共同抗原)细胞、αβT细胞、细胞毒性T细胞、辅助T-细胞、浆细胞、中性粒细胞、单核细胞、巨噬细胞、树突状细胞、吞噬细胞、粒细胞、先天淋巴细胞、自然杀伤(NK)细胞和γδT细胞。通常,借助组合细胞表面分子分析(例如,通过流式细胞术)对免疫细胞进行分类,以鉴定或分组或聚类以将免疫细胞分化为亚群。在有效负载为不利有效负载的本公开的分子和方法中,刺激的免疫应答旨在对靶细胞产生不利影响。提及“细胞毒性免疫细胞”是指导致细胞死亡的免疫细胞,特别是细胞毒性T细胞(也称为杀伤性T细胞)。
在一个实施方案中,不利有效负载编码细胞毒性物质(即细胞毒性有效负载)。
在一个实施方案中,不利有效负载是自杀基因。自杀基因是表达引起细胞死亡的蛋白质的基因。或者,自杀基因可能需要外部提供的辅助因子或辅助药物(例如前药)以发挥作用。然后辅助因子或辅助药物可以被自杀基因的产物转化为细胞毒性实体。在一个实施方案中,自杀基因编码能够将无活性前药转化为细胞毒性药物的蛋白质。无活性前药可以与功能性核酸分子同时或依次施用。
在一个实施方案中,自杀基因是单纯疱疹病毒胸苷激酶(HSV-TK)。具体地,HSV-TK基因与前药、更昔洛韦(GCV)或其类似物例如阿昔洛韦和伐昔洛韦组合使用。在可选实施方案中,自杀基因是胞嘧啶脱氨酶(CD)。特别地,CD基因与前药5-氟胞嘧啶(5FC)组合使用。
靶细胞
本文描述的功能性核酸分子可用于靶向多种细胞类型。具体地,细胞是哺乳动物细胞,例如人细胞。本公开可以包括不利有效负载的存在,因此适合于靶异常细胞(即异常细胞,例如不健康细胞)。
异常细胞可以是过度增殖细胞,即过度、异常增殖的细胞。在一个实施方案中,异常细胞是癌细胞或肿瘤细胞。在该实施方案中,不利有效负载可以是抗癌有效负载。
SOX2也可能在其他异常细胞,特别是癌细胞中扩增,因为它已被鉴定为癌基因。可以使用本公开的方法靶向的其他异常细胞的实例包括肺和食道的鳞状细胞癌以及许多其他细胞癌。
在一个实施方案中,异常细胞是选自以下的癌细胞:胶质母细胞瘤干细胞、神经胶质瘤细胞、肺癌细胞(特别是鳞状肺癌细胞)、食道癌细胞、卵巢癌细胞、乳腺癌细胞、口腔癌细胞(例如口、舌、咽)、胃癌细胞、小肠癌细胞、结直肠癌细胞、直肠癌细胞、肝癌细胞、胆管癌细胞、胆囊癌细胞、胰腺癌细胞、骨癌细胞(例如骨肉瘤)、皮肤癌细胞、子宫癌细胞、前列腺癌细胞、睾丸癌细胞、膀胱癌细胞、肾癌细胞、视网膜癌细胞、甲状腺癌细胞、淋巴瘤细胞、骨髓瘤细胞或白血病细胞。
在具体的实施方案中,异常细胞是胶质母细胞瘤干细胞。胶质母细胞瘤是神经胶质瘤的侵袭性形式,由主调节神经干细胞相关转录因子的升高水平/活性驱动。胶质母细胞瘤干细胞(GSC)通常具有关键神经发育转录因子(包括SOX2,其是神经干细胞身份所需的关键主调节子和重编程因子)的升高表达或活性(Bulstrode等2017,Gangemi等2009,Guerra-Rebollo等2019,Lopez-Bertoni等2015,和MacLeod等2019),GSC中SOX2的敲低降低了其致瘤性(Gangemi等2009),而它的异位表达与POU3F2、OLIG2和SALL2一起强制进入GSC状态(Suvà等2014)。本文呈现的实施例显示GSC选择性SSE保留了腺相关病毒(AAV)中的活性并用于驱动细胞毒性有效负载的表达以靶向杀死GSC。此外,SSE的活性在GSC分化过程中消失,并且在HEK或成纤维细胞中不存在。因此,即使启动子的强度已大幅增加,GSC选择性表达仍得以保留。
载体
根据另一方面,提供了包含本文所述的合成超级增强子或功能性核酸分子的载体。
本文所用的术语“载体”意指能够运输功能性核酸分子的分子。载体的一种类型是“质粒”,它是指可以其中连接额外DNA区段的环状双链DNA环。另一种类型的载体是病毒载体,其中额外的DNA区段可以连接到病毒基因组中。某些载体能够在它们所引入的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和游离型哺乳动物和酵母载体)。其他载体(例如非游离型哺乳动物载体)可以在引入宿主细胞后整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够指导它们可操作地连接的基因的表达。此类载体在本文中称为“重组表达载体”(或简称为“表达载体”)。一般而言,重组DNA技术中有用的表达载体通常是质粒的形式。
示例性表达载体是本领域已知的并且可以包括例如质粒载体、病毒载体(例如腺病毒、腺相关病毒、逆转录病毒或慢病毒载体)、噬菌体载体、粘粒载体等。表达载体的选择可以取决于待使用的宿主细胞的类型和使用目的。
在一个实施方案中,载体是病毒载体。病毒载体,特别是用于基因治疗应用的那些病毒载体是本领域众所周知的。此类病毒可以是具有单链(ss)或双链(ds)基因组的RNA和DNA病毒。例如,病毒载体包括但不限于腺病毒、腺相关病毒(AAV)、甲病毒、黄病毒、单纯疱疹病毒(HSV)、麻疹病毒、弹状病毒、逆转录病毒、慢病毒、新城疫病毒(NDV)、痘病毒和小核糖核酸病毒。插入容量和趋向性可能不同,因此可以基于预期应用选择病毒载体。
AAV载体作为最佳基因治疗病毒载体越来越受青睐,因为这些具有提高的安全性。然而,其局限性在于其货物尺寸较小。本文描述的SSE 4部分组件非常适合AAV。因此,在一个实施方案中,载体是AAV。不同的AAV血清型其趋向性不同,因此可以根据靶组织的类型选择所使用的AAV载体类型。AAV载体可以选自本领域已知的许多血清型,例如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或AAV11中的任一种,或者可以是非天然的变体。在一个实施方案中,AAV选自:AAV1、AAV2或AAV5。
根据另一方面,提供了载体,其包含本文所述的合成超级增强子和转基因(即有效负载,例如治疗有效负载)。如本文所述,合成的超级增强子可以可操作地连接至其他表达元件,例如启动子。
组合物和试剂盒
本公开还涉及包含本文所述的功能性核酸分子或载体的组合物。该组合物可以包含能够通过病毒载体(AAV、慢病毒等)和非病毒载体(纳米颗粒、脂质颗粒等)递送所述功能性核酸分子的组分。
根据另一方面,提供了包含本文所述的合成超级增强子、功能性核酸分子或载体以及可接受的运载体的组合物。合适的运载体是本领域已知的。在某些实施方案中,基于其促进用一个或多个功能性核酸分子转染靶细胞的能力来选择运载体。
根据另一方面,提供了包含本文所述的功能性核酸分子或载体的组合物,用于治疗。
根据另一方面,提供了包含本文所述的功能性核酸分子或载体的组合物,用于治疗癌症。
根据另一方面,提供了如本文所定义的功能性核酸分子(或载体或组合物)用于制备药物,特别是用于治疗癌症的药物的用途。
根据另一方面,提供了包含如本文所述的功能性核酸分子的试剂盒,其中不利有效负载是自杀基因,所述自杀基因编码能够将无活性前药转化为细胞毒性药物的蛋白质。因此,在这个方面,试剂盒额外包含无活性前药(即用于与功能性核酸分子一起施用)。
治疗方法
根据另一方面,提供了治疗疾病的方法,其包括向患者施用根据本文所述的功能性核酸分子、载体或组合物。
提及“受试者”、“患者”或“个体”是指待治疗的受试者,特别是哺乳动物受试者。哺乳动物受试者包括人类、非人类灵长类动物、农场动物(例如牛)、运动动物或宠物动物,例如狗、猫、豚鼠、兔、大鼠或小鼠。在一些实施方案中,受试者是人类。在可选实施方案中,受试者是非人类哺乳动物,例如小鼠。
如本文所用,“治疗”疾病或病症意指降低受试者所经历的疾病或病症的至少一种体征或症状的频率和/或严重性。
在一个实施方案中,疾病是癌症。本文所用的“癌症”是指细胞的异常生长或分裂。一般来说,癌细胞的生长和/或寿命超过其周围正常细胞和组织的生长和/或寿命,但与其不协调。癌症可以是良性的、恶性前期的或恶性的。癌症也可以是原发性癌症或继发性癌症。原发性癌症是其中癌症开始的原始器官或组织,而继发性癌症是原发性癌症扩散(或转移)到身体其他部位的结果。
癌症发生在多种细胞和组织中,包括口腔(如口、舌、咽)、消化系统(如食道、胃、小肠、结肠、直肠、肝脏、胆管、胆囊、胰腺)、呼吸系统(如喉、肺、支气管)、骨骼、关节、皮肤(如基底细胞、鳞状细胞、脑膜瘤)、乳房、生殖系统(如子宫、卵巢、前列腺、睾丸)、泌尿系统(如膀胱、肾、输尿管)、眼、神经系统(如脑)、内分泌系统(如甲状腺)、造血系统(如淋巴瘤、骨髓瘤、白血病、急性淋巴细胞白血病、慢性淋巴细胞白血病、急性粒细胞白血病、慢性粒细胞白血病)。
在另一实施方案中,癌症是位于脑或脊髓(即中枢神经系统)中的癌症,例如位于中枢神经系统中的原发性或继发性癌症。本公开特别适用于治疗胶质母细胞瘤。
功能性核酸分子(或载体或组合物)可以通过用于预期治疗的任何合适的递送方式来施用,例如静脉内、动脉内、心内、皮内、皮下、腹膜内、肌内或口服。在一个实施方案中,功能性核酸分子、载体或组合物被全身施用。施用也可以直接针对疾病部位。因此,在一个实施方案中,功能性核酸分子、载体或组合物被局部施用,例如通过肿瘤内直接施用到器官或组织中。
根据另一方面,提供了治疗胶质母细胞瘤的方法,其包括向患者施用功能性核酸分子和无活性前药,
其中所述功能性核酸包含由SOX转录因子激活的合成超级增强子和编码能够将无活性前药转化为细胞毒性药物的蛋白质的自杀基因,并且
其中所述自杀基因在胶质母细胞瘤细胞中由SOX转录因子激活合成超级增强子时表达。
在一个实施方案中,无活性前药与功能性核酸分子同时或依次施用。
应当理解,治疗方法将涉及施用治疗有效量。术语“治疗有效量”是有效改善或治疗疾病或病症的症状的量。治疗有效量可以是“预防有效量”,因为预防可以被认为是治疗。
应当理解,本文描述的实施方案可以应用于本公开的所有方面,即针对用途描述的实施方案可以同样应用于所要求保护的方法等。
条目
定义本公开及其优选方面的一组条目如下:
1.合成超级增强子,其由一个或多个转录因子激活,其中所述合成超级增强子包含源自不同基因组基因座的两个或多个增强子序列,其中每个增强子序列包含转录因子的结合位点和存在于其基因组基因座中的转录因子的结合位点上游和/或下游的20至400个核苷酸。
2.根据条目1所述的合成超级增强子,其中合成超级增强子内的两个或多个增强子序列中的每一个小于300个核苷酸长,特别是160个核苷酸长。
3.根据条目1或条目2所述的合成超级增强子,其中所述合成超级增强子小于1200个核苷酸长,特别是小于700个核苷酸长。
4.根据条目1至3中任一项所述的合成超级增强子,其中所述合成超级增强子包含四个增强子序列。
5.根据条目1至4中任一项所述的合成超级增强子,其中所述转录因子是SOX家族的转录因子。
6.根据条目1至5中任一项所述的合成超级增强子,其中所述合成超级增强子包含至少一个SOX二聚体基序。
7.根据条目6所述的合成超级增强子,其中所述SOX二聚体基序包含SEQ ID NO:1。
8.根据条目1至5中任一项所述的合成超级增强子,其中所述合成超级增强子包含至少一个SOX基序。
9.根据条目8所述的合成超级增强子,其中所述SOX基序是SOX2基序。
10.根据条目8或条目9所述的合成超级增强子,其中所述SOX2基序包含SEQ IDNO:3。
11.根据条目1至10中任一项所述的合成超级增强子,其中所述合成超级增强子包含表1中呈现的一个或多个增强子序列。
12.根据条目1至11中任一项所述的合成超级增强子,其中所述合成超级增强子包含与选自SEQ ID NO:64-80的序列具有至少80%序列同一性的序列。
13.根据条目1至12中任一项所述的合成超级增强子,其中所述合成超级增强子还包含转录调节子。
14.功能性核酸分子,其包含与转基因可操作地连接的条目1至13中任一项所述的合成超级增强子。
15.根据条目14所述的功能性核酸分子,其中所述转基因编码治疗性有效负载。
16.根据条目14所述的功能性核酸分子,其中所述转基因编码不利有效负载。
17.根据条目16所述的功能性核酸分子,其中所述不利有效负载编码刺激免疫应答的蛋白质,所述免疫应答导致细胞毒性免疫细胞的招募。
18.根据条目16所述的功能性核酸分子,其中所述不利有效负载编码细胞毒性物质。
19.根据条目1至18中任一项的功能性核酸分子,其中所述不利有效负载是自杀基因,其编码能够将无活性前药转化为细胞毒性药物的蛋白质。
20.根据条目14至19中任一项所述的功能性核酸分子,其中所述合成超级增强子可操作地连接至启动子。
21.功能性核酸分子,其包含由在靶异常细胞中表达的一个或多个转录因子激活的合成超级增强子和不利的有效负载,其中所述有效负载在所述转录因子激活合成超级增强子时表达。
22.根据条目21所述的功能性核酸分子,其中所述转录因子在靶异常细胞中差异表达。
23.根据条目21或条目22所述的功能性核酸分子,其中所述转录因子是发育或干细胞隶属转录因子。
24.根据条目21至23中任一项所述的功能性核酸分子,其中所述转录因子是SOX家族的转录因子。
25.根据条目21至24中任一项所述的功能性核酸分子,其由SOX2激活。
26.根据条目21至25中任一项所述的功能性核酸分子,其中所述合成超级增强子包含至少一个SOX二聚体基序。
27.根据条目26所述的功能性核酸分子,其中所述SOX二聚体基序包含SEQ ID NO:1。
28.根据条目21至25中任一项所述的功能性核酸分子,其中所述合成超级增强子包含至少一个SOX基序。
29.根据条目28所述的功能性核酸分子,其中所述SOX基序是SOX2基序。
30.根据条目28或条目29所述的功能性核酸分子,其中所述SOX2基序包含SEQ IDNO:3。
31.根据条目21至30中任一项所述的功能性核酸分子,其中所述合成超级增强子包含两个或多个增强子序列。
32.根据条目21至31中任一项所述的功能性核酸分子,其中所述合成超级增强子包含四个增强子序列。
33.根据条目31或条目32所述的功能性核酸分子,其中两个或多个增强子序列中的每一个具有不同的序列。
34.根据条目31至33中任一项所述的功能性核酸分子,其中所述两个或多个增强子序列中的每一个源自不同的基因组基因座。
35.根据条目31至34中任一项所述的功能性核酸分子,其中所述合成超级增强子内的两个或多个增强子序列中的每一个小于300个核苷酸长,特别是约160个核苷酸长。
36.根据条目31至35中任一项所述的功能性核酸分子,其中所述合成超级增强子内的两个或多个增强子序列中的每一个包含选自以下的序列:SOX基序和/或SOX二聚体基序。
37.根据条目21至36中任一项所述的功能性核酸分子,其中所述合成超级增强子包含表1中呈现的一个或多个增强子序列。
38.根据条目21至37中任一项所述的功能性核酸分子,其中所述合成超级增强子包含与选自SEQ ID NO:64-80的序列具有至少80%序列同一性的序列。
39.根据条目21至38中任一项所述的功能性核酸,其中所述合成超级增强子可操作地连接至启动子。
40.根据条目21至39中任一项所述的功能性核酸分子,其中所述不利有效负载编码刺激免疫应答的蛋白质,所述免疫应答导致细胞毒性免疫细胞的招募。
41.根据条目21至39中任一项所述的功能性核酸分子,其中所述不利有效负载编码细胞毒性物质。
42.根据条目1至41中任一项所述的功能性核酸分子,其中所述不利有效负载是自杀基因,所述自杀基因编码能够将无活性前药转化为细胞毒性药物的蛋白质。
43.根据条目42所述的功能性核酸分子,其中所述自杀基因是单纯疱疹病毒胸苷激酶(HSV-TK)基因并且所述前药是更昔洛韦、阿昔洛韦或伐昔洛韦。
44.根据条目21至43中任一项所述的功能性核酸分子,其中所述异常细胞是癌细胞或肿瘤细胞并且所述不利有效负载是抗癌有效负载。
45.根据条目21至44中任一项所述的功能性核酸分子,其中所述异常细胞是胶质母细胞瘤干细胞。
46.合成超级增强子,其由SOX家族的一个或多个转录因子激活,其中所述合成超级增强子包含两个或多个增强子序列和至少一个SOX基序和/或SOX二聚体基序。
47.根据条目46所述的合成超级增强子,其中所述两个或多个增强子序列中的每一个具有不同的序列。
48.根据条目46或条目47所述的合成超级增强子,其中两个或多个增强子序列中的每一个源自不同的基因组基因座。
49.根据条目46至48中任一项所述的合成超级增强子,其中所述合成超级增强子包含四个增强子序列。
50.根据条目46至49中任一项所述的合成超级增强子,其中所述合成超级增强子内的两个或多个增强子序列中的每一个小于300个核苷酸长,特别是160个核苷酸长。
51.根据条目46至50中任一项所述的合成超级增强子,其中所述合成超级增强子内的两个或多个增强子序列中的每一个包含选自以下的序列:SOX基序和/或SOX二聚体基序。
52.根据条目46至51中任一项所述的合成超级增强子,其由SOX2激活。
53.根据条目52所述的合成超级增强子,其中所述SOX二聚体基序包含SEQ ID NO:1。
54.根据条目46至51中任一项所述的合成超级增强子,其中所述SOX基序是SOX2基序。
55.根据条目54所述的合成超级增强子,其中所述SOX2基序包含SEQ ID NO:3。
56.根据条目46至55中任一项所述的合成超级增强子,其中所述合成超级增强子包含表1中呈现的一个或多个增强子序列。
57.根据条目46至56中任一项所述的合成超级增强子,其中所述合成超级增强子包含与选自SEQ ID NO:64-80的序列具有至少80%序列同一性的序列。
58.由SOX2激活的合成超级增强子,其中所述合成超级增强子包含源自不同基因组基因座的四个增强子序列,并且其中每个增强子序列包含至少一个SOX二聚体基序。
59.载体,其包含条目1至13或46-58中任一项所述的合成超级增强子,或条目14至45中任一项所述的功能性核酸分子。
60.根据条目59所述的载体,其中所述载体是病毒载体。
61.根据条目59或条目60所述的载体,其中所述载体是腺相关病毒(AAV)。
62.组合物,其包含条目1至13或46-58中任一项所述的合成超级增强子、根据条目14至45中任一项所述的功能性核酸分子或根据条目59至61中任一项所述的载体,和可接受的运载体。
63.组合物,其包含条目14至45中任一项所述的功能性核酸分子,用于治疗。
64.组合物,其包含条目14至45中任一项所述的功能性核酸分子,用于治疗癌症。
65.试剂盒,其包含根据条目21至45中任一项所述的功能性核酸分子,其中所述不利有效负载是编码能够将无活性前药转化为细胞毒性药物的蛋白质的自杀基因,并且所述试剂盒还包含所述无活性前药用于与功能性核酸分子一起施用。
66.治疗癌症的方法,其包括向患者施用根据条目14至45中任一项所述的功能性核酸分子或根据条目63或64所述的组合物。
67.根据条目66所述的方法,其中所述癌症是脑癌,例如胶质母细胞瘤。
68.根据条目66或条目67的方法,其中全身施用所述功能性核酸分子或组合物。
69.根据条目66或条目67所述的方法,其中局部施用所述功能性核酸分子或组合物。
70.治疗胶质母细胞瘤的方法,其包括向患者施用功能性核酸分子和无活性前药,
其中所述功能性核酸包含由SOX转录因子激活的合成超级增强子和编码能够将无活性前药转化为细胞毒性药物的蛋白质的自杀基因,且
其中所述自杀基因在胶质母细胞瘤细胞中由SOX转录因子激活合成超级增强子时表达。
71.根据条目70所述的方法,其中所述无活性前药与所述功能性核酸分子同时或顺序施用。
现在将参考以下非限制性实施例来说明本公开。
实施例
材料和方法
目标载体克隆
为了确保增强子克隆和超级增强子组装的高克隆效率,我们构建了一个新的定制目标载体以实现高效的golden gate克隆(golden gate cloning)。这也减少了反应设置时间/成本。该目标载体设计包括:报告基因盒Nanoluc-Ires-mNGreen-pA和最小CMV启动子(mCMV)。使用细菌自杀ccdB盒进行选择和有效克隆。CDV2含有跨越多个位置的ccdB盒,使得能够组装多达四个增强子和间隔区。与CDV1相反,CDV2还含有整个盒侧翼的PiggyBac转座酶识别位点。我们使用Gibson组装来生成无痕定制目标载体(Gibson等2009)。
SOX2增强子寡核苷酸池设计的生物信息学
Suvà及其同事发表了一种细胞系中GSC中的SOX2结合(MGG8细胞系中的SOX2r1和SOX2r2,原神经亚型)以及三种细胞系MGG4(原神经亚型)、MGG6(经典亚型)和MGG8(Suvà等2014)中的H3K27ac的技术重复。它们还包括分化的MGG8细胞(此处称为分化的胶质瘤细胞(DGC))的数据。为清楚起见,由于其致瘤特性,GSC系也被称为肿瘤增殖细胞,这与DGC相反(DGC是通过添加刺激星形胶质细胞分化的血清而在此处衍生自GSC)。
为了确定GSC特异性SOX2峰,将GSC SOX2r1和SOX2r2与DGC SOX2_H3K27ac(SOX2过表达的DGC中的H3K27ac Chip-Seq)重叠。此外,还在GSC细胞系之间鉴定了共有的H3K27ac峰,以定义推测的增强子序列。这些共有峰分别与GSC特异性SOX2r1和GSC特异性SOX2r2重叠。这可以防止失去任何潜在的重要区域。然后将所得共有峰组合到一个文件中,并合并接近100个碱基对(bp)的峰,这也去除了重复项。峰的长度范围为15-5300bp,且平均长度为411bp。接下来,手动管理池以去除重复序列和非增强子序列,例如着丝粒。这产生了一个管理的初始池,其包含1721个峰,范围为15-3366bp且平均长度为402bp。
为了避免PCR朝向小片段的偏差,我们还丢弃了小于100bp的所有区域,从而产生了1710个峰,范围为115-3366bp且平均长度为404bp。然后将这些峰分成160bp的片段。再次去除小于100bp的任何片段以避免PCR偏差。每侧均附接有20bp衔接子。
细胞系
使用Pollard等先前报道的NSC培养条件衍生GSC。简而言之,细胞在无血清和无饲养层的条件下在含有N2和B27补充剂的神经基础培养基中扩增。通过在培养基中补充层粘连蛋白-1贴壁培养细胞。Stricker等已对GSC7进行了表征。HEK293细胞获自ATCC细胞库。所有其他GSC系和huFb170均源自Pollard实验室(未发表),并被表征为Glioma CellularGenetics Resource(www.gcgr.org.uk)的一部分。
增强子阵列质粒文库的构建
我们选择了阵列文库格式,将160bp增强子片段分别克隆到单独的质粒中,并排列在96孔板中。这些160bp被合成为单个寡核苷酸(oligos)池,然后随机克隆到质粒中并进行分离。池的PCR扩增需要20bp×2,因此合成了200bp片段的文库(Twist Biosciences)。为了满足我们的oligo合成策略,GSC表达的ChIP-seq峰被合并为单个oligo。该寡核苷酸池进行PCR扩增(使用有限的循环来减少偏差和‘大奖’产物,这意味着更容易扩增的产物将超过寡核苷酸池),并通过有效的Golden Gate反应克隆到表达载体中。然后随机挑选、分离4579个单个质粒,并将其作为阵列质粒DNA文库铺在96孔板(×48)上。细菌菌落的挑选和质粒小量制备的产生得到了Edinburgh Genome Foundry(S.Rosser)的支持。然后使用优化的Nanoglo DLR测定(Nano-Glo双荧光素酶报告基因测定,Promega)以384孔形式筛选该文库。每个板与PGK-FFLuc以1:10的比例一起瞬时转染至GSC7细胞中。2天后,进行Nanoglo DLR测定并在读板器上进行测定。
用于文库产生的PCR扩增和纯化
我们开发了通过使用针对空载体的golden gate克隆和选择而非常高效率的文库扩增和质粒克隆,以避免不合适的产物、空序列和文库冗余。PCR条件经过优化,可以在有限/无背景和没有扩增偏差的情况下扩增寡核苷酸池。
我们使用KAPAHiFi Hotstart聚合酶用GC缓冲液(Roche,KK2501)、68℃退火温度和72℃下5秒延伸时间。首先用0.25μl(2.5ng输入)将寡核苷酸池扩增10个循环,然后将0.5μl该反应物用于接下来的15个循环扩增,以减少PCR偏差。
在golden gate克隆之前,使用基于磁珠的固相可逆固定化(SPRI)纯化来使损失最小化并纯化DNA。所有插入片段的Sanger测序证实它们是多样化的,并且所有序列都可以映射回到池的片段并含有衔接子。
384孔板的筛选平台
使用multidrop将细胞接种到384孔板中,并在第二天使用CyBio Felix进行转染。两天后,实验通过Nanoglo DLR测定终止,将相对于mCMV倍数变化大于10的所有命中均进行Sanger测序并映射回到基因组。
经验证的增强子的基因组特征
GREAT是一种在线工具,其将每个基因的基础调节结构域定义为转录起始位点(TSS)下游1kb和上游5kb,这意味着相近的基因是同一调节结构域的一部分。为了考虑远端调节事件,基础基因调节结构域在1000kb内向最近的基础上游和下游调节结构域延伸。然后,GREAT使用基因注释和查询序列的本体以及二项式检验来测试基因本体的富集,以预测靶基因(Mclean等2010)。我们研究了预测的靶基因在人类成人组织中的表达模式(https://gtexportal.org/home/)。
寡核苷酸拉下和质谱分析
使用生物素化引物对oligo进行PCR扩增。然后将PCR产物进行SPRI纯化以去除生物素化的引物二聚体。将这些dsDNA片段与来自GSC7和GSC328的核提取物一起孵育。然后将它们与链霉亲和物素蛋白磁珠结合,洗涤三次,并将冷冻珠子送去进行质谱分析。
细胞培养程序
在37℃、5% CO2中培养细胞系。细胞在未包被的细胞培养塑料皿上生长。胶质母细胞瘤干细胞系使用先前报道的条件(Pollard等,2009)在无血清条件下生长。对于传代,用PBS冲洗细胞系,并分别使用Accutase(针对GSC)或0.5%胰蛋白酶/EDTA(针对huFb170和HEK293)分离。将细胞置于洗涤培养基中并以300×g离心3分钟。将它们重悬于其各自的生长培养基中并重新铺板。对于冷冻保存,将细胞重悬于补充有10%DMSO的生长培养基中,并储存在-80℃下进行短期储存。对于长期保存,将小瓶转移到液氮容器中。
GSC、huFb170和HEK293细胞的转染
以所需的密度接种细胞。第二天进行转染。为此,将Plus试剂和LipofectamineLTX(Life Technologies,15338030)各自稀释在一半体积的Opti-MEM I低血清培养基(进一步称为Optimem)(Life Technologies,31985062)中。在此步骤之后,将Plus试剂/Optimem预混物添加到所有DNA样品中,然后添加Lipofectamine LTX/Optimem预混物。将转染混合物在室温下孵育5分钟,然后小心滴在细胞上。通常,不进行培养基改变。转染后两天对细胞进行分析。
HEK293细胞以指定的密度接种在各自的板形式中。第二天,将GMEM、DNA和PEI(自制)混合并在室温下孵育15分钟,以允许形成复合物。随后将转染混合物滴在细胞上,并在两天后进行分析。
Nano-Glo双荧光素酶报告基因测定系统(Promega)
该测定由两个步骤组成。使用标准化质粒PGK-Firefly-Luciferase(Promega,E5011)进行转染,其与目的质粒以1/10的比例转染。首先,测量萤火虫荧光素酶活性,其允许针对转染效率归一化。第二步,确定Nanoluc的活性,所述活性是目的质粒的读出。用PBS洗涤细胞3次,最后一次洗涤后,将20μl留在96孔板中(384孔中25μl)。添加Oneglo缓冲液并将板以480rpm摇动5分钟以允许细胞裂解。然后将96孔形式中的20μl细胞裂解物或384孔形式中的25μl细胞裂解物转移至相应的不透明白色板中,并使用Ensight多模式读板仪以每孔0.1秒测量发光。对于以下96孔形式的Nanoluc反应,将2μl细胞裂解物转移至含有40μlPBS的不透明白色板中,并向每孔添加补充有底物的20μlStopglo缓冲液。在384孔形式中,将含有底物的20μl Stopglo缓冲液添加到未稀释的细胞裂解液顶部。将板再次以480rpm摇动5分钟,以淬灭萤火虫荧光素酶反应并确保良好混合。再次使用Ensight多模式读板仪以每孔0.1秒测量Nanoluc活性。
将Nanoluc反应获得的数据归一化为Firefly反应,以说明转染效率的孔与孔之间的差异。归一化数据用于计算相对于空载体对照mCMV的倍数变化。
免疫细胞化学
用PBS洗涤细胞两次,并在4% PFA中固定10分钟。使用PBS中的0.1% Triton-100(进一步称为PBST)对细胞进行透化。用封闭液(含3%山羊血清的PBST中的1% BSA)封闭它们,并与一抗在4℃下孵育过夜(表3)。第二天,将细胞在PBST中洗涤3次,并将相应的二抗施加于封闭溶液中,并在室温下孵育45-60分钟。用PBS洗涤细胞,并用最终浓度为1μg/ml的DAPI核复染剂孵育5分钟。使用Nikon TiE显微镜和NIS elements软件(Nikon)获取图像。
表3:免疫组织化学实验中使用的抗体列表
流式细胞术
对于流式细胞术,将细胞分离、沉淀并重悬于适当体积的流式细胞术缓冲液(PBS中的1% BSA,v/v)中。细胞用Draq7(Abcam,ab109202,f.c.0.1μM)作为活/死染色剂进行染色,并使用BD LSRFortessa细胞分析仪(4激光,BD Bioscience)进行分析。流式细胞术数据的分析在FlowJo分析软件(FlowJo,版本10.6.2)中进行。
定量实时聚合酶链式反应(qRT-PCR)
对于qRT-PCR,TaqMan Universal PCR Master Mix(Applied Biosystems)和TaqMan基因表达测定(Life Technologies)在Quant Studio7 Flex实时qPCR仪上使用。每个平板上均采用未经过逆转录来评估DNA污染的RNA样本和水对照。此外,qRT-PCR也进行了技术重复。使用ddCt方法进行数据分析,该方法假设100% PCR效率,并用TaqMan测定进行保证。简而言之,计算技术重复的平均值并针对管家基因GAPDH进行归一化,这产生ddCt值。这些值进一步针对校准样品(GSC7)进行归一化以得到ddCt。
使用可扩展模块化哺乳动物组装(EMMA)工具包产生进入和最终载体
根据Martella等2017设计和产生载体。简而言之,为了驯化新部分,去除了BsaI和BsmBI位点。使用生成融合位点和BsaI位点的突出端的引物对新部分进行PCR扩增。这确保了简单且有效地克隆到部分进入载体中。所有部分进入载体都含有红色荧光蛋白(RFP),将其与待克隆的部分重组,因此提高了克隆效率,因为只有白色菌落才能含有该部分。为了组装表达载体,所有部分与受体载体以等摩尔比混合。为了提高克隆效率,受体载体含有细菌自杀盒ccdB,其与表达载体的一部分重组。因此,转入未修饰受体的细菌将无法形成菌落。
蛋白质印迹
在PBS中刮取细胞并以0.3g离心两次以除去所有液体。将细胞沉淀重悬于70μlRIPA缓冲液(50mM Tris-HCl pH 8.0、150mM NaCl、1%NP-40、0.5%脱氧胆酸盐、0.1% SDS和蛋白酶抑制剂(Complete,Roche,11697498001)中,并在冰上孵育5分钟。将裂解物在4℃下以13000rpm离心10分钟(离心机5415D,Eppendorf)。并将上清液收集在新管中。根据制造商的说明,使用Pierce BCA蛋白质测定试剂盒(Thermo Scientific,目录号:23225)对蛋白质提取物进行定量。
将含有50mM DTT的4×十二烷基硫酸锂(LDS)缓冲液总体积的5%添加到细胞提取物中,并将样品在95℃下变性10分钟。将样品装入由Carla Blin博士制备的具有SpectraMulticolour Broad Range Protein Ladder(Thermo Scientific,目录号:26634)或BioRad Precision Plus蛋白质双色标准品(目录号:1610377)的4-12%聚丙烯酰胺凝胶中。按照制造商说明,使用Biorad Trans-blot Turbo系统通过湿式电印迹或半干印迹将蛋白质条带转移至Immobilon PVDF膜(Millipore,IPVH00010)。使用TBS-T(TBS+0.1%Tween-20)中的5%牛奶在室温下进行膜封闭1小时,然后为在TBS-T的5%牛奶中一抗孵育并摇动过夜(表4)。第二天早晨,将膜在TBS-T中在室温下洗涤3次,每次5分钟,并与辣根过氧化物酶偶联的二抗在TBS-T中的5%牛奶中在室温下孵育1小时(表4)。再次,将膜在TBS-T中洗涤3次,每次5分钟,并使用自制的增强化学发光(ECL)溶液或Clarity ECL WesternBlotting底物(Bio-Rad,目录号:170-5061)显色,并使用X射线胶片或Bio-Rad ChemiDocTM成像仪成像。
表4:蛋白质印迹实验中使用的抗体列表
核提取物
所有缓冲液均在前一天制备,通过22μm过滤器(透析缓冲液除外)并在4℃下放置过夜。在马上使用前添加DTT和蛋白酶抑制剂。在培养基上刮取细胞并收集在50ml falcon上,在4℃下以1350rcf将其离心5分钟。将沉淀重悬于50ml冰冷的PBS中,取出等分式样用于细胞计数,并在4℃下以1350rcf再次离心5分钟。然后将沉淀重悬于每4000万个细胞5ml的冰冷缓冲液A(10mM HEPES pH 7.9、1.5mM MgCl2、10mM KCl、0.5mM DTT、蛋白酶抑制剂(Complete,Roche,11697498001))中,并在冰上孵育10分钟。将细胞悬浮液转移至玻璃Dounce匀浆器中并在冰上匀浆40次。将细胞悬浮液转移到falcon,并在4℃下以1350rcf离心10分钟。弃去上清液(胞质提取物),将沉淀重悬于每1000万个细胞的100μl冰冷缓冲液B(20mM HEPES pH 7.9、5%甘油、1M NaCl、1.5mM MgCl2、0.2mM EDTApH 8.0、0.5mM DTT、蛋白酶抑制剂(Complete,Roche,11697498001))中。将悬浮液在4℃下旋转30分钟,然后转移至透析膜(SnakeSkin,Thermo Scientific,目录号:68100)中。透析在500ml透析缓冲液(20mM HEPES pH 7.9、5%甘油、100mM KCl、0.83mM EDTA pH 8.0、1.66mM DTT、蛋白酶抑制剂(Complete,Roche,11697498001))中于4℃旋转进行两小时。更换透析缓冲液(500ml)并在4℃下继续透析过夜。将提取物收集在1.5ml管中,并在4℃下以最大速度离心15分钟(离心机5415D Eppendorf)。将上清液收集到新的1.5ml管中并进行定量(Pierce BCA蛋白测定试剂盒,Thermo Scientific,目录号23225)。将100μg等分试样在液氮中快速冷冻并储存在-80℃下。
使用生物素化引物的PCR扩增和纯化
根据制造商的说明,使用PrimeStar Max(Takara)用5'生物素化引物(表5)扩增增强子。
表5:用于转录因子拉下的5'生物素化引物
引物编号 序列 SEQ ID NO.
正向引物595 TGATCCGTCTCgCCCTactaggttactggtgcatgc 81
反向引物596 ACTAACGTCTCgGAGCacccaaactattggagcgag 82
根据制造商的说明,使用Agencourt AMPure XP磁珠(Beckman Coulter)进行PCR纯化。根据制造商的说明,使用Tapestation和试剂进行PCR产物定量。
相互作用蛋白质的沉淀
根据制造商的说明,使用链霉亲和素蛋白磁珠(NEB,S1420S)。简而言之,将10μl珠子等分到LoBind管中,并在磁力架上用结合缓冲液(20mM Tris-HCl pH 7.5、0.5M NaCl、1mM EDTA)洗涤3次。将20μl生物素化DNA(~20pmol)与200μl结合缓冲液混合并添加到珠子中。将悬浮液在室温下旋转2小时。用结合缓冲液再次洗涤珠子3次,并添加50μg核提取物(总体积50μl)。向珠子、DNA和核提取物中添加150μl透析缓冲液(20mM HEPES pH 7.9、5%甘油、100mM KCl、0.83mM EDTApH 8.0、1.66mM DTT、蛋白酶抑制剂(Complete,Roche,11697498001)),4℃下旋转过夜。第二天早上,用洗涤缓冲液(20mM HEPES pH 7.9、5%甘油、250mM NaCl、0.83mM EDTApH 8.0、1.66mM DTT)洗涤珠子三次。对于蛋白质印迹,在20μl上样缓冲液(含有50mM DTT的十二烷基硫酸锂(LDS)缓冲液)中洗脱蛋白质,并煮沸5分钟以使蛋白质变性。对于质谱分析,将珠子干燥送到该设备。
斑马鱼实验
所有胚胎均通过自然产卵获得,并收集在含有0.00001%亚甲蓝的调节水族箱水中。从受精后6小时(hpf)起,在实验期间用200μM N-苯基硫脲(PTU)(Sigma)处理胚胎,以抑制色素沉着(Karlsson、Von Hofsten和Olsson 2001)。
将受精卵在单细胞发育阶段进行注射。如Nusslein-Volhard和Dahm2002所述,将卵保持在1.5%琼脂糖(Sigma)模具中进行显微注射。使用P-97Flaming/Brown微量移液器拉出器(Sutter Instruments,USA)从玻璃毛细管(Harvard Apparatus,USA)拉出显微注射针。拉针参数如下:热:550;拉力:200;速度:55;时间:150。显微注射在PV820 PneumaticPicoPump(World Precision Instruments[WPI],USA)系统上进行。DNA构建体使用Tol2Kit系统创建(Kawakami 2007,Kwan等2007)。注射大约2nL含有Tol2加帽mRNA(20ng/μL)的质粒DNA(30ng/μL),并补充0.2%w/v酚红(Sigma)以促进注射体积的可视化。在三卡因麻醉后,将胚胎在24-48hpf时在宽视场荧光显微镜上实时成像。
腺相关病毒(AAV)转导测定
将HEK293细胞在转染前一天接种到6孔板中,以便转染当天汇合度为60-70%。在用PEI转染HEK293细胞之前,进行培养基更换,因为该培养基将在两天内用病毒进行调节。接下来的几天,将HEK293或GSC7细胞以低密度(10-20%)接种在相同或更小的板形式(6或12孔板)中。AAV条件培养基以1300rpm离心4分钟以去除污染细胞,并将上清液转移至以低密度接种的HEK293细胞中。在显微镜或流式细胞仪上分析细胞。
用于杀伤测定的细胞接种和转导
在细胞接种当天,使用上述方法分离细胞。使用血细胞计数器对细胞进行计数,并接种到96孔(每孔50μL中1,000个细胞)、24孔(每孔500μL中30,000个细胞)或6孔(每孔2mL中60,000个细胞)Corning板中,并置于37℃/5% CO2培养箱中。第二天,将AAV病毒储备液在室温下融解,并将适量的病毒储备液添加到所需量的培养基中以实现5×105的最终感染复数(MOI)。将含有病毒颗粒的培养基添加到细胞中,无需更换现有培养基。将细胞返回37℃/5% CO2
药物治疗
将冻干GCV在DMSO中稀释以达到100mM储备浓度。将GCV储备液等分并在-20℃下保存不超过1个月。为了制备工作储备液浓度,将GCV在适当培养基中按1:100稀释,然后将20μL此类工作储备液添加到已含有80μL培养基的孔中(实现另一个1:5稀释)。细胞上GCV的最终浓度为200μM。
作为阴性对照,DMSO在适当的培养基中按1:100稀释以获得工作储备液。将20μL工作储备液添加到已含有80μL培养基的孔中。作为阳性对照,将20μL DMSO添加到含有80μL培养基的孔中,实现20%DMSO的终浓度。
Incucyte活细胞成像
为了追踪治疗期间的细胞增殖和形态变化,使用Incucyte活细胞成像系统监测细胞。每4小时对Corning 96孔板进行全孔成像。使用基本汇合度评分分析软件(Incucyte)来估计汇合度。提取特定时间点的图像以验证细胞汇合度和形态。
MTT测定
测定当天,用0.3mg/mL MTT溶液(在细胞系合适的培养基中稀释)替换培养基。将细胞置于37℃/5% CO2的培养箱中3小时。孵育后,除去培养基,并向每个孔中添加70μLDMSO。将每个板在37℃黑暗下放置20分钟,偶尔摇动。在读取板之前,目视检查每个孔以确保所有(甲臜)晶体都溶解。用板读取器在560nm吸光度下读取板。
数据分析
大部分数据分析使用适用于Mac的Microsoft Excel版本16.23和GraphPad Prism7进行。误差线显示为平均值的标准差。使用RStudio版本1.1.456(RStudio Team 2015)进行了一些数据分析。为了生成插图,使用了biorender.com和Adobe Illustrator 22.0.1。此外,还使用了开源程序,例如bedtools(Quinlan和Hall 2010)、GREAT(Mclean等2010)、fastaspplitter(Stothard 2000)和MEME(Bailey等2009)用于各种分析。
实施例1-功能性SOX2增强子的鉴定
为了首先建立当将单独活性增强子组合成聚集的多部分阵列时能否实现协同活性的概念证明,我们首先鉴定了一小组候选增强子。这些是基于在神经干细胞(NSC)自我更新中具有已知作用的近端基因(POU3F2、POU3F3、CHD7、ASCL1、SOX6、ETV1)以及使用NSC相对于原代人成纤维细胞的可用差异表达数据来选择的。还包括五个SOX2候选自动调节增强子。将这些增强子(通常约为500-800bp)克隆到携带mNeonGreen和荧光素酶报告基因盒的质粒表达载体中,并使用两个独立的患者来源的胶质母细胞瘤干细胞(GSC)细胞系(G7和G328)测试其各自的增强子活性(图1)。这些增强子中的六个是有功能的,其NanoLuc的表达比mCMV增加了10倍以上(254、270、282、292、312和316;范围为10-300倍)。这些在HEK293细胞(阴性对照)中均不具有活性。
表6:预测的靶基因和增强子片段到转录起始位点(TSS)的距离
实施例2-四个不同增强子的组装导致转录活性的协同增加
为了研究组合多个增强子是否可以增加活性,我们首先构建了两个增强子(2x)、四个增强子(4x)或八个增强子(8x)(串联体)(即同一增强子的多个副本)的版本串联体。我们选择了具有可变强度的三种不同的单个增强子:270(约100倍)、254(约20倍)和312(约10倍)。对于270,在2部分和4部分增强子中,与单个增强子活性相比,我们仅注意到适度的协同效应。与单个增强子约100倍相比,4部分增强子产生约为500倍的活性(图1F)。令人惊讶的是,通过将副本增加到8部分串联体,我们没有观察到额外的增益。在独立患者系GSC328中观察到了类似的趋势。在所有构建体的HEK293细胞中仅看到荧光素酶激活的背景水平,其与mCMV阴性对照相当。
接下来我们测试了将来自不同基因的不同增强子混合在一起是否会产生提高的协同作用(图1K)。因此,我们将G7中鉴定的前4个单个增强子(270、282、292和316)组合成一个新的合成增强子(称为T4)。的确,使用Nanoluc报告基因测定(Nano-Glo荧光素酶测定和Nano-Glo双荧光素酶报告基因测定,均为Promega),我们注意到T4的表达相对于mCMV显著增加了5000倍以上(图1L)。使用流式细胞术对G7细胞中的mNGreen进行评分(图1I)进一步验证了这一点,其表明T4的水平约为G7细胞中全长CMV观察到的水平的50-60%。因此,组合来自不同基因的增强子会在GSC中产生增强子活性的协同效应和显著增加,但不会增加HEK293细胞中的背景表达。这些细胞类型特异性合成增强子簇随后被称为“合成超级增强子”(SSE)。
实施例3-GSC中T4合成超级增强子的活性在星形胶质细胞分化后降低
接下来我们测试了SSE-T4合成超级增强子是否对GSC状态具有特异性,因此在其分化为其中SOX2下调的星形胶质细胞时丢失。暴露于胎牛血清(FCS)10-15天后,G7细胞可以有效分化为星形胶质细胞样细胞。因此,用SSE-T4表达盒(使用PiggyBac转座酶系统)稳定转染GSC(G7),并使用荧光激活细胞分选(FAC)分选mNGreen+细胞。第二天将它们放入5%FCS中,并在15天的时间过程中使用流式细胞术每5天测量一次mNGreen表达(图1H-J)。基于活细胞荧光成像,mNGreen的表达在第5天显著降低。流式细胞术证实了这一点,流式细胞术显示大约50%的细胞在第5天时丢失了mNGreen,在第15天时丢失了大约80%。这些数据表明SSE-T4在GSC中具有高活性,但在其分化的星形胶质细胞样后代中则不然,因此SSE是细胞类型特异性的。
实施例4-SOX2增强子的阵列质粒文库的系统筛选
上述数据提供了原理证明,即将增强子组合成四部分阵列可以增加转录活性,而不影响非GSC细胞中的背景表达。我们推断,可以在基于高通量384孔板的荧光素酶测定中使用全套候选全基因组SOX2增强子进行增强子片段(160bp)的功能筛选,以系统鉴定用于SSE中时具有最佳性能和较小尺寸的功能增强子。通过在患者来源的GSC中进行此类筛选,我们可以克服现有血清生长癌细胞系的局限性,这些细胞系不具有适当的身份和相关的增强子。
选择160bp是因为这为核小体结合提供了足够的大小,并且可能是功能增强子内语法进化中的重要属性(Soufi等2015)。此外,160bp是合成混合寡核苷酸文库的方便大小,该寡核苷酸文库包含20bp末端,用于随后构建阵列质粒文库。我们更喜欢由合成寡核苷酸构建的阵列质粒文库,而不是其他混合文库筛选策略,例如STARR-seq(Muerdter等2018,Arnold等2013),因为这确保了改进的信噪比和直接的命中验证。
因此,我们设计了可以合成为池的一组寡核苷酸。我们重新分析了Suvà等2014的数据集,并定义了与H3K27ac重叠的一组GSC特异性SOX2结合峰,其鉴定出1710个不同的增强子。这些增强子平均约为400bp(范围:115-3366bp)。我们在计算机中将这些序列分成160bp的元素,其有100bp重叠。然后将9523个不同的寡核苷酸序列合成为一个池,进行PCR扩增,克隆到48x 96孔板的阵列质粒文库中(总共4579个单个质粒)。对所得质粒的亚组进行Sanger测序证实,这些质粒中的大多数(约70%)含有适当的增强子。
使用优化的荧光素酶测定以384孔形式筛选SOX2增强子文库。135个质粒被鉴定为有功能,比mCMV增加了10倍以上。然后使用独立的Nanoglo DLR测定一式三份验证这135个初始命中中的52个(图2)。这52个中的16个不止一次被发现。对命中进行Sanger测序,证实含有增强子,并使用原始设计组中的预期片段映射回人类基因组。
接下来,我们使用跨多个细胞系的独立流式细胞术测定验证了前17个片段(比mCMV增加了30倍以上)(图2)。这些细胞在独立的患者来源的GSC系(GSC328)中具有活性,但在测试的非神经细胞(HEK293细胞和人原代成纤维细胞,huFb170)中不具有活性。我们发现靠前命中的大多数都是脊椎动物进化上保守的序列。与基于NanoLuc的mCMV(范围:100-260倍)相比,前5的增强子各自均超过100倍。这些均通过流式细胞术进行了验证。
ID1101位于PRCP的内含子中;ID2904位于MYO18基因的内含子区域,靠近SEZ6L;ID0109位于TPK1和CNTNAP2之间的基因丰富区域;ID4328位于锌指转录因子ZNF438的内含子区域。ID0876位于NWD2的内含子区域。
表7:预测的靶基因和增强子片段到转录起始位点(TSS)的距离
因此,我们的功能筛选导致许多160bp增强子片段被鉴定,尽管其大小小4至5倍,但与全长增强子(如上所述)相比,其具有显著提高的活性。
实施例5-使用新鉴定的SOX2增强子产生强且具有选择性的合成超级增强子
我们通过将来自筛选的单个最活跃的片段聚集成四部分阵列来构建合成超级增强子,以鉴定它们的强度是否在保持细胞类型选择性的同时协同增强。
为了产生尽可能最强的合成超级增强子,我们使用来自Top17增强子的序列设计了一组四个新的4部分阵列。这些在mCMV的上游组装。根据其与mCMV的倍数变化中值对片段进行排序。4个最活跃的增强子(ID1101、ID2904、ID0109、ID4328,用“1”表示)聚集成4部分阵列,形成合成超级增强子。包含第二组的增强子(用“2”表示)被聚集成合成的超级增强子等等。我们假设四个最强的增强子将表现出最高的表达水平,那么下一组将是第二高的表达水平,等等。此外,通过在不同的细胞类型(GSC7、GSC328、HEK293和huFb170)中测试合成的超级增强子,我们还研究了它们的细胞类型—选择性。
测试的所有四种构建体(C1、C3、C5和C7)在GSC7和GSC328中诱导显著且选择性的表达,而在HEK293中仅诱导背景表达。在huFb170中未检测到表达。在GSC7和GSC328中,这些合成超级增强子(C1、C3、C5和C7)中的每一个比SSE-T4(上面讨论的第一代SSE)表现出更高的荧光强度和更高的mNGreen+细胞百分比,所述SSE-T4是使用候选增强子的最活跃合成超级增强子。值得注意的是,C1和C7诱导比阳性对照CMV高的表达水平,所述阳性对照CMV本身就是最强的病毒启动子之一。因此,我们观察到构建4部分增强子阵列具有明显的协同效应,从而产生极强且具有细胞类型选择性的合成超级增强子。
我们通过去除衔接子和间隔区(例如对于C1,974bp至640bp)进一步减小了合成超级增强子的大小。这些合成超级增强子被称为SSE 1-7,因为它们是7个构建体,并且其设计遵循与C1、C3、C5、C7相同的原理。所有构建体都显示出相似的活性水平。这在水平上与完整的CMV相当,并且在一些情况下,它高于CMV(Nanoglo DLR测定的SSE1、2、3、5和在GSC7中通过流式细胞术测定的SSE-1、2、3、5、7)。SSE-1、2、5和7在GSC7中也表现出比CMV更高的强度。还通过流式细胞术对GSC328、HEK293和huFb170进行mNGreen表达分析。GSC328的趋势类似。平均荧光强度(MFI)约为CMV,而SSE-6的强度明显低于CMV。在HEK293细胞中,所有合成的超级增强子都诱导转录达到与mCMV相似的水平。与未转染的细胞相比,mCMV显示出32.5%的mNGreen+细胞。与mCMV相比,SSE显示HEK293中的表达小幅增加。huFb170中SSE1-7的活性不能被检测到(超过1%)。在两种报告基因测定(Nanoglo DLR测定和流式细胞术)中,观察到每个构建体C1相对于SSE-1;C3相对于SSE-3等,具有使用较小的合成超级增强子获得更高活性的趋势(图3B、C、D)。活细胞图像证实了这一点(图3E)。所测试的合成超级增强子SSE-1、3、5和7的每一个的活性与CMV相似。
实施例6-合成超级增强子在分化的GSC中活性较低
为了研究SSE-2-SSE-7在分化条件下的活性,使用Piggybac转座酶系统稳定转染GSC7细胞,并分选mNGreen+细胞。对于mCMV和未转染的对照,分选相似数量的活细胞。然后将细胞放入不含生长因子但含有5% FCS的培养基中以诱导星形胶质细胞分化。
在分化过程中的第0、1、5、10和15天测量mNGreen表达(图4E和G)。我们观察到信号随着时间的推移而下降,这提示合成的超级增强子在GSC中表达最高,并且在分化时活性降低。
实施例7-斑马鱼胚胎揭示前脑中高度选择性的区域特异性表达
斑马鱼非常适合作为探索增强子的组织特异性的实验模型。我们鉴定了所有结构如腹侧脊髓表达、耳胶质板以及中脑/后脑和前端前脑之间共有的组织。一些片段具有额外的活性,例如前/后肠。我们通常在24hpf时观察到低表达,其持续增加直至48hpf时的最新测量时间点。关于对照,我们使用相同的测定观察到EGFP在CMV对照中广泛、非特异性的表达,而在mCMV中没有表达(图4)。mCMV对照表现出绿色荧光眼,这可能是由于水晶眼启动子的虚假转录所致(图4K)。
实施例8-SSE可用于腺相关病毒以诱导GSC的选择性杀伤
为了测试SSE是否适合驱动细胞毒性有效负载并选择性杀死GSC,我们用腺相关病毒2(AAV2)转导GSC7和huFB170细胞系,所述腺相关病毒2在具有由p2A连接的报告基因mCherry的多顺反子mRNA中含有源自单纯疱疹病毒(HSV)的自杀基因胸苷激酶(TK)。这些盒由作为阳性对照的组成型活性CMV启动子(CMV_HSV-TK-v5_P2A_mCherry)或目的启动子SSE-7(SSE-7-HSV-TK-v5-P2A-mCherry)驱动。HSV-TK是成熟的前药,其可通过磷酸化将非细胞毒性前药更昔洛韦(GCV)代谢为细胞毒性产物。磷酸化的GCV与dGTP竞争作为聚合酶的底物,由此导致干扰DNA合成,引起过早终止和细胞毒性。
流式细胞术和蛋白质印迹证实SSE-7在GSC7中驱动mCherry和HSV-TKv5两者表达,但在成纤维细胞(huFb170)中则不然(图5)。在整个细胞毒性实验中记录细胞汇合度。在用CMV或SSE-7驱动的TKv5-P2A-mCherry转导并接受200μM GCV的细胞中特异地观察到细胞增殖和汇合度的减少(图6A)。在单独接受病毒或更昔洛韦的细胞中没有观察到对细胞汇合度的显著负面影响。MTT测定数据表明代谢活性丧失(或缺乏),这作为用CMV或SSE-7驱动的TKv5-P2A-mCherry和GCV处理的GSC7细胞中细胞活力的近似读出(图6B)。CMV和SSE-7之间没有统计学差异(13%相比于12%存活力)(p值=0.7792)。单独的更昔洛韦对GSC7细胞活力影响小(89%存活力)。活细胞成像证实了这些发现,其显示治疗后细胞密度更低以及与细胞应激、损伤或死亡(圆形细胞)相关的形态变化(图6C)。总之,CMV和SSE-7都可以在GSC7细胞中驱动HSV-TK-v5-P2A-mCherry构建体的表达至足够的水平,以在更昔洛韦存在的情况下诱导细胞死亡。
根据实验结束时(第17天)的活细胞成像数据,大多数用CMV驱动的病毒(而非SSE-7驱动的病毒)转导的huFB170细胞被杀死(图6D)。MTT数据证实了这一点,证明了用CMV驱动的病毒转导的细胞中存活力为6.3%,而用SSE-7驱动的TKv5-P2A-mCherry转导的细胞则具有完全存活力(图6E,n=1)。
实施例9-SSE在一系列GSC中表现出活性
期望所提出的基因治疗中的SSE在不同的患者来源的胶质母细胞瘤细胞系中高度表达,但在其他细胞类型中无活性。在五种源自患者的胶质母细胞瘤细胞系(E17、E21、E28、E31、E34)中重复实施例8中描述的实验。选择这些细胞系用于该实验是因为它们涵盖了一系列遗传和转录GBM亚型,并且已显示在小鼠大脑中诱导肿瘤。总而言之,SSE7在所有细胞系中都有活性,但程度不同:它在阳性对照细胞系GSC7中高度表达且与全长CMV相当(图7C);以及E17和E28(图7C),其都属于到经典亚型,但在E21、E31和E34中表达频率较低(图7C)。
实施例10-从头基序的分析鉴定在前32个命中中富集的SOX二聚体基序
我们使用了MEME工具,其可以鉴定从头基序(Bailey等2009)。我们使用前32个命中作为输入。出乎意料的是,出现的重要基序是部分回文SOX基序(图8A)。SOX2不与其他SOX因子形成同源或异源二聚体;然而,SOXE组的成员已经充分确定进行了二聚化(SOX8、SOX9、SOX10)。有趣的是,SOX9是NSC和GSC众所周知的调节因子,但尚未像SOX2那样深入研究(Bulstrode等2017,Huang等2015,Mateo等2015,和DK Singh等2017)。该基序直接提示SOX2和SOX9可能在共有增强子上运行(图8C)。
然后,我们研究了相比于验证的未确认命中和初始寡核苷酸池的10个随机序列,这个二聚体基序是否是序列的寡核苷酸池的一般特征,并将其映射到前52个命中(所有序列相对于mCMV具有10x倍数变化)。该基序在前32个命中中以高频率存在,而在其余前33至前52个命中中以低频率存在。
实施例11-SOX二聚体基序对于GSC中ID2904的活性是必需的,并且提示SOX2和SOX9在关键GSC功能增强子上的协作
接下来我们探讨了SOX二聚体对于增强子功能是否至关重要。我们针对ID2904生成了一系列基序变体。合成的变体具有:1)半位点之间减小的间隔(-2n);2)基序半位点之间增加的间隔;3)和4)删除一个半位点;5)通过随机序列替换侧翼序列;6)基序倒置;7)核心核苷酸的突变;8)如由Jolma等2013报道的高亲和力基序的替换;9)随机序列作为阴性对照;和10)基序串联(concatemerisation)四次。这些不同的变体使我们能够在功能上剖析二聚体基序内的关键序列(图8)。
我们观察到ID2904中SOX二聚体基序的几乎所有变体的活性几乎完全丧失,这证实了该二聚体基序对于增强子功能的重要性。一个例外是两个半位点之间的距离改变,其导致活性增加。这很有趣,因为它与间隔可能是“次优化的”并且2bp的减少可能会驱动SOX9二聚体更强的结合(Farley等2015)的概念一致。我们得出结论,SOX二聚体基序对于ID2904的增强子活性至关重要。间隔的减小也符合Huang等2015的观点,他定义了SOXE因子基序的最佳间隔。
接下来,我们的目的是确认SOX2和SOX9确实与增强子和SOX二聚体基序结合。为此,我们进行了拉下测定,其中ID1101(筛选的最高命中)和ID2901被生物素化并与核提取物一起孵育。进行蛋白质印迹和质谱法来鉴定与片段相互作用的关键转录因子(图8)。为了进行数据分析,将ID1101针对随机序列599(在每个细胞系中)的平均值进行归一化。在两种细胞系中,将截止值设置为相对于599的两倍富集。为了过滤转录因子,从UniProt获得了所有转录因子的列表,并与两种细胞系中检测到的蛋白质重叠。
在免疫共沉淀实验中,SOX2在GSC7和GSC328中被ID1101特异性拉下,这证明SOX2与增强子结合(图8)。这在质谱法中得到了证实,因为SOX2在GSC328中富集了23倍,并在G7中富集了4.4倍,证实了该转录因子的结合。
此外,上述数据和图8J中显示的数据表明,围绕所述基序的序列背景(语法)在功能上很重要,因为野生型(WT)序列上下游20bp的替换导致活性完全丧失。
实施例12-SOX二聚体基序帮助在计算机中过滤活性增强子
我们假设该基序的存在可能具有提高我们对哪个增强子有活性的预测能力。为了检验这一假设,我们将基序映射到原始SOX2 ChIP-seq数据集的所有全长增强子。根据其在GBM或神经干细胞中具有已知功能的预测靶基因以及基因组内的聚类(意味着相同的预测靶基因的调节),选择70个区域进行初始筛选。将它们在Nanoglo DLR测定中进行测试。这些被称为“成簇的SOX二聚体基序增强子”(CSE)。因此,利用SOX二聚体基序频率和合理设计,我们将鉴定阳性增强子的成功率提高了约11倍;从原始筛选(52/2610)中的~2%到我们合理选择(16/70)中的~22.8%。通过流式细胞术在GSC7、GSC328、HEK293和huFb170中进一步验证阳性命中(图9)。
对209个增强子进行了额外的筛选,以鉴定更多的活性增强子。根据其预测的基序(称为minCSE-参见表1),增强子被减少至160bp。基于来自人类蛋白质图谱的数据(https://www.proteinatlas.org/),混合来自不同靶基因的160bp增强子片段以覆盖途径如增殖、干性或者脑富集/脑特异性的或神经胶质瘤富集/神经胶质瘤特异性的预测靶基因,以产生进一步的SSE用于筛选。
表8:具有基因组坐标、预测的靶基因及其从增强子片段到TSS的距离验证的CSE命中
结论
转录因子结合位点的作图、染色质可及性或增强子相关组蛋白标记广泛用于寻找关键转录因子(TF)和相关增强子。然而,主要限制是TF结合相当混杂,并且功能增强子仅代表一小部分。我们在此证明,组合功能增强子序列的阵列可以导致形成合成的超级增强子。通过利用内源功能增强子序列的自然“语法”但将这些序列以最佳大小和簇进行组合,我们能够在不牺牲细胞类型选择性的情况下获得转录激活协同增加的SSE。因此,我们的数据支持单个增强子可以组合来产生合成的超级增强子,该超级增强子保留选择性,但在驱动转录方面非常强大。
参考文献
Arnold等2013“Genome-wide quantitative enhancer activity mapsidentified by STARR-seq.”Science 339(6123):1074-1077
Bailey等2009.“MEME Suite:Tools for Motif Discovery and Searching.”Nucleic Acids Research 37(Suppl.2):202–8.
Boumahdi等2014.“SOX2 controls tumour initiation and cancer stem-cellfunctions in squamous-cell carcinoma.”Nature 511(7508):246-50.
Bulstrode等2017.“Elevated FOXG1 and SOX2 in Glioblastoma EnforcesNeural Stem Cell Identity through Transcriptional Control of Cell Cycle andEpigenetic Regulators.”Genes&Development 31(8):757–73.
Corish和Tyler-Smith,1999.“Attenuation of Green Fluorescent ProteinHalf-Life in Mammalian Cells.”Protein Engineering 12(12):1035–40.
Farley等2015“Suboptimization of Developmental Enhancers.”Science(NewYork,N.Y.)350(6258):325–28.
Gangemi等2009“SOX2 Silencing in Glioblastoma Tumor-Initiating CellsCauses Stop of Proliferation and Loss of Tumorigenicity.”Stem Cells 27(1):40–48.
Gibson等2009“Enzymatic Assembly of DNAMolecules up to Several HundredKilobases.”Nature Methods 6(5):343–45.
Guerra-Rebollo等2019“Targeting of Replicating CD133 and OCT4/SOX2Expressing Glioma Stem Cells Selects a Cell Population That ReinitiatesTumors upon Release of Therapeutic Pressure.”Scientific Reports 9(1):9549.
Huang等2015“SOXE Transcription Factors Form Selective Dimers on Non-Compact DNA Motifs through Multifaceted Interactions between Dimerization andHigh-Mobility Group Domains.”Scientific Reports 5(January):1–12.
Jolma等2013“Multiplexed Massively Parallel SELEX for Characterizationof Human Transcription Factor Binding Specificities.”Genome Research 20(6):861–73.
Karlsson,Von Hofsten和Olsson,2001“Generating Transparent Zebrafish:ARefined Method to Improve Detection of Gene Expression during EmbryonicDevelopment.”Marine Biotechnology 3(6):522–27.
Kawakami,2007“Tol2:A Versatile Gene Transfer Vector in Vertebrates.”Genome Biology 8(Suppl.1):1–10.
Kwan等2007“The Tol2kit:A Multisite Gateway-Based Construction Kit forTol2 Transposon Transgenesis Constructs.”Developmental Dynamics 236(11):3088–99.
Lopez-Bertoni等2015“DNMT-Dependent Suppression of MicroRNA Regulatesthe Induction of GBM Tumor-Propagating Phenotype by Oct4 and Sox2.”Oncogene34(30):3994–4004.
Lujan等2012“Direct Conversion of Mouse Fibroblasts to Self-Renewing,Tripotent Neural Precursor Cells.”PNAS 109(7):2527–32.
MacLeod等2019“Genome-Wide CRISPR-Cas9 Screens Expose GeneticVulnerabilities and Mechanisms of Temozolomide Sensitivity in GlioblastomaStem Cells.”Cell Reports 27(3):971-986.e9.
Martella等2017“EMMA:An Extensible Mammalian Modular Assembly Toolkitfor the Rapid Design and Production of Diverse Expression Vectors.”ACSSynthetic Biology 6(7):1380–92.
Mclean等2010“GREAT Improves Functional Interpretation of Cis-Regulatory Regions.”Nature Biotechnology 28(5):495–501.
Muerdter等2018“Resolving Systematic Errors in Widely Used EnhancerActivity Assays in Human Cells.”Nature Methods 15(2):141–49.
Nusslein-Volhard and Dahm,2002“Zebrafish:a practical approach”NewYork:Oxford University Press:303pages.
Pollard等2009“Glioma stem cell lines expanded in adherent culturehave tumor-specific phenotypes and are suitable for chemical and geneticscreens”Cell Stem Cell 4(6):568-80.
Quinlan和Hall,2010“BEDTools:A Flexible Suite of Utilities forComparing Genomic Features.”Bioinformatics 26(6):841–42.
D.K.Singh等2017“Oncogenes Activate an Autonomous TranscriptionalRegulatory Circuit That Drives Glioblastoma.”Cell Reports 18(4):961–76.
S.K.Singh等2004“Identification of Human Brain Tumour InitiatingCells.”Nature 432(7015):396–401.
Soufi等2015“Pioneer Transcription Factors Target Partial DNA Motifson Nucleosomes to Initiate Reprogramming.”Cell 161(3):555–68.
Stothard,2000“Internet On-Ramp.”BioTechniques 28(6):1102–4.
Stricker等2013“Widespread resetting of DNA methylation inglioblastoma-initiating cells suppresses malignant cellular behavior in alineage-dependent manner”Genes Dev.27(6):654-69.
Suvà等2014“Reconstructing and Reprogramming the Tumor-PropagatingPotential of Glioblastoma Stem-like Cells.”Cell 157(3):580–94.
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
序列表
<110> 爱丁堡大学董事会
<120> 功能性核酸分子和方法
<130> PE961716WO
<160> 89
<170> PatentIn版本3.5
<210> 1
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_特征
<222> (7)..(7)
<223> R代表A或G
<220>
<221> misc_特征
<222> (9)..(9)
<223> S代表C或G
<220>
<221> misc_特征
<222> (10)..(10)
<223> V代表A, C或G
<220>
<221> misc_特征
<222> (11)..(11)
<223> B代表C, G或T
<220>
<221> misc_特征
<222> (12)..(12)
<223> Y代表C或T
<220>
<221> misc_特征
<222> (14)..(15)
<223> K代表G或T
<400> 1
acaaagrgsv bytkk 15
<210> 2
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_特征
<222> (1)..(4)
<223> R代表A或G
<220>
<221> misc_特征
<222> (6)..(6)
<223> S代表C或G
<220>
<221> misc_特征
<222> (8)..(8)
<223> R代表A或G
<220>
<221> misc_特征
<222> (11)..(13)
<223> R代表A或G
<220>
<221> misc_特征
<222> (14)..(15)
<223> B代表C, G或T
<220>
<221> misc_特征
<222> (16)..(16)
<223> H代表A
<220>
<221> misc_特征
<222> (17)..(18)
<223> D代表A, G或T
<220>
<221> misc_特征
<222> (19)..(19)
<223> B代表C, G或T
<220>
<221> misc_特征
<222> (20)..(20)
<223> W代表A或T
<220>
<221> misc_特征
<222> (21)..(21)
<223> H代表A, C或T
<400> 2
rrrrasarag rrrbbhddbw h 21
<210> 3
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_特征
<222> (1)..(1)
<223> W代表A或T
<220>
<221> misc_特征
<222> (2)..(2)
<223> S代表C或G
<220>
<221> misc_特征
<222> (4)..(4)
<223> R代表A或G
<220>
<221> misc_特征
<222> (7)..(7)
<223> R代表A或G
<220>
<221> misc_特征
<222> (8)..(8)
<223> S代表C或G
<220>
<221> misc_特征
<222> (9)..(9)
<223> M代表A或C
<220>
<221> misc_特征
<222> (10)..(10)
<223> Y代表C或T
<220>
<221> misc_特征
<222> (11)..(11)
<223> M代表A或C
<220>
<221> misc_特征
<222> (12)..(12)
<223> H代表A, C或T
<220>
<221> misc_特征
<222> (14)..(15)
<223> B代表C, G或T
<400> 3
wsaragrsmy mhtbb 15
<210> 4
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 4
gtgagtgtga ctcacatgct ggcatcagag cccctcttag agcttagaac actgggcctc 60
tgtcaggcaa agaaaaggag tccctatgaa tagccatctc cacaaatagc agttactgtc 120
acttcttaaa agacacaagc atggctggag accggcactg 160
<210> 5
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 5
tgcatgttct tgggaaaaag tggtatttaa tgaaggcgct ttgagctgaa tcaaagagcc 60
tcattcttct gaaagtcctt cttcctagtc tctgcatccg gctcctatca aaggaaatcc 120
acagctttgg cttttcgttg ctgttgtcat ggaaatcgtt 160
<210> 6
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 6
gaaattggat cctgaggaga atgtcaccac ctctttgaca ataactagct ttcagagctg 60
aacacagtga atctggatac tgtgtatatg tttaaatgag ttaggaaatg acatcacatt 120
atttatttct tcttttgtga cttagtaaat tgacttggcc 160
<210> 7
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 7
tacaatctat tctccatagt catcagagtt tctttaaagg cacggttcag acaatggcac 60
cctctgttcc aaaccctcca gggcttccta tttcacttag cataaaaacc aaagtcctca 120
caatgaccga caagtcttca cacaatgtgc cccttcattg 160
<210> 8
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 8
gagcaggcag tcatttggtt cccttctctg aatgcattgg ctctgatcca cggcgcctca 60
ggaagtgaaa gggagcaggc agtgaggcca agccatgaat gttgggccct tttcttagaa 120
aacaaagggt tcactttagg ctaggaggaa acatccgggg 160
<210> 9
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 9
gtcggcggaa ctgagtctcc tttgtggagc ccctcatttg catgataaac cccggggaca 60
aagtgtgttc ttgttacttg gactgtttct tggaaactgc tgctacctgg agcgagtgaa 120
cacagggcaa gtattctcgc ccacagcaac gtgtcattga 160
<210> 10
<211> 137
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 10
caacgttttt ggcagatgca gctctttctg aacagtaagt cattgttgag tgacatgaat 60
aggacgagag ctacagaaaa tgaaggtttc aaaagattgt ctaaaacaaa agtcctttca 120
gtcccgtatt cagagtt 137
<210> 11
<211> 123
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 11
ataaattccg attagccaag gaagctctga gtctaaatac cagcaaagct cagcccctgc 60
aagtggggac gaattatttg aaaggtcatc ctagagacac tgaacaaagg gcctctagca 120
gct 123
<210> 12
<211> 138
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 12
ccaatgccaa agcagtttac attttacaga tgccatggca accgtcagga agttaccctg 60
tatggtctaa gagggggagg aaccctcagt tccgggaatt gcccgcccct ttcccggaaa 120
ctcatgaata atccaccc 138
<210> 13
<211> 161
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 13
cgttccccct taacaaaagc cacctcctcc ctcctgaaag gcaccattgg tcaccaaaac 60
aagtcccctt tgtcctccac cgcagctgga gcctgggcct tccatctcct gggggccaat 120
aaaaccccag atcagccaat cctccctccc tggctctgtc a 161
<210> 14
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 14
cagcaaaggc tgcacgcaat gggggagggg gaaggaggga aggatatttc ctccttttta 60
gatcagtttc ttttctgagc acaagtgctt tctgtgtcat cctaacaatg taagagccca 120
ctaagtttag gacgcataat accggccttt gttctactcc 160
<210> 15
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 15
tccaaacact cccctgcaac agatgtacac acagagccca ttgttttctc tagaaatgta 60
aactgcacgt cacagttact ccatacacac cacaaacaga ctccctttgt tctcaggata 120
tgtgttgaca caagaatatg tcatcctctc agctccagac 160
<210> 16
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 16
tgaaagagat gggtgtgtgg gagtggggga agctgagctc caggcagaca gcacagagcc 60
gccttgtcca acccagccag gtgccatggc aaccaacaaa ggccccattg tcccgtgtct 120
gctgggcctt cctgaggctc tggggtcaga gtcccggtt 159
<210> 17
<211> 154
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 17
ttgtcctgcc tttgagaaca ctggaagggc actgaaggct gaccagcatg cacctcaccc 60
cacctcctct ctgtctcatc ctcagccatc taagcgggag actcatcagg cttaaattct 120
cattcttatc caagattctt ctgcttcaaa tgag 154
<210> 18
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 18
tctaaatgga gatcctccca taaagggagt tctgtttggg cttcccttgg aagtccattg 60
aaagcgtttc acatttcaat gcttctttac attctcctct agaatgaatc tggaagggcc 120
atttcattcc agccctatca gatttactac ttcctcctgt 160
<210> 19
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 19
aagaatgaac tgggcccagc tgggcatttg catcaaagtg cctcaccaga gttcccagct 60
gctctggcag agtgcccagg cttgccccag agcccaaaca gaatgctctt tgagatgcct 120
ctggttttca 130
<210> 20
<211> 156
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 20
tacccttcca ggggagcagt ttcctggctg tgtcgtcaga tactgtggtt tacgctgttc 60
cggagtctgg aggtctgtgt gcctttgatc tctttcccaa ctaatttgca cagctgctgt 120
ggaggccctc atgaatgacc tctttctttc ctttct 156
<210> 21
<211> 154
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 21
ttgtcctgcc tttgagaaca ctggaagggc actgaaggct gaccagcatg cacctcaccc 60
cacctcctct ctgtctcatc ctcagccatc taagcgggag actcatcagg cttaaattct 120
cattcttatc caagattctt ctgcttcaaa tgag 154
<210> 22
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 22
acaaactaaa cacagacatt ttctcaatta gtcattttca ggtttattgc ctaagatgct 60
aattgaaatt cagggcaggc aaaaatacat cattggcctt tgtatatctt tgaaaggcct 120
tctgatggga ccttgctccg tataaaggct tctcttctct 160
<210> 23
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 23
gaccttgcct ctttctggcc tgtggccttt ctcctccccc agctgctgtc tggccgcccc 60
acccccaagt ctctgccaca accaaagctc ctttgttgcc tccccctgcc ccgggcctct 120
ccacctgctg ctagctcaat cccctctttg tgtggttggt 160
<210> 24
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 24
cattctttgc agataggaaa cagtttgcta tctgagagac tggccaaaaa ccttactttc 60
aagtaaaata gggctctatt cataagctcc tacatgtaca caagttactc tttatactcc 120
tttcagacaa tgataagaat agaaactatt taattcagga 160
<210> 25
<211> 125
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 25
acagcagcca gaggaagtgg ctgtgtacag agagcttttg tgagagaaga gggggagggg 60
gaaagagcaa agaaaaagaa ggaaagaaga gagggaagag gccagagaca gagaaggcca 120
gagca 125
<210> 26
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 26
atcacaaagt ggttagcatg caggggagtg cgccggtccc ccgcctgtat ttgcatgaca 60
aaagcgcctg cccaacggct ctcggtggct ttgttgagag ctgcagcctc gctcaggctg 120
agccttggga attgttcccc gacattggtt gttcctgggc 160
<210> 27
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 27
gggcaacaaa ggatgccatg caaagcagct cagaacttga gttgtttcaa cagatgctgt 60
tttatgtttt gccaaagaat ggcccctttt atttctgtca tgaatgcagt ctttctttca 120
gtttctaaat gtttgccagt attaacccta atccttatct 160
<210> 28
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 28
acagaagccg ttgctgcagt aaccactgcc gcaagagcaa ctttggcagc aggcaggtgc 60
caggcagcaa gctgagagaa cactgacaga ttcaaagtgt cttcagatac aaggctttgt 120
ttgtgcacag tgaacaaagg gcatattggg aaggcctcc 159
<210> 29
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 29
cccagactgc catctccacg gcccccacac cagcacacag atgcctcatt cacgtggtgc 60
tcccagggcc tggcaccagt tctgaggctt aaaataggca cacaacgggc ctttgtcgga 120
tagaggaagg aaggaaggag cgtttcagac aaaggagaca 160
<210> 30
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 30
accctttgca gagaggaaag agaaaggagg tctcctgttg gggagatctg ctttagaggt 60
taggaagaat ggtggagttg taagacattg gaatcactgt ctaggaagga cagtggcctt 120
ttatccaggg ctatttaaaa acagacagag cttcatctat 160
<210> 31
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 31
ttcctgcatc tggccctctt tgagagcccc ttgtgtgcca atgacaaacc cttctttatt 60
taagctcctc tgaagtgcct tcctggtctt ggcagctgga cagggccctg aataagacag 120
cgagcctcaa tggcaggcta ccccagggct gggtgacgta 160
<210> 32
<211> 159
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 32
tgcctctctt ccattggcat tggagtggct ataggccttt ggaggacctg gcaaagggga 60
agttgattta ggggttcatt gaattgaggg gaagtatgta agtggtttgc agtcacttcc 120
ttgtgtggta ctcttgtata gtaatgattt cctggaata 159
<210> 33
<211> 150
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 33
atgttaaaca gtgaaatcat cagcaaaaag cacaaaactg cagaaaacat ggcactaaat 60
agaacacaaa aaggacactt gtttacagta tgagagcaga aacaaggaaa cagtgtttcc 120
ttgttcagcc acagctggga ccttgtgtgt 150
<210> 34
<211> 105
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 34
gcattcattt tacagctggg gtaagctttc tctgaaatgc agctggaata ggcatttcaa 60
aggcccacag tgttatgcaa atgcttctat tctccatgtg ggcgg 105
<210> 35
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 35
aaatggtgat tatcatcatt tgttcaggga cattagcatg aaggccgaat gttctggcac 60
aaagacacgt ctgtgggaca ggcac 85
<210> 36
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 36
aagaatgaac tgggcccagc tgggcatttg catcaaagtg cctcaccaga gttcccagct 60
gctctggcag agtgcccagg cttgccccag agcccaaaca gaatgctctt tgagatgcct 120
ctggttttca 130
<210> 37
<211> 890
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 37
atctcatata tgtgtatatg tatttatgat ttacatatat acagacgtat cacacactcc 60
gaatagaata cagatttcct tcaatgacag caacaactca atgacccgcc cactagcatg 120
gctaaaatac taaaccacta gatagcttta tgtgaacttg agcttgattg tttcttagct 180
ctgcttcaga acctcatgat catgtgcatg caatttctac agaagcggaa acgtagatgc 240
tgtgggtcag tgagcattcc tttccagggt gcttctgaga tgaagcccca cgattaacac 300
agggccctta atgatgggcg ggggactaag cattccaaga ttggcctgga ttcctgccag 360
aagggagaga aaggggtctt tgtatgtgga catctgaagg gcgggcataa acatgttagt 420
tgatacttaa cacccaaaac cagtgccaaa accgttagct cccctcaata gcctactctg 480
gtttcaactg tccgcgacaa tggagcagcc acctcaatat acaaaacttg ctctttaaac 540
atcctcagag gaattcccaa aatagcagct gttagaagca aacagactct aattcattga 600
catatgcaga ccttttaatg tttttctggt gacgtttaca tttttttttg tacctacgcc 660
atctatgcat ttttaataat taccttgtag attacgtatg caatccctcc aggcacttga 720
agaaggagcc ccgggattca tcatcagatg aaattgttag tttttacggc aagaggccca 780
gctaatttat gcggggaatt tttcagacgt ttttcctctg ggctcccttc cctgctgtcc 840
tcgcgccttt cttcctcagt acattaagag attctgatgt gcctgcagca 890
<210> 38
<211> 594
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 38
agataaagcc agaaataaaa gggaaagaaa cagttatatg attttggtgg gaatttgcag 60
aaatacaggc tgaagctgaa gtcttccatc aggtgaggtt ttttccattg atctcatctc 120
tcgggctcag ctcttttatc tccagcgcat tttggatgtg gcttctcttt ccacctgctg 180
ggcctttaga tagagtactt ccttttgttt caaggtagca tttaactgag tctggaaaaa 240
ccatcattaa gggaaaataa agctgaaaga tgaattgaaa actatgtaaa agggcccttt 300
caggctgccg gagagattgc ctttccagcc taatgagcct gtgctgcctc tgattcagat 360
ggtgcaagga caggagaaaa gaatggagtt ttgtgcactg cgattttcca aagcacataa 420
tgcttagtca tttggggtgt taggaaagag agaaagtcgg agcggagtgt gtggtgaagt 480
gagagaaaga aagaaggctg aattttcgtt aagctgctca aatgcctgct ttaacaaaag 540
tctgccaggg ctagaggtga ttagccatca gtgctgctgc tgtttttgct gtcg 594
<210> 39
<211> 524
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 39
ctctttgggt ctaggtatca ttttgggatc acatcatgat aactctatgt gtgtgtgctg 60
ggagggcaaa gttgcaaagc aattactcag caatgctgaa gaaagaagca attactggaa 120
cacattttag ccccgcttgt cagagtgact ttcactgggg cacaagggaa gcattcactt 180
aggcagtatc cctttcagag gcttaattta gttttttctt ccctttaatt gtgtgattcc 240
agtattttag ctacaatccc taggctgtag gaacctttaa acacttcttt ttataaaaga 300
aatgcatggg cttttgaaga ataaacaggg ggctgcataa tttataggaa aatggcacca 360
tggacttttc cttcacaaag aacattgggg ttacattgga acaagccaaa tatgttttta 420
atgaatagtc agtaatcagc agcagctaca gtaagtgctt gaaatttttc ttttatgtgc 480
tatgagtcca caaactaagc atctgattct gattgcagcc atga 524
<210> 40
<211> 391
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 40
gtagagaata gattctgtag ggcttttaac ctccactgtt attccaagga tggggctcag 60
cttccttctt ttcctttctg actctgtcta tatcaagggt cccgtgggtt gttcctttcc 120
attgtggtct cactgcccag ctttaaggca ccatcctggc acagtgatag gtttaccttt 180
gtctaaaagt gtccatttgc atctctgtgg ccttcttgcc tgggtgacac ccacttgatt 240
aggcatttgc ccagtgtgag atcagagtcc ctcatttaca tttccccaca atagtgaatg 300
gcttacaggc tgttcaaata cagtttctaa acagtgaata attcagccag aaagccagcc 360
ttttaaggtt tggatttggg gcatttctga g 391
<210> 41
<211> 276
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 41
tcccttggaa agtgttcaaa tcaaagctac ctttatacca cactcctttg tgtcctgatg 60
tcctgaatag tgagattatc gggtacaccc acctgttcct gcacttcctt cctgctcaat 120
ttaaataaac aatgagctgt ttttcttctt gacaaagagc cagtctatac aacagcagca 180
ggaagattac tttctatctg tatgcaaaca gatacatagc tgagttctct ccaatccccg 240
ggaaaagacc cttttaacta aatgacttat gcttct 276
<210> 42
<211> 408
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 42
gccataattt gaacctcgga gtgccccact gacagccaac gacaccagag ggtccctttg 60
tatgtaagga ttgcatgact ccagttgaat gacccaagcc ggggacaaac aggaaagaac 120
ccagcagctc tggaggccac ttgagctgac tgtcaaatgc tctgggctga ttaacgacta 180
cgaacttcag ggaagacaag tgtgctttga tgccacagag ctatcctggg cctgtacagg 240
cccgtttctg ctctgaatga ggaagctgta ctttgcaggc acccggcaga acaagaatag 300
ggcctaagat acctgaatga agggcacaga ggaagtacaa aatacagtca ttgttggagc 360
tagaagctgg tgccaggcta cgagggggcc cagtggccaa gcattatg 408
<210> 43
<211> 345
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 43
tgtcgggcag ccaagacctg tcagggacaa gagtgctgtg agctgcgggc tggtgggtgg 60
aaggagagag gcccctggtg ctcctgccaa gccaaggaat gtgtcattgc tgtgctgtgc 120
cttcagcctg gcatttggga acaaagaggt actttgtatg gataacatag accaggttgt 180
tggggaaggg atcagagatg ggggtagacc catttttaaa aatctgctca tgtcccaggc 240
aagttttttt ggcagggatt gcagttgggc tattacaaag agctgctgta cacgaggggt 300
atgtctacta ctgtcaaatt acagcagcaa ttatcttggg cactg 345
<210> 44
<211> 677
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 44
ctcgataccc acattcctaa ccttttaatg ccaagcagcc tataagcatg tcaaatttta 60
ctcatgttcc tgctctttcc actcaagttg gctttgtggg ttgctggttt tatcaaaatt 120
gagtgagagt gtgttcaata caatgttgga ttcattaggg agaaaaaagc caaataaaaa 180
ccttgcttct tcaatgccag gagcttacaa agacatataa accatgagga attccaagga 240
cttgctcaga agccgttctg caaatgcatt tcttgaacaa agggccaatg ttcctttcag 300
ggaagagcgc gggactggtt tccggcattt ttctttaaat cattaggacc atgccagcaa 360
acaaacatat acagcccctg ggagaaagaa tctcattcaa cacagcttac aagagtttga 420
ttattaggga ggggtgcttc atggcacgtg cctcaccagc cggcccccaa atgtacagat 480
ctgtttaaag ggctttattg atggtggccg cagacagata gagcttgtga ggagaactga 540
catcccatgg atactaacat atcagcatca tcctgaccag cacacaatcc agtcagagag 600
agctgaaaag tctgcctcat tcccttgaaa atgtgcttct taagacaaat aaaatataga 660
aataagaaat tcacctc 677
<210> 45
<211> 663
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 45
atggacaatg gcagcctgaa agaatatgag ggagggtcac cagtgatgga catggtttgg 60
ggagagccca agaattgaag gggacttggg attgttgaca gaccttccac atctcagaat 120
gggggaagtg gtttcttttt tcctcattct ccaaggcttc tcagtctcag agaccccaag 180
agatgccatt aatacagatt cctcctctgg ctcctttgag acatttgctt ttgaaggacc 240
tggaagagaa agctctttgt atgtggccag aataaactca ttgtacaccc aaacaattaa 300
ctcctcaatg gacttgccag ccccttgaaa ggcctggccc tgcgtccctg gacctcttgg 360
gctctattca gtcccttaag cacaccaatg tttttgggtt tttgttttgt tttgtttgtt 420
attctgaaaa gtctttccct gagaatagtc tgagcggatc aacattgtcc tcagcctggc 480
atttatctct cctcgccagc gaatgtcaat caggaatcaa aaagccaaac agaggaggct 540
ttgaacggtg tcatcggggg tcgaagtgac ttccagctgt ctgtgcgtgg gccaggcctt 600
ctcgcagggc aaggaattgt gctgtcacac aaacccactg tctgtatagg ctcacagagc 660
cca 663
<210> 46
<211> 365
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 46
ctggggaaca aaacttagat cttgatcatc cagcatagct ctggcatgct gagcgtgtga 60
tacacctgtc tctaccgtca ggcaaacgag tgggttcaca ggcagaggcc tgccctgcca 120
aacaatgctc ccctttgtcc ccgcccaggg ctcaggagcc gcaaggaagc caaatccatc 180
agcacttgtc agggcccttg atgcacacaa tgcaagttat gatccacagt ccccggcaaa 240
gccccaggct tccagcaggc agcattaact gacacgcaat gtgtcagtca gccttctaaa 300
agccaggggt ggggatccgt gccagggggc cactgagctc tcattcccag aagccaacca 360
gagcc 365
<210> 47
<211> 673
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 47
gccttttagc tgattaacaa atacagtgaa tttaactttg tagattctta acatttaaag 60
acaacagtct aaggcaattt aaagtatatt ctgccaatca gttgttgagt tagaccaccc 120
atagcctttt tttattcttc attgtttgaa taatatggga ggaaatttag tgtatactct 180
cttcttcctg tattttccag ttagattaag ctgttgtctt cacaattgcc tcccagctgc 240
tgtgacttgt gaaaacaaca gaccctgctc tgttgtctgg agaaagccgg gattgttatg 300
agtaacttta ttgcaggcac atgagtgtgt taagacttta aaacacgctc aaatgtcatg 360
tgcacaccca atgacgggca agaataatta tgaaaaaaca agaaatctat gtctatgaaa 420
ccgtgttgga caaaatgggc cattcattgt gttcccctgg gaatgcctgg actctgcagt 480
cagaaaacaa aaaaggcact tttttcctgc cgtaggctga atgcttagct ttgccatctg 540
agccctaaga aaacatgggc ccctctactg ctggcgcacc cacgcacact aaaaaatatt 600
aatgcctctc tctccttact tttttccagg cattccctcg tgtaggctgt agccaatata 660
atgtcaacac aaa 673
<210> 48
<211> 306
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 48
gaacagcact taaatattaa tagcatcact gggaaaacac gacagctatt tccctgtttt 60
ctgcagctca atgaagagtt gttcagtgca gaccccagtg ctcttgcctc atgaatggac 120
gtgattgtgg ggacatcatc tcctactaag gcaaaacgtg acactgagaa caaaggctgg 180
tttttagcct gatgtgatga gctcacccca gtgcccatgt ggggactttg aagctcgtcc 240
aggtgccagt tttctgtgta tatgacattc ttggttgggg agggtgtgga ctgggcagca 300
ggcttt 306
<210> 49
<211> 379
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 49
ataagccctt taaattaaat ctttatgcag attctatttt atactccaaa cttttcatgg 60
agccttgtgt aattctgatg tgtaaaccaa caaacagaga ggctctgtgt atggagtagc 120
tggtttggat accagctggc ttggctgtgc gcctttctaa tggtaatgaa gtcacacagc 180
tgctaggaca atcagctgga gttcagattg tcactagcta aatggatatc cattgactag 240
cttcttatcc ggactcatta aagtttagta ttgacaaata gtggctggag gtttacaact 300
aagaggcatg tagaaatgaa cttgttgact attttttccc tatagctttt gctttgtgat 360
tcacagaatg tcattcatc 379
<210> 50
<211> 398
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 50
gccaacaact catatagtgg aggcttgagc acaccatgct tattcccaga gttccaatgc 60
tctgcttttg aaccattacc atgcctttca gcagcactgt caacagagct cagagaaggt 120
cttgaactcc agagaatgaa tgagatatgc caaatgaagc ataattactt tattgacgtc 180
attcagcttt caactcacat ttaatgagaa agcttctact gcttgaaaca gtgggccatt 240
tgtagcacat tatgcaaatg ataagactaa tcttttgcat tatacataag agctgcttat 300
tgtgcattaa ctaatttatc tgactaggaa ggggctatga atgctgattt ttattaagct 360
cttcattaag tgaaaatgta ggcatggcaa gtgcatat 398
<210> 51
<211> 490
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 51
atacatttta gcaccaaaca caatttaata acagggcaca gaggccgcaa agcctcctga 60
ttctgttcca ttactaattt atcaggggct gaaagcaacc aaacttagga tcccaggcag 120
acaatggagc ctttgagggg caagggaagc atcatttaaa aggaaagcat taccattcta 180
aaataatggc aaagcacatg aactgagtgc tctgaaagag agcactacaa aaaaggtatt 240
ctcagcttaa atgccccaaa cacaaaagct tttagttggg acttagacgg gaaaaagaaa 300
atagctccca ataaattggt tttaccagta tccttttgtg tgtgctggtg ccaagggggc 360
gagggtacag gcaaagcgtg attttccaaa acctagctga attatgtttc ttctttagaa 420
caaaacccaa cattttgcta atgaggataa agacagtaaa actgatattc ctgtgctatt 480
actaacttgg 490
<210> 52
<211> 621
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 52
cagaggagag aggaggtcat ttgggaccat ttactcatgc gagagtcact gccccatgct 60
aagatttccc ctaaaaataa aatgataaga taataactca taatgctctc cccaaatcag 120
taccacacag acccccctct tctgtttgct cagacccccg ctctccagca caaagtcttt 180
attggtctcc ctgcaggggt gaaaataaag ggggttttgt tcttctcctc cccctccccc 240
ctcgaagggc tgagtgagtt tatctgacac tgcagcagtc tttgtaaact gagtgtccca 300
ggataaacgc tcccttaaga gtcgcttggc ctgggacaga gggaccctct ccagaggaga 360
atggggagct tgttccaatg gtcttttaat atggggggcg gggtgtcacc aaggacaggc 420
ctccagcaca ctctcacaga agggtctctg tcctgaggct acagtggagg gaattcttaa 480
agacacagat gctgaaaagg gggaaggaat ttttttttcc cctaagggga ggggagggag 540
gttagggcgg gaaggagaag ggggagtggc gaggactcct cattccccag aacaattcca 600
gttacaacaa ggcgtctcta t 621
<210> 53
<211> 534
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 53
aggaagaagc atgctgggtc atttttgcct tgtttctagc tgcatgaatt gaaaagccag 60
gcccaggttc aatgcatcat tcttgaagca gtgaacaaaa tccctctttg ttccccagtg 120
aaacttatct ctgaagagct gcactacttc ctgtgagata tagccctgca gatgtgtcgt 180
gggagacccg cccggctgca ctgccttcca taaaagtgca agaatgggca ctttgtactg 240
ctggactgaa aatgacactc actcttctga tccccactgg ggttaccaag tgggcaaaac 300
ttcctgctta gaggaggggt catagacagc agggggagtg tgtgattttg ttttgttcct 360
ttgtgaattt gtttagctat ttatagagct aaaggagaaa gcaaacgggc acaatgtagc 420
acagtgtttt tcaaagtgta ttccatggaa ccctttcgtg ggttgcagac cccaggggtg 480
gaggcagagg atggggtggt gacagcagca ggtgctgtcc agggccttct gtct 534
<210> 54
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 54
ggacaggcct ccagcacact ctcacagaag ggtctctgtc ctgaggctac agtggaggga 60
attcttaaag acacagatgc tgaaaagggg gaaggaattt ttttttcccc taaggggagg 120
ggagggaggt tagggcggga aggagaaggg ggagtggcga 160
<210> 55
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 55
ggcaaacgag tgggttcaca ggcagaggcc tgccctgcca aacaatgctc ccctttgtcc 60
ccgcccaggg ctcaggagcc gcaaggaagc caaatccatc agcacttgtc agggcccttg 120
atgcacacaa tgcaagttat gatccacagt ccccggcaaa 160
<210> 56
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 56
gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60
gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120
tacctgaatg aagggcacag aggaagtaca aaatacagtc 160
<210> 57
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 57
aatggacgtg attgtgggga catcatctcc tactaaggca aaacgtgaca ctgagaacaa 60
aggctggttt ttagcctgat gtgatgagct caccccagtg cccatgtggg gactttgaag 120
ctcgtccagg tgccagtttt ctgtgtatat gacattcttg 160
<210> 58
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 58
caaacacaat ttaataacag ggcacagagg ccgcaaagcc tcctgattct gttccattac 60
taatttatca ggggctgaaa gcaaccaaac ttaggatccc aggcagacaa tggagccttt 120
gaggggcaag ggaagcatca tttaaaagga aagcattacc 160
<210> 59
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 59
ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt aaaccaacaa acagagaggc 60
tctgtgtatg gagtagctgg tttggatacc agctggcttg gctgtgcgcc tttctaatgg 120
taatgaagtc acacagctgc taggacaatc agctggagtt 160
<210> 60
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 60
ggtcagtgag cattcctttc cagggtgctt ctgagatgaa gccccacgat taacacaggg 60
cccttaatga tgggcggggg actaagcatt ccaagattgg cctggattcc tgccagaagg 120
gagagaaagg ggtctttgta tgtggacatc tgaagggcgg 160
<210> 61
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 61
gatgtggctt ctctttccac ctgctgggcc tttagataga gtacttcctt ttgtttcaag 60
gtagcattta actgagtctg gaaaaaccat cattaaggga aaataaagct gaaagatgaa 120
ttgaaaacta tgtaaaaggg ccctttcagg ctgccggaga 160
<210> 62
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 62
caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 60
tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 120
ggcttaattt agttttttct tccctttaat tgtgtgattc 160
<210> 63
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 63
ttcttttcaa ggatgcccaa agcgtgtgac tcttacagag agccaatggg gaaaggcagt 60
gtcgggacta agcaatgaat ggctcttcaa tggccagctg cccgcccaat aggataaaag 120
aaaaccccac ataatacttc cctttgtctc caaaaaaatt 160
<210> 64
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 64
gtgagtgtga ctcacatgct ggcatcagag cccctcttag agcttagaac actgggcctc 60
tgtcaggcaa agaaaaggag tccctatgaa tagccatctc cacaaatagc agttactgtc 120
acttcttaaa agacacaagc atggctggag accggcactg tgcatgttct tgggaaaaag 180
tggtatttaa tgaaggcgct ttgagctgaa tcaaagagcc tcattcttct gaaagtcctt 240
cttcctagtc tctgcatccg gctcctatca aaggaaatcc acagctttgg cttttcgttg 300
ctgttgtcat ggaaatcgtt gaaattggat cctgaggaga atgtcaccac ctctttgaca 360
ataactagct ttcagagctg aacacagtga atctggatac tgtgtatatg tttaaatgag 420
ttaggaaatg acatcacatt atttatttct tcttttgtga cttagtaaat tgacttggcc 480
tacaatctat tctccatagt catcagagtt tctttaaagg cacggttcag acaatggcac 540
cctctgttcc aaaccctcca gggcttccta tttcacttag cataaaaacc aaagtcctca 600
caatgaccga caagtcttca cacaatgtgc cccttcattg 640
<210> 65
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 65
gaaattggat cctgaggaga atgtcaccac ctctttgaca ataactagct ttcagagctg 60
aacacagtga atctggatac tgtgtatatg tttaaatgag ttaggaaatg acatcacatt 120
atttatttct tcttttgtga cttagtaaat tgacttggcc tacaatctat tctccatagt 180
catcagagtt tctttaaagg cacggttcag acaatggcac cctctgttcc aaaccctcca 240
gggcttccta tttcacttag cataaaaacc aaagtcctca caatgaccga caagtcttca 300
cacaatgtgc cccttcattg gagcaggcag tcatttggtt cccttctctg aatgcattgg 360
ctctgatcca cggcgcctca ggaagtgaaa gggagcaggc agtgaggcca agccatgaat 420
gttgggccct tttcttagaa aacaaagggt tcactttagg ctaggaggaa acatccgggg 480
gtcggcggaa ctgagtctcc tttgtggagc ccctcatttg catgataaac cccggggaca 540
aagtgtgttc ttgttacttg gactgtttct tggaaactgc tgctacctgg agcgagtgaa 600
cacagggcaa gtattctcgc ccacagcaac gtgtcattga 640
<210> 66
<211> 580
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 66
gagcaggcag tcatttggtt cccttctctg aatgcattgg ctctgatcca cggcgcctca 60
ggaagtgaaa gggagcaggc agtgaggcca agccatgaat gttgggccct tttcttagaa 120
aacaaagggt tcactttagg ctaggaggaa acatccgggg gtcggcggaa ctgagtctcc 180
tttgtggagc ccctcatttg catgataaac cccggggaca aagtgtgttc ttgttacttg 240
gactgtttct tggaaactgc tgctacctgg agcgagtgaa cacagggcaa gtattctcgc 300
ccacagcaac gtgtcattga caacgttttt ggcagatgca gctctttctg aacagtaagt 360
cattgttgag tgacatgaat aggacgagag ctacagaaaa tgaaggtttc aaaagattgt 420
ctaaaacaaa agtcctttca gtcccgtatt cagagttata aattccgatt agccaaggaa 480
gctctgagtc taaataccag caaagctcag cccctgcaag tggggacgaa ttatttgaaa 540
ggtcatccta gagacactga acaaagggcc tctagcagct 580
<210> 67
<211> 559
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 67
caacgttttt ggcagatgca gctctttctg aacagtaagt cattgttgag tgacatgaat 60
aggacgagag ctacagaaaa tgaaggtttc aaaagattgt ctaaaacaaa agtcctttca 120
gtcccgtatt cagagttata aattccgatt agccaaggaa gctctgagtc taaataccag 180
caaagctcag cccctgcaag tggggacgaa ttatttgaaa ggtcatccta gagacactga 240
acaaagggcc tctagcagct ccaatgccaa agcagtttac attttacaga tgccatggca 300
accgtcagga agttaccctg tatggtctaa gagggggagg aaccctcagt tccgggaatt 360
gcccgcccct ttcccggaaa ctcatgaata atccaccccg ttccccctta acaaaagcca 420
cctcctccct cctgaaaggc accattggtc accaaaacaa gtcccctttg tcctccaccg 480
cagctggagc ctgggccttc catctcctgg gggccaataa aaccccagat cagccaatcc 540
tccctccctg gctctgtca 559
<210> 68
<211> 618
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 68
ccaatgccaa agcagtttac attttacaga tgccatggca accgtcagga agttaccctg 60
tatggtctaa gagggggagg aaccctcagt tccgggaatt gcccgcccct ttcccggaaa 120
ctcatgaata atccaccccg ttccccctta acaaaagcca cctcctccct cctgaaaggc 180
accattggtc accaaaacaa gtcccctttg tcctccaccg cagctggagc ctgggccttc 240
catctcctgg gggccaataa aaccccagat cagccaatcc tccctccctg gctctgtcat 300
ccaaacactc ccctgcaaca gatgtacaca cagagcccat tgttttctct agaaatgtaa 360
actgcacgtc acagttactc catacacacc acaaacagac tccctttgtt ctcaggatat 420
gtgttgacac aagaatatgt catcctctca gctccagact gaaagagatg ggtgtgtggg 480
agtgggggaa gctgagctcc aggcagacag cacagagccg ccttgtccaa cccagccagg 540
tgccatggca accaacaaag gccccattgt cccgtgtctg ctgggccttc ctgaggctct 600
ggggtcagag tcccggtt 618
<210> 69
<211> 633
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 69
tccaaacact cccctgcaac agatgtacac acagagccca ttgttttctc tagaaatgta 60
aactgcacgt cacagttact ccatacacac cacaaacaga ctccctttgt tctcaggata 120
tgtgttgaca caagaatatg tcatcctctc agctccagac tgaaagagat gggtgtgtgg 180
gagtggggga agctgagctc caggcagaca gcacagagcc gccttgtcca acccagccag 240
gtgccatggc aaccaacaaa ggccccattg tcccgtgtct gctgggcctt cctgaggctc 300
tggggtcaga gtcccggttt tgtcctgcct ttgagaacac tggaagggca ctgaaggctg 360
accagcatgc acctcacccc acctcctctc tgtctcatcc tcagccatct aagcgggaga 420
ctcatcaggc ttaaattctc attcttatcc aagattcttc tgcttcaaat gagtctaaat 480
ggagatcctc ccataaaggg agttctgttt gggcttccct tggaagtcca ttgaaagcgt 540
ttcacatttc aatgcttctt tacattctcc tctagaatga atctggaagg gccatttcat 600
tccagcccta tcagatttac tacttcctcc tgt 633
<210> 70
<211> 600
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 70
ttgtcctgcc tttgagaaca ctggaagggc actgaaggct gaccagcatg cacctcaccc 60
cacctcctct ctgtctcatc ctcagccatc taagcgggag actcatcagg cttaaattct 120
cattcttatc caagattctt ctgcttcaaa tgagtctaaa tggagatcct cccataaagg 180
gagttctgtt tgggcttccc ttggaagtcc attgaaagcg tttcacattt caatgcttct 240
ttacattctc ctctagaatg aatctggaag ggccatttca ttccagccct atcagattta 300
ctacttcctc ctgtaagaat gaactgggcc cagctgggca tttgcatcaa agtgcctcac 360
cagagttccc agctgctctg gcagagtgcc caggcttgcc ccagagccca aacagaatgc 420
tctttgagat gcctctggtt ttcataccct tccaggggag cagtttcctg gctgtgtcgt 480
cagatactgt ggtttacgct gttccggagt ctggaggtct gtgtgccttt gatctctttc 540
ccaactaatt tgcacagctg ctgtggaggc cctcatgaat gacctctttc tttcctttct 600
<210> 71
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 71
gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60
gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120
tacctgaatg aagggcacag aggaagtaca aaatacagtc aatggacgtg attgtgggga 180
catcatctcc tactaaggca aaacgtgaca ctgagaacaa aggctggttt ttagcctgat 240
gtgatgagct caccccagtg cccatgtggg gactttgaag ctcgtccagg tgccagtttt 300
ctgtgtatat gacattcttg ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt 360
aaaccaacaa acagagaggc tctgtgtatg gagtagctgg tttggatacc agctggcttg 420
gctgtgcgcc tttctaatgg taatgaagtc acacagctgc taggacaatc agctggagtt 480
caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 540
tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 600
ggcttaattt agttttttct tccctttaat tgtgtgattc 640
<210> 72
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 72
gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60
gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120
tacctgaatg aagggcacag aggaagtaca aaatacagtc caaacacaat ttaataacag 180
ggcacagagg ccgcaaagcc tcctgattct gttccattac taatttatca ggggctgaaa 240
gcaaccaaac ttaggatccc aggcagacaa tggagccttt gaggggcaag ggaagcatca 300
tttaaaagga aagcattacc ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt 360
aaaccaacaa acagagaggc tctgtgtatg gagtagctgg tttggatacc agctggcttg 420
gctgtgcgcc tttctaatgg taatgaagtc acacagctgc taggacaatc agctggagtt 480
caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 540
tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 600
ggcttaattt agttttttct tccctttaat tgtgtgattc 640
<210> 73
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 73
aatggacgtg attgtgggga catcatctcc tactaaggca aaacgtgaca ctgagaacaa 60
aggctggttt ttagcctgat gtgatgagct caccccagtg cccatgtggg gactttgaag 120
ctcgtccagg tgccagtttt ctgtgtatat gacattcttg caaacacaat ttaataacag 180
ggcacagagg ccgcaaagcc tcctgattct gttccattac taatttatca ggggctgaaa 240
gcaaccaaac ttaggatccc aggcagacaa tggagccttt gaggggcaag ggaagcatca 300
tttaaaagga aagcattacc ggtcagtgag cattcctttc cagggtgctt ctgagatgaa 360
gccccacgat taacacaggg cccttaatga tgggcggggg actaagcatt ccaagattgg 420
cctggattcc tgccagaagg gagagaaagg ggtctttgta tgtggacatc tgaagggcgg 480
caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 540
tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 600
ggcttaattt agttttttct tccctttaat tgtgtgattc 640
<210> 74
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 74
ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt aaaccaacaa acagagaggc 60
tctgtgtatg gagtagctgg tttggatacc agctggcttg gctgtgcgcc tttctaatgg 120
taatgaagtc acacagctgc taggacaatc agctggagtt ggtcagtgag cattcctttc 180
cagggtgctt ctgagatgaa gccccacgat taacacaggg cccttaatga tgggcggggg 240
actaagcatt ccaagattgg cctggattcc tgccagaagg gagagaaagg ggtctttgta 300
tgtggacatc tgaagggcgg caattactca gcaatgctga agaaagaagc aattactgga 360
acacatttta gccccgcttg tcagagtgac tttcactggg gcacaaggga agcattcact 420
taggcagtat ccctttcaga ggcttaattt agttttttct tccctttaat tgtgtgattc 480
ttcttttcaa ggatgcccaa agcgtgtgac tcttacagag agccaatggg gaaaggcagt 540
gtcgggacta agcaatgaat ggctcttcaa tggccagctg cccgcccaat aggataaaag 600
aaaaccccac ataatacttc cctttgtctc caaaaaaatt 640
<210> 75
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 75
gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60
gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120
tacctgaatg aagggcacag aggaagtaca aaatacagtc ctccaaactt ttcatggagc 180
cttgtgtaat tctgatgtgt aaaccaacaa acagagaggc tctgtgtatg gagtagctgg 240
tttggatacc agctggcttg gctgtgcgcc tttctaatgg taatgaagtc acacagctgc 300
taggacaatc agctggagtt ggtcagtgag cattcctttc cagggtgctt ctgagatgaa 360
gccccacgat taacacaggg cccttaatga tgggcggggg actaagcatt ccaagattgg 420
cctggattcc tgccagaagg gagagaaagg ggtctttgta tgtggacatc tgaagggcgg 480
caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 540
tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 600
ggcttaattt agttttttct tccctttaat tgtgtgattc 640
<210> 76
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 76
caaacacaat ttaataacag ggcacagagg ccgcaaagcc tcctgattct gttccattac 60
taatttatca ggggctgaaa gcaaccaaac ttaggatccc aggcagacaa tggagccttt 120
gaggggcaag ggaagcatca tttaaaagga aagcattacc ctccaaactt ttcatggagc 180
cttgtgtaat tctgatgtgt aaaccaacaa acagagaggc tctgtgtatg gagtagctgg 240
tttggatacc agctggcttg gctgtgcgcc tttctaatgg taatgaagtc acacagctgc 300
taggacaatc agctggagtt ggtcagtgag cattcctttc cagggtgctt ctgagatgaa 360
gccccacgat taacacaggg cccttaatga tgggcggggg actaagcatt ccaagattgg 420
cctggattcc tgccagaagg gagagaaagg ggtctttgta tgtggacatc tgaagggcgg 480
ttcttttcaa ggatgcccaa agcgtgtgac tcttacagag agccaatggg gaaaggcagt 540
gtcgggacta agcaatgaat ggctcttcaa tggccagctg cccgcccaat aggataaaag 600
aaaaccccac ataatacttc cctttgtctc caaaaaaatt 640
<210> 77
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 77
gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60
gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120
tacctgaatg aagggcacag aggaagtaca aaatacagtc aatggacgtg attgtgggga 180
catcatctcc tactaaggca aaacgtgaca ctgagaacaa aggctggttt ttagcctgat 240
gtgatgagct caccccagtg cccatgtggg gactttgaag ctcgtccagg tgccagtttt 300
ctgtgtatat gacattcttg caattactca gcaatgctga agaaagaagc aattactgga 360
acacatttta gccccgcttg tcagagtgac tttcactggg gcacaaggga agcattcact 420
taggcagtat ccctttcaga ggcttaattt agttttttct tccctttaat tgtgtgattc 480
ttcttttcaa ggatgcccaa agcgtgtgac tcttacagag agccaatggg gaaaggcagt 540
gtcgggacta agcaatgaat ggctcttcaa tggccagctg cccgcccaat aggataaaag 600
aaaaccccac ataatacttc cctttgtctc caaaaaaatt 640
<210> 78
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 78
gggaagacaa gtgtgctttg atgccacaga gctatcctgg gcctgtacag gcccgtttct 60
gctctgaatg aggaagctgt actttgcagg cacccggcag aacaagaata gggcctaaga 120
tacctgaatg aagggcacag aggaagtaca aaatacagtc aatggacgtg attgtgggga 180
catcatctcc tactaaggca aaacgtgaca ctgagaacaa aggctggttt ttagcctgat 240
gtgatgagct caccccagtg cccatgtggg gactttgaag ctcgtccagg tgccagtttt 300
ctgtgtatat gacattcttg ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt 360
aaaccaacaa acagagaggc tctgtgtatg gagtagctgg tttggatacc agctggcttg 420
gctgtgcgcc tttctaatgg taatgaagtc acacagctgc taggacaatc agctggagtt 480
ttcttttcaa ggatgcccaa agcgtgtgac tcttacagag agccaatggg gaaaggcagt 540
gtcgggacta agcaatgaat ggctcttcaa tggccagctg cccgcccaat aggataaaag 600
aaaaccccac ataatacttc cctttgtctc caaaaaaatt 640
<210> 79
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 79
ctccaaactt ttcatggagc cttgtgtaat tctgatgtgt aaaccaacaa acagagaggc 60
tctgtgtatg gagtagctgg tttggatacc agctggcttg gctgtgcgcc tttctaatgg 120
taatgaagtc acacagctgc taggacaatc agctggagtt ggtcagtgag cattcctttc 180
cagggtgctt ctgagatgaa gccccacgat taacacaggg cccttaatga tgggcggggg 240
actaagcatt ccaagattgg cctggattcc tgccagaagg gagagaaagg ggtctttgta 300
tgtggacatc tgaagggcgg gatgtggctt ctctttccac ctgctgggcc tttagataga 360
gtacttcctt ttgtttcaag gtagcattta actgagtctg gaaaaaccat cattaaggga 420
aaataaagct gaaagatgaa ttgaaaacta tgtaaaaggg ccctttcagg ctgccggaga 480
caattactca gcaatgctga agaaagaagc aattactgga acacatttta gccccgcttg 540
tcagagtgac tttcactggg gcacaaggga agcattcact taggcagtat ccctttcaga 600
ggcttaattt agttttttct tccctttaat tgtgtgattc 640
<210> 80
<211> 640
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 80
caaacacaat ttaataacag ggcacagagg ccgcaaagcc tcctgattct gttccattac 60
taatttatca ggggctgaaa gcaaccaaac ttagggcaga caatggagcc tttgaggggc 120
aagggaagca tcatttaaaa ggaaagcatt accggtcagt gagcattcct ttccagggtg 180
cttctgagat gaagccccac gattaacaca gggcccttaa tgatgggcgg gggactaagc 240
attccaagat tggcctggat tcctgccaga agggagagaa aggggtcttt gtatgtggac 300
atctgaaggg cggcaattac tcagcaatgc tgaagaaaga agcaattact ggaacacatt 360
ttagccccgc ttgtcagagt gactttcact ggggcacaag ggaagcattc acttaggcag 420
tatccctttc agaggcttaa tttagttttt tcttcccttt aattgtgtga ttcttctttt 480
caaggatgcc caaagcgtgt gactcttaca gagagccaat ggggaaaggc agtgtcggga 540
ctaagcaatg aatggctctt caatggccag ctgcccgccc aataggataa aagaaaaccc 600
cacataatac ttccctttgt ctccaaaaaa attatcccag 640
<210> 81
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 81
tgatccgtct cgccctacta ggttactggt gcatgc 36
<210> 82
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 82
actaacgtct cggagcaccc aaactattgg agcgag 36
<210> 83
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 83
tcaaagagcc tcatt 15
<210> 84
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 84
tcaaagagcc att 13
<210> 85
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 85
tcaaagagat cctcatt 17
<210> 86
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 86
ttactccgag aaact 15
<210> 87
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 87
tctaagagcc tcaat 15
<210> 88
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 88
aacaatatgc agtgtt 16
<210> 89
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 89
ggcgatatcg tacgc 15

Claims (19)

1.超级增强子,其由一个或多个转录因子激活,其中所述超级增强子包含源自不同基因组基因座的两个或多个增强子序列,其中每个增强子序列包含所述转录因子的结合位点。
2.根据权利要求1所述的超级增强子,其中所述超级增强子内的两个或多个增强子序列中的每一个小于300个核苷酸长,特别是约160个核苷酸长,并且其中所述超级增强子小于1200个核苷酸长,特别是小于700个核苷酸长。
3.根据权利要求1或2所述的超级增强子,其中所述超级增强子包含四个增强子序列。
4.根据权利要求1至3中任一项所述的超级增强子,其中所述超级增强子包含至少一个SOX二聚体基序和/或至少一个SOX基序。
5.根据权利要求4所述的超级增强子,其中所述SOX二聚体基序包含SEQ ID NO:1。
6.根据权利要求4所述的超级增强子,其中所述SOX基序包含SEQ ID NO:3。
7.根据权利要求1至6中任一项所述的超级增强子,其中所述超级增强子包含表1中呈现的一个或多个增强子序列。
8.根据权利要求1至7中任一项所述的超级增强子,其中所述超级增强子包含与选自SEQ ID NO:64-80的序列具有至少80%序列同一性的序列。
9.根据前述权利要求中任一项所述的超级增强子,其中每个增强子序列还包含位于其基因组基因座中存在的转录因子的结合位点上游和/或下游的20至400个核苷酸。
10.功能性核酸分子,其包含与转基因可操作地连接的根据权利要求1至9中任一项所述的超级增强子。
11.根据权利要求10所述的功能性核酸,其中所述转基因编码用于在细胞中表达的基因、治疗有效负载或重编程因子。
12.功能性核酸分子,其包含超级增强子和不利的有效负载,所述超级增强子由在靶异常细胞中表达的一个或多个转录因子激活,其中所述有效负载在超级增强子被所述一个或多个转录因子激活时表达。
13.根据权利要求12所述的功能性核酸分子,其中所述转录因子在所述靶异常细胞中差异表达,并且任选地其中所述转录因子是发育或干细胞隶属转录因子。
14.根据权利要求12或权利要求13所述的功能性核酸分子,其中所述不利有效负载编码刺激免疫应答的蛋白质,所述免疫应答导致细胞毒性免疫细胞的招募。
15.根据权利要求12或权利要求13所述的功能性核酸分子,其中所述不利有效负载是自杀基因,所述自杀基因编码能够将无活性前药转化为细胞毒性药物的蛋白质。
16.组合物,其包含根据权利要求11至15中任一项所述的功能性核酸分子,用于治疗癌症,例如胶质母细胞瘤。
17.超级增强子,其由SOX家族的一个或多个转录因子激活,其中所述超级增强子包含两个或多个增强子序列和至少一个SOX基序和/或SOX二聚体基序。
18.根据权利要求17所述的超级增强子,其中所述两个或多个增强子序列中的每一个具有不同的序列。
19.根据权利要求17或权利要求18所述的超级增强子,其中所述超级增强子内的两个或多个增强子序列中的每一个小于300个核苷酸长,特别是约160个核苷酸长。
CN202280011408.1A 2021-01-27 2022-01-26 功能性核酸分子和方法 Pending CN116867901A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP21153875.6 2021-01-27
EP21153875.6A EP4036238A1 (en) 2021-01-27 2021-01-27 Functional nucleic acid molecule and method
PCT/GB2022/050206 WO2022162361A1 (en) 2021-01-27 2022-01-26 Functional nucleic acid molecule and method

Publications (1)

Publication Number Publication Date
CN116867901A true CN116867901A (zh) 2023-10-10

Family

ID=74346875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280011408.1A Pending CN116867901A (zh) 2021-01-27 2022-01-26 功能性核酸分子和方法

Country Status (9)

Country Link
US (1) US20240092847A1 (zh)
EP (2) EP4036238A1 (zh)
JP (1) JP2024504412A (zh)
KR (1) KR20230137399A (zh)
CN (1) CN116867901A (zh)
AU (1) AU2022212766A1 (zh)
BR (1) BR112023014906A2 (zh)
CA (1) CA3206298A1 (zh)
WO (1) WO2022162361A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB202211123D0 (en) * 2022-07-29 2022-09-14 Univ Edinburgh Cancer treatment
CN116286991B (zh) * 2023-02-10 2023-10-13 中国农业科学院农业基因组研究所 全基因组增强子筛选系统、筛选方法及应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2479278A1 (en) 2011-01-25 2012-07-25 Synpromics Ltd. Method for the construction of specific promoters
US20140296218A1 (en) 2012-10-25 2014-10-02 Whitehead Institute For Biomedical Research Super-enhancers and methods of use thereof
US20140287932A1 (en) 2012-10-25 2014-09-25 Whitehead Institute For Biomedical Research Super-enhancers and methods of use thereof
MA43735A (fr) 2016-03-07 2018-11-28 Univ Iowa Res Found Expression médiée par aav utilisant un promoteur et un activateur synthétiques

Also Published As

Publication number Publication date
CA3206298A1 (en) 2022-08-04
AU2022212766A1 (en) 2023-08-24
BR112023014906A2 (pt) 2023-10-31
EP4284935A1 (en) 2023-12-06
EP4036238A1 (en) 2022-08-03
KR20230137399A (ko) 2023-10-04
US20240092847A1 (en) 2024-03-21
JP2024504412A (ja) 2024-01-31
WO2022162361A1 (en) 2022-08-04

Similar Documents

Publication Publication Date Title
JP6867440B2 (ja) 三構成要素CRISPR/Cas複合体系およびその使用
JP2022081503A (ja) CRISPR/Cas9の核送達を通じた細胞RNAの追跡と操作
EP2877213B1 (en) Inducible dna binding proteins and genome perturbation tools and applications thereof
Ding et al. Tex10 coordinates epigenetic control of super-enhancer activity in pluripotency and reprogramming
JP2022184901A (ja) モジュラーAAV送達システムによるCRISPR-Casゲノム編集
CA3169710A1 (en) Type vi-e and type vi-f crispr-cas system and uses thereof
ES2891087T3 (es) Vectores de ADN, trasposones y transposasas para la modificación del genoma eucariota
US20160186208A1 (en) Methods of Mutating, Modifying or Modulating Nucleic Acid in a Cell or Nonhuman Mammal
JP2018505219A (ja) エピゲノム編集のための組成物および方法
CN109982710A (zh) 靶向增强的dna去甲基化
CN116867901A (zh) 功能性核酸分子和方法
JP6956416B2 (ja) トランスポゾン系、それを含むキット及びそれらの使用
CN107709544A (zh) 使用合成转录因子的核重编程方法
JP2022545461A (ja) 細胞型運命指定の調節因子を同定するための組成物および方法
US20230174958A1 (en) Crispr-inhibition for facioscapulohumeral muscular dystrophy
EP3359676A1 (en) Transposon system, kit comprising the same, and uses thereof
BR112021014442A2 (pt) Composições de regulação gênica e métodos para imunoterapia aprimorada
US20230086489A1 (en) Novel design of guide rna and uses thereof
WO2024023530A1 (en) Functional nucleic acid molecule and method
KR20230002611A (ko) 세포 분류기 회로 및 그의 사용 방법
WO2023212677A2 (en) Identification of tissue-specific extragenic safe harbors for gene therapy approaches
CN117062912A (zh) 用于基于crispr的转录抑制的融合蛋白
Borchardt MOLECULAR APPROACHES FOR CONTROLLING RNA STABILITY

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination