CN101410516B - 核酸相互作用分析 - Google Patents

核酸相互作用分析 Download PDF

Info

Publication number
CN101410516B
CN101410516B CN2007800091831A CN200780009183A CN101410516B CN 101410516 B CN101410516 B CN 101410516B CN 2007800091831 A CN2007800091831 A CN 2007800091831A CN 200780009183 A CN200780009183 A CN 200780009183A CN 101410516 B CN101410516 B CN 101410516B
Authority
CN
China
Prior art keywords
polynucleotide
label
oligonucleotide
restriction endonuclease
recognition site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007800091831A
Other languages
English (en)
Other versions
CN101410516A (zh
Inventor
阮一骏
丽莎
卫嘉玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agency for Science Technology and Research Singapore
Original Assignee
Agency for Science Technology and Research Singapore
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency for Science Technology and Research Singapore filed Critical Agency for Science Technology and Research Singapore
Publication of CN101410516A publication Critical patent/CN101410516A/zh
Application granted granted Critical
Publication of CN101410516B publication Critical patent/CN101410516B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/313Type II endonucleases, i.e. cutting outside recognition site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/101Crosslinking agents, e.g. psoralen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/131Modifications characterised by incorporating a restriction site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/197Modifications characterised by incorporating a spacer/coupling moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR

Abstract

本发明提供了一种分离的寡核苷酸和使用该分离的寡核苷酸对核酸-蛋白质复合物中的至少两种多聚核苷酸进行检测和/或识别的方法。所述寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签和第二标签得自核酸-蛋白质复合物。

Description

核酸相互作用分析
技术领域
一般来说,本发明涉及基因表达领域。更确切地说,本发明涉及核酸的相互作用。特别地,本发明涉及对核酸-蛋白相互作用的情况和相互作用的组分进行分析、检测和识别。
背景技术
染色质的相互作用是重要的基因调控方式。最近完成的人类基因组测序提供了遗传信息的框架。然而,人类基因组的结构和信息通常表现为一维线性关系,该一维线性关系不足以解释细胞系统的复杂性和协同性。为了理解基因组怎样作为和谐地结合的系统(orchestrated system)在活细胞的三维细胞核中真实地作用,需要一种完全不同的视角。基因组DNA(估计伸长后为两米长)浓缩在位于细胞核中的染色体中,仅仅几微米。已知染色体被不均匀地组织成常染色质和异染色质,它们被染色质蛋白所包装并通过用于转录和复制的转录因子所转达。
这些活性看来是有序的。可以观察到,大的染色体环包括活性基因。此外,还暗示了远端调控元件(如基因座控制区(LCR)、增强子、和绝缘子)通过将特定的遗传位点重新定位至活性转录或沉默转录的区域起作用。近期在β-球蛋白以及最近在细胞因子基因(IFN-γ)的研究中证明了LCRs可以直接与位于同一个染色体的相距较远的启动子相互作用,甚至可以直接与位于不同的染色体的启动子相互作用。染色体内和染色体间相互作用可能是发生在重要路径的协同基因调节中的多遗传位点的普遍现象。疾病中也暗含有染色体内-染色体间相互作用。例如,染色体易位可以导致myc转录物的调节紊乱,所述染色体易位使位于染色体15上的c-myc/pvt-1基因座与位于染色体12上的免疫球蛋白位点并列。此外,全基因组水平的染色体间相互作用的分析对所有相互作用的识别是必需的,并且将清楚地显示出细胞中的高水平的基因调节。
用于染色质相互作用的研究的技术:大多数用于研究三维结构和染色质相互作用的方法均存在大量的限制。可以解决此问题的技术可以简单地分为:可视化工具,如显微镜法、荧光素原位杂交(FISH)、和RNA标签和相关蛋白的复性(RNA-TRAP);和分子生物学方法,如染色体构象捕获(3C)、和3C后的染色质免疫沉淀法(3C-ChIP)。
在许多早期研究中,显微镜法被应用于研究细胞核中染色质的空间组织。然而,这种细胞遗传学方法仅能够提供染色体中染色质的粗略片段信息。荧光素原位杂交(FISH)是这一方向中的重要改进,FISH通过荧光标记的DNA或RNA探针与基因组DNA的杂交,使特定的遗传位点定位到染色体上特定的物理位置。然而,该方案仍然是受限制的。对FISH进行改进的RNA-TRAP是一种能够显示出远端的增强子与基因启动子在物理位置上极为接近的方法。
染色体构象捕获(3C)最初被设计成研究酵母染色体的构造(Dekker等,2002),以及用于研究遗传成分的相互作用,所述遗传成分分散在相距较远的范围内和/或分散在不同的染色体中。在染色体构象捕获(3C)中,用甲醛对DNA-蛋白(染色质)结构进行体内交联,并且通过限制性内切核酸酶将染色质消化成片段。然后,通过连接将具有DNA结合蛋白的DNA片段结合,再通过PCR对两种疑似已知的成分的连接物进行检测。通过特定的DNA结合蛋白或转录因子调节的染色质相互作用的检测,可以通过染色质免疫沉淀法(3C-ChIP)被进一步增强,其中,通过抗体拉开试验(antibody pull-down)使3C过程中导致的与蛋白交联的嵌合DNA片段浓缩。
虽然每种单独的技术和一些结合被证实能够用于对一些特定的染色体内和染色体间相互作用进行识别,但是这些方法依赖于关于存在哪些的远端染色质相互作用的已有知识或推测,以及依赖于设计成用于通过PCR以每次一个区域的方式对这种连接进行检测的引物。因而,目前用于研究染色质相互作用的技术在识别新的染色质相互作用以及全基因组水平的大范围识别上受到了极大的限制。
虽然对染色体在空间上被组装入细胞核中的方式以及如何同时调节远端基因的转录十分感兴趣,但目前仅能够得到零散的和间接的信息。在此方面缺乏信息主要是由于缺乏能够有效地解决染色体相互作用的三维问题的强有力的技术。
本领域需要能够有效地解决染色体相互作用的三维问题的更有效的方法和更强有力的技术,以克服现有技术存在的缺点及限制。
发明内容
本发明通过提供一种用于对核酸复合物中,特别是对核酸-蛋白质复合物中的至少一种核酸序列或片段进行检测、识别、和/或制备的新方法而解决了上述问题。特别地,本发明的方法提供了一种对核酸-蛋白质复合物中至少两种核酸序列或片段进行检测、识别、和/或制备的方法。本发明还涉及一种寡核苷酸,该寡核苷酸是由根据本发明的任意一个实施方式的方法制备得到的。本发明还提供了一种用于识别染色质相互作用的情况的方法,所述染色质相互作用的情况是通过相距较远的特定DNA结合蛋白和不同染色体之间的特定DNA结合蛋白来调节的。
另一方面,本发明通过提供一种分离的寡核苷酸解决了上述提及的问题,所述寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签和所述第二标签为核酸-蛋白质复合物的标签。特别地,本发明提供了一种分离的寡核苷酸,该分离的寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白质复合物。所述第一多聚核苷酸和所述第二多聚核苷酸可以为所述核酸-蛋白质复合物的同一核酸区域或不同核酸区域的一部分。
所述分离的寡核苷酸还可以含有至少一个限制性内切核酸酶识别位点和/或至少一个接头。特别地,所述至少一个限制性内切核酸酶识别位点可以包括在接头中。所述接头可以插在所述标签之间,或者所述接头可以与至少一个标签侧翼连接(即,定位的至少一个标签的上游和/或下游)。所述至少一种限制性内切核酸酶的识别位点可以不对称。例如,所述至少一种限制性内切核酸酶的识别位点可以为IIs型限制性内切核酸酶的识别位点或归巢限制性内切酶(homing restriction enzyme)的识别位点。
所述至少一个第一标签可以含有所述第一多聚核苷酸的5’末端和3’末端,所述至少一个第二标签可以含有所述第二多聚核苷酸的5’末端和3’末端。所述分离的寡核苷酸还可以含有至少一个接头。所述接头可以插在所述标签之间,或者所述接头可以定位在至少一个标签的上游和/或下游。所述接头含有至少一种限制性内切核酸酶的识别位点。所述至少一种限制性内切核酸酶的识别位点可以不对称。例如,所述至少一种限制性内切核酸酶的识别位点可以为IIs型限制性内切核酸酶的识别位点或归巢限制性内切酶的识别位点。
所述接头可以含有第一限制性识别位点和第二限制性识别位点,所述第一限制性识别位点被能够对第一多聚核苷酸进行酶切以得到第一标签的限制性内切核酸酶所识别,所述第二限制性识别位点被能够对第二多聚核苷酸进行酶切以得到第二标签的限制性内切核酸酶所识别。特别地,所述接头可以含有第一限制性识别位点和第二限制性识别位点,所述第一限制性识别位点被能够对第一多聚核苷酸进行酶切以得到第一多聚核苷酸的3’末端的第一限制性内切核酸酶所识别,所述第二限制性识别位点被能够对第二多聚核苷酸进行酶切以得到第二多聚核苷酸的5’末端的第二限制性内切核酸酶所识别。所述第一限制性识别位点和所述第二限制性识别位点可以被相同的或不同的限制性内切核酸酶所识别。
根据另一方面,所述第一多聚核苷酸还可以被能够识别第三识别位点的第三限制性内切核酸酶所酶切,以得到第一多聚核苷酸的5’末端;所述第二多聚核苷酸被能够识别第四识别位点的第四限制性内切核酸酶所酶切,以得到第二多聚核苷酸的3’末端。根据这个实施方式,至少一个第一标签通过连接所述第一多聚核苷酸的5’末端和3’末端获得,至少一个第二标签通过连接所述第二多聚核苷酸的5’末端和3’末端获得。所述第三限制性识别位点和第四限制性识别位点可以被相同的或不同的限制性内切核酸酶所识别。其它的识别位点可以包括在分别连接所述第一多聚核苷酸的5’末端和所述第二多聚核苷酸的3’末端的衔接头中。可供选择性地,所述第三限制性识别位点和第四限制性识别位点可以存在于载体中,该载体中插有第一多聚核苷酸-接头-第二多聚核苷酸结构。在这种情况下,所述第三限制性识别位点与所述第一多聚核苷酸的5’末端侧翼连接,所述第四限制性识别位点与所述第二多聚核苷酸的3’末端侧翼连接。
所述分离的寡核苷酸的核酸-蛋白质复合物可以为染色质结构的一部分。与感兴趣的蛋白结合的核酸片段可以为含有能够与感兴趣的蛋白结合的区域(例如,组蛋白结合位点)的任何核酸片段。所述多聚核苷酸可以为DNA或RNA。
另一个方面,本发明提供了一种寡核苷酸连环体,该寡核苷酸连环体含有至少两个分离的寡核苷酸,每个分离的寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签和所述第二标签为核酸-蛋白质复合物的标签。特别地,本发明提供了一种寡核苷酸连环体,该寡核苷酸连环体含有至少两个分离的寡核苷酸,每个分离的寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签为第一多聚核苷酸的标签,所述第二标签为第二多聚核苷酸的标签,所述第一多聚核苷酸和所述第二多聚核苷酸源自核酸-蛋白质复合物。所述连环体还可以含有至少一个接头。所述接头可以含有至少一种限制性内切核酸酶的识别位点。此外,所述连环体的每一个分离的寡核苷酸均可以含有至少一种限制性内切核酸酶的识别位点。所述至少一个限制性内切核酸酶识别位点包括在所述至少一个接头中和/或至少一个衔接头中。
所述接头可以插在所述标签之间,或者所述接头可以定位在至少一个标签的上游和/或下游。所述接头可以含有至少一种限制性内切核酸酶的识别位点。所述至少一种限制性内切核酸酶的识别位点可以为IIs型限制性内切核酸酶的识别位点或归巢限制性内切酶的识别位点。所述连环体的每一个寡核苷酸的第一标签可以含有源自所述第一多聚核苷酸的5’末端和3’末端;所述第二标签可以含有源自所述第二多聚核苷酸的5’末端和3’末端。
本发明的寡核苷酸或连环体可以插入载体和/或细胞中。所述细胞可以为细菌细胞。
所述多聚核苷酸核酸-蛋白质复合物可以为染色质结构的一部分。所述多聚核苷酸可以被定位在同一个染色体上,或者可以被定位在不同的染色体上。
在另一方面,本发明提供了一种寡核苷酸文库或者含有至少一种寡核苷酸的寡核苷酸连环体文库,所述寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核苷酸-蛋白质复合物。
所述文库中的至少一种寡核苷酸可以含有至少一个接头。所述接头可以插在所述标签之间,或者所述接头可以定位在至少一个标签的上游和/或下游。所述第一标签可以含有源自所述第一多聚核苷酸的5’末端和3’末端;所述第二标签还含有源自所述第二多聚核苷酸的5’末端和3’末端。
另一方面,本发明提供了一种制备至少一种分离的寡核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中,所述第一标签和所述第二标签得自核酸-蛋白质复合物;和
(c)分离所述寡核苷酸。
特别地,本发明提供了一种制备至少一种分离的寡核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白质复合物;和
(c)分离所述寡核苷酸。
在一个实施方式中,本发明此方面的步骤(b)包括:
(i)插入至少一个接头,该接头含有至少一个限制性内切核酸酶识别位点,和
(ii)使用能够识别位于所述接头中的至少一个识别位点的至少一种限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签和位于所述标签之间的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸。
在另一个实施方式中,本发明此方面的步骤(b)包括:
(i)在所述复合物的第一多聚核苷酸和第二多聚核苷酸之间插入至少一个接头,该接头含有至少一个限制性内切核酸酶识别位点;
(ii)在第一多聚核苷酸的5’末端和第二多聚核苷酸的3’末端分别加入至少一个限制性内切核酸酶识别位点;
(iii)使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;和
(iv)连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签、含有每个多聚核苷酸的5’末端和3’末端的标签和插入在该标签之间的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,步骤(ii)中的至少一种限制性内切核酸酶的识别位点为衔接头或载体的一部分。
所述多聚核苷酸可以通过将光活化成分加入到感兴趣的核酸(例如,DNA)和/或蛋白中而从核酸-蛋白质复合物中获得,而核酸/蛋白质复合物可以通过抗体调节的沉淀或亲和力介导的技术进行分离。这种基于亲和力的技术的例子包括:链霉亲和素/生物素、谷胱甘肽-S-转移酶/谷胱甘肽基质、麦芽糖结合蛋白/直链淀粉基质的相互作用。
另一方面,本发明提供了一种用于检测和/或识别核酸-蛋白质复合物中的至少两种多聚核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白质复合物;
(c)对所述寡核苷酸进行测序;和
(d)根据所述第一标签和所述第二标签的核苷酸序列对所述至少两种多聚核苷酸进行定位,从而对所述至少两种多聚核苷酸进行检测和/或识别。
在步骤(c)中进行测序之前,可以对步骤(b)中得到的寡核苷酸进行扩增。所述扩增可以通过聚合酶链式反应进行。在扩增后但在步骤(c)中的测序之前,可以对扩增的寡核苷酸进行至少一个纯化的步骤。所述至少一个纯化的步骤可以为凝胶电泳。
在测序前,本发明的寡核苷酸可以与至少一个通过的步骤(a)-(b)获得的另外的寡核苷酸连接。
通过桑格法(Sanger method)或多重测序分析如焦磷酸(pyrosequencing)测序技术来进行测序。
所述检测和/或识别可以用于所述多聚核苷酸的转移或易位。因此,所述方法可以用于对核酸-蛋白质复合物如位于染色质中的核酸-蛋白质复合物中彼此临近的多聚核苷酸和/或基因进行检测和/或识别。另外,与感兴趣的蛋白结合的核酸片段可以为含有能够与感兴趣的蛋白结合的区域(例如,组蛋白结合位点)的任何核酸片段。所述多聚核苷酸和以为DNA或RNA。
所述寡核苷酸可以被转染至至少一种细胞中。所述转染可以通过电穿孔来实现。所述细胞可以为细菌细胞。所述多聚核苷酸和以为DNA或RNA。
另一个方面,本发明提供了一种载体,该载体包括:寡核苷酸、寡核苷酸的连环体,或者寡核苷酸或连环体的文库。
附图说明
图1显示了本发明的通过成对的末端(双)标签测序进行染色质相互作用分析(CIA-PET)的方法的概述;
图2显示了本发明的另一种通过两个成对的末端(双)标签进行染色质相互作用(CIA-diPET)的方法的概述;
图3显示了对CIA-PET进行定位;CIA-PETs表示的真实的相互作用区域跨越两个不同的基因组区域,并且多重的CIA-PETs为簇生的;
图4显示了用于CIA-PET的相关限制性内切核酸酶的识别序列;每个用N或X表示的碱基可以为任何一种核苷酸(A、C、G或T);含有N和X的区域表示从不同的多聚核苷酸中得到的部分;图中从顶部至底部显示的序列为:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:36、SEQ ID NO:37、SEQID NO:20、SEQ ID NO:21、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQID NO:8、SEQ ID NO:13、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:14、SEQ ID NO:24、SEQ ID NO:25(SEQ ID No:24和SEQ ID No:25重复三次);
图5显示了对CIA-diPET进行定位;CIA-diPET表示的相互作用区域跨越两个不同的基因组区域;并且多重的CIA-diPET为簇生的;由CIA-diPET的两个PETs带来的额外信息有益于将CIA-diPET定位到基因组中;
图6显示了用于CIA-diPET的相关限制性内切核酸酶的识别序列;碱基N或X可以表示任何一种核苷酸(A、C、G或T),并且它们来自不同的多聚核苷酸;数字1和2表示来自两个区域的核苷酸或表示得自一个多聚核苷酸的末端,数字3和4表示来自两个区域的核苷酸或表示得自另一个多聚核苷酸的末端;数字(1、2、3、和/或4)可以表示任何一种核苷酸(A、C、G或T);图中从顶部至底部显示的序列为:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:35(SEQ ID No:24和SEQ ID No:25重复三次);
图7显示了含有多个独特克隆位点的载体pGIS8,载体pGIS8是可以用于本发明的载体的一个例子;
图8显示了不具有插入的接头的寡核苷酸如何不能够被限制性内切核酸酶所酶切的;因而,由于该寡核苷酸过长而通过电泳被去去除;图中从顶部至底部显示的序列为:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:38、SEQ IDNO:39、SEQ ID NO-40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44和SEQ ID NO:45;
图9显示了如果仅仅将部分插头插入至寡核苷酸中,将如何导致寡核苷酸被错误地酶切的,因而,由于该寡核苷酸过长而将通过电泳被去除;图中从顶部至底部显示的序列为:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50、SEQ IDNO:51、SEQ ID NO:52和SEQ ID NO:53;
图10显示了错误插入的接头是如何产生一些寡核苷酸的,这些寡核苷酸过长并且其长度发生变化,因而可以通过电泳而被去除;图中从顶部至底部显示的序列为:SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:54、SEQ IDNO:55、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62和SEQ ID NO:63;
图11显示了载体pGIS8的核苷酸序列,载体pGIS8为已标出不同的限制性内切核酸酶的识别位点的载体实例,所述序列为序列表中的SEQ IDNO:18和SEQ ID NO:19。
具体实施方式
定义
限制性内切核酸酶:限制性内切核酸酶为能够切割双链DNA的酶。所述限制性内切核酸酶可以切出两个切口,一个切口穿过双螺旋的每一个磷酸骨架而不对碱基产生破坏。酶切了的化学键可以通过称为连接酶的其它酶而重新形成,从而将得自不同染色体或基因的限制性酶切片段拼接在一起,其前提是它们的末端完全互补。II型酶识别特定的核苷酸序列,并在临近或位于它们的识别序列位点中的确定的位点对DNA进行酶切。它们生成不连续的限制性酶切片段和不同的凝胶带形式。IIs型酶切开它们的识别序列的外部一侧。MmeI与多数IIs型限制性内切核酸酶一样生成可变的末端长度(Dunn et al,2002showed that Mmel can cut 18/20 or 19/21 bases away in arough proportion of 1:1)。因而,在所有图中给出的序列各自代表一种使用类膜金属内肽酶后的常用变体。
成对的末端双标签(PET)中间体还具有可变的长度(即,在克隆至pGIS8质粒和MPET中间体后的M和G衔接头DNA序列),因为所述多聚核苷酸可以为不同的长度。III性酶还可以为限制性内切核酸酶-修饰酶的较大的联合体。它们切割其识别序列的外部,并且它们需要在同一个DNA分子中具有相反取向的两个这样的序列以完成酶切。归巢内切核酸酶为罕见的双链DNA酶,该酶能识别较大的不对称位点(12-40个碱基对)和编码序列,该编码序列通常嵌入在内含子(DNA)和内含肽(蛋白质)中。限制性内切核酸酶可以进行酶切以使平末端或粘性末端具有突出端。粘性末端片段不仅可以与最初切割的片段连接,还可以与任何具有相容性的黏性或粘性末端的其它片段连接。这样,由不同的酶生成的末端可以为相容的。因此,粘性末端还可以指能被连接的末端。多种II型限制性内切核酸酶能够对回文DNA序列进行酶切。如果限制性内切核酸酶具有非简并回文序列的酶切位点,则由此产生的所有末端是相容的。“回文”序列为在一条链上阅读的序列与反方向阅读其互补链的序列相同的一种序列。这样,对于处理核酸链以获得回文的粘性末端来说,可能使所述核酸链的末端互补并使该核酸链自环化(self-circularize)。上下文中“回文”的意思与其在语言学上的使用的意思是不同的。例如,序列GTAATG不是回文DNA序列,序列GTATAC是回文序列。能够留下黏性或粘性末端的限制性内切核酸酶的例子包括:BamHI、EcoRI和HindIII。能够留下平整的、非黏性的、或非粘性的末端的限制性内切核酸酶的例子包括:BseR1和AluI。
核苷酸:核苷的磷酸酯;核酸(DNA或RNA)的基本结构单位。核苷酸型碱基对:通过氢键结合的化学碱基对中的一种,所述氢键连接具有两条链的DNA分子或RNA分子的互补链;对于DNA,所述碱基对为腺嘌呤-胸腺嘧啶、鸟嘌呤-胞嘧啶;对于RNA,所述碱基对为腺嘌呤-尿嘧啶、鸟嘌呤-胞嘧啶。短链的核苷酸称为寡核苷酸,较长链的核苷酸称为多聚核苷酸。核苷酸可以与另外的核苷酸结合或连接。术语核苷酸可以与术语核酸互换使用。伸长的核酸具有5’末端和3’末端。伸长的核酸的末端区域分别称为5’末端和3’末端。关于多聚核苷酸的5’或3’末端,应该理解的是,含有具有多聚核苷酸的真实5’或3’末端的多聚核苷酸的任何区域、片段、或全部。
连环体:由末端与末端相连的至少两个核苷酸单体序列组成,并且该连环体可以被接头或间隔物随机地隔开。对于本发明的目的,根据本发明的方法制备了含有至少两个寡核苷酸的连环体。
克隆、无性繁殖:从一个有机体向另一个有机体传递核苷酸,例如基因,和/或通过遗传工程技术复制核苷酸。
文库:通常包含在一种或多种质粒中的克隆的核酸序列、寡核苷酸或多聚核苷酸的集合体。
载体:能够将遗传物质从一个细胞转移至另一个细胞中的噬菌体、质粒、或其它介质。
得到、得自:使用分子生物学方法、基因工程技术和操作技术赋予生物材料如核酸和蛋白某些所需要的特性。术语得到和得自可以在本发明中互换使用。
扩增:使核酸的拷贝数增加。通常使用的一种方法为聚合酶链式反应(PCR)。也可以使用本领域技术人员所公知的其它扩增方法。
转染或转化:用于将外源分子引入细胞的任何方法。脂质转染、磷酸钙沉淀、逆转录病毒释放、电穿孔、生物射弹转化仅仅是能够使用的技术中的几个实例。
染色质:核酸与主要是组蛋白的蛋白质的复合物,位于细胞核中容易被碱性燃料所染色,并在细胞分裂期间浓缩形成染色体。染色质是核酸-蛋白质复合物的一个例子。染色体区域可以与同一个染色体上的或不同的染色体上的其它区域相互作用。因此,所述相互作用情况可以为染色体间或染色体内的相互作用情况,并可以包括有关区域的遗传物质的重排。
转移:遗传信息在RNA加工水平的重排以形成新的嵌合的转录物。
易位:遗传信息在基因组DNA水平的重排。
核酸-蛋白质复合物:遗传物质与蛋白质的相互作用,例如,染色质中发现的;或者转录因子与伸长的核酸的结合。DNA-蛋白质-DNA(DPD)是更特殊的结构,其中,蛋白质结合在感兴趣的两个伸长的核酸(DNA)之间。可以将伸长的核酸如DNA作为DNA的标签或识别序列。
标签、标签-接头结构:标签或标记是核酸的识别序列,标签或标记涉及源自任何临近DNA区域的5’-或3’-的大部分核酸序列(末端;通常为18-20bp),或者标签可以含有5’-和3’-大部分的核酸序列或任何临近的DNA区域的两个末端。接头为人工合成的核酸序列。因此,标签-接头-标签结构是一种核酸排列,其中,接头插在两个标签之间。另一个可能的排列为接头-标签-标签-接头结构,其中,接头与标签侧翼连接(即,接头被定位在至少一个标签的上游和/或下游)。术语标签和标记在本发明中可以互换使用。
双标签:短核酸片段(通常为12-60bp)衍生自多聚核苷酸的末端的标签或标记。可以根据美国专利20050255501和/或20050059022的方法来制备双标记,这些专利的内容在此一并引入作为参考。
测序:用于确定生物多聚体中的组分(在此情况下为核酸)的规则的方法。所用的测序技术包括:桑格法(Sanger method)及其改进的变化、以及焦磷酸测序技术或测序的“454法”。
在以下说明书中,提供细节、具体的量和参数以描述本发明的实施方式。然而,对于本领域技术人员来说,本发明可以不以这些细节的方式来实现是显而易见的。为了不使本发明含糊不清,可以不详尽地描述一些细节。
为了实施发明的方法的具体的实施方式、用于实施本发明的其它实施方式公开的内容也可以在此使用,并在此一并引入作为参考。特别是操作方法、试剂、试验条件、限制性酶切位点、酶、载体、引物等等。特别地,很明显本领域技术人员知道如何改变已公开的用于其它实施方式中的技术和材料以适用本发明的实施方式。
本领域的技术人员应该理解的是在此没有具体介绍的技术可以在标准的分子生物学参考书如分子克隆中找到(Molecular Cloning:A LaboratoryManual by Sambrook and Russell,Third Edition,2001,published by ColdSpring Harbor Laboratory Press)。
描述
本发明涉及一种用于对核酸复合物中,特别是对核酸-蛋白质复合物中至少一种核酸序列或片段进行检测、识别、和/或制备的新方法。特别地,本发明的方法提供了一种对核酸-蛋白质复合物中至少两种核酸序列或片段进行检测、识别、和/或制备的方法。本发明还提供了寡核苷酸和/或寡核苷酸连环体。
根据一个方面,本发明提供了一种染色质相互作用的分析(CIA)方法。染色质相互作用的分析被设计成用于捕获关于远端控制区和染色体间的相互作用的全程过程的新信息。该方法被设计成用于在相距较远的位置和不同的染色体之间识别由特定的DNA结合蛋白如组蛋白介导的染色质相互作用情况。
本发明提供了以检测这样的DNA连接的CIA法的两个实施方式,即,CIA-PET法,该方法从两个连接的DNA片段中的每一个中得到单一的标签标记(约20bp)以形成标签1-接头-标签2(还称作“第一标签-接头-第二标签”)成对的末端双标签(PET)结构(图1);和CIA-diPET法,该方法得到两个成对的末端双标签(PET)以在“PET1-接头-PET2”结构中表示两个相关的DNA片段,故称作diPET(图2)。可以使用多重测序技术如“454”焦磷酸测序方法对CIA-PET和CIA-diPET的标签直接测序,或者将CIA-PET和CIA-diPET的标签连接以用于克隆并使用常规的测序方法进行测序。
因此,本发明提供了一种制备至少一种分离的寡核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中,所述第一标签和第二标签得自核酸-蛋白质复合物;和
(c)分离所述寡核苷酸。
所述第一标签可以得自第一多聚核苷酸,所述第二标签可以得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物。
所述步骤(b)可以包括:
(i)插入至少一个接头,该接头含有至少一个限制性内切核酸酶识别位点,和
(ii)使用能够识别位于所述接头中的至少一个识别位点的至少一种限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签和接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸。
特别地,所述步骤(b)可以包括:
(i)在所述复合物的第一多聚核苷酸和第二多聚核苷酸之间插入至少一个接头,该接头含有至少一个限制性内切核酸酶识别位点;
(ii)在第一多聚核苷酸的5’末端和第二多聚核苷酸的3’末端分别加入至少一种限制性内切核酸酶的识别位点;
(iii)使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;和
(iv)连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签、和插在所述标签之间的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述标签含有各个多聚核苷酸的5’末端和3’末端。
本发明还提供了一种用于检测和/或识别核酸-蛋白质复合物中的至少两种多聚核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物;
(c)对所述寡核苷酸进行测序;和
(d)根据所述第一标签和第二标签的核苷酸序列对所述至少两种多聚核苷酸进行定位,从而对所述至少两种多聚核苷酸进行检测和/或识别。
所述接头序列在它的两个末端(图2和4)分别携带一个II型限制性内切核酸酶的识别位点,因而,在II型限制性内切核酸酶消化后,可以分别从两个连接的DNA片段中分离出一个标签序列标记(约20bp),以形成标签-接头-标签结构,其中,一个标签表示染色体的一个DNA区域,另一个标签表示位于同一染色体或不同的染色体上的远端区域的基因座。这种成对的末端双标签结构称作“CIA-PET”,通过连接至更长的伸长DNA中可以有效地对其进行测序,或者通过测序对其进行直接分析。
可供选择地,接头序列可以与两个标签侧翼连接,以生成接头-标签-接头结构。
在这种方法中,所述核酸-蛋白质复合物,例如天然DNA-蛋白质-DNA(DPD)复合物,可以通过合适的固定剂如甲醛、乙醛、或甲醇而被交联。然后,可以通过超声波、水力剪切(Hydroshearing)(Hydroshear,Gene Machines)、皮下注射器针头的反复抽提、或通过限制性内切核酸酶的酶解作用将交联的DPD复合物片段化。源自不同染色体的DNA片段或相距较远的DNA片段被DPD复合物中的DNA结合蛋白所束缚。与需要这些DNA片段是什么的已有信息或推测以生成PCR引物的3C技术不同,束缚在DPD复合物中的具有远端相关性的DNA片段的末端可以使用特定的接头通过连接而结合。
所述接头(约20bp)含有两种II型限制性内切核酸酶的识别位点,这些识别位点能够连接被各个DPD复合物中的蛋白质所束缚的不同DNA片段的末端。然后,可以通过成对的末端双标签(PET)策略(US20050255501)对两个相关的DNA片段的DNA连接位点进行标记。优选IIs型限制性内切核酸酶的识别位点。除了II型限制性内切核酸酶以外,也可以使用任何其它适合的限制性内切核酸酶,包括III型或归巢限制性内切酶。
因而,本发明一方面提供了一种用于识别相距较长距离的染色质相互作用情况和不同的染色体之间的染色质相互作用情况的方法,所述染色质相互作用情况由特定的DNA结合蛋白如组蛋白调节。另一方面,本发明提供了一种分离的寡核苷酸,该寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物。所述标签与核酸-蛋白质复合物中的染色质区域相对应。然后,可以对这些标签进行测序,以对染色质相互作用情况进行分析、识别、和/或检测(图3和5)。
所述分离的寡核苷酸还可以含有至少一个接头。所述接头可以插在所述标签之间,或者所述接头可以定位在至少一个标签的上游和/或下游。所述接头可以含有至少一个限制性内切核酸酶识别位点;所述至少一种限制性内切核酸酶的识别位点可以不对称,所述至少一个限制性内切核酸酶识别位点可以为IIs型限制性内切核酸酶或归巢限制性内切酶的识别位点。
可供选择地,所述至少一个第一标签可以含有源自第一多聚核苷酸的5’末端和3’末端,所述至少一个第二标签可以含有源自第二多聚核苷酸的5’末端和3’末端。所述分离的寡核苷酸还可以含有至少一个接头。所述接头可以插在所述标签之间,或者所述接头可以定位在至少一个标签的上游和/或下游。所述接头可以含有至少一个限制性内切核酸酶识别位点;所述至少一个限制性内切核酸酶识别位点可以不对称,所述至少一个限制性内切核酸酶识别位点可以为IIs型限制性内切核酸酶或者归巢限制性内切酶的识别位点。
所述接头可以含有第一限制性识别位点和第二限制性识别位点,所述第一限制性识别位点可以被能够对第一多聚核苷酸进行酶切以得到第一标签的限制性内切核酸酶所识别;所述第二限制性识别位点可以被能够对第二多聚核苷酸进行酶切以得到第二标签的限制性内切核酸酶所识别(图1和4)。
所述接头可以含有第一限制性识别位点和第二限制性识别位点,所述第一限制性识别位点可以被能够对第一多聚核苷酸进行酶切以得到第一多聚核苷酸的3’末端的限制性内切核酸酶所识别;所述第二限制性识别位点可以被能够对第二多聚核苷酸进行酶切以得到第二多聚核苷酸的5’末端的的限制性内切核酸酶所识别。可供选择地,所述接头可以含有第一限制性识别位点和第二限制性识别位点,所述第一限制性识别位点可以被能够对第一多聚核苷酸进行酶切以得到第一多聚核苷酸的5’末端的限制性内切核酸酶所识别;所述第二限制性识别位点可以被能够对第二多聚核苷酸进行酶切以得到第二多聚核苷酸的3’末端的的限制性内切核酸酶所识别。
所述第一多聚核苷酸还可以被能够识别第三识别位点的第三限制性内切核酸酶所酶切,以得到第一多聚核苷酸的3’末端;所述第二多聚核苷酸被能够识别第四识别位点的第四限制性内切核酸酶所酶切,以得到第二多聚核苷酸的5’末端;所述至少一个第一标签是通过连接所述第一多聚核苷酸的5’末端和3’末端而获得的,所述至少一个第二标签是通过连接所述第二多聚核苷酸的5’末端和3’末端而获得的(图2和6)。所述第一和第三识别位点可以具有相同的序列,所述第二和第四识别位点可以具有相同的序列。
所述分离的寡核苷酸的核酸-蛋白质复合物可以为染色质结构的一部分。与感兴趣的蛋白结合的核苷酸片段可以为含有能够与感兴趣的蛋白结合的区域(例如,组蛋白结合位点)的任何核苷酸片段。所述多聚核苷酸可以为DNA或RNA。
可以将得到的CIA-PET序列定位到参考基因组序列中以确定染色质相互作用的连节点的位置,所述染色质作用可以是远程的染色体内(位于同一染色体)或染色体间(位于不同的染色体)作用。该信息可以用于研究细胞核内染色体的3-维组织结构、由转录因子调节的相距较远的和跨越不同染色体的协同基因调控、和其它后续的相关的问题(图3和5)。
通过全部可用的基因组序列,能够发展全基因组方法以对所有潜在的染色质相互作用进行识别。全基因组嵌合列阵是一种用于基因组问询的有效方法,其中,嵌合了20-60mer的寡核苷酸以覆盖微列阵中的整个基因组,并且将具有生物量的DNA探针与所述列阵杂交,可以读出所有列阵单元的杂交信号强度的图谱,以用于遗传成分的问询。所述嵌合列阵被证明能够用于识别外显子,并且当与ChIP(ChIP-芯片)耦合时还可以用于定位转录因子的结合位点。虽然基于列阵的方法由于具有较高的多元和平行属性而有效,但很难想象基于杂交的检测能够对染色质相互作用的两个DNA片段的非线性关系进行检测。
根据一个实施方式的寡核苷酸的制备
所述核酸-蛋白质复合物可以通过染色质免疫沉淀法(ChIP)得到。
染色质免疫沉淀法(ChIP)
ChIP被用于富集,因而能够对结合有特定蛋白如组蛋白的遗传区域进行识别,以及对核酸-蛋白质复合物中的接合到核酸的其它蛋白质进行识别(综述见Tavemer等,Genome Biol,2004.5(3):p.210)。目的在于在它们相互作用的位点使DNA与蛋白质交联。通过向培养基中的活细胞中添加适合的固定剂如甲醛、乙醛、或甲醇,可以快速有效地实现交联。
然后制备这些固定的细胞的粗提物,并通过超声波、水力剪切、皮下注射器针头的反复抽提、或通过限制性内切核酸酶的酶解作用,将染色质剪切至平均大小通常约为1kb;然后与感兴趣的DNA结合蛋白(例如,转录因子或组蛋白)的抗体一起用于免疫沉淀反应。然后将在每一免疫沉淀反应中富集的DNA片段解除连接并纯化,以通过多种方法对它们进行识别。使用ChIP的优点在于,通过快速的交联染色质和其它非组蛋白蛋白质,能够在体内“冻结”基因调控的网络,因而,在理论上及时地提出了任意点调节系统的“真实”图谱,所述优点,例如,避免了通过异源表达产生的潜在的假象。
最近,ChIP与全基因组结合(Lieb等,Nat Genet,2001.28(4):p.327-34)、与全染色体结合(Euskirchen等,MoI Cell Biol,2004.24(9):p.3804-14)、和与CpG岛结合(Weinmann等,Genes Dev,2002.16(2):p.235-44),或者在“ChlP-芯片”或“芯片的ChlP”(“ChlP-on-chip”)法中与微阵列结合,这样能够在基因组水平对蛋白质结合位点如转录因子结合位点(TFBS)进行定位(综述见Buck和Lieb,2004)。虽然这种方法的有效性在小基因组如酵母基因组中得到了证明(Lieb等,Nat Genet,2001.28(4):p.327-34),但是生产用于更复杂的生物体的全基因组微阵列的费用和复杂度仍然是限制因素。
CpG岛微阵列含有较高CpG含量的人基因组片段,并且由于CpG岛通常对应于增强子区域(Antequera and Bird,Proc Natl Acad Sci USA,1993.90(24):p.11995-9),这样的微阵列显示出可能的妥协(compromise)。然而,假定的蛋白质结合位点的定位仍然需要通过检查在列阵上观察到的富含CpG的探针的基因组DNA的上游和下游(通常1-2kb,超声波降解的ChIP片段的大约尺寸)进行间接地推断。
可供选择地,先前已经尝试了对富含ChIP的DNA片段进行克隆和测序,但仅取得了有限的成功。其问题在于ChIP富集的标靶从相对于全基因组的较高背景中获得的。即使100倍富集的特定标靶仍仅仅表示ChIP文库中的一小部分克隆,使得标准的DNA测序成为一种昂贵的方案。因此,在这种情况下,对ChIP克隆进行测序并不是一种识别富含标靶的好方法。还建议将基因表达的连续分析(SAGE)和大规模平行表示测序技术(MPSS)(Brenner等,Nat Biotechnol,2000.18(6):p.630-4)用作检测ChIP富集的定量工具,根本原理是:与非特异的背景相比,从富含ChIP的DNA片段生成的标签的数量较多。
然后,可以将这些标签定位到基因组序列中以对感兴趣的遗传区域进行识别(即,假定为1-2kb,表示超声波降解的片段)。虽然20bp的SAGE和MPSS标签在大多数的情况下应该具有足够的特异性以确定特定的基因组位置;当定位到基因组中时,仍然需要对所述标签的上游和下游大约1-2kb的所有序列进行检测。这与CpG岛微列阵法面对的问题相同。此外,使用这些方法的全面覆盖取决于可得到的限制性内切核酸酶的识别位点(定位酶位点(mapping-enzyme site))的前提;如果某一基因区域缺少识别位点,则特定的标签将错过相应的ChIP片段,因而,该区域将成为基因组中的“盲点”。
从上述的问题可以清楚地看出,促进基因组水平转录调控的分析所需要的是能够准确快速地找到侧翼于连接蛋白质结合区域的核酸序列的方法,以该方法作为全基因组阵列的可供选择的方法。在这一点上,本发明提供的新方法具有多种优点:(i)由本发明的一种方法得到的标签序列进行定位具有更高的特异性,因为已知每个标签均源自被5’和3’标记所包围的连续的DNA片段;这种信息使感兴趣的基因组区域的精确定位更容易,并不需要重复地对标准的SAGE或MPSS标签的上游和下游的1-2kb的任意一个序列进行检测;(ii)本发明的方法不需要存在任何的定位酶位点;(iii)测序前标签的连接意味着可以在一次序列读取中识别多个标签;(iv)该区域是基因簇中所有定位标签的共有区域(即,重叠的),因此,对正在谈论的核酸-蛋白质复合物中的DNA区域进行确定。
标签和双标签
为了本发明的目的,所述标签为得自核酸分子的核苷酸序列或标记,并且所述标签表示从其中能够得到该标签的多聚核苷酸。意欲被缩短或表示的多聚核苷酸可以为RNA、mRNA、基因组DNA、全长cDNA、或cDNA。
在本发明中,存在本发明的寡核苷酸中的两个标签还可以被称为双标签。与标签一样,双标签比其源自的或表示的初始核酸分子短。优选情况下,所述双标签必须比初始核酸分子短的多。作为“缩短”的结果,所述双标签可以基本含有初始核酸分子的5’末端区域(还表示为5’标签)和/或3’末端区域(还表示为3’标签)。因此,初始核酸分子的最初位于5’标签和3’标签之间或内部部分并不包括在双标签中。本发明的双标签保留有初始核酸分子的多数信息特征,即,所述核酸分子的初始和终止标记。
形成有5’标签和3’标签的双标签具有相同或不同的大小。优选情况下,它们具有相同数量的核苷酸。所述双标签可以为各种大小,但需要有意义地和有益地超过其源自的亲本序列的大小。优选的标签和双标签的大小取决于基因组的复杂程度。相对于细菌基因组,大小约为8bp-16bp的标签是足够的,但相对于复杂基因组如人基因组,可以考虑16-20bp(也就是,32-40bp双标签)的标签。一般而言,所述双标签的大小为约12-60bp。
为了本发明的目的,术语5’-末端、5’-端、和5’-标签是相互等同的,并可以互换使用。同样,术语3’-末端、3’-端、和3’-标签是相互等同的,并可以互换使用。在意欲被缩短或表示的初始核酸分子或核酸分子中的部分中,5’-端和3’-端分别表示临近所述分子的末端的区域或部分,和与所述分子中部相距最远的区域或部分。
根据本发明的一个方面,双标签中所含的5’-标签和3’-标签为被限制性内切核酸酶分别在临近意欲被缩短或表示的核酸分子或其部分的5’-端和3’-端位置酶切的分子区域。因此,双标签的大小可以取决于限制性内切核酸酶或所使用的酶。
相应地,本发明提供了一种分离的寡核苷酸,该寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物。所述寡核苷酸可以进一步含有插在所述标签之间的至少一个接头。所述寡核苷酸还可以进一步含有插在标签侧翼的至少一个接头(即,至少一个接头可以定位在至少一个标签的上游和/或下游)。
接头
特别地,各个接头可以含有:至少一个第一限制性内切核酸酶酶切位点;和至少一个第二临近的限制性内切核酸酶酶切位点。因此,每个接头中存在的限制性内切核酸酶的酶切位点的数量可以为一个或多个,优选两个。所述限制性酶切位点可以为不对称的限制性酶切位点。不对称的限制性酶切位点的例子为归巢限制性内切酶不对称识别位点、和一部分II型(或II类)识别位点。优选能在它的识别位点的一侧切割的II型限制性内切核酸酶。
然而,任何本领域已知的位点均可以使用。能够识别核酸分子中至少一个限制性酶切位点的限制性内切核酸酶以及可以使用哪些限制性内切核酸酶对本领域技术人员来说是显而易见的。(例如,见,Current Protocols inMolecular Biology,Vol.2,1995,Ed.Ausubel,et al.,Greene Publish.Assoc.&Wiley Interscience,Unit3.1.15;New England Biolabs Catalog,2005)。一些可能的限制性酶切位点和相应的限制性内切核酸酶将在下文中进行描述。
作为一个例子,为了制备根据本发明的双标签,可以使用能够识别限制性酶切位点的限制性内切核酸酶。特别是IIs型酶,例如类膜金属内肽酶。当使用类膜金属内肽酶时,该酶识别两个衔接头中每一个衔接头的内部序列,所述衔接头与意欲被缩短的核酸分子侧翼连接;而在内部切割核酸分子以形成含有17-21个核苷酸的标签(见图1和4中表示的类膜金属内肽酶酶切)。两个这样的标签可以通过钝化和连接的额外处理以形成含有34-38个核苷酸的双标签。因此,通过剪接或连接相同的核酸分子的5’末端和3’末端,可以得到所述双标签。
作为一个例子,可以引入不对称的位点。能够用于本发明的目的的不对称位点序列为:i)两个归巢限制性内切酶不对称识别位点序列;或ii)能够被II型限制性内切核酸酶识别的限制性内切核酸酶不对称切割位点序列。
New England Biolabs公司销售并描述了归巢限制性内切酶,并且在NewEngland Biolabs目录中提供了不对称位点序列的描述。这些归巢限制性内切酶识别位点序列为18-39bp。然而,在本发明中,识别位点序列并不限制于这些序列也不限制于这些大小。优选情况下,能够切割不对称位点序列的限制性归巢限制性内切酶选自由I-CeuI、PI-SceI、PI-PspI、和I-SceI所组成的组中。然而,上述提及的目录并不是穷举的。本领域公知的其它归巢限制性内切酶和在下文中公开的归巢限制性内切酶也包括在本发明的范围之内。
II型限制性内切核酸酶的例子包括:AarI、AceIII、AloI、BaeI、Bbr7I、BbvI、BbvII、BccI、Bce83I、BceAI、BcefI、BcgI、BciVI、BfiI、BinI、BpII、BsaXI、BscAI、BseMII、BseRI、BsgI、BsmI、BsmAI、BsmFI、Bsp24I、BspCNI、BspMI、BsrI、BsrDI、BstF5I、BtgZI、BtsI、CjeI、CjePI、EciI、Eco31I、Eco57I、Eco57MI、Esp3I、FaII、FauI、FokI、GsuI、HaeIV、HgaI、Hin4I、HphI、HpyAV、Ksp632I、MboII、MlyI、MmeI、MnII、PleI、Ppil、PsrI、RleAI、SapI、SfaNI、SspD5I、Sth132I、StsI、TaqII、TspDTI、TspGWI、TspRI、和Tth111II(Rebase Enzymes网站的列表http://rebase.neb.com/gi-bin/outsidelist;还可见Szybalski,W.,1985,Gene,40:169)。然而,上述列表并不是穷举的。本领域公知的其它II型限制性内切核酸酶和在下文中公开的II型限制性内切核酸酶也包括在本发明的范围之内。
限制性酶切位点和多个II型限制性内切核酸酶的切割位点的例子为(括号内为识别位点和切割位点):BbvI(GCAGC8/12)、HgaI(GACGC5/10)、BsmFI(GGGAC10/14)、SfaNI(GCATC5/9)、和Bsp I(ACCTGC4/8)。
还可以使用人工的限制性内切核酸酶。这些内切核酸酶可以通过蛋白质工程技术制备得到。例如,通过插入物设计了内切核酸酶FokI,从而使其在远离位于DNA底物的两条链上的识别位点处切割一个核苷酸。见Li和Chandrasegaran,Proc.Nat.Acad.Sciences USA 90:2764-8,1993。这样的技术可以用于制备具有期望的识别序列和期望的从识别位点至切割位点间的距离的限制性内切核酸酶。
在本发明的条件下,本发明的分离的寡核苷酸可以与其它分离的寡核苷酸结合或连接,以形成寡核苷酸连环体。为了测序的目的或克隆至适合的质粒或载体中的目的,可以将任何数量的寡核苷酸结合在一起。
相应地,另一方面,本发明提供了一种寡核苷酸连环体,该寡核苷酸连环体含有至少两个分离的寡核苷酸,每一个分离的寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物。
寡核苷酸连环体中的分离的寡核苷酸可以进一步含有至少一个接头。所述接头可以插在所述标签之间。可供选择地,接头可以与标签侧翼连接。所述接头可以含有至少一种限制性内切核酸酶的识别位点;该至少一种限制性内切核酸酶的识别位点可以为IIs型限制性内切酶的识别位点。
在一个实施方式中,寡核苷酸连环体的第一标签可以含有得自第一多聚核苷酸的3’末端,所述第二标签还含有得自第二多聚核苷酸的5’末端。连环体寡核苷酸的每一个分离的寡核苷酸还可以含有至少一个插在所述标签之间的接头。在另一个实施方式中,寡核苷酸连环体的第一标签可以含有得自第一多聚核苷酸的5’末端,所述第二标签还含有得自第二多聚核苷酸的3’末端。
在另一个实施方式中,寡核苷酸连环体的第一标签可以含有得自第一多聚核苷酸的5’末端和3’末端,所述第二标签还含有得自第二多聚核苷酸的5’末端和3’末端。寡核苷酸连环体的分离的寡核苷酸还可以含有至少一个插在所述标签之间的接头。
这些实施方式中每一个实施方式的接头均可以含有至少一种限制性内切核酸酶的识别位点;该至少一种限制性内切核酸酶的识别位点可以为IIs型限制性内切核酸酶的识别位点。
寡核苷酸的连环体可以插入至载体或细胞中,所述细胞可以为细菌细胞。
寡核苷酸的连环体可以源自染色质结构。所述多聚核苷酸定位在同一个染色体上,或者所述多聚核苷酸定位在不同的染色体上。
这些是优选的连环体时,显然能够被连结的本发明的寡核苷酸的数量取决于寡核苷酸的长度,并且不需要过多的试验而由本领域技术人员容易地决定。连环体形成后,可以将多个标签克隆至用于序列分析的载体,或者可以通过本领域技术人员所公知的技术不经过克隆而直接对双标签或连环体进行测序。因此,双标签的连接能够允许在单个载体或克隆中以系列的方式通过对多个双标签进行序列分析而对核酸分子如全长cDNA分子进行有效地分析。
在提及术语载体或重组载体时,还可以使用通过双标签基因序列的插入或合并而进行操作的质粒、病毒、或本领域公知的其它载体。这种载体含有能够促进有效转录的启动子序列。所述载体代表性地含有复制起始区、启动子、和特定的基因,该基因提供了选择转化的细胞的表型。例如,适用于本发明的载体包括:pBlueScript(Stratagene,La JoIIa,CA);pBC,pZErO-1(Invitrogen,Carlsbad,CA);和pGEM3z(Promega,Madison,WI)或这些载体的修饰载体;以及本领域技术人员公知的其它类似的载体。为了实现特定的目的,对pGEM3z载体进行修饰,并将这种修饰的载体称为pGIS8(图7和11)。在美国专利no.4,766,072,中也公开了pGEM载体,该专利引入本文作为参考。
为了生产能够衍生出标签或双标签的亲代多聚核苷酸或核酸分子,可以使用合适的载体作为全长文库。相应地,本发明范围内的合适的载体是那些载体的主链不包括相同的限制性酶切位点的载体,所述限制性酶切位点包括在在所述多聚核苷酸插入后与所述多聚核苷酸或所述双标签侧翼连接的衔接头中。优选地,本发明提供了一种载体,其中,该载体骨架(除了在插入多聚核苷酸时被除去的位于含有多克隆位点的填充片断(stuffer)区域外)不含有第一限制性酶切位点和包括在所述衔接头中的第二限制行酶切位点或其它限制性酶切位点。特别地,所述载体不含有至少II型限制性酶切位点(例如IIs型限制性酶切位点)和至少包括在所述衔接头中的第二限制性酶切位点或其它限制性酶切位点。更优选地,所述载体骨架(除了在插入多聚核苷酸时被除去的位于含有多克隆位点的填充片断区域外)不含有MmeI和BamHI的酶切位点。
在填充片段外部的任何区域不含有MmeI的酶切位点的载体的例子为图7和11所示的载体pGIS8。在pGIS8中,MmeI的识别位点通过诱变而被除去。
相应地,本发明提供了一个寡核苷酸文库,该寡核苷酸文库包括至少一种寡核苷酸,该寡核苷酸含有至少一个第一标签和至少一个第二标签,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物。本发明还提供了一个根据本发明的寡核苷酸连环体文库。
寡核苷酸文库中的至少一种寡核苷酸可以含有插在所述标签之间的至少一个接头。可供选择地,接头可以替换性地与标签侧翼连接。所述第一标签可以含有得自第一多聚核苷酸的5’末端和3’末端,第二标签还含有得自第二多聚核苷酸的5’末端和3’末端。
所述多聚核苷酸核酸-蛋白质复合物可以为染色质结构的一部分。所述多聚核苷酸可以定位在同一个染色体上,或者所述多核苷酸可以被定位在不同的染色体上。
根据一个方面,所述寡核苷酸被扩增。例如,通过PCR或其它已知的扩增方法。可以根据双标签的序列的信息来制备PCR引物和探针序列。因此,可以使用与载体内部特定区域相应的适合的PCR引物。这些区域与含有双标签和衔接头的寡核苷酸侧翼连接。可以通过连接(自环化)反应直接进行PCR以得到短PCR产物(例如200bp)。
然后,可以使用能够识别至少第二限制性酶切位点(位于衔接头内)的酶,对这些含有所需要的双标签的PCR产物进行酶切,以得到所需要的短粘性双标签。可以使用作为能够识别第二限制性酶切位点或其它限制性酶切位点的限制性内切核酸酶,例如,BamHI,并生成50bp的粘性双标签。这种扩增步骤的优点在于双标签的生成不需要制备双标签文库的扩增物,这可以通过不转化带有自环化的标记的质粒而避免。随后可以从载体中切出扩增的寡核苷酸(例如,用BamHI消化),并将该扩增的寡核苷酸连接在用于后续克隆和序列分析的长的伸长的DNA或RNA中(图1和2)。
在一个特别的方面,本发明公开了cDNA文库,其中,所述寡核苷酸含有至少一个双标签,并且,其中所述双标签含有约34-38个核苷酸,并且所述双标签是通过对从全长cDNA或它的片段的5’末端和3’末端核苷酸进行剪接而得到的。
本发明的双标签文库是包括初始核酸分子的代表性文库。例如,当包括核酸分子的文库是全长多聚核苷酸文库时,所述双标签文库是全长双标签代表性文库。每一个双标签克隆具有表征特定的全长克隆的足够信息。更重要的是,本发明的双标签含有源自核酸-蛋白质复合物的初始全长多聚核苷酸的5’末端和3’末端。因此,所述双标签是所述多聚核苷酸代表性的结构。
因此,足以对双标签文库的双标签克隆进行测序和分析。在发现感兴趣的双标签的情况下,例如,可以通过PCR从全长多聚核苷酸文库中选择并制备相应的全长多聚核苷酸,或者通过逆转录聚合酶链式反应(RT-PCR)直接从目标RNA样本中选择并制备相应的全长多聚核苷酸。
可以通过“454”测序(焦磷酸测序技术)法(Margulies等,2005)对本发明的寡核苷酸进行测序,并将本发明的寡核苷酸连接至用于克隆以制备CIA-PET文库的更长的伸长的DNA链中,随后使用桑格毛细管法(Sangercapillary method)进行测序。
因此,本发明提供了一种用于制备本发明寡核苷酸的方法、一种从核酸蛋白质复合物中检测和/或识别至少两种多聚核苷酸的方法、和一种制备含有本发明的寡核苷酸和连环体的寡核苷酸的载体的方法。
因此,另一方面,本发明提供了一种制备至少一种分离的寡核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中,所述第一标签和第二标签得自核酸-蛋白质复合物;和
(c)分离所述寡核苷酸。
特别地,本发明提供了一种制备至少一种分离的寡核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物;和
(c)分离所述寡核苷酸。
在一个实施方式中,本发明此方面的步骤(b)包括:
(i)插入至少一个接头,该接头含有至少一种限制性内切核酸酶的识别位点,和
(ii)使用能够识别位于所述接头中的至少一个识别位点的至少一种限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签和位于所述标签之间的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸。
在另一个实施方式中,本发明此方面的步骤(b)包括:
(i)在所述复合物的第一多聚核苷酸和第二多聚核苷酸之间插入至少一个接头,该接头含有至少一种限制性内切核酸酶的识别位点;
(ii)在第一多聚核苷酸的5’末端和第二多聚核苷酸的3’末端分别加入至少一种限制性内切核酸酶的识别位点;
(iii)使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;和
(iv)连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签、和插在所述标签之间的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述标签含有各个多聚核苷酸的5’末端和3’末端,步骤(ii)中的至少一个限制性内切核酸酶的识别位点为载体的一部分。
所述核酸-蛋白质复合物可以通过染色质免疫沉淀方法得到。
另一方面,本发明提供了一种用于检测和/或识别核酸-蛋白质复合物中的至少两种多聚核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)制备含有至少一个第一标签和至少一个第二标签的寡核苷酸,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和第二多聚核苷酸得自核酸-蛋白质复合物;
(c)对所述寡核苷酸进行测序;和
(d)根据所述第一标签和第二标签的核苷酸序列,对所述至少两种多聚核苷酸进行定位,从而对所述至少两种多聚核苷酸进行检测和/或识别。
在一个实施方式中,本发明此方面的步骤(b)包括:
(i)插入至少一个接头,该接头含有至少一种限制性内切核酸酶的识别位点,和
(ii)使用能够识别位于所述接头中的至少一个识别位点的至少一种限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签和位于所述标签之间的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸。
在另一个实施方式中,本发明此方面的步骤(b)包括:
(i)在所述复合物的第一多聚核苷酸和第二多聚核苷酸之间插入至少一个接头,该接头含有至少一种限制性内切核酸酶的识别位点;
(ii)在第一多聚核苷酸的5’末端和第二多聚核苷酸的3’末端分别加入至少一种限制性内切核酸酶的识别位点;
(iii)使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;和
(iv)连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签、和插在所述标签之间的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述标签含有各个多聚核苷酸的5’末端和3’末端,步骤(ii)中的至少一个限制性内切核酸酶的识别位点为衔接头或载体的一部分。
在本发明中,所述核酸-蛋白质复合物可以通过染色质免疫沉淀方法获得。所述核酸-蛋白质复合物可以通过将光活化成分加入到感兴趣的DNA和/或蛋白质中而得到,而DNA/蛋白质复合物通过抗体介导的沉淀作用或亲和力介导的技术进行分离。这种基于亲和力的技术的例子包括:链霉亲和素/生物素、谷胱甘肽-S-转移酶/谷胱甘肽基质、麦芽糖结合蛋白/直链淀粉基质的相互作用。
在步骤(c)中进行测序之前,可以对步骤(b)得到的寡核苷酸进行扩增;所述扩增可以通过聚合酶链式反应进行。在扩增之后但在步骤(c)中的测序之前,可以对扩增的寡核苷酸进行至少一个纯化步骤。所述至少一个纯化步骤可以为凝胶电泳。
本发明的寡核苷酸可以与通过测序前的步骤(a)-(b)获得至少一种另外的寡核苷酸连接以形成寡核苷酸的连环体。
通过桑格法或多重测序方法进行测序。所述多重测序方法可以为焦磷酸测序方法。可以使用任何适合的测序方法,如由Bonetta(2006)描述的方法。与感兴趣的蛋白结合的核酸片段可以为含有能够与感兴趣的蛋白结合的区域(例如,组蛋白结合位点)的任何核酸片段。所述多聚核苷酸可以为DNA或RNA。
所述多聚核苷酸可以定位在同一条染色体上,或者所述多核苷酸可以定位在不同的染色体上。
所述检测和/或识别可以用于所述多聚核苷酸的转移或易位。
所述寡核苷酸可以被转染至细胞中。所述转染的方法可以为电穿孔法。所述细胞可以为细菌细胞。
下面将对本发明关于CIA-PET和CIA-diPET技术的这些方面的实施方式进行详细地描述。
另一方面,本发明提供了一种载体,该载体包括本发明的寡核苷酸、寡核苷酸连环体、或寡核苷酸的文库。
CIA-PET
在CIA-PET方法中(图1和4),通过连接,被位于DPD复合物中的蛋白质束缚的DNA片段可以通过接头序列结合在一起。所述接头序列含有两个MmeI位点。解交联后,所述连接的DNA将被MmeI消化,以释放出成对的末端双标签(CIA-PET)。每一个CIA-PETs均含有两个侧翼连接的标签(每个约20bp)的接头(图1中标记的步骤2)。因此,包含在CIA-PET中的两个标签表示两个双标签遗传区域,该两个双标遗传签区域在线性基因组序列中彼此远离,但它们之间相互作用并受特定的蛋白质如组蛋白蛋白质调节。
将CIA-PETs用凝胶纯化后,将序列特异性衔接头加在CIA-PETs的两侧,然后通过PCR进行扩增(图1中的步骤3)。可以通过多种测序方法如“454”焦测序法和其它适合的测序方法直接对扩增的CIA-PETs进行测序,或者将扩增的CIA-PETs连接在更长的DNA延伸物上,用于克隆以得到CIA-PET文库,随后通过桑格毛细管法进行测序。将CIA-PET序列定位到参照基因组序列中。染色质相互作用位点可以基于在特定的基因座中频繁出现的CIA-PET来进行识别,染色质相互作用位点将与随机单独分布的背景噪音分开(图3)。
CIA-diPET
在CIA-diPET方法中(图2和6),提取表示两个相关的DNA片段的每一个DNA片段的成对的末端双标签序列并只对每个序列中一个标签的序列进行测序和比较。通过这种方式,获得的CIA-diPET含有比CIA-PET方法中的标签更长的标签序列。因而,本领域技术人员能够理解的是,与现有技术中的其它方法相比,本发明的CIA检测方法在定位染色质间的相互作用中更加具有特异性。DPD复合物中的DNA片段通过接头序列被连接在一起,所述接头序列含有MmeI位点和GsuI位点。在解交联后,通过超声波降解法可以随机地破碎所述连接的DNA。
然后,按大小分离DNA,并将DNA克隆至pGIS8载体中(图2中的步骤2),pGIS8载体含有位于其克隆位点紧邻的MmeI位点和Gsu位点(图7)。在细菌细胞中转化和繁殖后,通过连续的消化、自连接、和转化对文库克隆进行处理,以得到单一的diPET文库。单一的diPET文库中的质粒DNA被BamHI消化以释放出diPET结构(图2中的步骤4),所述diPET结构能够通过MS-PET测序法直接进行测序,或者进一步进行连接以进行克隆和测序。可以将CIA-diPET序列定位到参考基因组序列中。真实的染色质相互作用位点可以基于在特定的基因座中频繁出现的CIA-diPET来进行识别,真实的染色质相互作用位点将与随机单独分布的背景噪音分开(图5)。
现在异对本发明进行了一般性的描述,通过参考以下实施例能够更容易理解本发明的内容,所述实施例仅作为说明的目的,而不是为了限制本发明的范围。
在操作过程中,为了控制质量并确保接头或衔接头的正确插入,通过凝胶电泳去除不需要的片段(图8-10)。
实施例
CIA方法
使用小鼠胚胎干细胞(ES)细胞中的Nanog转录因子、用于Nanog的ChIP-PET数据、和ES细胞的其它关键转录因子如Oct4和Sox2作为生物学体系,来实施本发明。ChIP-PET数据提供了这些转录因子结合位置的线性图谱,并使用ChIP-PET数据作验证染色质相互作用数据的参考。通过CIA-PET和CIA-diPET两种方法来检测染色质之间的相互作用。
实施例中使用的序列如下文和序列表中所示。当显示了两条链时,上面的一条链为有义链,下面的一条链为反义链。所有示出的序列均为5’-3’方向。当核苷酸表示为N或n(或者图中的X或数字)时,意指在该位点上可以为任意一种核苷酸(A、C、G、或T)。
M&M接头
5’GTCGGAGGCCAAGGCGGCCGTACGTCCAACT3’(31nt)(SEQ IDNO:1)
5’GTTGGACGTACGGCCGCCTTGGCCTCCGAC3’(31nt)(SEQ IDNO:2)
5’末端是磷酸化的
M&G接头
5’GTCGGAGGCCAAGGCGGCCGTACGCTGGAGT3’(31nt)(SEQ IDNO:3)
5’CTCCAGCGTACGGCCGCCTTGGCCTCCGACT3’(31nt)(SEQ IDNO:4)
5’末端是磷酸化的
P1连接衔接头(PMR 011)
5’GGATCCCTTAATCGCCTTGCAGCACATC3’(28nt)(SEQ ID NO:5)
5’GATGTGCTGCAAGGCGATTAAGGGATCCNN3’(30nt)(SEQ IDNO:6)
上面接头的5’末端是磷酸化的
下面接头的5’末端不是被磷酸化的
P2连接衔接头(PMR012)
5’GGATCCCCTGTGTGAAATTGTTATCCGCT3’(29nt)(SEQ IDNO:7)
5’AGCGGATAACAATTTCACACAGGGGATCCNN3’(31nt)(SEQ IDNO:8)
上面衔接头的5’末端是磷酸化的
下面衔接头的5’末端不是磷酸化的
D1 diPETing衔接头(PMR011)
5’GGATCCCTTAATCGCCTTGCAGCACATC3’(28nt)(SEQ ID NO:9)
5’GATGTGCTGCAAGGCGATTAAGGGATCCNN3’(30nt)(SEQ IDNO:10)
上面衔接头的5’末端是磷酸化的
下面衔接头的5’末端不是磷酸化的
D2 diPETing衔接头(PMR012)
5’GGATCCAATGCTCCTCCCTGTGTGAAATTGTTATCCGCT3’(39nt)(SEQ ID NO:11)
5’AGCGGATAACAATTTCACACAGGGAGGAGCATTGGATCCNN3’(41nt)(SEQ ID NO:12)
上面衔接头的5’末端是磷酸化的
下面衔接头的5’末端不是磷酸化的
PMR011引物
5’GATGTGCTGCAAGGCGATTAAG3’(22nt)(SEQ ID NO:13)
5’末端是磷酸化的
PMR012引物
5’AGCGGATAACAATTTCACACAGG3’(23nt)(SEQ ID NO:14)
5’末端是磷酸化的
RecA选择性寡聚核苷酸
5’AGTCGGAGGCCAAGGCGGCCGTACGCTGGAGT3’(SEQ ID NO:15)(生物素化的)
PGIS8载体
该载体源自pGEM载体(Promega),含有用于以下限制性内切核酸酶的多个独特的克隆位点,位点的规律为:BamHI→MmeI;切割区域;GsuI→BamHI→BseRI。
使用以下寡核苷酸:
5’AATTGGATCCGACTCGAGGATGAATTCTCCAGGATCCCTCCTC3’(43nt)(SEQ ID NO:16)
5’TCGAGAGGAGGGATCCTGGAGAATTCATCCTCGAGTCGGATCC31(43nt)(SEQ ID NO:17)
5’末端不是磷酸化的
载体的其余部分不含有任何的BseRI、BamHI、MmeI或GsuI的位点。
pGIS8质粒是可以使用的载体的一个实例(图7)。有义链的序列为SEQID NO:18,反义链的序列为SEQ ID NO:19。含有限制性内切核酸酶的识别位点(表示为SEQ ID NO:16和17)的多克隆位点被插入到所述载体中。显示了多个限制内切酶的识别位点的pGIS8的序列表如图11所示。本领域技术人员可以制备并使用能够满足要求的其它载体。
M&M衔接头PET
5’NNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGTCCAACTN NNNNNNNNNNNNNNNNN3’(69nt)(SEQ ID NO:20)
5’NNNNNNNNNNNNNNNNNNAGTTGGACGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNN3’(69nt)(SEQ ID NO:21)
具有衔接头序列的M&M衔接头PET
5’GATGTGCTGCA AGGCGATTA AGGGATCCNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGTCCAACTNNNNNNNNNNNNNNNNNNGGATCCCCTGTGTGAAATTGTTATCCGCT3’(128nt)(SEQID NO:22)
5’AGCGGATAACAATTTCACACAGGGGATCCNNNNNNNNNNNNNNNNNNAGTTGGACGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNGGATCCCTTA ATCGCCTTGCAGCACATC3’(128nt)(SEQID NO:23)
M&M最终PET(切除衔接头序列后)
5’GATCCNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACG TCCAACTNNNNNNNNNNNNNNNNNNNNG3’(77nt)(SEQ IDNO:24)5’
GATCCNNNNNNNNNNNNNNNNNNNNAGTTGGACGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNG3’(77nt)(SEQIDNO:25)
超声降解后的M&G衔接头DNA序列
5’NNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGC TGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN3’(SEQ ID NO:26)
5’NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNN3’(SEQ ID NO:27)(可变nt)
克隆至pGIS8质粒中后的M&G衔接头DNA序列
(注:质粒的其它部分未给出)
5’GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAGGATCC3’(140nt)(SEQ ID NO:28)
5’GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGATCC3’(140nt)(SEQ ID NO:29)
MPET中间体
5’GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAGGATCC3’(132nt)(SEQ ID NO:30)
5’GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGATCC3’(132nt)(SEQ ID NO:31)
M和GdiPET
5’ATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAGGATCC3’(116nt)(SEQ ID NO:32)
5’GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNACTCAGCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNGTCGGATC3’(116nt)(SEQ ID NO:33)
释放出的具有BamHI粘性末端的diPET
5’GATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAG3’(111nt)(SEQ ID NO:34)
5’GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCG3’(111nt)(SEQ ID NO:35)
用MmeI消化前的M&M衔接头PET
5’NNNNNNNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGTCCAACTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN3’(91nt)(SEQ ID NO:36)
5’NNNNNNNNNNNNNNNNNNNNNNNNNNNNTCAGCCTCCGGTTCCGCCGGCATGCAGGTTGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN3’(91nt)(SEQ ID NO:37)
在插入M&G接头之前如图8所示的寡核苷酸
5’NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN3’(53nt)(SEQ ID NO:38)
5’NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTNNNNNNNNNNNNNNNNNNNNNN3’(53nt)(SEQ ID NO:39)
插入到质粒中的如图8所示的寡核苷酸(质粒的其它部分没有给出)
5’GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAGGATCC3’(140nt)(SEQ ID NO:40)
5’GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGATCC3’(140nt)(SEQ ID NO:41)
插入到质粒中的如图8所示的寡核苷酸(质粒的其它部分没有给出)
5’GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAGGATCC3’(140nT)(SEQ ID NO:42)
5’GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGATCC3’(140nt)(SEQ ID NO:43)
通过电泳除去的没有插入M&G接头的如图8所示的寡核苷酸
5’GATCCGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAG3’(112nt)(SEQ ID NO:44)
5’GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCG3’(112nt)(SEQ ID NO:45)
插入M&G接头之前如图9所示的寡核苷酸
5’NNNNNNNNNNNNNNNNNNNNNNNTCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNN3’(59nt)(SEQ ID NO:46)
5’NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNNNNNNNN NNNNNNNNNNNNNN3’(59nt)(SEQ ID NO:47)
在插入部分M&G接头后如图9所示的寡核苷酸
5’GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAGGATCC3’(140nt)(SEQ ID NO:48)
5’GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGATCC3’(140nt)(SEQ ID NO:49)
在被限制性内切核酸酶消化后具有插入部分M&G接头的如图9所示的寡核苷酸(质粒的其它部分没有给出)
5’GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCC GACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNCTCCAGGATCC3’(126nt)(SEQ ID NO:50)
5’GGATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGATCC3’(126nt)(SEQ ID NO:51)
从质粒中去除后如图9所示的寡核苷酸
5’GATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTCCAG3’(120nt)(SEQ IDNO:52)
5’GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCG3’(120nt)(SEQ IDNO:53)
具有插入在相反方向的M&G接头的如图10所示寡核苷酸
5’NNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN3’(85nt)(SEQ ID NO:54)
5’NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNN3’(85nt)(SEQ ID NO:55)
插入在质粒中的如图10所示的寡核苷酸(质粒的其它部分没有给出)
5’GGACTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGTCGGAGGCCAAGGCGGCCGTACGCTGGAGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCGGATCC3’(148nt)(SEQ ID NO:56)
5’GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTCCAGCGTACGGCCGCCTTGGCCTCCGACTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNCTC CAGTCC3’(148nt)(SEQ ID NO:57)
如图10所示的中间体寡核苷酸1
5’GGACTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNGTCGGATCC3’(62nt)(SEQ ID NO:58)
5’GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNCTCCAGTCC3’(62nt)(SEQ ID NO:59)
如图10所示的中间体寡核苷酸2
5’GGACTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN3’(62nt)(SEQ ID NO:60)
5’GGATCCGACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNCTCCAGTCC3’(62nt)(SEQ ID NO:61)
如图10所示的产物寡核苷酸
5’GATCCGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNN NNNNNNNNNNNNCTCCAG3’(114NT)(SEQ ID NO:62)
5’GATCCTGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCG3’(114nt)(SEQ ID NO:63)
实施例1使用小鼠胚胎干细胞的CIA-PET方案
CIA-PET方法(图1和4)包括五个阶段:(1)生成ChIP DNA-蛋白质-DNA复合物;(2)制备CIA-PET;(3)扩增CIA-PET;(4)对CIA-PET进行测序;和(5)对CIA-PET序列定位(图3)。
(1)生成ChIP DNA-蛋白质-DNA复合物
(a)在白血病抑制因子(Chemicon)的存在下,在无饲养层培养(feeder-free)小鼠胚胎干(ES)细胞。
(b)收集约1-2×108个细胞,并用甲醛(最终浓度为1%,Sigma)在室温下交联10分钟。
(c)细胞裂解和染色质的制备:
c1、使细胞在裂解缓冲液中裂解(50mM HEPES、1mM EDTA、0.15MNaCI、1%SDS、1%Triton X-100、0.1%脱氧胆酸盐,全部从Ambion购得)。
c2、通过超声波降解法使用Branson450超声细胞破碎仪使染色质溶解(20%的负载输出功率、30秒、5-8次)。
c3、将染色质稀释10倍,以使十二烷基磺酸钠(SDS)降低至0.1%。
c4、然后将提取物在4℃,14,000rpm的条件下离心10分钟。
c5、将提取物在-80℃下储存直至使用。
(d)免疫沉淀反应
d1、将2微克的单克隆抗体(F7,Santa Cruz)结合到蛋白质G琼脂糖凝胶(Pharmacia)上。
d2、在4℃下将抗体包覆的珠子与染色质提取物一起孵育16小时。
d3、然后通过以下缓冲液清洗所述珠子(试剂购自Sigma ChemicalCompany):
洗涤缓冲液1(50mM HEPES、1mM乙二胺四乙酸(EDTA)、0.15MNaCl、0.1%SDS、1%去通X-100(Triton X-100)、0.1%脱氧胆酸盐),清洗2次。
洗涤缓冲液2(50mM HEPES、1mM EDTA、0.5M NaCl、0.1%SDS、1%Triton X-100、0.1%脱氧胆酸盐),清洗1次。
洗涤缓冲液3(20mM Tris.HCl pH8.0、1mM EDTA、0.25M LiCl、0.5%NP40、0.5%脱氧胆酸盐),清洗1次。
洗涤缓冲液4(20mM Tris.HCl pH8.0、1mM EDTA),清洗1次。
d4、然后在65℃下,使用洗脱缓冲液洗脱20分钟以将蛋白质-DNA复合物从所述珠子上洗脱下来。
d5、在4℃下,在PBS(Ambion)中对洗脱物透析3小时以去除SDS。
(2)制备CIA-PET
(a)末端修复
使用Epicentre End-It试剂盒和以下化学品进行末端修复:
染色质(最多5μg)                      2.5μl(10×)
末端修复缓冲液                       5μl
2.5mM脱氧核苷三磷酸(dNTP)混合物      5μl
10mM三磷酸腺甙(ATP)                  5μl
末端修复酶混合物                     1μl
不含核酸酶的水                       至50μl
简单地涡旋混合,然后在室温下孵育45分钟,在70℃下加热10分钟以停止反应。通过加入27μl的不含核酸酶的水将浓度调节至65ng/μl。
(b)加尾(tailing)
DNA                                 20μl
10mM脱氧三磷酸腺甙(dATP)(Roche)     0.5μl
10×Ex Taq缓冲液(Takara)            2.5μl
Ex Taq聚合酶(Takara)                0.5μl
不含核酸酶的水                      至25μl
在PCR仪中于72℃下孵育30分钟,然后在4℃保存。最好取出离心管,在72℃下的孵育终止时立刻进行连接。
(c)使用M&M接头(SEQ ID NOS:1和2)连接DNA
染色质DNA(200μg)                                     3.1μl
M&M衔接头-T末端(38ng)                                3.1μl
具有聚乙二醇(PEG)的5×连接酶缓冲液(Invitrogen)       6μl
T4连接酶(5U/μl)(Invitrogen)                          1μl
不含核酸酶的水                         12.3μl
在16℃下过夜连接,得到插入有M&M接头的寡核苷酸(SEQ ID NOS:20和21)。
(d)使用蛋白酶K的解交联
将DNA样品分成20μl的分装体,并在15μl浓度为20mg/ml的蛋白酶K(Ambion)的存在下于65℃孵育过夜,以解交联。第二天,加入1μl浓度为10mg/ml的RNA酶A以降解RNA,在37℃下降解RNA45分钟,随后进行苯酚抽提并用乙醇沉淀DNA。重悬在20μl洗提缓冲液中,并在-20℃下保存。获得的浓度通常为500ng/μl。
定量DNA,并将0.5μl得到的DNA和Takara的宽范围序列梯,以及Invitrogen的低质量序列梯和从(a)中得到的0.5μl的材料,在1%的凝胶中进行电泳来进行质量控制。(d)中得到的材料点样量应该较少,并且在50-100bp的标记范围内不应该显示出任何明亮的条带。
(e)MmeI酶切
10μg DNA                                            20μl
10×NE缓冲液4(New England Biolabs)                  20μl
10×SAM(New England Biolabs)                        20μl
MmeI(2U/μl)(New England Biolabs)                    20μl
不含核酸酶的水                                      120μl
分装在两个离心管中,并在37℃下孵育过夜。SAM应该是新制备的。
含有糖蓝(glycoblue)的苯酚氯仿和乙醇的沉淀物。
定量DNA,并使用3μl得到的DNA与Takara的宽范围序列梯,以及使用Invitrogen的低质量序列梯和从(d)中得到的0.5μl的材料,在2%的凝胶或PAGE凝胶中进行电泳来进行质量控制。
(f)凝胶纯化
将得到的DNA与合适的序列梯(例如,20μlTakara的宽范围序列梯)负载到2%的琼脂糖凝胶的Scie-Plas中等尺寸孔(每孔60μl)中。在80V下电泳约1.5小时,然后在365nm的紫外光下观察。具有错误插入的接头的寡核苷酸将通过电泳被去除掉(错误插入的接头的例子,见图8-10)。根据生产商提供的建议使用一次性的Fermentas ElutaTubes切出双标签条带并进行电洗脱。在90V下电洗脱1-1.5小时,然后使用乙醇沉淀得到的双标签:
每200μ洗脱液,加入
3M NaOAc pH5.2(Amresco)                     20μl
1M MgCl2(Ambion)                            4.5μl
糖蓝(Ambion)                                2μl
100%的乙醇                                 800μl
在12μl的洗脱缓冲液(Qiagen)中重悬沉淀的双标签,并使用2-5μl双标签溶液和低质量序列梯(Invitrogen),在4-20%的PAGE微型胶中进行电泳以检测纯度并在视觉上进行定量。得到的正确双标签具有SEQ ID NOS:22和23所示的序列。
(3)扩增PET
(a)衔接头的连接(连接的衔接头SEQ ID NOS:5-8)
DNA(100ng)                                           6μl
衔接头(10μg)                                         6μl
10×连接酶缓冲液(具有亚精胺)                         1.5μl
T4DNA连接酶(5U/μl,Invitrogen)                       1μl
不含核酸酶的水                                       0.5μl
总体积为15μl,在16℃下孵育16小时。
具有亚精胺的10×连接酶缓冲液由以下物质组成:
60mM Tris-HCl pH7.5(Ambion)
60mM MgCl2(Ambion)
50mM NaCl(Ambion)
1mg/ml牛血清白蛋白(BSA)(NeW England Biolabs)
70mM β-巯基乙醇(Sigma)
1mM ATP(Invitrogen)
20mM二硫苏糖醇(DTT)(Invitrogen)
10mM亚精胺(Sigma)
(b)PCR扩增
使用引物PMRs11和12(分别为SEQ ID NOS:13和14)以及购自Qiagen的Hotstartaq试剂盒进行扩增:
DNA                                        1μl
10×PCR缓冲液(Qiagen)                      10μl
dNTP混合物(每种10mM)(Invitrogen)           2μl
PMR11                                      1μl(0.2μM)
PMR12                                      1μl(0.2μM)
HotStarTaq DNA聚合酶(Qiagen)               0.5μl
不含核酸酶的水                             至100μl
充分混合,在PCR仪上孵育:
1、95℃,15分钟
2、94℃,0.5分钟
3、55℃,0.5分钟
4、72℃,1分钟
5、重复步骤2-4,25个循环
6、72℃,10分钟
使用PCR纯化试剂盒(Qiagen)进行纯化。
(4)CIA-PETs的测序
可以根据454多重测序仪(454生命科学)的方案直接对CIA-PETs进行测序。该技术描述在Margulies等(2005)和美国专利申请No.20030068629中。这些参考文献的全文在此一并引入作为参考。
对CIA-PETs进行定位
可以使用压缩的后缀阵列(Compressed Suffix Array)进行定位。穿越两个不同的DNA片段的多个连接应该表示真实的远端控制区(图3)。
实施例3:CIA-diPET方法
CIA-diPET方法(图2和6)包括以下部分:(1)生成ChIP DNA-蛋白质-DNA复合物;(2)制备CIA文库;(3)制备CIA-PET文库;(4)测序;和(5)对CIA-PET序列进行定位(图5)。
(1)生成ChIP DNA-蛋白质-DNA复合物(如上所述)
(a)在白血病抑制因子(Chemicon)的存在下,在无饲层培养小鼠胚胎干(ES)细胞。
(b)收集约1-2×108个细胞,并用甲醛(最终浓度为1%,Sigma)在室温下交联10分钟。
(c)细胞裂解和染色质的制备:
c1、使细胞在裂解缓冲液中裂解(50mM HEPES、1mM EDTA、0.15MNaCl、1%SDS、1%Triton X-100、0.1%脱氧胆酸盐,全部由Ambion购得)。
c2、通过超声降解法使用Branson450超声细胞破碎仪使染色质溶解(20%的负载输出功率、30秒、5-8次)。
c3、将染色质稀释10倍,以使SDS降低至0.1%。
c4、然后将提取物在4℃,14,000rpm的条件下离心10分钟。
c5、将提取物在-80℃下储存直至使用。
(d)免疫沉淀反应
d1、将2微克的单克隆抗体(F7,Santa Cruz)结合到蛋白质G琼脂糖凝胶(Pharmacia)上。
d2、在4℃下将抗体包覆的珠子与染色质提取物一起孵育16小时。
d3、然后通过以下缓冲液清洗所述珠子(试剂购自Sigma ChemicalCompany):
洗涤缓冲液1(50mM HEPES、1mM EDTA、0.15M NaCl、0.1%SDS、1%Triton X-100、0.1%脱氧胆酸盐),清洗2次。
洗涤缓冲液2(50mM HEPES、1mM EDTA、0.5M NaCl、0.1%SDS、1%.Triton X-100、0.1%脱氧胆酸盐),清洗1次。
洗涤缓冲液3(20mM Tris.HCl pH8.0、1mM EDTA、0.25M LiCl、0.5%NP40、0,5%脱氧胆酸盐),清洗1次。
洗涤缓冲液4(20mM Tris.HCl pH8.0、1mM EDTA),清洗1次。
d4、然后在65℃下,使用洗脱缓冲液洗脱20分钟以将蛋白质-DNA复合物从所述珠子上洗脱下来。
d5、然后在4℃下,在PBS(Ambion)中对洗脱物透析3小时以去除SDS。
(2)制备CIA-diPET文库
(a)末端修复(用于制备CIA-PET),使用Epicentre End-It试剂盒进行末端修复:
染色质(最多5μg)                                    2.5μl
10×末端修复缓冲液(Epicentre)                      5μl
2.5mM dNTP混合物(Epicentre)                        5μl
10mM ATP(Epicentre)                                5μl
末端修复酶混合物(Epicentre)                        1μl
不含核酸酶的水                     31.5μl
简单地涡旋混合,并在室温下孵育45分钟,在70℃下加热10分钟以停止反应。通过加入27μl的不含核酸酶的水将浓度调节至65ng/μl。
(b)如上所述加尾以用于CIA-PET
DNA                                              20μl
10mM dATP(Roche)                                 0.5μl
10×Ex Taq缓冲液(Takara)                         2.5μl
Ex Taq聚合酶(Takara)                             0.5μl
不含核酸酶的水                                   1.5μl
在PCR仪中于72℃孵育30分钟,然后于4℃下保存。最好取出离心管,在72℃下的孵育终止时马上进行连接。
(c)DNA与M&M接头的连接(SEQ ID NOS:3和4)
染色质DNA(200ng)                                    3.1μl
M&G衔接头-T末端(38ng)                               7.6μl
具有PEG的5×连接酶缓冲液(Invitrogen)                6μl
T4连接酶(5U/μl)(Invitrogen)                         1μl
不含核酸酶的水                                      12.3μl
在16℃下过夜连接,得到插入有M&G接头的寡核苷酸(SEQ ID NOS:26和27)。
(d)与上述CIA-PET一样,使用蛋白酶K解交联。
将DNA样品分成20μl的分装体,并在15μl浓度为20mg/ml的蛋白酶K(Ambion)的存在下于65℃过夜以解交联。第二天,加入1μl浓度为10mg/ml的RNA酶A以降解RNA(Qiagen),在37℃下降解RNA45分钟,随后进行苯酚抽提并用乙醇沉淀DNA。重悬在20μl洗脱缓冲液中,并在-20℃下保存。获得的浓度通常为500ng/μl。
定量DNA,并将0.5μl得到的DNA和Takara的宽范围序列梯,以及Invitrogen的低质量序列梯和从(a)中得到的0.5μl的材料,在1%的凝胶中进行电泳来进行质量控制。(d)中得到的材料点样量应该较少,并且在50-100bp的标记范围内不应该显示出任何明亮的条带。
(e)使用NIa III的消化
NIa III在-80℃下储存(-80℃下半衰期6个月)。在使用前至于冰上。
DNA(约1μg)                                              2μl
10×NE缓冲液4(New England Biolabs)                       5μl
NIa III(New England Biolabs)                             1μl
100×BSA(New England Biolabs)                            0.5μl
不含核酸酶的水                                           41.5μl
制备5管上述反应液。在37℃下孵育1小时。将含有糖蓝的苯酚氯仿和乙醇沉淀物重悬在10μl的洗脱缓冲液中(Qiagen)。
(f)使用Epicentre End-It试剂盒对末端进行平整:
DNA(最多5μg)                                           34μl
10×末端修复缓冲液(Epicentre)                          5μl
2.5mM dNTP混合物(Epicentre)                            5μl
10mM ATP(Epicentre)                                    5μl
末端修复酶混合物(Epicentre)                            1μl
室温下孵育45分钟,在70℃下加热10分钟以停止反应。
(i)克隆至具有MmeI和GsuI侧翼连接位点的pGIS8载体中(SEQ ID NOS:18和19;图7和11)。
置于冰上,使用1.7ml的微离心管(使用多个离心管):
40ng/μl预酶切的pGIS                        1μl
DNA                                        6μl
具有PEG的5×连接酶缓冲液(Invitrogen)          2μl
T4DNA连接酶(5U/μl)(Invitrogen)                1μl
在16℃下孵育过夜(12-16小时),得到SEQ ID NOS:28和29所示的寡核苷酸。
设置一个载体自连的对照。
通过电穿孔技术,在每50μl感受态TOP10细胞(Invitrogen)中转染1μl的连接产物。在1ml的LB培养基中恢复每一个等份式样1小时,然后平板培养一系列稀释度(LB琼脂糖+氨苄青霉素)用于质量控制和滴定的试样。
然后,通过将剩余的培养基在更大的琼脂糖平板(Q-trays)上进行培养来扩大该过程,并使用Qiagen的高速质粒大量提取试剂盒(Qiagen HiSpeedPlasmid Maxi Kit)进行大量制备。
(3)CIA-diPET文库
(a)MmeI酶切
10μg DNA                                        100μl
10×NE缓冲液4(New England Biolabs)              20μl
10×SAM(New England Biolabs)                    20μl
MmeI(2U/μl)(New England Biolabs)                12μl
不含核酸酶的水                                 48
在37℃下孵育过夜,得到SEQ ID NOS:30和31所示的寡核苷酸。SAM应该是新制备的。将含有糖蓝的苯酚氯仿和乙醇沉淀物重悬在12μl的洗脱缓冲液中。
定量DNA,并将1μl得到的DNA和Takara的宽范围序列梯,以及使用Invitrogen的低质量序列梯和从(e)中得到的1μl的材料,在2%的凝胶或PAGE凝胶中进行电泳来进行质量控制。
(b)环化
设置96孔培养板,每个孔均含有以下物质(MJ Research):
100ng DNA                                            50μl
连接溶液1(Takara Ligation Kit ver2)                  50μl
密封培养板,以防止蒸发。
16℃下孵育过夜。
使用三个纯化柱进行PCR纯化(Qiagen),重悬在每个40μl的洗脱缓冲液中,得到总量约为120μl。
(c)GsuI酶切
设置9管:
环化的DNA                                           12μl
10×缓冲液TANGO(Fermentas)                          8.6μl
10×SAM(New England Biolabs)                        8.6μl
GsuI(5U/μl(Fermentas)                               1μl
不含核酸酶的水                                      55.8μl
在30℃下酶切至少2小时,但并不酶切过夜。得到如SEQ ID NOS:32和33所示的寡核苷酸。
(d)环化
设置9管,每管含有以下物质:
约100ng DNA                               50μl
连接溶液1(Takara Ligation Kit ver2)       50μl
16℃下孵育过夜。
进行苯酚氯仿乙醇沉淀,并重悬在12μl的洗脱缓冲液中。
(e)通过置于冰上的滚环扩增(Rolling Circle Amplication)(Templiphi试剂盒,Amersham)的解冻溶液进行扩增。制备3-4个含有以下物质的管:
2.5ng DNA                                   1μl
Templiphi试剂盒变性缓冲液(kit denature buffer)(Amersham)    10μl
在95℃下加热3分钟,然后置于冰上冷却。
在反应缓冲液中加入:
Templ iphi kit premix(Amersham)                  10μl
使用轻敲或温和地涡旋混合均匀。
在30℃下孵育16-18小时,但不摇动。
例如,微量移液1μl材料进行检测。它应该是有粘性的。通过皮克绿(picogreen)荧光测定法(Quant-iT DNA assay kit,Molecular Probes)对双链DNA进行定量。
(f)BamHI酶切
100μgDNA                                           1μl
10×单一的BamHI缓冲液(New England Biolabs)         10μl
100×牛血清白蛋白(New England Biolabs)             1μl
BamHI(20U/μl;超过2倍)(New England Bioiabs)        10μl
不含核酸酶水                                       78μl
如需要消化DNA应制备更多的管;在37℃下孵育过夜,以获得SEQ IDNOS:34和35所示的寡核苷酸。
(g)凝胶纯化
将得到的DNA与合适的序列梯(例如,Takara的宽范围序列梯)一起负载2%的琼脂糖凝胶的Scie-Plas的中等尺寸孔(每孔60μl)中。在80V下电泳约1.5小时,然后在365nm的紫外光下观察。具有错误插入的接头的寡核苷酸将通过电泳被去除掉(错误插入的接头的例子,见图8-10)。根据生产商的建议使用一次性Fermentas ElutaTubes将双标签条带切出并进行电洗脱。在90V电压下电洗脱1-1.5小时,然后以如下方式将得到的双标签进行乙醇沉淀:
每200μl洗脱液加入:
3M NaOAc pH5.2                                20μl
1M MgC12                                      4.5μl
糖蓝                                          2μl
100%的乙醇                                   800μl
重悬沉淀的diPETs于12μl的洗脱缓冲液中,并使用2-5μl得到的diPETs和低质量序列梯(Invitrogen)在4-20%的PAGE微型胶中进行电泳以检测纯度并在视觉上进行定量。
(4)CIA-diPET的测序
(a)凝胶纯化的BamHI-粘结性diPETs的连接:
CIA-diPETs 200-1000ng                               6μl
10×连接酶缓冲液(具有亚精胺)                        1μl
T4DNA连接酶(5U/μl)(Invitrogen)                      1μl
不含核酸酶的水                                      2μl
在16℃下孵育2小时至过夜。然后在65℃下热灭活10分钟。
(b)CIA-diPET连环体的部分BamHI再消化
使用Qiagen的PCR快速旋转纯化试剂盒(Qiagen PCR purificationQuickSpin Kit)纯化连环体DNA。然后使用1μl的纳米微滴对DNA进行定量(纳米微滴技术),并进行短时间的BamHI再消化:
连环体                                             20μl
10×BamHI缓冲液(New England Biolabs)               3μl
BamHI(稀释至1U/μl)(New England Biolabs)            0.2μl
100×BSA(New England Biolabs)                      0.5μl
不含核酸酶的水                                     6.3μl
在37℃下孵育30分钟,并不再孵育更长的时间。
快速加入6μl的荷载染料,在65℃加热15分钟,并且在负载于PAGE凝胶上之前置于冰上冷却。
(c)连环体化的CIA-diPETs的PAGE纯化
优选将全部的样本负载于4-20%的序列梯PAGE微型胶的一个孔中,在该微型胶的两侧负载有Takara的宽范围序列梯和Invitrogen的低质量序列梯,以检测大小。在200V下电泳约1小时。在SYBR Green I中染色15-30分钟,在用于切割凝胶的Dark Reader透照器(transilluminator)(Clare Chemical)中显影。
(d)连环体的切除
将连环体化的DNA切成3个分离部分,低(400-1000bp)、中等(1000-2000bp)、和高(>2000bp)。将每个切除大小片段的凝胶片段置于0.6ml的夏普列斯超速微量离心管(microfuge)中,该离心管的底部被21G针刺穿。将被刺穿的管置于1.7ml的夏普列斯超速微量离心管中,并在16110g,4℃下离心5分钟。因而,凝胶片段方便地破碎,并收集在1.7ml管的底部。在每个管中加200μl的LoTE:NH4OAc(167:33)(LoTE配方如下,NH4OAc购自Ambion),在65℃下加热2小时进行洗脱。
LoTE缓冲液:
3mM Tris-HCl pH7.5(Ambion)
0.2mM EDTA(Ambion)
在前述的微离心过滤装置中下,在16110g,4℃下离心10分钟,从凝胶片段中分离出上清液(含有洗脱的连接DNA)。对每个洗脱的大小片段进行苯酚/氯仿抽提,然后乙醇沉淀:
洗脱的DNA片段                               200μl
3M乙酸钠pH5.2                               20μl
糖蓝                                        2.2μl
100%的乙醇                     800μl
在-80℃下保存30分钟;在16110g,4℃下离心30分钟;用75%的乙醇冲洗1次。在6μl的LoTE缓冲液中重悬沉淀物。
(e)连接至pZErO-1载体
在使用前,pZErO-1克隆载体通过使用10个单位的BamHI(New EnglandBiolabs)在37℃下消化2μg的pZErO-1质粒DNA(Invitrogen)2小时而得到。消化的质粒DNA进行苯酚氯仿提纯和乙醇沉淀,然后重悬于60μl浓度为33ng/μl的LoTE中。可以通过设置载体自连接作为对照(几乎没有菌落)并进行琼脂糖凝胶电泳,来验证所述载体的有效性。
设置以下连接体系:
连环体DNA片段                            6μl
BamHI/pZErO-1                            1μl
5×连接酶缓冲液(具有PEG)(Invitrogen)     2μl
T4DNA连接酶(5U/μL)(Invitrogen)           1μl
16℃下孵育过夜。不进行热灭活。
还平行设置了自连接载体作为对照。当制备用于自连接的载体时,使用不含核酸酶的水替代连环体DNA片段。
在进行电穿孔之前,纯化各连接反应产物以去除盐:用不含核酸酶的水将体积调节至200μl,进行苯酚/氯仿提纯(pH7.9)和在-80℃下乙醇沉淀30分钟(使用糖蓝)。离心,使用70%的乙醇清洗沉淀物至少两次,并重悬在12μl的LoTE中。
在预冷的1.7ml夏普列斯超速微量离心管中,将1μl纯化的连接反应产物加入到25μl的电转化细胞(例如,购自Lucigen的E.cloni;购自invitrogen的TOP10)中。并不上下吹打混合,而是使用吸管端轻轻地搅动。置于冰上5分钟,然后转入到预冷的Biorad电穿孔比色皿中(0.1cm缝隙)。
再在冰上放置5分钟。使用Biorad微脉冲发生器、单脉冲、程序EC1进行电穿孔。时间常数通常为4.5-5毫秒。
在10秒的脉冲内,加入1ml室温普通的LB培养基,转入到15ml Falcon管中,在37℃、200rpm振荡下恢复1小时。
在含有低盐LB琼脂并添加有择示(Zeocin)(Immudia ZeocinAgar,Invitrogen)的小型琼脂平板上涂布20-50μl(取自1ml培养基),并在37℃下孵育过夜。
(f)文库质量控制
在除去自连接背景后,对克隆进行计数并检测文库的有效性。挑24-48个克隆用于PCR筛选,该PCR筛选使用引物PMR011和PMR012。包括对pZErO-1载体本身的对照PCR。基于PCR结果,挑1-4×96孔板的过夜培养(在低盐LB+择示,Immedia,Invitrogen)的克隆,对质粒进行纯化和进行测序,以检测每个插入物中双标签的平均数。
在这个阶段,所述文库可以以纯化的连接混合物的形式在-20℃下保存,直到进行更大规模的转化、质粒提取和测序。
(g)对测序的文库进行平板培养并挑菌落
每个平板以小于2000个的菌落密度,将转化的TOP10(Invitrogen)细菌细胞置于22×22cm的琼脂糖平板(Q-trays,Genetix)上进行平板培养,以便于机器挑菌。挑取的单个菌落培养在含有添加有择示的LB(见上文)的384孔平板中,并在37℃下过夜。重复384孔平板的实验多次,然后在15%的丙三醇(Sigma)的存在下于-80℃下保存。
(h)模板的制备
使用Sprintprep的固相试剂盒(Agencourt),制备从pZERO-1衍生的克隆得到的质粒。
(i)DNA测序
使用测序引物PMR011和PMR012(分别为SEQ ID NOS:13和14)从两个方向对质粒进行测序。
(5)对CIA-diPETs进行定位
使用压缩的后缀阵列(Compressed Suffix Array)进行定位。穿越两个不同的DNA片段的多个连接(n>3)应该表示真实的远端控制区(图5)。在使用含有定位到基因组的不同位点的标签的任何嵌合体表示基因组的重排之前,多于3个PETs显示了相同延伸的DNA的重排,即,间隔超过10kb分布的或者位于不同染色体上的标签1和标签2。
实施例4:使用的M和G载体pGIS8的构建
(a)得到pGIS8载体。
(b)通过如上所述的置于冰上的滚环扩增(Templiphi试剂盒,Amersham)的解冻溶液进行扩增。制备3-4个含有以下物质的管:
1ng DNA(大规模制备的)                               1μl
Templiphi试剂盒变性缓冲液                           10μl
在95℃下加热3分钟,然后置于冰上暂时地冷却。
在反应缓冲液中加入:
Templiphi试剂盒预混合物                             10μl
使用轻敲或温和地涡旋混合均匀。
在30℃下孵育16-18小时,但不摇动。
对材料进行检测。它应该是有粘性的。通过皮克绿荧光测定法(Quant-iTkit,Molecular Probes)对双链DNA进行定量。
(c)进行限制性内切核酸酶的消化
DNA                                25μl
Xhol(20U/μl)(New England Biolabs)  1μl
EcoR1(20U/μl)(New England Biolabs)              1μl
10×EcoR1缓冲液(New England Biolabs)            5μl
100×BSA(New England Biolabs)                   1μl
不含核酸酶的水                                  17μl
在37℃下孵育16小时。
使用PCR纯化试剂盒(Qiagen)进行纯化。
使用1%的琼脂糖凝胶检测5μl的PCR产物。
(d)末端钝化
制备两个含有以下物质的管:
DNA                                            22.5μl
10×末端修复缓冲液(Epicentre)                  5μl
2.5mM dNTP混合物(Epicentre)                    5μl
10mM ATP(Epicentre)                            5μl
末端修复酶混合物                               1μl
不含核酸酶的水                                 11.5μl
在室温下孵育45分钟,并在70℃下加热10分钟停止反应。
应该理解的是,在不背离本发明的宗旨和范围的情况下,本领域的技术人员能够进行多种修改和改进。
例如,本发明的CIA法可以用于其它种类的细胞,例如,酵母细胞替代哺乳动物细胞。同样,替代使用ChIP法,本发明的方法可以通过使用适合的固定剂而不需要免疫沉淀作用而进行实施。在这种变化中,所述方案为:
1、采集细胞。
2、使用甲醛在36℃下交联10分钟。
3、使用珠子-破碎机使细胞裂解并随后进行离心,以获得上清液。
4、通过超声波裂解法、水力剪切、皮下注射器针头的反复抽提、或通过限制性内切核酸酶的酶解作用剪切DNA。
5、通过SDS和去通-X(Triton-X)处理,去除不需要的蛋白质。
此后,可以按照上文所描述的方法对DNA进行进一步的处理(末端钝化,连接)。
此外,在另一种变化中,可以使用滚环扩增替代PCR。在这种变化中,去除不需要的蛋白质的程序为:
1、DNA的末端钝化
2、DNA的加尾
3、连接
4、使用合适的商购试剂盒,如购自Amersham Biosciences的Templiphi试剂盒,进行滚环扩增。
5、可以使用Invitrogen/Molecular Probes′PicoGreen荧光试剂盒(fluorimetry kit)对DNA进行定量。
6、使用MmeI限制性内切核酸酶消化,以获得分离的寡核苷酸。
此外,在另一个变化中,可以省略加尾步骤,可以使用合适的钝化末端接头。
References
Antequera and Bird(1993),Proc Natl Acad Sci USA.90(24):11995-9
Ausubel(1995)Current Protocols in Molecular Biology,Vol.2,1995,Ed.Ausubel,et al.,Greene Publish.Assoc.& WIiley Interscience,Unlt3.1.15
Bonetta(2006)Nature Methods3(2):141-147.
Brenneret al(2000).,Nat Biotechnol,2000.18(6):p.630-4
Buck and Lieb(2004)Genomics83(3):349-60
Dekker J,Rippe K,Dekker M and Kleckner N(2002)Science 295(5558):1306-11.
Dunn et al(2002)Genome Research 12(11):1756-1765
Euskirchen et al.,Mol Cell Biol,2004.24(9):p.3804-14
Liand Chandrasegaran(1993)Proc.Nat.Acad.Sciences USA 90:2764-8
Lieb et al.,Nat Genet,2001.28(4):p.327-34
Marguiies et al,2005 Nature 437,376-380(15 Sep 2005)
New England Biolabs Catalog2005.New England Biolabs(Ipswich,MA)
Szybalski,W.,1985,Gene,40:169
Taverner et al.,Genome Biol,2004.5(3):210.
US20050255501
US20050059022
US20030068629
US4,766,072
Weinmann et al.,Genes Dev,2002.16(2):235-44)
序列表
<110>新加坡科技研究局
<120>核酸相互作用分析
<130>FP3534
<160>63
<170>PatentIn version 3.4
<210>1
<211>31
<212>DNA
<213>人工序列
<220>
<223>M&M接头有义链;5’末端是磷酸化的
<400>1
gtcggaggcc aaggcggccg tacgtccaac t    31
<210>2
<211>31
<212>DNA
<213>人工序列
<220>
<223>M&M接头反义链;5’末端是磷酸化的
<400>2
gttggacgta cggccgcctt ggcctccgac t    31
<210>3
<211>31
<212>DNA
<213>人工序列
<220>
<223>M&G接头有义链;5’末端是磷酸化的
<400>3
gtcggaggcc aaggcggccg tacgctggag t    31
<210>4
<211>31
<212>DNA
<213>人工序列
<220>
<223>M&G接头反义链;5’末端是磷酸化的
<400>4
ctccagcgta cggccgcctt ggcctccgac t    31
<210>5
<211>28
<212>DNA
<213>人工序列
<220>
<223>P1连接衔接头(PMR 011)有义链;5’末端是磷酸化的
<400>5
ggatccctta atcgccttgc agcacatc        28
<210>6
<211>30
<212>DNA
<213>人工序列
<220>
<223>P1连接衔接头(PMR 011)反义链;5’端不是磷酸化的
<220>
<221>misc_feature
<222>(29)..(30)
<223>n是a、c、g或t
<400>6
gatgtgctgc aaggcgatta agggatccnn       30
<210>7
<211>29
<212>DNA
<213>人工序列
<220>
<223>P2连接衔接头(PMR 012)有义链;5’末端是磷酸化的
<400>7
ggatcccctg tgtgaaattg ttatccgct        29
<210>8
<211>31
<212>DNA
<213>人工序列
<220>
<223>P2连接衔接头(PMR 012)反义链;5’末端不是磷酸化的
<220>
<221>misc_feature
<222>(30)..(31)
<223>n是a、c、g或t
<400>8
agcggataac aatttcacac aggggatccn n    31
<210>9
<211>28
<212>DNA
<213>人工序列
<220>
<223>D1diPETing衔接头(PMR011)有义链;5’末端是磷酸化的
<400>9
ggatccctta atcgccttgc agcacatc       28
<210>10
<211>30
<212>DNA
<213>人工序列
<220>
<223>D1diPETing衔接头(PMR011)反义链;5’末端不是磷酸化的
<220>
<221>misc_feature
<222>(29)..(30)
<223>n是a、c、g或t
<400>10
gatgtgctgc aaggcgatta agggatccnn      30
<210>11
<211>39
<212>DNA
<213>人工序列
<220>
<223>D2diPETing衔接头(PMR012)有义链;5’末端是磷酸化的
<400>11
ggatccaatg ctcctccctg tgtgaaattg ttatccgct      39
<210>12
<211>41
<212>DNA
<213>人工序列
<220>
<223>D2diPETing衔接头(PMR012)反义链;5’末端不是磷酸化的
<220>
<221>misc_feature
<222>(40)..(41)
<223>n是a、c、g或t
<400>12
agcggataac aatttcacac agggaggagc attggatccn n    41
<210>13
<211>22
<212>DNA
<213>人工序列
<220>
<223>PMR011;5’末端是磷酸化的
<400>13
gatgtgctgc aaggcgatta ag                         22
<210>14
<211>23
<212>DNA
<213>人工序列
<220>
<223>PMR012;5’末端是磷酸化的
<400>14
agcggataac aatttcacac agg                        23
<210>15
<211>32
<212>DNA
<213>人工序列
<220>
<223>RecA选择寡核苷酸;生物素化的
<400>15
agtcggaggc caaggcggcc gtacgctgga gt                         32
<210>16
<211>43
<212>DNA
<213>人工序列
<220>
<223>用于pGIS8载体的多克隆位点填充片断(stuffer)的有义链
<400>16
aattggatcc gactcgagga tgaattctcc aggatccctc ctc              43
<210>17
<211>43
<212>DNA
<213>人工序列
<220>
<223>用于pGIS8载体的多克隆位点填充片断(stuffer)的反义链
<400>17
tcgagaggag ggatcctgga gaattcatcc tcgagtcgga tcc              43
<210>18
<211>3541
<212>DNA
<213>人工序列
<220>
<223>pGIS8载体的有义链
<400>18
gggcgaattc gatatcgcgg ccgcgcctgg ataaagtcag cagcttccac gccagcttca    60
cacaaaaagt gactgacggt agcggcgcgg cggtgcagga aggtcagggc gatctgtggg    120
tgaaacgtcc aaacttattc aactggcata tgacacaacc tgatgaaagc attctggttt    180
ctgacggtaa aacactgtgg ttctataacc cgttcgttga gcaagctacg gcaacctggc    240
tgaaagatgc caccggtaat acgccgttta tgctgattgc ccgcaaccag tccagcgact    300
ggcagcagta caatatcaaa cagaatggcg atgactttgt cctgacgccg aaagccagca    360
atggcaatct gaagcagttc accattaacg tgggacgtga tggcacaatc catcagttta    420
gcgcggtgga gcaggacgat cagcgcagca gttatcaact gaaatcccag caaaatgggg    480
ctgtggatgc agcgaaattt accttcaccc cgccgcaagg cgtcacggta gatgatcaac    540
gtaagtagag gcacctgagt gagcaatctg tcgctcgatt tttcggataa tacttttcaa    600
cctctggccg cgcgtatgcg gccagaaaat ttagcacagt atatcggcca gcaacatttg    660
ctggctgcgg ggaagccgtt gccgcgcgct atcgaagccg ggcatttaca ttctatgatc    720
ctctgggggc cgccgggtac cggcaaaaca actctcgctg aagtgattgc ccgctatgcg    780
aacgctgatg tggaacgtat ttctgccgta agtcgaattg gatccgactc gaggatgaat    840
tctccaggat ccctcctctg agtattctat agtgtcacct aaatagcttg gcgtaatcat    900
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag    960
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg    1020
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa    1080
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca    1140
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg    1200
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc    1260
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttcgat aggctccgcc    1320
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac    1380
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gtaccgaccc    1440
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata    1500
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc    1560
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagacca    1620
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag    1680
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta    1740
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg    1800
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc    1860
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt    1920
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa    1980
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat    2040
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga    2100
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac    2160
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg    2220
ctccggattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg    2280
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt    2340
cgccagttaa tagtttgcgc aacgttgttg gcattgctac aggcatcgtg gtgtcacgct    2400
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat    2460
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta    2520
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca    2580
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat    2640
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac    2700
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa    2760
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt    2820
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg    2880
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat    2940
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt    3000
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct    3060
aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc    3120
gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg    3180
tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg  3240
gtgttggcgg gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag  3300
tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc  3360
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc  3420
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag  3480
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attgtaatac gactcactat  3540
a                                                                  3541
<210>19
<211>3541
<212>DNA
<213>人工序列
<220>
<223>pGIS8载体的反义链
<400>19
tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac    60
cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat    120
agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg    180
cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc    240
actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca    300
cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg    360
accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga    420
cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct    480
tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc    540
taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa    600
tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt    660
gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct    720
gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc    780
cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta    840
tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac    900
tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc    960
atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac    1020
ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg    1080
gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac    1140
gagcgtgaca ccacgatgcc tgtagcaatg ccaacaacgt tgcgcaaact attaactggc    1200
gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt    1260
gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatccgga    1320
gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc    1380
cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag    1440
atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca    1500
tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc    1560
ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca    1620
gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc    1680
tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta    1740
ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt    1800
ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc    1860
gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg    1920
ttggtctcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg    1980
tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag    2040
ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc    2100
agggtcggta caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat    2160
agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg    2220
gggcggagcc tatcgaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc    2280
tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt    2340
accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca    2400
gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg    2460
attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac    2520
gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg    2580
gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac    2640
catgattacg ccaagctatt taggtgacac tatagaatac tcagaggagg gatcctggag    2700
aattcatcct cgagtcggat ccaattcgac ttacggcaga aatacgttcc acatcagcgt    2760
tcgcatagcg ggcaatcact tcagcgagag ttgttttgcc ggtacccggc ggcccccaga    2820
ggatcataga atgtaaatgc ccggcttcga tagcgcgcgg caacggcttc cccgcagcca    2880
gcaaatgttg ctggccgata tactgtgcta aattttctgg ccgcatacgc gcggccagag    2940
gttgaaaagt attatccgaa aaatcgagcg acagattgct cactcaggtg cctctactta    3000
cgttgatcat ctaccgtgac gccttgcggc ggggtgaagg taaatttcgc tgcatccaca    3060
gccccatttt gctgggattt cagttgataa ctgctgcgct gatcgtcctg ctccaccgcg    3120
ctaaactgat ggattgtgcc atcacgtccc acgttaatgg tgaactgctt cagattgcca    3180
ttgctggctt tcggcgtcag gacaaagtca tcgccattct gtttgatatt gtactgctgc    3240
cagtcgctgg actggttgcg ggcaatcagc ataaacggcg tattaccggt ggcatctttc    3300
agccaggttg ccgtagcttg ctcaacgaac gggttataga accacagtgt tttaccgtca    3360
gaaaccagaa tgctttcatc aggttgtgtc atatgccagt tgaataagtt tggacgtttc    3420
acccacagat cgccctgacc ttcctgcacc gccgcgccgc taccgtcagt cactttttgt    3480
gtgaagctgg cgtggaagct gctgacttta tccaggcgcg gccgcgatat cgaattcgcc    3540
c                                                                    3541
<210>20
<211>69
<212>DNA
<213>人工序列
<220>
<223>M&M衔接头PET的有义链
<220>
<221>misc_feature
<222>(1)..(17)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(50)..(69)
<223>n是a、c、g或t
<400>20
nnnnnnnnnn nnnnnnnagt cggaggccaa ggcggccgta cgtccaactn nnnnnnnnnn    60
nnnnnnnnn                                                            69
<210>21
<211>69
<212>DNA
<213>人工序列
<220>
<223>M&M衔接头PET反义链
<220>
<221>misc_feature
<222>(1)..(18)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(51)..(69)
<223>n是a、c、g或t
<400>21
nnnnnnnnnn nnnnnnnnag ttggacgtac ggccgccttg gcctccgact nnnnnnnnnn    60
nnnnnnnnn                                                            69
<210>22
<211>128
<212>DNA
<213>人工序列
<220>
<223>具有衔接头序列的M&M衔接头PET有义链
<220>
<221>misc_feature
<222>(29)..(47)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(80)..(99)
<223>n是a、c、g或t
<400>22
gatgtgctgc aaggcgatta agggatccnn nnnnnnnnnn nnnnnnnagt cggaggccaa    60
ggcggccgta cgtccaactn nnnnnnnnnn nnnnnnnnng gatcccctgt gtgaaattgt    120
tatccgct                                                             128
<210>23
<211>128
<212>DNA
<213>人工序列
<220>
<223>具有衔接头序列的M&M衔接头PET反义链
<220>
<221>misc_feature
<222>(30)..(49)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(82)..(100)
<223>n是a、c、g或t
<400>23
agcggataac aatttcacac aggggatccn nnnnnnnnnn nnnnnnnnna gttggacgta    60
cggccgcctt ggcctccgac tnnnnnnnnn nnnnnnnnnn ggatccctta atcgccttgc    120
agcacatc                                                             128
<210>24
<211>77
<212>DNA
<213>人工序列
<220>
<223>在切割衔接头序列后的M&M最终PET有义链
<220>
<221>misc_feature
<222>(6)..(24)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(57)..(76)
<223>n是a、c、g或t
<400>24
gatccnnnnn nnnnnnnnnn nnnnagtcgg aggccaaggc ggccgtacgt ccaactnnnn    60
nnnnnnnnnn nnnnnng                                                   77
<210>25
<211>77
<212>DNA
<213>人工序列
<220>
<223>在切割衔接头序列后的M&M最终PET反义链
<220>
<221>misc_feature
<222>(6)..(25)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(58)..(76)
<223>n是a、c、g或t
<400>25
gatccnnnnn nnnnnnnnnn nnnnnagttg gacgtacggc cgccttggcc tccgactnnn    60
nnnnnnnnnn nnnnnng                                                   77
<210>26
<211>85
<212>DNA
<213>人工序列
<220>
<223>在超声后的M&G衔接头的有义链
<220>
<221>misc_feature
<222>(1)..(23)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(56)..(85)
<223>n是a、c、g或t
<400>26
nnnnnnnnnn nnnnnnnnnn nnnagtcgga ggccaaggcg gccgtacgct ggagtnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnn                                          85
<210>27
<211>85
<212>DNA
<213>人工序列
<220>
<223>在超声后的M&G衔接头的反义链
<220>
<221>misc_feature
<222>(1)..(30)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(63)..(85)
<223>n是a、c、g或t
<400>27
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn actccagcgt acggccgcct tggcctccga    60
ctnnnnnnnn nnnnnnnnnn nnnnn                                          85
<210>28
<211>140
<212>DNA
<213>人工序列
<220>
<223>在克隆到pGIS8载体后的M&G衔接头有义链,载体的剩余部分没有给出。
<220>
<221>misc_feature
<222>(10)..(54)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(87)..(129)
<223>n是a、c、g或t
<400>28
ggatccgacn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnagtcgg    60
aggccaaggc ggccgtacgc tggagtnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nnnnnnnnnc tccaggatcc                                                140
<210>29
<211>140
<212>DNA
<213>人工序列
<220>
<223>在克隆到pGIS8载体后的M&G衔接头反义链,载体的剩余部分没有给出。
<220>
<221>misc_feature
<222>(12)..(54)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(87)..(131)
<223>n是a、c、g或t
<400>29
ggatcctgga gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnactcca    60
gcgtacggcc gccttggcct ccgactnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nnnnnnnnnn ngtcggatcc                                                140
<210>30
<211>132
<212>DNA
<213>人工序列
<220>
<223>M PET调节有义链
<220>
<221>misc_feature
<222>(10)..(46)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(79)..(121)
<223>n是a、c、g或t
<400>30
ggatccgacn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnagtc ggaggccaag    60
gcggccgtac gctggagtnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nctccaggat cc                                                        132
<210>31
<211>132
<212>DNA
<213>人工序列
<220>
<223>M PET调节反义链
<220>
<221>misc_feature
<222>(12)..(64)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(97)..(123)
<223>n是a、c、g或t
<400>31
ggatcctgga gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnactcca gcgtacggcc gccttggcct ccgactnnnn nnnnnnnnnn nnnnnnnnnn    120
nnngtcggat cc                                                      132
<210>32
<211>116
<212>DNA
<213>人工序列
<220>
<223>M&G diPET有义链
<220>
<221>misc_feature
<222>(9)..(45)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(78)..(105)
<223>n是a、c、g或t
<400>32
gatccgacnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnagtcg gaggccaagg    60
cggccgtacg ctggagtnnn nnnnnnnnnn nnnnnnnnnn nnnnnctcca ggatcc        116
<210>33
<211>116
<212>DNA
<213>人工序列
<220>
<223>M&G diPET反义链
<220>
<221>misc_feature
<222>(12)..(37)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(70)..(108)
<223>n是a、c、g或t
<400>33
ggatcctgga gnnnnnnnnn nnnnnnnnnn nnnnnnnact ccagcgtacg gccgccttgg    60
cctccgactn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnngt cggatc    116
<210>34
<211>111
<212>DNA
<213>人工序列
<220>
<223>释放的具有BamH1粘性端的diPET有义链。
<220>
<221>misc_feature
<222>(9)..(45)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(78)..(105)
<223>n是a、c、g或t
<400>34
gatccgacnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnagtcg gaggccaagg    60
cggccgtacg ctggagtnnn nnnnnnnnnn nnnnnnnnnn nnnnnctcca g             111
<210>35
<211>111
<212>DNA
<213>人工序列
<220>
<223>释放的具有BamH1粘性端的diPET反义链。
<220>
<221>misc_feature
<222>(11)..(39)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(72)..(107)
<223>n是a、c、g或t
<400>35
gatcctggag nnnnnnnnnn nnnnnnnnnn nnnnnnnnna ctccagcgta cggccgcctt    60
ggcctccgac tnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnngtc g             111
<210>36
<211>91
<212>DNA
<213>人工序列
<220>
<223>在用MmeI消化前的M&M PET有义链。
<220>
<221>misc_feature
<222>(1)..(28)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(61)..(91)
<223>n是a、c、g或t
<400>36
nnnnnnnnnn nnnnnnnnnn nnnnnnnnag tcggaggcca aggcggccgt acgtccaact    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn n                                   91
<210>37
<211>91
<212>DNA
<213>人工序列
<220>
<223>在用MmeI消化前的M&M PET反义链。
<220>
<221>misc_feature
<222>(1)..(31)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(64)..(91)
<223>n是a、c、g或t
<400>37
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nagttggacg tacggccgcc ttggcctccg    60
actnnnnnnn nnnnnnnnnn nnnnnnnnnn n                                   91
<210>38
<211>53
<212>DNA
<213>人工序列
<220>
<223>如图8所示的有义链在插入M&G接头前的寡核苷酸。
<220>
<221>misc_feature
<222>(1)..(53)
<223>n是a、c、g或t
<400>38
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnn    53
<210>39
<211>53
<212>DNA
<213>人工序列
<220>
<223>如图8所示的反义链在插入M&G接头前的寡核苷酸
<220>
<221>misc_feature
<222>(1)..(30)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(32)..(53)
<223>n是a、c、g或t
<400>39
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn tnnnnnnnnn nnnnnnnnnn nnn    53
<210>40
<211>140
<212>DNA
<213>人工序列
<220>
<223>插入质粒(质粒剩余部分未给出)中的如图8所示的有义链的寡核苷酸
<220>
<221>misc_feature
<222>(10)..(129)
<223>n是a、c、g或t
<400>40
ggatccgacn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nnnnnnnnnc tccaggatcc                                                140
<210>41
<211>140
<212>DNA
<213>人工序列
<220>
<223>插入质粒(质粒剩余部分未给出)中的如图8所示的反义链的寡核苷酸
<220>
<221>misc_feature
<222>(12)..(131)
<223>n是a、c、g或t
<400>41
ggatcctgga gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nnnnnnnnnn ngtcggatcc                                                140
<210>42
<211>140
<212>DNA
<213>人工序列
<220>
<223>在用MmeI酶切后的插入质粒(质粒剩余部分未给出)中的如图8所示的有义链的寡核苷酸
<220>
<221>misc_feature
<222>(10)..(129)
<223>n是a、c、g或t
<400>42
ggatccgacn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nnnnnnnnnc tccaggatcc                                                140
<210>43
<211>140
<212>DNA
<213>人工序列
<220>
<223>在用MmeI酶切后的插入质粒(质粒剩余部分未给出)中的如图8所示的反义链的寡核苷酸。
<220>
<221>misc_feature
<222>(12)..(131)
<223>n是a、c、g或t
<400>43
ggatcctgga gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nnnnnnnnnn ngtcggatcc                                                140
<210>44
<211>112
<212>DNA
<213>人工序列
<220>
<223>通过电泳除去的没有插入M&G接头的如图8所示的有义链的寡核苷酸
<220>
<221>misc_feature
<222>(8)..(106)
<223>n是a、c、g或t
<400>44
gatccgannn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnctcc ag            112
<210>45
<211>112
<212>DNA
<213>人工序列
<220>
<223>通过电泳除去的没有插入M&G接头的如图8所示的反义链的寡核苷酸
<220>
<221>misc_feature
<222>(11)..(109)
<223>n是a、c、g或t
<400>45
gatcctggag nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnt cg            112
<210>46
<211>59
<212>DNA
<213>人工序列
<220>
<223>如图9所示的有义链在插入M&G接头前的寡核苷酸
<220>
<221>misc_feature
<222>(1)..(23)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(30)..(59)
<223>n是a、c、g或t
<400>46
nnnnnnnnnn nnnnnnnnnn nnntccgacn nnnnnnnnnn nnnnnnnnnn nnnnnnnnn    59
<210>47
<211>59
<212>DNA
<213>人工序列
<220>
<223>如图9所示的反义链在插入M&G接头前的寡核苷酸
<220>
<221>misc_feature
<222>(1)..(30)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(37)..(59)
<223>n是a、c、g或t
<400>47
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn gtcggannnn nnnnnnnnnn nnnnnnnnn    59
<210>48
<211>140
<212>DNA
<213>人工序列
<220>
<223>插入的具有部分M&G接头的如图9所示的有义链的寡核苷酸(质粒剩余部分没有给出)
<220>
<221>misc_feature
<222>(10)..(58)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(65)..(129)
<223>n是a、c、g或t
<400>48
ggatccgacn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnntc    60
cgacnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nnnnnnnnnc tccaggatcc                                                140
<210>49
<211>140
<212>DNA
<213>人工序列
<220>
<223>插入的具有部分M&G接头的如图9所示的反义链的寡核苷酸(质粒剩余部分没有给出)
<220>
<221>misc_feature
<222>(12)..(76)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(83)..(131)
<223>n是a、c、g或t
<400>49
ggatcctgga gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnnngtcg gannnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nnnnnnnnnn ngtcggatcc                                                140
<210>50
<211>126
<212>DNA
<213>人工序列
<220>
<223>在用限制性内切核酸酶消化后的插入的具有部分M&G接头的如图9所示的有义链的寡核苷酸
(质粒剩余部分没有给出)
<220>
<221>misc_feature
<222>(10)..(44)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(51)..(115)
<223>n是a、c、g或t
<400>50
ggatccgacn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnntccgac nnnnnnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnctcca    120
ggatcc                                                               126
<210>51
<211>126
<212>DNA
<213>人工序列
<220>
<223>在用限制性内切核酸酶消化后的插入的具有部分M&G接头的如图9所示的反义链的寡核苷酸
(质粒剩余部分没有给出)
<220>
<221>misc_feature
<222>(12)..(76)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(83)..(117)
<223>n是a、c、g或t
<400>51
ggatcctgga gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnnngtcg gannnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnngtc    120
ggatcc                                                               126
<210>52
<211>120
<212>DNA
<213>人工序列
<220>
<223>从质粒中切除的如图9所示的有义链的寡核苷酸,由于该寡核苷酸太长通过电泳除去
<220>
<221>misc_feature
<222>(9)..(43)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(50)..(114)
<223>n是a、c、g或t
<400>52
gatccgacnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnntccgacn nnnnnnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnctccag    120
<210>53
<211>120
<212>DNA
<213>人工序列
<220>
<223>从质粒中切除的如图9的反义链的寡核苷酸,由于该寡核苷酸太长通过电泳除去
<220>
<221>misc_feature
<222>(11)..(75)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(82)..(116)
<223>n是a、c、g或t
<400>53
gatcctggag nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnngtcgg annnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnngtcg    120
<210>54
<211>85
<212>DNA
<213>人工序列
<220>
<223>具有反向插入的M&G接头的如图10所示的有义链的寡核苷酸
<220>
<221>misc_feature
<222>(1)..(23)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(56)..(85)
<223>n是a、c、g或t
<400>54
nnnnnnnnnn nnnnnnnnnn nnnagtcgga ggccaaggcg gccgtacgct ggagtnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnn                                          85
<210>55
<211>85
<212>DNA
<213>人工序列
<220>
<223>具有反向插入的M&G接头的如图10所示的反义链的寡核苷酸
<220>
<221>misc_feature
<222>(1)..(30)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(63)..(85)
<223>n是a、c、g或t
<400>55
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn actccagcgt acggccgcct tggcctccga    60
ctnnnnnnnn nnnnnnnnnn nnnnn                                          85
<210>56
<211>148
<212>DNA
<213>人工序列
<220>
<223>插入到质粒中的如图10所示的有义链的寡核苷酸(质粒的剩余部分未给出)
<220>
<221>misc_feature
<222>(10)..(54)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(87)..(139)
<223>n是a、c、g或t
<400>56
ggactggagn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnagtcgg    60
aggccaaggc ggccgtacgc tggagtnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nnnnnnnnnn nnnnnnnnng tcggatcc                                       148
<210>57
<211>148
<212>DNA
<213>人工序列
<220>
<223>插入到质粒中的如图10所示的反义链的寡核苷酸(质粒的剩余部分未给出)
<220>
<221>misc_feature
<222>(10)..(62)
<223>n是a、c、g或t
<220>
<221>misc_feature
<222>(95)..(139)
<223>n是a、c、g或t
<400>57
ggatccgacn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnactccagc gtacggccgc cttggcctcc gactnnnnnn nnnnnnnnnn nnnnnnnnnn    120
nnnnnnnnnn nnnnnnnnnc tccagtcc                                       148
<210>58
<211>62
<212>DNA
<213>人工序列
<220>
<223>如图10所示的中间体1寡核苷酸的有义链
<220>
<221>misc_feature
<222>(10)..(53)
<223>n是a、c、g或t
<400>58
ggactggagn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnngtcggat    60
cc                                                                   62
<210>59
<211>62
<212>DNA
<213>人工序列
<220>
<223>如图10所示的中间体1寡核苷酸的反义链
<220>
<221>misc_feature
<222>(10)..(53)
<223>n是a、c、g或t
<400>59
ggatccgacn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnctccagt    60
cc                                                                   62
<210>60
<211>62
<212>DNA
<213>人工序列
<220>
<223>如图10所示的中间体2寡核苷酸的有义链
<220>
<221>misc_feature
<222>(10)..(53)
<223>n是a、c、g或t
<400>60
ggactggagn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnngtcggat    60
cc                                                                   62
<210>61
<211>62
<212>DNA
<213>人工序列
<220>
<223>如图10所示的中间体2寡核苷酸的反义链
<220>
<221>misc_feature
<222>(10)..(53)
<223>n是a、c、g或t
<400>61
ggatccgacn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnctccagt    60
cc                                                                   62
<210>62
<211>114
<212>DNA
<213>人工序列
<220>
<223>通过电泳除去的由于M&G接头错误插入产生的寡核苷酸有义链
<220>
<221>misc_feature
<222>(8)..(108)
<223>n是a、c、g或t
<400>62
gatccgannn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnct ccag          114
<210>63
<211>114
<212>DNA
<213>人工序列
<220>
<223>通过电泳除去的由于M&G接头错误插入产生的寡核苷酸反义链
<220>
<221>misc_feature
<222>(11)..(111)
<223>n是a、c、g或t
<400>63
gatcctggag nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    60
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ntcg          114
28

Claims (23)

1.一种分离的寡核苷酸,该分离的寡核苷酸含有至少一个第一标签、至少一个第二标签、和至少一个插在两个标签之间的接头,其中,所述接头含有第一限制性内切核酸酶的第一识别位点和第二限制性内切核酸酶的第二识别位点,所述第一限制性内切核酸酶能够对第一识别位点的外侧进行酶切以得到第一标签,所述第一标签含有源自第一多聚核苷酸的核酸序列;所述第二限制性内切核酸酶能够对第二识别位点的外侧进行酶切以得到第二标签,所述第二标签含有源自第二多聚核苷酸的核酸序列,其中,所述第一多聚核苷酸和第二多聚核苷酸为核酸-蛋白质复合物的多聚核苷酸。
2.根据权利要求1所述的分离的寡核苷酸,其中,所述第一限制性内切核酸酶和第二限制性内切核酸酶识别位点为IIs型、III型或归巢限制性内切核酸酶的识别位点。
3.根据权利要求1所述的分离的寡核苷酸,其中,所述至少一个第一标签含有所述第一多聚核苷酸的5’末端和3’末端,所述至少一个第二标签含有所述第二多聚核苷酸的5’末端和3’末端。
4.根据权利要求1所述的分离的寡核苷酸,其中,所述第一限制性内切核酸酶能够对所述第一多聚核苷酸进行酶切以得到第一多聚核苷酸的3’末端,所述第二限制性内切核酸酶能够对所述第二多聚核苷酸进行酶切以得到第二多聚核苷酸的5’末端。
5.根据权利要求1所述的分离的寡核苷酸,其中,所述第一限制性内切核酸酶能够对所述第一多聚核苷酸进行酶切以得到第一多聚核苷酸的5’末端,所述第二限制性内切核酸酶能够对所述第二多聚核苷酸进行酶切以得到第二多聚核苷酸的3’末端。
6.根据权利要求3所述的分离的寡核苷酸,其中,所述第一限制性内切核酸酶能够对所述第一多聚核苷酸进行酶切以得到第一多聚核苷酸的3’末端,所述第二限制性内切核酸酶能够对第二多聚核苷酸进行酶切以得到第二多聚核苷酸的5’末端;所述第一多聚核苷酸还含有被第三限制性内切核酸酶所识别的第三识别位点,该限制性内切核酸酶与第一限制性内切核酸酶相容,且能够对所述第三识别位点外侧的第一多聚核苷酸进行酶切以得到所述第一多聚核苷酸的5’末端;所述第二多聚核苷酸含有被第四限制性内切核酸酶识别的第四识别位点,该第四限制性内切核酸酶与所述第二限制性内切核酸酶相容,且能够对所述第四识别位点外侧的第二多聚核苷酸进行酶切以得到第二多聚核苷酸的3’末端;所述至少一个第一标签通过连接所述第一多聚核苷酸的5’末端和3’末端获得,所述至少一个第二标签通过连接所述第二多聚核苷酸的5’末端和3’末端获得。
7.根据权利要求1所述的分离的寡核苷酸,其中,所述核酸-蛋白质复合物为染色质结构的一部分。
8.根据权利要求1所述的分离的寡核苷酸,其中,所述多聚核苷酸为DNA或RNA。
9.一种载体,该载体含有权利要求1所述的寡核苷酸。
10.一种寡核苷酸连环体,该寡核苷酸连环体含有至少两个分离的寡核苷酸,每个分离的寡核苷酸含有至少一个第一标签和至少一个第二标签,以及至少一个插在两个标签之间的接头,其中,每个接头含有第一内切核酸酶的第一识别位点和第二限制性内切核酸酶的第二识别位点,所述第一限制性内切核酸酶能够对所述第一识别位点的外侧进行酶切以得到每个第一标签,所述每个第一标签含有源自第一多聚核苷酸的核酸序列;所述第二限制性内切核酸酶能够对第二识别位点的外侧进行酶切以得到每个第二标签,所述每个第二标签含有源自第二多聚核苷酸的核酸序列,其中,每个第一多聚核苷酸和每个第二多聚核苷酸为核酸-蛋白质复合物的多聚核苷酸。
11.根据权利要求10所述的寡核苷酸连环体,其中,对于每个寡核苷酸,所述第一限制性内切核酸酶识别位点和第二限制性内切核酸酶识别位点为IIs型、III型或归巢限制性内切核酸酶的识别位点。
12.根据权利要求10所述的寡核苷酸连环体,其中,对于每个寡核苷酸,所述第一标签含有源自所述第一多聚核苷酸的5’末端和3’末端,所述第二标签还含有源自所述第二多聚核苷酸的5’末端和3’末端。
13.一种寡核苷酸文库,该寡核苷酸文库包括至少一种根据权利要求1所述的寡核苷酸。
14.一种制备至少一种分离的寡核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)(i)插入至少一个接头,该接头含有位于所述复合物的第一多聚核苷酸和第二多聚核苷酸之间的至少一个限制性内切核酸酶识别位点;
(ii)使用至少一种能够识别位于所述接头中的至少一个识别位点的限制性内切核酸酶,对所述第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签和接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸;和
(c)分离所述寡核苷酸,该寡核苷酸含至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和所述第二多聚核苷酸得自所述核酸-蛋白质复合物。
15.一种制备至少一种分离的寡核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)(i)插入至少一个接头,该接头含有位于所述复合物的第一多聚核苷酸和第二多聚核苷酸之间的至少一个限制性内切核酸酶识别位点;
(ii)在第一多聚核苷酸的5’末端和第二多聚核苷酸的3’末端分别加入至少一个限制性内切核酸酶识别位点;
(iii)使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;
(iv)连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签、和插入在所述标签之间的接头,所述第一标签含有得自所述第一多聚核苷酸的5’末端和3’末端,所述第二标签含有得自所述第二多聚核苷酸的5’末端和3’末端;和
(c)分离所述寡核苷酸,该寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和所述第二多聚核苷酸得自所述核酸-蛋白质复合物。
16.根据权利要求15所述的方法,其中,步骤b(ii)中的至少一个限制性内切核酸酶识别位点为衔接头或载体的一部分。
17.根据权利要求14所述的方法,其中,所述核酸-蛋白质复合物是通过染色质的免疫沉淀作用得到的。
18.一种检测和/或识别核酸-蛋白质复合物中的至少两种多聚核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)(i)插入至少一个接头,该接头含有位于所述复合物的第一多聚核苷酸和第二多聚核苷酸之间的至少一个限制性内切核酸酶识别位点;
(ii)使用至少一种能够识别位于所述接头中的至少一个识别位点的限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签和位于所述标签之间的接头,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸;
(c)对所述寡核苷酸进行测序,该寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和所述第二多聚核苷酸得自所述核酸-蛋白质复合物;和
(d)根据所述第一标签和所述第二标签的核苷酸序列对所述至少两种多聚核苷酸进行定位,从而对所述至少两种多聚核苷酸进行检测和/或识别。
19.一种检测和/或识别核酸-蛋白质复合物中的至少两种多聚核苷酸的方法,该方法包括:
(a)提供核酸-蛋白质复合物;
(b)(i)插入至少一个接头,该接头含有位于所述复合物的第一多聚核苷酸和第二多聚核苷酸之间的至少一个限制性内切核酸酶识别位点;
(ii)在第一多聚核苷酸的5’末端和第二多聚核苷酸的3’末端分别加入至少一个限制性内切核酸酶识别位点;
(iii)使用能够识别至少一个识别位点的至少一种限制性内切核酸酶,对第一多聚核苷酸和第二多聚核苷酸进行酶切,以获得酶切片段;
(iv)连接所述酶切片段以形成寡核苷酸,该寡核苷酸含有第一标签、第二标签、和插入在所述标签之间的接头,所述第一标签含有得自所述第一多聚核苷酸的5’末端和3’末端,所述第二标签含有得自所述第二多聚核苷酸的5’末端和3’末端;
(c)对所述寡核苷酸进行测序,该寡核苷酸含有至少一个第一标签和至少一个第二标签,其中,所述第一标签得自第一多聚核苷酸,所述第二标签得自第二多聚核苷酸,所述第一多聚核苷酸和所述第二多聚核苷酸得自核酸-蛋白质复合物;和
(d)根据所述第一标签和所述第二标签的核苷酸序列对所述至少两种多聚核苷酸进行定位,从而对所述至少两种多聚核苷酸进行检测和/或识别。
20.根据权利要求19所述的方法,其中,步骤b(iii)中的至少一个限制性内切核酸酶识别位点为衔接头或载体的一部分。
21.根据权利要求18-20中的任意一项所述的方法,其中,所述核酸-蛋白质复合物是通过染色质的免疫沉淀作用得到的。
22.根据权利要求18所述的方法,其中,所述寡核苷酸与至少一种另一个寡核苷酸连接,所述另一个寡核苷酸是通过测序前的步骤(a)-(b)得到的。
23.根据权利要求18所述的方法,其中,所述多聚核苷酸定位在同一个染色体上,或者所述多聚核苷酸定位在不同的染色体上。
CN2007800091831A 2006-03-13 2007-03-09 核酸相互作用分析 Expired - Fee Related CN101410516B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/373,519 2006-03-13
US11/373,519 US8071296B2 (en) 2006-03-13 2006-03-13 Nucleic acid interaction analysis
PCT/SG2007/000069 WO2007106047A1 (en) 2006-03-13 2007-03-09 Nucleic acid interaction analysis

Publications (2)

Publication Number Publication Date
CN101410516A CN101410516A (zh) 2009-04-15
CN101410516B true CN101410516B (zh) 2012-05-30

Family

ID=38232601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800091831A Expired - Fee Related CN101410516B (zh) 2006-03-13 2007-03-09 核酸相互作用分析

Country Status (10)

Country Link
US (1) US8071296B2 (zh)
EP (1) EP1835038B1 (zh)
JP (1) JP2007289152A (zh)
KR (1) KR20080102301A (zh)
CN (1) CN101410516B (zh)
AU (1) AU2007225499A1 (zh)
BR (1) BRPI0708784A2 (zh)
CA (1) CA2647935A1 (zh)
TW (1) TW200813220A (zh)
WO (1) WO2007106047A1 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2202322A1 (en) 2003-10-31 2010-06-30 AB Advanced Genetic Analysis Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
US8071296B2 (en) 2006-03-13 2011-12-06 Agency For Science, Technology And Research Nucleic acid interaction analysis
US9540637B2 (en) 2008-01-09 2017-01-10 Life Technologies Corporation Nucleic acid adaptors and uses thereof
US8530197B2 (en) 2008-01-09 2013-09-10 Applied Biosystems, Llc Method of making a paired tag library for nucleic acid sequencing
US8263367B2 (en) 2008-01-25 2012-09-11 Agency For Science, Technology And Research Nucleic acid interaction analysis
US9434985B2 (en) 2008-09-25 2016-09-06 University Of Massachusetts Methods of identifying interactions between genomic loci
US8481699B2 (en) * 2009-07-14 2013-07-09 Academia Sinica Multiplex barcoded Paired-End ditag (mbPED) library construction for ultra high throughput sequencing
US8574832B2 (en) * 2010-02-03 2013-11-05 Massachusetts Institute Of Technology Methods for preparing sequencing libraries
US9029103B2 (en) 2010-08-27 2015-05-12 Illumina Cambridge Limited Methods for sequencing polynucleotides
US8663919B2 (en) 2011-05-18 2014-03-04 Life Technologies Corporation Chromosome conformation analysis
CN102427171A (zh) * 2011-07-29 2012-04-25 中国兵器工业第二○六研究所 Ka波段平板缝隙阵天线单脉冲馈电网络
WO2013070167A1 (en) * 2011-11-10 2013-05-16 Neus Visa The use of a synthetic dna-antibody complex as external reference for chromatin immunoprecipitation
AU2014212152B2 (en) 2013-02-01 2020-02-06 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
CA2936089A1 (en) * 2013-09-05 2015-03-12 The Jackson Laboratory Compositions for rna-chromatin interaction analysis and uses thereof
CA2956925C (en) 2014-08-01 2024-02-13 Dovetail Genomics, Llc Tagging nucleic acids for sequence assembly
CA2976902A1 (en) 2015-02-17 2016-08-25 Dovetail Genomics Llc Nucleic acid sequence assembly
GB2554572B (en) 2015-03-26 2021-06-23 Dovetail Genomics Llc Physical linkage preservation in DNA storage
US20180284114A1 (en) * 2015-10-02 2018-10-04 Arizona Board Of Regents On Behalf Of Arizona State University Methods for processing biopolymeric arrays
AU2016341198B2 (en) 2015-10-19 2023-03-09 Dovetail Genomics, Llc Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
KR20180116377A (ko) 2016-02-23 2018-10-24 더브테일 제노믹스 엘엘씨 게놈 어셈블리를 위한 페이징된 판독 세트의 생성 및 반수체형 페이징
EP3455379B1 (en) 2016-05-12 2023-07-05 Agency For Science, Technology And Research Ribonucleic acid (rna) interactions
EP3954771A1 (en) 2016-05-13 2022-02-16 Dovetail Genomics, LLC Recovering long-range linkage information from preserved samples
US11370810B2 (en) 2018-11-20 2022-06-28 Arima Genomics, Inc. Methods and compositions for preparing nucleic acids that preserve spatial-proximal contiguity information

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4766072A (en) 1985-07-17 1988-08-23 Promega Corporation Vectors for in vitro production of RNA copies of either strand of a cloned DNA sequence
US5866330A (en) 1995-09-12 1999-02-02 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US6136537A (en) * 1998-02-23 2000-10-24 Macevicz; Stephen C. Gene expression analysis
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
US6410243B1 (en) 1999-09-01 2002-06-25 Whitehead Institute For Biomedical Research Chromosome-wide analysis of protein-DNA interactions
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
AU2743001A (en) 1999-12-29 2001-07-09 Arch Development Corporation Method for generation of longer cdna fragments from sage tags for gene identification
WO2002010438A2 (en) 2000-07-28 2002-02-07 The Johns Hopkins University Serial analysis of transcript expression using long tags
CA2419479A1 (en) 2000-08-14 2002-02-21 Transgenetics Incorporated Transcription factor target gene discovery
GB0228289D0 (en) 2002-12-04 2003-01-08 Genome Inst Of Singapore Nat U Method
WO2004065628A1 (en) 2003-01-21 2004-08-05 Guoliang Fu Quantitative multiplex detection of nucleic acids
US7601492B2 (en) 2003-07-03 2009-10-13 The Regents Of The University Of California Genome mapping of functional DNA elements and cellular proteins
US8222005B2 (en) 2003-09-17 2012-07-17 Agency For Science, Technology And Research Method for gene identification signature (GIS) analysis
EP2202322A1 (en) * 2003-10-31 2010-06-30 AB Advanced Genetic Analysis Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
WO2005082098A2 (en) * 2004-02-27 2005-09-09 President And Fellows Of Harvard College Polony fluorescent in situ sequencing beads
JP4644685B2 (ja) 2004-07-02 2011-03-02 株式会社ダナフォーム 塩基配列タグの調製方法
US8005621B2 (en) 2004-09-13 2011-08-23 Agency For Science Technology And Research Transcript mapping method
WO2007057785A2 (en) 2005-05-24 2007-05-24 Rolf Ohisson Methods for analyzing interactions between at least two nucleic acid sequences
US8428882B2 (en) 2005-06-14 2013-04-23 Agency For Science, Technology And Research Method of processing and/or genome mapping of diTag sequences
RU2478716C2 (ru) 2005-07-04 2013-04-10 Эрасмус Юниверсити Медикал Сентр Улавливание и характеристика совместно локализованного хроматина
US8071296B2 (en) 2006-03-13 2011-12-06 Agency For Science, Technology And Research Nucleic acid interaction analysis

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Chia-Lin Wei et al..5" Long serial analysis of gene expression (LongSAGE) and 3" LongSAGE for transcriptome characterization and genome annotation.《PNAS》.2004,第101卷(第32期), *
Patrick Ng et al..Gene identification signature (GIS) analysis for transcriptome characterization and genome annotation.《nature methods》.2005,第2卷(第2期), *

Also Published As

Publication number Publication date
CA2647935A1 (en) 2007-09-20
AU2007225499A1 (en) 2007-09-20
CN101410516A (zh) 2009-04-15
EP1835038B1 (en) 2014-06-04
WO2007106047A8 (en) 2009-07-23
US8071296B2 (en) 2011-12-06
TW200813220A (en) 2008-03-16
KR20080102301A (ko) 2008-11-24
WO2007106047A1 (en) 2007-09-20
JP2007289152A (ja) 2007-11-08
US20070238101A1 (en) 2007-10-11
BRPI0708784A2 (pt) 2011-07-12
EP1835038A1 (en) 2007-09-19

Similar Documents

Publication Publication Date Title
CN101410516B (zh) 核酸相互作用分析
AU2018279457B2 (en) Method for manufacturing DNA-edited eukaryotic cell, and kit used in method
DK2663645T3 (da) Gærstammer, der er modificeret til produktion af ethanol fra glycerol
KR20210149060A (ko) Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합
DK2718440T3 (en) NUCLEASE ACTIVITY PROTEIN, FUSION PROTEINS AND APPLICATIONS THEREOF
AU774643B2 (en) Compositions and methods for use in recombinational cloning of nucleic acids
KR20200064129A (ko) 트랜스제닉 선택 방법 및 조성물
AU2016364229A1 (en) Means and methods for preparing engineered proteins by genetic code expansion in insect cells
AU782960B2 (en) Conditional gene trapping construct for the disruption of genes
AU2022200903B2 (en) Engineered Cascade components and Cascade complexes
CN106687590B (zh) 黄热病毒病毒样颗粒
KR20220012245A (ko) 신규한 omni-50 crispr 뉴클레아제
KR20210005146A (ko) 유전자 편집된 t 세포에서의 인간 foxp3의 발현
TW200815605A (en) Nucleic acid concatenation
CN108220294A (zh) CRISPR/Cas9载体组合及其在基因敲除中的应用
CN110951770B (zh) 一种简单快速高效的CRISPR/Cas9载体构建方法及应用
CN111148833B (zh) 改变细胞具有的双链dna的目标部位的方法
KR102416059B1 (ko) 에레모테시움의 발효를 통한 리보플라빈의 더 높은 생성을 위한 베타-산화 경로의 효소를 엔코딩하는 유전자 및 지방산 수송체 유전자의 과-발현
CN107988259B (zh) SmartBac杆状病毒表达系统及其应用
US11814412B2 (en) Artificial proteins and compositions and methods thereof
KR102292446B1 (ko) 형질전환 생물체 선별용 마커 조성물, 형질전환 생물체 및 형질전환 방법
CN109652325B (zh) δ整合并分泌表达纤维素酶的酿酒酵母工业菌株及应用
CN108949690B (zh) 一种制备可实时检测间充质干细胞骨分化的细胞模型的方法
CN111778251A (zh) 敲除猪异种抗原的基因的gRNA及其应用
KR20220139344A (ko) 신경변성 질환을 치료하기 위한 조성물 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120530

Termination date: 20170309

CF01 Termination of patent right due to non-payment of annual fee