CN109837273B - 一种crispr辅助dna靶向富集方法及其应用 - Google Patents

一种crispr辅助dna靶向富集方法及其应用 Download PDF

Info

Publication number
CN109837273B
CN109837273B CN201811082353.5A CN201811082353A CN109837273B CN 109837273 B CN109837273 B CN 109837273B CN 201811082353 A CN201811082353 A CN 201811082353A CN 109837273 B CN109837273 B CN 109837273B
Authority
CN
China
Prior art keywords
dna
artificial sequence
sgrna
sequence
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811082353.5A
Other languages
English (en)
Other versions
CN109837273A (zh
Inventor
王进科
徐新慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201811082353.5A priority Critical patent/CN109837273B/zh
Publication of CN109837273A publication Critical patent/CN109837273A/zh
Application granted granted Critical
Publication of CN109837273B publication Critical patent/CN109837273B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种CRISPR辅助DNA靶向富集方法及其应用,通过改造CRISPR/Cas9系统的sgRNA而发展了一种3'末端带有捕获序列的新型sgRNA,将该sgRNA与无核酸酶活性的Cas9蛋白形成复合物,用该复合物靶向结合目标DNA,所形成的DNA‑dCas9‑sgRNA复合物可被表面固定单链捕获寡核苷酸的磁珠捕获,从而从DNA文库或混合物中靶向富集并分离目标DNA,用于目标DNA的序列分析。本发明提供的方法与目前普遍的基于杂交的靶向富集方法相比具有高简单性,特异性,灵敏度和通量等显著优点,能够在制备DNA检测、诊断及治疗试剂中进行深入应用。

Description

一种CRISPR辅助DNA靶向富集方法及其应用
技术领域
本发明属于生物医学技术领域,具体涉及一种CRISPR辅助的DNA靶向富集测序方法及其应用。
背景技术
目前的医疗,特别是个性化或精准医疗,越来越依赖于DNA分析。临床样品中的DNA越来越多地用于寻找疾病的诊断,预后和预测生物标志物。DNA分析还通过液体活检,体外诊断(IVD)和非侵入性产前检测(NIPT)为疾病诊断开辟了新的机会。DNA分析可用于发现基因组中发生的遗传和表观遗传的改变,例如单核苷酸变体(SNV),拷贝数变异体(CNV),易位和甲基化。随着DNA测序技术的广泛应用,新一代测序(NGS)提供了一种功能强大的工具,能够以单碱基分辨率对全基因组规模的DNA编码信息进行解码。通过NGS分析,DNA可以提供各种有价值的信息。首先,深度的全基因组测序(WGS)可用于系统地鉴定与癌症发展有关的多态性和特征性突变。其次,靶向基因组测序(TGPS)可用于检测已知的致病突变,用于诊断和预后。第三,亚硫酸氢盐测序可用于发现DNA甲基化的重要表观遗传标记的改变。最后,WGS还可用于表征另一种重要的表观遗传标记,即染色质开放状态(ATAC-seq),其通过核小体的表观遗传修饰(例如甲基化和乙酰化)来确定。外显子中发生的遗传改变可能产生功能失活的蛋白质或RNA。在调节区域发生的遗传和表观遗传改变可能导致目标基因表达的失调。因此,所有这些DNA测序揭示的序列改变将有助于解释疾病的发生。
虽然WGS更全面,并提供更多的信息,但由于人类基因组庞大而复杂(多达30亿个碱基对),使得WGS性价比高。因此,人类基因组的靶向测序技术已被越来越多地采用,例如全外显子组测序(WES),全调节组测序(WRS)和靶向基因组测序(TGPS)。靶向DNA测序(TDS)与WGS相比具有几个显著优势。首先,TDS更具成本效益。其次,TDS实现了比WGS更高的样品通量,允许在大量个体中揭示生物学上重要的序列变异。第三,TDS通过优化读取深度覆盖率和降低待测序DNA的复杂性来提高准确性。这些重要优势使TDS能够迅速应用于临床检测。例如,波士顿儿童医院的医生科学家通过使用一种可快速操作的WES-XomeDxXpress(GeneDx)测试了前人报道过的涉及新生儿疾病的4,500个基因,其中包括外显子组中约20,000个外显子。在通过深度测序(CAPP-Seq)方法进行的CAncer个性化分析中,选择器被设计用于通过使用公开的下一代测序数据来识别特定癌症类型中的高频率突变,例如癌症体细胞突变目录(COSMIC)和癌症基因组图谱(TCGA)。对来自活组织检查的肿瘤和正常DNA进行与选择器探针组的杂交捕获,并测序至深度覆盖以发现对患者特异的突变或量化先前发现的突变。CAPP-Seq可以检测10,000个健康DNA分子中的一个突变DNA分子。CAPP-Seq可用于监测肿瘤负荷,预后指标和无活组织检查的肿瘤基因分型。因此,用于选择大基因组目标序列的技术将揭示生物学上重要的序列变异。
目前,gDNA的靶向富集可以通过四种策略实现。第一种是在芯片或微阵列上进行DNA杂交靶向序列以捕获寡核苷酸。第二种是生物素标记的捕获探针(DNA或RNA)结合到磁珠上包被的链霉亲和物素。或者,首先将捕获探针与输入DNA杂交,然后在延伸的过程中将生物素化的核苷酸掺入DNA产物中。然后通过使用包被有链霉亲和素的磁珠将新合成的DNA捕获。第三种是靶向PCR扩增。第四个是通过环化的反向探针捕获DNA。在这些策略中,前两种策略通过固体表面或溶液中的大量捕获探针而具有高靶向富集能力。由于多重PCR的限制,靶向扩增通常受其低通量限制。因此,靶向扩增通常仅用于检测有限量的致病位点或基因。目前,溶液内杂交成为靶向富集测序的主要选择,因为它不需要昂贵的芯片/微阵列和相应的附加设备。例如,溶液内杂交已经被主要商业上可获得的WES试剂盒广泛采用(例如Agilent的SureSelect Human All Exon,Roche/Nimblegen的SeqCap EZ Exome Library,Illumina的TruSeq Exome Enrichment和iGeneTech的AIwholeExome)。然而,这些技术仍然严重依赖于杂交来捕获目标DNA。在这种情况下,输入gDNA必须在高温下变性,并且必须在高温下进行长时间的杂交过程。另外,非特异杂交是不可避免的,所产生的高噪声或背景信号会降低靶向富集的特异性。最后,必须重复化学合成大量消耗性单链生物素化捕获寡核苷酸。因此,仍然需要新的靶向富集测序技术。
CRISPR是源自细菌的免疫系统,通过酶切破坏入侵的微噬菌体DNA。该系统已经发展成为高效的基因编辑工具。此外,该系统还被开发为一种基因表达调控工具。例如,无酶切活性的Cas9(dCas9)及sgRNA近年来被最广泛地用于调节基因表达。在CRISPR/cas9技术的这些应用中,除了通过在dCas9蛋白上融合转录激活或抑制结构域之外,sgRNA也可以被改造后实现基于dCas9的基因转录激活。与Cas9蛋白的改造相比,sgRNA的改造可以更加简单,灵活,高效地重新设计。此外,由于病毒包装有长度限制,改造sgRNA对基于dCas9的转录激活或抑制的体内应用更有帮助。最常用的sgRNA改造是在3'末端与MS2环融合的sgRNA(sgRNA-MS适体),其可以通过与转录激活结构域VP64-HSF1融合的二聚化MS2噬菌体外壳蛋白结合(MS2-VP64-HSF1,MPH)。该系统现在作为协同激活介体(SAM)系统而为人所知。同样,另一种基于改造sgRNA的dCas9激活系统,命名为Casilio系统,其sgRNA附有一个或多个RNA结合蛋白Pumilio/FBF(PUF)的结合位点(sgRNA-PBS),同时dCas9与PUF结构域融合的各种转录调节结构域(例如VP64和p65-HSF1)。以相同的方式,通过扩展sgRNA以包括效应蛋白结合位点,构建可编码具有靶向基因和调节作用的模块化sgRNA。对于这些募集RNA模块,使用分别被MCP,PCP和Com RNA结合蛋白识别的病毒RNA序列MS2、PP7和com。通过改造sgRNA以包括识别特定信号的核酸开关,从而实现了基于CRISPR-Cas9的“信号传导”,其可以对外部或内部信号(例如药物)响应以调节内源基因的转录。显然,这些嵌合sgRNA极大地拓宽了CRISPR技术的应用,表明嵌合sgRNA在探索CRISPR技术的新应用方面具有巨大潜力。
发明内容
发明目的:本发明的目的是提供一种CRISPR辅助的DNA靶向富集方法,所富集的DNA可通过各种分析方法特别是下一代测序(NGS)技术分析,从而快速低成本地提供目标DNA的序列信息。
本发明还提供了一种CRISPR辅助的DNA靶向富集测序方法的应用。
技术方案:一种CRISPR辅助DNA靶向富集方法,其特征在于,将CRISPR系统与DNA文库或混合物进行反应,靶向富集并分离目标DNA,用于目标DNA的序列分析。
其中,所述CRISPR系统指CRISPR蛋白与其引导RNA(sgRNA)形成的可与目标DNA序列结合的复合物。
其中,所述与目标DNA序列结合的复合物为无核酸酶活性的Cas9(dCas9)蛋白与其sgRNA结合形成的复合物dCas9-sgRNA。
其中,所述Cas9蛋白包括常规dCas9蛋白以及经过其他改造过程形成的各种dCas9蛋白;
其中,所述dCas9蛋白也可用Cas9蛋白替代;
其中,与dCas9蛋白结合的sgRNA为一种人工设计的捕获sgRNA(capture sgRNA,csgRNA),其3'末端带有一段捕获序列,该捕获序列能够引导复合物dCas9-sgRNA靶向结合目标DNA,形成DNA-dCas9-sgRNA复合物。
作为优选,捕获序列为5'-CGGAA CCTTA CGAAT ACCAG ATGC-3'。(SEQ ID NO.1)
其中,捕获序列为一种经过人工设计,与人全基因组DNA序列同源性极低的序列。
其中,捕获序列也可以添加在csgRNA的5′末端。
其中,所述sgRNA包括靶向具有PAM序列的各种DNA序列,包括本发明中所设计的靶向6种基因AKT1、APOE、BRCA1、IL6、TERT和TP53的各外显子的各种sgRNA,以及靶向突变型TERT基因启动子的sgRNA。
其中,所形成的DNA-dCas9-sgRNA复合物可被表面固定捕获寡核苷酸的固相介质捕获。
其中,所述固相介质包括各种固相介质,如磁珠、凝胶颗粒、尼龙膜等。
作为优选,所述固相介质为磁珠。
作为优选,所述磁珠为偶联链霉亲和素(streptavidin)的磁珠。
其中,捕获寡核苷酸在固相介质上的固定方法包括各种固定方法。
作为优选,捕获寡核苷酸的固定生物素-链霉亲和素连接,其中捕获寡核苷酸的5'端共价修饰生物素(biotin)。
其中,所述磁珠表面固定的捕获寡核苷酸为一种单链寡核苷酸,其序列与捕获sgRNA的3'末端的捕获序列互补,即磁珠表面固定的捕获寡核苷酸可与sgRNA的捕获序列退火杂交;
作为优选,其中捕获寡核苷酸的序列为5'-TTTTTTT GCAT CTGGT ATTCG TAAGGTTCCG-3'。(SEQ ID NO.2)
其中,所述磁珠表面固定的捕获寡核苷酸与sgRNA捕获序列的退火杂交,是一种常温下可快速发生的核酸杂交反应;
作为优选,其中常温为室温。该反应条件为本发明的重要创新点。
其中,借助磁珠表面固定的捕获寡核苷酸与sgRNA捕获序列的退火杂交,可将DNA-dCas9-sgRNA复合物捕获到固相介质表面。
其中,捕获到固相介质表面的DNA-dCas9-sgRNA复合物可借助物理分离技术(如离心、磁吸等)将dCas9-sgRNA结合的目标DNA从DNA文库或混合物中简单快速分离出来。
其中,DNA文库或混合物指含有各种序列DNA片段的DNA溶液,如基因组DNA(gDNA)片段混合物。
其中,磁珠捕获的DNA-dCas9-sgRNA复合物中的DNA,可借助各种DNA纯化技术(如有机试剂抽提、各类DNA纯化试剂盒等)进行纯化,纯化后的DNA可用克隆测序、下一代测序(NGS)、芯片杂交等技术进行分析,解读其序列信息。
本发明所述的CRISPR辅助靶向富集DNA方法在制备DNA检测、诊断及治疗试剂中的应用。
总之,在本发明中,通过对CRISPR系统中的sgRNA进行改造,我们将CRISPR dCas9-sgRNA技术与磁性分离技术相结合,开发了一种新的基于dCas9-sgRNA的DNA靶向富集技术。本发明重新设计了sgRNA的3'末端并添加了可与固定在磁珠上的单链捕获寡核苷酸互补的短捕获序列。这种特殊的sgRNA被命名为捕获sgRNA(csgRNA)。通过生物素-链霉亲和素相互作用将单链捕获寡核苷酸锚定在磁珠表面上,其中单链捕获寡核苷酸被生物素修饰,链霉亲和素包被在磁珠表面上。为了从人基因组DNA文库中富集目标DNA片段,首先将基因组DNA文库与dCas9-csgRNA复合物一起孵育,形成DNA-dCas9-csgRNA复合物,通过捕获寡核苷酸偶联的磁珠捕获该复合物而捕获含有csgRNA靶标序列的DNA片段。捕获的DNA-dCas9-csgRNA复合物可以通过磁分离容易地从基因组DNA文库中分离出来,并通过下一代测序技术分析富集的DNA。我们将此技术命名为CRISPR辅助靶向富集(CRISPR-assistant targetenrichment,CATE)。将CATE与下一代测序(NGS)技术相结合进行目标DNA的靶向富集测序,则被称为CATE-seq。
有益效果:本发明发展了一种新的靶向富集技术——CATE。相比之下,CATE与目前广泛使用的基于杂交的靶向富集方法相比具有几个显著优势。这些优点表现在低成本、易操作性、高特异性、高灵敏和高通量。CATE与高通量测序结合使用(CATE-seq),则为日益重要的靶向测序提供了一种新的强大技术。
CATE方法具有高度简单性。与目前广泛使用的基于杂交的靶向富集策略不同,CATE是一种不依赖于杂交的靶向富集策略。所有基于杂交的靶标富集都是从DNA样品在高温下变性开始,并在47℃至65℃进行长时间的单轮或双轮杂交(至少1.5至4小时,最多16至72小时)。杂交后,捕获的样品必须在高温(例如47℃)下洗涤数次(例如两次),并在室温下使用制造商的缓冲液洗涤几次(例如三次)。然而,CATE不需要DNA变性和杂交。CATE提供了一种简单的浓缩目标序列策略,可在短短2小时内快速完成。整个CATE程序可以在室温下操作,而不需要基于杂交的靶向富集所需的昂贵的硬件(例如杂交站)。CATE也不需要任何高成本的DNA芯片或基于杂交的靶标富集所使用的冗长的生物素标记的捕获探针。CATE优于基于杂交的方法的另一个优点是CATE直接捕获dsDNA,但基于杂交的方法只能捕获ssDNA。这意味着一个sgRNA可以捕获两条靶DNA;然而,必须设计两组不同的寡核苷酸捕获探针以分别捕获两条靶DNA链。因此,CATE极大地简化了捕获探针(sgRNA)设计和选择的复杂性。
CATE的一个重要特征是通过在室温下快速地RNA:DNA杂交,来捕获磁珠上的DNA-dCas9-csgRNA复合物。与DNA:DNA杂交体相比,这种RNA:DNA杂交的过程得益于更好的退火效率和RNA:DNA复合物的稳定性的优势。应注意,CATE中的磁分离步骤在室温下进行。我们发现gDNA-dCas9-csgRNA复合物可被磁珠高效捕获,表明csgRNA捕获序列与珠子包被的捕获寡核苷酸在室温下高效杂交。这是CATE的有利关键步骤。应该提到的是,本发明中使用的csgRNA捕获序列(24bp长)是人工设计的序列,经过与人类基因组进行比对,它与人类基因组DNA序列没有同源性。这可以防止可能的单链gDNA和污染的RNA的干扰。该实验揭示了24-bp csgRNA捕获序列在CATE中表现出色。
捕获sgRNA是CATE的主要实验材料。完美的sgRNA设计对于成功的CATE-seq至关重要。在sgRNA设计中,我们仔细检查了已报道的目标外显子序列所含有的体细胞突变。我们设计了许多sgRNA,但选择那些没有突变的靶标,这可以防止突变对CATE的潜在干扰。然而,为了丰富那些已知的引起疾病的突变,可以设计突变特异性sgRNA,因为我们在本发明中富集了突变TERT启动子。由于PAM序列的广泛存在,sgRNA设计和选择对于CATE来说不是问题。为了通过体外转录简单快速地制备csgRNA,我们使用了我们实验室最近开发的新的sgRNA转录模板制备方法(Zhang等,Anal Bioanal Chem.2018;410:2889-2900)。可以通过三轮PCR方案快速制备sgRNA转录模板。通过使用该方案和体外转录,可以在两天内合成许多csgRNA。更重要的是,可以使用该程序在文库中制备多个sgRNA,这极大地简化了sgRNA制备过程。
CATE方法具有高度的特异性。CATE方法的高特异性依赖于Cas9-sgRNA与其靶DNA之间的高特异性相互作用,这与当前基于杂交的靶向测序方法大不相同。这避免了由捕获探针和变性DNA之间的非特异性杂交导致的任何非特异性富集,如通过当前的各种靶向测序所产生的非特异性富集。在基于杂交的方法中难以设计靶向各种靶的多种高特异性捕获探针,因为这些探针必须具有相似的退火温度以获得相似的退火效率。在芯片上,捕获探针和DNA样品之间的非特异性退火将导致较高的非特异性富集和噪声信号。在溶液中,除捕获探针和DNA样品之间的非特异性退火外,捕获探针之间的非特异性退火会降低富集效率。另外,具有高腺嘌呤和胸腺嘧啶(A-T)或鸟嘌呤和胞嘧啶(G-C)含量的序列可以通过自身杂交形成二级结构而不与被捕获探针结合。大量存在的重复序列可能导致非特异的富集。本发明结果充分验证了CATE方法的高特异性。总之,我们发现大约90%的可mapping的reads是sgRNA靶标,在6种细胞克隆的7个gDNA样品中富集多达35个外显子的6个基因。另外,通过使用CATE方法,高度稀释的野生型TERT启动子序列(1:1,000,000)中的突变TERT启动子序列被特异性富集。重要的是,野生型和突变型TERT启动子序列之间仅存在一个碱基差异而利用这个碱基差异使用CATE方法靶向富集突变型序列,实验结果表明Cas9-sgRNA与其靶DNA结合的高度特异性。这些数据表明,通过CATE方法可以从DNA样品中特异性地分离具有罕见和低频疾病相关SNP的gDNA片段。例如,本发明中使用的突变TERT启动子序列在大多数癌症中重新激活端粒酶的表达。我们的实验表明,使用CATE方法可以有效地从DNA样本中分离出与疾病相关的突变体,尤其是SNP,这可能为临床诊断提供有力的工具,尤其是NIPT和IVT。
CATE方法具有高灵敏度。该发明通过梯度富集测定证明了CATE的高灵敏度。我们将突变的TERT启动子序列以不同的比例与野生型TERT启动子序列中,最低稀释度为1:1,000,000。我们发现突变的TERT启动子序列从最低稀释度的混合序列中被成功富集,富集倍数为3691倍。作为基于杂交的代表性靶向富集,据报道CAPP-Seq可以检测10,000个健康DNA分子中的一个突变DNA分子。CATE的敏感性远远高于CAPP-Seq。因此,CATE有助于检测那些罕见的突变,例如液体活检中无细胞胎儿DNA(cffDNA)和无细胞肿瘤DNA(ctDNA)的突变。CATE方法的高灵敏度也通过使用的非常低的输入DNA用量。一次CATE富集实验中,我们使用少至约5ng gDNA。相反,在固体阵列捕获方法中,需要10至15μg的起始DNA材料来驱动杂交完成。最常用的溶液内杂交靶标富集方法包括SureSelect(安捷伦),Nextera(Illumina),TruSeq(Illumina)和SeqCap EZ(Roche Nimblegen),需要50ng至100ng,优选高质量的输入DNA。即使是最新的溶液杂交靶标富集,SureSelect Human All Exon V7(安捷伦)仍然需要10ng输入DNA。杂交方法通常需要更多的输入DNA,当使用甲醛或多聚甲醛固定的石蜡包埋(FFPE)组织样品时,这一要求可能具有挑战性。
CATE方法具有高通量。首先,可以在文库中制备多个sgRNA而不相互干扰,这极大地增强了sgRNA制备通量。其次,DNA样品中的许多靶标可以通过不同的csgRNA末端的相同捕获序列而被磁珠捕获。通过比较我们发现不同数量的csgRNA组成的csgRNA库获得的无差异的CATE-seq结果,我们发现复杂的csgRNA混合物可用于以高通量形式富集各种目标DNA而相互间没有干扰。第三,标签的DNA样品可以混合在一起,并通过CATE作为单个DNA样品富集,这极大地简化了实验操作,提高了通量并减少了偏差。
本发明提出的技术可用于从各种DNA中分离目标DNA。在本发明中,我们使用了由Tn5转座体剪切的gDNA(该过程现特称为tagmentation)作为输入DNA(input DNA)样品;然而,通过任何其他方式剪切的所有DNA片段都可以用于CATE-seq分析(见图18示意图),例如通过内切核酸酶消化和超声处理产生的DNA片段。另外,天然降解的DNA也可用于通过CATE-seq分析,例如无血细胞DNA(cfDNA)。当应用于cfDNA时,CATE-seq有助于识别液体活检中引起疾病的突变。在本发明中,CATE-seq的NGS文库构建过程使用我们最近发布的SALP方法(Wu等,BMC Genomics 2018,19:143)。这是一种单链文库构建方法,它能够构建所有DNA样本来源的NGS文库,特别是高度降解的DNA,如血液游离DNA(cfDNA)。因此,CATE-seq可能有利于在未来的液体活检中分析cfDNA。
本发明提出的CATE方法还可以用作为表征Cas9/sgRNA脱靶性的一种新方法。在本发明中,我们将所有reads定位到基因组,发现90%的可定位(mapping)的读长(reads)是sgRNA所处的靶标序列。剩下10%的可定位reads被怀疑是非特异的脱靶造成的。然而,我们发现这些疑似脱靶reads几乎均匀且随机地分布在整个基因组中(图8)。通过预测所使用的54个sgRNA的潜在脱靶位点,我们发现这些可疑的脱靶reads的分布与预测的脱靶没有相关性(图8)。因此,我们得出结论,这些可疑的脱靶是由于输入DNA被磁珠非特异地吸附所致。通过在CATE中严格洗涤可以进一步减少该问题。这些结果表明dCAS9-csgRNA具有高靶特异性,这确保了CATE的高特异性。
本发明提出的CATE方法的原理还可用于其他CRISPR蛋白。应该指出,CATE在本发明中使用的策略也可应用于其他CRISPR蛋白,特别是那些RNA结合蛋白,如Cas13a。这些Cas蛋白和sgRNA可以通过类似的改造而用于富集RNA分子。
我们开发了一种新的靶向测序技术,即基于dCas9/sgRNA的靶向富集测序。我们用短捕获序列改造成csgRNA,csgRNA可以与固定在磁珠上的捕获寡核苷酸退火。在该技术中,将输入的gDNA片段与预组装的dCas9-csgRNA复合物一起温育,使靶dsDNA片段与dCas9-csgRNA复合物特异性结合。然后用捕获寡核苷酸偶联的磁珠分离dsDNA-dCas9-csgRNA复合物。我们使用该技术通过54个csgRNA在6种细胞系中成功地富集了6个基因的35个靶外显子。结果证明了该技术的高简单性、特异性、灵敏度和通量。因此,我们为靶向测序提供了一种新的强大工具,与目前基于杂交的方法相比具有明显的优势。
附图说明
图1为CRISPR辅助靶向富集(CATE)的原理。(A)CATE-seq程序的示意图。SSA:单链接头;SALP:单链接头文库制备;ME:嵌合元件;Ad1:接头1(Illumina引物1的退火位点);Ad2:接头2(Illumina引物2的退火位点);NGS:下一代测序。(B)CATE原理的示意图。dCas9:无核酸酶活性的Cas9;csgRNA:捕获sgRNA(capture sgRNA)。捕获探针:固定在磁珠表面上的寡核苷酸,其可以与csgRNA的3'末端的捕获序列退火;图中的英文注释:Tagmentation(with transposome constituted by Tn5and barcoded transposon):片段化(用Tn5与标签化转座元组成的转座体进行);Barcode:标签;CATE(CRISPR-assistant targetenrichment):CATE(CRISPR辅助靶向富集);T adaptor:T接头;SALP(denature,SSAligation,elonggation and T adaptor ligation):SALP(变性、SSA连接、延伸及T接头连接);Index:索引;PCR(with index primer for preparing final NGS library):PCR(使用索引引物准备种种的NGS文库);dCas9-csgRNA binding:dCas9-csgRNA结合;TargetDNA:靶DNA;Beads capturing:微球捕获;Capture:捕获寡核苷酸;Beads:微球;DNApurification:DNA纯化。
图2为DNA标记和CATE。(A)使用Tn5转座体片段化和标记6种细胞系的gDNA。M:DL2000;1:片段化和标记的gDNA;2:未片段化和标记的gDNA。从凝胶中回收200-1000bp的gDNA片段。(B)通过SALP法制备的用于CATE-seq的NGS文库的电泳检测。M:DL2000;1:用超声片段化的gDNA构建的NGS文库作为阴性对照;2:用片段化和标记的gDNA构建的NGS文库;
图3为克隆的菌落PCR检测。在用293T细胞的gDNA构建NGS文库后,将2ng 293T NGS文库DNA连接到T载体pEASY-Blunt中,然后用T载体转化大肠杆菌。在37℃下在固体琼脂上孵育过夜后,挑取50个阳性菌落用于克隆测序。菌落为随机挑选,菌落编号分别为:2、3、4、5、6、7、8、9、11、13、14、15、16、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、37、38、39、40、41、43、44、45、46、47、49、50、51、52、53、54、55、56、57。
图4为AKT1、APOE和BRCA1基因中测序克隆的图谱。显示了CDS区、sgRNA靶标和克隆定位的分布。从上至下分别为AKT1、APOE和BRCA1基因。
图5为IL6、TERT和TP53基因中测序克隆的图谱。显示了CDS区、sgRNA靶标和克隆定位的分布。从上至下分别为IL6、TERT和TP53基因。
图6为测序结果中的reads分布的统计结果。(A)七种DNA样品中所有的reads、可定位reads和靶向reads的分布。(B)六种基因中所有可定位reads分布。(C)测序结果中六个基因中reads的分布(%)与sgRNA数量的分布(%)。外圈,sgRNA的分布;内圈,reads的分布。(D)读取7个DNA样品中6个基因的所有sgRNA对应的靶标reads的分布。使用reads的log2值。每行代表sgRNA,灰度代表reads的分布数量。(E)比较293T DNA样品与其他DNA样品的reads。具有最低reads的点是由sgRNA TERT-CDS8-2富集的reads数量。(F)外显子和非外显子中靶向reads的碱基分布情况;图中的英文注释:Reads distribution by cells type:读长(Reads)的细胞分布;Reads numbers:读长个数;Tageting reads:靶向读长;Mappablereads:可定位读长;Reads distribution by target gene:读长(Reads)的靶基因分布;Reads distribution versus sgRNAs distribution:读长分布与sgRNA分布的关系;293Tcell Reads numbers:293T细胞的读长个数;other cells reads numbers:其他细胞的读长个数;Targets with two sgRNA:有两个sgRNA的靶点;Targets with one sgRNA:有一个sgRNA的靶点;Target of sgRNA TERT-CDS8-2:sgRNA TERT-CDS8-2的靶点。
图7为NGS测序中所测序DNA片段的长度分布。图中英文注释:Reads numbers:读长个数;length of sequenced DNA fragments(bp):测序DNA片段的长度(碱基对)。
图8为人类基因组中7个DNA测序样品中可mapping的reads分布。从外到内,染色体图谱,CATE-seq分别读取293T、293Tm、HepG2、HL7702、HeLa、SiHa和C-33A DNA样品的密度,以及预测的sgRNA脱靶位点。reads密度是指每个1-Mb窗口中分布的reads数量。然后计算reads密度的log2值并显示为Circos。最内层中的垂直线是预测的sgRNA的脱靶的位置。图中存在与APOE基因重叠的预测的脱靶。事实上,它距离APOE基因位点远达1,140,004bp(脱靶位置是chr19:44270841,但APOE基因位置是chr19:45410845);
图9为CATE-seq结果中靶基因位点的reads数量分布。根据定位结果,使用UCSCGenome Browser显示BigWig文件中的读取数据。BigWig文件用作Track文件,hg19用作参考基因组。显示了在6种细胞系的7个gDNA样品中的整个6个靶基因座中的可定位reads分布。灰度表示reads密度。显示了整个基因位点和6个靶基因的所有外显子。所有csgRNA靶标的位置在sgRNA的图中显示为垂直线(标记为sgRNA通道);图中英文注释:Your sequencefrom Blat Search:来自Blat搜索的你的序列;UCSC genes(RefSeq,GeneBank,CCDS,Rfam,tRNAs&Comparative Genomics):UCSC基因(RefSeq,GeneBank,CCDS,Rfam,tRNAs及比较基因组学);Scale:比例。
图10为在TP53基因座中的reads的分布情况。图中展示了七个DNA样品中reads的分布情况,所有的csgRNA靶标使用垂直线表示(标记为sgRNA通道);图中英文注释:Yoursequence from Blat Search:来自Blat搜索的你的序列;UCSC genes(RefSeq,GeneBank,CCDS,Rfam,tRNAs&Comparative Genomics):UCSC基因(RefSeq,GeneBank,CCDS,Rfam,tRNAs及比较基因组学);Scale:比例。
图11为在AKT1基因座中的reads的分布情况。图中展示了七个DNA样品中reads的分布情况,所有的csgRNA靶标使用垂直线表示(标记为sgRNA通道);图中英文注释:Yoursequence from Blat Search:来自Blat搜索的你的序列;UCSC genes(RefSeq,GeneBank,CCDS,Rfam,tRNAs&Comparative Genomics):UCSC基因(RefSeq,GeneBank,CCDS,Rfam,tRNAs及比较基因组学);Scale:比例。
图12为在APOE基因座中的reads的分布情况。图中展示了七个DNA样品中reads的分布情况,所有的csgRNA靶标使用垂直线表示(标记为sgRNA通道);图中英文注释:Yoursequence from Blat Search:来自Blat搜索的你的序列;UCSC genes(RefSeq,GeneBank,CCDS,Rfam,tRNAs&Comparative Genomics):UCSC基因(RefSeq,GeneBank,CCDS,Rfam,tRNAs及比较基因组学);Scale:比例。
图13为在BRAC1基因座中的reads的分布情况。图中展示了七个DNA样品中reads的分布情况,所有的csgRNA靶标使用垂直线表示(标记为sgRNA通道);图中英文注释:Yoursequence from Blat Search:来自Blat搜索的你的序列;UCSC genes(RefSeq,GeneBank,CCDS,Rfam,tRNAs&Comparative Genomics):UCSC基因(RefSeq,GeneBank,CCDS,Rfam,tRNAs及比较基因组学);Scale:比例。
图14为在IL6基因座中的reads的分布情况。图中展示了七个DNA样品中reads的分布情况,所有的csgRNA靶标使用垂直线表示(标记为sgRNA通道);图中英文注释:Yoursequence from Blat Search:来自Blat搜索的你的序列;UCSC genes(RefSeq,GeneBank,CCDS,Rfam,tRNAs&Comparative Genomics):UCSC基因(RefSeq,GeneBank,CCDS,Rfam,tRNAs及比较基因组学);Scale:比例。
图15为在TERT基因座中的reads的分布情况。图中展示了七个DNA样品中reads的分布情况,所有的csgRNA靶标使用垂直线表示(标记为sgRNA通道);图中英文注释:Yoursequence from Blat Search:来自Blat搜索的你的序列;UCSC genes(RefSeq,GeneBank,CCDS,Rfam,tRNAs&Comparative Genomics):UCSC基因(RefSeq,GeneBank,CCDS,Rfam,tRNAs及比较基因组学);Scale:比例。
图16为Reads在6种细胞系中6个基因的靶向外显子的分布。统计6种细胞系中6个基因的每个目标外显子范围内的碱基分布情况。本图仅显示了目标外显子。横坐标的单位是碱基对(bp),表示剪接的目标外显子的全长;图中英文注释:Reads numbers:读长个数。
图17为CATE在突变识别,通量和灵敏度中的情况。(A)CATE-seq在本发明中发现的突变位点。这是许多癌症中广泛报道的热点突变。(B)reads在293T和293Tm gDNA样品中的分布。计数并显示在富集的293T和293Tm gDNA样品中定位到每个靶基因的reads。(C)突变型TERT启动子序列的靶向富集。将突变型和野生型TERT启动子序列以不同比例混合。然后用CATE从这些混合物中富集突变型TERT启动子序列。通过ARMS-qPCR分析富集的DNA中突变型所占比例的变化情况。计算富集DNA中突变体TERT启动子序列的百分比和富集倍数;图中英文注释:Reads numbers:读长个数。Reads distribution in 293T and 293Tm samples:读长在293T及293Tm样品中的分布;Genes:基因;Percent of mutant:突变型百分数;Enrichment fold of mutant:突变型富集倍数。Ratio(mutant:wild type):比值(突变型:野生型)。
图18为通用CATE-seq流程(A)及原理(B)示意图。图中英文注释:Sheared ornaturally degraded DNA fragments:剪切或自然降解的DNA片段;CATE(CRISPR-assistant target enrichment):CATE(CRISPR辅助靶向富集);Library construction orcloning sequencing:文库构建或克隆测序;Tagmentation(with transposomeconstituted by Tn5and barcoded transposon):Index:索引;NGS:下一代测序片段化;dCas9-csgRNAbinding:dCas9-csgRNA结合;Target DNA:靶DNA;Beads capturing andmagnetic isolation:微球捕获及磁分离;Capture:捕获寡核苷酸;Beads:微球;DNApurification:DNA纯化。
图19为本发明实施例中50个克隆序列图,图中的各克隆序列中,下划线序列为sgRNA靶序列;粗体碱基为PAM序列;每条序列的前6个碱基为标签(barcode)序列,紧随其后为恒定的ME序列。(为便于更直观地说明,以上50个克隆的序列通过附图进行直观表现,具体克隆序列对应序列表中SEQ ID NO.202-SEQ ID NO.251)。
图20为本发明实施例中20个克隆序列图,图中下划线序列为sgRNA target序列;粗体碱基为PAM序列。(为便于更直观地说明,以上50个克隆的序列通过附图进行直观表现,具体克隆序列对应序列表中SEQ ID NO.252-SEQ ID NO.271)。
具体实施方式
以下结合附图和实施例对本发明作进一步说明。
实施例1利用CATE技术富集6种细胞系基因组DNA中6个基因的35个外显子序列,并用克隆测序及下一代测序法(NGS)测序分析;利用CATE技术富集突变型TERT启动子序列并用ARMS-qPCR。
实验材料和方法
细胞培养:所有细胞均购自中国科学院上海细胞库。用添加了10%胎牛血清(HyClone)、100U/mL青霉素和100μg/mL链霉素(Biosharp)的DMEM培养基(HyClone)培养293T、HepG2、HeLa、SiHa和C-33A细胞。用添加了10%胎牛血清(HyClone)、100U/mL青霉素和100μg/mL链霉素(Biosharp)的RPMI-1640培养基(HyClone)培养HL7702细胞。将细胞在37℃,5%CO2培养箱中温育。
DNA提取:将细胞接种到25cm2培养瓶中,用完全培养基培养24小时(融合度大于80%)。用预冷的PBS洗涤细胞两次后,使用胰蛋白酶消化收集细胞。使用TIANamp GenomicDNAKit(Tiangen)从细胞中提取基因组DNA(gDNA)。通过光谱测定法定量提取的gDNA,并储存在-80℃备用。
DNA片段化(tagmentation):为了制备Tn5转座体,设计并化学合成用于制备标签转座子的寡核苷酸(表1)。以20μM的浓度将寡核苷酸溶解在DEPC水中。两种寡核苷酸(标签1-7)(Barcode 1-7)和ME寡核苷酸(ME oligo;表1)以等体积混合。混合物在95℃变性5分钟后,自然冷却至室温。以这种方式,制备了七个转座子(ME-B-1–7)(表2)。然后将Tn5转座体加入到含有2μL转座子(10μM)、2μL 10×TPS缓冲液(Robustnique Cooperation Ltd.,中国天津)、5μL RobustTn5转座酶(Robustnique Cooperation Ltd.)和11μL DEPC水的反应液(20μL)中。在25℃下孵育30分钟。组装的Tn5转座体命名为T-B-1–7,将其储存在-20℃备用。提取的293T、HepG2、HL7702、C-33a、SiHa和HeLa细胞的gDNA分别用Tn5转座体T-B-1–6标记。另外,也用Tn5转座体T-B-7标记293T gDNA,称其为293Tm。标记反应体系(30μL):200nggDNA、5μL转座体、6μL 5×LM缓冲液(Robustnique Cooperation Ltd.)和一定体积的ddH2O。将反应液在55℃下温育15分钟。不含转座子的反应用作阴性对照。将标记产物进行琼脂糖凝胶电泳后,回收200-1000bp片段,作为富集靶序列的输入DNA。
表1.组装Tn5转座体(transposome)的含有ME序列的寡核苷酸
Figure GDA0002040130750000111
Figure GDA0002040130750000121
表2.组装Tn5转座子的转座元(Transposons)
Figure GDA0002040130750000126
SgRNA制备:通过UCSC(https://genome.ucsc.edu/)浏览器工具,获得APOE、AKT1、TP53、BRCA1、IL6和TERT基因的转录本序列(参考基因组是hg19)。使用自制脚本,确定基因的所有非冗余全长CDS区域。如果CDS区域短于70bp,则将侧翼的20-bp基因组序列添加到CDS的两端,从而可以设计合适的sgRNA。然后,使用Chop-Chop在线sgRNA设计软件(http://chopchop.cbu.uib.no/),针对hg19参考基因组获得的每个CDS序列设计sgRNA。设计结果如表3所示。通过体外转录制备所有csgRNA。为了制备用于csgRNA转录的DNA模板,使用三轮融合PCR扩增方案。通过体外转录制备所有csgRNA。为了制备用于csgRNA转录的DNA模板,使用三轮融合PCR扩增方案。根据sgRNA设计结果化学合成PCR引物(表4)。用超纯水溶解所有引物至10μM。用F1和R(7个循环)进行第一次PCR(PCR1)。PCR1产物作为模板并使用F2和sgR1(表4)作为引物(30个循环)进行第二次PCR(PCR2)。PCR2产物作为模板和F3和sgR1(表4)作为引物(30个循环)的产物进行第三次PCR(PCR3)。PCR1反应(50μL)含有1×
Figure GDA0002040130750000123
HSPremix(Takara),10pmol F1和10pmol R.PCR1,程序为95℃3分钟,95℃20秒,58℃15秒和72℃40秒,72℃5分钟,共7个循环。PCR2反应(50μL)含有1×
Figure GDA0002040130750000124
HS Premix,10pmolF2,20010pmol sgR1和5-10ng PCR1产物。PCR2程序为95℃3分钟,95℃20秒,58℃15秒,72℃40秒,72℃5分钟,25个循环。PCR3反应含有1×
Figure GDA0002040130750000125
HS Premix,10pmol F3,10pmolsgR1和5-10ng PCR2产物。PCR3程序为95℃3分钟,95℃20秒,58℃15秒,72℃40秒,72℃5分钟,28-30个循环。PCR程序在Mastercycler Pro(Eppendorf)上运行。凝胶回收纯化PCR1和PCR2产物,然后用作下一轮PCR的模板。凝胶回收纯化PCR3产物,并用作csgRNA体外转录的模板。
表3.sgRNA设计结果。
Figure GDA0002040130750000131
Figure GDA0002040130750000141
根据sgRNA设计结果化学合成PCR引物(表4)。通过凝胶回收并纯化PCR产物,将其作为csgRNA体外转录的模板。转录反应体系(20μL):1μL T7RNA聚合酶(New EnglandBiolabs)、2μL 10×T7RNA聚合酶缓冲液(New England Biolabs)、1μL rNTP(New EnglandBiolabs)、10μL DNA模板(200–1000)ng和6μL无RNA酶的ddH2O。将反应液在37℃下孵育过夜后,与Trizol溶液混合。通过氯仿-异丙醇萃取并用乙醇沉淀纯化RNA。将纯化的RNA溶解在不含RNA酶的ddH2O中,通过光谱测定法定量。将csgRNA稀释至15ng/μL,储存在-80℃备用。
表4.制备csgRNA体外转录模板的PCR引物
Figure GDA0002040130750000142
Figure GDA0002040130750000151
Figure GDA0002040130750000161
Figure GDA0002040130750000171
靶向富集:在富集之前,首先准备dCas9蛋白、csgRNA混合物和磁珠。将dCas9蛋白(New England Biolabs,NEB)用储备溶液稀释至0.3μM并储存在-20℃。根据它们的编号将csgRNA混合物分成四组(表3),即No.1-11(AKT1csgRNA)、No.12-25(APOE和TP53csgRNA)、No.26-40(IL6和BRCA1 csgRNA)和No.41-54(TERT csgRNA)。在每次混合中,每种csgRNA的用量为约7.5ng。将5μL带有链霉亲和素的磁珠(Dynabead-M-280-链霉亲和素蛋白,Invitrogen)加入到50μL含有0.5%BSA的PBS(称为PBS-BSA溶液)中,置于磁力架上15秒。吸出上清液,用50μL PBS-BSA溶液洗涤磁珠三次后,加入50μL 1×dCas9缓冲液和2μL捕获寡核苷酸(10μM)。捕获寡核苷酸的序列是5'-Biotin-TTTTTTTGCA TCTGGTATTC GTAAGGTTCCG-3'(SEQ ID NO.2)。将磁珠旋转混合1小时后,用50μL 1×dCas9缓冲液洗涤三次。将预混合的csgRNA(No.1-11、12-25、26-40和41-54)加入到不含RNA酶的EP管中。向每个EP管中加入4μL 0.3μM dCas9蛋白、4U RNase Inhibitor(ThermoFisher)和2.5μL10×dCas9缓冲液。然后用DEPC水将所有反应液补充至25μL。将混合物在室温(25℃)下旋转孵育10分钟。从而形成dCas9-csgRNA复合物。然后将制备好的六种细胞的gDNA文库加入到dCas9-csgRNA管中。向每个管中加入5μL的gDNA(约5ng)。在37℃下孵育30分钟后,将gDNA-dCas9-csgRNA反应产物加入到有固定有捕获寡核苷酸的磁珠中,并在旋转混合器上在室温下混合1小时。将磁珠溶液置于磁架中15秒。吸出上清液。用50μL PBS-BSA洗涤磁珠三次。最后,将磁珠重悬于30μL TE缓冲液(pH8.1)中,在85℃水浴中温育5分钟。然后将磁珠快速置于磁架上,将溶液小心地转移到干净的EP管中作为富集的靶DNA片段,将其储存在-20℃备后。
DNA测序:NGS文库是根据我们实验室最近开发的SALP方法构建的。构建测序文库所需的引物如表5所示。为了制备接头,将20μM浓度的两种寡核苷酸SA和SA-3N(表5)以等摩尔混合,然后在95℃下变性5分钟,然后自然冷却至室温。退火的寡核苷酸用作单链接头(SSA)。通过CATE富集的10μL gDNA在95℃变性5分钟并立即插入冰中2分钟。然后,将1μLT4DNA连接酶(1U/μL,Invitrogen),2μL 10×连接缓冲液和1μL SSA加入到变性的gDNA中。将连接反应物用超纯水补充至20μL,并在16℃或22℃下孵育过夜2小时。向连接产物中加入20μL 2×rTaq混合物(Takara)并在72℃下延伸15分钟。用PCR扩增延伸产物。PCR反应包含20μL延伸产物,25μL 2×
Figure GDA0002040130750000182
HotStart HiFi PCR Master Mix(NEB,M0543S),1μL 10μM通用引物(表4),1μL IP15(10μM)(表4),并补充高达50μL的超纯水。PCR程序为:98℃5分钟,17个循环的98℃10秒,65℃30秒和72℃1分钟,和72℃5分钟。将PCR产物进行琼脂糖凝胶电泳(1.5%),切下200-1000bp的DNA涂片,用Axygen DNAGel Recovery Kit(Axygen)回收。使用Qubit量化回收的产物。将七个DNA文库以相同的ng质量混合,并使用双端150-bp测序在Hiseq-4000的泳道中测序。
表5.构建测序文库所需的引物
Figure GDA0002040130750000181
读长(Reads)分析:使用Python脚本,选择原始CATE-seq数据中的reads,并根据正确的标签序列将其分配给7个DNA样本。计算分配给每个DNA样品的reads。通过相同的脚本,根据两个配对reads上的标签序列从原始CATE-seq数据的fastq文件中提取每个DNA样品的reads。为了生成每个DNA样品的fastq文件,使用以下条件对原始CATE-seq数据进行分类:1.在reads分类中允许最多5个非连续的不确定碱基(N);2.在标签序列上允许最多一个不在两端的不确定碱基(N);3.标签长度必须等于设计的序列长度。然后使用bowtie(Centos5.5操作系统)参数:bowtie-q-p10-v3-t-k1-m3--trim5 25--trim3 25--sam--best--strata-X 2000/home/xxh/software/bowtie-1.1.2/indexes/hg19-1hebing-R1-out.fastq-2hebing-R2-out.fastq Mapped-file 2>mapped-log-file。将fastq文件中提取的reads mapping到人类基因组19(hg19)的参考基因组中。参数中xxh是指加载到本地系统的参考基因组索引文件的位置。然后使用samtools将生成的sam文件转换为bam文件,以提高后续数据分析的速度。转换命令为:samtools view-Sbo mapped-file.bam mapped-file。然后使用以下命令对生成的bam文件进行排序:samtools sort mapped-file.bamsorted-mapped-file.bam。最后,为了使用UCSC基因组浏览器可视化mapping结果,使用bedGraphToBigWig的命令工具(bedGraphToBigWig bedgraph hg19.chrom.sizes bw)将已排序的bam文件转换为BigWig文件。
TERT富集:使用PCR扩增出235bp的野生型TERT启动子(命名为TERT-P)和在-158位置含有C/T突变的突变型TERT启动子(命名为TERT-P-mut)的DNA片段,所用引物TERT-PF,TERT-PR和TERT-Mut-R的具体信息在补充材料中(表6)。为了制备野生型和突变型TERT启动子区,使用寡聚TERT-PF和TERT-PR(表6)作为引物,从HepG2细胞的gDNA扩增235-bp野生型TERT启动子DNA片段。该片段命名为TERT-P。然后通过融合PCR制备相同长度的突变型TERT启动子DNA片段,以便在TERT-P的-158位突变C至T。引物TERT-PF和TERT-Mut-R(表6)用于扩增TERT-P的5'部分。引物TERT-Mut-F和TERT-PR用于扩增TERT-P的3'部分。然后将两种PCR产物混合并在没有任何引物的情况下扩增10个循环,使得两个短片段延伸成长DNA片段。然后用引物TERT-PF和TERT-PR扩增该片段26个循环。该产品命名为TERT-P-mut。为了富集突变体型TERT启动子,将位于-162bp至-164bp位置的GGG作为PAM来设计靶向突变体位置的sgRNA。sgRNA靶和PAM的序列是5'-TCCCC GGCCC AGCCC CTTCC GGG(SEQ ID NO.189)(从-142到-164;粗体中的T是突变碱基)。然后使用上述实验中的三轮融合PCR来产生RNA模板并通过体外转录制备csgRNA。PCR引物是F1、R和sgR1(表4),以及TERT-sgRNA-F2和TERT-sgRNA-F3(表6)。为了从野生型和突变型TERT启动子DNA片段的混合物中富集突变型TERT启动子,将10μL相同浓度(0.2ng/μL)的TERT-P和TERT-P-mut等体积混合后,获得了TERT启动子DNA的模拟样品。然后用上述CATE方案富集TERT-P-mut。以TERT-PF和TERT-PR作为引物,用rTaq mix(Takara)对富集的DNA进行20个循环的扩增。用PCR清洁试剂盒纯化PCR产物后,将纯化产物连接到T载体上。挑取20个阳性菌落并测序。计算测序结果中突变体序列与野生型序列的比率。在第二次富集测定中,TERT-P和TERT-P-mut分别以1:1、1:10、1:100、1:1000、1:10000、1:100000和1:1000000的比例混合。各种混合物中总DNA的最终浓度相同(0.2ng/μL)。每种混合物都用靶向TERT-P-mut的csgRNA来富集。根据ARMS方法来设计延伸引物。使用延伸引物,通过ARMS-qPCR来确定富集结果中所含突变体的比例(表6)。ARMS-qPCR的具体方法为:为了扩增TERT-P序列突变点的上游,使用引物TERT-PF和ARMS-TERT-qR从样品中扩增野生型和突变型序列作为核酸样品的总量。引物TERT-PF和ARMS-TERT-qWT-R用于从样品中扩增野生型片段。引物TERT-PF和ARMS-TERT-qMT-R用于从样品中扩增突变体片段。然后计算每个样品的野生型和突变型序列的比例。为了扩增TERT-P序列的突变位点的下游,在另一个方向上的引物(TERT-PR、ARMS-TERT-qF、ARMS-TERT-qWT-F、ARMS-TERT-qMT-F;表6)用作上游扩增结果的验证。根据Ct值计算富集DNA中突变型TERT启动子序列的百分比和富集倍数。
表6.用于扩增TERT启动子及构建突变型序列的引物
名称 序列(5'>3')
TERT-PF AGTGGATTCGCGGGCACAGA(SEQ ID NO.190)
TERT-PR CAGCGCTGCCTGAAACTC(SEQ ID NO.191)
TERT-Mut-F CCCCGCCCCGTCCCGACCCCTTCCGGGTCCCCGGCCCAGCCCCC(SEQ ID NO.192)
TERT-Mut-R GGCTGGGCCGGGGACCCGGAAGGGGTCGGGACGGGGCGGGG(SEQ ID NO.193)
TERT-sgRNA-F2 TCCCCGGCCCAGCCCCCTCCGTTTTAGAGCTAGAAATAGCAAG(SEQ ID NO.194)
TERT-sgRNA-F3 TTCTAATACGACTCACTATAGTCCCCGGCCCAGCCCCCTCC(SEQ ID NO.195)
ARMS-TERT-q-F TCCGCGCGGACCCCGCCCCGTCCCGACCC(SEQ ID NO.196)
ARMS-TERT-q-R GCCCGGAGGGGGCTGGGCCGGGGACCC(SEQ ID NO.197)
ARMS-TERT-qWT-F CTCCGCGCGGACCCCGCCCCGTCCCGACCCCGC(SEQ ID NO.198)
ARMS-TERT-qWT-R GGCCCGGAGGGGGCTGGGCCGGGGACCCGTG(SEQ ID NO.199)
ARMS-TERT-qMT-F CTCCGCGCGGACCCCGCCCCGTCCCGACCCCGT(SEQ ID NO.200)
ARMS-TERT-qMT-R GGCCCGGAGGGGGCTGGGCCGGGGACCCGTA(SEQ ID NO.201)
实验结果:
1.CRISPR辅助靶向富集(CACE)原理
通过CRISPR辅助的靶向富集(CATE)目标DNA的原理在图1A中展示。在该方法中,通过向正常sgRNA序列的3'末端添加捕获序列(5'-CGGAA CCTTA CGAAT ACCAG ATGC-3')来改造正常的sgRNA,其产生3'末端延伸的sgRNA(图1B)。由于新设计的sgRNA将用于捕获目标DNA,因此将其命名为捕获sgRNA(csgRNA)。相应地,与csgRNA的捕获序列互补的寡核苷酸(称为捕获探针)在其3'末端用生物素修饰并偶联在包被有链霉亲和素的磁珠上。为了富集目标gDNA片段,首先设计目标DNA的sgRNA,并通过体外转录制备csgRNA。从细胞中提取gDNA并用Tn5转座体片段化处理。回收200bp和1000bp之间的片段并用作富集靶序列的输入DNA。然后将gDNA片段与预先构建的dCas9-csgRNA复合物混合,dCas9-csgRNA结合其目标序列。最后,将混合物与偶联有捕获探针的磁珠一起温育,使用磁珠分离DNA-dCas9-csgRNA复合物。然后用我们最近开发的SALP-seq方法纯化和分析捕获的DNA。
2.DNA片段化(tagmentation)、CATE及NGS文库构建
按照Tn5转座酶的使用说明书,使用由Tn5转座酶和带有标签序列的ME序列构成的Tn5转座体将6种细胞系(293T、HepG2、HL7702、HeLa、SiHa和C-33A)的gDNA片段化(表2)。通过6种标签序列的Tn5转座体标记六个DNA样品(293T,HepG2,HL7702,HeLa,SiHa和C-33A的gDNA)(表2)。293T gDNA还用另外一种Tn5转座体标记,具有另一标签(表3)供以后使用,其命名为293Tm(m表示混合)。经过标记的片段化的gDNA经过琼脂糖凝胶电泳检测,显示来自6种细胞系的所有gDNA都被Tn5转座体片段化(图2A)。然后切胶回收分离200-1000bp的DNA片段(图2A),然后通过CATE富集其中的目标序列(图1B)。靶向富集的结果使用高保真DNA聚合酶进行16个循环的PCR扩增(图2B)。使用1.5%琼脂糖凝胶检测PCR产物,回收其中200-1000bp片段。使用Qubit对回收的DNA进行定量,并使用NGS进行分析。应该指出的是,我们还使用DEPC水作为csgRNA和超声处理的DNA样品的对照,作为CATE中标记的输入gDNA的对照,这个对照组中没有获得富集产物。
3.NGS文库的克隆测序
为了探索CATE过程的可行性,首先用293T gDNA进行片段化和标记,然后进行CATE和NGS文库构建,通过克隆测序检测制备的NGS文库。首先使用菌落PCR鉴定阳性克隆,随机选择50个阳性克隆进行测序(图3)。将测序结果(为便于直观表示,以上50个克隆序列信息见图19所示,另外该50个序列通过序列表提交,序列表中相应序列号为SEQ ID NO.202-SEQID NO.251)mapping到参考基因组(hg19)。发现所有这50个克隆都位于靶向设计有sgRNA的6个基因的CDS区域内(图4和图5)。所有克隆都含有sgRNA靶标序列。另外,基因克隆的数量与为该序列内的sgRNA的数量成比例。设计有两个sgRNA的CDS区域在克隆测序结果中占比较多(31个克隆)。这些结果初步证明了CATE方法的可行性,可靠性和高特异性。这些结果也表明了构建的NGS库的高质量。这种快速克隆测序(两天)为在NGS之前评估CATE特异性和NGS文库质量提供了一种简便有效的策略。随后用CATE以293T细胞建立的程序处理另外五种细胞系的gDNA。
4.NGS及数据分析
将293T,HepG2,HL7702,HeLa,SiHa,C-33A和293Tm等7个NGS文库以相同的质量(ng)混合在一起以形成合并的最终NGS文库。然后用Hiseq-4000测序仪对该文库进行测序。结果总共获得163,270,664个reads,其中135,607,186个reads具有正确的标签(占总reads的83%)(表7)。其中124,699,943个reads是可mapping到基因组上的(占总reads的76%和正确标签reads的92%)(表7)。根据标签序列将测序结果按照样品进行分组后,计算每个样品中含有的reads数量,可以mapping到基因组的reads数量和靶向reads数量(表8;图6A)。靶向reads是指含有sgRNA靶标的对末端测序的DNA片段的reads。结果表明,总共124,699,943个可mapping的reads中有多达112,760,368个reads为靶向reads(92%的可定位reads)(表7)。这些数据表明CATE具有靶向特异性。由所有的可mapping的reads具有相同的长度分布(图7)。7个样品有着相似的reads分布,可mapping的reads比例和靶向reads(表8)显示CATE方法具有高可重复性。
表7.CATE-seq获得的读长(reads)统计
Figure GDA0002040130750000221
表8.CATE-seq读长(reads)在DNA样品间的分布、定位及靶向
Figure GDA0002040130750000222
5.读长(reads)在靶基因中的分布
然后计算分配给6个靶基因的reads数量(图6B)。结果表明,分配给特定基因的reads数量与为该基因设计的sgRNA数量呈正相关。大多数sgRNAs(14)是针对TERT基因的7个CDS区域设计的,因此,靶向TERT基因的reads最多。相反地,IL6基因的三个CDS区设计了5个sgRNA,因此,靶向IL6基因的reads最少(图6C)。这些数据显示了CATE的富集效应与sgRNA的分布相关。接下来,根据reads的mapping结果,对所有细胞系中的每个基因所对应的reads数量进行计数(图6D)。结果表明,所有sgRNA均有效地富集了它们的靶标(图6D)。此外,所有sgRNA在所有DNA样品中对其靶标具有稳定的富集效率(图6D)。另外,某一特定区域内的富集效率与该区域内所分布的sgRNA数量相关(图6D)。为了进一步探索reads的分布情况,计算每个靶的reads,其中将两个紧密相邻的sgRNA靶向的靶标视为一个靶标(表9)。基于这些数据,通过比较293T样品与其他DNA样品的reads,研究了所有DNA样品中所有sgRNA的富集效率。结果表明,只有sgRNA TERT-CDS8-2在7个样品中显示出最低的富集效率(图6E)。所有其他sgRNA在所有样品中具有相似的富集效率(图3)。结果显示,两个紧密相邻的sgRNA的reads比一个sgRNA的reads数量多出大约两倍(图6E)。接下来,根据作图结果,计数并比较外显子和非外显子中靶向reads所涵盖的所有碱基的分布。发现外显子和非外显子中的碱基分别在所有7个样品中分别占75%和25%(图6F)。
表9.CATE-seq读长(reads)在所有编码区(CDS,即外显子)中的分布
Figure GDA0002040130750000223
Figure GDA0002040130750000231
Figure GDA0002040130750000241
Figure GDA0002040130750000251
Figure GDA0002040130750000261
注:第一行:靶向Reads(长度小于2000bp的配对末端DNA片段);第二行:外显子中的靶向Reads(长度小于2000bp的配对末端DNA片段);第三行:外显子中的靶向Reads(小于1000bp配对末端DNA片段)。
6.读长(reads)靶向的特异性
为了分析测序结果中reads在全基因组范围内的分布情况,用CIRCOS将所有可以mapping的reads的分布可视化到基因组上,7个DNA样品的可视化的结果(图8)。可以看出,大多数reads位于sgRNA靶标所在的靶基因座中。然而,仍存在一些分布在其他基因组区域的疑似脱靶reads(11,939,575个reads;表7)(图8)。然而,定位到其他基因组位置的reads均匀且随机地分布在整个基因组中,并且这些reads的分布密度远低于目标区域的reads密度。为了确定这些可疑的脱靶reads是否是由dCas9-csgRNA的真正脱靶结合产生的,我们使用默认参数在线程序ChopChop预测了所有csgRNA的脱靶位点。结果表明,基因组中这些疑似的脱靶reads的分布与所有csgRNA的预测的脱靶无关(图8)。因此,可以得出结论,这些可疑的脱靶reads来自于CATE过程中磁性分离中非常低量的gDNA非特异性吸附到磁珠。这些数据还揭示了CATE的高度特异性。接下来,为了显示靶基因中的reads的分布及其与sgRNA位置的关系,使用UCSC基因组工具显示BigWig文件中的reads分布情况。结果显示,在7个DNA样品中,reads在6个靶基因座中高度富集(图9)。更重要的是,reads在sgRNA靶向的外显子中高度富集(图9)。两个sgRNA靶向的区域比一个sgRNA靶向的区域富集更多的reads数量。这些数据表明CATE的高效率和特异性。
7.读长(Reads)对靶外显子的覆盖
为了获得设计有sgRNA的外显子位置的reads覆盖情况,用UCSC基因组可视化6种细胞系中6个基因的所有可mapping的reads分布。结果表明CATE-seq结果中的reads在sgRNA靶标的位置高度富集(图10到图15)。此外,两个sgRNA靶向的外显子比单个sgRNA靶向的外显子有更多的reads分布。从图中可以发现目标外显子被reads高度覆盖。除了靶外显子外,靶外显子侧翼的长内含子序列也被高度富集和测序。在本发明中,单个sgRNA被设计为多达17个外显子(48.5%)。发现全长靶标外显子和部分侧翼内含子都被这些单个sgRNA富集的CATE-seq reads高度覆盖(图10到图15)。这些外显子的长度为85-246bp(表10);然而,超过50000个reads覆盖的序列长度为495-582bp(表10)。对于其他18个外显子,17个外显子设计有两个sgRNA,另外一个外显子设计有三个sgRNA(表10)。这些外显子的长度为94-310bp(表10);然而,超过50000个reads覆盖的序列长度为495-865bp(表10)。这些数据表明,一个sgRNA足以用于人类基因组中大多数外显子的靶向富集。对于89%的外显子,没有必要设计两个sgRNA,在本发明中设计了两个sgRNA(表10)。仅对少数长外显子应设计两个或更多个sgRNA(表10)。上述数据还表明,sgRNA也可以设计在侧翼内含子中,用于捕获太短而不含有适当sgRNA靶标的外显子。为了进一步检查对靶标外显子区域reads的覆盖率,探索了6种细胞系中6个基因的靶向外显子的reads分布。因此,全长靶外显子中的reads以单碱基进行计数。结果表明,reads覆盖了大部分外显子的全长(图7)。通过比较6种细胞系中6个基因的reads,发现变体DNA样品中dCas9-sgRNA的富集效率高度稳定,这可以由不同的DNA样品中的相对平行的分布线表明(图7)。这些数据表明CATE方法适用于寻找体细胞突变的靶向测序。
表10.大于50000reads覆盖的序列及外显子长度
Figure GDA0002040130750000271
Figure GDA0002040130750000281
8.大于5000个读长(reads)所覆盖的突变统计
为了在靶向测序的外显子中发现潜在的体细胞突变,使用CATE-seq数据进行突变分析。在经过mapping后,发现六种细胞系的reads中都有突变碱基。最终结果显示,大多数突变发生在靶向sgRNA的外显子侧翼的内含子中。靶外显子中仅发生少数突变(表11)。在三种细胞系(HepG2、C-33a和HeLa)中含有rs1042522突变(图16)。该SNP位于TP53基因的编码区中,并且是与多种肿瘤发生相关,是高风险突变。可以看出,突变发生在肝肿瘤细胞HepG2中,而不是在正常肝细胞HL7702中。在本发明中使用的三种宫颈癌细胞系中,HeLa细胞是HPV18阳性细胞,SiHa细胞是HPV16阳性细胞,而C-33a细胞是HPV阴性细胞。根据CATE-seq结果和HPV感染,可以推断HeLa细胞癌变可能源于HPV病毒感染和TP53突变的组合,SiHa细胞癌变可能仅由HPV病毒感染引起,但是C53a细胞的癌变可能是由TP53突变引起的。
表11.测序结果中每种细胞的突变信息
Figure GDA0002040130750000282
Figure GDA0002040130750000291
SNV*:单核苷酸变异
DIV**:删除/插入变异
9.利用复杂csgRNA文库提高进行CATE的通量
在富集293T DNA样品中,将54个csgRNA分成4组。每组用于gDNA的独立靶向富集。然后,将富集的gDNA混合在一起并用作293T细胞的最终CATE产物。但是,是否可以使用更复杂的csgRNA库来同时富集更多的目标?这对于简化操作和提高CATE方法的吞吐量很重要。因此,在293Tm DNA样品的富集中,将所有csgRNA(总共54个csgRNA)混合在一起并用于靶向富集293T gDNA。在获得测序结果后,分析这两种方法是否对CATE-seq结果有影响,以证明通过使用更复杂的csgRNA库进行更高通量富集的可行性。计算这两种富集方式获得的靶向每个靶基因的reads分布情况。通过比较293Tm和293T样品中6个基因的reads分布,发现两种富集方式之间6个基因的reads分布没有显著差异。在两种富集方式中,reads始终与基因的sgRNA数成正比。这些数据表明,CATE反应中csgRNA的增加对靶标富集没有影响。csgRNA之间没有相互干扰,这有助于提高CATE的筛选通量而不失其特异性(图16)。
10.CATE特异性与灵敏性的进一步表征
为了进一步探索CATE方法的富集特异性,使用dCas9/csgRNA从混合有野生型TERT(TERT-P)和突变型TERT(TERT-P-mut)启动子片段形成的DNA样品中富集其中的突变型TERT启动子片段。(TERT-P-MUT)。首先,将TERT-P和TERT-P-mut片段在等摩尔下混合以形成混合物,然后使用靶向突变序列的csgRNA利用CATE方法靶向富集TERT-P-mut序列。使用rTaq预混酶(Takara)扩增富集产物中的TERT启动子序列,回收扩增产物后连入T载体中并测序。结果显示在20个测序的阳性克隆中存在19个TERT-P-mut和1个TERT-P序列(为了更加直观的表示,以上20个克隆序列信息见图20,另外该20个克隆的序列通过序列表提交,对应序列号为SEQ ID NO.252-SEQ ID NO.271),表明突变序列被CATE高度且特异性地富集。其次,将TERT-P-mut和TERT-P以不同比例混合,然后使用靶向突变序列的csgRNA用CATE方法富集富集突变序列。使用ARMS-qPCR定量分析富集的DNA中野生型和突变型的TERT序列的比例变化。结果显示dCas9/csgRNA可以富集来自所有混合样品的突变序列(图16)。特别地,dCas9/csgRNA富集以1:1,000,000的最低比例在野生型序列中稀释的突变序列。通过靶向富集,突变序列的富集倍数高达3691倍(图16)。
序列表
<110> 东南大学
<120> 一种CRISPR辅助DNA靶向富集方法及其应用
<160> 271
<170> SIPOSequenceListing 1.0
<210> 1
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
cggaacctta cgaataccag atgc 24
<210> 2
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tttttttgca tctggtattc gtaaggttcc g 31
<210> 3
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gactggagtt cagacgtgtg ctcttccgat ctatcacgag atgtgtataa gagacag 57
<210> 4
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gactggagtt cagacgtgtg ctcttccgat ctcgatgtag atgtgtataa gagacag 57
<210> 5
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gactggagtt cagacgtgtg ctcttccgat cttgaccaag atgtgtataa gagacag 57
<210> 6
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
gactggagtt cagacgtgtg ctcttccgat ctcagatcag atgtgtataa gagacag 57
<210> 7
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
gactggagtt cagacgtgtg ctcttccgat ctgatcagag atgtgtataa gagacag 57
<210> 8
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gactggagtt cagacgtgtg ctcttccgat ctcttgtaag atgtgtataa gagacag 57
<210> 9
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gactggagtt cagacgtgtg ctcttccgat ctggctacag atgtgtataa gagacag 57
<210> 10
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ctgtctctta tacacatct 19
<210> 11
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
gactggagtt cagacgtgtg ctcttccgat ctatcacgag atgtgtataa gagacag 57
<210> 12
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
tctacacata ttctctgtc 19
<210> 13
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gactggagtt cagacgtgtg ctcttccgat ctcgatgtag atgtgtataa gagacag 57
<210> 14
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gactggagtt cagacgtgtg ctcttccgat cttgaccaag atgtgtataa gagacag 57
<210> 15
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gactggagtt cagacgtgtg ctcttccgat ctcagatcag atgtgtataa gagacag 57
<210> 16
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gactggagtt cagacgtgtg ctcttccgat ctgatcagag atgtgtataa gagacag 57
<210> 17
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gactggagtt cagacgtgtg ctcttccgat ctcttgtaag atgtgtataa gagacag 57
<210> 18
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gactggagtt cagacgtgtg ctcttccgat ctggctacag atgtgtataa gagacag 57
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cagttctcct actcggccag cgg 23
<210> 20
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
cttcaagccc caggtcacgt cgg 23
<210> 21
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gtattttgat gaggagttca cgg 23
<210> 22
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
acgtgtacga gaagaaggtg cgg 23
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
atgcagcatc gcttctttgc cgg 23
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gtgctggagg acaatgacta cgg 23
<210> 25
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tgtgccgcaa aaggtcttca tgg 23
<210> 26
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
aatctcagcg ccatagaagc ggg 23
<210> 27
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gtcagccaca gtctggatgg cgg 23
<210> 28
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gcaggatgtg gaccaacgtg agg 23
<210> 29
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
ctcgggcacc atgagcgacg tgg 23
<210> 30
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
cacattcctg gcaggtatgg ggg 23
<210> 31
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
attcctggca ggtatggggg cgg 23
<210> 32
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
cagcagaccg agtggcagag cgg 23
<210> 33
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
gcaagcggtg gagacagagc cgg 23
<210> 34
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gctcgaacca gctcttgagg cgg 23
<210> 35
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
actggaggaa caactgaccc cgg 23
<210> 36
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gtctctgaaa gaggcgggtc tgg 23
<210> 37
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
cagccacctg aagtccaaaa agg 23
<210> 38
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
tctcgaagcg ctcacgccca cgg 23
<210> 39
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
tcccaagact tagtacctga agg 23
<210> 40
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
aagagaatct ccgcaagaaa ggg 23
<210> 41
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
caagcagtca cagcacatga cgg 23
<210> 42
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
ccattgttca atatcgtccg ggg 23
<210> 43
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
tcgacgctag gatctgactg cgg 23
<210> 44
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
caaattcggt acatcctcga cgg 23
<210> 45
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
ggagaaggca actggaccga agg 23
<210> 46
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
gagtctcggt acatcctcga cgg 23
<210> 47
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
gatccagttc ctgcagaaaa agg 23
<210> 48
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
agtccagcct gagggctctt cgg 23
<210> 49
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
tctcattctg cgcagcttta agg 23
<210> 50
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
ggctagaaat ctgttgctat ggg 23
<210> 51
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
gctcttacct gtgggcatgt tgg 23
<210> 52
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
ttgccaacac gagctgactc tgg 23
<210> 53
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
ctcatactac tgatactgct ggg 23
<210> 54
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
gtctgggcca cacgatttga cgg 23
<210> 55
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
gcccatcatt agatgatagg tgg 23
<210> 56
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
aaatcaggga actaaccaaa cgg 23
<210> 57
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
aggaaacatg taatgatagg cgg 23
<210> 58
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
ctaatttctt ggcccctctt cgg 23
<210> 59
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
gtacaggtga gccgccacca agg 23
<210> 60
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
agatgttggt gcacaccgtc tgg 23
<210> 61
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
gccagtctca ccttcaaccg cgg 23
<210> 62
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
catgcgtcgc aaactctttg ggg 23
<210> 63
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
tttgttcaga tgccggccca cgg 23
<210> 64
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
atggctgcgt ggtgaacttg cgg 23
<210> 65
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
atgggcggcc ttctggacca cgg 23
<210> 66
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
gacgcacgca gtacgtgttc tgg 23
<210> 67
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
caccttcgtg ctgcgtgtgc ggg 23
<210> 68
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
tgtgaacatg gactacgtcg tgg 23
<210> 69
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
aagcagaggt caggcagcat cgg 23
<210> 70
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
cgcagagcac cgtctgcgtg agg 23
<210> 71
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
agaacaggct ctttttctac cgg 23
<210> 72
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
cgaagccgta cacctgccag ggg 23
<210> 73
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttg 53
<210> 74
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
aaaaaaaagc accgactcgg tgccactttt tcaagttgat aacggactag cc 52
<210> 75
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
aaaaaaaagc atctggtatt cgtaaggttc cgcaccgact cggtgccact ttttc 55
<210> 76
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
gaaaaagtgg caccgagtcg gtgcggaacc ttacgaatac cagatgcttt ttttt 55
<210> 77
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
cacattcctg gcaggtatgg gttttagagc tagaaatagc aag 43
<210> 78
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
ttctaatacg actcactata gcacattcct ggcaggtatg g 41
<210> 79
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
attcctggca ggtatggggg gttttagagc tagaaatagc aag 43
<210> 80
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
ttctaatacg actcactata gattcctggc aggtatgggg g 41
<210> 81
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
cagcagaccg agtggcagag gttttagagc tagaaatagc aag 43
<210> 82
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
ttctaatacg actcactata gcagcagacc gagtggcaga g 41
<210> 83
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
gcaagcggtg gagacagagc gttttagagc tagaaatagc aag 43
<210> 84
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
ttctaatacg actcactata ggcaagcggt ggagacagag c 41
<210> 85
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
gctcgaacca gctcttgagg gttttagagc tagaaatagc aag 43
<210> 86
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
ttctaatacg actcactata ggctcgaacc agctcttgag g 41
<210> 87
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
gcaagcggtg gagacagagc gttttagagc tagaaatagc aag 43
<210> 88
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
ttctaatacg actcactata gactggagga acaactgacc c 41
<210> 89
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
cagttctcct actcggccag gttttagagc tagaaatagc aag 43
<210> 90
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
ttctaatacg actcactata gcagttctcc tactcggcca g 41
<210> 91
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
cttcaagccc caggtcacgt gttttagagc tagaaatagc aag 43
<210> 92
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
ttctaatacg actcactata gcttcaagcc ccaggtcacg t 41
<210> 93
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
gtattttgat gaggagttca gttttagagc tagaaatagc aag 43
<210> 94
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
ttctaatacg actcactata ggtattttga tgaggagttc a 41
<210> 95
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
acgtgtacga gaagaaggtg gttttagagc tagaaatagc aag 43
<210> 96
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
ttctaatacg actcactata gacgtgtacg agaagaaggt g 41
<210> 97
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
atgcagcatc gcttctttgc gttttagagc tagaaatagc aag 43
<210> 98
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
ttctaatacg actcactata gatgcagcat cgcttctttg c 41
<210> 99
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
gtgctggagg acaatgacta gttttagagc tagaaatagc aag 43
<210> 100
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
ttctaatacg actcactata ggtgctggag gacaatgact a 41
<210> 101
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
tgtgccgcaa aaggtcttca gttttagagc tagaaatagc aag 43
<210> 102
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
ttctaatacg actcactata gtgtgccgca aaaggtcttc a 41
<210> 103
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
aatctcagcg ccatagaagc gttttagagc tagaaatagc aag 43
<210> 104
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
ttctaatacg actcactata gaatctcagc gccatagaag c 41
<210> 105
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
gtcagccaca gtctggatgg gttttagagc tagaaatagc aag 43
<210> 106
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
ttctaatacg actcactata ggtcagccac agtctggatg g 41
<210> 107
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
gcaggatgtg gaccaacgtg gttttagagc tagaaatagc aag 43
<210> 108
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
ttctaatacg actcactata ggcaggatgt ggaccaacgt g 41
<210> 109
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
ctcgggcacc atgagcgacg gttttagagc tagaaatagc aag 43
<210> 110
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
ttctaatacg actcactata gctcgggcac catgagcgac g 41
<210> 111
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
gtctctgaaa gaggcgggtc gttttagagc tagaaatagc aag 43
<210> 112
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
ttctaatacg actcactata ggtctctgaa agaggcgggt c 41
<210> 113
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
cagccacctg aagtccaaaa gttttagagc tagaaatagc aag 43
<210> 114
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
ttctaatacg actcactata gcagccacct gaagtccaaa a 41
<210> 115
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
tctcgaagcg ctcacgccca gttttagagc tagaaatagc aag 43
<210> 116
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 116
ttctaatacg actcactata gtctcgaagc gctcacgccc a 41
<210> 117
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 117
tcccaagact tagtacctga gttttagagc tagaaatagc aag 43
<210> 118
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 118
ttctaatacg actcactata gtcccaagac ttagtacctg a 41
<210> 119
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 119
aagagaatct ccgcaagaaa gttttagagc tagaaatagc aag 43
<210> 120
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 120
ttctaatacg actcactata gaagagaatc tccgcaagaa a 41
<210> 121
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 121
caagcagtca cagcacatga gttttagagc tagaaatagc aag 43
<210> 122
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 122
ttctaatacg actcactata gcaagcagtc acagcacatg a 41
<210> 123
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 123
ccattgttca atatcgtccg gttttagagc tagaaatagc aag 43
<210> 124
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 124
ttctaatacg actcactata gccattgttc aatatcgtcc g 41
<210> 125
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 125
tcgacgctag gatctgactg gttttagagc tagaaatagc aag 43
<210> 126
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 126
ttctaatacg actcactata gtcgacgcta ggatctgact g 41
<210> 127
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 127
caaattcggt acatcctcga gttttagagc tagaaatagc aag 43
<210> 128
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 128
ttctaatacg actcactata gcaaattcgg tacatcctcg a 41
<210> 129
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 129
ggagaaggca actggaccga gttttagagc tagaaatagc aag 43
<210> 130
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 130
ttctaatacg actcactata gggagaaggc aactggaccg a 41
<210> 131
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 131
gagtctcggt acatcctcga gttttagagc tagaaatagc aag 43
<210> 132
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 132
ttctaatacg actcactata ggagtctcgg tacatcctcg a 41
<210> 133
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 133
gatccagttc ctgcagaaaa gttttagagc tagaaatagc aag 43
<210> 134
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 134
ttctaatacg actcactata ggatccagtt cctgcagaaa a 41
<210> 135
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 135
agtccagcct gagggctctt gttttagagc tagaaatagc aag 43
<210> 136
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 136
ttctaatacg actcactata gagtccagcc tgagggctct t 41
<210> 137
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 137
tctcattctg cgcagcttta gttttagagc tagaaatagc aag 43
<210> 138
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 138
ttctaatacg actcactata gtctcattct gcgcagcttt a 41
<210> 139
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 139
ggctagaaat ctgttgctat gttttagagc tagaaatagc aag 43
<210> 140
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 140
ttctaatacg actcactata gggctagaaa tctgttgcta t 41
<210> 141
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 141
gctcttacct gtgggcatgt gttttagagc tagaaatagc aag 43
<210> 142
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 142
ttctaatacg actcactata ggctcttacc tgtgggcatg t 41
<210> 143
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 143
ttgccaacac gagctgactc gttttagagc tagaaatagc aag 43
<210> 144
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 144
ttctaatacg actcactata gttgccaaca cgagctgact c 41
<210> 145
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 145
ctcatactac tgatactgct gttttagagc tagaaatagc aag 43
<210> 146
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 146
ttctaatacg actcactata gctcatacta ctgatactgc t 41
<210> 147
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 147
gtctgggcca cacgatttga gttttagagc tagaaatagc aag 43
<210> 148
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 148
ttctaatacg actcactata ggtctgggcc acacgatttg a 41
<210> 149
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 149
gcccatcatt agatgatagg gttttagagc tagaaatagc aag 43
<210> 150
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 150
ttctaatacg actcactata ggcccatcat tagatgatag g 41
<210> 151
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 151
aaatcaggga actaaccaaa gttttagagc tagaaatagc aag 43
<210> 152
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 152
ttctaatacg actcactata gaaatcaggg aactaaccaa a 41
<210> 153
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 153
aggaaacatg taatgatagg gttttagagc tagaaatagc aag 43
<210> 154
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 154
ttctaatacg actcactata gaggaaacat gtaatgatag g 41
<210> 155
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 155
ctaatttctt ggcccctctt gttttagagc tagaaatagc aag 43
<210> 156
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 156
ttctaatacg actcactata gctaatttct tggcccctct t 41
<210> 157
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 157
gtacaggtga gccgccacca gttttagagc tagaaatagc aag 43
<210> 158
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 158
ttctaatacg actcactata ggtacaggtg agccgccacc a 41
<210> 159
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 159
agatgttggt gcacaccgtc gttttagagc tagaaatagc aag 43
<210> 160
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 160
ttctaatacg actcactata gagatgttgg tgcacaccgt c 41
<210> 161
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 161
gccagtctca ccttcaaccg gttttagagc tagaaatagc aag 43
<210> 162
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 162
ttctaatacg actcactata ggccagtctc accttcaacc g 41
<210> 163
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 163
catgcgtcgc aaactctttg gttttagagc tagaaatagc aag 43
<210> 164
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 164
ttctaatacg actcactata gcatgcgtcg caaactcttt g 41
<210> 165
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 165
tttgttcaga tgccggccca gttttagagc tagaaatagc aag 43
<210> 166
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 166
ttctaatacg actcactata gtttgttcag atgccggccc a 41
<210> 167
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 167
atggctgcgt ggtgaacttg gttttagagc tagaaatagc aag 43
<210> 168
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 168
ttctaatacg actcactata gatggctgcg tggtgaactt g 41
<210> 169
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 169
atgggcggcc ttctggacca gttttagagc tagaaatagc aag 43
<210> 170
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 170
ttctaatacg actcactata gatgggcggc cttctggacc a 41
<210> 171
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 171
gacgcacgca gtacgtgttc gttttagagc tagaaatagc aag 43
<210> 172
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 172
ttctaatacg actcactata ggacgcacgc agtacgtgtt c 41
<210> 173
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 173
caccttcgtg ctgcgtgtgc gttttagagc tagaaatagc aag 43
<210> 174
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 174
ttctaatacg actcactata gcaccttcgt gctgcgtgtg c 41
<210> 175
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 175
tgtgaacatg gactacgtcg gttttagagc tagaaatagc aag 43
<210> 176
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 176
ttctaatacg actcactata gtgtgaacat ggactacgtc g 41
<210> 177
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 177
aagcagaggt caggcagcat gttttagagc tagaaatagc aag 43
<210> 178
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 178
ttctaatacg actcactata gaagcagagg tcaggcagca t 41
<210> 179
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 179
cgcagagcac cgtctgcgtg gttttagagc tagaaatagc aag 43
<210> 180
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 180
ttctaatacg actcactata gcgcagagca ccgtctgcgt g 41
<210> 181
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 181
agaacaggct ctttttctac gttttagagc tagaaatagc aag 43
<210> 182
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 182
ttctaatacg actcactata gagaacaggc tctttttcta c 41
<210> 183
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 183
cgaagccgta cacctgccag gttttagagc tagaaatagc aag 43
<210> 184
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 184
ttctaatacg actcactata gcgaagccgt acacctgcca g 41
<210> 185
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 185
agatcggaag agcgtcgtgt agggaaagag tgt 33
<210> 186
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 186
acactctttc cctacacgac gctcttccga tctnnn 36
<210> 187
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 187
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 188
<211> 66
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 188
caagcagaag acggcatacg agattctgac atgtgactgg agttcagacg tgtgctcttc 60
cgatct 66
<210> 189
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 189
tccccggccc agccccttcc ggg 23
<210> 190
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 190
agtggattcg cgggcacaga 20
<210> 191
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 191
cagcgctgcc tgaaactc 18
<210> 192
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 192
ccccgccccg tcccgacccc ttccgggtcc ccggcccagc cccc 44
<210> 193
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 193
ggctgggccg gggacccgga aggggtcggg acggggcggg g 41
<210> 194
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 194
tccccggccc agccccctcc gttttagagc tagaaatagc aag 43
<210> 195
<211> 41
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 195
ttctaatacg actcactata gtccccggcc cagccccctc c 41
<210> 196
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 196
tccgcgcgga ccccgccccg tcccgaccc 29
<210> 197
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 197
gcccggaggg ggctgggccg gggaccc 27
<210> 198
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 198
ctccgcgcgg accccgcccc gtcccgaccc cgc 33
<210> 199
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 199
ggcccggagg gggctgggcc ggggacccgt g 31
<210> 200
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 200
ctccgcgcgg accccgcccc gtcccgaccc cgt 33
<210> 201
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 201
ggcccggagg gggctgggcc ggggacccgt a 31
<210> 202
<211> 481
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 202
atcacgagat gtgtataaga gacagtgctg ggattaggct gttgcagata atgcaacaag 60
gcttggaagg ctaacctggg gtgaggccgg gttggggccg ggctgggggt gggaggagtc 120
ctcactggcg gttgattgac agtttctcct tccccagact ggccaatcac aggcaggaag 180
atgaaggttc tgtgggctgc gttgctggtc acattcctgg caggtatggg ggcggggctt 240
gctcggttcc ccccgctcct ccccctctca tcctcacctc aacctcctgg ccccattcag 300
gcagaccctg ggccccctct tctgaggctt ctgtgctgct tcctggctct gaacagcgat 360
ttgacgctct ctgggcctcg gtttccccca tccttgagat aggagttaga agttgttttg 420
ttgttgttgt ttgttgttgt tgttttgttt ttttgagatg aagtctcgct ctgtcgccca 480
g 481
<210> 203
<211> 481
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 203
atcacgagat gtgtataaga gacagtgctg ggattaggct gttgcagata atgcaacaag 60
gcttggaagg ctaacctggg gtgaggccgg gttggggccg ggctgggggt gggaggagtc 120
ctcactggcg gttgattgac agtttctcct tccccagact ggccaatcac aggcaggaag 180
atgaaggttc tgtgggctgc gttgctggtc acattcctgg caggtatggg ggcggggctt 240
gctcggttcc ccccgctcct ccccctctca tcctcacctc aacctcctgg ccccattcag 300
gcagaccctg ggccccctct tctgaggctt ctgtgctgct tcctggctct gaacagcgat 360
ttgacgctct ctgggcctcg gtttccccca tccttgagat aggagttaga agttgttttg 420
ttgttgttgt ttgttgttgt tgttttgttt ttttgagatg aagtctcgct ctgtcgccca 480
g 481
<210> 204
<211> 557
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 204
atcacgagat gtgtataaga gacagttatt caacatttaa acaatccttt ttactttcat 60
tttccttcag gcaaagaatc tagatgcaat aaccacccct gacccaacca caaatgccag 120
cctgctgacg aagctgcagg cacagaacca gtggctgcag gacatgacaa ctcatctcat 180
tctgcgcagc tttaaggagt tcctgcagtc cagcctgagg gctcttcggc aaatgtagca 240
tgggcacctc agattgttgt tgttaatggg cattccttct tctggtcaga aacctgtcca 300
ctgggcacag aacttatgtt gttctctatg gagaactaaa agtatgagcg ttaggacact 360
attttaatta tttttaattt attaatattt aaatatgtga agctgagtta atttatgtaa 420
gtcatattta tatttttaag aagtaccact tgaaacattt tatgtattag ttttgaaata 480
ataatggaaa gtggctatgc agtttgaata tcctttgttt cagagccaga tcatttcttg 540
gaaagtgtag gcttacc 557
<210> 205
<211> 400
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 205
atcacgagat gtgtataaga gacagtgagg tcgccaggcc cttggtgggc tggatgtgcc 60
gtgtccggat ggtgcaggtc tggggtgagg tcgccaggcc cttggtgagc tggatgtgcg 120
gtgtccggat ggtgcaggtc cggggtgagg tcaccaggcc ctcggtgatc tggatgtggc 180
atgtccttct cgtttaaggg gttggctgtg ttccggccgc agagcaccgt ctgcgtgagg 240
agatcctggc caagttcctg cactggctga tgagtgtgta cgtcgtcgag ctgctcaggt 300
ctttctttta tgtcacggag accacgtttc aaaagaacag gctctttttc taccggaaga 360
gtgtctggag caagttgcaa agcattggaa tcaggtactg 400
<210> 206
<211> 388
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 206
atcacgagat gtgtataaga gacagtgagg tcgccaggcc cttggtgggc tggatgtgcc 60
gtgtccggat ggtgcaggtc tggggtgagg tcgccaggcc cttggtgagc tggatgtgcg 120
gtgtccggat ggtgcaggtc cggggtgagg tcaccaggcc ctcggtgatc tggatgtggc 180
atgtccttct cgtttaaggg gttggctgtg ttccggccgc agagcaccgt ctgcgtgagg 240
agatcctggc caagttcctg cactggctga tgagtgtgta cgtcgtcgag ctgctcaggt 300
ctttctttta tgtcacggag accacgtttc aaaagaacag gctctttttc taccggaaga 360
gtgtctggag caagttgcaa agcattgg 388
<210> 207
<211> 369
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 207
atcacgagat gtgtataaga gacagcaggt ccggggtgag gtcaccaggc cctcggtgat 60
ctggatgtgg catgtccttc tcgtttaagg ggttggctgt gttccggccg cagagcaccg 120
tctgcgtgag gagatcctgg ccaagttcct gcactggctg atgagtgtgt acgtcgtcga 180
gctgctcagg tctttctttt atgtcacgga gaccacgttt caaaagaaca ggctcttttt 240
ctaccggaag agtgtctgga gcaagttgca aagcattgga atcaggtact gtatccccac 300
gccaggcctc tgcttctcga agtcctggaa caccagcccg gcctcagcat gcgcctgtct 360
ccacttgcc 369
<210> 208
<211> 591
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 208
atcacgagat gtgtataaga gacagtgtcc ttggccaggg ctgatctcca aagcctcagg 60
cccaagcaga gtggcgggca ggccggggtc agttgggcct ctgtccccaa ccctgcagcc 120
tgcacccacc cactcaggaa gcccctgccc tgccgtgagc tctgtggtgc tttgctaccc 180
acagctgctc agggacgctg caccaccggc tcccctccct ggccccggaa cgtcctgtct 240
ggcgggccct acatcacagg aggaaggggc ctgaacccag ggcctgggca ggtggcggta 300
ccgacactgt ggccttgttt cctgcctgca ggcttggcgg gggctccgag gacgccaagg 360
agatcatgca gcatcgcttc tttgccggta tcgtgtggca gcacgtgtac gagaagaagg 420
tgcggctgct ccccgcatat tcacgcgcac gcatgctccc cacatatcca cactcacgca 480
tgcacgtggc acgctcgcca gatttcccac acactcgccc tcacctcagg agcctgctgc 540
agtcctggta caaggagggc cttgctgcac caacctcagc gcctggtgct c 591
<210> 209
<211> 577
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 209
atcacgagat gtgtataaga gacagaatta aattacacag aactgtgatt gttttctaga 60
tttcttcctc taggttatta attgacaata cctacataaa actctttcca gaatgttgtt 120
aagtcttagt cattagggag atacatatgg atacactcac aaattcttct ggggtcaggc 180
cagacaccac catggacatt cttttgttga ccctttctgt tgaagctgtc aattctggct 240
tctccctgct cacactttct tccattgcat tatacccagc agtatcagta gtatgagcag 300
cagctggact ctgggcagat tctgcaactt tcaattgggg aactttcaat gcagaggttg 360
aagatggtat gttgccaaca cgagctgact ctggggctct gtcttcagaa ggatcagatt 420
cagggtcatc agagaagagg ctgattccag attccaggta aggggttccc tctgaaagga 480
atgggagaag tttaatttac acaacgatga atgttgaatt acaaagttct ggtctctgtt 540
aagaattaaa aagaccaata aagttaggtt aagagaa 577
<210> 210
<211> 516
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 210
atcacgagat gtgtataaga gacagctgca gcctgcaccc acccactcag gaagcccctg 60
ccctgccgtg agctctgtgg tgctttgcta cccacagctg ctcagggacg ctgcaccacc 120
ggctcccctc cctggccccg gaacgtcctg tctggcgggc cctacatcac aggaggaagg 180
ggcctgaacc cagggcctgg gcaggtggcg gtaccgacac tgtggccttg tttcctgcct 240
gcaggcttgg cgggggctcc gaggacgcca aggagatcat gcagcatcgc ttctttgccg 300
gtatcgtgtg gcagcacgtg tacgagaaga aggtgcggct gctccccgca tattcacgcg 360
cacgcatgct ccccacatat ccacactcac gcatgcacgt ggcacgctcg ccagatttcc 420
cacacactcg ccctcacctc aggagcctgc tgcagtcctg gtacaaggag ggccttgctg 480
caccaacctc agcgcctggt gctcagaggc tctggc 516
<210> 211
<211> 598
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 211
atcacgagat gtgtataaga gacagtcact aaggtgatgt tcctgagatg cctttgccaa 60
tattacctgg ttactgcagt catttaagct attcttcaat gataataaat tctcctctgt 120
gttcttagac agacactcgg tagcaacggt gctatgccta gtagactgag aaggtatatt 180
gtttacttta ccaaataaca agtgttggaa gcagggaagc tcttcatcct cactagataa 240
gttctcttct gaggactcta atttcttggc ccctcttcgg taaccctgag ccaaatgtgt 300
atgggtgaaa gggctaggac tcctgctaag ctctcctttc tggacgcttt tgctaaaaac 360
agcagaactt tccttaatgt cattttcagc aaaactagta tcttccttta tttcaccatc 420
atctaacagg tcatcaggtg tctcagaaca aacctgagat gcatgactac ttcccatagg 480
ctgttctaag ttatctgaaa tcagatatgg agagaaatct gtattaacag tctgaactac 540
ttcttcatat tcttgctttt ttatttcagg atgcttacaa ttacttccag gaagactt 598
<210> 212
<211> 591
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 212
atcacgagat gtgtataaga gacagtgtcc ttggccaggg ctgatctcca aagcctcagg 60
cccaagcaga gtggcgggca ggccggggtc agttgggcct ctgtccccaa ccctgcagcc 120
tgcacccacc cactcaggaa gcccctgccc tgccgtgagc tctgtggtgc tttgctaccc 180
acagctgctc agggacgctg caccaccggc tcccctccct ggccccggaa cgtcctgtct 240
ggcgggccct acatcacagg aggaaggggc ctgaacccag ggcctgggca ggtggcggta 300
ccgacactgt ggccttgttt cctgcctgca ggcttggcgg gggctccgag gacgccaagg 360
agatcatgca gcatcgcttc tttgccggta tcgtgtggca gcacgtgtac gagaagaagg 420
tgcggctgct ccccgcatat tcacgcgcac gcatgctccc cacatatcca cactcacgca 480
tgcacgtggc acgctcgcca gatttcccac acactcgccc tcacctcagg agcctgctgc 540
agtcctggta caaggagggc cttgctgcac caacctcagc gcctggtgct c 591
<210> 213
<211> 574
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 213
atcacgagat gtgtataaga gacagaccgg cacctcggcc acctcaccgt gcgcacaaat 60
gggttggcgc cgtgccatgg ccctggctgt gtcccgtggc ccctcctccg ggcccttcat 120
ctaagctgat accaaatgtg gggctcaaac gcacttctgt ttaaaaagga agttaaacca 180
aagcacagcc accctctttt ctctgcggaa cgttctggct cccacgacgt agtccatgtt 240
cacaatcggc cgcagcccgt caggcttggg gatgaagcgg agtctggacg tcagcagggc 300
gggcctggct tcccgatgct gcctgacctc tgcttccgac agctcccgca gctgcaccct 360
cttcaagtgc tgtctgcaat agagagcccc tcaggaggct tgctcagcca gacaacagac 420
tagggggaag ctcacgggaa gccacaagcc cccaccgact cagtgagggc tcagggcacc 480
cacggcagca cacgctgaag gccatgcccg gggccacgtc cacccatgcc agccagacgc 540
ctctgagagc ccctctactt gcagggcacc tgga 574
<210> 214
<211> 577
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 214
atcacgagat gtgtataaga gacagtgaca cagggacctg ggccctcaga gcactgcctc 60
ccaccctgat cattggcact ctccaaaagg aaccttttta aatatttaga ttttaaaaca 120
tctgaagcca aaaaagctga acactgcagg cctctctgag tgtggagaga aaagggagtg 180
ggcgggggca ggcagtggcc cctcaccttg gtcaggtggt gtgatggtga tcatctgggc 240
cgtgaactcc tcatcaaaat acctggtgtc agtctccgac gtgacctggg gcttgaaggg 300
tgggctgagc tgcagaggtg ggcagacggg acagtcatga gcttcgctcc ccactcccag 360
cacaccctca agtgtgctca agaccttcaa agcacctgga tctccaaggg gtctccaggc 420
aggactgatg tcagagagca gcaagccacc agccccccac agaggcagct ctgggaggga 480
gggacatgag gggtgcagga gcacggagac aaccctcaac agctgagacg caaagctgcc 540
ctcacagcag ccccagcagg cgacaggagg tagtgca 577
<210> 215
<211> 619
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 215
atcacgagat gtgtataaga gacaggccag ggctgatctc caaagcctca ggcccaagca 60
gagtggcggg caggccgggg tcagttgggc ctctgtcccc aaccctgcag cctgcaccca 120
cccactcagg aagcccctgc cctgccgtga gctctgtggt gctttgctac ccacagctgc 180
tcagggacgc tgcaccaccg gctcccctcc ctggccccgg aacgtcctgt ctggcgggcc 240
ctacatcaca ggaggaaggg gcctgaaccc agggcctggg caggtggcgg taccgacact 300
gtggccttgt ttcctgcctg caggcttggc gggggctccg aggacgccaa ggagatcatg 360
cagcatcgct tctttgccgg tatcgtgtgg cagcacgtgt acgagaagaa ggtgcggctg 420
ctccccgcat attcacgcgc acgcatgctc cccacatatc cacactcacg catgcacgtg 480
gcacgctcgc cagatttccc acacactcgc cctcacctca ggagcctgct gcagtcctgg 540
tacaaggagg gccttgctgc accaacctca gcgcctggtg ctcagaggct ctggcactgc 600
cgggttccac caggaaact 619
<210> 216
<211> 473
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 216
atcacgagat gtgtataaga gacagacctg cactcggaga agaacgtggt gtaccgggac 60
ctcaaggtgc gctggcgggc aggcaggggg gcagggccct gggggcctgg cggcactgac 120
ctgaggccac ctttccccta gctggagaac ctcatgctgg acaaggacgg gcacattaag 180
atcacagact tcgggctgtg caaggagggg atcaaggacg gtgccaccat gaagaccttt 240
tgcggcacac ctgagtacct ggcccccgag gtgtgcgccc cacctgcgtg catacgcgtt 300
gctgcgtccc cacgtcctga gcacacgcaa tgctgtgtcc tctctgtgcc ccaagcacgt 360
cacacctccc ccggcagtgt cccggacacc ccttgatgcc gagtcctgcc catctgccac 420
ccgtgcaggt gctggaggac aatgactacg gccgtgcagt ggactggtgg ggg 473
<210> 217
<211> 458
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 217
atcacgagat gtgtataaga gacagtcctt taaaatatat attatggtat aagttggtgt 60
tctgaagtta gttagctaca accaggagcc attgtctttg aggcatcact gccccctgat 120
ggcaaatgcc ccaattgcag gtaaaacagt caagaagaaa acggcatttt gagtgttaga 180
ctggaaactt tccacttgat aagaggtccc aagacttagt acctgaaggg tgaaatattc 240
tccatccagt ggtttcttct ttggctgggg agaggagctg gtgttgttgg gcagtgctag 300
gaaagaggca aggaaaggtg ataaaagtga atctgaggca taactgcacc cttggtctcc 360
tccaccgctt cttgtcctgc ttgcttacct cgcttagtgc tccctggggg cagctcgtgg 420
tgaggctccc ctttcttgcg gagattctct tcctctgt 458
<210> 218
<211> 1036
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 218
atcacgagat gtgtataaga gacagtgtgt ggggagccac agctctgctg caccttcccg 60
ggggtggggc cagcgaccct cacctgcacc cacctcggcc ctctttgctg agaccccaaa 120
tcctccgggc atctgatctc ccatctactg ttcagacacc ttcccagcct cctctgctaa 180
gactccccat aaacatctct ttaccccatg cccctgctgc cctgggatgg cctccatgac 240
gtcccacggc cagtgcacag gcacagtggg gacacctggg gccacaccgg ctcctaccac 300
tacccagaga tggagaacag gtgctttgca cagagccacg cgaacagaac tgtgcacagg 360
cagcagcacc actgaaaacg taagacattc cttgccccta aaacccagga gttccaaggt 420
gaagccccgg gtcagaggtg agcagagcgc ggagggtccc tggaggctgg gcctgcaccc 480
cttggtggcg gctcacctgt acgcctgcag caggaggatc ttgtagatgt tggtgcacac 540
cgtctggagg ctgttcacct agagtcgcca agaaagagtg agaaacggta gaaacctctc 600
tgggatttta agtttttact ttttgcttta tcatccattc agatggaaca agaaagagga 660
acattttgac aagaaactat ccctcttccc agtgaaatcc ggcctggccc tcacccggca 720
gctgcgaacc accctgggcg agtcaagact ctgtgtcatc tgcctgcccc cgaggctcgg 780
ccaagacagg aaggaaccag gagagggagt ggacgcaaat gcccacagag aggggaggtg 840
gacgcagatg cccacagaga gggggagtgg acgcggatgc ccacaggaga gagggagtgg 900
agtggatgta aatgcccaca ggagaggggg agtggacaca gacgcccaca ggagagaggg 960
aatggagtgg atgtaaatgc ccacaggaga gggggagtgg acacggacgc ccacaggaga 1020
gagggagtgg atgcag 1036
<210> 219
<211> 693
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 219
atcacgagat gtgtataaga gacaggcttt cttctatgta agtaaattaa gatggtttag 60
gaagaggaga actcctcctt gatttttacc tatccaaaga tattttctca ctaacatgtt 120
ggcactaaca gcagctcaac gccatctgaa cacataacat actgaatcct aactattaac 180
caccttcatg ctcttgagaa gggggacaag gtatagtttt tttttgccat aggataacat 240
ttaggtgctg ttttgtttgg agagtggtag agaaatagaa tagcctctag aacatttcag 300
caatctgagg aacccccatc gtgggatctt gcttataata ctccactatg taagacaaag 360
gctggtgctg gaactctggg gttctcccag gctcttacct gtgggcatgt tggtgaaggg 420
cccatagcaa cagatttcta gccccctgaa gatctggaag aagagaggaa gagagaggga 480
caggggaatg gagagaagga aaatctagtt ataaaagaat attggctttt attcaaaaaa 540
cagactttca aaaaggaaga gcttttcttt ttcttctgtt caccacctga tgatttctgc 600
tgctacttcc cagggacaag cagtccaatg tccagaacac tacaggattt cagaagatct 660
tcttgaagtg catatgtagt tgacctgcac tct 693
<210> 220
<211> 708
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 220
atcacgagat gtgtataaga gacagccaac ctcttaaagc acggccagca agctgccata 60
ctgccaggaa actgagacag ggccccacag attgacacag ggacctgggc cctcagagca 120
ctgcctccca ccctgatcat tggcactctc caaaaggaac ctttttaaat atttagattt 180
taaaacatct gaagccaaaa aagctgaaca ctgcaggcct ctctgagtgt ggagagaaaa 240
gggagtgggc gggggcaggc agtggcccct caccttggtc aggtggtgtg atggtgatca 300
tctgggccgt gaactcctca tcaaaatacc tggtgtcagt ctccgacgtg acctggggct 360
tgaagggtgg gctgagctgc agaggtgggc agacgggaca gtcatgagct tcgctcccca 420
ctcccagcac accctcaagt gtgctcaaga ccttcaaagc acctggatct ccaaggggtc 480
tccaggcagg actgatgtca gagagcagca agccaccagc cccccacaga ggcagctctg 540
ggagggaggg acatgagggg tgcaggagca cggagacaac cctcaacagc tgagacgcaa 600
agctgccctc acagcagccc cagcaggcga caggaggtag tgcagcccag ctctgagaga 660
ccctccctgc taccaggagg tgataacttt atttttcctt tttctttc 708
<210> 221
<211> 810
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 221
atcacgagat gtgtataaga gacagctgct ttctgaagac acctcagtgc acccaggtct 60
ggtgcaccat ttccttttac caaaatagca cagaaaactg ctcccgttgt gagcaccctc 120
actcccacag aaagatgcat ttctgctcag ccccagatgg gacgaggggc accctgtggc 180
ctctgaccct ttgggattgg cagtcgcctg ccccacacgg aagcagaggt ggacgcaacg 240
gccctgcagc agcacctgcc ccagccgggc acaggctcca cttccggcca ggtgcgctca 300
cctggagtag tcgctctgca cctccagggt ccgggtatcc agcagcaggc cgcaccaggg 360
gaataggccg tgggccggca tctgaacaaa agccgtgcca cccagggcct cgtcttctac 420
agggaagttc accactgtct tccgcaagtt caccacgcag ccatactcag ggacacctcg 480
gaccagggtc ctaaggcaga ggggcaatgt cagccccagg atgcggggcc gtcacccagg 540
aggtaacctg acacccttgt taaatgcttt ggaaaacccc agagaagtgg tgatttggag 600
cagggtgctg ggcctggcag gagctctgag gagcctggac ccagccctgc tccagacttc 660
ggggtgcttt ccctgtctcc cgggcaggac aggtaggtga gcatgcaaga acctggcctg 720
gacccgggac agccaggact cagatgggag gtgcagcccc agtggcctct gtgatggtcc 780
atctcatgtg tccccatggc aacaccacaa 810
<210> 222
<211> 527
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 222
atcacgagat gtgtataaga gacagtggcg gtaccgacac tgtggccttg tttcctgcct 60
gcaggcttgg cgggggctcc gaggacgcca aggagatcat gcagcatcgc ttctttgccg 120
gtatcgtgtg gcagcacgtg tacgagaaga aggtgcggct gctccccgca tattcacgcg 180
cacgcatgct ccccacatat ccacactcac gcatgcacgt ggcacgctcg ccagatttcc 240
cacacactcg ccctcacctc aggagcctgc tgcagtcctg gtacaaggag ggccttgctg 300
caccaacctc agcgcctggt gctcagaggc tctggcactg ccgggttcca ccaggaaact 360
ggcctggtcc tcatttcctc ctcccctcgg aggtgtgtca cactctgagt ttcctcctcc 420
cctcggaggt gtgtcacact ctgagtgcca gccttggggt tcccttccct gacgctgtgc 480
agtgaaggct ggctggtggt ggaccagggg tgctgcccct tggcctc 527
<210> 223
<211> 665
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 223
atcacgagat gtgtataaga gacaggcatg ctcacctacc tgtcctgccc gggagacagg 60
gaaagcaccc cgaagtctgg agcagggctg ggtccaggct cctcagagct cctgccaggc 120
ccagcaccct gctccaaatc accacttctc tggggttttc caaagcattt aacaagggtg 180
tcaggttacc tcctgggtga cggccccgca tcctggggct gacattgccc ctctgcctta 240
ggaccctggt ccgaggtgtc cctgagtatg gctgcgtggt gaacttgcgg aagacagtgg 300
tgaacttccc tgtagaagac gaggccctgg gtggcacggc ttttgttcag atgccggccc 360
acggcctatt cccctggtgc ggcctgctgc tggatacccg gaccctggag gtgcagagcg 420
actactccag gtgagcgcac ctggccggaa gtggagcctg tgcccggctg gggcaggtgc 480
tgctgcaggg ccgttgcgtc cacctctgct tccgtgtggg gcaggcgact gccaatccca 540
aagggtcaga ggccacaggg tgcccctcgt cccatctggg gctgagcaga aatgcatctt 600
tctgtgggag tgagggtgct cacaacggga gcagttttct gtgctatttt ggtaaaagga 660
aatgg 665
<210> 224
<211> 702
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 224
atcacgagat gtgtataaga gacagtcagg ttacctcctg ggtgacggcc ccgcatcctg 60
gggctgacat tgcccctctg ccttaggacc ctggtccgag gtgtccctga gtatggctgc 120
gtggtgaact tgcggaagac agtggtgaac ttccctgtag aagacgaggc cctgggtggc 180
acggcttttg ttcagatgcc ggcccacggc ctattcccct ggtgcggcct gctgctggat 240
acccggaccc tggaggtgca gagcgactac tccaggtgag cgcacctggc cggaagtgga 300
gcctgtgccc ggctggggca ggtgctgctg cagggccgtt gcgtccacct ctgcttccgt 360
gtggggcagg cgactgccaa tcccaaaggg tcagaggcca cagggtgccc ctcgtcccat 420
ctggggctga gcagaaatgc atctttctgt gggagtgagg gtgctcacaa cgggagcagt 480
tttctgtgct attttggtaa aaggaaatgg tgcaccagac ctgggtgcac tgaggtgtct 540
tcagaaagca gtctggatcc gaacccaaga cgcccgggcc ctgctgggcg tgagtctctc 600
caaacccgaa acacaggggc cctgctgggc atgagtccct ctgaacccga gaccctgggg 660
ccctgatggg cgtgagtctc tccgaaccca gagacttcag gg 702
<210> 225
<211> 594
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 225
atcacgagat gtgtataaga gacagtctct cagagctggg ctgcactacc tcctgtcgcc 60
tgctggggct gctgtgaggg cagctttgcg tctcagctgt tgagggttgt ctccgtgctc 120
ctgcacccct catgtccctc cctcccagag ctgcctctgt ggggggctgg tggcttgctg 180
ctctctgaca tcagtcctgc ctggagaccc cttggagatc caggtgcttt gaaggtcttg 240
agcacacttg agggtgtgct gggagtgggg agcgaagctc atgactgtcc cgtctgccca 300
cctctgcagc tcagcccacc cttcaagccc caggtcacgt cggagactga caccaggtat 360
tttgatgagg agttcacggc ccagatgatc accatcacac cacctgacca aggtgagggg 420
ccactgcctg cccccgccca ctcccttttc tctccacact cagagaggcc tgcagtgttc 480
agcttttttg gcttcagatg ttttaaaatc taaatattta aaaaggttcc ttttggagag 540
tgccaatgat cagggtggga ggcagtgctc tgagggccca ggtccctgtg tcaa 594
<210> 226
<211> 552
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 226
atcacgagat gtgtataaga gacagtggga ttggcagtcg cctgccccac acggaagcag 60
aggtggacgc aacggccctg cagcagcacc tgccccagcc gggcacaggc tccacttccg 120
gccaggtgcg ctcacctgga gtagtcgctc tgcacctcca gggtccgggt atccagcagc 180
aggccgcacc aggggaatag gccgtgggcc ggcatctgaa caaaagccgt gccacccagg 240
gcctcgtctt ctacagggaa gttcaccact gtcttccgca agttcaccac gcagccatac 300
tcagggacac ctcggaccag ggtcctaagg cagaggggca atgtcagccc caggatgcgg 360
ggccgtcacc caggaggtaa cctgacaccc ttgttaaatg ctttggaaaa ccccagagaa 420
gtggtgattt ggagcagggt gctgggcctg gcaggagctc tgaggagcct ggacccagcc 480
ctgctccaga cttcggggtg ctttccctgt ctcccgggca ggacaggtag gtgagcatgc 540
aagaacctgg cc 552
<210> 227
<211> 692
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 227
atcacgagat gtgtataaga gacagctcca tctgaaggga tgtggctctt tctacctggg 60
ggtcctgcct ggggccagcc ttgggctacc ccagtggctg taccagaggg acaggcatcc 120
tgtgtggagg ggcatgggtt cacgtggccc cagatgcagc ctgggaccag gctccctggt 180
gctgatggtg ggacagtcac cctgggggtt gaccgccgga ctgggcgtcc ccagggttga 240
ctataggacc aggtgtccag gtgccctgca agtagagggg ctctcagagg cgtctggctg 300
gcatgggtgg acgtggcccc gggcatggcc ttcagcgtgt gctgccgtgg gtgccctgag 360
ccctcactga gtcggtgggg gcttgtggct tcccgtgagc ttccccctag tctgttgtct 420
ggctgagcaa gcctcctgag gggctctcta ttgcagacag cacttgaaga gggtgcagct 480
gcgggagctg tcggaagcag aggtcaggca gcatcgggaa gccaggcccg ccctgctgac 540
gtccagactc cgcttcatcc ccaagcctga cgggctgcgg ccgattgtga acatggacta 600
cgtcgtggga gccagaacgt tccgcagaga aaagagggtg gctgtgcttt ggtttaactt 660
cctttttaaa cagaagtgcg tttgagcccc ac 692
<210> 228
<211> 634
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 228
atcacgagat gtgtataaga gacagtcctg ctgtgcctga ctggtatttg gttgtactat 60
tttttctttc tctcttcact gctagaacaa ctatccattt gcaattcagt acaattaggt 120
gggcttagat ttctactgac tactagttca agcgcatgaa tatgcctggt agaagacttc 180
ctcctcagcc tattcttttt aggtgctttt gaattgtgga tatttaattc gagttccata 240
ttgcttatac tgctgcttat aggttcagct ttcgttttga aagcagattc tttttcgagt 300
gattctattg ggttaggatt tttctcattc tgaatagaat caccttttgt tttattctca 360
tgaccactat tagtaatatt catcacttga ccattctgct ccgtttggtt agttccctga 420
tttatcattt caggagtctt ttgaactgcc aaatctgctt tcttgataaa atcctcagga 480
tgaaggcctg atgtaggtct ccttttacgc tttaatttat ttgtgagggg acgctcttgt 540
attatctgtg gctcagtaac aaatgctcct ataattagat tttcagttac atggcttaag 600
ttggggaggc ttgccttctt ccgataggtt ttcc 634
<210> 229
<211> 690
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 229
atcacgagat gtgtataaga gacagcacag ggacctgggc cctcagagca ctgcctccca 60
ccctgatcat tggcactctc caaaaggaac ctttttaaat atttagattt taaaacatct 120
gaagccaaaa aagctgaaca ctgcaggcct ctctgagtgt ggagagaaaa gggagtgggc 180
gggggcaggc agtggcccct caccttggtc aggtggtgtg atggtgatca tctgggccgt 240
gaactcctca tcaaaatacc tggtgtcagt ctccgacgtg acctggggct tgaagggtgg 300
gctgagctgc agaggtgggc agacgggaca gtcatgagct tcgctcccca ctcccagcac 360
accctcaagt gtgctcaaga ccttcaaagc acctggatct ccaaggggtc tccaggcagg 420
actgatgtca gagagcagca agccaccagc cccccacaga ggcagctctg ggagggaggg 480
acatgagggg tgcaggagca cggagacaac cctcaacagc tgagacgcaa agctgccctc 540
acagcagccc cagcaggcga caggaggtag tgcagcccag ctctgagaga ccctccctgc 600
taccaggagg tgataacttt atttttcctt tttctttctt gttttcttat ttttcttatt 660
ggtcttcttg taaattggga aagagggaga 690
<210> 230
<211> 467
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 230
atcacgagat gtgtataaga gacagtctgg cgggccctac atcacaggag gaaggggcct 60
gaacccaggg cctgggcagg tggcggtacc gacactgtgg ccttgtttcc tgcctgcagg 120
cttggcgggg gctccgagga cgccaaggag atcatgcagc atcgcttctt tgccggtatc 180
gtgtggcagc acgtgtacga gaagaaggtg cggctgctcc ccgcatattc acgcgcacgc 240
atgctcccca catatccaca ctcacgcatg cacgtggcac gctcgccaga tttcccacac 300
actcgccctc acctcaggag cctgctgcag tcctggtaca aggagggcct tgctgcacca 360
acctcagcgc ctggtgctca gaggctctgg cactgccggg ttccaccagg aaactggcct 420
ggtcctcatt tcctcctccc ctcggaggtg tgtcacactc tgagttt 467
<210> 231
<211> 470
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 231
atcacgagat gtgtataaga gacagggaca ctcaccctag gccagcccag gagccccagg 60
ggaggcagcc cctcccaccc agcagggcac aggcactcac agaccctggg gctactaccc 120
ccatctctcc ctccccaggc ccagccctgg cagcgggtac taacctcgtt tgtgcagcca 180
accctccttc acaatagcca cgtcgctcat ggtgcccgag gctcccgcga cgctcacgcg 240
ctcctctcag gctggcgctc cccgagccca gctggcctgg ccacagcctc tgggagaagc 300
aaaggaagct gaatgtgagg ccacgcctgg ctaagggcag ctcctcgccc tgggtgagcc 360
agagacccac tgcacgtgcc tgggggctcc acccgcacct gccttcccag gtgggctgcc 420
atccctctaa gctctctgac ccccatctgc ccgcctgcct tccctctccc 470
<210> 232
<211> 507
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 232
atcacgagat gtgtataaga gacaggaaga cttcctcctc agcctattct ttttaggtgc 60
ttttgaattg tggatattta attcgagttc catattgctt atactgctgc ttataggttc 120
agctttcgtt ttgaaagcag attctttttc gagtgattct attgggttag gatttttctc 180
attctgaata gaatcacctt ttgttttatt ctcatgacca ctattagtaa tattcatcac 240
ttgaccattc tgctccgttt ggttagttcc ctgatttatc atttcaggag tcttttgaac 300
tgccaaatct gctttcttga taaaatcctc aggatgaagg cctgatgtag gtctcctttt 360
acgctttaat ttatttgtga ggggacgctc ttgtattatc tgtggctcag taacaaatgc 420
tcctataatt agattttcag ttacatggct taagttgggg aggcttgcct tcttccgata 480
ggttttccca aatattttgt cttcaat 507
<210> 233
<211> 440
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 233
atcacgagat gtgtataaga gacagaactt aaaatcccag agaggtttct accgtttctc 60
actctttctt ggcgactcta ggtgaacagc ctccagacgg tgtgcaccaa catctacaag 120
atcctcctgc tgcaggcgta caggtgagcc gccaccaagg ggtgcaggcc cagcctccag 180
ggaccctccg cgctctgctc acctctgacc cggggcttca ccttggaact cctgggtttt 240
aggggcaagg aatgtcttac gttttcagtg gtgctgctgc ctgtgcacag ttctgttcgc 300
gtggctctgt gcaaagcacc tgttctccat ctctgggtag tggtaggagc cggtgtggcc 360
ccaggtgtcc ccactgtgcc tgtgcactgg ccgtgggacg tcatggaggc catcccaggg 420
cagcaggggc atggggtaaa 440
<210> 234
<211> 442
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 234
atcacgagat gtgtataaga gacagccact tctctggggt tttccaaagc atttaacaag 60
ggtgtcaggt tacctcctgg gtgacggccc cgcatcctgg ggctgacatt gcccctctgc 120
cttaggaccc tggtccgagg tgtccctgag tatggctgcg tggtgaactt gcggaagaca 180
gtggtgaact tccctgtaga agacgaggcc ctgggtggca cggcttttgt tcagatgccg 240
gcccacggcc tattcccctg gtgcggcctg ctgctggata cccggaccct ggaggtgcag 300
agcgactact ccaggtgagc gcacctggcc ggaagtggag cctgtgcccg gctggggcag 360
gtgctgctgc agggccgttg cgtccacctc tgcttccgtg tggggcaggc gactgccaat 420
cccaaagggt cagaggccac ag 442
<210> 235
<211> 398
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 235
atcacgagat gtgtataaga gacaggctct gcacctccag ggtccgggta tccagcagca 60
ggccgcacca ggggaatagg ccgtgggccg gcatctgaac aaaagccgtg ccacccaggg 120
cctcgtcttc tacagggaag ttcaccactg tcttccgcaa gttcaccacg cagccatact 180
cagggacacc tcggaccagg gtcctaaggc agaggggcaa tgtcagcccc aggatgcggg 240
gccgtcaccc aggaggtaac ctgacaccct tgttaaatgc tttggaaaac cccagagaag 300
tggtgatttg gagcagggtg ctgggcctgg caggagctct gaggagcctg gacccagccc 360
tgctccagac ttcggggtgc tttccctgtc tcccgggc 398
<210> 236
<211> 573
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 236
atcacgagat gtgtataaga gacaggtttc aagtggtact tcttaaaaat ataaatatga 60
cttacataaa ttaactcagc ttcacatatt taaatattaa taaattaaaa ataattaaaa 120
tagtgtccta acgctcatac ttttagttct ccatagagaa caacataagt tctgtgccca 180
gtggacaggt ttctgaccag aagaaggaat gcccattaac aacaacaatc tgaggtgccc 240
atgctacatt tgccgaagag ccctcaggct ggactgcagg aactccttaa agctgcgcag 300
aatgagatga gttgtcatgt cctgcagcca ctggttctgt gcctgcagct tcgtcagcag 360
gctggcattt gtggttgggt caggggtggt tattgcatct agattctttg cctgaaggaa 420
aatgaaagta aaaaggattg tttaaatgtt gaataaatcc tttgcagtgg agggatgctc 480
tgggctatgg gatgatgttc aaatgtgaaa tgtggggtga atgagattaa ctggggtgcc 540
tgctctgagt aggacccttc catagcaaca aac 573
<210> 237
<211> 596
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 237
atcacgagat gtgtataaga gacaggagct gagatctcac cattacactc cagcctgggc 60
aacaagagtg aaactccgtc tcaaaaaaga taaataaagt aaaatggggt aagggaagat 120
tacgagacta atacacacta atactctgag gtgctcagta aacatatttg catggggtgt 180
ggccaccatc ttgatttgaa ttcccgttgt cccagcctta ggcccttcaa agcattggtc 240
agggaaaagg ggcacagacc ctctcactca tgtgatgtca tctctcctcc ctgcttctgt 300
ctcctacagc cacctgaagt ccaaaaaggg tcagtctacc tcccgccata aaaaactcat 360
gttcaagaca gaagggcctg actcagactg acattctcca cttcttgttc cccactgaca 420
gcctcccacc cccatctctc cctcccctgc cattttgggt tttgggtctt tgaacccttg 480
cttgcaatag gtgtgcgtca gaagcaccca ggacttccat ttgctttgtc ccggggctgc 540
actgaactag ttggcctgca ctggtgtttt gttgtgggga ggaggatggg gagtag 596
<210> 238
<211> 650
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 238
atcacgagat gtgtataaga gacagacctc ccagactaca ctgatagcca aagcttgatg 60
tccttggcca gggctgatct ccaaagcctc aggcccaagc agagtggcgg gcaggccggg 120
gtcagttggg cctctgtccc caaccctgca gcctgcaccc acccactcag gaagcccctg 180
ccctgccgtg agctctgtgg tgctttgcta cccacagctg ctcagggacg ctgcaccacc 240
ggctcccctc cctggccccg gaacgtcctg tctggcgggc cctacatcac aggaggaagg 300
ggcctgaacc cagggcctgg gcaggtggcg gtaccgacac tgtggccttg tttcctgcct 360
gcaggcttgg cgggggctcc gaggacgcca aggagatcat gcagcatcgc ttctttgccg 420
gtatcgtgtg gcagcacgtg tacgagaaga aggtgcggct gctccccgca tattcacgcg 480
cacgcatgct ccccacatat ccacactcac gcatgcacgt ggcacgctcg ccagatttcc 540
cacacactcg ccctcacctc aggagcctgc tgcagtcctg gtacaaggag ggccttgctg 600
caccaacctc agcgcctggt gctcagaggc tctggcactg ccgggttcca 650
<210> 239
<211> 597
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 239
atcacgagat gtgtataaga gacagtagcc aggcatggtg ccacacacct gtgctctcag 60
ctactcagga ggctgaggca ggaggatcgc ttgagcccag aaggtcaagg ttgcagtgaa 120
ccatgttcag gccgctgcac tccagcctgg gtgacagagc aagaccctgt ttataaatac 180
ataatgcttt ccaagtgatt aaaccgactc ccccctcacc ctgcccacca tggctccaaa 240
gaagcatttg tggagcacct tctgtgtgcc cctaggtact agatgcctgg acggggtcag 300
aaggaccctg acccaccttg aacttgttcc acacaggatg ccaggccaag gtggagcaag 360
cggtggagac agagccggag cccgagctgc gccagcagac cgagtggcag agcggccagc 420
gctgggaact ggcactgggt cgcttttggg attacctgcg ctgggtgcag acactgtctg 480
agcaggtgca ggaggagctg ctcagctccc aggtcaccca ggaactgagg tgagtgtccc 540
catcctggcc cttgaccctc ctggtgggcg gctatacctc cccaggtcca ggtttca 597
<210> 240
<211> 595
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 240
atcacgagat gtgtataaga gacagacaat ataaatattt ctttaaaaat atgtataagt 60
tagccattta tttgaggtaa gcctacactt tccaagaaat gatctggctc tgaaacaaag 120
gatattcaaa ctgcatagcc actttccatt attatttcaa aactaataca taaaatgttt 180
caagtggtac ttcttaaaaa tataaatatg acttacataa attaactcag cttcacatat 240
ttaaatatta ataaattaaa aataattaaa atagtgtcct aacgctcata cttttagttc 300
tccatagaga acaacataag ttctgtgccc agtggacagg tttctgacca gaagaaggaa 360
tgcccattaa caacaacaat ctgaggtgcc catgctacat ttgccgaaga gccctcaggc 420
tggactgcag gaactcctta aagctgcgca gaatgagatg agttgtcatg tcctgcagcc 480
actggttctg tgcctgcagc ttcgtcagca ggctggcatt tgtggttggg tcaggggtgg 540
ttattgcatc tagattcttt gcctgaagga aaatgaaagt aaaaaggatt gttta 595
<210> 241
<211> 602
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 241
atcacgagat gtgtataaga gacagcttca gctactttgg catttgattc agactcccca 60
tcatgtgagt catcagaacc taacagttca tcacttctgg aaaaccactc attaactttc 120
tgaatgctgc tatttagtgt tatccaagga acatcttcag tatctctagg attctctgag 180
catggcagtt tctgcttatt ccattctttt ctctcacaca ggggatcagc attcagatct 240
accttttttt ctgtgctggg agtccgccta tcattacatg tttccttact tccagcccat 300
ctgttatgtt ggctccttgc taagccaggc tgtttgcttt tattacagaa ttcagccttt 360
tctacattca ttctgtcttt agtgagtaat aaactgctgt tctcatgctg taatgagctg 420
gcatgagtat ttgtgccaca tggctccaca tgcaagtttg aaacagaact accctgatac 480
ttttctggat gcctctcagc tgcacgcttc tcagtggtgt tcaaatcatt attactgggt 540
tgatgatgtt cagtatttgt tacatccgtc tcagaaaatt cacaagcagc tgaaaatata 600
ca 602
<210> 242
<211> 541
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 242
atcacgagat gtgtataaga gacagcatcc tcctggcctc cccgagggcg tgccctccat 60
gccatgggaa gacatggggc cctggacact caccctaggc cagcccagga gccccagggg 120
aggcagcccc tcccacccag cagggcacag gcactcacag accctggggc tactaccccc 180
atctctccct ccccaggccc agccctggca gcgggtacta acctcgtttg tgcagccaac 240
cctccttcac aatagccacg tcgctcatgg tgcccgaggc tcccgcgacg ctcacgcgct 300
cctctcaggc tggcgctccc cgagcccagc tggcctggcc acagcctctg ggagaagcaa 360
aggaagctga atgtgaggcc acgcctggct aagggcagct cctcgccctg ggtgagccag 420
agacccactg cacgtgcctg ggggctccac ccgcacctgc cttcccaggt gggctgccat 480
ccctctaagc tctctgaccc ccatctgccc gcctgccttc cctctcccca aaacactcag 540
g 541
<210> 243
<211> 342
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 243
atcacgagat gtgtataaga gacagccctc ccacccagca gggcacaggc actcacagac 60
cctggggcta ctacccccat ctctccctcc ccaggcccag ccctggcagc gggtactaac 120
ctcgtttgtg cagccaaccc tccttcacaa tagccacgtc gctcatggtg cccgaggctc 180
ccgcgacgct cacgcgctcc tctcaggctg gcgctccccg agcccagctg gcctggccac 240
agcctctggg agaagcaaag gaagctgaat gtgaggccac gcctggctaa gggcagctcc 300
tcgccctggg tgagccagag acccactgca cgtgcctggg gg 342
<210> 244
<211> 727
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 244
atcacgagat gtgtataaga gacagagata ttttctcact aacatgttgg cactaacagc 60
agctcaacgc catctgaaca cataacatac tgaatcctaa ctattaacca ccttcatgct 120
cttgagaagg gggacaaggt atagtttttt tttgccatag gataacattt aggtgctgtt 180
ttgtttggag agtggtagag aaatagaata gcctctagaa catttcagca atctgaggaa 240
cccccatcgt gggatcttgc ttataatact ccactatgta agacaaaggc tggtgctgga 300
actctggggt tctcccaggc tcttacctgt gggcatgttg gtgaagggcc catagcaaca 360
gatttctagc cccctgaaga tctggaagaa gagaggaaga gagagggaca ggggaatgga 420
gagaaggaaa atctagttat aaaagaatat tggcttttat tcaaaaaaca gactttcaaa 480
aaggaagagc ttttcttttt cttctgttca ccacctgatg atttctgctg ctacttccca 540
gggacaagca gtccaatgtc cagaacacta caggatttca gaagatcttc ttgaagtgca 600
tatgtagttg acctgcactc tacaggcatt ctttgtcatt caaggactga gcatctcact 660
tttgtcacca atcaggccaa ggctcctccc taatgatctc tgcaggtgct ttaacttgtt 720
agatgca 727
<210> 245
<211> 365
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 245
atcacgagat gtgtataaga gacagactgg ccaatcacag gcaggaagat gaaggttctg 60
tgggctgcgt tgctggtcac attcctggca ggtatggggg cggggcttgc tcggttcccc 120
ccgctcctcc ccctctcatc ctcacctcaa cctcctggcc ccattcaggc agaccctggg 180
ccccctcttc tgaggcttct gtgctgcttc ctggctctga acagcgattt gacgctctct 240
gggcctcggt ttcccccatc cttgagatag gagttagaag ttgttttgtt gttgttgttt 300
gttgttgttg ttttgttttt ttgagatgaa gtctcgctct gtcgcccagg ctggagtgca 360
gtggc 365
<210> 246
<211> 435
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 246
atcacgagat gtgtataaga gacagcagct ggcccagccc gttttcagac acagctcggg 60
gtggctcttc tgagaggggc gctgtggtgg ggcgagtctg ccttcccgtt gacccagggc 120
cgtttctgtc gctggcccta agaaacagct cccgtaccgc gcctgccccc tgggactcag 180
gcatcccagg cacatctgtc ctggcacacc cagttcctgc ctggctgcct ggcgagggtc 240
tgacgggtag agtgtgcgtg gctctcacca cccgcacgtc tgtaggggag tacatcaaga 300
cctggcggcc acgctacttc ctcctcaaga atgatggcac cttcattggc tacaaggagc 360
ggccgcagga tgtggaccaa cgtgaggctc ccctcaacaa cttctctgtg gcgcgtaagt 420
atccccttgg cctct 435
<210> 247
<211> 495
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 247
atcacgagat gtgtataaga gacagtgtcc gaatggtgca ggtccagggt gaggtcgcca 60
ggcccttggt gggctggatg tgccgtgtcc ggatggtgca ggtctggggt gaggtcgcca 120
ggcccttggt gagctggatg tgcggtgtcc ggatggtgca ggtccggggt gaggtcacca 180
ggccctcggt gatctggatg tggcatgtcc ttctcgttta aggggttggc tgtgttccgg 240
ccgcagagca ccgtctgcgt gaggagatcc tggccaagtt cctgcactgg ctgatgagtg 300
tgtacgtcgt cgagctgctc aggtctttct tttatgtcac ggagaccacg tttcaaaaga 360
acaggctctt tttctaccgg aagagtgtct ggagcaagtt gcaaagcatt ggaatcaggt 420
actgtatccc cacgccaggc ctctgcttct cgaagtcctg gaacaccagc ccggcctcag 480
catgcgccag tctct 495
<210> 248
<211> 449
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 248
atcacgagat gtgtataaga gacagatgcc atgggaagac atggggccct ggacactcac 60
cctaggccag cccaggagcc ccaggggagg cagcccctcc cacccagcag ggcacaggca 120
ctcacagacc ctggggctac tacccccatc tctccctccc caggcccagc cctggcagcg 180
ggtactaacc tcgtttgtgc agccaaccct ccttcacaat agccacgtcg ctcatggtgc 240
ccgaggctcc cgcgacgctc acgcgctcct ctcaggctgg cgctccccga gcccagctgg 300
cctggccaca gcctctggga gaagcaaagg aagctgaatg tgaggccacg cctggctaag 360
ggcagctcct cgccctgggt gagccagaga cccactgcac gtgcctgggg gctccacccg 420
cacctgcctt cccaggtggg ctgccatcc 449
<210> 249
<211> 506
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 249
atcacgagat gtgtataaga gacagtcact ctttcttggc gactctaggt gaacagcctc 60
cagacggtgt gcaccaacat ctacaagatc ctcctgctgc aggcgtacag gtgagccgcc 120
accaaggggt gcaggcccag cctccaggga ccctccgcgc tctgctcacc tctgacccgg 180
ggcttcacct tggaactcct gggttttagg ggcaaggaat gtcttacgtt ttcagtggtg 240
ctgctgcctg tgcacagttc tgttcgcgtg gctctgtgca aagcacctgt tctccatctc 300
tgggtagtgg taggagccgg tgtggcccca ggtgtcccca ctgtgcctgt gcactggccg 360
tgggacgtca tggaggccat cccagggcag caggggcatg gggtaaagag atgtttatgg 420
ggagtcttag cagaggaggc tgggaaggtg tctgaacagt agatgggaga tcagatgccc 480
ggaggatttg gggtctcagc aaagag 506
<210> 250
<211> 562
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 250
atcacgagat gtgtataaga gacagaccta actttattgg tctttttaat tcttaacaga 60
gaccagaact ttgtaattca acattcatcg ttgtgtaaat taaacttctc ccattccttt 120
cagagggaac cccttacctg gaatctggaa tcagcctctt ctctgatgac cctgaatctg 180
atccttctga agacagagcc ccagagtcag ctcgtgttgg caacatacca tcttcaacct 240
ctgcattgaa agttccccaa ttgaaagttg cagaatctgc ccagagtcca gctgctgctc 300
atactactga tactgctggg tataatgcaa tggaagaaag tgtgagcagg gagaagccag 360
aattgacagc ttcaacagaa agggtcaaca aaagaatgtc catggtggtg tctggcctga 420
ccccagaaga atttgtgagt gtatccatat gtatctccct aatgactaag acttaacaac 480
attctgaaaa gagttttatg taggtattgt caattaataa cctagaggaa gaaatctaga 540
aaacaatcac agttctgtgt aa 562
<210> 251
<211> 502
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 251
atcacgagat gtgtataaga gacagtggat ttgacacttg gcagccctga gtgttttggg 60
gagagggaag gcaggcgggc agatgggggt cagagagctt agagggatgg cagcccacct 120
gggaaggcag gtgcgggtgg agcccccagg cacgtgcagt gggtctctgg ctcacccagg 180
gcgaggagct gcccttagcc aggcgtggcc tcacattcag cttcctttgc ttctcccaga 240
ggctgtggcc aggccagctg ggctcgggga gcgccagcct gagaggagcg cgtgagcgtc 300
gcgggagcct cgggcaccat gagcgacgtg gctattgtga aggagggttg gctgcacaaa 360
cgaggttagt acccgctgcc agggctgggc ctggggaggg agagatgggg gtagtagccc 420
cagggtctgt gagtgcctgt gccctgctgg gtgggagggg ctgcctcccc tggggctcct 480
gggctggcct agggtgagtg tc 502
<210> 252
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 252
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagcaccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 253
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 253
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc cattcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 254
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 254
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctacc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 255
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 255
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 256
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 256
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 257
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 257
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga cccctcccgg gtccccggcc cagccccctc tgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 258
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 258
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccccc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 259
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 259
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 260
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 260
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt acagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 261
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 261
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc ccggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 262
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 262
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 263
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 263
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttaacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 264
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 264
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 265
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 265
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgac ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 266
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 266
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 267
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 267
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 268
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 268
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc ggggccctcc cagcccctcc 180
cctacctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 269
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 269
agtggattcg cgggcacaga cgcccaggtc cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc caccccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 270
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 270
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235
<210> 271
<211> 235
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 271
agtggattcg cgggcacaga cgcccaggac cgcgctcccc acgtggcgga gggactgggg 60
acccgggcac ccgtcctgcc ccttcacctt ccagctccgc ctcctccgcg cggaccccgc 120
cccgtcccga ccccttccgg gtccccggcc cagccccctc cgggccctcc cagcccctcc 180
ccttcctttc cgcggccccg ccctctcctc gcggcgcgag tttcaggcag cgctg 235

Claims (8)

1.一种CRISPR辅助DNA靶向富集方法,其特征在于,将CRISPR系统与DNA文库或混合物进行反应,靶向富集并分离目标DNA,用于目标DNA的序列分析,其中所述CRISPR系统为CRISPR蛋白与其引导sgRNA形成的可与目标DNA序列结合的复合物,所述与目标DNA序列结合的复合物为无核酸酶活性的Cas9蛋白与sgRNA结合形成的复合物dCas9-sgRNA,其中与dCas9蛋白结合的sgRNA的3' 末端带有一段捕获序列,该捕获序列能够引导DNA-dCas9-sgRNA复合物被捕获。
2.根据权利要求1所述的CRISPR辅助DNA靶向富集方法,其特征在于,所述dCas9蛋白包括常规dCas9蛋白以及经过其他改造过程形成的各种dCas9蛋白。
3.根据权利要求1所述的CRISPR辅助DNA靶向富集方法,其特征在于,所形成的DNA-dCas9-sgRNA复合物可被表面固定捕获寡核苷酸的固相介质捕获。
4.根据权利要求3所述的CRISPR辅助DNA靶向富集方法,其特征在于,所述固相介质为磁珠,所述磁珠表面固定的捕获寡核苷酸为一种单链寡核苷酸,其序列与sgRNA 的3'末端的捕获序列互补,即磁珠表面固定的捕获寡核苷酸可与sgRNA的捕获序列退火杂交。
5.根据权利要求4所述的CRISPR辅助DNA靶向富集方法,其特征在于,所述磁珠表面固定的捕获寡核苷酸与sgRNA捕获序列的退火杂交,是一种常温下可快速发生的核酸杂交反应,借助磁珠表面固定的捕获寡核苷酸与sgRNA捕获序列的退火杂交,可将DNA-dCas9-sgRNA复合物捕获到磁珠表面。
6.根据权利要求5所述的CRISPR辅助DNA靶向富集方法,其特征在于,捕获到磁珠表面的DNA-dCas9-sgRNA复合物可借助磁分离技术将dCas9-sgRNA结合的目标DNA从DNA文库或混合物中简单快速分离出来。
7.根据权利要求6所述的CRISPR辅助DNA靶向富集方法,其特征在于,磁珠捕获的DNA-dCas9-sgRNA复合物中的DNA,可借助各种DNA纯化技术进行纯化,纯化后的DNA可通过测序技术进行分析,解读其序列信息。
8.一种权利要求1所述的CRISPR辅助DNA靶向富集方法在制备DNA检测、诊断及治疗试剂中的应用。
CN201811082353.5A 2018-09-17 2018-09-17 一种crispr辅助dna靶向富集方法及其应用 Active CN109837273B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811082353.5A CN109837273B (zh) 2018-09-17 2018-09-17 一种crispr辅助dna靶向富集方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811082353.5A CN109837273B (zh) 2018-09-17 2018-09-17 一种crispr辅助dna靶向富集方法及其应用

Publications (2)

Publication Number Publication Date
CN109837273A CN109837273A (zh) 2019-06-04
CN109837273B true CN109837273B (zh) 2021-06-29

Family

ID=66883056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811082353.5A Active CN109837273B (zh) 2018-09-17 2018-09-17 一种crispr辅助dna靶向富集方法及其应用

Country Status (1)

Country Link
CN (1) CN109837273B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110205318A (zh) * 2019-05-15 2019-09-06 杭州杰毅生物技术有限公司 基于CRISPR-Cas去除宿主基因组DNA的宏基因组提取方法
CN112301101A (zh) * 2019-07-24 2021-02-02 上海吐露港生物科技有限公司 Crispr多靶标检测方法及其试剂盒
CN111471745B (zh) * 2020-03-30 2021-09-07 华中农业大学 基于CRISPR/Cas9系统介导的DNA靶向捕获方法
CN111575351B (zh) * 2020-04-26 2021-06-18 东南大学 一种基于CRISPR/Cas9的DNA检测方法及其应用
CN112501353B (zh) * 2020-12-09 2023-01-06 四川大学华西医院 一种检测新冠病毒及其突变体的试剂盒
CN113106144A (zh) * 2020-12-30 2021-07-13 中南大学湘雅二医院 Dna片段靶向富集方法及其在基因组靶向测序中的应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107109401A (zh) * 2014-07-21 2017-08-29 亿明达股份有限公司 使用crispr‑cas系统的多核苷酸富集
CN108138176A (zh) * 2015-08-19 2018-06-08 阿克生物公司 使用基于核酸引导的核酸酶的系统捕获核酸

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9873907B2 (en) * 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107109401A (zh) * 2014-07-21 2017-08-29 亿明达股份有限公司 使用crispr‑cas系统的多核苷酸富集
CN108138176A (zh) * 2015-08-19 2018-06-08 阿克生物公司 使用基于核酸引导的核酸酶的系统捕获核酸

Also Published As

Publication number Publication date
CN109837273A (zh) 2019-06-04

Similar Documents

Publication Publication Date Title
CN109837273B (zh) 一种crispr辅助dna靶向富集方法及其应用
CN113166797B (zh) 基于核酸酶的rna耗尽
AU2022203184A1 (en) Sequencing controls
US20190153535A1 (en) Varietal counting of nucleic acids for obtaining genomic copy number information
EP3169808B1 (en) Trio:tert fusion in cancer
EP3132054B1 (en) Met fusions
EP1761639B1 (en) Analysis of methylated nucleic acid
CN110628880B (zh) 一种同步使用信使rna与基因组dna模板检测基因变异的方法
CN110719957B (zh) 用于核酸靶向富集的方法和试剂盒
KR102354422B1 (ko) 대량 평행 서열분석을 위한 dna 라이브러리의 생성 방법 및 이를 위한 키트
KR20110004860A (ko) 비정상적인 미토콘드리아 dna, 그것에 연관된 융합 트랜스크립트 및 혼성화 프로브
CN110241183B (zh) 一种fgfr融合基因的检测方法、试剂盒以及探针库
CN110628894A (zh) 用于帕金森病基因突变检测的靶向捕获测序试剂盒及其应用
JP2020536525A (ja) プローブ及びこれをハイスループットシーケンシングに適用するターゲット領域の濃縮方法
WO2020219759A1 (en) Methods and compositions for enrichment of target nucleic acids
CN114891859A (zh) 一种液相杂交捕获方法及其试剂盒
Tosi et al. Long-adapter single-strand oligonucleotide probes for the massively multiplexed cloning of kilobase genome regions
CN112391466A (zh) 用于检测乳腺癌的甲基化生物标记物或其组合和应用
CN110387400B (zh) 一种同时捕获基因组目标区域正反义双链的平行液相杂交捕获方法
KR20220130591A (ko) 희석 또는 비-정제된 샘플에서 핵산의 정확한 병렬 정량분석 방법
KR20220130592A (ko) 핵산의 정확한 병렬 정량분석을 위한 고감도 방법
CN111534858A (zh) 用于高通量测序的文库构建方法及高通量测序方法
Xu et al. CRISPR-assisted targeted enrichment-sequencing (CATE-seq)
US11268087B2 (en) Isolation and immobilization of nucleic acids and uses thereof
CN117305466B (zh) 一种能够识别单碱基甲基化状态的检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant