CN112266948A - 一种高通量靶向建库的方法和应用 - Google Patents

一种高通量靶向建库的方法和应用 Download PDF

Info

Publication number
CN112266948A
CN112266948A CN202011229857.2A CN202011229857A CN112266948A CN 112266948 A CN112266948 A CN 112266948A CN 202011229857 A CN202011229857 A CN 202011229857A CN 112266948 A CN112266948 A CN 112266948A
Authority
CN
China
Prior art keywords
sequencing
probe
targeted
target
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011229857.2A
Other languages
English (en)
Inventor
尹东
张寅�
汪单兰
黄泳欣
张静源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen Memorial Hospital Sun Yat Sen University
Original Assignee
Sun Yat Sen Memorial Hospital Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen Memorial Hospital Sun Yat Sen University filed Critical Sun Yat Sen Memorial Hospital Sun Yat Sen University
Priority to CN202011229857.2A priority Critical patent/CN112266948A/zh
Publication of CN112266948A publication Critical patent/CN112266948A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开一种高通量靶向建库的方法和应用。本发明的方法包括如下步骤:基于检测的基因设计并合成靶向捕获探针和PCR扩增引物;将样本基因组DNA和靶向捕获探针杂交过夜,得到捕获的目的片段,环化,酶切,纯化,PCR扩增,得到构建的靶向测序文库;靶向测序文库纯化,检测文库DNA片段浓度和大小,二代测序,根据测序结果分析靶向测序文库的质量和测序信息。本发明能够在一轮PCR反应中扩增上百个检测基因,解决了多重PCR建库只能检测少量基因位点、实验条件难优化的不足;只有一轮PCR,且探针骨架上有随机barcode,减少PCR偏倚,能够区别PCR和测序引入的碱基错误;简化了建库步骤,减少了试剂和时间成本。

Description

一种高通量靶向建库的方法和应用
技术领域
本发明涉及测序检测技术领域,特别涉及一种高通量靶向建库的方法和应用。
背景技术
新一代测序在分子检测中得到越来越多的认同和应用;可以分为靶向测序,全转录组测序和全基因组测序。靶向测序是获取疾病相关基因信息高效可行的方法,但由于关键环节受限于现有的方法,费用仍然较为昂贵,且存在操作繁琐和灵敏度不高等不足。靶向建库是基因靶向测序的关键环节,目前国内外测序靶向建库方法主要采用多重PCR或探针捕获的方法。多重PCR建库实验条件摸索难度较大,且存在检测基因数目较少,无法去除PCR偏倚,检测方法灵敏度不高等缺点。探针捕获建库的方法需要合成特制的探针,成本高昂。这两种技术价格昂贵,也无法根据实际需求而快速灵活地应用。发明人整合上述两种方法,并对诸多技术点进行改进,提出一种反转探针捕获PCR的建库方法。反转探针捕获PCR建库方法利用常规分子试剂即可完成建库,大大降低实验条件摸索的难度,降低成本,提高灵敏度。该方法有望应用于药物代谢基因、疾病相关基因和肿瘤突变基因检测等,具有良好的应用前景。
发明内容
本发明的首要目的在于克服现有技术的缺点与不足,提供一种高通量靶向建库的方法。
本发明的另一目的在于提供上述高通量靶向建库的方法的应用。
本发明的目的通过下述技术方案实现:一种高通量靶向建库的方法,包括如下步骤:
(1)基于检测的基因设计并合成靶向捕获探针;
步骤(1)所述的靶向捕获探针(MIP)的骨架为5'端测序引物ATCCGACGGTAGTGT和3'端测序引物CTTCAGCTTCCCGAT,靶向捕获探针的骨架两端分别为靶向目的基因位点两端的靶向片段,左右各15-30nt,目的基因片段长度为100-200nt。
步骤(1)所述的靶向捕获探针序列为:NNNNNCTTCAGCTTCCCGATATCCGACGGTAGTGTNNNNN;其中NNNNN分别为靶向目的基因位点两端的靶向片段。
步骤(1)所述的靶向捕获探针是用TE buffer(PH 8.0)溶解,将溶解后的探针混合,配置成探针混合液(probe mix),再将探针混合液中的探针5'端加磷酸基团得到的靶向捕获探针。
所述的探针混合液的总浓度为100uM,每个探针的浓度为总浓度除以探针数,探针混合液中每一种探针加入量为1uL。
步骤(1)所述的基因包括肿瘤治疗药物相关基因和药物代谢相关基因。
步骤(1)所述的靶向捕获探针的骨架匹配Illumina测序平台。
(2)将样本基因组DNA和步骤(1)所述的靶向捕获探针杂交过夜,得到捕获的目的片段,环化,酶切,纯化,PCR扩增,得到构建的靶向测序文库;
步骤(2)所述的基因组DNA提取的样本优选为石蜡标本和外周血白细胞。
步骤(2)所述的基因组DNA与靶向捕获探针按500ng:1~100pmol的比例混合;优选为按500ng:3pmol的比例混合。
步骤(2)中所述的杂交的反应体系:2.5uL 10×Ampligase buffer、500ng基因组DNA、终浓度为3pmol的靶向捕获探针,ddH2O补齐至22.5uL。
步骤(2)中所述的杂交的反应条件:95℃、10min,0.1℃/s缓慢降温至60℃后保持24h。
步骤(2)中所述的环化是将0.32uL Hemo KlenTaq酶、0.5uL 0.025mM dNTPs、1uLAmpligase加入杂交后的捕获产物中环化。
步骤(2)中所述的环化的反应条件为60℃、20h。
步骤(2)中所述的酶切是采用核酸外切酶ExoⅠ和ExoⅢ各2uL进行消化。
步骤(2)所述的PCR扩增的引物中,上游引物为:adaptor序列-barcode序列-间隔序列-连接序列-靶向捕获探针骨架5'测序引物的相同序列。
所述的barcode序列相当于样本的“身份证”,一个样本对应一个barcode,在引物合成之后即可获得这段序列。
所述的上游引物优选为:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAG-NNNNN-GAT-ACACGCACG-ATCCGACGGTAGTGT-3';所述NNNNN为barcode序列。
所述的adaptor序列匹配测序平台PGM。
步骤(2)所述的PCR扩增的引物中,下游引物为:测序平台的另一个adaptor序列和连接序列-靶向捕获探针骨架3'测序引物的反向互补序列。
所述的下游引物优选为:5'-TCCGCTTTCCTCTCTATGGGCAGTCGGTGATCATACGAGATCCGTA-ATCGGGAAGCTGAAG-3'。
所述的测序平台的另一个adaptor序列配测序平台PGM。
步骤(2)所述的PCR扩增得到的序列为:上游引物–NNNNN–捕获的目的基因序列–NNNNN–3'端测序引物;其中,捕获的目的基因序列为SNP位点,为100-200nt;NNNNN分别为靶向目的基因位点两端的靶向片段。
步骤(2)中所述的PCR扩增的反应体系:0.5uL Phusion酶、10uL 5×buffer、0.5uL10nM的dNTP、5uL模板、2.5nM的上下游引物各2uL,ddH2O补充至50uL。
步骤(2)中所述的PCR扩增的反应条件:98℃、3min;98℃、20s,60℃、30s,72℃、30s,一共35个循环;72℃、5min。
(3)将步骤(2)所述的靶向测序文库纯化,检测文库DNA片段浓度和大小,进行二代测序,根据测序结果分析判断靶向测序文库的质量和测序信息。
步骤(3)所述的纯化为采用VAHTS DNA Clean Beads磁珠进行纯化,用30uL的ddH2O回收。
一种用于上述高通量靶向建库的方法的试剂盒,包括上述高通量靶向建库的方法中所用的靶向捕获探针、PCR扩增引物、捕获和酶切目的片段的试剂、PCR扩增和纯化的试剂。
一种宏基因组测序方法,包括上述高通量靶向建库的方法和建库的产物,将其用于直接测序。
所述的测序的基因优选为药物代谢基因、疾病相关基因以及肿瘤突变基因。
本发明相对于现有技术具有如下的优点及效果:
(1)本发明能够在一轮PCR反应中靶向扩增一百多个检测基因,解决了现有多重PCR技术在同一PCR反应体系只能检测少量基因位点、实验条件难优化的问题。
(2)本发明在二代测序前只有一轮PCR反应,且探针骨架上有随机barcode,能够大大减少PCR造成的偏倚,能够识别PCR引入的碱基错误和测序引入的碱基错误。
(3)本发明简化了二代测序文库制备的操作步骤,减少了试剂和时间成本。
附图说明
图1是本发明的流程示意图。
图2是本发明的原理示意图。
图3是不同浓度比例探针捕获文库的琼脂糖凝胶图。
图4是KIT探针捕获文库的一代测序验证图。
图5是PIK3CA探针捕获文库的一代测序验证图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
1、探针的设计、合成和加磷酸基团
1.1设计探针
通过NCBI序列(https://www.ncbi.nlm.nih.gov/gene/),基于检测的基因位点设计靶向捕获探针(MIP)。探针骨架采用匹配Illumina测序平台的5’测序引物(ATCCGACGGTAGTGT)和3’端测序引物(CTTCAGCTTCCCGAT)各15nt,共30nt,探针两端分别为靶向目的基因位点两端的靶向片段,左右各15-30nt,目的基因片段长度为100-200nt,探针序列:
NNNNNCTTCAGCTTCCCGATATCCGACGGTAGTGTNNNNN;其中NNNNN为靶向目的基因位点两端的靶向片段。
所述的基因位点包括肿瘤治疗药物相关基因和药物代谢相关基因位点见表1,共设计16种探针,探针序列如SEQ ID NO.6~SEQ ID NO.21所示。
表1检测的目标基因
AKT APC CYP19A1 CYP2C19 CYP2D6 DPYD
EGFR KIT KRAS MET MTHFR PIK3CA
PTEN TP53 UGT1A1 CTNNB1
1.2在上海生工公司订购探针。
1.3合成的探针用TE buffer(PH 8.0)溶解,溶解后的探针浓度为100uM。
充分涡旋混匀配置成探针混合液。其中探针混合液(probe mix)总浓度为100uM,每个探针在混合液中的浓度为总浓度除以探针数,每一种探针加入的量都是1uL。
1.4按表2配置反应体系,在探针5’端加入一个磷酸基团。
表2
Figure BDA0002764821450000051
反应条件:37℃、45min,80℃、20min。
注意事项:引物溶解过程加样要准确,确保每一管引物的浓度都是100uM,并且充分混匀;配置probe mix的时候加样要准确,确保每一种探针加入的量都是1uL,以免造成引物浓度的不均匀。
1.5反应结束后把步骤1.4的探针混合液用去离子水稀释成不同的浓度。
2、DNA提取
2.1提取外周血白细胞的DNA(外周血白细胞来源于中山大学孙逸仙纪念医院,利用天根公司的血液/细胞/组织基因组DNA提取试剂盒(DP304),-20℃保存。提取具体步骤如下:
2.1.1使用EDTA抗凝的抗凝管采集外周血。
2.1.2取EDTA抗凝的血液,加入蛋白酶K溶液,混匀。
2.1.3再加入裂解液,充分颠倒混匀,70℃加热10分钟。溶液变清亮后简短离心去除EP管内壁的水珠。
2.1.4加无水乙醇,充分震荡混匀使DNA沉淀。
2.1.5将上一步的溶液和沉淀过吸附柱,离心后倒掉废液。
2.1.6向吸附柱内加入漂洗液,离心后倒掉废液。洗涤两次。
2.1.7倒掉废液后,再离心2分钟。将吸附柱打开盖子,室温静置几分钟至吸附材料晾干。
2.1.8将吸附柱转移至一个干净的离心管内,加入50μL TE缓冲液。室温放置3分钟后离心,将溶液收集至离心管内。
3、目的片段的捕获
3.1、将步骤1得到的5’端有磷酸基团的探针混合液与500ng步骤2得到的基因组DNA进行杂交过夜,捕获目的片段。反应体系见表3。设置对照:1、PCR NC:PCR的阴性对照,扩增模板为H2O;2、H2O组:指不同浓度探针进行捕获的时候,模板为H2O。
表3
Figure BDA0002764821450000061
反应条件:95度10min,0.1℃/s缓慢降温至60度后保持24小时。
捕获结束后,根据碱基互补配对原则,利用DNA聚合酶进行探针的环化,填补缺口。将表4的各物质加入捕获产物中。
表4
Figure BDA0002764821450000062
反应条件:60℃、20h。
注意事项:关于缓慢降温,如果没有实验条件,可以采用普通降温的方法,但是效果没有缓慢降温好。
4、外切酶消化及PCR反应
4.1、捕获产物用核酸外切酶ExoⅠ(M0293)和ExoⅢ(M0206)各2uL进行消化。
4.2、纯化消化产物,利用天根公司的通用型DNA纯化回收试剂盒(DP214)对酶切反应进行纯化。
4.3、PCR反应
4.3.1、PCR反应引入测序需要的adaptor和barcode序列。不同样品需要使用不同barcode的上游引物,可以使用同一条下游引物。
上游引物如下:
PGM-PCR-FW:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAG-CTAAGGTAAC-GAT-ACACGCACG-ATCCGACGGTAGTGT-3'(SEQ ID NO.22);
下游引物如下:
PGM_PCR_RV:5'-TCCGCTTTCCTCTCTATGGGCAGTCGGTGATCATACGAGATCCGTA-ATCGGGAAGCTGAAG-3'(SEQ ID NO.23)。
PCR扩增得到的序列为:
5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGCTAAGGTAACGATACACGCACGATCCGACGGTAGTGTNNNNNCTTCAGCTTCCCGAT-3';
其中,N为目的基因的SNP位点(100-200nt)以及目的基因位点两端的片段(各15-30nt)。
合成引物,将引物用TE buffer(PH 8.0)溶解,溶解后的引物充分涡旋混匀配置成引物混合液,总浓度为100uM。
4.3.2、PCR反应条件及体系如表5所示。
表5
Figure BDA0002764821450000071
反应条件:98度3min;98度20s,60度30s,72度30s,一共35个循环;72度5min。
5、纯化PCR反应产物
5.1、反应结束后,使用诺唯赞VAHTS DNA Clean Beads磁珠(N411),按照说明书,对建库PCR反应后的文库进行纯化,用30uL的ddH2O回收产物。
5.2、用Qubit进行DNA定量及DNA浓度质控。
5.2、安捷伦Agilent 2100生物分析仪检测文库片段的大小,进行DNA片段长度质控。
5.3、取文库进行TA克隆(TAKARA,6011),将克隆的菌落送一代测序验证是否捕获到目的片段。
6、二代测序
文库DNA浓度和片段长度质量控制均合格后,按测序试剂盒的说明书要求将文库混合制备成文库混合物进行二代测序,获取二代测序结果,根据二代测序结果分析判断所述的靶向测序文库的质量。
以上本发明建库的流程和原理见图1和图2。利用不同浓度的探针捕获的建库产物如图3所示。图3表明目的基因的捕获及建库步骤适用于不同的基因组DNA与靶向捕获探针比例,基因组DNA与靶向捕获探针按500ng:1~100pmol的比例混合,进行捕获及PCR扩增之后,PCR产物进行琼脂糖凝胶电泳。文库大小为300bp。PCR NC:PCR的阴性对照,扩增模板为H2O;H2O组:不同浓度探针进行捕获的时候,模板为H2O。图4和图5是KIT探针和PIK3CA探针捕获文库的一代测序验证图,表示建库成功并文库质量可行。发明人对构建的文库进行二代测序,结果证明设计靶向的位点的所有位置都很好地覆盖,而且不同区域间的覆盖度一致性良好,说明建库成功。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
序列表
<110> 中山大学孙逸仙纪念医院
<120> 一种高通量靶向建库的方法和应用
<160> 24
<170> SIPOSequenceListing 1.0
<210> 1
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 5’端测序引物
<400> 1
atccgacggt agtgt 15
<210> 2
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 3’端测序引物
<400> 2
cttcagcttc ccgat 15
<210> 3
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 靶向捕获探针序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (2)..(2)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (3)..(3)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (5)..(5)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (36)..(36)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (37)..(37)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (38)..(38)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (39)..(39)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (40)..(40)
<223> n is a, c, g, t or u
<400> 3
nnnnncttca gcttcccgat atccgacggt agtgtnnnnn 40
<210> 4
<211> 62
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 上游引物
<220>
<221> misc_feature
<222> (31)..(31)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (32)..(32)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (33)..(33)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (34)..(34)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (35)..(35)
<223> n is a, c, g, t or u
<400> 4
ccatctcatc cctgcgtgtc tccgactcag nnnnngatac acgcacgatc cgacggtagt 60
gt 62
<210> 5
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 下游引物
<400> 5
tccgctttcc tctctatggg cagtcggtga tcatacgaga tccgtaatcg ggaagctgaa 60
g 61
<210> 6
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AKT1_1_0021
<400> 6
gtactcccct acagacgtgc gggtggtgac ttcagcttcc cgatatccga cggtagtgtg 60
agaagttgtt gaggg 75
<210> 7
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> APC_1_0061
<400> 7
cgttctctct ccaaacttct atctttttcc ttcagcttcc cgatatccga cggtagtgtc 60
ttcttccatg acttt 75
<210> 8
<211> 74
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CYP19A1_1_0023
<400> 8
gccatgggcc actgagtgtt cactgtcttc agcttcccga tatccgacgg tagtgtctca 60
aactcttggc ctct 74
<210> 9
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CYP2C19_1_0016
<400> 9
tcgatggaca tcaacaaccc tcgggacttc ttcagcttcc cgatatccga cggtagtgtg 60
caataatttt cccac 75
<210> 10
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CYP2D6_1_0039
<400> 10
cagaacacac catactgctt cgaccaggtc ttcagcttcc cgatatccga cggtagtgtc 60
catcttcctg ctcct 75
<210> 11
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> DPYD_1_0004
<400> 11
gctcaatatt cagaaaggag ctttgtccac ttcagcttcc cgatatccga cggtagtgtc 60
ttatgccaat tctct 75
<210> 12
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> EGFR_1_0208
<400> 12
gaaatttaca gggtgagagg ctgggatgcc ttcagcttcc cgatatccga cggtagtgtt 60
ttggaaaacc tgcag 75
<210> 13
<211> 73
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> KIT_1_0051
<400> 13
gctgttatgc actgatccgg gctttgtctt cagcttcccg atatccgacg gtagtgtttc 60
tgtttttctt ggc 73
<210> 14
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> KRAS_1_0019
<400> 14
caagtttata ttcagtcatt ttcagcaggc ttcagcttcc cgatatccga cggtagtgtg 60
catattaaaa caaga 75
<210> 15
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> MET_1_0217
<400> 15
gtatgattgt ggggaaagac atgtcgctgc ttcagcttcc cgatatccga cggtagtgtt 60
tacagatgaa aggac 75
<210> 16
<211> 73
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> MTHFR_1_0002
<400> 16
gcaccgacat gggcatcact tgccccactt cagcttcccg atatccgacg gtagtgtggg 60
agctttgagg ctg 73
<210> 17
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> PIK3CA_1_0013
<400> 17
cgactttgtg accttcggct ttttcaaccc ttcagcttcc cgatatccga cggtagtgtt 60
taaagaagca agaaa 75
<210> 18
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> PTEN_1_0007
<400> 18
acttagactt gacctgtatc catttctgcc ttcagcttcc cgatatccga cggtagtgtg 60
cttctgccat ctctc 75
<210> 19
<211> 73
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> TP53_4_0004
<400> 19
gcaaaacatc ttgttgaggg caggggactt cagcttcccg atatccgacg gtagtgtctc 60
atggtggggg cag 73
<210> 20
<211> 75
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> UGT1A1_1_0037
<400> 20
gcaaaggcgc catggctgtg gagtcccact tcagcttccc gatatccgac ggtagtgtgt 60
ggactgacag ctttt 75
<210> 21
<211> 74
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CTNNB1_1_0144
<400> 21
ccattctggt gccactaccc ttcagcttcc cgatatccga cggtagtgtc tactaatgct 60
aatactgttt cgta 74
<210> 22
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> PGM_PCR_FW
<400> 22
ccatctcatc cctgcgtgtc tccgactcag ctaaggtaac gatacacgca cgatccgacg 60
gtagtgt 67
<210> 23
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> PGM_PCR_RV
<400> 23
tccgctttcc tctctatggg cagtcggtga tcatacgaga tccgtaatcg ggaagctgaa 60
g 61
<210> 24
<211> 87
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> PCR扩增得到的序列
<220>
<221> misc_feature
<222> (68)..(68)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (69)..(69)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (70)..(70)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (71)..(71)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (72)..(72)
<223> n is a, c, g, t or u
<400> 24
ccatctcatc cctgcgtgtc tccgactcag ctaaggtaac gatacacgca cgatccgacg 60
gtagtgtnnn nncttcagct tcccgat 87

Claims (10)

1.一种高通量靶向建库的方法,其特征在于包括如下步骤:
(1)基于检测的基因设计并合成靶向捕获探针;
(2)将样本基因组DNA和步骤(1)所述的靶向捕获探针杂交过夜,得到捕获的目的片段,环化,酶切,纯化,PCR扩增,得到构建的靶向测序文库;
(3)将步骤(2)所述的靶向测序文库纯化,检测文库DNA片段浓度和大小,进行二代测序,根据测序结果分析判断靶向测序文库的质量和测序信息。
2.根据权利要求1所述的高通量靶向建库的方法,其特征在于,
步骤(1)所述的靶向捕获探针的骨架为5'端测序引物ATCCGACGGTAGTGT和3'端测序引物CTTCAGCTTCCCGAT,靶向捕获探针的骨架两端分别为靶向目的基因位点两端的靶向片段,左右各15-30nt,目的基因片段长度为100-200nt;
步骤(1)所述的靶向捕获探针序列为:5'-NNNNNCTTCAGCTTCCCGATATCCGACGGTAGTGTNNNNN-3';其中,NNNNN分别为靶向目的基因位点两端的靶向片段;
步骤(2)所述的PCR扩增的引物中,上游引物为:adaptor序列-barcode序列-间隔序列-连接序列-靶向捕获探针骨架5'测序引物的相同序列;
步骤(2)所述的PCR扩增的引物中,下游引物为:测序平台的另一个adaptor序列和连接序列-靶向捕获探针骨架3’测序引物的反向互补序列;
步骤(2)所述的PCR扩增得到的序列为:上游引物–NNNNN–捕获的目的基因序列–NNNNN–3'端测序引物;其中,捕获的目的基因序列为SNP位点,为100-200nt;NNNNN分别为靶向目的基因位点两端的靶向片段。
3.根据权利要求2所述的高通量靶向建库的方法,其特征在于,
所述的上游引物为:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAG-NNNNN-GAT-ACACGCACG-ATCCGACGGTAGTGT-3';所述NNNNN为barcode序列;
所述的下游引物为:5'-TCCGCTTTCCTCTCTATGGGCAGTCGGTGATCATACGAGATCCGTA-ATCGGGAAGCTGAAG-3'。
4.根据权利要求1所述的高通量靶向建库的方法,其特征在于,
步骤(1)所述的靶向捕获探针是用TE buffer(PH 8.0)溶解,将溶解后的探针混合,配置成探针混合液,再将探针混合液中的探针5'端加磷酸基团得到的靶向捕获探针;
所述的探针混合液的总浓度为100uM,每个探针的浓度为总浓度除以探针数,探针混合液中每一种探针加入量为1uL。
5.根据权利要求1-3任一项所述的高通量靶向建库的方法,其特征在于,
步骤(1)所述的基因包括肿瘤治疗药物相关基因和药物代谢相关基因;
步骤(1)所述的靶向捕获探针的骨架匹配Illumina测序平台;
所述的adaptor序列匹配测序平台PGM;
所述的测序平台的另一个adaptor序列配测序平台PGM。
6.根据权利要求5所述的高通量靶向建库的方法,其特征在于,
步骤(2)所述的基因组DNA提取的样本为石蜡标本和外周血白细胞;
步骤(2)所述的基因组DNA与靶向捕获探针按500ng:1~100pmol的比例混合;
步骤(2)中所述的PCR扩增的反应体系:0.5uL Phusion酶、10uL 5×buffer、0.5uL10nM的dNTP、5uL模板、2.5nM的上下游引物各2uL,ddH2O补充至50uL;
步骤(2)中所述的PCR扩增的反应条件:98℃、3min;98℃、20s,60℃、30s,72℃、30s,一共35个循环;72℃、5min。
7.根据权利要求6所述的高通量靶向建库的方法,其特征在于,
步骤(2)中所述的杂交的反应条件:95℃、10min,0.1℃/s缓慢降温至60℃后保持24h;
步骤(2)中所述的环化是将0.32uL Hemo KlenTaq酶、0.5uL 0.025mM dNTPs、1uLAmpligase加入杂交后的捕获产物中环化;
步骤(2)中所述的环化的反应条件为60℃、20h;
步骤(3)所述的纯化为采用VAHTS DNA Clean Beads磁珠进行纯化,用30uL的ddH2O回收。
8.一种用于上述高通量靶向建库的方法的试剂盒,包括权利要求1-7任一项所述的高通量靶向建库的方法中所用的靶向捕获探针、PCR扩增引物、捕获和酶切目的片段的试剂、PCR扩增和纯化的试剂。
9.一种宏基因组测序方法,包括权利要求1-7任一项所述的高通量靶向建库的方法和建库的产物,将其用于直接测序。
10.根据权利要求9所述的宏基因组测序方法,其特征在于,所述的测序的基因为药物代谢基因、疾病相关基因以及肿瘤突变基因。
CN202011229857.2A 2020-11-06 2020-11-06 一种高通量靶向建库的方法和应用 Pending CN112266948A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011229857.2A CN112266948A (zh) 2020-11-06 2020-11-06 一种高通量靶向建库的方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011229857.2A CN112266948A (zh) 2020-11-06 2020-11-06 一种高通量靶向建库的方法和应用

Publications (1)

Publication Number Publication Date
CN112266948A true CN112266948A (zh) 2021-01-26

Family

ID=74344661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011229857.2A Pending CN112266948A (zh) 2020-11-06 2020-11-06 一种高通量靶向建库的方法和应用

Country Status (1)

Country Link
CN (1) CN112266948A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112941147A (zh) * 2021-03-02 2021-06-11 深圳市睿法生物科技有限公司 一种高保真靶标基因建库方法及其试剂盒
CN113658638A (zh) * 2021-08-20 2021-11-16 江苏先声医学诊断有限公司 一种基于ngs平台的同源重组缺陷的检测方法和质控体系
CN114085895A (zh) * 2021-11-30 2022-02-25 普瑞斯新(上海)生物医疗科技有限公司 快速检测msi的检测引物及其试剂盒
CN116515955A (zh) * 2023-06-20 2023-08-01 中国科学院海洋研究所 一种高效低成本的多基因靶向分型方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070065847A1 (en) * 2005-08-11 2007-03-22 Affymetrix, Inc. Degeneratively Labeled Probes
US20100069263A1 (en) * 2008-09-12 2010-03-18 Washington, University Of Sequence tag directed subassembly of short sequencing reads into long sequencing reads
CN107523640A (zh) * 2017-10-12 2017-12-29 厦门燕旭安生物科技有限公司 一种ctDNA精准测序的扩增子文库构建方法
CN108350500A (zh) * 2015-07-29 2018-07-31 普罗格尼迪公司 用于检测染色体异常的核酸和方法
CN108396057A (zh) * 2018-02-28 2018-08-14 重庆市肿瘤研究所 基于长链分子倒置探针的核酸靶向捕获测序文库制备方法
CN108517350A (zh) * 2018-04-09 2018-09-11 中国人民解放军陆军军医大学第附属医院 多种病原体靶向建库试剂盒
CN109252224A (zh) * 2017-07-14 2019-01-22 深圳华大基因股份有限公司 一种环状探针和基于环状探针捕获的测序文库构建方法
CN109486922A (zh) * 2017-09-08 2019-03-19 深圳华大基因股份有限公司 一种基于单引物探针捕获检测微生物目标序列的方法
CN110205365A (zh) * 2019-07-02 2019-09-06 中山大学孙逸仙纪念医院 一种高效研究rna相互作用组的高通量测序方法及其应用
CN110359096A (zh) * 2018-04-09 2019-10-22 深圳华大智造科技有限公司 一种利用生物样本直接构建靶向文库的方法
CN110392739A (zh) * 2017-03-20 2019-10-29 南洋理工大学 检测dna突变的测序方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070065847A1 (en) * 2005-08-11 2007-03-22 Affymetrix, Inc. Degeneratively Labeled Probes
US20100069263A1 (en) * 2008-09-12 2010-03-18 Washington, University Of Sequence tag directed subassembly of short sequencing reads into long sequencing reads
CN108350500A (zh) * 2015-07-29 2018-07-31 普罗格尼迪公司 用于检测染色体异常的核酸和方法
CN110392739A (zh) * 2017-03-20 2019-10-29 南洋理工大学 检测dna突变的测序方法
CN109252224A (zh) * 2017-07-14 2019-01-22 深圳华大基因股份有限公司 一种环状探针和基于环状探针捕获的测序文库构建方法
CN109486922A (zh) * 2017-09-08 2019-03-19 深圳华大基因股份有限公司 一种基于单引物探针捕获检测微生物目标序列的方法
CN107523640A (zh) * 2017-10-12 2017-12-29 厦门燕旭安生物科技有限公司 一种ctDNA精准测序的扩增子文库构建方法
CN108396057A (zh) * 2018-02-28 2018-08-14 重庆市肿瘤研究所 基于长链分子倒置探针的核酸靶向捕获测序文库制备方法
CN108517350A (zh) * 2018-04-09 2018-09-11 中国人民解放军陆军军医大学第附属医院 多种病原体靶向建库试剂盒
CN110359096A (zh) * 2018-04-09 2019-10-22 深圳华大智造科技有限公司 一种利用生物样本直接构建靶向文库的方法
CN110205365A (zh) * 2019-07-02 2019-09-06 中山大学孙逸仙纪念医院 一种高效研究rna相互作用组的高通量测序方法及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MARC VENDRELL等: "Combinatorial Strategies in Fluorescent Probe Development", 《CHEM REV》, vol. 112, no. 8, pages 4391 - 4420 *
MATTHIAS MEYER等: "Illumina Sequencing Library Preparatio for Highly Multiplexed Target Capture and Sequencing", 《COLD SPRING HARB PROTOC》, pages 1 - 5 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112941147A (zh) * 2021-03-02 2021-06-11 深圳市睿法生物科技有限公司 一种高保真靶标基因建库方法及其试剂盒
CN112941147B (zh) * 2021-03-02 2024-06-04 深圳市睿法生物科技有限公司 一种高保真靶标基因建库方法及其试剂盒
CN113658638A (zh) * 2021-08-20 2021-11-16 江苏先声医学诊断有限公司 一种基于ngs平台的同源重组缺陷的检测方法和质控体系
CN114085895A (zh) * 2021-11-30 2022-02-25 普瑞斯新(上海)生物医疗科技有限公司 快速检测msi的检测引物及其试剂盒
CN114085895B (zh) * 2021-11-30 2023-10-10 普瑞斯新(上海)生物医疗科技有限公司 快速检测msi的检测引物及其试剂盒
CN116515955A (zh) * 2023-06-20 2023-08-01 中国科学院海洋研究所 一种高效低成本的多基因靶向分型方法
CN116515955B (zh) * 2023-06-20 2023-11-17 中国科学院海洋研究所 一种多基因靶向分型方法

Similar Documents

Publication Publication Date Title
CN112266948A (zh) 一种高通量靶向建库的方法和应用
CN107858414B (zh) 一种高通量测序接头、其制备方法及其在超低频突变检测中的应用
CN105861710B (zh) 测序接头、其制备方法及其在超低频变异检测中的应用
CN110114472A (zh) 将线性测序文库转换为环状测序文库的方法
WO2016049878A1 (zh) 一种基于snp分型的亲子鉴定方法及应用
WO2018184495A1 (zh) 一步法构建扩增子文库的方法
CN107236729A (zh) 一种基于探针捕获富集的快速构建靶核酸测序文库的方法和试剂盒
CN108517567B (zh) 用于cfDNA建库的接头、引物组、试剂盒和建库方法
CN108103164B (zh) 一种利用多重荧光竞争性pcr检测拷贝数变异的方法
CN109477245A (zh) 生成用于大规模平行测序的dna文库的方法和试剂盒
CN102839168A (zh) 核酸探针及其制备方法和应用
CN107893109A (zh) 一种基于移除野生型序列的低丰度基因突变富集方法
CN111647953A (zh) 用于检测地中海贫血基因突变的高通量文库构建试剂盒及文库构建方法
CN111269909A (zh) 一种转录组建库的方法、试剂和应用
CN116445581A (zh) 少突胶质细胞瘤相关基因高通量扩增子文库的制备方法、多重pcr引物对及应用
CN115715323A (zh) 一种高兼容性的PCR-free建库和测序方法
WO2022007863A1 (zh) 一种靶基因区域快速富集方法
CN114015749A (zh) 一种基于高通量测序的线粒体基因组测序文库的构建方法及扩增引物
CN113667714B (zh) 一种目标区域捕获方法、试剂盒及测序方法
CN112259165A (zh) 用于检测微卫星不稳定性状态的方法及系统
CN112195238A (zh) 一种扩增pkd1基因的引物组及试剂盒
CN113215663B (zh) 一种基于高通量测序的胃癌靶向治疗基因组文库的构建方法及引物
CN114277114A (zh) 一种扩增子测序添加唯一性标识符的方法及应用
CN110225979B (zh) 基于滚环扩增的基因组目标区域富集方法及其应用
CN107904297B (zh) 用于微生物多样性研究的引物组、接头组和测序方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination