CN114250269A - 一种探针组合物、基于该探针组合物的二代测序文库及其应用 - Google Patents
一种探针组合物、基于该探针组合物的二代测序文库及其应用 Download PDFInfo
- Publication number
- CN114250269A CN114250269A CN202111633522.1A CN202111633522A CN114250269A CN 114250269 A CN114250269 A CN 114250269A CN 202111633522 A CN202111633522 A CN 202111633522A CN 114250269 A CN114250269 A CN 114250269A
- Authority
- CN
- China
- Prior art keywords
- probe
- nucleic acid
- target nucleic
- acid sequence
- blocking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000523 sample Substances 0.000 title claims abstract description 119
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 37
- 239000000203 mixture Substances 0.000 title claims abstract description 32
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 46
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 37
- 230000000903 blocking effect Effects 0.000 claims abstract description 24
- 238000010276 construction Methods 0.000 claims abstract description 11
- 239000011324 bead Substances 0.000 claims description 30
- 238000000034 method Methods 0.000 claims description 25
- 238000009396 hybridization Methods 0.000 claims description 23
- 238000006243 chemical reaction Methods 0.000 claims description 19
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 14
- 210000002381 plasma Anatomy 0.000 claims description 14
- 239000012634 fragment Substances 0.000 claims description 12
- 108010090804 Streptavidin Proteins 0.000 claims description 7
- 229960002685 biotin Drugs 0.000 claims description 7
- 235000020958 biotin Nutrition 0.000 claims description 7
- 239000011616 biotin Substances 0.000 claims description 7
- 238000011528 liquid biopsy Methods 0.000 claims description 7
- 230000008439 repair process Effects 0.000 claims description 6
- 239000003153 chemical reaction reagent Substances 0.000 claims description 5
- 108020004414 DNA Proteins 0.000 claims description 4
- 239000003623 enhancer Substances 0.000 claims description 4
- 238000012408 PCR amplification Methods 0.000 claims description 3
- 238000001574 biopsy Methods 0.000 claims description 3
- 210000003296 saliva Anatomy 0.000 claims description 3
- 210000002700 urine Anatomy 0.000 claims description 3
- 206010003445 Ascites Diseases 0.000 claims description 2
- 210000004910 pleural fluid Anatomy 0.000 claims description 2
- 210000000582 semen Anatomy 0.000 claims description 2
- 210000002966 serum Anatomy 0.000 claims description 2
- 210000004243 sweat Anatomy 0.000 claims description 2
- 210000003608 fece Anatomy 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 19
- 238000005516 engineering process Methods 0.000 abstract description 13
- 108090000623 proteins and genes Proteins 0.000 abstract description 9
- 108020004707 nucleic acids Proteins 0.000 abstract description 6
- 102000039446 nucleic acids Human genes 0.000 abstract description 6
- 230000035945 sensitivity Effects 0.000 abstract description 6
- 230000007614 genetic variation Effects 0.000 abstract description 2
- 239000006228 supernatant Substances 0.000 description 23
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 18
- 239000000243 solution Substances 0.000 description 17
- 239000007788 liquid Substances 0.000 description 14
- 238000005119 centrifugation Methods 0.000 description 10
- 238000002156 mixing Methods 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 238000007847 digital PCR Methods 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- 239000011534 wash buffer Substances 0.000 description 5
- 108091092584 GDNA Proteins 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 238000007664 blowing Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000001035 drying Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 230000036438 mutation frequency Effects 0.000 description 3
- 239000002102 nanobead Substances 0.000 description 3
- 102200048955 rs121434569 Human genes 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 230000017531 blood circulation Effects 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 2
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 102200007373 rs17851045 Human genes 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000001179 sorption measurement Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N Betaine Natural products C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- KWIUHFFTVRNATP-UHFFFAOYSA-O N,N,N-trimethylglycinium Chemical compound C[N+](C)(C)CC(O)=O KWIUHFFTVRNATP-UHFFFAOYSA-O 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 208000030852 Parasitic disease Diseases 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000007605 air drying Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 229960003237 betaine Drugs 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012631 diagnostic technique Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002346 musculoskeletal system Anatomy 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6832—Enhancement of hybridisation reaction
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种探针组合物、基于该探针组合物的二代测序文库及其应用,属于基因检测技术领域。本发明提供的探针组合物,用于检测靶核酸序列相对于非靶核酸序列的变异,包括阻滞探针和捕获探针,阻滞探针和捕获探针针对非靶核酸序列和靶核酸序列的差异序列进行设计;阻滞探针和非靶核酸序列结合的吉布斯自由能与捕获探针和非靶核酸序列结合的吉布斯自由能之差ΔG非 阻滞‑捕获为‑9.5~‑0.5kcal/mol;捕获探针和靶核酸序列结合的吉布斯自由能与阻滞探针和靶核酸序列结合的吉布斯自由能之差ΔG靶 捕获‑阻滞为‑8.5~‑0.5kcal/mol。本发明的探针组合物基于选择性靶向富集技术,并提供了一种高灵敏检测低频基因变异的高通量文库的构建方法,能够检测核酸样本中低至0.1%的变异。
Description
技术领域
本发明涉及基因检测技术领域,尤其涉及一种探针组合物、基于该探针组合物的二代测序文库及其应用。
背景技术
液体活检是以血液等非固态生物组织为标本进行取样和分析的体外诊断技术。液体活检中的“液体”以血液为主,也包括粪便、尿液、唾液以及其他体液样品。液体活检最主要的应用场景是早起筛查、诊断、用药指导、监测、预后管理,以及无创产前检测,除此之外还包括肌肉骨骼系统和结缔组织疾病、传染病和寄生虫病等其他疾病。根据检测物的不同,液体活检技术已发展出几个分支,其中,cfDNA/ctDNA技术是一种常见的液体活检技术。游离DNA(cfDNA)是游离于血液循环系统中的来自细胞的DNA片段,主要来自于细胞凋亡进程中片段化的DNA、坏死细胞的DNA碎片、细胞分泌的外泌体。cfDNA中最重要的一类是循环肿瘤DNA(ctDNA),ctDNA是进入血液循环系统中的来自肿瘤基因组的DNA片段,携带了突变、插入、缺失、重排、拷贝数异常和/或甲基化等信息,通常在cfDNA中的占比小于1%。
利用高通量测序(NGS,也叫二代测序)技术对ctDNA进行检测的液体活检技术,有望改变肿瘤的诊断和治疗。NGS可以一次性对成千上万个位点进行测序,可以应用到肿瘤筛查,靶向用药选择,耐药鉴定,治疗效果评估等方面。不过受制于测序文库构建流程和测序平台,NGS技术的检测下限一般在2%。基于唯一分子标签(UMI)的文库构建方法可以提高NGS的检测灵敏度至0.1%,但是这通常需要25000X以上的超高测序深度,限制了NGS在检测低于1%的低频变异场景的应用。低频基因变异检测技术除了UMI-NGS外,目前最常用的方法还包括等位基因阻滞扩增系统(ARMS)和数字PCR技术。ARMS和数字PCR技术检测灵敏度可达0.1%,但是只能检测有限位点的变异,检测通量很难提高。因此,目前市场仍需寻找一种对测序深度要求不高,却能够检测低于1%的低频变异的高通量测序技术。
发明内容
为解决上述技术问题,本发明提供了一种基于选择性靶向富集技术的用于变异检测的探针组合物。
本发明的第一个目的是提供一种探针组合物,该探针组合物包括阻滞探针和捕获探针,用于检测靶核酸序列相对于非靶核酸序列的变异,靶核酸序列相对于非靶核酸序列至少存在一个碱基的变异,其中:
阻滞探针和捕获探针针对非靶核酸序列和靶核酸序列的差异序列进行设计;
上述阻滞探针和非靶核酸序列结合的吉布斯自由能(G阻滞)与捕获探针和非靶核酸序列结合的吉布斯自由能(G捕获)之差ΔG非 阻滞-捕获为-9.5~-0.5kcal/mol;捕获探针和靶核酸序列结合的吉布斯自由能与阻滞探针和靶核酸序列结合的吉布斯自由能之差ΔG靶 捕获-阻滞为-8.5~-0.5kcal/mol。
进一步地,ΔG非 阻滞-捕获可以是-9.5~-8.5kcal/mol,-8.5~-7.5kcal/mol,-7.5~-6.5kcal/mol,-6.5~-5.5kcal/mol,-5.5~-4.5kcal/mol,-4.5~-3.5kcal/mol,-3.5~-2.5kcal/mol,-2.5~-1.5kcal/mol,-1.5~-0.5kcal/mol。优选地,ΔG非 阻滞-捕获为-4.5~-2.5kcal/mol。
进一步地,ΔG靶 捕获-阻滞可以是-8.5~-7.5kcal/mol,-7.5~-6.5kcal/mol,-6.5~-5.5kcal/mol,-5.5~-4.5kcal/mol,-4.5~-3.5kcal/mol,-3.5~-2.5kcal/mol,-2.5~-1.5kcal/mol,-1.5~-0.5kcal/mol。优选地,ΔG靶 捕获-阻滞为-4.5~-2.5kcal/mol。
本发明的第二个目的是提供一种基于上述探针组合物的二代测序文库的构建方法,包括以下步骤:
(1)将样本DNA片段、阻滞探针和捕获探针进行杂交反应;
(2)对样本DNA片段中的靶核酸片段进行捕获,对捕获的DNA片段进行末端修复和接头(adapter)连接;
(3)对接头连接产物进行样本标签(index)PCR扩增,构建得到上述测序文库。
进一步地,样本DNA为gDNA样本或cfDNA样本,gDNA和cfDNA可以来源于血浆、血清、血液、尿液、汗液、唾液、精液、胸水、腹水、粪便、穿刺样本、石蜡包埋组织切片(FFPE)样本。因此,本发明的探针组合物可用于制备液体活检试剂或组织活检试剂。
进一步地,若样本DNA为gDNA样本,需对其进行基因组打断;若样本为cfDNA样本,由于cfDNA本身已经是自然降解的短片段,则不需要进行打断步骤。
进一步地,基因组打断的方法包括物理打断法和化学打断法,如Covaris超声打断、fragmentase酶切打断等。
进一步地,在步骤(1)中,进行杂交反应时,杂交反应体系中还包括杂交缓冲液和杂交增强剂,杂交增强剂包括二甲基亚砜、甜菜碱、尿素、甲酰胺或十二烷基硫酸钠中的至少一种。
进一步地,在步骤(2)中,上述捕获探针修饰有生物素(阻滞探针上不进行生物素标记),捕获探针与靶核酸序列杂交后,用修饰有链霉亲和素的磁珠进行亲和捕获。具体地,将链霉亲和素磁珠与杂交反应后的体系共孵育,经清洗、热洗脱和室温洗脱,最后通过高温加热分离链霉亲和素磁珠和被捕获的靶向DNA片段。
进一步地,进行index PCR扩增时,将接头连接产物与带有index序列的引物混合,进行PCR反应。index序列可用于区分不同的样本DNA。
进一步地,上述构建得到的测序文库应用于二代测序平台,测序深度为100X-1000X。
上述探针组合物中,样本DNA中的非靶核酸序列和靶核酸序列、阻滞探针、捕获探针同时进行杂交反应,本发明对其结合的吉布斯自由能进行优化,非靶核酸序列与阻滞探针结合,捕获探针与靶核酸序列结合。捕获探针上带有生物素标记,会与随后的链霉亲和素磁珠进行结合;而阻滞探针上没有生物素标记,非靶核酸序列会在磁珠分离过程中丢失。捕获的DNA片段进行末端修复&加A,接头连接以及index PCR形成最终的测序文库。
本发明具有以下优势:(1)提高了检测的灵敏度,可以检测低至0.1%的变异;(2)测序文库中靶核酸序列被富集,因此,变异检测时不需要高深度的测序,测序数据量也较小,适用于桌面型的测序平台;(3)与传统的杂交文库构建方法相比,本方法可以减少一次PCR,缩短了文库构建的时间,。同时,针对靶核酸序列富集的技术平台,现有技术大都采用定量PCR技术,每管检测的位点少,若想增加位点就需要分管进行检测,样本量的消耗增大,而肿瘤患者大量采血是比较困难的。而本发明属于NGS领域,每管可检测的位点从数百到数千,对样本量的要求更低;(4)在NGS领域,选择性杂交技术与多重扩增技术也存在位点数的巨大差异。多重扩增的位点数存在上限,多到一定程度,就难以优化反应条件来使所有位点都获得理想的检测效果;而本发明的选择性杂交技术可以轻松覆盖整个外显子组,可扩增性好,可在已有的panel中根据科学研究进展增加位点,而不降低产品性能。
借由上述方案,本发明至少具有以下优点:
本发明通过在杂交反应中引入阻滞探针,阻滞探针和捕获探针竞争性地与靶核酸序列/非靶核酸序列结合,根据热动力学差异对阻滞探针和捕获探针进行设计,使得非靶核酸序列与阻滞探针结合,靶核酸序列与捕获探针结合,最终的测序文库中靶核酸序列被富集。本发明的探针组合物或基于其构建的二代测序文库可用于检测低频变异,具有高灵敏度(可检测低至0.1%的变异)、高通量(可同时检测数千变异位点)的优势,对样本数据量要求低,且不依赖于高深度测序(平均测序深度约为1000X)。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合详细附图说明如后。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明。
图1为本发明的选择性靶向富集技术方案示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
实施例1
下面以非小细胞肺癌中的热点变异检测和Illumina高通量测序平台为例,结合具体实施例对本发明作进一步的详细说明。
一、探针的设计与合成
针对非小细胞肺癌相关基因变异位点中的热点,根据热动力学原理进行阻滞探针和捕获探针的设计与合成,其中捕获探针用生物素标记,阻滞探针不进行生物素标记。本发明实施例中涉及到的非小细胞肺癌相关基因的变异热点和对应探针编号见表1和表2。
表1非小细胞肺癌基因变异热点及对应探针的序号
表2探针序列信息
本实施例中的探针及技术方案可以应用到不同厂商生产的第二代测序平台,包括但不限于Illumina、ThermoFisher和BGI等。
二、待测样本准备
本发明实施例检测的样本包括4例已知基因变异频率的cfDNA标准品和20例基因变异未知的血浆样本。cfDNA标准品包含6个单碱基变异(SNV)、1个缺失和1个插入,共8个位点,其变异频率经数字PCR检验确认,分别为1%、0.5%、0.1%和0%,各重复检测3次。血浆样本同时采用STE技术和对照技术(ARMS PCR技术)进行基因检测。
血浆样本游离DNA提取的具体步骤如下:
1、将10mL新鲜采集的全血样本在4小时内进行血浆的分离,4℃1600g离心20min,将上清血浆转移至新的离心管。再于16000g离心10min,去除残留细胞,并将上清血浆转移至15mL离心管中。
2、往含有血浆的15mL离心管中依次加入160μL蛋白酶K和400μL样本裂解液,涡旋震荡混匀上述离心管,并于60℃孵育20min。
3、孵育的同时,在另一离心管中依次加入游离DNA裂解/结合液和纳米磁珠(每反应加入5mL游离DNA裂解/结合液和60μL纳米磁珠)制备合适反应体积的纳米磁珠结合溶液并混匀。
4、孵育结束后,将离心管平衡至室温,并将制备好的纳米磁珠结合溶液加入已经完成裂解的血浆样本中,颠倒10次混匀。
5、将离心管以1000rpm转速振荡10min后,置于磁力架上静置5min待管内溶液澄清。
6、小心弃掉上清,将离心管从磁力架上取下,加入1mL洗涤液,并涡旋震荡以重悬纳米磁珠。
7、将已重悬的纳米磁珠溶液转移入一个新的1.5mL离心管,并置于磁力架上静置2min待管内溶液澄清。
8、小心弃掉上清,将离心管从磁力架上取下,加入1mL洗涤液,并涡旋震荡以重悬纳米磁珠。短暂离心后,置于磁力架上静置2min待管内溶液澄清。
9、小心弃掉上清,将离心管从磁力架上取下,加入1mL新鲜制备的二次洗涤液,并涡旋震荡以重悬纳米磁珠。短暂离心后,置于磁力架上静置2min待管内溶液澄清。
10、小心弃掉上清包括管底部残余液体,将离心管置于磁力架上,开盖3min室温晾干。
11、将离心管从磁力架上取下,加入45μL洗脱液,充分震荡离心管以使纳米磁珠重悬,室温静置5min。
12、将离心管短暂离心后,置于磁力架上2min待管内溶液澄清,收集43μL上清(cfDNA)置于另一干净的离心管中保存。
13、取1μL cfDNA用Qubit试剂测定cfDNA的浓度。20例cfDNA样本的浓度测定结果如表3所示。
表3 20例血浆样本cfDNA浓度测定结果
三、文库构建和高通量测序
1、样本浓缩与杂交的步骤如下:
(1)取30ng cfDNA样本置于1.5mL低吸附离心管中并用0.1X TE补足至50μL,并加入7.5μL Human cotDNA和104μL Ampure XP Beads。涡旋混匀,25℃孵育10min。
(2)将离心管置于磁力架上5min至液体完全澄清,使用移液器移弃上清。
(3)沿离心管壁缓慢加入200μL新鲜配制的80%乙醇,静置30sec,使用移液器移弃上清。
(4)重复以上步骤一次。
(5)离心管置于磁力架上,使用10μL吸头移去少量残留乙醇,注意勿吸到磁珠。
(6)将磁珠置于室温干燥2-5min,至乙醇完全挥发。
(7)往离心管中依次加入9.5μL杂交缓冲液,3μL杂交增强剂,3μL捕获探针和3μL阻滞探针,充分混合均匀,室温孵育5min。
(8)将离心管置于磁力架上5min至液体完全澄清,使用移液器转移17μL上清至新的0.2mL PCR管中,瞬时离心,放进PCR仪中,启动如下PCR程序:95℃,30sec(DNA变性反应);65℃,16hrs(杂交反应);65℃,∞。
2、链霉亲和素磁珠捕获的步骤如下:
(1)提前30min取出streptavidin beads置于室温平衡,涡旋混匀,吸取50μL至1个1.5mL低吸附离心管中。
(2)向离心管中加入100μL Bead Wash Buffer,轻柔吹吸混匀10次,瞬时离心,置于磁力架上数分钟,待液体完全澄清,使用移液器移弃上清。将离心管从磁力架上移出。
(3)重复以上步骤2次。
(4)向离心管中加入17μL磁珠悬浮液,轻柔吹吸混匀,将离心管置于65℃孵育5min。
(5)待杂交反应结束后,将17μL重悬的链霉亲和素磁珠加入到杂交体系中,并用移液器轻柔吹吸混匀。
(6)65℃孵育45min,每15min轻柔吹吸混匀一次,确保磁珠完全重悬。
(7)孵育结束后,向PCR管中加入100μL 65℃Wash Buffer 1,吹吸混匀含有磁珠的杂交体系。
(8)将PCR管置于磁力架上30sec,待液体完全澄清后,使用移液器吸取移弃上清。
(9)将PCR管从磁力架上移出,加入150μL 65℃Wash Buffer2,轻柔吹吸混匀,放进PCR仪中孵育5min。
(10)重复步骤8和9一次。
(11)将PCR管瞬时离心后置于磁力架上1min,待液体完全澄清后吸取移弃上清,加入150μL室温Wash Buffer 1,涡旋混匀,室温孵育2min。
(12)将PCR管瞬时离心后置于磁力架上1min,待液体完全澄清后吸取移弃上清,加入150μL室温Wash Buffer 3,涡旋混匀,室温孵育2min。
(13)将PCR管瞬时离心后置于磁力架上1分钟,待液体完全澄清后吸取移弃上清,加入150μL室温Wash Buffer 4,涡旋混匀,室温孵育2min。
(14)将PCR管瞬时离心后置于磁力架上1min,待液体完全澄清后吸取移弃上清,之后换用10μL吸头移去少量残余缓冲液。
(15)将PCR管从磁力架上移出,加入42μL Nuclease Free Water,使用移液器轻柔吹吸10次,室温孵育5min。
(16)瞬时离心后,将PCR管置于PCR仪上95℃5min后,立即置于磁力架上30sec,待液体完全澄清后使用移液器转移40μL上清至新的0.2mL PCR管中。
3、末端修复和3’端加A的步骤如下:
(1)往含有样本的0.2mL PCR管中依次加入6μL End Repair&A-Tailing Buffer和4μL End Repair&A-tailing Enzyme,混合均匀,瞬时离心。
(2)将PCR管放入PCR仪,启动如下PCR程序:20℃,30min;65℃,30min;4℃,∞。
4、接头连接的步骤如下:
(1)待上一步反应结束,往PCR管中依次加入2μL Adapter,26μLLigation Buffer,2μL DNA Ligase,混合均匀,瞬时离心。
(2)将PCR管放入PCR仪,启动如下PCR程序:20℃,15min;4℃,∞。
5、连接产物纯化的步骤如下:
(1)待上一步反应结束,往PCR管中加入40μL提前平衡至室温的Ampure XP Beads,混合均匀,25℃孵育5min。
(2)将PCR管瞬时离心后放置于磁力架上5分钟min至液体完全澄清,使用移液器吸取移弃上清。
(3)沿离心管壁缓慢加入200μL新鲜配制的80%乙醇,静置30sec,使用移液器移弃上清。
(4)重复以上步骤一次。
(5)离心管置于磁力架上,使用10μL吸头移去少量残留乙醇,注意勿吸到磁珠。
(6)将磁珠置于室温干燥2-5min,至乙醇完全挥发。
(7)移出PCR管,向PCR管中加入21μL Nuclease Free Water,将磁珠悬浮混匀,25℃孵育5min。
(8)将PCR管瞬时离心后放置于磁力架上5min至液体完全澄清,使用移液器小心吸取20μL上清转移至一个新的0.2mL PCR管中。
6、PCR扩增的步骤如下:
(1)往含有纯化的连接产物的PCR管中依次加入25μL 2X HiFi PCR Master Mix和5μL Amplification Primer Mix,混合均匀,瞬时离心。
(2)将PCR管放入PCR仪,启动如下PCR程序:98℃,2min;(98℃,15sec;60℃,30sec;72℃,30sec)X14 cycles;72℃,2min;4℃,∞。
7、文库纯化的步骤如下:
(1)向含有扩增产物的PCR管中加入50μL提前平衡至室温的Ampure XP Beads,混合均匀,25℃孵育5min。
(2)将PCR管瞬时离心后放置于磁力架上5min至液体完全澄清,使用移液器吸取移弃上清。
(3)沿离心管壁缓慢加入200μL新鲜配制的80%乙醇,静置30sec,使用移液器移弃上清。
(4)重复以上步骤一次。
(5)离心管置于磁力架上,使用10μL吸头移去少量残留乙醇,注意勿吸到磁珠。
(6)将磁珠置于室温干燥2-5min,至乙醇挥发完全。
(7)移出PCR管,向PCR管中加入21μL TE Solution,将磁珠悬浮混匀,25℃孵育5min。
(8)将PCR管瞬时离心后放置于磁力架上5min至液体完全澄清,使用移液器小心吸取20μL上清转移至一个新的0.2mL PCR管中保存。
8、高通量测序的步骤如下:
构建完成的NGS文库经QC合格后,在Illumina NovaSeq 6000平台上进行2x150 bp的双端测序,平均测序深度为1000X。
四、生物信息学数据分析
NovaSeq 6000产生的NGS原始数据经过删除接头序列、滤除低质量数据和基因组reference比对后,对靶区间内的变异进行识别。标准品和血浆样本的检测结果分别见表4和表5。
表4 4种已知基因变异频率的标准品的检测结果,分别重复3次
注:+表示该位点检测结果为阳性,-表示该位点检测结果为阴性。
表5 20例血浆样本的基因变异检测结果
从表4的结果可以看出,本方案对30ng的cfDNA标准品可以稳定检出低至0.1%变异频率的SNV和INDEL,灵敏度和特异性均达100%。
从表5的结果可以看出,20例血浆样本同时使用本发明的STE技术和对照技术进行了检测,17例样本(8例野生型和9例变异型)两种方法的检测结果完全一致,3例的检测结果存在差异。在这3例检测结果不一致的样本中,有2例样本STE技术检测出了超出对照技术A产品覆盖的范围:14号样本STE检出TP53 R175H变异,而对照技术检测为野生型;19号样本STE检出KRAS Q61H变异而对照技术检测为野生型;有1例样本STE比对照技术多检出1处变异:5号样本STE技术检出EGFR 19DEL和EGFR T790M,而对照技术只检出EGFR 19DEL,没有检出EGFR T790M。
对检测结果不一致的样本用数字PCR技术进行验证。其中14号样本TP53 R175H和19号样本KRAS Q61H经数字PCR验证,两个变异均为真实变异,变异频率分别为1.25%和3.50%。这两个位点由于不在对照技术试剂盒的检测范围内,未检出属正常。5号样本EGFRT790M变异经数字PCR验证,其变异频率为0.09%。
以上数据表明,本发明STE技术可以在较低NGS测序深度的前提下,稳定检出低至0.1%的基因变异。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
序列表
<110> 上海市肺科医院,阅尔基因技术(苏州)有限公司,上海阅尔基因技术有限公司
<120> 一种探针组合物、基于该探针组合物的二代测序文库及其应用
<160> 64
<170> SIPOSequenceListing 1.0
<210> 1
<211> 120
<212> DNA
<213> (人工序列)
<400> 1
ggcagccagg aacgtactgg tgaaaacacc gcagcatgtc aagatcacag attttgggct 60
ggccaaactg ctgggtgcgg aagagaaaga ataccatgca gaaggaggca aagtaaggag 120
<210> 2
<211> 120
<212> DNA
<213> (人工序列)
<400> 2
caacccccac gtgtgccgcc tgctgggcat ctgcctcacc tccaccgtgc agctcatcac 60
gcagctcatg cccttcggct gcctcctgga ctatgtccgg gaacacaaag acaatattgg 120
<210> 3
<211> 120
<212> DNA
<213> (人工序列)
<400> 3
ctggatccca gaaggtgaga aagttaaaat tcccgtcgct atcaaggaat taagagaagc 60
aacatctccg aaagccaaca aggaaatcct cgatgtgagt ttctgctttg ctgtgtgggg 120
<210> 4
<211> 120
<212> DNA
<213> (人工序列)
<400> 4
tggccaccat gcgaagccac actgacgtgc ctctccctcc ctccaggaag cctacgtgat 60
ggccagcgtg gacaaccccc acgtgtgccg cctgctgggc atctgcctca cctccaccgt 120
<210> 5
<211> 120
<212> DNA
<213> (人工序列)
<400> 5
caaccaagct ctcttgagga tcttgaagga aactgaattc aaaaagatca aagtgctggg 60
ctccggtgcg ttcggcacgg tgtataaggt aaggtccctg gcacaggcct ctgggctggg 120
<210> 6
<211> 120
<212> DNA
<213> (人工序列)
<400> 6
attcgtccac aaaatgattc tgaattagct gtatcgtcaa ggcactcttg cctacgccac 60
cagctccaac taccacaagt ttatattcag tcattttcag caggccttat aataaaaata 120
<210> 7
<211> 120
<212> DNA
<213> (人工序列)
<400> 7
acacaaagaa agccctcccc agtcctcatg tactggtccc tcattgcact gtactcctct 60
tgacctgctg tgtcgagaat atccaagaga caggtttctc catcaattac tacttgcttc 120
<210> 8
<211> 120
<212> DNA
<213> (人工序列)
<400> 8
tgattttgca gaaaacagat ctgtatttat ttcagtgtta cttacctgtc ttgtctttgc 60
tgatgtttca ataaaaggaa ttccataact tcttgctaag tcctgagcct gttttgtgtc 120
<210> 9
<211> 120
<212> DNA
<213> (人工序列)
<400> 9
tccacaaaat ggatccagac aactgttcaa actgatggga cccactccat cgagatttca 60
ctgtagctag accaaaatca cctattttta ctgtgaggtc ttcatgaaga aatatatctg 120
<210> 10
<211> 120
<212> DNA
<213> (人工序列)
<400> 10
ccacattaca tacttaccat gccactttcc cttgtagact gttccaaatg atccagatcc 60
aattctttgt cccactgtaa tctgcccatc aggaatctcc caatcatcac tcgagtcccg 120
<210> 11
<211> 120
<212> DNA
<213> (人工序列)
<400> 11
attcatctac aaagtggttc tggattagct ggattgtcag tgcgcttttc ccaacaccac 60
ctgctccaac caccaccagt ttgtactcag tcatttcaca ccagcaagaa cctgttggaa 120
<210> 12
<211> 120
<212> DNA
<213> (人工序列)
<400> 12
acagaggaag ccttcgcctg tcctcatgta ttggtctctc atggcactgt actcttcttg 60
tccagctgta tccagtatgt ccaacaaaca ggtttcacca tctataacca cttgttttct 120
<210> 13
<211> 120
<212> DNA
<213> (人工序列)
<400> 13
aaaatgacaa agaacagctc aaagcaattt ctacacgaga tcctctctct gaaatcactg 60
agcaggagaa agattttcta tggagtcaca ggtaagtgct aaaatggaga ttctctgttt 120
<210> 14
<211> 120
<212> DNA
<213> (人工序列)
<400> 14
cttagataaa actgagcaag aggctttgga gtatttcatg aaacaaatga atgatgcaca 60
tcatggtggc tggacaacaa aaatggattg gatcttccac acaattaaac agcatgcatt 120
<210> 15
<211> 120
<212> DNA
<213> (人工序列)
<400> 15
ccagggcatc tggatccctg atggggagaa tgtgaaaatt ccagtggcca tcaaagtgtt 60
gagggaaaac acatccccca aagccaacaa agaaatctta gacgtaagcc cctccaccct 120
<210> 16
<211> 120
<212> DNA
<213> (人工序列)
<400> 16
tgtgtggtct cccataccct ctcagcgtac ccttgtcccc aggaagcata cgtgatggct 60
ggtgtgggct ccccatatgt ctcccgcctt ctgggcatct gcctgacatc cacggtgcag 120
<210> 17
<211> 120
<212> DNA
<213> (人工序列)
<400> 17
cccaactaca gaaatggttt caaatgaatc tgtagactac cgagctactt ttccagaagg 60
tatatttcag tttattgttc tgagaaatac ctatacatat acctcagtgg gttgtgacat 120
<210> 18
<211> 120
<212> DNA
<213> (人工序列)
<400> 18
ctttctgtag gctggatgaa aaattcacag tcaaggttgc tgattttggt cttgccagag 60
acatgtatga taaagaatac tatagtgtac acaacaaaac aggtgcaaag ctgccagtga 120
<210> 19
<211> 120
<212> DNA
<213> (人工序列)
<400> 19
aatgaaggtg ccatcattct tgaggaggaa gtagcgtggc cgccaggtct tgatgtactc 60
ccctacagac gtgcgggtgg tgagagccac gcacactcta cccgtcagac cctcgccagg 120
<210> 20
<211> 120
<212> DNA
<213> (人工序列)
<400> 20
tggatcccaa ctgcctaccg ttgccatccg ggctttacgc aaataagtaa gaaggtctcc 60
tccctccatc agttccagga taatgtattg gggttcattc agcagacaaa ctccaagctg 120
<210> 21
<211> 120
<212> DNA
<213> (人工序列)
<400> 21
cgggcgaggg cgggtctctc ggaggaagga cttgaggtct ccccccgcca tgagctccag 60
caggatgaac cggggcaggg attgcaggct caccccaatg cagcgaacaa tgttctggtg 120
<210> 22
<211> 120
<212> DNA
<213> (人工序列)
<400> 22
tgtggcttta cctgatgatc agggcttcca tgaggaaatc cagttcgtcc tgttcagagc 60
acacttcagg cagcgtctgg gcagagaagg ggagggtggg gaggaggagg aggctgtgag 120
<210> 23
<211> 120
<212> DNA
<213> (人工序列)
<400> 23
acacagatca gcgacaggat gacaggaaga gcacagtcac tttgactcac cggtggatga 60
agtggttttc ctccaaatac tgacagccac aggcaatgtc ccgagccacg tgcagaaggt 120
<210> 24
<211> 120
<212> DNA
<213> (人工序列)
<400> 24
tcttcggcgt ctgcaccgag ggccgccccc tgctcatggt ctttgagtat atgcggcacg 60
gggacctcaa ccgcttcctc cggtaccagc acctggcctc agcgctggcc ccggcccctg 120
<210> 25
<211> 120
<212> DNA
<213> (人工序列)
<400> 25
ctggggtcag gtgcagggga agacaatcct tgcttacctg aggaacttat tcaggtctcc 60
atgcttcatg tattcaaaga ccatgatgag ggggtcccca tcgccgcaca ctccatagaa 120
<210> 26
<211> 120
<212> DNA
<213> (人工序列)
<400> 26
ctttcttgcg gagattctct tcctctgtgc gccggtctct cccaggacag gcacaaacac 60
gcacctcaaa gctgttccgt cccagtagat taccactact caggatagga aaagagaagc 120
<210> 27
<211> 120
<212> DNA
<213> (人工序列)
<400> 27
ggtggcaagt ggctcctgac ctggagtctt ccagtgtgat gatggtgagg atgggcctcc 60
ggttcatgcc gcccatgcag gaactgttac acatgtagtt gtagtggatg gtggtacagt 120
<210> 28
<211> 120
<212> DNA
<213> (人工序列)
<400> 28
cctcctccca gagaccccag ttgcaaacca gacctcaggc ggctcatagg gcaccaccac 60
actatgtcga aaagtgtttc tgtcatccaa atactccaca cgcaaatttc cttccactcg 120
<210> 29
<211> 120
<212> DNA
<213> (人工序列)
<400> 29
gtctctccag ccccagctgc tcaccatcgc tatctgagca gcgctcatgg tgggggcagc 60
gcctcacaac ctccgtcatg tgctgtgact gcttgtagat ggccatggcg cggacgcggg 120
<210> 30
<211> 120
<212> DNA
<213> (人工序列)
<400> 30
ggttattctg atttcccatt cttttcttta cttaaatagg gcaagttcac tacagcaagt 60
gatgtgtggg cctttggggt tactttgtgg gagactttca ccttttgtca agaacagccc 120
<210> 31
<211> 120
<212> DNA
<213> (人工序列)
<400> 31
gctggaggag ctagagcttg atgagcagca gcgaaagcgc cttgaggcct ttcttaccca 60
gaagcagaag gtgggagaac tgaaggatga cgactttgag aagatcagtg agctgggggc 120
<210> 32
<211> 120
<212> DNA
<213> (人工序列)
<400> 32
agtttgtggt ctgccagcta aaggtgaaga tatattcctc caattcagga cccacacgac 60
gggaagacaa gttcatgtac tttgagttcc ctcagccgtt acctgtgtgt ggtgatatca 120
<210> 33
<211> 120
<212> DNA
<213> (人工序列)
<400> 33
ggcagccagg aacgtactgg tgaaaacacc gcagcatgtc aagatcacag attttgggcg 60
ggccaaactg ctgggtgcgg aagagaaaga ataccatgca gaaggaggca aagtaaggag 120
<210> 34
<211> 120
<212> DNA
<213> (人工序列)
<400> 34
caacccccac gtgtgccgcc tgctgggcat ctgcctcacc tccaccgtgc agctcatcat 60
gcagctcatg cccttcggct gcctcctgga ctatgtccgg gaacacaaag acaatattgg 120
<210> 35
<211> 120
<212> DNA
<213> (人工序列)
<400> 35
tctgtcatag ggactctgga tcccagaagg tgagaaagtt aaaattcccg tcgctatcaa 60
aacatctccg aaagccaaca aggaaatcct cgatgtgagt ttctgctttg ctgtgtgggg 120
<210> 36
<211> 120
<212> DNA
<213> (人工序列)
<400> 36
tgcgaagcca cactgacgtg cctctccctc cctccaggaa gcctacgtga ttggccagcg 60
ggccagcgtg gacaaccccc acgtgtgccg cctgctgggc atctgcctca cctccaccgt 120
<210> 37
<211> 120
<212> DNA
<213> (人工序列)
<400> 37
caaccaagct ctcttgagga tcttgaagga aactgaattc aaaaagatca aagtgctggc 60
ctccggtgcg ttcggcacgg tgtataaggt aaggtccctg gcacaggcct ctgggctggg 120
<210> 38
<211> 120
<212> DNA
<213> (人工序列)
<400> 38
attcgtccac aaaatgattc tgaattagct gtatcgtcaa ggcactcttg cctacgccat 60
cagctccaac taccacaagt ttatattcag tcattttcag caggccttat aataaaaata 120
<210> 39
<211> 120
<212> DNA
<213> (人工序列)
<400> 39
acacaaagaa agccctcccc agtcctcatg tactggtccc tcattgcact gtactcctcg 60
tgacctgctg tgtcgagaat atccaagaga caggtttctc catcaattac tacttgcttc 120
<210> 40
<211> 120
<212> DNA
<213> (人工序列)
<400> 40
tgattttgca gaaaacagat ctgtatttat ttcagtgtta cttacctgtc ttgtctttgt 60
tgatgtttca ataaaaggaa ttccataact tcttgctaag tcctgagcct gttttgtgtc 120
<210> 41
<211> 120
<212> DNA
<213> (人工序列)
<400> 41
tccacaaaat ggatccagac aactgttcaa actgatggga cccactccat cgagatttct 60
ctgtagctag accaaaatca cctattttta ctgtgaggtc ttcatgaaga aatatatctg 120
<210> 42
<211> 120
<212> DNA
<213> (人工序列)
<400> 42
ccacattaca tacttaccat gccactttcc cttgtagact gttccaaatg atccagatct 60
aattctttgt cccactgtaa tctgcccatc aggaatctcc caatcatcac tcgagtcccg 120
<210> 43
<211> 120
<212> DNA
<213> (人工序列)
<400> 43
attcatctac aaagtggttc tggattagct ggattgtcag tgcgcttttc ccaacaccat 60
ctgctccaac caccaccagt ttgtactcag tcatttcaca ccagcaagaa cctgttggaa 120
<210> 44
<211> 120
<212> DNA
<213> (人工序列)
<400> 44
acagaggaag ccttcgcctg tcctcatgta ttggtctctc atggcactgt actcttcttt 60
tccagctgta tccagtatgt ccaacaaaca ggtttcacca tctataacca cttgttttct 120
<210> 45
<211> 120
<212> DNA
<213> (人工序列)
<400> 45
aaaatgacaa agaacagctc aaagcaattt ctacacgaga tcctctctct gaaatcacta 60
agcaggagaa agattttcta tggagtcaca ggtaagtgct aaaatggaga ttctctgttt 120
<210> 46
<211> 120
<212> DNA
<213> (人工序列)
<400> 46
cttagataaa actgagcaag aggctttgga gtatttcatg aaacaaatga atgatgcacg 60
tcatggtggc tggacaacaa aaatggattg gatcttccac acaattaaac agcatgcatt 120
<210> 47
<211> 120
<212> DNA
<213> (人工序列)
<400> 47
ccagggcatc tggatccctg atggggagaa tgtgaaaatt ccagtggcca tcaaagtgtc 60
gagggaaaac acatccccca aagccaacaa agaaatctta gacgtaagcc cctccaccct 120
<210> 48
<211> 120
<212> DNA
<213> (人工序列)
<400> 48
cataccctct cagcgtaccc ttgtccccag gaagcatacg tgatggctat acgtgatggc 60
ggtgtgggct ccccatatgt ctcccgcctt ctgggcatct gcctgacatc cacggtgcag 120
<210> 49
<211> 120
<212> DNA
<213> (人工序列)
<400> 49
cccaactaca gaaatggttt caaatgaatc tgtagactac cgagctactt ttccagaagt 60
tatatttcag tttattgttc tgagaaatac ctatacatat acctcagtgg gttgtgacat 120
<210> 50
<211> 120
<212> DNA
<213> (人工序列)
<400> 50
ctttctgtag gctggatgaa aaattcacag tcaaggttgc tgattttggt cttgccagaa 60
acatgtatga taaagaatac tatagtgtac acaacaaaac aggtgcaaag ctgccagtga 120
<210> 51
<211> 120
<212> DNA
<213> (人工序列)
<400> 51
aatgaaggtg ccatcattct tgaggaggaa gtagcgtggc cgccaggtct tgatgtactt 60
ccctacagac gtgcgggtgg tgagagccac gcacactcta cccgtcagac cctcgccagg 120
<210> 52
<211> 120
<212> DNA
<213> (人工序列)
<400> 52
tggatcccaa ctgcctaccg ttgccatccg ggctttacgc aaataagtaa gaaggtctct 60
tccctccatc agttccagga taatgtattg gggttcattc agcagacaaa ctccaagctg 120
<210> 53
<211> 120
<212> DNA
<213> (人工序列)
<400> 53
cgggcgaggg cgggtctctc ggaggaagga cttgaggtct ccccccgcca tgagctccat 60
caggatgaac cggggcaggg attgcaggct caccccaatg cagcgaacaa tgttctggtg 120
<210> 54
<211> 120
<212> DNA
<213> (人工序列)
<400> 54
tgtggcttta cctgatgatc agggcttcca tgaggaaatc cagttcgtcc tgttcagagt 60
acacttcagg cagcgtctgg gcagagaagg ggagggtggg gaggaggagg aggctgtgag 120
<210> 55
<211> 120
<212> DNA
<213> (人工序列)
<400> 55
acacagatca gcgacaggat gacaggaaga gcacagtcac tttgactcac cggtggatgc 60
agtggttttc ctccaaatac tgacagccac aggcaatgtc ccgagccacg tgcagaaggt 120
<210> 56
<211> 120
<212> DNA
<213> (人工序列)
<400> 56
tcttcggcgt ctgcaccgag ggccgccccc tgctcatggt ctttgagtat atgcggcaca 60
gggacctcaa ccgcttcctc cggtaccagc acctggcctc agcgctggcc ccggcccctg 120
<210> 57
<211> 120
<212> DNA
<213> (人工序列)
<400> 57
ctggggtcag gtgcagggga agacaatcct tgcttacctg aggaacttat tcaggtctct 60
atgcttcatg tattcaaaga ccatgatgag ggggtcccca tcgccgcaca ctccatagaa 120
<210> 58
<211> 120
<212> DNA
<213> (人工序列)
<400> 58
ctttcttgcg gagattctct tcctctgtgc gccggtctct cccaggacag gcacaaacat 60
gcacctcaaa gctgttccgt cccagtagat taccactact caggatagga aaagagaagc 120
<210> 59
<211> 120
<212> DNA
<213> (人工序列)
<400> 59
ggtggcaagt ggctcctgac ctggagtctt ccagtgtgat gatggtgagg atgggcctct 60
ggttcatgcc gcccatgcag gaactgttac acatgtagtt gtagtggatg gtggtacagt 120
<210> 60
<211> 120
<212> DNA
<213> (人工序列)
<400> 60
cctcctccca gagaccccag ttgcaaacca gacctcaggc ggctcatagg gcaccaccat 60
actatgtcga aaagtgtttc tgtcatccaa atactccaca cgcaaatttc cttccactcg 120
<210> 61
<211> 120
<212> DNA
<213> (人工序列)
<400> 61
gtctctccag ccccagctgc tcaccatcgc tatctgagca gcgctcatgg tgggggcagt 60
gcctcacaac ctccgtcatg tgctgtgact gcttgtagat ggccatggcg cggacgcggg 120
<210> 62
<211> 120
<212> DNA
<213> (人工序列)
<400> 62
ggttattctg atttcccatt cttttcttta cttaaatagg gcaagttcac tacagcaaga 60
gatgtgtggg cctttggggt tactttgtgg gagactttca ccttttgtca agaacagccc 120
<210> 63
<211> 120
<212> DNA
<213> (人工序列)
<400> 63
gctggaggag ctagagcttg atgagcagca gcgaaagcgc cttgaggcct ttcttacccc 60
gaagcagaag gtgggagaac tgaaggatga cgactttgag aagatcagtg agctgggggc 120
<210> 64
<211> 120
<212> DNA
<213> (人工序列)
<400> 64
agtttgtggt ctgccagcta aaggtgaaga tatattcctc caattcagga cccacacgat 60
gggaagacaa gttcatgtac tttgagttcc ctcagccgtt acctgtgtgt ggtgatatca 120
Claims (10)
1.一种探针组合物,其特征在于,所述探针组合物用于检测靶核酸序列相对于非靶核酸序列的变异,该探针组合物包括阻滞探针和捕获探针,其中:
阻滞探针和捕获探针针对非靶核酸序列和靶核酸序列的差异序列进行设计;
所述阻滞探针和非靶核酸序列结合的吉布斯自由能与捕获探针和非靶核酸序列结合的吉布斯自由能之差ΔG非 阻滞-捕获为-9.5~-0.5kcal/mol;所述捕获探针和靶核酸序列结合的吉布斯自由能与阻滞探针和靶核酸序列结合的吉布斯自由能之差ΔG靶 捕获-阻滞为-8.5~-0.5kcal/mol。
2.根据权利要求1所述的探针组合物,其特征在于:所述阻滞探针和非靶核酸序列结合的吉布斯自由能与捕获探针和非靶核酸序列结合的吉布斯自由能之差ΔG非 阻滞-捕获为-4.5~-2.5kcal/mol;所述捕获探针和靶核酸序列结合的吉布斯自由能与阻滞探针和靶核酸序列结合的吉布斯自由能之差ΔG靶 捕获-阻滞为-4.5~-2.5kcal/mol。
3.一种基于权利要求1或2所述的探针组合物的二代测序文库的构建方法,其特征在于,包括以下步骤:
将样本DNA片段、权利要求1或2所述的探针组合物进行杂交反应,杂交反应完成后对样本DNA片段中的靶核酸片段进行捕获,对捕获的靶核酸片段进行末端修复和接头连接,对接头连接产物进行index PCR扩增,构建得到所述二代测序文库。
4.根据权利要求3所述的构建方法,其特征在于:样本DNA片段来源于血浆、血清、血液、尿液、汗液、唾液、精液、胸水、腹水、粪便、穿刺样本和石蜡包埋组织切片样本中的至少一种。
5.根据权利要求3所述的构建方法,其特征在于:杂交反应体系中还包括杂交增强剂。
6.根据权利要求3所述的构建方法,其特征在于:所述捕获探针修饰有生物素。
7.根据权利要求3所述的构建方法,其特征在于:所述的捕获包括将杂交反应得到的杂交产物与修饰有链霉亲和素的磁珠共孵育后分离的步骤。
8.权利要求3-7任一项所述的构建方法构建得到的二代测序文库。
9.根据权利要求8所述的二代测序文库,其特征在于:测序深度为100X-1000X。
10.权利要求1或2所述的探针组合物在制备液体活检试剂或制备组织活检试剂中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111633522.1A CN114250269A (zh) | 2021-12-28 | 2021-12-28 | 一种探针组合物、基于该探针组合物的二代测序文库及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111633522.1A CN114250269A (zh) | 2021-12-28 | 2021-12-28 | 一种探针组合物、基于该探针组合物的二代测序文库及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114250269A true CN114250269A (zh) | 2022-03-29 |
Family
ID=80795513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111633522.1A Pending CN114250269A (zh) | 2021-12-28 | 2021-12-28 | 一种探针组合物、基于该探针组合物的二代测序文库及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114250269A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115713971A (zh) * | 2022-09-28 | 2023-02-24 | 上海睿璟生物科技有限公司 | 二代测序的靶向序列捕获探针设计策略选择方法、系统及终端 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104513855A (zh) * | 2014-11-28 | 2015-04-15 | 中国科学院上海微系统与信息技术研究所 | 一种基于热力学优化的高特异性核酸杂交方法 |
CN107236729A (zh) * | 2017-07-04 | 2017-10-10 | 上海阅尔基因技术有限公司 | 一种基于探针捕获富集的快速构建靶核酸测序文库的方法和试剂盒 |
WO2018028001A1 (zh) * | 2016-08-12 | 2018-02-15 | 成都诺恩生物科技有限公司 | 特异捕获并重复复制低频率dna碱基变异的方法及应用 |
CN110387400A (zh) * | 2018-04-19 | 2019-10-29 | 上海迪赢生物科技有限公司 | 一种同时捕获基因组目标区域正反义双链的平行液相杂交捕获方法 |
CN112195219A (zh) * | 2020-11-03 | 2021-01-08 | 至本医疗科技(上海)有限公司 | 小panel探针靶向捕获富集测序文库分子的降噪方法 |
CN112359083A (zh) * | 2020-11-11 | 2021-02-12 | 天津大学 | 一种基于锁式探针技术生成单链环状dna的方法及其应用 |
CN112708662A (zh) * | 2020-12-28 | 2021-04-27 | 阅尔基因技术(苏州)有限公司 | 抑制生物dna样本中非目标区域的核苷酸组合物及其应用 |
-
2021
- 2021-12-28 CN CN202111633522.1A patent/CN114250269A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104513855A (zh) * | 2014-11-28 | 2015-04-15 | 中国科学院上海微系统与信息技术研究所 | 一种基于热力学优化的高特异性核酸杂交方法 |
WO2018028001A1 (zh) * | 2016-08-12 | 2018-02-15 | 成都诺恩生物科技有限公司 | 特异捕获并重复复制低频率dna碱基变异的方法及应用 |
CN107236729A (zh) * | 2017-07-04 | 2017-10-10 | 上海阅尔基因技术有限公司 | 一种基于探针捕获富集的快速构建靶核酸测序文库的方法和试剂盒 |
CN110387400A (zh) * | 2018-04-19 | 2019-10-29 | 上海迪赢生物科技有限公司 | 一种同时捕获基因组目标区域正反义双链的平行液相杂交捕获方法 |
CN112195219A (zh) * | 2020-11-03 | 2021-01-08 | 至本医疗科技(上海)有限公司 | 小panel探针靶向捕获富集测序文库分子的降噪方法 |
CN112359083A (zh) * | 2020-11-11 | 2021-02-12 | 天津大学 | 一种基于锁式探针技术生成单链环状dna的方法及其应用 |
CN112708662A (zh) * | 2020-12-28 | 2021-04-27 | 阅尔基因技术(苏州)有限公司 | 抑制生物dna样本中非目标区域的核苷酸组合物及其应用 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115713971A (zh) * | 2022-09-28 | 2023-02-24 | 上海睿璟生物科技有限公司 | 二代测序的靶向序列捕获探针设计策略选择方法、系统及终端 |
CN115713971B (zh) * | 2022-09-28 | 2024-01-23 | 上海睿璟生物科技有限公司 | 靶向序列捕获探针设计策略选择方法、系统及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109609647B (zh) | 基于二代测序的用于泛癌种靶向、化疗及免疫用药的检测Panel、检测试剂盒及其应用 | |
CN108753967B (zh) | 一种用于肝癌检测的基因集及其panel检测设计方法 | |
CN107541791A (zh) | 血浆游离dna甲基化检测文库的构建方法、试剂盒及应用 | |
CN105040111B (zh) | 系统性红斑狼疮图谱模型的构建方法 | |
CN108004304B (zh) | 一种检测淋巴细胞相关基因重排的克隆性的方法 | |
WO2016049878A1 (zh) | 一种基于snp分型的亲子鉴定方法及应用 | |
CN109371139A (zh) | 一种基于高通量测序技术用于检测甲状腺癌致病相关基因变异的引物及其应用 | |
CN114317762B (zh) | 用于检测早期肝癌的三标记物组合物及其试剂盒 | |
CN106520963B (zh) | 高通量测序检测人循环肿瘤dna kras基因的捕获探针及试剂盒 | |
CN111961729A (zh) | 一种用于检测5-羟甲基胞嘧啶含量的试剂盒及其应用 | |
CN115786459B (zh) | 一种应用于高通量测序检测实体瘤微小残留病的方法 | |
CN108374047B (zh) | 一种基于高通量测序技术检测膀胱癌的试剂盒 | |
CN113061652A (zh) | 一种基于葡萄糖基修饰的测定基因标志物中5hmC含量的方法 | |
CN111575347A (zh) | 构建用于同时获得血浆中游离dna甲基化和片段化模式信息的文库的方法 | |
CN114250269A (zh) | 一种探针组合物、基于该探针组合物的二代测序文库及其应用 | |
CN114592066B (zh) | 一种新型多靶点肝癌早期检测的组合标志物及其应用 | |
CN111020710A (zh) | 造血及淋巴组织肿瘤的ctDNA高通量检测 | |
CN109735611A (zh) | 一种用于检测骨髓衰竭综合征的基因组合、引物库、构建高通量测序文库的方法及其应用 | |
CN115198035A (zh) | 基于纳米孔测序同时获取病毒整合转录本和rna修饰的检测方法和应用 | |
CN111235270B (zh) | 一种基于高通量测序法的肿瘤抗原表达检测引物及试剂盒 | |
CN114196740A (zh) | 用于同时识别多种基因类型的数字扩增检测方法、检测产品和检测试剂盒 | |
CN116445478B (zh) | 一种构建ighv基因文库的引物组合及其应用 | |
CN113981059B (zh) | 一种地中海贫血症突变基因检测引物组合物及其试剂 | |
CN115807103B (zh) | 36个红细胞血型系统基因全编码区序列同步检测基因分型方法、探针集及试剂盒 | |
KR102695246B1 (ko) | 유전체와 후성 유전체 동시 분석 방법 및 분석 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |