CN118006770A - 使用游离dna分子的正负链差异检测癌症 - Google Patents
使用游离dna分子的正负链差异检测癌症 Download PDFInfo
- Publication number
- CN118006770A CN118006770A CN202211409380.5A CN202211409380A CN118006770A CN 118006770 A CN118006770 A CN 118006770A CN 202211409380 A CN202211409380 A CN 202211409380A CN 118006770 A CN118006770 A CN 118006770A
- Authority
- CN
- China
- Prior art keywords
- dna
- strand
- cancer
- positive
- negative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 56
- 201000011510 cancer Diseases 0.000 title claims abstract description 39
- 238000001514 detection method Methods 0.000 title description 8
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000012165 high-throughput sequencing Methods 0.000 claims abstract description 8
- 108020004414 DNA Proteins 0.000 claims description 116
- 102000053602 DNA Human genes 0.000 claims description 39
- 239000012472 biological sample Substances 0.000 claims description 14
- 238000010276 construction Methods 0.000 claims description 14
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 13
- 239000012634 fragment Substances 0.000 claims description 12
- 239000008280 blood Substances 0.000 claims description 7
- 210000004369 blood Anatomy 0.000 claims description 7
- 206010009944 Colon cancer Diseases 0.000 claims description 4
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 3
- 208000000461 Esophageal Neoplasms Diseases 0.000 claims description 3
- 206010030155 Oesophageal carcinoma Diseases 0.000 claims description 3
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 3
- 201000004101 esophageal cancer Diseases 0.000 claims description 3
- 206010017758 gastric cancer Diseases 0.000 claims description 3
- 210000002381 plasma Anatomy 0.000 claims description 3
- 210000002966 serum Anatomy 0.000 claims description 3
- 201000011549 stomach cancer Diseases 0.000 claims description 3
- 230000009946 DNA mutation Effects 0.000 claims description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 claims description 2
- 231100000844 hepatocellular carcinoma Toxicity 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 claims 2
- 239000013074 reference sample Substances 0.000 claims 1
- 238000012163 sequencing technique Methods 0.000 abstract description 14
- 230000035772 mutation Effects 0.000 abstract description 5
- 239000000523 sample Substances 0.000 description 24
- 238000006243 chemical reaction Methods 0.000 description 14
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 4
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 150000007523 nucleic acids Chemical group 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 210000003917 human chromosome Anatomy 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 206010008342 Cervix carcinoma Diseases 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 201000010881 cervical cancer Diseases 0.000 description 2
- 239000013068 control sample Substances 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 101710086015 RNA ligase Proteins 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000030609 dephosphorylation Effects 0.000 description 1
- 238000006209 dephosphorylation reaction Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 208000013077 thyroid gland carcinoma Diseases 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Pathology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种分析样本中DNA的正链和负链的差异用于检测癌症的方法。所述方法包括对样本DNA进行高通量测序,然后根据测序数据中的正链和负链的差异,计算样本DNA的正链和负链的不平衡性(包括但不限于正负链相对深度,比例,末端序列特征和突变等),并用于检测癌症。
Description
技术领域
本发明涉及生物技术领域,特别是DNA检测领域。具体地,本发明涉及对血浆DNA进行检测和分析的方法。更具体地,本发明涉及对生物样本中的DNA的正负链数目差异进行计算的方法,以及基于此区分生物样本的来源个体是否具有癌症,以及癌症的类型和肿瘤大小等。
背景技术
循环游离DNA指游离于细胞外的核酸片段。尽管目前关于循环游离DNA的临床研究和应用在迅速的进展,但对于循环游离DNA相关的许多分子特征仍然有待探索,这对于推进循环游离DNA的分析的临床应用有着重要的价值。
研究癌症患者的血浆中的肿瘤来源的DNA分子的特征是一项就有很大挑战性的工作,因为肿瘤来源的DNA分子的含量较少,而且无法轻易的与正常来源的背景DNA分子进行区分。在目前已有的临床研究工作中,最为常用的特征是DNA分子上的特异性碱基突变或核酸修饰,但是由于整个基因组上存在着随机的碱基突变背景,而且癌症特异性突变也相对较少,因此比较难以精准的将肿瘤来源的DNA和正常DNA进行区分。特别是在早期癌症的筛查和诊断的应用场景下。
在之前的循环游离DNA的研究中,通常采用的检测技术是基于双链文库构建的高通量测序的方法,但目前已知在循环游离DNA中,有部分的DNA分子存在着断裂损伤或末端突出等情况,而且还有部分DNA分子本身就是以单链形式存在的。由于通常使用的双链文库构建方法的第一步就需要对DNA分子进行末端修复,而且接头连接过程是双链DNA分子之间的平末端或TA连接,使得前述的特殊DNA分子都无法被成功建库,这部分DNA分子所携带的信息被丢失。
发明内容
本发明的目的之一,在于提供一种分析样本中DNA的正链和负链的差异用于检测癌症的方法。所述方法包括对样本DNA进行高通量测序,然后根据测序数据中的正链和负链的差异,计算样本DNA的正链和负链的不平衡性,并用于检测癌症。举例来说,实施方法计算染色体某一区域内的正负链数目的差异,并将其与已知类型癌症的参考数值进行比较,当足够数目的区域具有匹配的正负链差异时,可鉴别出癌症类型。
在一些实施例中,通过使用单链DNA建库技术对循环游离DNA进行文库构建,可以保留样本中DNA分子的单链信息。在一些实施例中,由于单链DNA的存在导致的染色体区域内的正负链数目的不平衡信号可作为潜在的肿瘤信号。在一些实施例中,循环游离DNA(包括单链DNA)来自于肿瘤细胞,因此也可称为循环肿瘤DNA。在一些实施例中,样本同时含有肿瘤DNA和非肿瘤DNA。
对于不同类型的癌症,对应患者的血浆中可以检测到不同癌症相关的分子特征,包括但不限于拷贝数变异、甲基化水平的改变、单核苷酸突变、病毒序列插入、片段大小变化、末端序列特征、锯齿末端特征和染色体重排等。
在一些实施例中,通过对样本中的DNA片段的正负链差异进行分析,可以用来推测样本来源的癌症分期。比如,如果样本的正负链差异与健康对照者对应区域的数值相差较大的,可指示早期癌症;而与癌症组织样本的数值相差较小的,可指示晚期癌症。
本发明的一方面,提供了一种基于从个体获取的生物样品检测癌症的方法,包含:
a)确定所述生物样品中的单链DNA分子和双链DNA分子中的每一条DNA链的序列以及含量,
b)根据a)的结果,确定所述DNA链在所述个体的基因组中的位置,并鉴别所述DNA链是对应的所述基因组中的DNA正链或DNA负链,
c)确定所述基因组中一个或多个特定区域的所述DNA正链和所述DNA负链的差异信息,
d)根据所述差异信息,判断判断所述个体是否患有所述癌症。
在一些实施例中,在步骤d)中,通过比较每个所述特定区域的所述DNA正负链差异信息与不同类型的癌症样本的对应DNA正负链差异信息参考值,判断所述个体是否患有所述癌症。
在一些实施例中,所述基因组的特定区域的长度为至少50bp,至少200bp,至少500bp,至少1000bp,至少2000bp,至少5000bp,至少10000bp,或至少20000bp。
在一些实施例中,所述基因组的特定区域包含人体7号染色体69,838,000bp至69,848,000bp区域。在一些实施例中,所述基因组的特定区域包含人体7号染色体69,838,000bp至69,848,000bp区域内的长度为至少50bp,至少200bp,至少500bp,至少1000bp,至少2000bp,或至少5000bp的区域。
在一些实施例中,在步骤c)中,选择至少2个,至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个,或至少10个基因组特定区域。
在一些实施例中,所述差异信息为正负链相对覆盖率,DNA链末端序列,DNA突变,或其任意组合。
在一些实施例中,所述差异信息为DNA正负链的相对覆盖率。在一些实施例中,所述相对覆盖率的计算方法为(i)获得所述特定区域的所述DNA正链的片段数和所述DNA负链的片段数;(ii)将所述DNA正链的所述片段数除以所述DNA负链的所述片段数,以获得所述相对覆盖率。
在一些实施例中,在步骤a)中使用高通量测序技术确定所述每一条DNA链的序列以及含量。在一些实施例中,所述高通量测序技术使用的文库构建方式可以区分DNA分子的正负链。在一些实施例中,使用的文库构建方式是单链DNA建库技术。
在一些实施例中,所述方法进一步包括计算所述癌症的肿瘤的尺寸及其DNA正负链差异信息的校准函数,从而使用所述校准函数判断所述肿瘤的尺寸。在一些实施例中,所述校准函数是利用来自有已知尺寸的肿瘤的生物体的参考样品的数据对确定的。
在一些实施例中,所述癌症为肺癌,胃癌,肝癌,食管癌,乳腺癌,宫颈癌,卵巢癌,子宫颈癌,前列腺癌,睾丸癌,结肠直肠癌,结肠癌,胰腺癌,头颈癌,甲状腺癌,神经胶质瘤,或皮肤癌。在一些实施例中,所述癌症为肝细胞癌,结直肠癌,食管癌,或胃癌。
在一些实施例中,所检测的样本可选自组织、全血、血浆、血清、尿液和粪便。在一些实施例中,所述生物样品为血液,血浆,或血清。
在一些实施例中,所述单链DNA分子和双链DNA分子包含血浆游离DNA。
本发明的一方面,提供了一种计算机系统,其特征在于,能够基于对生物样品中的单链DNA分子和双链DNA分子中的每一条DNA链的序列以及含量的检测结果,确定所述DNA链在所述个体的基因组中的位置,并鉴别所述DNA链是对应的所述基因组中的DNA正链或DNA负链,然后确定所述基因组中一个或多个特定区域的所述DNA正链和所述DNA负链的差异信息,并根据所述差异信息,判断所述个体是否患有所述癌症。
在一些实施例中,为实现上述目的,本发明采用的技术方案如下:
一种分析生物体的生物样品的方法,所述生物样品包括源自正常细胞和可能来自与癌症有关的细胞的DNA分子,其中所述核酸分子中的至少一部分在所述生物样品中是以游离状态存在的。检测方法包括:
1.对生物样品中的DNA分子进行检测,其中所选检测方法可以区分DNA分子的正负链;
2.根据检测结果,鉴别所述DNA分子在所述生物体的参考基因组中的位置;基于所鉴别的位置,将相应样本的核酸分子鉴别为来自所述染色体区域。
3.计算染色体上全部或部分区域的正链和负链数目的差异信息,根据计算值和参考基线值以确定所述染色体区域是否呈现出正负链不平衡性。
利用根据本发明实施例的检测样本中DNA分子正负链差异的方法,可以有效的计算样本的DNA正负链差异信号,并且通过将计算得到的样本信号和已知癌症类型或已知尺寸的肿瘤的参考品的信号进行比较计算,可以指示样本来源所对应的癌症类型或肿瘤尺寸信息。
根据本发明的又一方面,本发明提供了一种确定样本中DNA分子正负链差异信息的系统。根据本发明实施例,该系统其包括:测序文库构建装置,所述测序文库构建装置为权利要求3所述的;测序装置,所述测序装置与所述测序文库构建装置相连,以便于对所述样本的测序文库进行测序,获得所述样本的测序结果;分析装置,对所述样本的测序结果进行分析,以便获得所述DNA分子的正负链差异信息。
采用根据本发明实施例的确定DNA分子的正负链差异信息的系统,能够灵敏、准确、高效地确定微量样本中的DNA分子的的正负链差异信息,并且可用于区分癌症。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了根据本发明一个实施例的对样本中的DNA分子的正负链差异进行检测和分析的流程图;
图2显示了根据本发明的一个实施例检测到的癌症样本的血液游离DNA分子和健康对照样本的血液游离DNA分子在相同染色体区域的正负链信号的差异,其中红色的为癌症样本,黄色的为健康对照样本,横坐标为人的7号染色体区域坐标,纵坐标为正负链片段数偏差值。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出。本领域的技术人员将会理解,下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。实施例中未注明具体技术条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明,都是可以通过商业市场购买获得的常规产品,例如NEB等公司。
根据本发明的一个方面,本发明提供了一种对样本中DNA分子的正负链差异信息进行分析的方法。参考图1,根据本发明的实施例,该方法可以包括以下步骤:
1.对生物样本使用合适的DNA提取试剂盒进行提取。
2.用于建库的DNA样本首先用Qubit 4.0来进行定量,使用1*Qubit dsDNAHSassay kit来进行定量。用于建库的DNA可用0.5-20ng作为起始量。
4.脱磷酸处理和高温变性。
将DNA样本进行去磷酸,反应体系中包括碱性磷酸酶和反应buffer,37℃反应30分钟,然后95℃反应5分钟,将DNA高温变性成单链。
5单链接头和上步单链DNA产物连接,该连接为两个单链DNA分子之间的连接。
5-1单链接头序列为5’-Pho-(N)nAAGTCGGATCGTAGCCATG-3’ddC(SEQ ID NO:1),该接头序列5’端磷酸化修饰,3’端双脱氧修饰,防止了连接反应中接头的自连和DNA分子间的自连。同时在接头的5’端引物n个碱基的随机序列,用于矫正低起始量建库时可能引起的PCR扩增误差,n为1~15之间的正整数。
5-2该连接反应体系包括:变性后的单链DNA产物,单链接头,PEG8000,连接酶buffer和T4 RNA连接酶。
5-3反应条件为16℃过夜或者30℃反应2小时。
6延伸反应。以单链连接产物为模板,单链接头已知序列设计引物进行延伸,获得双链DNA产物。
6-1引物序列为:CAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT(SEQ ID NO:2)。
6-2反应体系包括:上步单链DNA连接产物,引物,DNA聚合酶buffer和DNA聚合酶。
6-3反应条件:95℃2分钟,45度30秒,72度5分钟。
7.双端接头连接。该步反应是上步反应生产的双链DNA产物和双链DNA接头之间进行的分子间连接。
7-1双链DNA接头序列为:
F序列:5’-Pho-GAAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA-3’(SEQ ID NO:3)。
R序列:5’-CAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTTCT-3’(SEQ ID NO:4)。
R序列是F序列的方向互补,特殊的是,R序列的最后有一个突出的碱基T。
7-2连接反应体系包括:上步双链DNA产物,双链DNA接头,T4 DNAligase和T4 DNAligase buffer。
7-3反应条件为20℃反应30分钟。
8.PCR扩增。以上一步获得的连接产物为模板,以5’端和3’端两端接头已知序列为正反向引物,进行PCR扩增。
8-1正向序列:
5’-GCATGGCGACCTTATCAGNNNNNNNNNTTGTCTTCCTAAGACCGCTTGG-3’(SEQ ID NO:5)。
反向序列:
5’-Pho-CTCTCAGTACGTCAGCAGTTNNNNNNNNNNCAACTCCTTGGCTCACAGAAC-3’(SEQ IDNO:6).
其中的10个随机碱基用于在高通量测序中区分不同的样本。
8-2反应体系包括:上步连接产物,正反向PCR引物,高保真DNA聚合酶,DNA聚合酶buffer。
8-3反应条件:98℃变性2min;98℃,15s,60℃,30s,72℃,30s。该过程循环反应8-15个循环。然后72℃反应5min。
9.磁珠法进行PCR产物纯化,得出目的产物,回收得到文库。
10.对文库进行上机测序得到测序数据。
11.测序数据分析。使用FastQC软件对上一步获得的测序数据进行质控,然后把测序序列与标准人类基因组序列通过比对软件BWA进行比对,获得定位于人类基因组相应位置的信息,即生成SAM格式文件,最后根据SAM文件中比对标签,通过SAMtools软件获得正负链片段数偏差值(图2)。
结果显示,癌症样本的血液游离DNA分子(红色线条)和健康对照样本(黄色线条)的血液游离DNA分子在相同染色体区域的正负链信号有显著差异。
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。本领域的技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
FastQC、BWA、SAMtools为软件名称,在国内是没有业界通用中文名称,都是直接用英文或缩写进行描述。
Claims (14)
1.一种基于从个体获取的生物样品检测癌症的方法,包含:
a)确定所述生物样品中的单链DNA分子和双链DNA分子中的每一条DNA链的序列以及含量;
b)根据a)的结果,确定所述DNA链在所述个体的基因组中的位置,并鉴别所述DNA链是对应的所述基因组中的DNA正链或DNA负链;
c)确定所述基因组中一个或多个特定区域的所述DNA正链和所述DNA负链的差异信息;
d)根据所述差异信息,判断所述个体是否患有所述癌症。
2.根据权利要求1所述的方法,其特征在于,在步骤d)中,通过比较每个所述特定区域的所述DNA正负链差异信息与不同类型的癌症样本的对应DNA正负链差异信息参考值,判断所述个体是否患有所述癌症。
3.根据权利要求1或2所述的方法,其特征在于,所述基因组的特定区域的长度为至少50bp,至少200bp,至少500bp,至少1000bp,至少2000bp,至少5000bp,至少10000bp,或至少20000bp。
4.根据权利要求1-3任一项所述的方法,其特征在于,在步骤c)中,选择至少2个,至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个,或至少10个所述特定区域。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述差异信息为正负链相对覆盖率,DNA链末端序列,DNA突变,或其任意组合。
6.根据权利要求5所述的方法,其特征在于,所述差异信息为DNA正负链的相对覆盖率,所述相对覆盖率的计算方法为(i)获得所述特定区域的所述DNA正链的片段数和所述DNA负链的片段数;(ii)将所述DNA正链的所述片段数除以所述DNA负链的所述片段数,以获得所述相对覆盖率。
7.根据权利要求1-6任一项所述的方法,其特征在于,在步骤a)中使用高通量测序技术确定所述每一条DNA链的序列以及含量;优选地,所述高通量测序技术使用的文库构建方式可以区分DNA分子的正负链。
8.根据权利要求1-7任一项所述的方法,其特征在于,使用的文库构建方式是单链DNA建库技术。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述方法进一步包括计算所述癌症的肿瘤的尺寸及其DNA正负链差异信息的校准函数,从而使用所述校准函数判断所述肿瘤的尺寸。
10.根据权利要求9所述的方法,其中,所述校准函数是利用来自有已知尺寸的肿瘤的生物体的参考样品的数据对确定的。
11.根据权利要求1-10任一项所述的方法,其特征在于,所述癌症为肝细胞癌,结直肠癌,食管癌,或胃癌。
12.根据权利要求1-11任一项所述的方法,其特征在于,所述生物样品为血液,血浆,或血清。
13.根据权利要求1-12任一项所述的方法,其特征在于,所述单链DNA分子和双链DNA分子包含血浆游离DNA。
14.一种计算机系统,其特征在于,能够实现根据权利要求1-13任一项所述的方法中的b)-d)步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211409380.5A CN118006770A (zh) | 2022-11-09 | 2022-11-09 | 使用游离dna分子的正负链差异检测癌症 |
PCT/CN2023/130137 WO2024099301A1 (zh) | 2022-11-09 | 2023-11-07 | 游离dna分子的正负链信号检测分析 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211409380.5A CN118006770A (zh) | 2022-11-09 | 2022-11-09 | 使用游离dna分子的正负链差异检测癌症 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118006770A true CN118006770A (zh) | 2024-05-10 |
Family
ID=90957360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211409380.5A Pending CN118006770A (zh) | 2022-11-09 | 2022-11-09 | 使用游离dna分子的正负链差异检测癌症 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN118006770A (zh) |
WO (1) | WO2024099301A1 (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10822651B2 (en) * | 2016-10-28 | 2020-11-03 | Grail, Inc. | Methods for single-stranded nucleic acid library preparation |
CN106987585B (zh) * | 2017-03-15 | 2019-11-12 | 深圳市海普洛斯生物科技有限公司 | 一种针对cfDNA的单链DNA二代测序文库构建方法 |
CN109797197A (zh) * | 2019-02-11 | 2019-05-24 | 杭州纽安津生物科技有限公司 | 一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用 |
CN110846411B (zh) * | 2019-11-21 | 2020-09-18 | 上海仁东医学检验所有限公司 | 一种基于二代测序的单独肿瘤样本区分基因突变类型的方法 |
CN111254194B (zh) * | 2020-01-13 | 2021-09-07 | 东南大学 | 基于cfDNA的测序及数据分析的癌症相关生物标记及其在cfDNA样品分类中的应用 |
CN112397143B (zh) * | 2020-10-30 | 2022-06-21 | 深圳思勤医疗科技有限公司 | 基于血浆多组学多维特征和人工智能预测肿瘤风险值的方法 |
-
2022
- 2022-11-09 CN CN202211409380.5A patent/CN118006770A/zh active Pending
-
2023
- 2023-11-07 WO PCT/CN2023/130137 patent/WO2024099301A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024099301A1 (zh) | 2024-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Salk et al. | Enhancing the accuracy of next-generation sequencing for detecting rare and subclonal mutations | |
EP3918089A1 (en) | Compositions and methods for isolating cell-free dna | |
WO2016101258A1 (zh) | 一种检测与人体异常状态相关的差异甲基化CpG岛的方法 | |
US11359233B2 (en) | Methods for labelling nucleic acids | |
JP2020527340A (ja) | セルフリーdna中のdnaメチル化を評価するための方法およびシステム | |
CN110643680B (zh) | 适用于超微量dna测序的接头及其应用 | |
WO2021067484A1 (en) | Compositions and methods for analyzing cell-free dna in methylation partitioning assays | |
EP3272865A1 (en) | High-sensitivity method for detecting target nucleic acid | |
US20170321270A1 (en) | Noninvasive prenatal diagnostic methods | |
US20220177874A1 (en) | Methods for library preparation to enrich informative dna fragments using enzymatic digestion | |
WO2019076018A1 (zh) | 一种用于检测目的基因低频突变的扩增子文库的构建方法 | |
CN104264231A (zh) | 构建测序文库的方法及其应用 | |
JP2023544720A (ja) | Dnaメチル化分配アッセイのシグナル対ノイズ比を改善するための方法およびシステム | |
CN116323977A (zh) | 用于核酸分析的组合物和方法 | |
CN115679000A (zh) | 微小残留病灶的检测方法、装置、设备和存储介质 | |
JP2024056984A (ja) | エピジェネティック区画アッセイを較正するための方法、組成物およびシステム | |
WO2023226939A1 (zh) | 用于检测结直肠癌淋巴结转移的甲基化生物标记物及其应用 | |
CN116219020B (zh) | 一种甲基化内参基因及其应用 | |
CN118006770A (zh) | 使用游离dna分子的正负链差异检测癌症 | |
CN117441027A (zh) | Heatrich-BS:用于亚硫酸氢盐测序的富含CpG的区域的热富集 | |
CN114746560A (zh) | 改进甲基化多核苷酸结合的方法、组合物和系统 | |
US20210027859A1 (en) | Method, Apparatus and System to Detect Indels and Tandem Duplications Using Single Cell DNA Sequencing | |
US20240229112A1 (en) | Compositions and methods for analyzing cell-free dna in methylation partitioning assays | |
JP2023524681A (ja) | 分配された核酸を使用した配列決定のための方法 | |
CN118048450A (zh) | 使用miRNA亚型的家族占比检测癌症 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |