CN112760384B - 一种胰腺癌预后判定方法及装置 - Google Patents

一种胰腺癌预后判定方法及装置 Download PDF

Info

Publication number
CN112760384B
CN112760384B CN202110364809.2A CN202110364809A CN112760384B CN 112760384 B CN112760384 B CN 112760384B CN 202110364809 A CN202110364809 A CN 202110364809A CN 112760384 B CN112760384 B CN 112760384B
Authority
CN
China
Prior art keywords
pancreatic cancer
prognosis
risk score
copy number
number variation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110364809.2A
Other languages
English (en)
Other versions
CN112760384A (zh
Inventor
张守伟
赵义
方璐
何骥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Precision Medical Laboratory Co ltd
Zhenhe Beijing Biotechnology Co ltd
Original Assignee
Wuxi Precision Medical Laboratory Co ltd
Zhenhe Beijing Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Precision Medical Laboratory Co ltd, Zhenhe Beijing Biotechnology Co ltd filed Critical Wuxi Precision Medical Laboratory Co ltd
Priority to CN202110364809.2A priority Critical patent/CN112760384B/zh
Publication of CN112760384A publication Critical patent/CN112760384A/zh
Application granted granted Critical
Publication of CN112760384B publication Critical patent/CN112760384B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Evolutionary Biology (AREA)
  • Oncology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本申请公开了一种胰腺癌预后判定方法及装置,属于医学检测技术领域。本申请的方法包括检测胰腺癌患者的肿瘤组织DNA样本中关于胰腺癌的显著相关性基因,并确定所述显著相关性基因的拷贝数变异数值;根据所述的显著相关性基因的拷贝数变异数值及预后检测模型,确定胰腺癌患者的风险分数;根据所述的风险分数确定胰腺癌患者预后情况;本申请的装置包括基因检测模块、风险分数确定模块、预后评估模块。利用本申请所提出的方法及装置,基于胰腺癌肿瘤组织DNA样本测序获得原始数据,降低了对样本质量的要求,客观性较强,具有较高的临床应用价值。

Description

一种胰腺癌预后判定方法及装置
技术领域
本申请属于医学检测技术领域,具体涉及一种胰腺癌预后判定方法及装置。
背景技术
胰腺癌在中国是一种较为高发且难治的癌症,据2015年的中国癌症数据统计显示,胰腺癌的发病率在癌症领域排名第9,而死亡率排名第6。为了提高胰腺癌的精准诊疗水平以及治愈率,如何对胰腺癌患者的预后状态进行判断就显得尤为重要。
目前,针对胰腺癌的预后判断存在很多技术方案,但这些技术方案存在不同的缺陷。首先,一类技术方案是基于单一临床因素对胰腺癌患者的预后进行判断,包括ECOG表现状态(Eastern Cooperative Oncology Group Performance Status)、肿瘤标志物CA 19-9水平和年龄等,但是基于单一临床因素进行的预后判断效能不够,易受其他因素影响。第二,一类技术方案是基于多个临床因素计算预后分数,根据分数的高低对患者预后进行判断,但该类方案在针对不同临床因素对应分数的设定上存在较大的主观因素,影响预后判断的准确性。第三,一类技术方案是基于胰腺癌高频突变基因(KRAS/TP53/SMAD4/CDKN2A)的突变状态对患者进行预后判断,但是高频突变基因的突变状态和中国胰腺癌患者的预后不具有显著相关性。第四,一类技术方案是基于肿瘤组织的转录谱筛选基因并构建预后检测模型对胰腺癌患者的预后进行判断,但该类方案在获取数据时对肿瘤组织的质量要求较高,限制了该方案的临床应用。因此,通过对现有技术的分析可以看出,目前对胰腺癌的预后判断技术并不理想。
发明内容
技术问题:针对现有对胰腺癌预后判断的技术不佳的问题,本申请提供一种胰腺癌预后预测方法及装置,从而能够对胰腺癌患者进行准确的预后判断。
技术方案:本申请一方面提供一种胰腺癌预后判定方法,包括:
检测胰腺癌患者的肿瘤组织DNA样本中关于胰腺癌的显著相关性基因,并确定所述显著相关性基因的拷贝数变异数值;
根据所述的显著相关性基因的拷贝数变异数值及预后检测模型,确定胰腺癌患者的风险分数;
根据所述的风险分数确定胰腺癌患者预后情况。
进一步地,还包括根据所述的显著相关性基因的拷贝数变异数值构建预后检测模型。
进一步地,根据所述的显著相关性基因的拷贝数变异数值构建预后检测模型的方法包括:
收集若干例胰腺癌患者的肿瘤组织DNA样本,构建胰腺癌肿瘤数据集,并按比例划分为训练集和测试集;
针对每个肿瘤组织DNA样本选取若干个与胰腺癌有关的基因,用于预后检测模型构建;
计算每个基因的拷贝数变异数值;
基于每个基因的拷贝数变异数值,采用Cox回归分析方法进行预后检测模型构建,并利用弹性网络方法筛选出所述的相关性基因,并经过留一交叉验证构建出最终预后检测模型。
进一步地,基于所述显著性基因构建的预后检测模型为:
风险分数=-0.1136*RAD50+0.6140*AKT1+0.5643*CSF1R-0.3089*JAK2-0.2088*ABL1
其中,RAD50、AKT1、CSF1R、JAK2和ABL1为所述显著相关性基因,将所述显著相关性基因的拷贝数变异数值对应带入预后检测模型,得到风险分数。
进一步地,根据所述的风险分数确定胰腺癌患者预后情况的方法包括:
所述风险分数大于或等于风险分数阈值,则判定胰腺癌患者预后情况不好;
所述风险分数小于风险分数阈值则判定胰腺癌患者预后情况良好。
进一步地,所述风险分数阈值的确定方法包括:
基于预后检测模型及训练集中胰腺癌肿瘤组织DNA样本中显著相关性基因的拷贝数变异数值,计算每位患者的风险分数;
基于每位患者的风险分数,选择一个数值能够将患者分为高风险组和低风险组,当两组患者之间具有最大的预后差异时,所选择的数值确定为风险分数阈值。
进一步地,所述构建预后检测模型的方法还包括:验证预后检测模型的效能,验证方法包括:
基于预后检测模型及测试集中胰腺癌肿瘤组织样本中显著相关性基因的拷贝数变异数值,计算每位患者的风险分数;
基于所述风险分数阈值,将测试集分为高风险组和低风险组,并比较两组患者之间的预后差异。
进一步地,所述确定基因的拷贝数变异数值的方法包括:
对胰腺癌肿瘤组织DNA样本的测序数据进行过滤,包括对测序接头序列以及低质量碱基的移除;
将过滤后的测序数据比对到人类基因组上;
对比对结果进行处理,包括依赖基因组坐标对比对结果进行排序以及对比对结果中的重叠区域进行标记;
采用若干个健康人白细胞测序数据为每个基因捕获区域构建覆盖深度基线,并以肿瘤组织测序数据中该区域覆盖深度和基线覆盖深度比值的log2转化值作为该区域的拷贝数变异数值,对于每一个基因,取该基因范围所覆盖所有捕获区域拷贝数变异数值的中位数作为该基因的拷贝数变异数值。
另一方面,本申请提供一种胰腺癌预后检测装置,包括:
基因检测模块,用于检测胰腺癌患者的肿瘤组织DNA样本中关于胰腺癌的显著相关性基因,确定显著相关性基因的拷贝数变异数值;
风险分数确定模块,用于根据所述的显著相关性基因的拷贝数变异数值及预后检测模型,确定胰腺癌患者的风险分数;
预后评估模块,用于根据所述的风险分数确定胰腺癌患者预后情况。
进一步地,还包括预后检测模型构建模块,用于根据所述的显著相关性基因的拷贝数变异数值,构建预后检测模型。
有益效果:利用本申请的实施例中所提出的胰腺癌预后判定方法,通过检测胰腺癌的显著相关性基因,并根据显著相关性基因的拷贝数变异数值及预后检测模型,计算胰腺癌患者的风险分数,并根据风险分数对胰腺癌患者的预后情况进行判断,相对于现有技术,基于胰腺癌肿瘤组织DNA样本测序获得原始数据,降低了对样本质量的要求,并且客观性较强,具有较高的临床应用价值。
附图说明
图1为本申请实施例中的胰腺癌预后判定方法的流程图;
图2为本申请实施例中计算基因的拷贝数变异数值的流程图;
图3为本申请实施例中构建预后检测模型的方法流程图。
具体实施方式
下面结合实施例和说明书附图对本发明作进一步的说明。
如图1示出了本申请的实施例中胰腺癌预后判定方法的流程图,结合图1,该方法包括:
步骤S100:检测胰腺癌患者的肿瘤组织DNA样本中关于胰腺癌的显著相关性基因,并确定所述显著相关性基因的拷贝数变异数值。
对于胰腺癌患者,并不是所有与胰腺癌相关的基因都能够用于对胰腺癌患者的预后情况进行预测判断,如果对所有与胰腺癌相关的基因都进行检测,那么会极大的增加检测人员的工作量,从而不便于临床应用。因此,在本申请的实施例中,通过检测与胰腺癌具有显著相关性的基因,即可完成胰腺癌的预后检测,从而便于临床应用。对于所需要检测的相关性基因的种类,是在进行预后检测模型的构建过程中确定,具体在下文中会详细说明。
步骤S200:根据所述的显著相关性基因的拷贝数变异数值及预后检测模型,确定胰腺癌患者的风险分数。
当确定了胰腺癌的显著相关性基因,并计算得到相应的拷贝数变异数值之后,将显著相关性基因的拷贝数变异数值带入预后检测模型,即可得到胰腺癌患者的风险分数,然后根据胰腺癌患者的风险分数,从而判断出胰腺癌患者的预后情况。
步骤S300:根据所述的风险分数确定胰腺癌患者预后情况。
在本申请的实施例中,在根据风险分数确定胰腺癌患者预后情况时,如果风险分数大于或等于风险分数阈值,则判定胰腺癌患者预后情况不好;如果风险分数小于风险分数阈值则判定胰腺癌患者预后情况良好。
利用本申请的实施例中所提出的胰腺癌预后判定方法,通过检测胰腺癌的显著相关性基因,并根据显著相关性基因的拷贝数变异数值及预后检测模型,计算胰腺癌患者的风险分数,并根据风险分数对胰腺癌患者的预后情况进行判断,相对于现有技术,基于胰腺癌肿瘤组织DNA样本测序获得原始数据,降低了对样本质量的要求,并且客观性较强,具有较高的临床应用价值。
图2示出了本申请的实施例中确定基因的拷贝数变异数的方法流程,具体的,在本申请的实施例中,确定任一基因的拷贝数变异数的方法为:
S101:对胰腺癌肿瘤组织DNA样本的测序数据进行过滤,包括对测序接头序列以及低质量碱基的移除;在本申请的具体操作过程中,采用Trimmomatic(v0.36)。
S102:将过滤后的测序数据比对到人类基因组上;具体操作时,是采用BWA(v0.7.17)软件将过滤后的测序数据比对到hg19版本的人类基因组上,在软件参数保持默认的情况下完成比对。
S103:对比对结果进行处理,包括依赖基因组坐标对比对结果进行排序以及对比对结果中的重叠区域进行标记;具体的,采用软件Picard(v2.23.0),软件参数保持默认的情况下对比对结果完成处理。
S104:采用30个健康人白细胞测序数据为每个基因捕获区域构建覆盖深度基线,并以肿瘤组织测序数据中该区域覆盖深度和基线覆盖深度比值的log2转化值作为该区域的拷贝数变异数值,对于每一个基因,取该基因范围所覆盖所有捕获区域拷贝数变异数值的中位数作为该基因的拷贝数变异数值。在本申请的实施例具体操作过程中,采用软件CNVkit(v0.9.2),参数保持默认,鉴定模式选择“reference”,从而完成基因的拷贝数变异数值的计算。
为了能够更好的对胰腺癌进行预后检测,在本申请的实施例中,还包括预后检测模型的构建方法,具体的,预后检测模型的构建是基于显著相关性基因的拷贝数变异数值构建出来的。在一个实施例中,预后检测模型的构建方法包括:
步骤S201:收集若干例胰腺癌患者的肿瘤样本,构建胰腺癌肿瘤数据集,并按比例分为训练集和测试集。
在本申请的实施例中,总共收集了233例中国人群的胰腺癌患者的肿瘤样本,构建了一个胰腺癌肿瘤样本数据集,并按照2:1的比例将肿瘤样本数据划分为训练集和测试集。
步骤S202:针对每个胰腺癌肿瘤DNA样本选取若干个基因,用于预后检测模型构建。因为每个肿瘤样本组织中包括大量的基因,但并不是每个基因都与胰腺癌有关,因此,在构建预后检测模型的过程中,筛选出若干与胰腺癌相关的基因用于预后检测模型的构建。具体的,在本申请的实施例中,基于Reactome(https://reactome.org/)数据库,选取了富集于DNA repair、RTK related signaling pathways和HRR pathway 的73个基因用于构建预后检测模型,具体参见表1。
表1 与胰腺癌有关的基因
Figure 471367DEST_PATH_IMAGE001
步骤S203:计算每个基因的拷贝数变异数值。针对表1中的每个基因,可按照步骤S101-S104的方法计算拷贝数变异数值。
步骤S204:基于每个基因的拷贝数变异数值,采用Cox回归分析方法进行预后检测模型构建,并利用弹性网络方法筛选出所述的相关性基因,并经过留一交叉验证构建出最终预后检测模型。
具体的,在本申请的实施例中,利用R软件中的R package glmnet软件包,采用Cox回归分析方法构建胰腺癌预后检测模型,然而并非所有基因都与胰腺癌具有显著相关性,因此,采用弹性网络算法进行变量惩罚,筛选出胰腺癌的显著相关性基因,然后经过留一交叉验证,构建得到最终的预后检测模型。
在申请的实施例中,共筛选出5个显著相关性基因,分别为RAD50、AKT1、CSF1R、JAK2和ABL1,构建出的预后检测模型为:
风险分数=-0.1136*RAD50+0.6140*AKT1+0.5643*CSF1R-0.3089*JAK2-0.2088*ABL1
在上述模型的实施例中,在进行胰腺癌预后检测时,只需要检测上述5个胰腺癌的显著相关性基因,然后将对应基因的拷贝数变异数值带入上述模型中,即可以得到胰腺癌患者的风险分数,然后通过将风险分数与风险分数阈值进行比较,从而判断出胰腺癌患者的预后情况。基于基因的拷贝数变异数值,进行预后检测模型的构建,客观性较强,并且可以看出所构建的模型仅需要5个显著相关性基因,即可确定胰腺癌患者的风险分数,因此操作简单,从而具有较好的临床应用价值。
在本申请的实施例中,风险分数阈值采用如下方法进行确定。
首先,基于预后检测模型及训练集中胰腺癌肿瘤组织样本中显著相关性基因的拷贝数变异数值,计算每位患者的风险分数。
然后基于每位患者的风险分数,选择一个数值能够将患者分为高风险组和低风险组,当两组患者之间具有最大的预后差异时,所选择的数值确定为风险分数阈值。在本申请的实施例中,采用R软件中的R package maxstat包,将训练集分为高风险组和低风险组,使得两组患者之间具有最大的预后差异,确定的风险分数阈值为-0.0958。其中,高风险组包含119例样本,低风险组包含36例样本,并且高风险组性对于低风险组,风险比HR=5.9,置信度95%CI=2.36-14.61,显著性P=1.6×10-5,表明风险分数值越低,预后趋向于越好,因此根据胰腺癌患者的风险分数与风险分数阈值对比后,即可判断胰腺癌患者的预后情况。
为了对预后检测模型的效能进行验证,在本申请的实施例中,采用如下方法对模型的效能进行验证。
首先,基于预后检测模型及测试集中胰腺癌肿瘤组织样本中显著相关性基因的拷贝数变异数值,计算每位患者的风险分数;然后基于所得到的风险分数阈值,将测试集同样分为高风险组和低风险组,并比较两组患者之间的预后差异。在本申请的实施例中,对于测试集而言,高风险组包括58例样本,低风险组包括20例样本,并且高风险组相对于低风险组而言,风险比HR=2.6,置信度95%CI=1.02-6.69,显著性P=3.8×10-2。同样表明,风险分数值越低,预后趋向于越好,因此,对所构建的预后检测模型的效能进行了有效的验证,说明,利用本申请的实施例中所构建的预后检测模型,可以明显的区分出胰腺癌患者预后的好坏,从而能够在临床应用过程中,客观地对胰腺癌患者的预后情况进行判断。
进一步地,本申请基于所提出的胰腺癌预后判定方法,提出了一种胰腺癌预后检测装置,在本申请的一个实施例中,该装置包括基因检测模块、风险分数确定模块、预后评估模块。其中,基因检测模块用于检测胰腺癌患者的肿瘤组织中关于胰腺癌的显著相关性基因,确定显著相关性基因的拷贝数变异数值;风险分数确定模块用于根据所述的显著相关性基因的拷贝数变异数值及预后检测模型,确定胰腺癌患者的风险分数;预后评估模块用于根据所述的风险分数确定胰腺癌患者预后情况。
在本申请的另一实施例中,检测装置还包括预后检测模型构建模块,用于根据所述的显著相关性基因的拷贝数变异数值,构建预后检测模型。
利用本申请的实施例中所提出的预后检测装置,能够客观地对胰腺癌患者的预后情况进行判定,具有较高的临床应用价值。
上述实施例仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和等同替换,这些对本发明权利要求进行改进和等同替换后的技术方案,均落入本发明的保护范围。

Claims (4)

1.一种胰腺癌预后判定装置,其特征在于,包括:基因检测模块,用于检测胰腺癌患者的肿瘤组织DNA样本中关于胰腺癌的显著相关性基因,确定显著相关性基因的拷贝数变异数值;其中,所述显著相关性基因为:RAD50、AKT1、CSF1R、JAK2和ABL1;
风险分数确定模块,用于根据所述的显著相关性基因的拷贝数变异数值及预后检测模型,确定胰腺癌患者的风险分数;其中,所述预后检测模型为:
风险分数=-0.1136*RAD50+0.6140*AKT1+0.5643*CSF1R-0.3089*JAK2-0.2088*ABL1;
预后评估模块,用于根据所述的风险分数确定胰腺癌患者预后情况;所述预后评估模块判断胰腺癌患者预后情况的方法包括:
所述风险分数大于或等于风险分数阈值,则判定胰腺癌患者预后情况不好;
所述风险分数小于风险分数阈值则判定胰腺癌患者预后情况良好;
所述风险分数阈值的确定方法包括:
基于预后检测模型及训练集中胰腺癌肿瘤组织DNA样本中显著相关性基因的拷贝数变异数值,计算每位患者的风险分数;
基于每位患者的风险分数,选择一个数值能够将患者分为高风险组和低风险组,当两组患者之间具有最大的预后差异时,所选择的数值确定为风险分数阈值。
2.根据权利要求1所述的装置,其特征在于,还包括预后检测模型构建模块,用于根据所述的显著相关性基因的拷贝数变异数值,构建预后检测模型;构建所述预后检测模型的方法为:收集若干例胰腺癌患者的肿瘤组织DNA样本,构建胰腺癌肿瘤数据集,并按比例划分为训练集和测试集;
针对每个肿瘤组织DNA样本选取若干个与胰腺癌有关的基因,用于预后检测模型构建;
计算每个基因的拷贝数变异数值;
基于每个基因的拷贝数变异数值,采用Cox回归分析方法进行预后检测模型构建,并利用弹性网络方法筛选出所述的相关性基因,并经过留一交叉验证构建出最终预后检测模型。
3.根据权利要求2所述的装置,其特征在于,在预后检测模型构建模块中,构建预后检测模型的方法还包括:验证预后检测模型的效能;
验证方法包括:
基于预后检测模型及测试集中胰腺癌肿瘤组织样本中显著相关性基因的拷贝数变异数值,计算每位患者的风险分数;
基于所述风险分数阈值,将测试集分为高风险组和低风险组,并比较两组患者之间的预后差异。
4.根据权利要求1所述的装置,其特征在于,所述基因检测模块中确定基因的拷贝数变异数值的方法包括:
对胰腺癌肿瘤组织DNA样本的测序数据进行过滤,包括对测序接头序列以及低质量碱基的移除;
将过滤后的测序数据比对到人类基因组上;
对比对结果进行处理,包括依赖基因组坐标对比对结果进行排序以及对比对结果中的重叠区域进行标记;
采用若干个健康人白细胞测序数据为每个基因捕获区域构建覆盖深度基线,并以肿瘤组织测序数据中该区域覆盖深度和基线覆盖深度比值的log2转化值作为该区域的拷贝数变异数值,对于每一个基因,取该基因范围所覆盖所有捕获区域拷贝数变异数值的中位数作为该基因的拷贝数变异数值。
CN202110364809.2A 2021-04-06 2021-04-06 一种胰腺癌预后判定方法及装置 Active CN112760384B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110364809.2A CN112760384B (zh) 2021-04-06 2021-04-06 一种胰腺癌预后判定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110364809.2A CN112760384B (zh) 2021-04-06 2021-04-06 一种胰腺癌预后判定方法及装置

Publications (2)

Publication Number Publication Date
CN112760384A CN112760384A (zh) 2021-05-07
CN112760384B true CN112760384B (zh) 2021-06-25

Family

ID=75691138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110364809.2A Active CN112760384B (zh) 2021-04-06 2021-04-06 一种胰腺癌预后判定方法及装置

Country Status (1)

Country Link
CN (1) CN112760384B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114045286A (zh) * 2021-11-22 2022-02-15 上海交通大学医学院附属瑞金医院 用于胰腺癌分子分型的基因集及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006246241A1 (en) * 2005-05-13 2006-11-16 Universite Libre De Bruxelles Gene-based algorithmic cancer prognosis
CN112037851A (zh) * 2020-06-29 2020-12-04 中山大学附属第六医院 自噬相关基因在结直肠癌预后的试剂盒和系统中的应用

Also Published As

Publication number Publication date
CN112760384A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN109033749B (zh) 一种肿瘤突变负荷检测方法、装置和存储介质
CN109767810B (zh) 高通量测序数据分析方法及装置
CN112802548B (zh) 单样本全基因组预测等位基因特异性拷贝数变异的方法
CN107391965A (zh) 一种基于高通量测序技术的肺癌体细胞突变检测分析方法
CN106778073B (zh) 一种评估肿瘤负荷变化的方法和系统
CN108256292B (zh) 一种拷贝数变异检测装置
CN110846411B (zh) 一种基于二代测序的单独肿瘤样本区分基因突变类型的方法
CN107423578A (zh) 检测体细胞突变的装置
CN110060733A (zh) 基于单样本的二代测序肿瘤体细胞变异检测装置
JP2008507993A (ja) 多重プローブターゲット相互作用パターンの自動分析:パターンマッチング及び対立遺伝子同定
CN112164423B (zh) 基于RNAseq数据的融合基因检测方法、装置和存储介质
CN113096728B (zh) 一种微小残余病灶的检测方法、装置、存储介质及设备
CN112766428A (zh) 肿瘤分子分型方法及装置、终端设备及可读存储介质
CN112760384B (zh) 一种胰腺癌预后判定方法及装置
CN116356001B (zh) 一种基于血液循环肿瘤dna的双重背景噪声突变去除方法
CN112746097A (zh) 一种检测样本交叉污染的方法以及预测交叉污染源的方法
CN116403644B (zh) 一种用于癌症风险预测的方法及装置
WO2019133937A1 (en) Microsatellite instabilty detection
CN111180013B (zh) 检测血液病融合基因的装置
CN108460248B (zh) 一种基于Bionano平台检测长串联重复序列的方法
KR102217272B1 (ko) 유전체 변이 정보를 이용한 질병 진단 바이오마커 추출 방법
CN115232875A (zh) 基于尿液鉴定肾盂癌病人不同类型癌细胞的方法及系统
CN114067908B (zh) 一种评估单样本同源重组缺陷的方法、装置和存储介质
CN109762881A (zh) 一种用于检测肿瘤患者血液ctDNA中的超低频突变位点的生物信息方法
CN111733229B (zh) 一种精神分裂症遗传风险分型试剂盒及分型装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant