CN114708916A - 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质 - Google Patents

微卫星稳定性的检测方法、检测装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114708916A
CN114708916A CN202210255054.7A CN202210255054A CN114708916A CN 114708916 A CN114708916 A CN 114708916A CN 202210255054 A CN202210255054 A CN 202210255054A CN 114708916 A CN114708916 A CN 114708916A
Authority
CN
China
Prior art keywords
sample
microsatellite
state
stability
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210255054.7A
Other languages
English (en)
Other versions
CN114708916B (zh
Inventor
王维锋
刘成琨
郑新
姚继成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhiben Medical Laboratory Co ltd
Origimed Technology Shanghai Co ltd
Original Assignee
Shanghai Zhiben Medical Laboratory Co ltd
Origimed Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhiben Medical Laboratory Co ltd, Origimed Technology Shanghai Co ltd filed Critical Shanghai Zhiben Medical Laboratory Co ltd
Priority to CN202210255054.7A priority Critical patent/CN114708916B/zh
Publication of CN114708916A publication Critical patent/CN114708916A/zh
Application granted granted Critical
Publication of CN114708916B publication Critical patent/CN114708916B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种微卫星稳定性的检测方法、检测装置、计算机设备及存储介质。上述微卫星稳定性的检测方法和检测装置,结合统计模型和相关基因位点,能够实现在没有阴性参照样本的情况下对微卫星稳定性状态进行评估,较传统的检测方法,提高了效率,降低了检测成本,提高了准确性。

Description

微卫星稳定性的检测方法、检测装置、计算机设备及存储介质
技术领域
本发明涉及生物信息学领域,特别是涉及一种微卫星稳定性的检测方法、检测装置、计算机设备及存储介质。
背景技术
微卫星不稳定性(Microsatellite Instability,MSI)是DNA复制及损伤过程中出现的碱基错配、未配或多配造成的现象,表现为同一微卫星位点在不同个体之间的差异,或者同一个体的正常组织与某些异常组织之间重复单位的差异。
由一系列特异性修复DNA碱基错配的酶组成的DNA错配修复(mismatch repair,MMR)系统能够查出MSI并进行修复,保证复制的准确性。如果MMR修复系统出现故障,如参与MMR修复的基因发生了突变,则有可能导致MSI和整个基因组的不稳定性,最终可能造成细胞增殖分化异常和肿瘤的发生。
通过MSI检测,可以评价MMR系统功能,从而预测癌症患者是否对免疫疗法敏感。目前MSI相关的检测方法主要有3种:
1)免疫组化(Immunohistochemistry,IHC):通过使用相应抗体检测四种常见错配修复基因(MLH1、MSH2、MSH6和PMS2)的表达情况,明确是否存在错配修复缺陷。存在1种及以上蛋白表达阴性即为错配修复缺陷(deficient mismatch repair,dMMR),否则为错配修复蛋白完整(proficient mismatch repair,pMMR)。其优势在于应用性广泛,并且能确定哪些MMR蛋白在肿瘤细胞中表达缺失。但是IHC本身存在主观性,同时受抗体质量和实验因素等影响,有时无法检出某些蛋白的变化,导致MMR结果偶有报错。
2)基于PCR(Polymerase Chain Reaction)的方法:主要采用多重荧光PCR结合毛细管电泳的方法,通过PCR扩增特定的微卫星序列,然后通过毛细管电泳比较肿瘤组织与正常组织微卫星序列长度的差异来判断该位点是否存在MSI现象。这种检测方法是公认的MSI检测的金标准,也是使用最广泛的方法。PCR检测方法不仅弥补了IHC在因非截断式错义突变导致的MSI无法检出的漏洞,同时还具备良好的可重复性。但是,其检测的基因(panel)的位点较少、通量较低、无法提供具体的基因突变信息,而且实验周期较长。
3)基于NGS(Next-Generation Sequencing)的方法:与PCR相比,NGS方法通量大,涉及基因范围广、灵敏度和特异性更高,可与靶点的突变检测和肿瘤突变负荷(tumormutation burden,TMB)检测等共用一份测序数据。在目前已发表的NGS方法中,一般都是以PCR检测结果作为金标准,通过比较二者结果一致性作为评价NGS检测性能的标准。但目前基于NGS检测方法都需要以正常样本为参照,增加了取样步骤。
发明内容
基于此,有必要提供一种微卫星稳定性的检测方法,以能够实现对样本微卫星稳定性的无参且较为准确的检测。
此外,还提供一种微卫星稳定性的检测装置、一种计算机设备和一种计算机存储介质。
一种微卫星稳定性的检测方法,包括以下步骤:
获取待测样本的测序数据;
根据待测样本的测序数据,得到待测样本的突变基因状态矩阵
Figure BDA0003548371020000021
其中,t为所有待测样本的待分析的基因数量,q=(b1t,b2t,b3t,...,bnk)T,b为各待测样本的目标位点的突变状态,n为待测样本的样本量,k=1,2,3,...,t;及
根据预设的系数β和公式
Figure BDA0003548371020000031
得到yv,yv=(d1,d2,d3,...,dn)T,d代表得到的各待测样本的微卫星稳定性状态,n为待测样本的样本量。
在其中一个实施例中,上述微卫星稳定性的检测方法还包括如下确定预设的系数β的步骤:
获取已确定微卫星稳定性状态的训练样本的测序数据,作为训练集测序数据;
根据训练集测序数据,得到训练样本的突变基因状态矩阵
Figure BDA0003548371020000032
其中,i为所有训练样本的待分析的突变基因数量,p=(a1j,a2j,a3j,...,amj)T,a为各训练样本的目标位点的突变状态,m为训练样本的样本量,j=1,2,3,...,i;及
根据由弹性网络回归得到的关系式
Figure BDA0003548371020000033
得到预设的系数β,其中,y=(c1,c2,c3,...,cm)T,c代表各训练样本的微卫星稳定性状态,m为训练样本的样本量。
在其中一个实施例中,λ1和λ2的计算包括步骤:令λ=λ1=λ2,采用5-折交叉验证估计得到λ。
在其中一个实施例中,上述检测方法中待测样本的测序数据和训练集测序数据是通过二代测序得到的。
一种微卫星稳定性的检测装置,包括以下模块:
测序数据获取模块,用于获取待测样本的测序数据;
突变状态获取模块,用于根据待测样本的测序数据,得到待测样本的突变基因状态矩阵
Figure BDA0003548371020000041
其中,t为所有待测样本的待分析的基因数量,q=(b1t,b2t,b3t,...,bnk)T,b为各待测样本的目标位点的突变状态,n为待测样本的样本量,k=1,2,3,...,t;及
微卫星稳定性状态检测模块,用于根据预设的系数β和公式
Figure BDA0003548371020000042
得到yv,yv=(d1,d2,d3,...,dn)T,d代表得到的各待测样本的微卫星稳定性状态,n为所述待测样本的样本量。
在其中一个实施例中,上述微卫星稳定性状态的检测装置还包括确定预设的系数β的模块,确定所述预设的系数β的模块还包括数据获取模块、状态获取模块和系数确定模块;其中数据获取模块用于获取已确定微卫星稳定性状态的训练样本的测序数据,作为训练集测序数据;状态获取模块用于根据所述训练集测序数据,得到训练样本的突变基因状态矩阵
Figure BDA0003548371020000043
其中,i为所有训练样本的待分析的突变基因数量,p=(a1j,a2j,a3j,...,amj)T,a为各训练样本的目标位点的突变状态,m为训练样本的样本量,j=1,2,3,...,i;系数确定模块用于根据由弹性网络回归得到的关系式
Figure BDA0003548371020000044
得到预设的系数β,其中,y=(c1,c2,t3,...,cm)T,c代表各训练样本的微卫星稳定性状态,m为训练样本的样本量。
在其中一个实施例中,上述系数确定模块中的λ1和λ2的计算包括步骤:令λ=λ1=λ2,采用5-折交叉验证估计得到λ。
在其中一个实施例中,上述检测装置中待测样本的测序数据和训练集测序数据是通过二代测序得到的。
一种计算机设备,具有处理器和存储器,存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如上述任一实施例中的微卫星稳定性的检测方法的步骤。
一种计算机存储介质,其上存储有计算机程序,计算机程序被执行时实现如上述任一实施例中的微卫星稳定性的检测方法的步骤。
上述微卫星稳定性的检测方法和检测装置,结合统计模型和相关基因位点,能够实现在没有阴性参照样本的情况下对微卫星稳定性状态进行评估,较传统的检测方法,提高了效率,降低了检测成本,提高了准确性。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本申请一实施方式提供了一种微卫星稳定性的检测方法,包括步骤S11、步骤S12和步骤S13。
具体地,步骤S11:获取待测样本的测序数据。
在一个可选的具体示例中,通过二代测序(Next Generation Sequencing,NGS)得到待测样本测序数据。具体地,采用二代测序能够方便快捷地获得大量样本的大量基因的测序数据,由于涉及的基因数量多,能够提高微卫星稳定性检测的灵敏度和准确性。可以理解的是,也可以采用其他测序方法得到待测样本测序数据。
步骤S12:根据待测样本的测序数据,得到待测样本的突变基因状态矩阵
Figure BDA0003548371020000061
其中,t为所有待测样本的待分析的基因数量,q=(b1t,b2t,b3t,...,bnk)T,b为各待测样本的目标位点的突变状态,n为待测样本的样本量,k=1,2,3,...,t。
具体地,根据待测样本的测序数据,得到待测样本的突变基因状态矩阵,即是将待测样本的测序数据分析得到各待测样本的各目标位点的突变状态,形成突变基因状态矩阵。例如,使用GATK(The Genome Analysis Toolkit)或lianti等软件可以获得各待测样本的各目标位点的突变状态(突变/未突变),如果有十个待测样本,每个待测样本包含有CDH1、EGFR、KMT2D、NFE2L2、RB1、SPTA1和TOP1七个基因,每个基因检测一个目标位点,可以得到每个待测样本的基因突变结果如表1所示:
表1
CDH1 EGFR KMT2D NFE2L2 RB1 SPTA1 top1
样本01 未突变 未突变 未突变 未突变 未突变 未突变 未突变
样本02 未突变 未突变 突变 未突变 突变 未突变 突变
样本03 未突变 未突变 未突变 未突变 未突变 未突变 未突变
样本04 突变 未突变 未突变 突变 未突变 突变 未突变
样本05 未突变 未突变 未突变 未突变 未突变 未突变 未突变
样本06 未突变 未突变 突变 未突变 未突变 未突变 未突变
样本07 未突变 突变 未突变 未突变 未突变 未突变 突变
样本08 未突变 未突变 未突变 未突变 未突变 未突变 未突变
样本09 突变 未突变 未突变 突变 未突变 未突变 未突变
样本010 未突变 未突变 未突变 未突变 未突变 突变 未突变
根据表1中的突变结果,即能得到如下突变基因状态矩阵:
Figure BDA0003548371020000071
步骤S13:根据预设的系数β和公式
Figure BDA0003548371020000072
得到yv,yv=(d1,d2,d3,...,dn)T,d代表得到的各待测样本的微卫星稳定性状态,n为待测样本的样本量。
具体地,
Figure BDA0003548371020000073
h为计算得到的各待测样本微卫星稳定性的OR值(Odds Ratio),微卫星稳定性状态通过d的数值判断,当d等于1时,表示该待测样本为微卫星高不稳定状态(MSI-H);当d等于0时,表示该待测样本为非微卫星高不稳定状态,即包括微卫星低不稳定状态(MSI-L)和微卫星稳定状态(MSS)。由于微卫星高不稳定状态与对免疫疗法的预后有较强相关性,而微卫星低不稳定状态与免疫疗法的预后相关性较弱,因此本申请中将微卫星高不稳定状态与微卫星低不稳定状态区分开。
在一些实施例中,上述微卫星稳定性的检测方法还包括步骤S131、步骤S132和步骤S133。
具体地,步骤S131:获取已确定微卫星稳定性状态的训练样本的测序数据,作为训练集测序数据。
在一个可选的具体示例中,采用与步骤S11相同的测序方法进行测序,具体地,采用相同的测序方法能够获得相同位点的测序数据,并保证测序误差的一致性,能够使检测结果更准确。
在一个可选的具体示例中,可以采用多重荧光PCR-毛细管电泳法确定训练样本的微卫星稳定性状态。可以理解的是,也可以采用其他方法确定训练样本的微卫星稳定性状态,例如免疫组化法。
在一个可选的具体示例中,获取的微卫星高不稳定状态的训练样本与非微卫星高不稳定状态的训练样本的数量较大且相近,保持两者样本数量相近可以提高检测的准确度,避免训练得到的模型对其中一类样本产生偏好,可以有效降低假阳性和假阴性结果的出现。
步骤S132:根据训练集测序数据,得到上述训练样本的突变基因状态矩阵
Figure BDA0003548371020000081
其中,i为所有上述训练样本的待分析的突变基因数量,p=(a1j,a2j,a3j,...,amj)T,a为各训练样本的目标位点的突变状态,m为训练样本的样本量,j=1,2,3,...,i。
具体地,该步骤中得到训练样本的突变基因状态矩阵的方法与步骤S11相同。
步骤S133:根据由弹性网络回归得到的关系式
Figure BDA0003548371020000091
得到预设的系数β,其中,y=(c1,c2,c3,...,cm)T,c代表各训练样本的微卫星稳定性状态,m为训练样本的样本量。
具体地,c为0或1,是根据训练样本已知的微卫星稳定性状态设定,若训练样本为微卫星高不稳定状态则记为1,否则记为0。
在一个可选的具体示例中,λ1和λ2的计算包括步骤:令λ=λ1=λ2,采用5-折交叉验证估计得到λ。可以理解的是,λ1和λ2为正则化系数,在其他一些实施例中,可以采用其他方法计算得出λ1和λ2的值,能实现最终计算出β的值即可。
可以理解的是,在经过步骤S131~步骤S133后,得到的β能直接用于步骤S13中微卫星稳定性的检测,不需要每次检测之前都重新确定β的值。因此,能够实现只取待测样本进行微卫星稳定性的检测,而不需要取正常样本作为阴性对照,实现了无参的微卫星稳定性检测。
此外,经过步骤S131~步骤S133,同时也实现了特征筛选,即筛选出了与微卫星不稳定相关的基因,也能够将筛选得到的这些基因用在与微卫星不稳定相关的其他研究上。
基于与上述微卫星稳定性的检测方法相同的思想,本申请一实施方式还提供了一种微卫星稳定性的检测装置,包括模块21、模块22和模块23。
具体地,模块21:测序数据获取模块,用于获取待测样本的测序数据。
模块22:突变状态获取模块,用于根据待测样本的测序数据,得到待测样本的突变基因状态矩阵
Figure BDA0003548371020000101
其中,t为所有待测样本的待分析的基因数量,q=(b1t,b2t,b3t,...,bnk)T,b为各待测样本的目标位点的突变状态,n为待测样本的样本量,k=1,2,3,...,t。
模块23:微卫星稳定性状态检测模块,用于根据预设的系数β和公式
Figure BDA0003548371020000102
得到yv,yv=(d1,d2,d3,...,dn)T,d代表得到的各待测样本的微卫星稳定性状态,n为待测样本的样本量。
在一些实施例中,上述微卫星稳定性的检测装置还包括模块231、模块232和模块233。
具体地,模块231:数据获取模块,用于获取已确定微卫星稳定性状态的训练样本的测序数据,作为训练集测序数据。
模块232:状态获取模块,用于根据训练集测序数据,得到训练样本的突变基因状态矩阵
Figure BDA0003548371020000103
其中,i为所有训练样本的待分析的突变基因数量,p=(a1j,a2j,a3j,...,amj)T,a为各训练样本的目标位点的突变状态,m为训练样本的样本量,j=1,2,3,...,i。
模块233:系数确定模块,用于根据由弹性网络回归得到的关系式
Figure BDA0003548371020000104
得到预设的系数β,其中,y=(c1,c2,c3,...,cm)T,c代表各训练样本的微卫星稳定性状态,m为训练样本的样本量。
可以理解的是,在采用已确定微卫星稳定性状态的训练样本进行训练时需要调用模块231~模块233,在训练完成后可直接将β的值输入微卫星稳定性的检测装置的模块23中,可直接用于对待测样本的微卫星稳定性的检测,不需要每次检测都调用模块231~模块233进行训练。
基于如上所述的各实施例,本发明还提供了一种计算机设备,具有处理器和存储器,存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如上述任一实施例和具体示例中的微卫星稳定性的检测方法的步骤。
基于如上所述的各实施例,本发明还提供了一种计算机存储介质,其上存储有计算机程序,计算机程序被执行时实现如上述任一实施例和具体示例中的微卫星稳定性的检测方法的步骤。
本领域普通技术人员可以理解实现上述方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性的计算机可读取存储介质中,该计算机程序在执行时,可包括如上各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其他介质的任何引用,均包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
上述微卫星稳定性的检测方法和检测装置,结合统计模型和相关基因位点,能够实现在没有阴性参照样本的情况下对微卫星稳定性状态进行评估,较传统的检测方法,提高了效率,降低了检测成本,提高了准确性。
具体实施例
以下采用具体实施例说明本发明的微卫星稳定性的检测方法产生的技术效果。
实施例1
1.获取训练样本
选取530个已确定微卫星稳定性状态的肿瘤样本作为训练样本,依次记为样本1~样本530。其中共270例微卫星高不稳定状态(MSI-H)样本,260例非微卫星高不稳定状态(MSI-L和MSS)样本,并将微卫星高不稳定状态记为1,否则记为0,并记成y=(c1,c2,c3,...,c530)T的形式,其中,c为各样本的微卫星稳定性状态,即(由于样本数量大,以下矩阵y中没有列出全部样本的微卫星未定型状态,只列举部分以示例):
Figure BDA0003548371020000121
2.获取训练样本突变基因的状态
采用二代测序对训练样本进行测序,获取测序数据,根据测序结果,将各目标位点的突变状态分为突变与未突变,将突变记为1,为突变记为0,如表2所示,并记成突变基因状态矩阵
Figure BDA0003548371020000122
其中,i为所有训练样本的待分析的突变基因数量,i=17105,p=(a1j,a2j,a3j,...,amj)T,a为各训练样本的目标位点的突变状态,m为样本量,m=530,j=1,2,3,...,i。由于样本和待分析的突变基因数量大,表2以及矩阵X中没有全部列出,只列举部分以示例。
表2
CDK8 CEBPA EPHA7 FGF21 GATA4 JAK3
样本1 1 0 0 0 0 0
样本2 0 0 1 0 1 0
样本3 0 0 0 0 0 0
样本528 0 1 0 0 0 0
样本529 1 0 0 0 0 1
样本530 0 0 0 1 0 0
将表2的内容记成突变基因状态矩阵为:
Figure BDA0003548371020000131
3.通过训练确定λ并计算出β
令λ=λ1=λ2,采用5-折交叉验证可估计得到λ。之后根据由弹性网络回归得到的关系式
Figure BDA0003548371020000132
计算得出β的值。其中,y和X分别为以上步骤1和步骤2中得到的。
4.验证本发明检测方法的准确性
将步骤1中的训练样本采用本发明的方法检测,即将步骤2中的矩阵X代入
Figure BDA0003548371020000133
得到微卫星稳定性检测结果,与原来已确定的微卫星稳定性结果进行比对,如表3所示。
表3
Figure BDA0003548371020000141
表3中,
Figure BDA0003548371020000142
Figure BDA0003548371020000143
TP:真阳性样本数;TN:真阴性样本数;FP:假阳性样本数;FN:假阴性样本数。
从表3可以看出,本发明的微卫星稳定性状态的检测方法的准确率、敏感性和特异性都很高,说明该方法能够用于微卫星稳定性状态的检测,在没有正常样本做阴性对照的条件下也能准确地确定样本的微卫星稳定性状态,且检测通量大,效率高。
5.检测待测样本的微卫星不稳定状态
获取40个待测样本,依次命名为待测样本1~待测样本40。采用二代测序对待测样本进行测序,获取测序数据,根据测序结果,将各目标位点的突变状态分为突变与未突变,将突变记为1,为突变记为0,如表4所示,并记为突变基因状态矩阵
Figure BDA0003548371020000144
其中,t为所有待测样本的待分析的基因数量,t=17105,q=(b1t,b2t,b3t,...,bnk)T,b为各待测样本的目标位点的突变状态,n为待测样本的样本量,n=40,k=1,2,3,...,t。由于样本量和基因数量较大,以下列举出部分结果以示例:
表4
CDK8 CEBPA EPHA7 FGF21 GATA4 JAK3
待测样本1 0 0 0 0 0 0
待测样本2 1 1 0 0 0 0
待测样本3 0 0 0 0 0 1
待测样本38 0 0 1 1 0 0
待测样本39 1 0 0 0 0 0
待测样本40 0 1 0 0 0 0
将表4的内容记成突变基因状态矩阵为:
Figure BDA0003548371020000151
将步骤3中计算得到的β代入
Figure BDA0003548371020000152
中计算得到yv,yv=(d1,d2,d3,...,dn)T,d代表得到的各待测样本的微卫星稳定性状态,
Figure BDA0003548371020000153
微卫星稳定性状态通过d的数值判断,当d等于1时,表示该待测样本为微卫星高不稳定状态(MSI-H);当d等于0时,表示该待测样本为非微卫星高不稳定状态,即包括微卫星低不稳定状态(MSI-L)和微卫星稳定状态(MSS)。以下列举出部分结果以示例:
Figure BDA0003548371020000161
根据yv,各待测样本对应的微卫星稳定性状态如表5所示(只列举部分以示例)。
表5
样本名称 微卫星稳定性状态
待测样本1 MSI-L或MSS
待测样本2 MSI-L或MSS
待测样本3 MSI-L或MSS
待测样本38 MSI-L或MSS
待测样本39 MSI-L或MSS
待测样本40 MSI-H
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。应当理解的是,在本领域技术人员在本发明提供的技术方案的基础上,通过合乎逻辑的分析、推理或有限的试验得到的技术方案,均在本发明所附权利要求的保护范围内。因此,本发明专利的保护范围应以所附权利要求为准,说明书可以用于解释权利要求的内容。

Claims (10)

1.一种微卫星稳定性的检测方法,其特征在于,包括以下步骤:
获取待测样本的测序数据;
根据所述待测样本的测序数据,得到所述待测样本的突变基因状态矩阵,
Figure FDA0003548371010000011
其中,t为所有所述待测样本的待分析的基因数量,q=(b1t,b2t,b3t,...,bnk)T,b为各所述待测样本的目标位点的突变状态,n为所述待测样本的样本量,k=1,2,3,...,t;及
根据预设的系数β和公式
Figure FDA0003548371010000012
得到yv,yv=(d1,d2,d3,...,dn)T,d代表得到的各所述待测样本的微卫星稳定性状态,n为所述待测样本的样本量。
2.根据权利要求1所述的检测方法,其特征在于,还包括如下确定所述预设的系数β的步骤:
获取已确定微卫星稳定性状态的训练样本的测序数据,作为训练集测序数据;
根据所述训练集测序数据,得到所述训练样本的突变基因状态矩阵
Figure FDA0003548371010000013
其中,i为所有所述训练样本的待分析的突变基因数量,p=(a1j,a2j,a3j,...,amj)T,a为各所述训练样本的目标位点的突变状态,m为所述训练样本的样本量,j=1,2,3,...,i;及
根据由弹性网络回归得到的关系式
Figure FDA0003548371010000014
得到所述预设的系数β,其中,y=(c1,c2,c3,...,cm)T,c代表各所述训练样本的微卫星稳定性状态,m为所述训练样本的样本量。
3.根据权利要求2所述的检测方法,其特征在于,λ1和λ2的计算包括步骤:令λ=λ1=λ2,采用5-折交叉验证估计得到λ。
4.根据权利要求2或3所述的检测方法,其特征在于,所述待测样本的测序数据和所述训练集测序数据是通过二代测序得到的。
5.一种微卫星稳定性的检测装置,其特征在于,包括以下模块:
测序数据获取模块,用于获取待测样本的测序数据;
突变状态获取模块,用于根据所述待测样本的测序数据,得到所述待测样本的突变基因状态矩阵
Figure FDA0003548371010000021
其中,t为所有所述待测样本的待分析的基因数量,q=(b1t,b2t,b3t,...,bnk)T,b为各所述待测样本的目标位点的突变状态,n为所述待测样本的样本量,k=1,2,3,...,t;及
微卫星稳定性状态检测模块,用于根据预设的系数β和公式
Figure FDA0003548371010000022
得到yv,yv=(d1,d2,d3,...,dn)T,d代表得到的各所述待测样本的微卫星稳定性状态,n为所述待测样本的样本量。
6.根据权利要求5所述的检测装置,其特征在于,还包括确定所述预设的系数β的模块,所述确定所述预设的系数β的模块还包括数据获取模块、状态获取模块和系数确定模块;所述数据获取模块用于获取已确定微卫星稳定性状态的训练样本的测序数据,作为训练集测序数据;所述状态获取模块用于根据所述训练集测序数据,得到所述训练样本的突变基因状态矩阵
Figure FDA0003548371010000023
其中,i为所有所述训练样本的待分析的突变基因数量,p=(a1j,a2j,a3j,...,amj)T,a为各所述训练样本的目标位点的突变状态,m为所述训练样本的样本量,j=1,2,3,...,i;所述系数确定模块用于根据由弹性网络回归得到的关系式
Figure FDA0003548371010000031
得到所述预设的系数β,其中,y=(c1,c2,c3,...,cm)T,c代表各所述训练样本的微卫星稳定性状态,m为所述训练样本的样本量。
7.根据权利要求6所述的确定装置,其特征在于,λ1和λ2的计算包括步骤:令λ=λ1=λ2,采用5-折交叉验证估计得到λ。
8.根据权利要求6或7所述的微卫星稳定性的检测装置,其特征在于,所述待测样本的测序数据和所述训练集测序数据是通过二代测序得到的。
9.一种计算机设备,其特征在于,具有处理器和存储器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~4任一项所述的微卫星稳定性的检测方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1~4任一项所述的微卫星稳定性的检测方法的步骤。
CN202210255054.7A 2022-03-15 2022-03-15 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质 Active CN114708916B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210255054.7A CN114708916B (zh) 2022-03-15 2022-03-15 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210255054.7A CN114708916B (zh) 2022-03-15 2022-03-15 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN114708916A true CN114708916A (zh) 2022-07-05
CN114708916B CN114708916B (zh) 2023-11-10

Family

ID=82169484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210255054.7A Active CN114708916B (zh) 2022-03-15 2022-03-15 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114708916B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109584961A (zh) * 2018-12-03 2019-04-05 元码基因科技(北京)股份有限公司 基于二代测序技术检测血液微卫星不稳定的方法
CN109637590A (zh) * 2018-12-29 2019-04-16 西安交通大学 一种基于基因组测序的微卫星不稳定性检测系统及方法
CN110257524A (zh) * 2019-08-01 2019-09-20 浙江大学 一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法
CN110570907A (zh) * 2019-09-04 2019-12-13 北京橡鑫生物科技有限公司 建立检测微卫星不稳定的基线及模型的方法与应用
CN110797078A (zh) * 2020-01-06 2020-02-14 北京吉因加科技有限公司 微卫星不稳定位点筛选、分析模型的构建方法及装置
CN111223526A (zh) * 2019-11-15 2020-06-02 深圳裕策生物科技有限公司 基于二代测序血液样本的微卫星不稳定检测方法和装置
CN111304303A (zh) * 2020-02-18 2020-06-19 福建和瑞基因科技有限公司 微卫星不稳定的预测方法及其应用
US20200255909A1 (en) * 2019-02-12 2020-08-13 Tempus Integrated machine-learning framework to estimate homologous recombination deficiency
CN113160891A (zh) * 2021-04-14 2021-07-23 西安交通大学 一种基于转录组测序的微卫星不稳定性检测方法
CN114026253A (zh) * 2019-04-22 2022-02-08 奥比特基因组学公司 用于微卫星分析的方法和系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109584961A (zh) * 2018-12-03 2019-04-05 元码基因科技(北京)股份有限公司 基于二代测序技术检测血液微卫星不稳定的方法
CN109637590A (zh) * 2018-12-29 2019-04-16 西安交通大学 一种基于基因组测序的微卫星不稳定性检测系统及方法
US20200255909A1 (en) * 2019-02-12 2020-08-13 Tempus Integrated machine-learning framework to estimate homologous recombination deficiency
CN114026253A (zh) * 2019-04-22 2022-02-08 奥比特基因组学公司 用于微卫星分析的方法和系统
CN110257524A (zh) * 2019-08-01 2019-09-20 浙江大学 一种区分结直肠癌的癌组织及癌旁正常组织的结直肠癌判别模型及其构建方法
CN110570907A (zh) * 2019-09-04 2019-12-13 北京橡鑫生物科技有限公司 建立检测微卫星不稳定的基线及模型的方法与应用
CN111223526A (zh) * 2019-11-15 2020-06-02 深圳裕策生物科技有限公司 基于二代测序血液样本的微卫星不稳定检测方法和装置
CN110797078A (zh) * 2020-01-06 2020-02-14 北京吉因加科技有限公司 微卫星不稳定位点筛选、分析模型的构建方法及装置
CN111304303A (zh) * 2020-02-18 2020-06-19 福建和瑞基因科技有限公司 微卫星不稳定的预测方法及其应用
CN113160891A (zh) * 2021-04-14 2021-07-23 西安交通大学 一种基于转录组测序的微卫星不稳定性检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈锡美 等: "《胃粘膜疾病基础与临床研究》", vol. 1, 上海科技教育出版社, pages: 270 - 274 *

Also Published As

Publication number Publication date
CN114708916B (zh) 2023-11-10

Similar Documents

Publication Publication Date Title
CN111304303B (zh) 微卫星不稳定的预测方法及其应用
Steinfath et al. Automated image analysis for array hybridization experiments
Wang et al. High quality copy number and genotype data from FFPE samples using Molecular Inversion Probe (MIP) microarrays
Eisenhofer et al. Diagnostic tests and biomarkers for pheochromocytoma and extra-adrenal paraganglioma: from routine laboratory methods to disease stratification
Agbor-Enoh et al. Applying rigor and reproducibility standards to assay donor-derived cell-free DNA as a non-invasive method for detection of acute rejection and graft injury after heart transplantation
Hung et al. Analysis of microarray and RNA-seq expression profiling data
Meunier et al. Data analysis methods for detection of differential protein expression in two-dimensional gel electrophoresis
CN113724791B (zh) Cyp21a2基因ngs数据分析的方法、装置及应用
CN111091868B (zh) 一种染色体非整倍体的分析方法及系统
JP4302924B2 (ja) Dnaマイクロアレイのデータを統計的に分析する際の画像測定法
Stenton et al. The clinical application of RNA sequencing in genetic diagnosis of Mendelian disorders
CN115394357A (zh) 用于判断样本配对或污染的位点组合及其筛选方法和应用
CN117253539B (zh) 基于胚系突变检测高通量测序中样本污染的方法和系统
US20030169064A1 (en) Selective trim and wafer testing of integrated circuits
CN114708916A (zh) 微卫星稳定性的检测方法、检测装置、计算机设备及存储介质
Sachdeva et al. Validation of next-generation sequencer for 24-chromosome aneuploidy screening in human embryos
KR102472050B1 (ko) 환자 맞춤형 패널을 이용한 암의 재발을 예측하는 방법
US6876929B2 (en) Process for removing systematic error and outlier data and for estimating random error in chemical and biological assays
Turan et al. Somatic copy number variant load in neurons of healthy controls and Alzheimer’s disease patients
ElBakry et al. Identification of differentially expressed genes for time-course microarray data based on modified RM ANOVA
US20160265051A1 (en) Methods for Detection of Fetal Chromosomal Abnormality Using High Throughput Sequencing
CN116848511A (zh) 用于进行自动化临床诊断交叉研究的系统和方法
CN109192243A (zh) 染色体比例的修正方法、装置、介质
Wu et al. Profiling the effects of short time-course cold ischemia on tumor protein phosphorylation using a Bayesian approach
CN117198399A (zh) 预测msi状态的微卫星位点、系统及试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant