CN110387419B - 实体瘤多基因检测基因芯片及其制备方法和检测装置 - Google Patents
实体瘤多基因检测基因芯片及其制备方法和检测装置 Download PDFInfo
- Publication number
- CN110387419B CN110387419B CN201910768791.5A CN201910768791A CN110387419B CN 110387419 B CN110387419 B CN 110387419B CN 201910768791 A CN201910768791 A CN 201910768791A CN 110387419 B CN110387419 B CN 110387419B
- Authority
- CN
- China
- Prior art keywords
- hla
- mutation
- quality control
- chr2
- chr1
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Physics & Mathematics (AREA)
- Pathology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
一种实体瘤多基因检测基因芯片及其制备方法和检测装置,该基因芯片包含如表1所示的用于检测肿瘤突变负荷和靶向用药相关突变位点的基因区域的探针序列,以及如表2所示的用于检测微卫星不稳定位点的探针序列。本发明的基因芯片,能够捕获859个肿瘤突变负荷和靶向用药相关突变位点以及250个微卫星不稳定位点的基因区域,这些基因区域可真实反映人全基因组上肿瘤突变负荷及微卫星不稳定状态的变化趋势,且该区域覆盖了常见的靶向用药相关突变位点,可以同时用于各种肿瘤分子标志物的检测。
Description
技术领域
本申请涉及肿瘤检测领域,特别是涉及一种实体瘤多基因检测基因芯片及其制备方法和检测装置。
背景技术
肿瘤是由基因组变异引起的疾病。肿瘤的治疗包括手术、放疗、化疗、分子靶向治疗、免疫治疗等多种手段,其中靶向治疗及免疫治疗均需要根据临床分子标志物的状态制定相应治疗策略。
肿瘤的靶向治疗是在细胞分子水平上,针对已经明确的致癌位点设计相应的治疗药物,特异地选择致癌位点结合发生作用,使肿瘤细胞特异性死亡的治疗方式。靶向治疗药物可分为靶向性的表皮生长因子受体(EGFR)阻断剂、针对某些特定细胞标志物的单克隆抗体、酪氨酸激酶受体抑制剂、抗肿瘤血管生成药物及其他激酶抑制剂等,在应用靶向药物之前需要确定患者致癌位点及相关标志物的变化情况,因此基因检测是靶向治疗前的必要步骤。
免疫检查点抑制剂开辟了肿瘤治疗的新时代,但由于缺乏合适的临床分子标志物,PD-1/PD-L1药物的受益人群无法被高效筛选,筛选率只有20%-30%。肿瘤突变负荷(TMB)是反应肿瘤细胞中总的基因突变程度的一个指标,通常以每百万碱基(Mb)的肿瘤基因组区域中包含的肿瘤体细胞突变总数来表示。不同类型的肿瘤、同一种肿瘤中不同人群的TMB水平会不一样,并且在平均TMB水平比较高的肿瘤中,也并不是所有患者的TMB水平都比较高,不同肿瘤类别中存在高TMB水平的人群比例都不一样。已有研究表明高TMB的水平能大概率预测肺癌、膀胱癌、黑色素瘤等肿瘤对免疫检查点抑制剂药物响应概率。鉴于TMB作为标志物在临床试验已取得一些良好的效果,国内外已有一些大型的公司或药企单独或合作进行TMB生物标志物的开发,研究将TMB纳入免疫检查点抑制剂药物临床试验的检测范围。微卫星不稳定(MSI)也是一种分子标志物,临床上有高效准确检测肿瘤突变负荷、微卫星不稳定及靶向治疗位点突变的需求。
但目前市场上相关产品多为单项检测,以3种指标(TMB、MSI、靶向治疗位点突变)为例,需要分别单独检测,具有成本高、周期长、样本用量大的缺陷,不适合临床应用。亟待开发一种可以同时检测多种指标的检测试剂盒,可以高效地检测多种指标。
发明内容
本发明提供一种实体瘤多基因检测基因芯片及其制备方法和检测装置,能够同时分析TMB、MSI和靶向治疗位点突变三种指标,预测肿瘤靶向治疗药物及免疫检查点抑制剂疗效。
根据第一方面,本发明提供一种实体瘤多基因检测基因芯片,该基因芯片包含如表1所示的用于检测TMB和靶向用药相关突变位点的基因区域的探针序列,以及如表2所示的用于检测MSI位点的探针序列。
在优选实施例中,上述基因芯片还包含检测如表3所示的HLA基因型的探针。
在优选实施例中,上述基因芯片还包含检测SNP质控位点的探针,上述SNP质控位点为根据Cell Lines Project(细胞系项目)数据库设计的,中国人群中突变频率在0.4-0.6区间的位点。
在优选实施例中,上述SNP质控位点包括rs1327118、rs1402695、rs1414904、rs1131498、rs1079820、rs1805087、rs1032807、rs1801262、rs1515002、rs1392265、rs11096957、rs1426003、rs1363333、rs3734440、rs156318、rs1843026、rs1368136、rs1105176、rs156697、rs12828016、rs1395936、rs1541836、rs1805034、rs1030687、rs171953、rs753381、rs1293153和rs1541290。
在优选实施例中,上述基因芯片还包含检测如表4所示的性别判断质控位点的探针。
根据第二方面,本发明提供一种如第一方面的基因芯片的制备方法,该方法包括:
提供如第一方面的基因芯片所需的芯片基底和结合于芯片基底上的探针;
将上述探针通过基因芯片制备方法结合于上述芯片基底上,得到上述基因芯片。
芯片基底包括但不限于磁珠。
根据第三方面,本发明提供一种用于肿瘤样本检测的二代测序方法,该方法包括:
提取肿瘤组织DNA,并以上述肿瘤组织DNA为材料构建测序文库;
使用如第一方面的基因芯片捕获上述测序文库中的目标基因;
对上述目标基因进行测序以确定其序列。
根据第四方面,本发明提供一种实体瘤多基因检测装置,该装置包括:
如第一方面的基因芯片;以及
用于测定上述基因芯片所捕获的实体瘤组织的核酸序列的测序装置。
根据第五方面,本发明提供一种实体瘤多基因检测装置,该装置包括:
数据获取单元,用于获取如第一方面的基因芯片所捕获的实体瘤组织的核酸序列的测序数据;
体细胞变异检测及结果过滤单元,用于对实体瘤组织的测序数据进行变异检测,并对检测结果使用生殖细胞突变数据库进行过滤以得到实体瘤组织相关的体细胞突变;
体细胞结构变异检测单元,用于对实体瘤组织的测序数据进行体细胞结构变异检测以得到实体瘤组织相关的体细胞结构变异;
肿瘤突变负荷预测单元,用于对实体瘤组织的测序数据进行肿瘤突变负荷预测;
微卫星不稳定检测单元,用于对实体瘤组织的测序数据进行微卫星不稳定检测。
在优选实施例中,上述微卫星不稳定检测单元包括以下子单元:
潜在微卫星不稳定位点获取子单元,用于分别计算每个位点的微卫星不稳定变化情况,统计所有符合质控标准且发生碱基的插入或缺失且支持读长数满足设定标准的位点,获得潜在微卫星不稳定位点;
体细胞微卫星不稳定位点获取子单元,用于使用基于信息熵的算法对所述潜在微卫星不稳定位点进行筛选,获得体细胞微卫星不稳定位点;
体细胞微卫星不稳定位点数量统计子单元,用于统计体细胞微卫星不稳定位点数量;和
微卫星不稳定检测结果获取子单元,用于筛选体细胞微卫星不稳定位点数占总微卫星不稳定位点数的百分比大于设定阈值的位点,获得微卫星不稳定检测结果。
在优选实施例中,上述质控标准为5bp≤微卫星不稳定位点长度≤50bp;上述设定标准为p<0.05;上述阈值为20%。
在优选实施例中,上述装置还包括如下一种或多种单元:
下机数据处理单元,用于将下机数据转化为通用的文件格式以及将多个样本的数据拆分开来;
数据过滤及质控单元,用于去除测序数据中的测序接头序列、低质量序列及N碱基组成的序列以及对过滤后的数据进行质控以得到符合质控标准的合格数据;
序列比对及质控单元,用于将测序数据比对到参考基因组并对质控结果进行质控以得到符合质控标准的合格数据;
变异结果注释单元,用于对变异结果进行注释以得到基因名称、转录本编号及位置信息、HGVS突变编号,和/或对中国人群突变频率进行注释,和/或对突变进行有害性预测和保守性预测,和/或对突变相关疾病信息进行注释;
样本质控单元,用于对上述基因芯片捕获的SNP位点进行基因型分析以得到SNP位点基因型与检测个体的对应关系;
样本性别质控单元,用于对上述基因芯片捕获的性别判断质控位点进行分析以得到性别判断质控位点与检测个体的对应关系;
HLA分型单元,用于对上述基因芯片捕获的HLA基因区域进行HLA分型。
根据第六方面,本发明提供一种实体瘤多基因检测方法,包括:
获取如第一方面的基因芯片所捕获的实体瘤组织的核酸序列的测序数据;
对实体瘤组织的测序数据进行变异检测,并对检测结果使用生殖细胞突变数据库进行过滤以得到实体瘤组织相关的体细胞突变;
对实体瘤组织的测序数据进行体细胞结构变异检测以得到实体瘤组织相关的体细胞结构变异;
对实体瘤组织的测序数据进行肿瘤突变负荷预测;
对实体瘤组织的测序数据进行微卫星不稳定检测。
在优选实施例中,上述微卫星不稳定检测包括以下步骤:
分别计算每个位点的微卫星不稳定变化情况,统计所有符合质控标准且发生碱基的插入或缺失且支持读长数满足设定标准的位点,获得潜在微卫星不稳定位点;
使用基于信息熵的算法对潜在微卫星不稳定位点进行筛选,获得体细胞微卫星不稳定位点;
统计体细胞微卫星不稳定位点数量;和
筛选体细胞微卫星不稳定位点数占总微卫星不稳定位点数的百分比大于设定阈值的位点,获得微卫星不稳定检测结果。
在优选实施例中,上述质控标准为5bp≤微卫星不稳定位点长度≤50bp;上述设定标准为p<0.05;上述阈值为20%。
在优选实施例中,上述实体瘤多基因检测方法,还包括如下一种或多种步骤;
将下机数据转化为通用的文件格式以及将多个样本的数据拆分开来;
去除测序数据中的测序接头序列、低质量序列及N碱基组成的序列以及对过滤后的数据进行质控以得到符合质控标准的合格数据;
将测序数据比对到参考基因组并对质控结果进行质控以得到符合质控标准的合格数据;
对变异结果进行注释以得到基因名称、转录本编号及位置信息、HGVS突变编号,和/或对中国人群突变频率进行注释,和/或对突变进行有害性预测和保守性预测,和/或对突变相关疾病信息进行注释;
对上述基因芯片捕获的SNP位点进行基因型分析以得到SNP位点基因型与检测个体的对应关系;
对上述基因芯片捕获的性别判断质控位点进行分析以得到性别判断质控位点与检测个体的对应关系;
对上述基因芯片捕获的HLA基因区域进行HLA分型。
根据第七方面,本发明提供一种计算机可读存储介质,该计算机可读存储介质包括程序,该程序能够被处理器执行以实现如第六方面的实体瘤多基因检测方法。
本发明的基因芯片,能够捕获859个TMB和靶向用药相关突变位点以及250个MSI位点的基因区域,这些基因区域可真实反映人全基因组上肿瘤突变负荷及MSI的变化趋势,且该区域覆盖了常见的靶向用药相关突变位点,可以同时用于各种标志物的检测。
本发明的实体瘤多基因检测装置,在仅使用肿瘤样本(即单样本)检测的情况下,一次测序完成多项指标的分析,可准确反映样本中点突变、插入缺失、结构变异、微卫星不稳定、肿瘤突变负荷及HLA分型情况。
附图说明
图1为本发明实施例中用于肿瘤样本检测的二代测序方法流程图;
图2为本发明实施例中实体瘤多基因检测装置的结构框图;
图3为本发明实施例中实体瘤多基因检测信息分析方法流程图;
图4为本发明实施例中MSI检测与金标准比较结果图;
图5为本发明实施例中HLA分型与HLA检测金标准比较结果图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他材料、方法所替代。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
针对现有技术存在的问题,本发明提供一种实体瘤多基因检测基因芯片,包括捕获以下基因区域的探针:(1)859个用于检测TMB和靶向用药相关突变位点的基因区域;(2)250个用于检测MSI位点的基因区域。
本发明应用于二代测序领域,用于肿瘤突变分析、微卫星不稳定(MSI)检测、肿瘤突变负荷(TMB)检测,预测肿瘤靶向治疗药物及免疫检查点抑制剂疗效。
本发明的开发与应用技术路线大体如下所示:
肿瘤组织样本收集→肿瘤组织DNA提取→高通量基因捕获测序→测序数据预处理→测序数据比对→体细胞变异检测分析(点突变、插入删除、结构变异)→肿瘤纯度预测→TMB计算→MSI计算→结果解读→指导肿瘤治疗。
在一个具体实施例中,具体实施如下:
1、靶向捕获芯片设计:
传统肿瘤基因检测通常采用全外显子测序,具有成本高、周期长的缺点。为解决此问题,本发明设计了一种靶向捕获芯片,只捕获特定基因序列并进行测序,有效降低了测序数据量,达到节省成本、缩短周期的目的。
该靶向捕获芯片的设计过程是:
1)根据COSMIC数据库收集的突变信息,统计每个基因的每个外显子上有多少个碱基发生突变,突变总数除以外显子总长度,得到每个外显子上出现突变碱基的概率。
2)根据ICGC数据库(https://icgc.org/)收集的样本数据,统计每个基因的每个外显子上有多少个样本发生突变,突变样本数除以总样本数,得到每个外显子上出现突变样本的概率。
3)根据中国人群食管癌、肺癌及胃癌基因组数据,统计每个基因的每个外显子上有多少个样本发生突变,突变样本数除以总样本数,得到每个外显子上出现突变样本的概率。
4)根据上述数据对每个外显子赋予分值,计算方法为:pa*0.3+pb*0.2+pc*0.5,其中pa、pb、pc分别为1)、2)、3)步计算的概率。此分值可代表外显子对肿瘤突变荷变化的贡献程度。去除贡献程度为0的外显子后,其余外显子作为候选区域进入下一步计算。
5)根据Cancer Gene Census基因列表总结的肿瘤相关重要基因对外显子分配权重,属于该基因列表的外显子权重为1,不属于该基因列表的外显子权重为0.5。外显子得分乘以权重得到加权分值。
6)使用遗传算法对外显子进行筛选。遗传算法使用DEAP软件包,参数设置如下:初始种群数量50,Lambda值400,突变概率0.5,交换概率0.4,迭代500代。评分公式为:区域大小权重-0.5,外显子分值1.0,所选区域TMB结果与外显子相关性权重1.0。据此计算出最终捕获区域。
7)对于Cancer Gene Census基因列表上所列基因,若不在捕获区域内,则挑选部分SNP位点用于CNV检测。位点选择规则为:选择中国人群中突变频率在0.3-0.7的位点,平均每M区域选择6个。
8)为配合靶向药物相关变异检测,补充以下重要基因的全外显子:
EGFR | BIM | KRAS | BRAF | PIK3CA | KIT |
PDGFRA | NRAS | CSF1R | FLT3 | SMO | SRC |
PTEN | BRD4 | RARA | TMPRSS2 | FGFR2 | NOTCH2 |
BCR | FGFR3 | NTRK1 | RAF1 |
9)为配合结构变异检测,补充以下重要基因内含子上容易发生结构变异的区域,即ALK、ROS1和RET基因区域。区域的计算方法是根据COSMIC数据库收集的已知结构变异,筛选发生频率最高的区域。
最终设计的捕获区域包含以下表1所示的859个基因区域。
表1
进一步,为检测MSI,补充以下表2所示的250个可能发生MSI变化的位点。具体而言,统计TCGA数据库样本中发生MSI变化的位点,按照可能发生MSI变化的频率从高到低的顺序进行筛选且与MSI整体趋势相关的位点组成。
表2
进一步,添加HLA分型区域,用于对样本进行HLA分型。根据中国人群HLA分布频率,设计以下表3所示的HLA基因型的探针。
表3
进一步,添加SNP质控位点,对每个样本确定唯一标识,用于识别样本污染或混样的异常。该质控位点的选择方法为:根据Cell Lines Project数据库设计的质控位点,选择其中中国人群中突变频率在0.4-0.6区间的位点,根据PCR验证成功率排序,选择最高的28个SNP位点如下:rs1327118、rs1402695、rs1414904、rs1131498、rs1079820、rs1805087、rs1032807、rs1801262、rs1515002、rs1392265、rs11096957、rs1426003、rs1363333、rs3734440、rs156318、rs1843026、rs1368136、rs1105176、rs156697、rs12828016、rs1395936、rs1541836、rs1805034、rs1030687、rs171953、rs753381、rs1293153和rs1541290。
进一步,添加如下表4中的性别判断质控位点,用于判断样本性别,避免样本编号混乱。
表4
chrX | 11314992 | AMEL_Intron3_X |
chrX | 24229534 | ZFXY_MA_expanded_up_2x_X |
chrY | 2655436 | SRY_Y |
chrY | 2848026 | ZFXY_MA_expanded_up_2x_Y |
chrY | 6737998 | AMEL_Intron3_Y |
本发明的技术方案与发明名称为“用于肿瘤突变负荷检测的基因芯片及其制备方法和装置”,申请号为2018107129399的中国发明专利相比,主要区别包括:
a)删除如下表5所示的基因。这些基因对肿瘤突变负荷计算贡献较低,且不是靶向用药相关基因。
表5
b)新增如下表6所示的基因。这些基因对肿瘤突变负荷计算贡献较高,能够提高肿瘤突变负荷计算的准确性。
表6
APOBEC3A | LOC101927322 | PRKACA | TIMM23B |
ARTN | MAP4K3 | PRKDC | TMEFF1 |
ATP2C1 | METTL21A | PROC | TOE1 |
BCL2L11 | MFSD11 | RAD17 | TPM3 |
C11ORF65 | MYCNOS | RAD50 | U2AF1L5 |
C1QTNF5 | NBPF10 | REEP5 | UGT1A10 |
CD3EAP | NBPF19 | RHOA | UGT1A3 |
CD74 | NBPF20 | RNMT | UGT1A4 |
CENPP | NBPF9 | SEC14L2 | UGT1A5 |
CSF1R | NO | SEC14L3 | UGT1A6 |
CYP19A1 | PCDHA1 | SLC7A8 | UGT1A7 |
DCBLD1 | PCDHA2 | SMOX | UGT1A8 |
FAM20A | PCDHA5 | SNAPC5 | UGT1A9 |
FAM69A | PCDHA6 | SRC | WDR20 |
FANCD2OS | PCDHA7 | SRP19 | ZDHHC6 |
FNTB | PDCD1 | SSX4B | ZNF2 |
HIST1H2BK | PINLYP | SYN3 | ZNF276 |
INSRR | POLD1 | TACC3 | |
LHFPL6 | POLE4 | TAGLN | |
LIG3 | PRG4 | TBC1D9 |
c)对结构变异基因区域重新设计。结构变异通常发生在基因的内含子区域,常规外显子捕获方式无法检测。本发明在这些基因易发生结构变异的内含子区域设计捕获探针,保证了结构变异检测的准确性。
d)对HLA分型区域重新设计。针对中国人群常见的HLA基因型设计捕获探针,提高捕获效率的同时增加了中国人群HLA分型的准确性。
本发明还提供上述基因芯片的制备方法,该方法包括:芯片基底和结合于芯片基底上的探针;将探针通过基因芯片制备方法结合于芯片基底上,得到基因芯片。
本发明实施例中,基因芯片制备方法不限,只要是能够将核酸探针结合于芯片基底上即可,现有技术中有多种实现这种结合的方法,本领域技术人员可以根据需要选择合适方法实现。
基于本发明的基因芯片,本发明一个实施例还提供一种用于肿瘤样本检测的二代测序方法,该方法包括:提取肿瘤组织DNA,并以肿瘤组织DNA为材料构建测序文库;使用本发明的基因芯片捕获测序文库中的目标基因;对目标基因进行测序以确定其序列。
具体而言,在一个实施例中,本发明的二代测序方法可以按照图1所示的流程进行。其中提取肿瘤组织DNA及提取质控、DNA修复、建库及建库质控和测序及测序质控等步骤可以按照现有技术方法进行。而杂交捕获及质控使用本发明的基因芯片实现。
本发明实施例中,可用的测序方法很多,理论上任何测序平台,包括但不限于Illumina平台及MGI平台均可用于本发明中对目标基因进行测序。具体的测序策略包括但不限于PE100或PE150测序方式,肿瘤组织测序的数据量一般在5G左右。
基于本发明的基因芯片,本发明一个实施例还提供一种实体瘤多基因检测装置,该装置包括:本发明的基因芯片;以及,用于测定基因芯片所捕获的实体瘤组织的核酸序列的测序装置。测序装置具体可以是各种测序平台,包括但不限于Illumina平台及MGI平台等。
需要说明的是,上述实体瘤多基因检测装置是实体的物理装置,以基因芯片和配套使用的测序装置构成。除此之外,上述实体瘤多基因检测装置还可以包括其他配套设备和装置,例如实体瘤多基因检测二代测序文库构建使用的设备和装置等。
基于本发明的基因芯片,本发明一个实施例还提供一种实体瘤多基因检测装置,如图2所示,该装置包括:数据获取单元201,用于获取本发明的基因芯片所捕获的实体瘤组织的核酸序列的测序数据;体细胞变异检测及结果过滤单元202,用于对实体瘤组织的测序数据进行变异检测,并对检测结果使用生殖细胞突变数据库进行过滤以得到实体瘤组织相关的体细胞突变;体细胞结构变异检测单元203,用于对实体瘤组织的测序数据进行体细胞结构变异检测以得到实体瘤组织相关的体细胞结构变异;肿瘤突变负荷预测单元204,用于对实体瘤组织的测序数据进行肿瘤突变负荷预测;微卫星不稳定检测单元205,用于对实体瘤组织的测序数据进行微卫星不稳定检测。
在一个优选实施例中,本发明的装置还包括如下一种或多种单元:下机数据处理单元,用于将下机数据转化为通用的文件格式以及将多个样本的数据拆分开来;数据过滤及质控单元,用于去除测序数据中的测序接头序列、低质量序列及N碱基组成的序列以及对过滤后的数据进行质控以得到符合质控标准的合格数据;序列比对及质控单元,用于将测序数据比对到参考基因组并对质控结果进行质控以得到符合质控标准的合格数据;变异结果注释单元,用于对变异结果进行注释以得到基因名称、转录本编号及位置信息、HGVS突变编号,和/或对中国人群突变频率进行注释,和/或对突变进行有害性预测和保守性预测,和/或对突变相关疾病信息进行注释;样本质控单元,用于对上述基因芯片捕获的SNP位点进行基因型分析以得到SNP位点基因型与检测个体的对应关系;样本性别质控单元,用于对上述基因芯片捕获的性别判断质控位点进行分析以得到性别判断质控位点与检测个体的对应关系;HLA分型单元,用于对上述基因芯片捕获的HLA基因区域进行HLA分型。
本领域技术人员可以理解,上述实施方式中各种单元的全部或部分功能可以通过硬件的方式实现,也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘、光盘、硬盘等,通过计算机执行该程序以实现上述功能。例如,将程序存储在设备的存储器中,当通过处理器执行存储器中程序,即可实现上述全部或部分功能。另外,当上述实施方式中全部或部分功能通过计算机程序的方式实现时,该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中,通过下载或复制保存到本地设备的存储器中,或对本地设备的系统进行版本更新,当通过处理器执行存储器中的程序时,即可实现上述实施方式中全部或部分功能。
因此,本发明的一个实施例提供一种计算机可读存储介质,该计算机可读存储介质包括程序,该程序能够被处理器执行以实现如下的实体瘤多基因检测方法:获取本发明的基因芯片所捕获的实体瘤组织的核酸序列的测序数据;对实体瘤组织的测序数据进行变异检测,并对检测结果使用生殖细胞突变数据库进行过滤以得到实体瘤组织相关的体细胞突变;对实体瘤组织的测序数据进行体细胞结构变异检测以得到实体瘤组织相关的体细胞结构变异;对实体瘤组织的测序数据进行TMB预测;对实体瘤组织的测序数据进行MSI检测。
在优选实施例中,上述实体瘤多基因检测方法,还包括如下一种或多种步骤;将下机数据转化为通用的文件格式以及将多个样本的数据拆分开来;去除测序数据中的测序接头序列、低质量序列及N碱基组成的序列以及对过滤后的数据进行质控以得到符合质控标准的合格数据;将测序数据比对到参考基因组并对质控结果进行质控以得到符合质控标准的合格数据;对变异结果进行注释以得到基因名称、转录本编号及位置信息、HGVS突变编号,和/或对中国人群突变频率进行注释,和/或对突变进行有害性预测和保守性预测,和/或对突变相关疾病信息进行注释;对上述基因芯片捕获的SNP位点进行基因型分析以得到SNP位点基因型与检测个体的对应关系;对上述基因芯片捕获的性别判断质控位点进行分析以得到性别判断质控位点与检测个体的对应关系;对上述基因芯片捕获的HLA基因区域进行HLA分型。
以下通过实施例详细说明本发明的技术方案和效果,应当理解,实施例仅是示例性的,不能理解为对本发明保护范围的限制。
实施例1
本实施例中设计定制的探针,覆盖表1至表4以及28个SNP位点区域的探针序列。芯片性能测试结果如下表7所示,可见该探针设计兼容常见的Illumina平台及MGI平台,设计区域覆盖度均达到99%以上,满足正常使用需求。
表7
样本编号 | 测序平台 | 捕获效率(%) | 覆盖度(%) |
DNR901971SLZAA01_3_2 | MGI | 37.195 | 99.829 |
DNR901971XYZAA01_2_3 | MGI | 42.099 | 99.792 |
DNR901979SLZAA01_3_2 | MGI | 32.582 | 99.868 |
DNR901979XYZAA01_2_3 | MGI | 40.51 | 99.838 |
DNR902340SLZAA01_2_1 | MGI | 49.45 | 99.789 |
DNR902340XYZAA01_2_1 | MGI | 39.764 | 99.764 |
DNR903896SLZAA01_3_2 | MGI | 38.427 | 99.857 |
DNR903896XYZAA01_2_3 | MGI | 56.814 | 99.76 |
DNR904698SLZAA01_2_1 | MGI | 42.357 | 99.755 |
DNR904698XYZAA01_2_1 | MGI | 40.17 | 99.792 |
DNR900409SLZAA01_1_2 | Illumina | 61.416 | 99.838 |
DNR900409XYZAA01_1_2 | Illumina | 66.512 | 99.748 |
DNR900931SLZAA01_1_2 | Illumina | 65.534 | 99.841 |
DNR900931XYZAA01_1_2 | Illumina | 65.609 | 99.744 |
DNR901128AZZAA01_1_2 | Illumina | 67.301 | 99.657 |
DNR901128XYZAA01_1_2 | Illumina | 65.862 | 99.621 |
DNR902792AZZAA01_1_2 | Illumina | 66.514 | 99.733 |
DNR902792XYZAA01_1_2 | Illumina | 67.078 | 99.652 |
实施例2
本实施例展示了信息分析方法,包括下机数据处理、数据过滤及质控、序列比对及结果质控、体细胞突变检测及结果过滤、变异结果注释、MSI检测、肿瘤纯度预测、TMB预测、TMB用药指导等环节。上述信息分析方法通过自动化调度系统在生物信息分析集群上运行,稳定高效输出分析结果。如图3所示,各信息分析环节详细介绍如下:
a)下机数据处理:测序仪产生的通常为专用格式数据,需首先转化为通用的fastq文件格式。此外,一张测序芯片上会混合多个样本,需要在分析之前将属于各个样本的数据拆分开来。本方法可适配常见第二代测序仪输出数据格式,根据测序仪类型不同采用不同的处理方式。对于Illumina测序仪使用bcl2fastq软件对下机数据进行处理,并针对常用的NextSeq 500测序仪进行了参数上的优化,达到提高数据利用率、简化后续处理的目的。对于MGI测序仪,仪器直接产出可用数据量(Clean data),软件根据标签(index)序列匹配筛选各样本数据。数据处理完毕后经过质控程序质控,判断数据产出及质量是否出现异常,无异常则进入下一步骤。
b)数据过滤及质控:Illumina测序仪产出的数据除包含有效数据外,测序仪还包括测序接头序列、低质量序列及N碱基组成的序列,这些序列会干扰后续分析,需要去除。本发明使用cutadapt软件进行上述操作。过滤后的数据使用质控软件进行质控,符合以下表8标准的数据为合格数据。
表8
MGI测序仪数据直接使用质控软件进行质控,符合以下表9标准的数据为合格数据。
表9
c)序列比对及质控:序列比对采用bwa mem算法进行,使用的参考基因组为GRCh37.73。比对结果直接进行去重合排序处理,不需生成临时文件,达到节省时间及空间的目的。比对结果使用质控软件进行质控,符合以下表10标准的数据为合格数据。
表10
比对率(Mapping_rate) | >99% |
比对质量(Mapping_quality) | >50 |
插入片段大小(Insert_size) | <230bp and>120bp |
重复率(Duplication_rate) | <30% |
捕获率(Capture_rate) | >50% |
目标区域测序深度(Depth_in_target) | >500X |
目标区域覆盖度(Target_coverage) | >98% |
目标区域大于500X深度比例(Target_500X) | >60% |
目标区域大于100X深度比例(Target_100X) | >80% |
目标区域大于10X深度比例(Target_10X) | >90% |
d)体细胞变异检测及结果过滤:体细胞变异包括SNV、InDel,本方法对肿瘤组织数据进行变异检测,并对检测结果进行过滤,只保留肿瘤相关的体细胞突变。其中,SNV的检测及过滤在发明名称为“基于二代测序检测点突变的方法、装置和存储介质”,申请号为201711107001.6的中国专利的基础上改进,InDel的检测及过滤在发明名称为“基于二代测序的插入缺失突变检测方法、装置和存储介质”,申请号为201810273763.1的中国专利的基础上改进,使用单一肿瘤样本通过以下步骤计算体细胞变异:1)使用samtools及varscan软件计算测序数据中与参考碱基不同的潜在变异位点;2)根据变异位点的碱基质量值、比对质量值、reads上相对位置、突变频率、是否为热点突变等因素进行统计分析,确定候选突变位点;3)使用生殖细胞突变数据库(dbSNP数据库、千人基因组数据库、ExAC数据库)中的人群变异数据进行过滤,只保留非生殖细胞突变,作为最终结果。
本方法与原有方法的不同在于,增加了步骤3),原有变异检测方法用于单样本时无法区分体细胞突变与生殖细胞突变,本方法通过该步骤实现此效果。实际数据测试显示,添加步骤3)后,本方法对于靶向药物相关变异检测的灵敏度为97.89%,特异性为97.94%,可满足实际使用。
e)体细胞结构变异检测:本方法参照发明名称为“用于检测目标区域基因融合的方法、装置和存储介质”、申请号为201711107002.0的中国专利,使用单一肿瘤样本(取消了对照样本的输入),根据双末端读长(paired-end reads)配对关系及软剪接读长(softclipped reads)比对位置确定结构变异断点,得到最终结果。
f)变异结果注释:本方法首先使用SnpEff注释软件对变异结果进行注释,得到基因名称、转录本编号及位置信息、HGVS突变编号等基本信息;随后使用ExAC数据库对中国人群突变频率进行注释,使用DBNSFP数据库对突变进行有害性预测和保守性预测,使用clinvar数据库对突变相关疾病信息进行注释。根据这些信息可对变异性质进行判断,用于后续分析。
g)TMB预测:本发明的TMB预测方法参照发明名称为“肿瘤突变负荷检测方法、装置和存储介质”、申请号为201910254928.5的中国专利,即单样本检测TMB的方法,因此可使用此方法计算TMB。
h)微卫星不稳定(MSI)检测:本方法的MSI检测过程如下:1)在芯片上设计250个可能发生MSI变化的位点。2)分别计算每个位点的MSI变化情况,对于所有符合质控标准(最小长度为5bp,最大长度为50bp)的位点,若该位点发生碱基的插入或缺失且支持读长(reads)数满足标准(统计学检验p<0.05),则认为是潜在MSI位点。3)上述方法鉴定出潜在MSI位点,但无法判断MSI是否为肿瘤细胞特有。成对样本检测可以通过对照样本进行区分。本方法为单样本检测,使用基于信息熵的算法预测潜在MSI位点属于生殖细胞突变还是体细胞突变,进而筛选出肿瘤细胞特有的MSI位点。4)统计体细胞突变MSI位点数量及其占总位点数的百分比,若百分比大于设定的阈值(如20%)则认为该样本为微卫星不稳定。
i)样本质控:为确保检测的样本不至于混淆,本方法在捕获芯片上设计了28个多态性位点,这些位点具有人群多态性,在不同人中表现为不同基因型,可用于鉴定与患者的对应关系。检测过程如下:1)分析每个多态性位点的基因型及突变频率;2)使用其他检测方法(如荧光PCR法)对原始样本的相同位点进行分型;3)比较两种方法分型结果的一致性,若一致性>80%表示二者为相同样本,否则说明二者可能为不同样本,需要进一步确认。
j)样本性别质控:为确保检测的样本不至于混淆,本方法在捕获芯片上设计了5个性别判断位点,如表4所示,这些位点分布于性染色体上,可用于鉴定样本性别,判断与患者的对应关系。检测过程如下:1)分析每个性别判断位点的测序情况;2)若X染色体上位点有覆盖,且Y染色体上对应位点也有覆盖,证明样本来源为男性;3)若X染色体上位点有覆盖,且Y染色体上对应位点无覆盖,证明样本来源为女性;4)若X染色体上位点无覆盖,表示样本测序出现问题,无法判断。
k)HLA分型:HLA分型情况可用于新生抗原预测等用途。HLA分型检测过程如下:1)将测序数据比对至包含不同HLA基因型序列的参考基因组(GRCh38),根据比对情况判断不同基因型的概率;2)提取HLA区域测序读长后进行组装,分析与各种HLA基因型的相似度;3)综合1)和2)两种方法的结果交集作为HLA分型结果。
对上述信息分析方法的验证结果如下:
1、靶向用药相关突变位点检测
使用标准品对上述位点检测情况进行评估,结果如下表11,可见该方法对常见突变位点均可有效检出。
表11
突变类型 | 基因名称 | 突变情况 | 理论突变频率 | 实际突变频率 |
SNP | EGFR | T790M | 4.20% | 3.02 |
DEL | FLT3 | ΔI836 | 5.00% | 3.21 |
SNP | IDH1 | R132C | 5.00% | 3.01 |
SNP | JAK2 | V617F | 5.00% | 5.59 |
SNP | KRAS | G12A | 5.00% | 2.47 |
SNP | KRAS | G12R | 5.00% | 4.86 |
SNP | MEK1/MAP2K1 | P124L | 5.00% | 4.23 |
SNP | NOTCH1 | L1600P | 4.80% | 5.48 |
SNP | NRAS | Q61K | 5.00% | 4.48 |
融合(fusion) | EML4-ALK | COSF734(EML4-ALK) | 3.2 | 0.93 |
融合(fusion) | ROS1 | CD74-ROS1 fusion | 3.2 | 1.4 |
2、MSI检测
使用本方法检测结果与MSI检测金标准(一代测序方法,PCR方法)比较,结果如图4。图中左侧为经金标准检测为微卫星不稳定(MSI)的样本,右侧为经金标准检测为微卫星稳定(MSS)的样本,可见两类样本使用本方法检测的MSI频率数值范围有显著不同,当使用20%频率作为阈值时与金标准的符合度为100%。
3、TMB检测
使用2018-2019年间收集的42例中国肺癌患者样本(样本来源为深圳裕策生物科技有限公司发起的中国抗癌天梯计划数据库),分别通过本发明的方法和传统WES方法计算TMB,比较二者结果,结果如图5,Pearson相关系数0.965,证明本发明的基因芯片计算的TMB与WES TMB有很高的相关性,可以代表WES TMB。
4、HLA分型
使用本方法检测结果与HLA检测金标准(一代测序方法,PCR方法)比较,结果如下表12,可见分型一致性超过96%。
表12
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
Claims (15)
1.一种实体瘤多基因检测基因芯片,其特征在于,所述基因芯片包含如表1所示的用于检测肿瘤突变负荷和靶向用药相关突变位点的基因区域的探针序列,以及如表2所示的用于检测微卫星不稳定位点的探针序列;
表1
表2
;
所述基因芯片还包含检测如下表3所示的HLA基因型的探针;
表3
。
2.根据权利要求1所述的基因芯片,其特征在于,所述基因芯片还包含检测SNP质控位点的探针,所述SNP质控位点为根据Cell Lines Project数据库设计的,中国人群中突变频率在0.4-0.6区间的位点。
3.根据权利要求2所述的基因芯片,其特征在于,所述SNP质控位点包括rs1327118、rs1402695、rs1414904、rs1131498、rs1079820、rs1805087、rs1032807、rs1801262、rs1515002、rs1392265、rs11096957、rs1426003、rs1363333、rs3734440、rs156318、rs1843026、rs1368136、rs1105176、rs156697、rs12828016、rs1395936、rs1541836、rs1805034、rs1030687、rs171953、rs753381、rs1293153和rs1541290。
4.根据权利要求1所述的基因芯片,其特征在于,所述基因芯片还包含检测如下表4所示的性别判断质控位点的探针;
表4
。
5.一种如权利要求1-4任一项所述的基因芯片的制备方法,其特征在于,所述方法包括:
提供如权利要求1-4任一项所述的基因芯片所需的芯片基底和结合于芯片基底上的探针;
将所述探针通过基因芯片制备方法结合于所述芯片基底上,得到所述基因芯片。
6.一种非疾病诊断治疗目的的用于肿瘤样本检测的二代测序方法,其特征在于,所述方法包括:
提取肿瘤组织DNA,并以所述肿瘤组织DNA为材料构建测序文库;
使用如权利要求1-4任一项所述的基因芯片捕获所述测序文库中的目标基因;
对所述目标基因进行测序以确定其序列。
7.一种实体瘤多基因检测装置,其特征在于,所述装置包括:
如权利要求1-4任一项所述的基因芯片;以及
用于测定所述基因芯片所捕获的实体瘤组织的核酸序列的测序装置。
8.一种实体瘤多基因检测装置,其特征在于,所述装置包括:
数据获取单元,用于获取如权利要求1-4任一项所述的基因芯片所捕获的实体瘤组织的核酸序列的测序数据;
体细胞变异检测及结果过滤单元,用于对实体瘤组织的测序数据进行变异检测,并对检测结果使用生殖细胞突变数据库进行过滤以得到实体瘤组织相关的体细胞突变;
体细胞结构变异检测单元,用于对实体瘤组织的测序数据进行体细胞结构变异检测以得到实体瘤组织相关的体细胞结构变异;
肿瘤突变负荷预测单元,用于对实体瘤组织的测序数据进行肿瘤突变负荷预测;
微卫星不稳定检测单元,用于对实体瘤组织的测序数据进行微卫星不稳定检测。
9.根据权利要求8所述的实体瘤多基因检测装置,其特征在于,所述微卫星不稳定检测单元包括以下子单元:
潜在微卫星不稳定位点获取子单元,用于分别计算每个位点的微卫星不稳定变化情况,统计所有符合质控标准且发生碱基的插入或缺失且支持读长数满足设定标准的位点,获得潜在微卫星不稳定位点;
体细胞微卫星不稳定位点获取子单元,用于使用基于信息熵的算法对所述潜在微卫星不稳定位点进行筛选,获得体细胞微卫星不稳定位点;
体细胞微卫星不稳定位点数量统计子单元,用于统计所述体细胞微卫星不稳定位点数量;和
微卫星不稳定检测结果获取子单元,用于筛选所述体细胞微卫星不稳定位点数占总微卫星不稳定位点数的百分比大于设定阈值的位点,获得微卫星不稳定检测结果。
10.根据权利要求9所述的实体瘤多基因检测装置,其特征在于,所述质控标准为5bp≤微卫星不稳定位点长度≤50bp;所述设定标准为p<0.05;所述阈值为20%。
11.根据权利要求8所述的实体瘤多基因检测装置,其特征在于,所述装置还包括如下一种或多种单元:
下机数据处理单元,用于将下机数据转化为通用的文件格式以及将多个样本的数据拆分开来;
数据过滤及质控单元,用于去除测序数据中的测序接头序列、低质量序列及N碱基组成的序列以及对过滤后的数据进行质控以得到符合质控标准的合格数据;
序列比对及质控单元,用于将测序数据比对到参考基因组并对质控结果进行质控以得到符合质控标准的合格数据;
变异结果注释单元,用于对变异结果进行注释以得到基因名称、转录本编号及位置信息、HGVS突变编号,和/或对中国人群突变频率进行注释,和/或对突变进行有害性预测和保守性预测,和/或对突变相关疾病信息进行注释;
样本质控单元,用于对所述基因芯片捕获的SNP位点进行基因型分析以得到SNP位点基因型与检测个体的对应关系;
样本性别质控单元,用于对所述基因芯片捕获的性别判断质控位点进行分析以得到性别判断质控位点与检测个体的对应关系;
HLA分型单元,用于对所述基因芯片捕获的HLA基因区域进行HLA分型。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括程序,该程序能够被处理器执行以实现如下所述的实体瘤多基因检测方法:
获取如权利要求1-4任一项所述的基因芯片所捕获的实体瘤组织的核酸序列的测序数据;
对实体瘤组织的测序数据进行变异检测,并对检测结果使用生殖细胞突变数据库进行过滤以得到实体瘤组织相关的体细胞突变;
对实体瘤组织的测序数据进行体细胞结构变异检测以得到实体瘤组织相关的体细胞结构变异;
对实体瘤组织的测序数据进行肿瘤突变负荷预测;
对实体瘤组织的测序数据进行微卫星不稳定检测。
13.根据权利要求12所述的计算机可读存储介质,其特征在于,所述微卫星不稳定检测包括以下步骤:
分别计算每个位点的微卫星不稳定变化情况,统计所有符合质控标准且发生碱基的插入或缺失且支持读长数满足设定标准的位点,获得潜在微卫星不稳定位点;
使用基于信息熵的算法对所述潜在微卫星不稳定位点进行筛选,获得体细胞微卫星不稳定位点;
统计所述体细胞微卫星不稳定位点数量;和
筛选所述体细胞微卫星不稳定位点数占总微卫星不稳定位点数的百分比大于设定阈值的位点,获得微卫星不稳定检测结果。
14.根据权利要求13所述的计算机可读存储介质,其特征在于,所述质控标准为5bp≤微卫星不稳定位点长度≤50bp;所述设定标准为p<0.05;所述阈值为20%。
15.根据权利要求12所述的计算机可读存储介质,其特征在于,所述实体瘤多基因检测方法,还包括如下一种或多种步骤:
将下机数据转化为通用的文件格式以及将多个样本的数据拆分开来;
去除测序数据中的测序接头序列、低质量序列及N碱基组成的序列以及对过滤后的数据进行质控以得到符合质控标准的合格数据;
将测序数据比对到参考基因组并对质控结果进行质控以得到符合质控标准的合格数据;
对变异结果进行注释以得到基因名称、转录本编号及位置信息、HGVS突变编号,和/或对中国人群突变频率进行注释,和/或对突变进行有害性预测和保守性预测,和/或对突变相关疾病信息进行注释;
对所述基因芯片捕获的SNP位点进行基因型分析以得到SNP位点基因型与检测个体的对应关系;
对所述基因芯片捕获的性别判断质控位点进行分析以得到性别判断质控位点与检测个体的对应关系;
对所述基因芯片捕获的HLA基因区域进行HLA分型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910768791.5A CN110387419B (zh) | 2019-08-20 | 2019-08-20 | 实体瘤多基因检测基因芯片及其制备方法和检测装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910768791.5A CN110387419B (zh) | 2019-08-20 | 2019-08-20 | 实体瘤多基因检测基因芯片及其制备方法和检测装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110387419A CN110387419A (zh) | 2019-10-29 |
CN110387419B true CN110387419B (zh) | 2023-06-13 |
Family
ID=68289173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910768791.5A Active CN110387419B (zh) | 2019-08-20 | 2019-08-20 | 实体瘤多基因检测基因芯片及其制备方法和检测装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110387419B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110797078A (zh) * | 2020-01-06 | 2020-02-14 | 北京吉因加科技有限公司 | 微卫星不稳定位点筛选、分析模型的构建方法及装置 |
CN111321140B (zh) * | 2020-03-03 | 2021-08-06 | 苏州吉因加生物医学工程有限公司 | 一种基于单样本的肿瘤突变负荷检测方法和装置 |
CN111748622A (zh) * | 2020-05-22 | 2020-10-09 | 湖南光琇高新生命科技有限公司 | 一种遗传性肿瘤易感基因检测试剂盒及其探针 |
CN113053458B (zh) * | 2021-01-19 | 2023-08-04 | 深圳裕康医学检验实验室 | 一种肿瘤新生抗原负荷的预测方法及装置 |
CN112746097A (zh) * | 2021-01-29 | 2021-05-04 | 深圳裕康医学检验实验室 | 一种检测样本交叉污染的方法以及预测交叉污染源的方法 |
CN113151476B (zh) * | 2021-05-07 | 2022-08-09 | 北京泛生子基因科技有限公司 | 一种基于二代测序数据鉴别微卫星不稳定的位点组合、方法及其应用 |
CN115354081B (zh) * | 2022-10-18 | 2023-03-24 | 迈杰转化医学研究(苏州)有限公司 | 一种泛实体瘤精准用药基因检测组合及其应用 |
CN116564405B (zh) * | 2023-04-19 | 2023-12-15 | 江苏先声医学诊断有限公司 | 一种基于平均无序度的基因组测序突变位点过滤方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102251046A (zh) * | 2011-07-29 | 2011-11-23 | 王荣 | 一种用于检测血液中肿瘤突变基因的方法 |
CA2865335A1 (en) * | 2012-03-09 | 2013-09-12 | Caris Life Sciences Luxembourg Holdings, S.A.R.L. | Biomarker compositions and methods |
CN109033749A (zh) * | 2018-06-29 | 2018-12-18 | 深圳裕策生物科技有限公司 | 一种肿瘤突变负荷检测方法、装置和存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2016349644B2 (en) * | 2015-11-06 | 2022-11-24 | Ventana Medical Systems, Inc. | Representative diagnostics |
CN107475375B (zh) * | 2017-08-01 | 2018-08-24 | 南京世和基因生物技术有限公司 | 一种用于与微卫星不稳定性相关微卫星位点进行杂交的dna探针库、检测方法和试剂盒 |
AU2018338441A1 (en) * | 2017-09-25 | 2020-04-09 | Memorial Sloan Kettering Cancer Center | Tumor mutational load and checkpoint immunotherapy |
CN107992721B (zh) * | 2017-11-10 | 2020-03-31 | 深圳裕策生物科技有限公司 | 用于检测目标区域基因融合的方法、装置和存储介质 |
CN109913539A (zh) * | 2017-12-13 | 2019-06-21 | 浙江大学 | 一种靶向捕获hla基因序列并测序的方法 |
CN108796055B (zh) * | 2018-06-12 | 2022-04-08 | 深圳裕策生物科技有限公司 | 基于二代测序的肿瘤新生抗原检测方法、装置和存储介质 |
CN109022553B (zh) * | 2018-06-29 | 2019-10-25 | 裕策医疗器械江苏有限公司 | 用于肿瘤突变负荷检测的基因芯片及其制备方法和装置 |
CN109706065A (zh) * | 2018-12-29 | 2019-05-03 | 深圳裕策生物科技有限公司 | 肿瘤新生抗原负荷检测装置及存储介质 |
CN109609647B (zh) * | 2019-01-25 | 2022-08-23 | 臻悦生物科技江苏有限公司 | 基于二代测序的用于泛癌种靶向、化疗及免疫用药的检测Panel、检测试剂盒及其应用 |
CN110592213A (zh) * | 2019-09-02 | 2019-12-20 | 深圳市新合生物医疗科技有限公司 | 预测新抗原负荷和检测基因组突变的基因panel |
-
2019
- 2019-08-20 CN CN201910768791.5A patent/CN110387419B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102251046A (zh) * | 2011-07-29 | 2011-11-23 | 王荣 | 一种用于检测血液中肿瘤突变基因的方法 |
CA2865335A1 (en) * | 2012-03-09 | 2013-09-12 | Caris Life Sciences Luxembourg Holdings, S.A.R.L. | Biomarker compositions and methods |
CN109033749A (zh) * | 2018-06-29 | 2018-12-18 | 深圳裕策生物科技有限公司 | 一种肿瘤突变负荷检测方法、装置和存储介质 |
Non-Patent Citations (1)
Title |
---|
分子诊断研发与市场发展概况;周琳颖 等;生物产业技术;6-13 * |
Also Published As
Publication number | Publication date |
---|---|
CN110387419A (zh) | 2019-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110387419B (zh) | 实体瘤多基因检测基因芯片及其制备方法和检测装置 | |
JP7317078B2 (ja) | 腫瘍変異負荷を評価するための方法及びシステム | |
AU2016326742B2 (en) | Method, apparatus, and computer program product for analyzing biological data | |
US20200203014A1 (en) | Methods and systems for sequencing-based variant detection | |
WO2019157791A1 (zh) | 一种拷贝数变异的检测方法、装置以及计算机可读介质 | |
US20180371453A1 (en) | Low-frequency mutations enrichment sequencing method for free target dna in plasma | |
CN108009400A (zh) | 全基因组肿瘤突变负荷预测方法、设备以及存储介质 | |
US20220243279A1 (en) | Systems and methods for evaluating tumor fraction | |
WO2016140974A1 (en) | Process for measuring tumor response to an initial oncology treatment | |
CN113249483B (zh) | 一种检测肿瘤突变负荷的基因组合、系统及应用 | |
US20220399080A1 (en) | Methods and products for minimal residual disease detection | |
WO2023030233A1 (zh) | 一种拷贝数变异的检测方法及其应用 | |
US20220356533A1 (en) | Biomarker composition for diagnosing or predicting prognosis of thyroid cancer, comprising preparation capable of detecting mutation in plekhs1 gene, and use thereof | |
Tang et al. | Tumor mutation burden derived from small next generation sequencing targeted gene panel as an initial screening method | |
US20230057154A1 (en) | Somatic variant cooccurrence with abnormally methylated fragments | |
US20170251973A1 (en) | Process for Measuring Tumor Response to an Initial Oncology Treatment | |
Spence et al. | Inter-laboratory proficiency testing scheme for tumour next-generation sequencing in Ontario: a pilot study | |
US20220213550A1 (en) | A method for diagnosing cancers of the genitourinary tract | |
US20240145038A1 (en) | cfDNA FRAGMENTOMIC DETECTION OF CANCER | |
US20240182981A1 (en) | Identification and design of cancer therapies based on rna sequencing | |
US20240105279A1 (en) | Methods and systems employing targeted next generation sequencing for classifying a tumor sample as having a level of homologous recombination deficiency similar to that associated with mutations in brca1 or brca2 genes | |
EP4397773A1 (en) | Copy number variation detection method and application thereof | |
EP4381512A1 (en) | Somatic variant cooccurrence with abnormally methylated fragments | |
US20230091151A1 (en) | Compositions and Methods for Targeted NGS Sequencing of cfRNA and cfTNA | |
Coysh | Bioinformatics pipeline development for analyses of data generated by target capture-based Next-Generation Sequencing, to characterise mutations and the utility of using off-target sequences to detect genomic imbalances in Multiple Myeloma patients. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |