CN114023381B - 一种肺癌mrd融合基因判定方法、装置、存储介质及设备 - Google Patents

一种肺癌mrd融合基因判定方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN114023381B
CN114023381B CN202111677030.2A CN202111677030A CN114023381B CN 114023381 B CN114023381 B CN 114023381B CN 202111677030 A CN202111677030 A CN 202111677030A CN 114023381 B CN114023381 B CN 114023381B
Authority
CN
China
Prior art keywords
fusion gene
fusion
gene
sequence
blood cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111677030.2A
Other languages
English (en)
Other versions
CN114023381A (zh
Inventor
杨滢
张娇
李菲菲
陶威
张亚晰
何骥
陈维之
杜波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhenhe Beijing Biotechnology Co ltd
Original Assignee
Zhenhe Beijing Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhenhe Beijing Biotechnology Co ltd filed Critical Zhenhe Beijing Biotechnology Co ltd
Priority to CN202111677030.2A priority Critical patent/CN114023381B/zh
Publication of CN114023381A publication Critical patent/CN114023381A/zh
Application granted granted Critical
Publication of CN114023381B publication Critical patent/CN114023381B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种肺癌MRD融合基因判定方法、装置、存储介质及设备,属于医学检测技术领域。包括接收肿瘤组织、肿瘤血细胞和血浆的测序数据;根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列;在肿瘤血细胞和血浆的测序数据中追踪所述第一融合基因序列和第二融合基因序列,得到第一融合基因;对所述第一融合基因通过过滤血细胞中的融合基因,判定最终的经典融合基因。所述的装置、存储介质及设备均是基于所述的方法实现。本发明能够对肺癌MRD融合基因进行准确判定。

Description

一种肺癌MRD融合基因判定方法、装置、存储介质及设备
技术领域
本申请属于医学检测技术领域,具体涉及一种肺癌MRD融合基因判定方法、装置、存储介质及设备。
背景技术
肺癌是发病率和死亡率增长最快,对人类健康和生命威胁最大的恶性肿瘤之一。目前手术切除和辅助治疗是肺癌的主要治疗方式,但是仍有一定比例的患者会出现肿瘤复发。如I期、II期和III期五年复发率分别为21%、36%和55%。识别高复发风险群体并及时干预处理,可以提高患者的总生存,改善生活质量。目前,临床上主要采用TNM分期评估肺癌患者的预后或复发风险,但还有待完善。循环肿瘤DNA(ctDNA)是由肿瘤细胞凋亡坏死释放到血液中的短DNA片段,目前被广泛应用于肿瘤患者的早期诊断、用药指导、耐药监测等多个方面。国内外多项研究数据均显示,检测ctDNA可以对肺癌患者进行个体化复发风险分层,为后续干预措施的决策提供更多维度参考信息。
目前,针对肺癌的融合基因的检出有专门用于ctDNA分析的NGS panel,并且许多基因融合的问题是使用杂交捕获panel获得的,经典的肺癌融合基因主要包括ALK、RET、ROS1重排,现有技术中,针对这三类经典融合基因的鉴定存在不同的缺陷,例如融合基因的检出容易出现假阳性的问题,从而导致对融合基因检测的准确性差。
发明内容
技术问题:针对现有对肺癌MRD融合基因的鉴定技术准确性差的问题,本申请提出一种肺癌MRD融合基因判定方法、装置、存储介质及设备,从而能够对肺癌患者的经典融合基因的检出进行准确的鉴定。
技术方案:第一方面,本发明提供一种肺癌MRD融合基因判定方法,包括:
接收肿瘤组织、肿瘤血细胞和血浆的测序数据;
根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列;
在肿瘤血细胞和血浆的测序数据中追踪所述第一融合基因序列和第二融合基因序列,得到第一融合基因;
对所述第一融合基因通过过滤血细胞中的融合基因,判定最终的经典融合基因,所述的经典融合基因为ALK、RET和ROS1。
进一步地,所述第一检测软件为FusionMap,第二检测软件为FACTERA。
进一步地,所述利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列包括:
利用第一检测软件进行融合基因分析,得到第一融合基因结果和第一比对结果;对所述第一融合基因结果进行条件过滤,得到第一融合基因序列;
根据第一比对结果,利用第二检测软件得到第二融合基因结果,对所述第二融合基因结果进行过滤,得到第二融合基因序列。
进一步地,所述对所述第一融合基因结果进行条件过滤包括:
对第一融合基因结果按照softclipped reads序列的支持数大于或等于10进行过滤。
进一步地,对所述第二融合基因结果进行过滤包括:
过滤多重比对位点;
过滤已知数据库中假阳性位点基因,所述数据库为基于至少500例基线样本;
若此融合在大于或等于2例样本中出现,则被列为黑名单融合位点;对于经典融合基因ALK/RET/ROS1位点的reads支持数要大于5,其他基因大于10。
进一步地,所述在肿瘤血细胞和血浆中的测序数据中追踪所述第一融合基因序列和第二融合基因序列包括:
利用BWA软件,分别用肿瘤血细胞和血浆的测序数据对所述第一融合基因序列和第二融合基因序列进行比对,保留完全匹配到的融合基因,得到第一融合基因。
进一步地,所述通过过滤血细胞中的融合,判定最终的经典融合基因包括:
针对第一融合基因,通过配对样本,过滤血浆中追踪到血细胞的胚系融合基因,只保留三类经典融合基因ALK、RET和ROS1的结果,确定该样本最终的融合基因。
进一步地,所述确定该样本最终的融合基因的方法为:
分别利用第一检测软件和第二检测软件分别进行分析,若在任一检测软件中融合基因的报出符合筛选条件,则确定为最终的融合基因。
进一步地,所述方法还包括对第二检测软件进行优化,所述优化包括:
添加FACTERA软件默认没有输出的比对位置信息;
优化第二软件的融合序列拼接方向,结合基因所在正负链信息与cigar值进一步优化融合方向,若基因在正链,则cigar值不变;若基因在负链,则cigar值取反向,得到矫正后的融合方向。
第二方面,本发明提供一种肺癌MRD融合基因判定装置,根据所提供的肺癌MRD融合基因判定方法对肺癌MRD融合基因,包括:
数据接收模块,其被配置为用于接收肿瘤组织、肿瘤血细胞和血浆的测序数据;
序列检出模块,其被配置为用于根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列;
序列追踪模块,其被配置为用于在肿瘤血细胞和血浆中的测序数据中追踪所述第一融合基因序列和第二融合基因序列,得到第一融合基因;
鉴定模块,其被配置为对第一融合基因通过过滤血细胞中的融合,判定最终的经典融合基因。
第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令,所述计算机指令能够被处理器执行以实现本发明所提供的肺癌MRD融合基因判定方法。
第四方面,本发明提供一种电子设备,包括:
本发明所提供的计算机可读存储介质,以及
处理器,所述处理器被配置为能够执行计算机可读存储介质中存储的计算机指令。
部分英文缩写说明:
ctDNA: Circulating tumor DNA,循环肿瘤DNA
MRD : minimal residual disease,经过根治性治疗的早中期癌症患者体内的隐匿性微转移或微小残留病灶。
cigar:比对结果,代表比对到参考基因组的具体情况,如37M1D2M1I的意思是37个匹配,1个参考序列上的删除,2个匹配,1个参考序列上的插入。
本发明首先根据所述肿瘤组织的测序数据获得融合基因序列;然后在肿瘤血细胞和血浆中追踪组织的融合基因序列;最后通过过滤血细胞中的融合,鉴定最终的经典融合基因。本发明相对于现有技术,对肺癌MRD融合基因的检测判定具有较高的准确率,能够有效避免现有技术中容易出现假阳性的问题。同时,本发明基于肺癌肿瘤组织DNA样本测序获得原始数据,降低了对样本质量的要求。
附图说明
图1为本发明的实施例中肺癌MRD融合基因判定方法的流程图;
图2为本发明的实施例中从肿瘤组织的原始测序数据得到融合基因序列的流程图;
图3为本发明的实施例中生成肺癌MRD经典融合基因的IGV示例图;
图4为本发明的实施例中肺癌MRD融合基因判定装置的框图;
图5为本发明的实施例中电子设备的框图。
具体实施方式
下面结合实施例和说明书附图对本发明作进一步的说明。说明的是,术语“第一”、“第二”等仅仅是为了便于说明,并不能作为对数量等的限定。
第一方面,本发明的实施例中提供了一种肺癌MRD融合基因判定方法,图1示出了该方法的流程图。结合图1所示,本发明的实施例中,该方法包括:
步骤S100:接收肿瘤组织、肿瘤血细胞和血浆的测序数据。在本发明的实施例中,可以基于一代、二代、三代基因测序技术对肿瘤组织、肿瘤血细胞和血浆进行测序,得到测序数据,利用所得到的测序数据完成对肺癌MRD融合基因的判定。
步骤S200:根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列。
具体的,在本发明的实施例中,可以按照如下的步骤进行,如图2所示。
步骤S201:对肺癌肿瘤组织DNA样本的测序数据进行过滤,包括对测序接头序列以及低质量碱基的移除;在本发明的实施例中,可以采用Trimmomatic(v0.36)进行相应操作。
步骤S202:将过滤后的测序数据比对到人类基因组上;具体操作时,是采用BWA(v0.7.17)软件将过滤后的测序数据比对到hg19版本的人类基因组上,在软件参数保持默认的情况下完成比对。
在本发明的优选实施例中,第一检测软件可以选择FusionMap,第二检测软件可以采用FACTERA。
步骤S203:将步骤S202得到的比对结果采用FuisonMap软件进行融合基因分析,得到第一融合基因结果和第一比对结果。本实施例中,在利用FusionMap软件时,第一融合基因结果为Fusionmap.filter.results文件输出,第一比对结果为FusionMap.bam文件输出。利用FuisonMap软件进行融合基因分析,检出经典融合基因,提取softclipped 跨断点支持的reads组装得到融合序列。通过对第一融合基因结果进行条件过滤,得到第一融合基因序列,即利用第一检测软件生成的融合基因序列文件。具体的,在本发明的实施例中,第一融合基因结果Fusionmap.filter.results按照Softclipped reads 序列的reads支持数大于等于10,即可生成FusionMap融合基因序列文件。
步骤S204:根据第一比对结果,利用第二检测软件得到第二融合基因结果,对第二融合基因结果进行过滤,得到第二融合基因序列。在本发明的实施例中,第二检测软件是FACTERA,第二融合基因结果指的是利用FACTERA软件得到的融合基因,具体的是第一比对结果Fusionmap.bam输入到FACTERA软件中组装得到融合基因序列,然后对该融合基因序列在进行过滤,得到的就是第二融合基因序列。
更具体的,对融合基因序列进行过滤时包括:过滤多重比对位点;过滤已知数据库中假阳性位点基因,这里的数据库为基于至少500例基线样本,若此融合在大于或等于2例样本中出现,则被列为黑名单融合位点,对于经典融合基因ALK/RET/ROS1 位点的reads支持数要大于5,其他基因大于10,过滤完的基因提取生成为第二检测软件的融合基因序列文件,也就是第二融合基因序列。
在本发明的实施例中,通过验证分析确定使用第一检测软件比对结果作为第二检测软件的比对输入文件,可以得到更高的检出率。在本发明的示例中,如表1所示。
表1 比对文件选择融合结果示例
FUSION Num Ratio
肿瘤组织样本—RNA&DNA共同检出 118 100.0%
FACTERA原始检出-fusionmap.bam 104 88.1%
FACTERA原始检出-mkdup.bam 100 84.7%
如表1所示,通过118例肿瘤组织样本,在这些样本的RNA和DNA样本中都确定有经典融合的报出,通过测试FACTERA软件适用哪种比对文件融合基因的检出率更高,最终确定用FusionMap软件输出的比对文件。
在本发明的实施例中,在利用FACTERA软件进行融合基因检测时,对FACTERA软件进行了优化,从而提高检测的准确性。具体包括两方面:一是,添加了FACTERA软件默认没有输出的比对位置信息。经过测试,FACTERA软件没有输出位置信息是有真实融合位点的检出,通过实现FACTERA软件分析结果能够输出全部比对的结果,从一定意义上防止了真实融合基因的漏检。二是,优化FACTERA软件融合序列拼接方向。FACTERA软件根据reads比对到参考基因组cigar值判断融合方向,即保留断点前的片段(NC)或断点后的片段(CN),进而拼接融合序列。本申请结合基因所在正负链信息与cigar值进一步优化融合方向,若基因在正链,则cigar值不变。若基因在负链,则cigar值取反向,得到矫正后的融合方向。根据融合方向的4种可能(NC->CN, NC->NC,CN->CN, CN->NC)拼接融合序列,得到准确的融合序列。具体算法为:NC->CN,融合序列为两个基因片段顺序连接;NC->NC,第二个基因片段取反向互补;CN->NC,融合序列为第二个基因片段连接第一个基因片段;CN->CN,融合序列为第二个基因片段取反向互补后连接第一个基因片段。
步骤S300:在肿瘤血细胞和血浆中的测序数据中追踪所述第一融合基因序列和第二融合基因序列,得到第一融合基因。该步骤的主要目的,是为了在肿瘤血浆和血细胞中追踪监测组织得到的融合基因,具体的,利用BWA软件,将步骤S200得到的第一融合基因序列和第二融合基因序列分别用肿瘤血细胞和血浆样本测序数据进行比对,保留完全匹配到的融合基因,也就是所谓的第一融合基因。可以得到融合基因的比对文件,然后根据测序数据平台提取得到第一融合基因ID和支持reads数。
步骤S400:通过过滤血细胞中的融合,判定最终的经典融合基因。在本发明的实施例中,该步骤的主要目的是为了排除假阳性融合基因。具体的,对步骤S300得到的融合基因,通过配对样本,过滤血浆中追踪到血细胞的胚系融合基因,只保留三类经典融合基因ALK、RET和ROS1的结果,确定该样本最终的融合基因。在本发明的实施例中,为了更加准确地确定最终的融合基因,在该步骤中,分别利用第一检测软件和第二检测软件分别进行分析,若在任一个检测软件中融合基因的报出符合筛选条件,则确定为最终的融合基因。
如表2所示,给出了本发明的一个示例中,利用所提供的方法得出的血浆中的追踪结果。
表2结果文件内容示例
FUSIONID FF_supportreas CF_supportreas Original
chr6-117647588:chr5-149777997|ROS1-TCOF1 26 9 FusionMap
chr2:29450322-29450822,chr2:42506433-42506933|ALK-EML4 85 5 FACTERA
a.FUSIONID:表示融合基因1/2的位置及基因名称
b.FF_supportreads:肿瘤组织样本的融合基因reads支持数
c.CF_supportreads:肿瘤血浆样本的融合基因reads支持数
d.Original:融合基因结果来源软件
如表2 给出了本发明的示例中第一检测软件和第二检测软件分析得到的融合基因检测结果。
如表3所示,给出了本发明的一个示例中,利用所提供的方法得出的最终FUSION_MRD的判定结果。
表3 Fusion_MRD 结果
PID Fusion_MRD FusionINFO
P1_CF0 Positive chr10:32316465-32316965,chr10:43611765-43612265|RET-KIF5B|14|93|FACTERA;chr10-32316466:chr10-43611766|KIF5B-RET|58|1|FusionMap
P1_CF3D Positive chr10:32316465-32316965,chr10:43611765-43612265|RET-KIF5B|14|126|FACTERA;chr10-32316466:chr10-43611766|KIF5B-RET|58|5|FusionMap
P1_CF1M Positive chr10:32316465-32316965,chr10:43611765-43612265|RET-KIF5B|14|163|FACTERA
P1_CF3M Positive chr10:32316465-32316965,chr10:43611765-43612265|RET-KIF5B|14|111|FACTERA
P1_CF6M Positive chr10:32316465-32316965,chr10:43611765-43612265|RET-KIF5B|14|124|FACTERA
P1_CF9M Positive chr10:32316465-32316965,chr10:43611765-43612265|RET-KIF5B|14|227|FACTERA
P1_CF12M Positive chr10:32316465-32316965,chr10:43611765-43612265|RET-KIF5B|14|518|FACTERA
如表3所示,血浆样本随时间检测,肺癌MRD融合阳性保持稳定趋势,融合断点的支持reads数也在不断递增,提示肿瘤存在微小残留病灶未清除。
图3示出了本发明示例中具体生成肺癌MRD经典融合基因的IGV示例图。图中展示了肺癌肿瘤组织样本P1_FFZ,肿瘤血浆样本P1_CF9M和P1_CF12M,肿瘤血细胞样本P1_BC的融合比对结果IGV实例图,可以看出肺癌MRD经典融合基因KIF5B-RET,在组织中检测到后,在随后的9个月和12个月采集的血浆中也检测到,肿瘤血细胞样本中没有检测到,验证了本实施方法的准确性和真实性。
IGV(Integrative Genomics Viewer)是一款本地即可使用的基因组浏览器,该软件支持芯片数据,NGS数据,基因组注释等多种类型的数据。
第二方面,本发明的实施例中提供了一种肺癌MRD融合基因判定装置,该装置可以根据本发明所提供的肺癌MRD融合基因判定方法对肺癌MRD融合基因进行判定,如图4所示,在本发明的实施例中,该装置包括数据接收模块、序列检出模块、追踪模块和鉴定模块,其中数据接收模块被配置为用于接收肿瘤组织、肿瘤血细胞和血浆的测序数据;序列检出模块被配置为用于根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列;追踪模块被配置为用于在肿瘤血细胞和血浆中的测序数据中追踪所述第一融合基因序列和第二融合基因序列;鉴定模块被配置为用于通过过滤血细胞中的融合,判定最终的经典融合基因。对于各个模块具体如何实现相应的功能,与本发明的所提供的方法中相应的方法步骤相同,此处不再赘述。
第三方面,本发明提供一种计算机可读存储介质,其中存储有计算机指令,当计算机指令由处理器执行时,能够实现本发明的实施例中所提出的肺癌MRD融合基因判定方法。本发明中所称的计算机可读介质包括各种类型的计算机存储介质,可以是通用或专用计算机能够存取的任何可用介质。举例而言,计算机可读介质可以包括RAM、ROM、EPROM、E2PROM、寄存器、硬盘、可移动盘、CD-ROM或其他光盘存储器、磁盘存储器或其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码单元并能够由通用或特定用途计算机、或者通用或特定用途处理器进行存取的任何其他临时性或者非临时性介质。如本文所使用的,盘(disk)和碟(disc)包括紧致碟(CD)、激光碟、光碟、数字多用途光碟(DVD)、软盘和蓝光碟,其中盘通常磁性地复制数据,而碟则用激光来光学地复制数据。上述的组合也应当包括在计算机可读介质的保护范围之内。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读写信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
本发明的第四方面,提供一种电子设备。如图5所示,电子设备包括如上文所述的任意一种计算机可读存储介质和处理器。其中,处理器被配置成能够执行计算机可读存储介质中存储的计算机指令。需要说明的是,电子设备还可以包括其他部件,例如输入设备、显示设备等,出于清楚说明本发明的原理角度考虑,这些部件并未示出。
上述实施例仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和等同替换,这些对本发明权利要求进行改进和等同替换后的技术方案,均落入本发明的保护范围。

Claims (11)

1.一种肺癌MRD融合基因判定方法,其特征在于,包括:
接收肿瘤组织、肿瘤血细胞和血浆的测序数据;
根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列,包括:利用第一检测软件进行融合基因分析,得到第一融合基因结果和第一比对结果;对所述第一融合基因结果进行条件过滤,得到第一融合基因序列;根据第一比对结果,利用第二检测软件得到第二融合基因结果,对所述第二融合基因结果进行过滤,得到第二融合基因序列;
在肿瘤血细胞和血浆的测序数据中追踪所述第一融合基因序列和第二融合基因序列,得到第一融合基因;
对所述第一融合基因通过过滤血细胞中的融合基因,判定最终的经典融合基因。
2.根据权利要求1所述的方法,其特征在于,所述第一检测软件为FusionMap,第二检测软件为FACTERA。
3.根据权利要求2所述的方法,其特征在于,所述对所述第一融合基因结果进行条件过滤包括:
对第一融合基因结果按照softclipped reads序列的支持数大于或等于10进行过滤。
4.根据权利要求3所述的方法,其特征在于,对所述第二融合基因结果进行过滤包括:
过滤多重比对位点;
过滤已知数据库中假阳性位点基因,所述数据库为基于500例基线样本;
若此融合在大于或等于2例样本中出现,则被列为黑名单融合位点;对于经典融合基因ALK/RET/ROS1位点的reads支持数要大于5,其他基因大于10。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述在肿瘤血细胞和血浆中的测序数据中追踪所述第一融合基因序列和第二融合基因序列包括:
利用BWA软件,分别用肿瘤血细胞和血浆的测序数据对所述第一融合基因序列和第二融合基因序列进行比对,保留完全匹配到的融合基因,得到第一融合基因。
6.根据权利要求5所述的方法,其特征在于,所述通过过滤血细胞中的融合,判定最终的经典融合基因包括:
针对第一融合基因,通过配对样本,过滤血浆中追踪到血细胞的胚系融合基因,只保留三类经典融合基因ALK、RET和ROS1的结果,确定该样本最终的融合基因。
7.根据权利要求6所述的方法,其特征在于,所述确定该样本最终的融合基因的方法为:
分别利用第一检测软件和第二检测软件分别进行分析,若在任一检测软件中融合基因的报出符合筛选条件,则确定为最终的融合基因。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括对第二检测软件进行优化,所述优化包括:
添加FACTERA软件默认没有输出的比对位置信息;
优化第二软件的融合序列拼接方向,结合基因所在正负链信息与cigar值进一步优化融合方向,若基因在正链,则cigar值不变;若基因在负链,则cigar值取反向,得到矫正后的融合方向。
9.一种肺癌MRD融合基因判定装置,根据权利要求1-8任一项所述的肺癌MRD融合基因判定方法对肺癌MRD融合基因进行判定,其特征在于,包括:
数据接收模块,其被配置为用于接收肿瘤组织、肿瘤血细胞和血浆的测序数据;
序列检出模块,其被配置为用于根据所述肿瘤组织的测序数据,利用第一检测软件和第二检测软件进行融合基因分析,得到第一融合基因序列和第二融合基因序列;
序列追踪模块,其被配置为用于在肿瘤血细胞和血浆中的测序数据中追踪所述第一融合基因序列和第二融合基因序列,得到第一融合基因;
鉴定模块,其被配置为对第一融合基因通过过滤血细胞中的融合基因,判定最终的经典融合基因。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机指令,所述计算机指令能够被处理器执行以实现权利要求1-8任一项所述的肺癌MRD融合基因判定方法。
11.一种电子设备,其特征在于,包括:
权利要求10所述的计算机可读存储介质,以及处理器,所述处理器被配置为能够执行计算机可存储介质中的计算机指令。
CN202111677030.2A 2021-12-31 2021-12-31 一种肺癌mrd融合基因判定方法、装置、存储介质及设备 Active CN114023381B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111677030.2A CN114023381B (zh) 2021-12-31 2021-12-31 一种肺癌mrd融合基因判定方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111677030.2A CN114023381B (zh) 2021-12-31 2021-12-31 一种肺癌mrd融合基因判定方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN114023381A CN114023381A (zh) 2022-02-08
CN114023381B true CN114023381B (zh) 2022-03-22

Family

ID=80069462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111677030.2A Active CN114023381B (zh) 2021-12-31 2021-12-31 一种肺癌mrd融合基因判定方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN114023381B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115679000B (zh) * 2022-12-30 2023-03-21 臻和(北京)生物科技有限公司 微小残留病灶的检测方法、装置、设备和存储介质
CN116994656B (zh) * 2023-09-25 2024-01-02 北京求臻医学检验实验室有限公司 一种用于提高二代测序检测准确度的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106650254A (zh) * 2016-12-16 2017-05-10 武汉菲沙基因信息有限公司 一种基于转录组测序数据检测融合基因的方法
CN107437002A (zh) * 2017-04-28 2017-12-05 首度生物科技(苏州)有限公司 一种快速检测融合基因的方法
CN108486235A (zh) * 2018-03-07 2018-09-04 北京圣谷智汇医学检验所有限公司 一种高效经济检测融合基因的方法和体系
CN112164423A (zh) * 2020-10-14 2021-01-01 深圳吉因加医学检验实验室 基于RNAseq数据的融合基因检测方法、装置和存储介质
CN113035273A (zh) * 2021-03-11 2021-06-25 南京先声医学检验有限公司 一种快速、超高灵敏度的dna融合基因检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140323320A1 (en) * 2011-12-31 2014-10-30 Bgi Tech Solutions Co., Ltd. Method of detecting fused transcripts and system thereof

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106650254A (zh) * 2016-12-16 2017-05-10 武汉菲沙基因信息有限公司 一种基于转录组测序数据检测融合基因的方法
CN107437002A (zh) * 2017-04-28 2017-12-05 首度生物科技(苏州)有限公司 一种快速检测融合基因的方法
CN108486235A (zh) * 2018-03-07 2018-09-04 北京圣谷智汇医学检验所有限公司 一种高效经济检测融合基因的方法和体系
CN112164423A (zh) * 2020-10-14 2021-01-01 深圳吉因加医学检验实验室 基于RNAseq数据的融合基因检测方法、装置和存储介质
CN113035273A (zh) * 2021-03-11 2021-06-25 南京先声医学检验有限公司 一种快速、超高灵敏度的dna融合基因检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
当前RNA序列比对技术的分析;侯莉 等;《智能计算机与应用》;20121031;第2卷(第5期);1-3,7 *

Also Published As

Publication number Publication date
CN114023381A (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN114023381B (zh) 一种肺癌mrd融合基因判定方法、装置、存储介质及设备
CN107849612B (zh) 比对和变体测序分析管线
CN112111565A (zh) 一种细胞游离dna测序数据的突变分析方法和装置
CN111341383B (zh) 一种检测拷贝数变异的方法、装置和存储介质
CN112164423B (zh) 基于RNAseq数据的融合基因检测方法、装置和存储介质
CN103993069A (zh) 病毒整合位点捕获测序分析方法
EP3729441B1 (en) Microsatellite instability detection
WO2023115662A1 (zh) 一种变体核酸的检测方法
CN111326212A (zh) 一种结构变异的检测方法
CN105925665A (zh) 试剂盒、建库方法以及检测目标区域变异的方法及系统
CN105132407A (zh) 一种脱落细胞dna低频突变富集测序方法
US20200075123A1 (en) Genetic variant detection based on merged and unmerged reads
CN116403644B (zh) 一种用于癌症风险预测的方法及装置
CN113724785B (zh) 基于二代测序的肿瘤分型方法、装置、存储介质及设备
CN112102944A (zh) 一种基于ngs的脑肿瘤分子诊断的分析方法
WO2018150378A1 (en) Detecting cross-contamination in sequencing data using regression techniques
CN111968702A (zh) 一种基于循环肿瘤dna的恶性肿瘤早期筛查系统
CN114067908B (zh) 一种评估单样本同源重组缺陷的方法、装置和存储介质
CN115273982A (zh) 基于转录组测序数据的非编码circRNA生物信息分析方法、装置、终端及介质
CN108504734B (zh) 一种恶性肿瘤组织特定个体归属的判断方法及其应用
CN117577178B (zh) 一种结构变异精确断裂信息的检测方法、系统及其应用
CN116083587B (zh) 一种基于异常可变剪切预测肿瘤新生抗原的方法以及装置
CN112639129A (zh) 确定新发突变在胚胎中的遗传状态的方法和装置
CN117423388B (zh) 一种基于甲基化水平的多癌种检测系统及电子设备
US20170226588A1 (en) Systems and methods for dna amplification with post-sequencing data filtering and cell isolation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant