CN116994649A - 一种基因检测数据的智能判定方法以及智能判定系统 - Google Patents
一种基因检测数据的智能判定方法以及智能判定系统 Download PDFInfo
- Publication number
- CN116994649A CN116994649A CN202310998726.8A CN202310998726A CN116994649A CN 116994649 A CN116994649 A CN 116994649A CN 202310998726 A CN202310998726 A CN 202310998726A CN 116994649 A CN116994649 A CN 116994649A
- Authority
- CN
- China
- Prior art keywords
- intelligent
- gene
- verification
- data
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 56
- 238000001514 detection method Methods 0.000 title claims abstract description 41
- 238000012795 verification Methods 0.000 claims abstract description 27
- 238000012790 confirmation Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000012360 testing method Methods 0.000 claims abstract description 8
- 238000004458 analytical method Methods 0.000 claims description 18
- 230000035772 mutation Effects 0.000 claims description 18
- 239000000523 sample Substances 0.000 claims description 15
- 238000007726 management method Methods 0.000 claims description 12
- 108700028369 Alleles Proteins 0.000 claims description 9
- 238000002474 experimental method Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000001712 DNA sequencing Methods 0.000 claims description 2
- 238000003705 background correction Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 238000013500 data storage Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 claims 1
- 206010028980 Neoplasm Diseases 0.000 description 13
- 101150044182 8 gene Proteins 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 210000001685 thyroid gland Anatomy 0.000 description 10
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 8
- 102100022091 Ribosomal oxygenase 1 Human genes 0.000 description 8
- 201000005202 lung cancer Diseases 0.000 description 8
- 208000020816 lung neoplasm Diseases 0.000 description 8
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 description 7
- 201000011510 cancer Diseases 0.000 description 7
- 238000003908 quality control method Methods 0.000 description 6
- 230000008707 rearrangement Effects 0.000 description 6
- 101150000874 11 gene Proteins 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 5
- 101150042081 PCR10 gene Proteins 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 102100030708 GTPase KRas Human genes 0.000 description 3
- 102100039788 GTPase NRas Human genes 0.000 description 3
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 3
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 3
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 3
- 108010016731 PPAR gamma Proteins 0.000 description 3
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 3
- 238000002869 basic local alignment search tool Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013523 data management Methods 0.000 description 3
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 3
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 3
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 101150098999 pax8 gene Proteins 0.000 description 3
- 102000016914 ras Proteins Human genes 0.000 description 3
- 102200055464 rs113488022 Human genes 0.000 description 3
- 102000001301 EGF receptor Human genes 0.000 description 2
- 108060006698 EGF receptor Proteins 0.000 description 2
- 101150077555 Ret gene Proteins 0.000 description 2
- 208000024770 Thyroid neoplasm Diseases 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 101150103120 ptc gene Proteins 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 101150072531 10 gene Proteins 0.000 description 1
- 101150033839 4 gene Proteins 0.000 description 1
- NJYVEMPWNAYQQN-UHFFFAOYSA-N 5-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C21OC(=O)C1=CC(C(=O)O)=CC=C21 NJYVEMPWNAYQQN-UHFFFAOYSA-N 0.000 description 1
- BZTDTCNHAFUJOG-UHFFFAOYSA-N 6-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11OC(=O)C2=CC=C(C(=O)O)C=C21 BZTDTCNHAFUJOG-UHFFFAOYSA-N 0.000 description 1
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 1
- 101100296682 Arabidopsis thaliana PCR10 gene Proteins 0.000 description 1
- 101100522123 Caenorhabditis elegans ptc-1 gene Proteins 0.000 description 1
- 101100410162 Caenorhabditis elegans ptc-3 gene Proteins 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 101100520033 Dictyostelium discoideum pikC gene Proteins 0.000 description 1
- 102100029974 GTPase HRas Human genes 0.000 description 1
- 101000779641 Homo sapiens ALK tyrosine kinase receptor Proteins 0.000 description 1
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 1
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 1
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 1
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 102100038825 Peroxisome proliferator-activated receptor gamma Human genes 0.000 description 1
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 1
- 102100036894 Protein patched homolog 2 Human genes 0.000 description 1
- 101710161395 Protein patched homolog 2 Proteins 0.000 description 1
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000037029 cross reaction Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 108700021358 erbB-1 Genes Proteins 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 230000005861 gene abnormality Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 208000013076 thyroid tumor Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种基因检测数据的智能判定方法以及智能判定系统,所述智能判定方法包括如下步骤:从PCR仪器输出的原始数据文件中读取PCR产物结果的数据信息,将数据信息进行预处理和去噪,与数据库中已知的正常和突变基因序列进行判别比对,判定具体类型;然后对判定的具体类型进行结果确认与验证,重复测试后,生产最终结果报告。本发明的智能判定方法实现检测结果智能判读,检测报告智能生成,具有较为广泛的应用。
Description
技术领域
本发明涉及基因检测数据判定领域,具体而言,涉及一种基因检测数据的智能判定方法以及智能判定系统。
背景技术
目前现有技术中,工作人员在完成PCR实验之后,实验数据只能在仪器中显示,医生需要将数据手动誊抄到纸上,然后再在医院分子基因中心后台管理系统中生成报告的时候,根据纸上的实验数据,人工去判定某基因是否突变或融合。该工作不仅增加了医生的工作量,且容易出现错误。
有鉴于此,特提出本发明。
发明内容
有鉴于此,本发明公开了一种基因检测数据的智能判定方法以及智能判定系统,本方法建立了标准的基因检测标准,自动接入设备检测结果,对检测结果自动调用检测函数进行计算,实现全程的自动智能计算,智能判读。全程提高了PCR基因检测的效率及质量,建立PCR基因检测的全程管理,对PCR基因测序数据进行全程的数据标准化管理,对PCR基因检测过程中的样本质控、核酸提取、核酸稀释、MIX配置、上机质控、检测质控、结果质控、报告质控进行全程诊断标准管理,实现检测结果智能判读,检测报告智能生成,具有较为广泛的应用。
具体地,本发明是通过以下技术方案实现的:
第一方面,本发明公开了一种基因检测数据的智能判定方法,包括如下步骤:
从PCR仪器输出的原始数据文件中读取PCR产物结果的数据信息,将数据信息进行预处理和去噪,与数据库中已知的正常和突变基因序列进行判别比对,判定具体类型;
然后对判定的具体类型进行结果确认与验证,重复测试后,生产最终结果报告。
第二方面,本发明公开了一种基因检测数据的智能判定系统,包括:
判定模块:用于从PCR仪器输出的原始数据文件中读取PCR产物结果的数据信息,将数据信息进行预处理和去噪,与数据库中已知的正常和突变基因序列进行判别比对,判定具体类型;
结果验证模块:用于对判定的具体类型进行结果确认与验证,重复测试后,生产最终结果报告。
第三方面,本发明公开了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第二方面所述基因检测数据的智能判定方法的步骤。
第四方面,本发明公开了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第二方面所述智能判定方法的步骤。
本发明的基因检测数据的智能判定方法以及智能判定系统,通过建立标准的基因检测标准,自动接入设备检测结果,对检测结果自动调用检测函数进行计算,实现全程的自动智能计算,智能判读。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例提供的基因检测数据的智能判定方法的操作流程图;
图2为本发明实施例提供的新增的检测数值字段供医生复核的界面;
图3为本发明实施例提供的KNBP判定规则;
图4为本发明实施例提供的报告生成结果界面图;
图5为本发明实施例提供的肺癌11基因判定标准;
图6为本发明实施例提供的LET反应条B(LETB)FAM/ROX信号结果判定;
图7为本发明实施例提供的KNBP与EGFR结果判定标准;
图8为本发明实施例提供的甲状腺8基因癌判定标准;
图9为本发明实施例提供的一种计算机设备的流程示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
参照图1所示,本发明公开了一种基因检测数据的智能判定方法,包括如下步骤:
从PCR仪器输出的原始数据文件中读取PCR产物结果的数据信息,将数据信息进行预处理和去噪,与数据库中已知的正常和突变基因序列进行判别比对,判定具体类型;
然后对判定的具体类型进行结果确认与验证,重复测试后,生产最终结果报告。
整个智能判定方法是建立在数据库构建的基础上,所以第一步骤数据库构建的方法包括:
需要构建一个数据库来存储已知的正常基因序列、突变基因序列和其他相关信息。这些基因序列可以从公开数据库或通过实验室自行获取。对于每个基因,需要收集多个样本的序列信息,以保证结果的可靠性和统计学意义。数据的收集可以通过测序技术获得DNA片段的序列数据,并使用专业的测序分析软件对数据进行处理和整理。选择数据库管理系统可以选择合适的数据库管理系统,如SQLite、MySQL、PostgreSQL等,根据项目需求和规模进行选择。
然后,第二步骤为PCR产物结果的数据信息处理,对于PCR反应产生的目标基因片段,可以运用各种分析方法对其进行处理和分析。例如,可以利用凝胶电泳技术将PCR产物在琼脂糖凝胶上分离,然后使用图像分析软件定量测量DNA条带的大小和强度。此外,还可以使用荧光标记的引物和探针进行PCR反应,然后利用荧光实时定量PCR仪器测量荧光信号的强度和曲线变化。这些数据可以提供PCR产物的大小、带型模式、荧光信号强度等信息。直接从PCR仪器输出的原始数据文件中读取PCR产物数据和样本信息。
第三步骤是对形成的数据信息进行预处理和去噪,常用的方法可以包括背景校正、中值滤波等等。
第四步骤是对数据信息与数据库中已知的正常和突变基因序列进行判别比对,利用生物信息学工具进行序列比对和比较其实是判定规则比对的重要步骤之一。常用的工具包括BLAST、ClustalW、MAFFT等软件或在线平台。将PCR产物的序列与数据库中已知的正常和突变基因序列进行比对,以查找相似性和差异性。通过计算PCR数值的匹配度、缺失或插入的碱基数目等指标,可以确定PCR产物与已知标准之间的相关程度。并且在进行序列比对前,需要预先获取目标片段的序列信息。
在实施判定规则比对过程中,需要使用各种生物信息学工具和软件来处理和分析数据。这些工具能够对DNA序列进行比对、查找突变、计算相似性等操作。例如,BLAST(BasicLocal Alignment Search Tool)是一种常用的序列比对工具,可以根据已知序列库搜索和比对目标序列,从而确定其与已知序列的相似性和差异性。ClustalW和MAFFT是多序列比对工具,可用于比对多个样本的序列并生成比对结果。
此外,还有一些专门用于突变检测和分析的工具和软件。例如,VarScan可以从测序数据中识别出突变位点,并评估其频率和统计显著性。GATK(Genome Analysis Toolkit)是一个广泛使用的软件包,用于基因组变异分析,包括SNP(单核苷酸多态性)和INDEL(插入/缺失)的检测和注释。这些工具可以帮助实现判定规则比对的技术性要求,提高结果的准确性和可靠性。
在进行判定规则比对时,还需要考虑一些技术细节和注意事项。例如,引物和探针的设计应该具有高度特异性,能够选择性地扩增目标基因片段,并排除可能的交叉反应。此外,PCR反应条件的优化也是必要的,以确保扩增效率、特异性和可重复性。关于结果报告与解释,需要提供清晰详细的信息,包括数据分析的方法、结果的可信度评估、参考文献和数据库的引用等。
判定规则比对是一个涉及多种技术手段的过程,包括数据库构建、PCR产物数据处理、序列比对与比较、比对结果分析与解释、结果确认与验证,以及结果报告与解释等步骤。合理使用生物信息学工具、遵循实验操作规范、充分考虑验证和质控等方面将有助于高效准确地完成判定规则比对的任务。
其中,该发明的比对数据库采用了具有特色的肿瘤数据库,肿瘤数据库包含库管理、基因型数据管理、芯片数据管理、表型数据管理四个模块。肿瘤数据库不仅能批量管理样品数据,包括样品数据的入库、压缩、信息的查看和权限的设置等等,而且为基础分析流程提供重要的输入来源。系统通过创建不同样品库来对样品进行分类管理,每一个样品库可授权给多个用户,可以管理对数据库的访问修改权限,可配置不同的表型模板,方便数据的分类管理。该发明支持大规模存储和管理常见生物信息数据类型,包括但不限于二代测序单端数据、二代测序双端数据、SAM数据、BAM数据、GVCF数据、VCF数据、序列数据和SNP数据。通过录入对应vcf结果文件,系统将自动记录和统计对应位点的相关信息。如SNP编号、等位基因数量、等位基因观察数、次等位基因及频率、主等位基因及频率、其它等位基因及频率、基因型分布情况、观测杂合度频率、期望杂合度频率和哈温平衡P值等。在平台中,数据分析依赖于分析流程的配置。分析流程与一般流程图相同,每一个节点为一个分析任务,如同在脚本中的一条简单命令。而多个分析任务间用连线按顺序连接,组建出流程链路,如同一个完整的脚本。在执行分析流程时,系统会自动将能够并发执行的分析任务同时运行。
第五步骤是结果分析与解释:根据序列比对的结果,可以对PCR产物与已知标准之间的一致性进行分析和解释。如果PCR产物的序列与正常基因序列高度一致,则可以判定为正常类型;如果PCR产物的序列与突变基因序列具有特定的差异或突变,就可以判定为突变类型。在分析过程中,还可以考虑序列的保守性、功能区域的位置以及已知突变的生物学影响等因素。判定样本是否为阳性,可以根据比对得分来判定样本是否为阳性。
第六步骤是结果确认与验证:为了确保判定规则比对的准确性和可靠性,一般需要进行结果的确认和验证。这可以通过重复实验、使用不同的技术平台进行验证,或者将样本送往其他实验室进行验证。同时,也可以与已有的文献、数据库或专家意见进行对比和交流,以获得更可靠的结果。其中,验证过程可能包括DNA测序验证、引物和探针特异性验证、重复PCR实验验证等。可以对内部对照样本进行比对和比较,以验证PCR实验的可靠性。
第七步骤是为了提高准确性进行重复测试的步骤。
第八步骤是结果报告与解释:根据判定规则比对的分析结果,生成一份结果报告,并对PCR结果进行详细的解释。报告中应包括PCR产物的判定结果(正常或突变类型)以及所依据的判定规则和参考标准。同时,还可以提供相关的参考文献、数据库信息或专家意见,以支持结果的解释和分析。
此外,为了更为准确的理解本发明的方案,以具体的实施例进行说明:
在医生做完PCR实验的时候,通过实验仪器的系统将实验数据导出。然后将该导出数据以Excel的格式导入到相应模块中,系统会去解析该Excel文件,获得相应的实验数据。以型号为7500的实验仪器导出的PCR10基因项目的实验数据为例,通过解析实验数据的Excel文件,可以获得1-12号管的FAM与HEX值。根据目前使用的PCR10基因项目的检测试剂盒的说明书,去判断出该号管对应的基因是否有突变或者融合。
导入的Excel数据,会在生成病人PCR实验报告模板的时候会自动带入到报告生成的界面。以PCR10基因项目为例,生成PCR10基因报告模板的界面,会增加一栏为实验数据的值,并且对应的基因是否融合或突变会根据实验数据的值来进行自动的判定,医生可以手动修改该判定的结果以避免实验仪器检测出来的数据所带来的误差,具体见图2所示。
以KNBP的项目为例,将仪器Mx3000P导出的实验数据excel,直接导入到医院系统中。以这个数据为例,每次上机都将阴控、阳控管放在特定的位置,在导出的Excel中阴控、阳控将排在前列,之后才是每个患者的数据。KNBP项目需要对1-12号管进行检测,1-11号管对应不同的基因位点,12号管对应外控值。1-12号管中有FAM和HEX两个信号通道。一般情况下,1-11号管FAM信号通道的值为No Ct即为无Ct值。如果FAM通道出现了Ct值,则表明该号管所代表的基因出现突变,具体是强阳、弱阳还是阴性需要根据该号管的Ct值再去判定。判定规则如下:如果该管的Fam Ct值在弱阳的区间范围内,则需要去计算ΔCt值。ΔCt值的计算方式为当前管的Ct值减去外控Ct值即ΔCt=Ct-外控Ct。再计算出ΔCt之后,取ΔCt的绝对值与每个管的Cut-off值相比较,若小于该Cut-off值则为弱阳,若大于则为阴性。具体见图3所示。
在导入数据之后,系统会自动根据数值去计算并且显示出突变的基因。并且自动判定该位点是否突变。在系统自动判定之后,经过人工审核后,会将该数据存入数据库,并且在生成报告的时候自动带出此数据,具体结果见图4所示。
以下是PCR自动判定的步骤:
判定规则比对是通过技术手段将PCR结果与已知标准进行比对和分析,以确定PCR结果的含义。下面将进一步深入描述判定规则比对的技术性细节,包括数据库构建、PCR产物数据处理、序列比对与比较、比对结果分析与解释、结果确认与验证,以及结果报告与解释等方面。
在获得PCR仪器导出的Excel结果之后,该发明使用了Apache POI的工具来解析Excel文件。
肺癌11基因、EGFR等项目的导入规则与KNBP的类似,只是不同项目拥有不同的Ct值的判定规则,并且不同项目检测的基因数量不同,则管号不同(有些项目只需要检测1-8号管)。若需要检测7个基因,则需要保留8个管,最后一个管为外控值用于计算ΔCt。
另外,不同仪器导出的Excel格式也不同,只是判定的规则与KNBP的几乎一致,都需要去判定FAM通道是否有Ct值。如果有Ct值的话,则该号管所代表的基因存在突变。至于是阳性还是阴性需要去根据每个试剂的规则去判定Ct值。
肺癌11基因:
肺癌11基因存在RNA和DNA,因此有两个Excel需要导入,一个是RNA的结果,另外一个是DNA的结果。
另外,在肺癌11基因中,存在FAM、HEX和ROX三个信号通道,ROX信号通道的规则与FAM一样,也代表着不同的基因。对于肺癌11基因,每一号管会有FAM、HEX、ROX三个值,FAM和ROX对应着基因位点,HEX只是内控的数据,不代表任何基因位点。在计算ΔCt的时候,FAM的需要去减FAM的外控值,ROX的需要去减ROX的外控值,具体见图5-7所示。
甲状腺8基因癌:
甲状腺8基因癌是指甲状腺癌中具有8个特定基因异常的一种亚型,这些基因包括BRAF、RAS(HRAS、KRAS、NRAS)、RET/PTC(RET/PTC1、RET/PTC2、RET/PTC3)、PAX8/PPARγ等。对于甲状腺肿块进行判定是否为甲状腺8基因癌的标准主要有以下几项:
BRAF V600E突变检测:BRAF V600E是甲状腺8基因癌中最常见的突变类型,通过检测BRAF V600E突变可以辅助判断是否为甲状腺8基因癌。
RAS和RET/PTC基因重排检测:RAS和RET/PTC基因重排也是甲状腺8基因癌中常见的突变类型之一,通过检测这些基因的重排情况可以帮助判断是否为甲状腺8基因癌,具体见图8所示。
PAX8/PPARγ基因重排检测:PAX8/PPARγ基因重排是甲状腺8基因癌中的另一种常见突变类型,通过检测这一基因的重排情况也可以协助判断是否为甲状腺8基因癌。
本发明除了提供了一种基因检测数据的智能判定方法,还提供了一种基因检测数据的智能判定系统,包括:
判定模块:用于从PCR仪器输出的原始数据文件中读取PCR产物结果的数据信息,将数据信息进行预处理和去噪,与数据库中已知的正常和突变基因序列进行判别比对,判定具体类型;
结果验证模块:用于对判定的具体类型进行结果确认与验证,重复测试后,生产最终结果报告。
该系统主要由上述几个模块构成,具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
上述实施例中涉及的符号具体含义如下:
1、PCR:聚合酶链式反应
2、PCR10:肺癌10基因(EGFR、ALK、ROS1、KRAS、NRAS、BRAF、PIK3CA、RET、HER2、MET)检测
3、Excel:表格文件
4、KNBP:靶向4基因(KRAS、NRAS、BRAF、PIK3CA)(组织)
5、Mx3000p:PCR检测仪器型号
6、FAM:5/6-羧基荧光素
7、HEX:六氯-6-甲基荧光素
8、ROX:羧基-X-罗丹明
9、Ct值:PCR检测中反映样本中核酸含量的浓度的指标
10、ΔCt值:当前管的Ct值减去外控Ct值
11、EGFR:是指表皮生长因子受体(Epidermal Growth Factor Receptor)基因的第29位点的突变检测,使用ARMS法(Amplification Refractory Mutation System)进行检测。这个突变点通常与肺癌等肿瘤相关。
12、DNA:脱氧核糖核酸
13、RNA:核糖核酸
14、Cut-off:ΔCt临界值。
图9为本发明公开的一种计算机设备的结构示意图。参考图9所示,该计算机设备400,至少包括存储器402和处理器401;所述存储器402通过通信总线403和处理器连接,用于存储所述处理器401可执行的计算机指令,所述处理器401用于从所述存储器402读取计算机指令以实现上述任一实施例所述的智能判定方法的步骤。
对于上述装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备,例如包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部磁盘或可移动盘)、磁光盘以及CD ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路补充或并入专用逻辑电路中。
最后应说明的是:虽然本说明书包含许多具体实施细节,但是这些不应被解释为限制任何发明的范围或所要求保护的范围,而是主要用于描述特定发明的具体实施例的特征。本说明书内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上所述仅为本公开的较佳实施例而已,并不用以限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开保护的范围之内。
Claims (9)
1.一种基因检测数据的智能判定方法,其特征在于,包括如下步骤:
从PCR仪器输出的原始数据文件中读取PCR产物结果的数据信息,将数据信息进行预处理和去噪,与数据库中已知的正常和突变基因序列进行判别比对,判定具体类型;
然后对判定的具体类型进行结果确认与验证,重复测试后,生产最终结果报告。
2.根据权利要求1所述的智能判定方法,其特征在于,所述数据库的构建方法包括如下步骤:
通过测序技术或其他公开数据库获得一系列序列数据存储后,采用测序分析软件进行处理和整理,采用SQLite、MySQL或PostgreSQL的数据库管理系统进行管理。
3.根据权利要求1所述的智能判定方法,其特征在于,所述判别比对的方法包括如下步骤:
对数据信息涉及的SNP编号、等位基因数量、等位基因观察数、次等位基因及频率、主等位基因及频率、其它等位基因及频率、基因型分布情况、观测杂合度频率、期望杂合度频率和哈温平衡P值进行统计和分析;
通过不同基因的Ct值判定规则去判定基因的突变、以及是阳性还是阴性。
4.根据权利要求1所述的智能判定方法,其特征在于,结果确认与验证的方法包括如下步骤:
通过重复实验、使用不同的技术平台进行验证,或者将样本送往其他实验室进行验证,验证的方法包括DNA测序验证、引物和探针特异性验证、重复PCR实验验证的方法。
5.根据权利要求1所述的智能判定方法,其特征在于,最终结果报告包括PCR产物的判定结果以及所依据的判定规则和参考标准,还包括参考文献、数据库信息或专家意见。
6.根据权利要求1所述的智能判定方法,其特征在于,预处理和去噪的方法包括背景校正、中值滤波的方法。
7.权利要求1-6任一项所述的基因检测数据的智能判定方法的智能判定系统,其特征在于,包括:
判定模块:用于从PCR仪器输出的原始数据文件中读取PCR产物结果的数据信息,将数据信息进行预处理和去噪,与数据库中已知的正常和突变基因序列进行判别比对,判定具体类型;
结果验证模块:用于对判定的具体类型进行结果确认与验证,重复测试后,生产最终结果报告。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序执行时实现权利要求1-6任一项所述智能判定方法的步骤。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6任一项所述智能判定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310998726.8A CN116994649A (zh) | 2023-08-09 | 2023-08-09 | 一种基因检测数据的智能判定方法以及智能判定系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310998726.8A CN116994649A (zh) | 2023-08-09 | 2023-08-09 | 一种基因检测数据的智能判定方法以及智能判定系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116994649A true CN116994649A (zh) | 2023-11-03 |
Family
ID=88524540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310998726.8A Pending CN116994649A (zh) | 2023-08-09 | 2023-08-09 | 一种基因检测数据的智能判定方法以及智能判定系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116994649A (zh) |
-
2023
- 2023-08-09 CN CN202310998726.8A patent/CN116994649A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108573125B (zh) | 一种基因组拷贝数变异的检测方法及包含该方法的装置 | |
KR101795124B1 (ko) | 복제 수 변이를 검측하기 위한 방법 및 시스템 | |
KR102638152B1 (ko) | 서열 변이체 호출을 위한 검증 방법 및 시스템 | |
US11043283B1 (en) | Systems and methods for automating RNA expression calls in a cancer prediction pipeline | |
CN109767810B (zh) | 高通量测序数据分析方法及装置 | |
CN107423578B (zh) | 检测体细胞突变的装置 | |
CN111304303B (zh) | 微卫星不稳定的预测方法及其应用 | |
CN111968701B (zh) | 检测指定基因组区域体细胞拷贝数变异的方法和装置 | |
CN106909806A (zh) | 定点检测变异的方法和装置 | |
JP7067896B2 (ja) | 品質評価方法、品質評価装置、プログラム、および記録媒体 | |
CN108588194A (zh) | 利用高通量测序数据检测肿瘤突变负荷的方法及装置 | |
CN111647648A (zh) | 一种用于检测乳腺癌基因突变的基因panel及其检测方法与应用 | |
CN110016497B (zh) | 一种检测肿瘤单细胞基因组拷贝数变异的方法 | |
CN106778073A (zh) | 一种评估肿瘤负荷变化的方法和系统 | |
CN110021346B (zh) | 基于RNAseq数据的基因融合与突变检测方法及系统 | |
WO2021232388A1 (zh) | 确定胚胎细胞染色体中预定位点碱基类型的方法及其应用 | |
CN111326212A (zh) | 一种结构变异的检测方法 | |
CN112349346A (zh) | 检测基因组区域中的结构变异的方法 | |
CN105925665A (zh) | 试剂盒、建库方法以及检测目标区域变异的方法及系统 | |
CN113450871A (zh) | 基于低深度测序的鉴定样本同一性的方法 | |
CN115083521B (zh) | 一种单细胞转录组测序数据中肿瘤细胞类群的鉴定方法及系统 | |
KR20190015957A (ko) | 유전자 패널에 기초한 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스 | |
US20180080068A1 (en) | Methods and Systems for Ultra-Sensitive Detection of Genomic Alterations | |
CN108026576A (zh) | 通过母亲血浆dna的浅深度测序准确定量胎儿dna分数 | |
CN115691672A (zh) | 针对测序平台特征的碱基质量值矫正方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |