CN113990487A - 基于血常规、生化、尿常规检验数据的恶性肿瘤识别系统 - Google Patents
基于血常规、生化、尿常规检验数据的恶性肿瘤识别系统 Download PDFInfo
- Publication number
- CN113990487A CN113990487A CN202111258767.0A CN202111258767A CN113990487A CN 113990487 A CN113990487 A CN 113990487A CN 202111258767 A CN202111258767 A CN 202111258767A CN 113990487 A CN113990487 A CN 113990487A
- Authority
- CN
- China
- Prior art keywords
- data
- malignant tumor
- routine
- model
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了基于血常规,生化,尿常规检验数据的恶性肿瘤识别系统,属于医学检验领域和恶性肿瘤识别领域。总体架构包括:数据获取模块,获取常规检验数据,如血常规、生化、尿常规等数据。数据预处理模块,将上述获取到的常规检验数据进行进一步清理筛选,丢弃无用数据,选取常规数据中带有恶性肿瘤标签数据,离群点处理前先要判断该点是否是可用,若是无用点则可以当作噪声处理,若是有用则保留,进行数据的缺失值填补、样本数据的不平衡处理、数据标准化。模型构建模块,将数据进行阳性数据组和阴性数据组分类然后再分为训练集、测试集和验证集划分,再利用神经网络集成模型进行训练。恶性肿瘤识别模块:该模块将利用已经构建好的最优模型,并输入常规检验数据进行恶性肿瘤识别。本发明创造具有如下有益效果,本发明中的恶性肿瘤识别系统基于医院检验科常规检验数据,对于医院检验科具有特殊恶性肿瘤的防漏功能,对于患者具有恶性肿瘤疾病的提示功能。
Description
技术领域
本发明创造涉及医学检验领域和恶性肿瘤识别领域,具体涉及一种基于常规检验数据的恶性肿瘤的识别系统。
背景技术
目前医院对于恶性肿瘤的检查系统有很多:映像学的检查有X线常规透视、拍片各种造影、B型超声检查,及更有效的CT、ECT、核磁共振检查等,血液检查有血清学,肿瘤标记物,免疫组化。不同部位的恶性肿瘤诊断方法也不一样。比如胃部的肿瘤需要胃镜等。在还没有确定完成映像检查或者没有条件进行映像检查的时候,恶性肿瘤的危害一直在提升。而且在实际就医看病的时候需要等待映像检查的结果才可以和医生进行再一次诊断,这无疑是一种耗费时间的方法,并且有可能导致恶性肿瘤的进一步扩张,同时延误了患者能够及时确诊恶性肿瘤和进行治疗的时间,甚至有生命危险。本发明创造一种基于常规检验数据的恶性肿瘤的识别系统,可以实现在常规检验结果(血常规,生化,尿常规)检出后进行初步的恶性肿瘤识别,这样可以提前为医生及患者进行肿瘤的定位提示,医生和患者都可以根据该结果进行及时的复诊和对应治疗。
发明内容
针对上述问题本发明采用机器学习的技术提供解决方案,本发明旨在提供一种基于常规检验数据的恶性肿瘤识别系统。
本发明创造的总体架构为:数据获取模块、数据预处理模块、算法模型模块、恶性肿瘤识别模块,以下为分模块详细步骤介绍:
数据获取模块:获取常规检验数据,如血常规、生化、尿常规等数据。
数据预处理模块:将上述获取到的常规检验数据进行进一步清理筛选,丢弃无用数据,选取常规数据中带有恶性肿瘤标签数据,离群点处理前先要判断该点是否是可用,若是无用点则可以当做噪声处理,若是有用则保留,进行数据的缺失值填补、样本数据的不平衡处理、数据标准化。
算法模型模块:基于检验样本的数据产生一个或多个适用于恶性肿瘤识别的分类器,分类器主要作用是可以将检验样本数据分为阳性数组和阴性数组并建立队形的训练集和验证和测试集利用神经网络集成模型进行模型的构建。
恶性肿瘤识别模块:该模块将利用已经构建好的最优模型,并输入常规检验数据进行恶性肿瘤识别。
本发明创造具有如下有益效果:本发明中的恶性肿瘤识别系统基于医院检验科常规检验数据,可以为医院检验科提供特殊恶性肿瘤的防漏功能,对于患者具有恶性肿瘤提示功能,对于医疗卫生保健机构具有罕见病、遗传病筛查功能。
附图说明
利用附图对发明创造作进一步说明,但附图中的实施例不构成对本发明创造的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明结构示意图。
具体实施方式
本发明实施例的整体架构流程如图1所示,下面将以图1为主线进行对本发明实施例技术实现系统的详细阐述。
参见图1,本实施例的一种基于常规检验数据的恶性肿瘤识别系统,包括数据获取模块、数据预处理模块、模型构建模块、恶性肿瘤识别模块、恶性肿瘤模型的评价。
本实施例数据获取模块主要为医院检验科的检验结果数据,且数据是经过审核过后的数据,该类数据不仅对于本实施例而且对于其他相关研究也具有很大的价值,在常规检验数据的获取上要按照恶性肿瘤进行获取,包括但不限于胰腺癌,宫颈癌,卵巢癌,贲门癌,结肠癌,胃癌,食道癌,乳腺癌,子宫内膜癌,肺癌,直肠癌,肝癌等慢性恶性肿瘤。
本实施例数据预处理模块包含如下步骤:丢弃无用数据,选取常规数据中带有恶性肿瘤标签数据,离群点处理前先要判断该点是否是可用,若是无用点则可以当做噪声处理,若是有用则保留。
样本的缺失值处理,对于医学检验结果的缺失值填补一直没有很好的解决方案,所以在缺失值处理方面采用填补缺失前先判断缺失的系统,判断缺失的占样本总体的比例,缺失比例如小于20%则可利用缺失填补,如比例大于该水平则视情况而定,建议去除缺失样本。
本实施例数据的标准化,采用正态分布标准化的系统对数据进行统一的标准化,这样有利于进一步提升模型训练时的准确度及整体流程的计算效能。
数据不平衡情况很常见如果没有好的方案解决会严重影响学习的效果,本例中在数据不平衡处理上,从数据层面来讲:实现过采样(增加分类中少数类样的数量)和欠采样(通过减少分类中多数类样本的数量)解决样本不均衡。从算法层面讲:通过正负样本的惩罚权重,还有难例挖掘解决样本不平衡。
本实施例模型构建模块,采用以神经网络集成模型为基础进行模型的构建,模型构建前先将数据进行阳性数据组和阴性数据组分类然后再分为训练集、测试集和验证集划分,之后利用数据进行模型的训练,模型产出后进行模型的评估调优,调优主要参数为隐藏层数和隐藏层的神经元个数,还通过early stopping 防止过拟合。然后通过roc图 loss图等,做出最优模型的选取。
本实施例恶性肿瘤识别模块,本实施例优选地进行了以下恶性肿瘤的识别且准确率均达到80%以上,恶性肿瘤如下:胰腺癌,宫颈癌,卵巢癌,贲门癌,结肠癌,胃癌,食道癌,乳腺癌,子宫内膜癌,肺癌,直肠癌,肝癌等,识别模块需要准备好需要进行识别的样本的常规检验数据如血常规、生化、尿常规等,数据格式及标准需要同模型训练使用的规格相同,之后加载已有最优模型进行识别结果的输出,结果形式为是否患有该恶性肿瘤及对应的概率输出。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (4)
1.基于血常规,生化,尿常规检验数据的恶性肿瘤识别系统其特征是,
数据预处理模块:利用获取的检验数据对数据进行进一步的标准化和缺失值填补,算法模型模块:把数据分为阴性数据组和阳性数据组,之后使用机器学习方法训练模型,并且通过测试集得出模型评估指标,对模型进行评价,以完成训练,恶性肿瘤识别模块:使用构建好的模型对常规检验数据进行是否为恶性肿瘤的识别。
2.根据权利要求1所述的检验样本数据进行数据的预处理,把数据进行标准化,数据的区间缩放,数据的缺失值填补其中包括中位数法、平均值、众数等常规方法,也包括对抗机器学习的样本缺失值填补方法。
3.根据权利要求1所述的基于血常规,生化,尿常规检验数据的恶性肿瘤识别方系统,其特征在于,常规检验数据进行恶性肿瘤识别过程中,将检验样本数据进行了分类处理,其中根据诊断结果为恶性肿瘤的样本划分为阳性数据组,非恶性肿瘤的样本划分为阴性数据组。
4.根据权利要求3所述的基于血常规,生化,尿常规检验数据的恶性肿瘤识别系统中,其特征在于,通过阳性数据和阴性数据根据一定比例随机分为训练集、验证集和测试集,所述的恶性肿瘤识别模块进行了以下恶性肿瘤的识别且根据ROC曲线下面积AUC对算法模型进行评价的过程中,当AUC>0 .8则判断分类器训练成功。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111258767.0A CN113990487A (zh) | 2021-10-27 | 2021-10-27 | 基于血常规、生化、尿常规检验数据的恶性肿瘤识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111258767.0A CN113990487A (zh) | 2021-10-27 | 2021-10-27 | 基于血常规、生化、尿常规检验数据的恶性肿瘤识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113990487A true CN113990487A (zh) | 2022-01-28 |
Family
ID=79742913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111258767.0A Pending CN113990487A (zh) | 2021-10-27 | 2021-10-27 | 基于血常规、生化、尿常规检验数据的恶性肿瘤识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113990487A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115223709A (zh) * | 2022-07-26 | 2022-10-21 | 内蒙古卫数数据科技有限公司 | 基于布病诊断神经网络模型的缺失值填补迁移学习方法 |
-
2021
- 2021-10-27 CN CN202111258767.0A patent/CN113990487A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115223709A (zh) * | 2022-07-26 | 2022-10-21 | 内蒙古卫数数据科技有限公司 | 基于布病诊断神经网络模型的缺失值填补迁移学习方法 |
CN115223709B (zh) * | 2022-07-26 | 2024-01-23 | 内蒙古卫数数据科技有限公司 | 基于布病诊断神经网络模型的缺失值填补迁移学习方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lakhman et al. | Differentiation of uterine leiomyosarcoma from atypical leiomyoma: diagnostic accuracy of qualitative MR imaging features and feasibility of texture analysis | |
US20210225511A1 (en) | Method and system for improving cancer detection using deep learning | |
Zhang et al. | Combination of multiple serum markers using an artificial neural network to improve specificity in discriminating malignant from benign pelvic masses | |
JP7218215B2 (ja) | 画像診断装置、画像処理方法及びプログラム | |
Vomweg et al. | Improved artificial neural networks in prediction of malignancy of lesions in contrast‐enhanced MR‐mammography | |
CN110991536B (zh) | 原发性肝癌的早期预警模型的训练方法 | |
CN109124660A (zh) | 基于深度学习的胃肠间质瘤术后风险检测方法和系统 | |
US11819351B2 (en) | Medical imaging apparatus, medical image processing apparatus, and image processing program | |
CN110021022A (zh) | 一种基于深度学习的甲状腺核医学图像诊断方法 | |
Pareek et al. | Predicting the spread of vessels in initial stage cervical cancer through radiomics strategy based on deep learning approach | |
CN113990487A (zh) | 基于血常规、生化、尿常规检验数据的恶性肿瘤识别系统 | |
Gunasekaran | Leveraging object detection for the identification of lung cancer | |
Zahedi et al. | Classification of Breast Cancer Tumors Using Mammography Images Processing Based on Machine Learning. | |
Bordin et al. | Explainable AI points to white matter hyperintensities for Alzheimer's disease identification: A preliminary study | |
CN113611404A (zh) | 一种基于集成学习的血浆样本癌症早筛方法 | |
CN113393938B (zh) | 一种融合影像和临床特征信息的乳腺癌风险预测系统 | |
Lashkari et al. | Developing a toolbox for clinical preliminary breast cancer detection in different views of thermogram images using a set of optimal supervised classifiers | |
Brennan et al. | The role of breast MRI in clinical practice | |
Suárez-Cuenca et al. | Automated detection of pulmonary nodules in CT: false positive reduction by combining multiple classifiers | |
Cherezov et al. | Rank acquisition impact on radiomics estimation (AсquIRE) in chest CT imaging: A retrospective multi-site, multi-use-case study | |
WO2022053817A1 (en) | Method for biomarker estimation | |
Nalla et al. | Influence of Convolutional Neural Network Depth on the Efficacy of Automated Breast Cancer Screening Systems | |
Saji et al. | Deep Learning Methods for Lung Cancer Detection, Classification and Prediction-A Review | |
Overman | New research finds iCAD’s ProFound AI risk for digital breast tomosynthesis is 2.4 x more accurate than traditional lifetime risk models | |
Sangeetha et al. | A Novel Method to Detect Lung Cancer using Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |