CN114564992A - 一种基于病理数据的病理特征概率分布预测方法及系统 - Google Patents

一种基于病理数据的病理特征概率分布预测方法及系统 Download PDF

Info

Publication number
CN114564992A
CN114564992A CN202210190372.XA CN202210190372A CN114564992A CN 114564992 A CN114564992 A CN 114564992A CN 202210190372 A CN202210190372 A CN 202210190372A CN 114564992 A CN114564992 A CN 114564992A
Authority
CN
China
Prior art keywords
data
pathological
feature
probability
probability distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210190372.XA
Other languages
English (en)
Inventor
徐赤坤
谭铤
刘康
李伟
何俊德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Turing Medical Technology Co ltd
Original Assignee
Shanghai Turing Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Turing Medical Technology Co ltd filed Critical Shanghai Turing Medical Technology Co ltd
Priority to CN202210190372.XA priority Critical patent/CN114564992A/zh
Publication of CN114564992A publication Critical patent/CN114564992A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • A61B5/346Analysis of electrocardiograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Cardiology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于病理数据的病理特征概率分布预测方法,包括:步骤S1,采集一患者的病理数据,对病理数据进行降维处理得到对应的特征数据,并预先配置多个特征标签;步骤S2,针对每个特征标签,根据特征数据及至少一种统计学习模型分别预测得到特征标签对应的先验概率,随后根据先验概率处理得到第一后验概率,并根据各特征数据及至少一种机器学习模型分别预测得到各特征标签对应的第二后验概率;步骤S3,根据第一后验概率及第二后验概率处理得到概率均值,由所有特征标签及对应的概率均值形成患者的病理特征概率分布。有益效果是根据病理数据预测患者的病理特征概率分布,以辅助医生对患者的病理数据进行分类,提高诊断效率。

Description

一种基于病理数据的病理特征概率分布预测方法及系统
技术领域
本发明涉及信号分析的技术领域,尤其涉及一种基于病理数据的病理特征概率分布预测方法及系统。
背景技术
在对患者进行临床诊断时,需要采集患者的病理数据在各类医学诊断手段中,包括通过采集患者的病理信号,根据病理信号分析患者可能患有的疾病。在各类病理信号中,心电图数据多应用在心脏病症的判断。
其中,在医生对患者的诊断过程中,医生需要持续采集包含患者的心脏特征的体表心电图,通过观察体表心电图分析体表心电图中包含的心电图数据的特征,以进行诊断。而根据体表心电图分析患者的疾病时,受医生的从业经验及主观认知局限,存在诊断结果的准确性不高的缺陷,难以把握心电数据中的细微变化,甚至可能在检测过程中遗漏患者的一些心脏异常情况例如心肌缺血疾病等。因此,对于病理数据进行与处理和预测并进行有序分类,对于辅助医生进行早期分析,提高工作效率具有很大的帮助。
发明内容
针对现有技术中存在的问题,本发明提供一种基于病理数据的病理特征概率分布预测方法,包括:
步骤S1,采集一患者的病理数据,对所述病理数据进行降维处理得到对应的特征数据,并预先配置多个特征标签;
步骤S2,针对每个所述特征标签,根据所述特征数据及预先训练得到的至少一种统计学习模型分别预测得到所述特征标签对应的先验概率,随后根据所述先验概率处理得到第一后验概率,并根据各所述特征数据及预先训练得到的至少一种机器学习模型分别预测得到各所述特征标签对应的第二后验概率;
步骤S3,根据所述第一后验概率及所述第二后验概率处理得到各所述特征标签对应的概率均值,由所有所述特征标签及对应的所述概率均值形成所述患者的病理特征概率分布,以辅助医生对所述患者的所述病理数据进行分类。
优选的,所述步骤S1中,采用傅里叶基变换或哈尔基变换或小波基变换对所述病理数据进行降维处理得到所述特征数据。
优选的,所述步骤S1中,对所述病理数据进行降维处理之前,还包括预处理过程,所述预处理过程包括:
步骤A1,对所述病理数据进行格式转换得到预处理数据,并根据所述预处理数据的格式判断所有所述病理数据是否均完成格式转换;
若是,则将所述预处理数据作为所述病理数据进行降维处理得到所述特征数据;
若否,则输出表征所述病理数据存在格式错误的信号。
优选的,执行所述步骤S2之前还包括统计学习模型训练过程,包括:
步骤B1,获取多个第一样本病理数据,并获取各所述特征标签对应的特异性人群对应的特征概率分布;
步骤B2,根据所述第一样本病理数据处理得到对应的第一样本特征数据;
步骤B3,根据所述特征概率分布构建所述统计学习模型,并以所述第一样本特征数据作为输入,以所述第一样本特征数据对应的第一真实先验概率作为输出,训练得到所述统计学习模型。
优选的,执行所述步骤S2之前还包括机器学习模型训练过程,包括:
步骤C1,获取多个第二样本病理数据,并获取所述第二样本病理数据对应的特异性人群对应的第二真实先验概率及对应的真实后验概率;
步骤C2,根据所述第二样本病理数据处理得到对应的第二样本特征数据;
步骤C3,以各所述第二样本特征数据作为输入,以所述第二样本特征数据对应的所述真实后验概率作为输出,训练得到所述机器学习模型。
优选的,执行所述步骤S2之前,还包括模型验证过程,包括:
步骤D1,构建验证集,所述验证集中包含多个验证病理数据及所述验证病理数据对应的真实概率分布;
步骤D2,将所述验证病理数据输入至所述统计学习模型预测得到对应的测试先验概率,并根据所述测试先验概率处理得到第三后验概率,随后将所述验证病理数据输入至所述机器学习模型处理得到对应的第四后验概率;
步骤D3,根据所述第三后验概率及所述第四后验概率处理得到对应的测试概率均值;
步骤D4,由所有所述特征标签及对应的所述测试概率均值形成测试概率分布,根据所述测试概率分布及所述真实概率分布处理得到对应的误差值,并根据所述误差值及预先配置的误差范围判断所述统计学习模型预测及所述机器学习模型的准确性。
优选的,还提供一种基于病理数据的病理特征概率分布预测系统,应用如上述任意一项所述的病理特征概率分布预测方法,所述病理特征概率分布预测系统包括:
预处理模块,用于采集一患者的病理数据,对所述病理数据进行降维处理得到对应的特征数据,并预先配置多个特征标签;
预测模块,连接所述预处理模块,用于针对每个所述特征标签,根据所述特征数据及预先训练得到的至少一种统计学习模型分别预测得到所述特征标签对应的先验概率,随后根据所述先验概率处理得到第一后验概率,并根据各所述特征数据及预先训练得到的至少一种机器学习模型分别预测得到各所述特征标签对应的第二后验概率;
分析模块,连接所述预测模块,用于根据所述第一后验概率及所述第二后验概率处理得到各所述特征标签对应的概率均值,由所有所述特征标签及对应的所述概率均值形成所述患者的病理特征概率分布,以辅助医生对所述患者的所述病理数据进行分类。
优选的,所述预处理模块包括:
数据采集单元,用于采集所述患者的所述病理数据;
降维处理单元,连接所述数据采集单元,用于对所述病理数据进行格式转换得到预处理数据,并在根据所述预处理数据的格式判断所有所述病理数据均完成格式转换时,将所述预处理数据作为所述病理数据进行降维处理得到所述特征数据。
优选的,还包括第一模型训练模块,连接所述预测模块,所述第一模型训练模块包括:
第一采集单元,用于获取多个第一样本病理数据,并获取各所述特征标签对应的特异性人群对应的特征概率分布;
第一处理单元,连接所述第一采集单元,用于根据所述第一样本病理数据处理得到对应的第一样本特征数据;
第一训练单元,连接所述第一处理单元,用于根据所述特征概率分布构建所述统计学习模型,并以所述第一样本特征数据作为输入,以所述第一样本特征数据对应的第一真实先验概率作为输出,训练得到所述统计学习模型。
优选的,还包括第二模型训练模块,连接所述预测模块,所述第二模型训练模块包括:
第二采集单元,用于获取多个第二样本病理数据,并获取所述第二样本病理数据对应的特异性人群对应的第二真实先验概率及对应的真实后验概率;
第二处理单元,连接所述第二采集单元,用于根据所述第一样本病理数据处理得到对应的第二样本特征数据;
第二训练单元,连接所述第二采集单元,用于以各所述第二样本特征数据作为输入,以所述第二样本特征数据对应的所述真实后验概率作为输出,训练得到所述机器学习模型。
上述技术方案具有如下优点或有益效果:
(1)、根据病理数据处理得到各特征标签对应的概率均值,由各特征标签及对应的概率均值形成病理特征概率分布,病理特征概率分布为医生对患者的诊断过程起到辅助作用,提高了医生的诊断效率;
(2)、概率均值由第一后验概率及第二后验概率处理得到,与单一的第一后验概率或第二后验概率处理得到病理特征概率分布相比,结合第一后验概率及第二后验概率处理得到的预测结果准确性更高;
(3)、通过对统计学习模型及机器学习模型进行验证,通过将测试概率分布与验证集对应的真实概率分布进行比较,得到对应的误差值,并根据误差值来判断统计学习模型及机器学习模型的预测结果的准确性,便于后续对统计学习模型及机器学习模型进行优化。
附图说明
图1为本发明的较佳的实施例中,病理特征概率分布预测方法的流程图;
图2为本发明的较佳的实施例中,病理特征概率分布预测方法中预处理过程的具体流程图;
图3为本发明的较佳的实施例中,病理特征概率分布预测方法中统计学习模型训练过程的具体流程图;
图4为本发明的较佳的实施例中,病理特征概率分布预测方法中机器学习模型训练过程的具体流程图;
图5为本发明的较佳的实施例中,病理特征概率分布预测方法中模型验证过程的具体流程图;
图6为本发明的较佳的实施例中,病理特征概率分布预测系统的控制原理图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本发明并不限定于该实施方式,只要符合本发明的主旨,则其他实施方式也可以属于本发明的范畴。
本发明的较佳的实施例中,基于现有技术中存在的上述问题,现提供一种基于病理数据的病理特征概率分布预测方法,如图1所示,包括:
步骤S1,采集一患者的病理数据,对病理数据进行降维处理得到对应的特征数据,并预先配置多个特征标签;
步骤S2,针对每个特征标签,根据特征数据及预先训练得到的至少一种统计学习模型分别预测得到特征标签对应的先验概率,随后根据先验概率处理得到第一后验概率,并根据各特征数据及预先训练得到的至少一种机器学习模型分别预测得到各特征标签对应的第二后验概率;
步骤S3,根据第一后验概率及第二后验概率处理得到各特征标签对应的概率均值,由所有特征标签及对应的概率均值形成患者的病理特征概率分布,以辅助医生对患者的病理数据进行分类。
具体地,本实施例中,病理数据为患者的心电图数据,则:
步骤S1中,采集患者的心电图数据,对心电图数据进行降维处理得到对应的特征数据,并预先配置与各类心脏病症对应的特征标签。医生根据病理特征概率分布对患者进行心脏病症的诊断。
病理特征概率分布包括所有特征标签及对应的概概率均值,使得为医生提供更加全面的诊断依据,减少因医生未发现心电图数据中微小的异常而未诊断到患者的其他疾病的情况。
本发明的较佳的实施例中,步骤S1中,采用傅里叶基变换或哈尔基变换或小波基变换对病理数据进行降维处理得到特征数据。
具体地,本实施例中,在根据心电图数据对患者可能患有的心脏病症进行预测之前,需要从医院的内部系统获取患者的心电图数据,而在医院的内部系统中,心电图数据往往以xml的格式进行储存。因而,在获取心电图数据后,需要对心电图数据进行格式转换,便于后续分析。
本发明的较佳的实施例中,步骤S1中,对病理数据进行降维处理之前,还包括一预处理过程,如图2所示,预处理过程包括:
步骤A1,采集患者的病理数据;
步骤A2,对病理数据进行格式转换得到预处理数据,并根据预处理数据的格式判断所有病理数据是否均完成格式转换;
若是,则将预处理数据作为病理数据进行降维处理得到特征数据;
若否,则输出表征病理数据存在格式错误的信号。
具体地,本实施例中,在对心电图数据进行降维处理之前:
首先,提取xml格式的心电图数据中所包含的两个数据特征点之间的数据,并整理成12维数据后,以csv或txt格式作为心电图数据储存。
随后,判断各心电图数据的格式是否均转换成功,当存在心电图数据的格式转换不成功时,输出报错信号,以提示操作人员存在心电图数据格式错误的情况,无法继续进行预测。
在各心电图数据均转换成功后,对心电图数据进行数据规范化处理,需要对心电图数据进行奇异值分解,以减少心电图数据中的奇异点对预测结果的影响,实现降噪目的。
本发明的较佳的实施例中,执行步骤S2之前还包括统计学习模型训练过程,如图3所示,包括:
步骤B1,获取多个第一样本病理数据,并获取各特征标签对应的特异性人群对应的特征概率分布;
步骤B2,根据第一样本病理数据处理得到对应的第一样本特征数据;
步骤B3,根据特征概率分布构建统计学习模型,并以第一样本特征数据作为输入,以第一样本特征数据对应的第一真实先验概率作为输出,训练得到统计学习模型。
具体地,本实施例中,各第一样本病理数据对应的人群分属于各特异性人群,则根据人群所属的特异性人群的类型分别读入第一样本病理数据。各特异性人群对应的第一样本病理数据分别保存至对应的数据文件内。针对每个数据文件,以数据维度为12的12维导联时间序列或数据维度为1的单导联时间序列读取数据文件中的第一样本病理数据,读取得到的心电图数据为一维时间数据序列。随后,对读取得到的心电图数据进行规范化处理。
规范化处理包括:在心电图数据中存在奇异点时,对一维时间数据序列中序号在数据长度0.1至数据长度0.9之间对应的心电图数据求二阶差分,得到最小值,并将最小值与预设的阈值相乘得到乘积值,并取出所有二阶差分小于乘积值的心电图数据中的片段。随后,根据各片段纵坐标对应的中位数,筛选得到该中位数对应的片段横坐标。接着,对筛选得到的片段进行切割,得到数据长度为0.1的规范化时间数据序列,最后对规范化时间数据序列进行降维处理,并将降维处理后的规范化时间数据序列作为第一样本特征数据输出。
本发明的较佳的实施例中,执行步骤S2之前还包括机器学习模型训练过程,如图4所示,包括:
步骤C1,获取多个第二样本病理数据,并获取第二样本病理数据对应的特异性人群对应的第二真实先验概率及对应的真实后验概率;
步骤C2,根据第二样本病理数据处理得到对应的第二样本特征数据;
步骤C3,以各第二样本特征数据作为输入,以第二样本特征数据对应的真实后验概率作为输出,训练得到机器学习模型。
具体地,本实施例中,机器学习模型包括但不限于基于决策树的XGBoost,LightGBM,随机森林等及基于神经网络的LSTM,CNN等算法。
在进行病理特征概率分布预测时,针对每个特征标签,对各降维处理后的第一样本特征数据采用核密度估计方法来获取先验概率,计算公式如下:
Figure BDA0003524323300000111
其中,h为预先配置的核函数的标准差,K用于代指高斯函数,xi=1,2,...,n为各第一样本特征数据对应的一维分量,各特征标签及对应的先验概率形成先验概率分布。
随后,分别计算第一后验概率及第二后验概率。
其中,针对统计学习模型,第一后验概率的计算公式如下:
Figure BDA0003524323300000112
其中,p(y|xobs)为后验概率分布,xobs为第一特征样本数据,p(xobs|y)为先验概率分布,p(z)为特征概率分布。
针对机器学习模型,第二后验概率的计算公式如下:
Figure BDA0003524323300000121
其中,p(y|xobs)为第二后验概率,xobs为第一特征样本数据,fy(xobs)为机器学习模型中预先训练得到的特征标签y对应的预测函数,fz(xobs)为机器学习模型中预先训练得到的特异性人群z对应的预测函数。
本发明的较佳的实施例中,执行步骤S2之前,还包括模型验证过程,如图5所示,包括:
步骤D1,构建验证集,验证集中包含多个验证病理数据及验证病理数据对应的真实概率分布;
步骤D2,将验证病理数据输入至统计学习模型预测得到对应的测试先验概率,并根据测试先验概率处理得到第三后验概率,随后将验证病理数据输入至机器学习模型处理得到对应的第四后验概率;
步骤D3,根据第三后验概率及第四后验概率处理得到对应的测试概率均值;
步骤D4,由所有特征标签及对应的测试概率均值形成测试概率分布,根据测试概率分布及真实概率分布处理得到对应的误差值,并根据误差值及预先配置的误差范围判断统计学习模型预测及机器学习模型的准确性。
具体地,本实施例中,对统计学习模型及机器学习模型进行准确性判断的过程包括:
根据真实概率分布及测试概率分布处理得到表征测试概率值的准确度的评估分数,评估分数的计算公式如下:
Figure BDA0003524323300000131
其中,BS为评估分数,I为测试集中包含的验证病理数据的数量,表示第i个验证病理数据于特征标签y的测试概率均值,误差值为p(y|i)-yi,误差范围为[0,1];
特征标签y与第i个验证病理数据对应的特异性人群相符时,yi=1;
特征标签y与第i个验证病理数据对应的特异性人群不相符时,yi=0。
BS的值越接近0,说明准确性越高;BS的值越接近1,则说明准确性越低。
另一实施例中,分别计算精确率、召回率及准确率,并处理得到综合指数,并根据综合指数的值判断统计学习模型及机器学习模型的准确性。
其中,精确率Precision的计算公式如下:
Figure BDA0003524323300000132
其中,TPi表示第i个验证病理数据属于特征标签y,实际也属于对应的心脏病症,FPi表示第i个验证病理数据不属于特征标签y,实际属于对应的心脏病症。
召回率Recall的计算公式如下:
Figure BDA0003524323300000141
其中,FNi表示第i个验证病理数据不属于特征标签y,实际也不属于对应的心脏病症;
准确率Accuracy的计算公式如下:
Figure BDA0003524323300000142
其中,TNi表示第i个测试数据属于特征标签y,实际不属于对应的心脏病症。
综合指数F1的计算公式如下:
Figure BDA0003524323300000143
本发明的较佳的实施例中,还提供一种基于病理数据的病理特征概率分布预测系统,应用如上述任意一项的病理特征概率分布预测方法,如图6所示,病理特征概率分布预测系统包括:
预处理模块1,用于采集一患者的病理数据,对病理数据进行降维处理得到对应的特征数据,并预先配置多个特征标签;
预测模块2,连接预处理模块1,用于针对每个特征标签,根据特征数据及预先训练得到的至少一种统计学习模型分别预测得到特征标签对应的先验概率,随后根据先验概率处理得到第一后验概率,并根据各特征数据及预先训练得到的至少一种机器学习模型分别预测得到各特征标签对应的第二后验概率;
分析模块3,连接预测模块2,用于根据相应的第一后验概率及第二后验概率处理得到各特征标签对应的概率均值,由所有特征标签及对应的概率均值形成患者的病理特征概率分布,以辅助医生对患者的病理数据进行分类。
本发明的较佳的实施例中,预处理模块1包括:
数据采集单元11,用于采集患者的病理数据;
降维处理单元12,连接数据采集单元,用于对病理数据进行格式转换得到预处理数据,并在根据预处理数据的格式判断所有病理数据均完成格式转换时,将预处理数据作为病理数据进行降维处理得到特征数据。
本发明的较佳的实施例中,还包括第一模型训练模块4,连接预测模块2,第一模型训练模块4包括:
第一采集单元41,用于获取多个第一样本病理数据,并获取各特征标签对应的特异性人群对应的特征概率分布;
第一处理单元42,连接第一采集单元41,用于根据第一样本病理数据处理得到对应的第一样本特征数据;
第一训练单元43,连接第一处理单元42,用于根据特征概率分布构建统计学习模型,并以第一样本特征数据作为输入,以第一样本特征数据对应的第一真实先验概率作为输出,训练得到统计学习模型。
本发明的较佳的实施例中,还包括第二模型训练模块5,连接预测模块2,第二模型训练模块5包括:
第二采集单元51,用于获取多个第二样本病理数据,并获取第二样本病理数据对应的特异性人群对应的第二真实先验概率及对应的真实后验概率;
第二处理单元52,连接第二采集单元51,用于根据第一样本病理数据处理得到对应的第二样本特征数据;
第二训练单元53,连接第二处理单元52,用于以各第二样本特征数据作为输入,以第二样本特征数据对应的真实后验概率作为输出,训练得到机器学习模型。
具体地,本实施例中,可对第一采集单元41及第二采集单元51进行集成,用以采集第三样本病理数据,其中,第三样本病理数据作为第一样本病理数据及第二样本病理数据保存。
还可对第一处理单元42及第二处理单元52进行集成,用以由第三样本病理数据处理得到第三样本特征数据,并作为第一样本特征数据及第二样本特征数据输出。
综上,通过对待预测的心电图数据进行片段提取、数据规范化及数据降维处理,将心电图数据转化为各规范化时间数据序列,以供后续进行病理特征概率分布预测。此外,针对每一特征标签,分别预测第一后验概率及第二后验概率并进行平均值计算得到概率均值,并将概率均值作为对应的特征标签的概率值,起到减小预测误差的作用,提高了病理特征概率分布的准确度。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (10)

1.一种基于病理数据的病理特征概率分布预测方法,其特征在于,包括:
步骤S1,采集一患者的病理数据,对所述病理数据进行降维处理得到对应的特征数据,并预先配置多个特征标签;
步骤S2,针对每个所述特征标签,根据所述特征数据及预先训练得到的至少一种统计学习模型分别预测得到所述特征标签对应的先验概率,随后根据所述先验概率处理得到第一后验概率,并根据各所述特征数据及预先训练得到的至少一种机器学习模型分别预测得到各所述特征标签对应的第二后验概率;
步骤S3,根据所述第一后验概率及所述第二后验概率处理得到各所述特征标签对应的概率均值,由所有所述特征标签及对应的所述概率均值形成所述患者的病理特征概率分布,以辅助医生对所述患者的所述病理数据进行分类。
2.根据权利要求1所述的病理特征概率分布预测方法,其特征在于,所述步骤S1中,采用傅里叶基变换或哈尔基变换或小波基变换对所述病理数据进行降维处理得到所述特征数据。
3.根据权利要求1所述的病理特征概率分布预测方法,其特征在于,所述步骤S1中,对所述病理数据进行降维处理之前,还包括预处理过程,所述预处理过程包括:
步骤A1,采集所述患者的所述病理数据;
步骤A2,对所述病理数据进行格式转换得到预处理数据,并根据所述预处理数据的格式判断所有所述病理数据是否均完成格式转换;
若是,则将所述预处理数据作为所述病理数据进行降维处理得到所述特征数据;
若否,则输出表征所述病理数据存在格式错误的信号。
4.根据权利要求1所述的病理特征概率分布预测方法,其特征在于,执行所述步骤S2之前还包括统计学习模型训练过程,包括:
步骤B1,获取多个第一样本病理数据,并获取各所述特征标签对应的特异性人群对应的特征概率分布;
步骤B2,根据所述第一样本病理数据处理得到对应的第一样本特征数据;
步骤B3,根据所述特征概率分布构建所述统计学习模型,并以所述第一样本特征数据作为输入,以所述第一样本特征数据对应的第一真实先验概率作为输出,训练得到所述统计学习模型。
5.根据权利要求1所述的病理特征概率分布预测方法,其特征在于,执行所述步骤S2之前还包括机器学习模型训练过程,包括:
步骤C1,获取多个第二样本病理数据,并获取所述第二样本病理数据对应的特异性人群对应的第二真实先验概率及对应的真实后验概率;
步骤C2,根据所述第二样本病理数据处理得到对应的第二样本特征数据;
步骤C3,以各所述第二样本特征数据作为输入,以所述第二样本特征数据对应的所述真实后验概率作为输出,训练得到所述机器学习模型。
6.根据权利要求1所述的病理特征概率分布预测方法,其特征在于,执行所述步骤S2之前,还包括模型验证过程,包括:
步骤D1,构建验证集,所述验证集中包含多个验证病理数据及所述验证病理数据对应的真实概率分布;
步骤D2,将所述验证病理数据输入至所述统计学习模型预测得到对应的测试先验概率,并根据所述测试先验概率处理得到第三后验概率,随后将所述验证病理数据输入至所述机器学习模型处理得到对应的第四后验概率;
步骤D3,根据所述第三后验概率及所述第四后验概率处理得到对应的测试概率均值;
步骤D4,由所有所述特征标签及对应的所述测试概率均值形成测试概率分布,根据所述测试概率分布及所述真实概率分布处理得到对应的误差值,并根据所述误差值及预先配置的误差范围判断所述统计学习模型预测及所述机器学习模型的准确性。
7.一种基于病理数据的病理特征概率分布预测系统,其特征在于,应用如权利要求1-6中任意一项所述的病理特征概率分布预测方法,所述病理特征概率分布预测系统包括:
预处理模块,用于采集一患者的病理数据,对所述病理数据进行降维处理得到对应的特征数据,并预先配置多个特征标签;
预测模块,连接所述预处理模块,用于针对每个所述特征标签,根据所述特征数据及预先训练得到的至少一种统计学习模型分别预测得到所述特征标签对应的先验概率,随后根据所述先验概率处理得到第一后验概率,并根据各所述特征数据及预先训练得到的至少一种机器学习模型分别预测得到各所述特征标签对应的第二后验概率;
分析模块,连接所述预测模块,用于根据所述第一后验概率及所述第二后验概率处理得到各所述特征标签对应的概率均值,由所有所述特征标签及对应的所述概率均值形成所述患者的病理特征概率分布,以辅助医生对所述患者的所述病理数据进行分类。
8.根据权利要求7所述的病理特征概率分布预测系统,其特征在于,所述预处理模块包括:
数据采集单元,用于采集所述患者的所述病理数据;
降维处理单元,连接所述数据采集单元,用于对所述病理数据进行格式转换得到预处理数据,并在根据所述预处理数据的格式判断所有所述病理数据均完成格式转换时,将所述预处理数据作为所述病理数据进行降维处理得到所述特征数据。
9.根据权利要求7所述的病理特征概率分布预测系统,其特征在于,还包括第一模型训练模块,连接所述预测模块,所述第一模型训练模块包括:
第一采集单元,用于获取多个第一样本病理数据,并获取各所述特征标签对应的特异性人群对应的特征概率分布;
第一处理单元,连接所述第一采集单元,用于根据所述第一样本病理数据处理得到对应的第一样本特征数据;
第一训练单元,连接所述第一处理单元,用于根据所述特征概率分布构建所述统计学习模型,并以所述第一样本特征数据作为输入,以所述第一样本特征数据对应的第一真实先验概率作为输出,训练得到所述统计学习模型。
10.根据权利要求7所述的病理特征概率分布预测系统,其特征在于,还包括第二模型训练模块,连接所述预测模块,所述第二模型训练模块包括:
第二采集单元,用于获取多个第二样本病理数据,并获取所述第二样本病理数据对应的特异性人群对应的第二真实先验概率及对应的真实后验概率;
第二处理单元,连接所述第二采集单元,用于根据所述第一样本病理数据处理得到对应的第二样本特征数据;
第二训练单元,连接所述第二采集单元,用于以各所述第二样本特征数据作为输入,以所述第二样本特征数据对应的所述真实后验概率作为输出,训练得到所述机器学习模型。
CN202210190372.XA 2022-02-28 2022-02-28 一种基于病理数据的病理特征概率分布预测方法及系统 Pending CN114564992A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210190372.XA CN114564992A (zh) 2022-02-28 2022-02-28 一种基于病理数据的病理特征概率分布预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210190372.XA CN114564992A (zh) 2022-02-28 2022-02-28 一种基于病理数据的病理特征概率分布预测方法及系统

Publications (1)

Publication Number Publication Date
CN114564992A true CN114564992A (zh) 2022-05-31

Family

ID=81715535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210190372.XA Pending CN114564992A (zh) 2022-02-28 2022-02-28 一种基于病理数据的病理特征概率分布预测方法及系统

Country Status (1)

Country Link
CN (1) CN114564992A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115409104A (zh) * 2022-08-25 2022-11-29 贝壳找房(北京)科技有限公司 用于识别对象类型的方法、装置、设备、介质和程序产品

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115409104A (zh) * 2022-08-25 2022-11-29 贝壳找房(北京)科技有限公司 用于识别对象类型的方法、装置、设备、介质和程序产品

Similar Documents

Publication Publication Date Title
Rubin et al. Recognizing abnormal heart sounds using deep learning
CN108511055B (zh) 基于分类器融合及诊断规则的室性早搏识别系统及方法
El Bouny et al. ECG heartbeat classification based on multi-scale wavelet convolutional neural networks
CN113095302B (zh) 用于心律失常分类的深度模型、利用该模型的方法及装置
CN113995419B (zh) 一种基于心跳节律信号的房颤发生风险预测系统及其应用
Islam et al. New hybrid deep learning approach using BiGRU-BiLSTM and multilayered dilated CNN to detect arrhythmia
Fang et al. Dual-channel neural network for atrial fibrillation detection from a single lead ECG wave
Al-Salman et al. Extracting epileptic features in EEGs using a dual-tree complex wavelet transform coupled with a classification algorithm
CN110693488A (zh) 心电信号处理系统、方法、电子设备及可读存储介质
Patra et al. Predictive analysis of rapid spread of heart disease with data mining
CN112641451A (zh) 基于单通道脑电信号多尺度残差网络睡眠分期方法及系统
CN116361688A (zh) 用于心电节律自动分类的多模态特征融合模型构建方法
CN114564992A (zh) 一种基于病理数据的病理特征概率分布预测方法及系统
CN117017310A (zh) 基于知识蒸馏的声电双模先天性心脏病预测装置
CN112057068A (zh) 一种癫痫病理数据分类方法、装置及存储介质
CN116484290A (zh) 一种基于Stacking集成的抑郁症识别模型构建方法
Aarthy et al. Modified parametric-based AlexNet structure to classify ECG signals for cardiovascular diseases
CN114429816A (zh) 一种心电图分析方法、装置、设备及介质
CN113425298A (zh) 一种通过穿戴设备采集数据分析抑郁程度的方法
Singh et al. Autonomous Myocardial Infarction Detection from Electrocardiogram with a Multi Label Classification Approach
ASLAN A New Computational Approach Framework For The Diagnosis Of Alzheimer's Disease
CN117831771B (zh) 一种基于深度学习的疾病风险预测模型构建方法及系统
Cherifi et al. Automated Diagnosis of Neuromuscular Disorders using EMG Signals
CN114711790B (zh) 新生儿电惊厥类型确定方法、装置、设备和存储介质
Sadeghi et al. Diagnosing left bundle branch block in 12-lead electrocardiogram using self-attention convolutional neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination