CN111563411B - 利用AdaBoost和弱分类器的心电信号分类方法 - Google Patents
利用AdaBoost和弱分类器的心电信号分类方法 Download PDFInfo
- Publication number
- CN111563411B CN111563411B CN202010237763.3A CN202010237763A CN111563411B CN 111563411 B CN111563411 B CN 111563411B CN 202010237763 A CN202010237763 A CN 202010237763A CN 111563411 B CN111563411 B CN 111563411B
- Authority
- CN
- China
- Prior art keywords
- electrocardiosignal
- value
- classification
- data set
- weak classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明公开了利用AdaBoost和弱分类器的心电信号分类方法,属于数据源分类技术领域。所述方法包括:对心电数据进行特征提取,获得心电信号训练样本数据集;根据心电信号样本的初始权重,抽样选取心电信号训练数据集获得心电信号样本;用弱分类器对心电信号样本进行分类,分类错误的样本的加权方式由弱分类器的分类错误率和样本被错分的概率这两个因素所决定。本发明充分考虑分错样本的错分概率,通过设置合适的阈值,并以此对弱分类器进行筛选,来得到分类精度更高的强分类器。
Description
技术领域
本发明涉及一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,属于数据源分类技术领域。
背景技术
AdaBoost算法最早源于1990年,Schapire提出了Boosting(自举)算法,是一种提高预测能力的有效工具,然而,Boosting算法并不能解决如何将弱分类器合成强分类器的问题。1995年,Freund和Schapire提出了AdaBoost算法,其是一种迭代算法,其通过样本分布和弱分类器权值,得到相应的弱分类器,并组成强分类器,其具有很高的精度,并在分类问题和回归问题得到了广泛的应用,目前,主要广泛的应用于生物电信号处理、人脸识别、图片检索等方面。
传统的AdaBoost算法中的权重主要用于弱分类器寻找其分类误差最小的点,那么其权重对于待测实例来说是固定的,因此,分类正确率不是很高。心脏疾病具有实时性和突发性,且死亡率较高,因此,将对心电信号情况判断的准确性要求很高。现有的利用AdaBoost算法进行心电信号分类是通过弱分类器的错分率来调整训练集中的权值,并且所有被分错的心电信号样本均用同一个权重因子进行加权,并未考虑错误样本的错分率对弱分类器进行筛选,这种分类方式分类的精度不高。
发明内容
本发明提供一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,所述方法包括:对心电数据进行特征提取,获得心电信号训练样本数据集;确定心电信号训练样本数据集的初始权重;用弱分类器对心电信号训练样本数据集进行分类,弱分类器分类错误的样本的加权方式由弱分类器对心电信号训练样本数据集分类错误的概率和对心电信号训练样本数据集分类后取错误类值的概率所决定。
在本发明的一种实施方式中,所述AdaBoost算法通过训练不同的弱分类器,然后综合起来,形成最终的强分类器;训练弱分类器时,给予每条心电数据用于计算误差的不同权重,对每个分类器,给予用于分类的不同权重。
在本发明的一种实施方式中,所述特征提取算法为离散小波变换,具体为二进小波变换,包括如下步骤:
S201:取能保证预处理的心电信号的数据量个数的采样点;
S202:设置正阈值为极大值点幅值的平均值的1/4,负阈值为极小值点幅值的平均值的1/4;
S203:函数选择二次B样条小波,尺度为4,利用1-4尺度上的小波系数选出QRS波能量最大的某一尺度求出模极大值序列;
S204:在选取的尺度上设置初始阈值,在极大值点组成的序列和极小值点组成的序列中搜索极值对,保留正极大值大于正阈值,负极大值小于负阈值的模极大值对,同时将不符合要求的极值对从序列中删除;
S205:由最终的极值点组成的序列确定极值对的过零点位置,每一对的过零点就是R波的估计定位,将这些过零点纳入R波候选点序列中,并求出R波候选点序列中两两间隔的平均值RRmean;
S206:求出每个R波间隔,若在0.6×RRmean的时间内出现第二个R波,那么去掉绝对值小的R波,并将该点从R波候选点序列中去除;
S207:当发现R波间隔超过1.6×RRmean时,减小正阈值为平均值的1/6,返回步骤S204设置第二个阈值检测R波;若还检测不到目标,则存在倒向R波,将波形沿x轴翻转重新检测。
在本发明的一种实施方式中,所述用弱分类器对心电信号数据集分类错误的样本加权的步骤包括:
S301:设输入的特征提取后的心电信号训练样本数据集为{(A1,B1),(A2,B2),……,(At,Bt)},At是数据集的属性向量,Bt是标志向量,Bt={-1,1};算法的循环次数为固定的数值n;所述标志向量Bt将心电信号训练样本数据集分为两类,分别为1和-1,其中,-1代表心电异常类值,1代表心电正常类值;
S302:确定心电信号训练样本数据集的初始权重为D(Ai)=1/t,i=1,2,…,t;
S303:确定弱分类器Ht,用弱分类器对心电信号训练样本数据集进行分类,分类错误的概率为εt,心电信号训练样本数据集取正常类值和异常类值时的概率为(P(1),P(2),…,P(t));
S304:当分类错误时,弱分类器Ht对心电信号训练样本数据集分类后取错误类值的概率为P(a),分类后取正确类值的概率为1-P(a),加权因子为η=2P(a)-1;
S305:预设阈值,当步骤S5得到的取错误类值的概率P(a)大于预设的阈值时,返回步骤S302;
S306:当εt>0.5时,重新初始化心电信号训练样本数据集权重,并返回步骤S303,否则
S307:更新分布Dt,Zt是一个标准化因子,则:
其中,αt表示Ht(At)为最终的强分类器的重要程度;
S308:n轮训练结束后,输出最终的强分类器:
在本发明的一种实施方式中,所述S305中,阈值为3/4。
本发明的利用优化的AdaBoost加权方式和弱分类器对心电信号分类方法用于人体心电信号的分类。
有益效果:
(1)本发明充分考虑弱分类器的分类错误率和样本被错分的概率这两个因素对AdaBoost分类错误样本的加权方式影响,并以此为基础对加权因子做出了改进,来得到分类精度更高的强分类器,能够更好地对心电信号进行分类。
(2)本发明充分考虑分错心电信号样本的错分概率,通值过设置合适的阈值,并以此对弱分类器进行筛选,来得到分类精度更高的强分类器。
(3)本发明通过考虑分错样本的错分概率这一个数值,同时改进了算法的加权因子和弱分类器的筛选方式,使得改进过程更方便简单,心电信号分类效果更明显。
附图说明
图1是本发明算法流程图。
图2是本发明AdaBoost改进部分的算法示意图。
图3是本发明AdaBoost算法原理图。
图4是实施例2的原算法和改进后的算法对比图。
具体实施方式
下面结合附图和实施例对本发明作进一步详细说明。
实施例1
如图1、图2所示,一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,所述方法包括:
S1:获取心电数据,所述数据集来自MIT-BIH数据库(美国麻省理工学院提供的研究心律失常的数据库)中的心率失常数据库;
S2:进行心电数据特征提取,所述特征提取算法为离散小波变换(DWT),具体为二进小波变换,具体步骤如下:
S201:取前500个采样点,保证预处理的心电信号的数据量;
S202:设置正阈值为极大值点幅值的平均值的1/4,负阈值为极小值点幅值的平均值的1/4;
S203:函数选择二次B样条小波,尺度为4,利用1-4尺度上的小波系数选出QRS波(QRS wave complex)能量最大的某一尺度求出模极大值序列;
S204:在选取的尺度上设置初始阈值,在极大值点组成的序列和极小值点组成的序列中搜索极值对,保留正极大值大于正阈值,负极大值小于负阈值的模极大值对,同时将不符合要求的极值对从序列中删除;
S205:由最终的极值点组成的序列确定极值对的过零点位置,每一对的过零点就是R波的估计定位,将这些过零点纳入R波候选点序列中,并求出R波候选点序列中两两间隔的平均值RRmean;
S206:求出每个R波间隔,若在0.6×RRmean的时间内出现第二个R波,那么去掉绝对值小的R波,并将该点从R波候选点序列中去除;
S207:当发现R波间隔超过1.6×RRmean时,减小正阈值为平均值的1/6,返回步骤S204,设置第二个阈值检测R波;若还检测不到目标,则存在倒向R波,将波形沿x轴翻转重新检测;
S3:如图3所示,所述心电信号特征分算法采用AdaBoost算法,所述AdaBoost算法为单决策树的弱分类器的分类算法;所述AdaBoost算法通过训练不同的弱分类器,然后综合起来,形成最终的强分类器;训练弱分类器时,给予每条数据用于计算误差的不同权重,每个分类器,给予用于分类的不同权重;所述决策树为单次分类效果很差的弱分类器,并且根据决策属性不同,即便重复使用单决策树,也可以诞生出分类效果不同的分类器;
设输入的特征提取后的心电信号训练样本数据集为{(A1,B1),(A2,B2),……,(At,Bt)},At是数据集的属性向量,Bt是标志向量,Bt={-1,1};算法的循环次数为固定的数值n;所述标志向量Bt在本实施例中将心电信号训练样本数据集分为两类,分别为1和-1,其中,-1代表心电异常类值,1代表心电正常类值;
S4:确定心电信号训练样本数据集的初始权重为D(Ai)=1/t,i=1,2,…,t;
S5:确定弱分类器Ht,用弱分类器对心电信号训练样本数据集进行分类,分类错误的概率为εt,心电信号训练样本数据集取正常类值和异常类值时的概率为(P(1),P(2),…,P(t));
S6:当分类错误时,弱分类器Ht对心电信号训练样本数据集分类后取错误类值的概率为P(a),分类后取正确类值的概率为1-P(a),加权因子为η=2P(a)-1;
S7:预设阈值,本实施例预设阈值为3/4,当步骤S5得到的取错误类值的概率P(a)大于预设的阈值时,返回步骤S4;
S8:当εt>0.5时,重新初始化心电信号训练样本数据集权重,并返回步骤S5,否则
S9:更新分布Dt,Zt是一个标准化因子,则:
其中,αt表示Ht(At)为最终的强分类器的重要程度。
S10:n轮训练结束后,输出最终的强分类器:
实施例2
本实施例对所改进算法进行验证。
二分类算法经常通过ROC(Receiver Operating Characteristic)曲线和AUC(Area Under the Curve)值来判断分类器性能的优劣;具体过程为:将两类样本分成正类和负类,将正类用模型分类正确的样本用TP表示,正类分类错误的样本用FP表示;将负类用模型分类正确的样本用TN表示,负类分类错误的样本用FN表示。如图4所示,曲线的横坐标为False positive rate(FPR),纵坐标为True positiverate(TPR),AUC值指的是ROC曲线与横轴假正率(FPR)围成的面积。
式中,FP+TN为我们预测到的所有N类,所以FPR越小越好;TP+FN为我们预测到的所以P类,所以TPR越大越好。
针对实施例1中的心电数据分类过程,对比本发明方法和原AdaBoost算法。图4中有两条曲线,位于下方的曲线为原AdaBoost算法,上方曲线为改进后的AdaBoost算法。原分类精度为96.27%,改进后的分类精度为96.68%,提高了约0.41%,可知,改进后的AdaBoost算法比原AdaBoost算法分类性能更好。
本发明的保护范围并不仅局限于上述实施例,凡是在本发明构思的精神和原则之内,本领域的专业人员能够做出的任何修改、等同替换和改进等均应包含在本发明的保护范围之内。
Claims (4)
1.一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,其特征在于,所述方法包括:对心电数据进行特征提取,获得心电信号训练样本数据集;用AdaBoost算法对心电信号训练样本数据集进行分类,所述AdaBoost算法为单决策树的弱分类器的分类算法,所述弱分类器分类错误的样本的加权方式由弱分类器对心电信号训练样本数据集分类错误的概率和对心电信号训练样本数据集分类后取错误类值的概率所决定;
所述AdaBoost算法通过训练不同的弱分类器,然后综合起来,形成最终的强分类器;训练弱分类器时,给予每条心电数据用于计算误差的不同权重,对每个分类器,给予用于分类的不同权重;
用弱分类器对心电信号数据集分类错误的样本加权的步骤包括:
S301:设输入的特征提取后的心电信号训练样本数据集为{(A1,B1),(A2,B2),……,(At,Bt)},At是数据集的属性向量,Bt是标志向量,Bt={-1,1};算法的循环次数为固定的数值n;所述标志向量Bt将心电信号训练样本数据集分为两类,分别为1和-1,其中,-1代表心电异常类值,1代表心电正常类值;
S302:确定心电信号训练样本数据集的初始权重为D(Ai)=1/t,i=1,2,…,t;
S303:确定弱分类器Ht,用弱分类器对心电信号训练样本数据集进行分类,分类错误的概率为εt,心电信号训练样本数据集取正常类值和异常类值时的概率为(P(1),P(2),…,P(t));
S304:当分类错误时,弱分类器Ht对心电信号训练样本数据集分类后取错误类值的概率为P(a),分类后取正确类值的概率为1-P(a),加权因子为η=2P(a)-1;
S305:预设阈值,当步骤S5得到的取错误类值的概率P(a)大于预设的阈值时,返回步骤S302;
S306:当εt>0.5时,重新初始化心电信号训练样本数据集权重,并返回步骤S303,否则
S307:更新分布Dt,Zt是一个标准化因子,则:
其中,αt表示Ht(At)为最终的强分类器的重要程度;
S308:n轮训练结束后,输出最终的强分类器:
2.如权利要求1所述的一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,其特征在于,所述特征提取算法为离散小波变换,具体为二进小波变换,包括如下步骤:
S201:在需预处理的心电数据中取采样点;
S202:设置正阈值为极大值点幅值的平均值的1/4,负阈值为极小值点幅值的平均值的1/4;
S203:函数选择二次B样条小波,尺度为4,利用1-4尺度上的小波系数选出QRS波能量最大的某一尺度求出模极大值序列;
S204:在选取的尺度上设置初始阈值,在极大值点组成的序列和极小值点组成的序列中搜索极值对,保留正极大值大于正阈值,负极大值小于负阈值的模极大值对,同时将不符合要求的极值对从序列中删除;
S205:由最终的极值点组成的序列确定极值对的过零点位置,每一对的过零点就是R波的估计定位,将这些过零点纳入R波候选点序列中,并求出R波候选点序列中两两间隔的平均值RRmean;
S206:求出每个R波间隔,若在0.6×RRmean的时间内出现第二个R波,那么去掉绝对值小的R波,并将该点从R波候选点序列中去除;
S207:当发现R波间隔超过1.6×RRmean时,减小正阈值为平均值的1/6,返回步骤S204设置第二个阈值检测R波;若还检测不到目标,则存在倒向R波,将波形沿x轴翻转重新检测。
3.如权利要求2所述的一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法,其特征在于,所述S305中,阈值为3/4。
4.权利要求1-3任一所述的一种利用优化的AdaBoost加权方式和弱分类器对心电信号分类的方法用于人体心电信号的分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010237763.3A CN111563411B (zh) | 2020-03-30 | 2020-03-30 | 利用AdaBoost和弱分类器的心电信号分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010237763.3A CN111563411B (zh) | 2020-03-30 | 2020-03-30 | 利用AdaBoost和弱分类器的心电信号分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111563411A CN111563411A (zh) | 2020-08-21 |
CN111563411B true CN111563411B (zh) | 2023-08-29 |
Family
ID=72070343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010237763.3A Active CN111563411B (zh) | 2020-03-30 | 2020-03-30 | 利用AdaBoost和弱分类器的心电信号分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111563411B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112612897B (zh) * | 2020-12-30 | 2023-06-20 | 湖北大学 | 一种维基百科概念依赖关系识别方法 |
CN115462800B (zh) * | 2021-06-11 | 2024-10-18 | 广州视源电子科技股份有限公司 | 一种心电信号特征波形检测方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108696379A (zh) * | 2017-04-07 | 2018-10-23 | 南京航空航天大学 | 基于集成学习和smote的蜂窝网络故障诊断系统 |
CN108932452A (zh) * | 2017-05-22 | 2018-12-04 | 中国科学院半导体研究所 | 基于多尺度卷积神经网络的心律失常心拍分类方法 |
CN110236518A (zh) * | 2019-04-02 | 2019-09-17 | 武汉大学 | 基于神经网络的心电及心震信号联合分类的方法及装置 |
CN110960211A (zh) * | 2019-12-30 | 2020-04-07 | 江南大学 | 一种基于嵌入式的心电实时监测系统 |
-
2020
- 2020-03-30 CN CN202010237763.3A patent/CN111563411B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108696379A (zh) * | 2017-04-07 | 2018-10-23 | 南京航空航天大学 | 基于集成学习和smote的蜂窝网络故障诊断系统 |
CN108932452A (zh) * | 2017-05-22 | 2018-12-04 | 中国科学院半导体研究所 | 基于多尺度卷积神经网络的心律失常心拍分类方法 |
CN110236518A (zh) * | 2019-04-02 | 2019-09-17 | 武汉大学 | 基于神经网络的心电及心震信号联合分类的方法及装置 |
CN110960211A (zh) * | 2019-12-30 | 2020-04-07 | 江南大学 | 一种基于嵌入式的心电实时监测系统 |
Non-Patent Citations (1)
Title |
---|
刘光达等.基于小波变换和Adaboost算法的心脏骤停预测模型研究.《生物医学工程研究》.2017,第36卷(第36期),第1-6页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111563411A (zh) | 2020-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109620152B (zh) | 一种基于MutiFacolLoss-Densenet的心电信号分类方法 | |
CN110443798B (zh) | 一种基于磁共振图像的自闭症检测方法、装置及系统 | |
Liu et al. | Classification of heart diseases based on ECG signals using long short-term memory | |
CN112507996B (zh) | 一种主样本注意力机制的人脸检测方法 | |
CN108511055B (zh) | 基于分类器融合及诊断规则的室性早搏识别系统及方法 | |
CN111986811B (zh) | 一种基于算法和大数据的疾病预测系统 | |
CN111563411B (zh) | 利用AdaBoost和弱分类器的心电信号分类方法 | |
CN113050042A (zh) | 基于改进UNet3+网络的雷达信号调制类型识别方法 | |
CN110532880B (zh) | 样本筛选及表情识别方法、神经网络、设备及存储介质 | |
CN108597603B (zh) | 基于多维高斯分布贝叶斯分类的癌症复发预测系统 | |
CN113657491A (zh) | 一种用于信号调制类型识别的神经网络设计方法 | |
CN106096517A (zh) | 一种基于低秩矩阵与特征脸的人脸识别方法 | |
CN114469124B (zh) | 一种运动过程中异常心电信号的识别方法 | |
CN108509996A (zh) | 基于Filter和Wrapper选择算法的特征选择方法 | |
CN102663681B (zh) | 基于排序k-均值算法的灰度图像分割方法 | |
CN112560596A (zh) | 一种雷达干扰类别识别方法及系统 | |
CN114512240A (zh) | 一种痛风预测模型系统、设备及存储介质 | |
CN115034296A (zh) | 一种基于域相似性脑电跨被试源域选择方法 | |
CN114492519A (zh) | 一种基于超声回波射频信号的肺超声特殊征象b线识别分类方法 | |
CN105809129A (zh) | 一种基于Gabor小波的多阈值LBP人脸识别方法 | |
CN116884415A (zh) | 一种基于DV-Softmax损失函数的声纹识别方法 | |
CN113066544B (zh) | 基于CAA-Net与LightGBM的FVEP特征点检测方法 | |
CN113159194A (zh) | 一种基于属性动态选择与灰度关联分析的缺失值填补方法 | |
Xiang et al. | An Improved SMOTE Algorithm Using Clustering | |
CN111920397A (zh) | 基于稀疏最小二乘支持向量机的动脉硬化程度检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |