CN112270359A - 一种一维序列升维聚类方法及系统 - Google Patents

一种一维序列升维聚类方法及系统 Download PDF

Info

Publication number
CN112270359A
CN112270359A CN202011182284.2A CN202011182284A CN112270359A CN 112270359 A CN112270359 A CN 112270359A CN 202011182284 A CN202011182284 A CN 202011182284A CN 112270359 A CN112270359 A CN 112270359A
Authority
CN
China
Prior art keywords
dimensional
module
electrocardiosignals
electrocardiosignal
denoising
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011182284.2A
Other languages
English (en)
Inventor
潘晓光
李宇
王小华
刘剑超
张娜
焦璐璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi Sanyouhe Smart Information Technology Co Ltd
Original Assignee
Shanxi Sanyouhe Smart Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanxi Sanyouhe Smart Information Technology Co Ltd filed Critical Shanxi Sanyouhe Smart Information Technology Co Ltd
Priority to CN202011182284.2A priority Critical patent/CN112270359A/zh
Publication of CN112270359A publication Critical patent/CN112270359A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Psychiatry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Physiology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Pathology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明属于人工智能图像处理技术领域,具体涉及一种一维序列升维聚类方法及系统,包括心电信号收集模块、预处理模块、去噪模块、格罗姆变换模块、无监督K‑means聚类模块、输出结果模块,所述心电信号收集模块导入一维心电信号,并储存于数据库中,并对所述一维心电信号依照导入数据库先后时间顺序从X0到Xn进行脚注;所述预处理模块用于对一维心电信号的时间序列X=x1,x2,...,xn进行缩放;所述去噪模块用于所述一维心电信号进行筛选去噪;所述格罗姆变换模块用于实现所述一维心电信号转变为二维心电图像;本发明将心电信号的识别从时域问题转换图像分类问题,通过对时间序列进行內积来衡量数据内部的相似性,将其转换为格罗姆矩阵,完成从一维到二维的升维过程。

Description

一种一维序列升维聚类方法及系统
技术领域
本发明属于人工智能图像处理技术领域,具体涉及一种一维序列升维聚类方法及系统。
背景技术
心电信号(Electrocardiogram,ECG)是对心脏活动的直观记录,通过心电图展现的心率、S-T段、P波、QRS波群的形态及出现位置等特征能够对于窦性心动过速、窦性心律不齐、室性早搏和心房颤动等心律失常进行诊断,是进行心脏疾病判别的主要依据之一。过去,心电信号的判别主要靠医生人为判断,随着医疗标准的不断提高,人工判别的速度与准确度已不足以满足医疗需求。本技术能够极大程度的展现数据隐性特征,提高心电信号识别速度与识别准确率,解决由于数据不足而导致的模型识别能力差的问题,同时由于使用无监督学习,极大地减少了标注成本。同时拥有较强的泛化能力,可以适应不同病人的病理分类。
现有技术存在的问题或缺陷:1、提取特征单一,无法准确描述信号所反映的信息,导致信号分类准确率较低;2、样本较少导致准确率较低,深度学习模型已被证明在数据分类方面具有良好的效果,但深度学习模型的训练对数据规模要求较高,而大多序列信号标注数据较少,会导致模型训练不完全,模型欠拟合,识别准确率较低。目前的一维序列分类方法存在序列分类准确率低、分类模泛化能力差、算力要求过高等问题。
发明内容
针对上述传统心电信号的处理提取特征单一、识别准确率较低的技术问题,本发明提供了一种分类准确率高、特征提取容易、成本低、自动化程度高的一维序列升维聚类方法及系统。
为了解决上述技术问题,本发明采用的技术方案为:
一种一维序列升维聚类方法,包括下列步骤:
S1、一维心电信号收集;
S2、一维心电信号去噪;
S3、对去噪后的一维心电信号进行格罗姆变换;
S4、导入无监督K-means聚类算法;
S5、输出结果,并储存。
所述S1中一维心电信号收集的方法为:导入一维心电信号,将其分割为长度为n的心电信号段,并储存为NPY文件供模型读取。
所述S2中一维心电信号去噪的方法为:首先对一维心电信号按照一维时间序列排序X=x1,x2,...,xn,同时按照
Figure BDA0002750503340000021
进行缩放。
所述S2中一维心电信号去噪采用滤波器,所述滤波器的截止频率为0.08,所述滤波器采用阶数为4的低通滤波器。
所述S3中对去噪后的一维心电信号进行格罗姆变换的方法为:将去噪后的一维心电信号导入格罗姆变换模块,格罗姆变换模块的格罗姆角场通过对时间序列进行内积来衡量数据内部的相似性,将一维心电信号转换为格罗姆矩阵,实现一维心电信号转变为二维心电图像。
所述格罗姆变换转换过程为:一维心电信号进行缩放和去噪后,计算每一对的点积并放入格罗姆矩阵G中,
Figure BDA0002750503340000022
根据矩阵的值完成二维心电图像的构建。
所述S4中导入无监督K-means聚类算法的方法为:首先随机指定类中心,根据所述二维心电图像距离类中心的远近进行类簇的划分,划分完成之后,重新对类中心进行计算,经过循环迭代,直到类中心收敛,完成类簇划分。
所述对类中心进行计算的方法为;通过EM算法的两步走策略计算出类中心,求取最小化平方误差函数E,求取最小化平方误差函数E的公式为:
Figure BDA0002750503340000023
所述k为数据量,所述μi为类中心,所述t为数据,所述Ci为类簇。
一种一维序列升维聚类系统,包括心电信号收集模块、预处理模块、去噪模块、格罗姆变换模块、无监督K-means聚类模块、输出结果模块,所述心电信号收集模块与预处理模块,所述预处理模块连接有去噪模块,所述去噪模块连接有格罗姆变换模块,所述格罗姆变换模块连接有无监督K-means聚类模块,所述无监督K-means聚类模块连接有输出结果模块。
本发明与现有技术相比,具有的有益效果是:
本发明将心电信号的识别从时域问题转换图像分类问题,通过对时间序列进行內积来衡量数据内部的相似性,将其转换为格罗姆矩阵,完成从一维到二维的升维过程。可以在保留数据特征的同时,展现出数据更多的隐藏特征,使得后续使用深度神经网络进行特征提取更加容易。本专利采用无监督K-means聚类算法,对数据量的要求较低。由于采用无监督算法,并不需要数据的标注,这在一定程度上节约了经济成本,且此方法只需在确立类簇中心时耗费一定算力,而在中心确立后,只需较少的计算成本即可完成数据的分类工作。同时真正做到了无人参与、智能识别。
附图说明
图1为本发明的工作流程图;
图2为本发明的算法流程总图;
图3为本发明的信号转化流程图;
图4为本发明的聚类流程图;
图5为本发明的结构原理图;
其中:1为心电信号收集模块,2为预处理模块,3为去噪模块,4为格罗姆变换模块,5为无监督K-means聚类模块,6为输出结果模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种一维序列升维聚类方法,如图1、图2、图3所示,包括下列步骤:
步骤一、心电信号收集;导入一维心电信号,将其分割为长度为n的心电信号段,并储存为NPY文件供模型读取;这里对心电信号进行分割的目的在于,统一输入模型数据的大小,方便模型进行识别。
步骤二、一维心电信号去噪;将所述一维心电信号的时间序列X=x1,x2,...,xn进行连续小波变换去噪;所述缩放采用数据归一化的计算方式,进行缩放。去噪的目的在于,为了减少最开始收集的数据的偏差,因为实际收集数据中,有一些心电图像因为个体的特殊性,导致偏差较大,如果不将这些个体特殊的图像除去,会影响结果的精确性。
步骤三、对去噪后的一维心电信号进行格罗姆变换;将去噪后的心电信号导入格罗姆变换模块,格罗姆角场通过对时间序列进行內积来衡量数据内部的相似性,将其转换为格罗姆矩阵,实现一维心电信号转变为二维心电图像,将心电信号的识别从时域问题转换图像分类问题,通过对时间序列进行內积来衡量数据内部的相似性,将其转换为格罗姆矩阵,完成从一维到二维的升维过程。可以在保留数据特征的同时,展现出数据更多的隐藏特征,使得后续使用深度神经网络进行特征提取更加容易。
步骤四、导入无监督K-means聚类算法;首先随机指定类中心,根据二维心电图像距离类中心的远近进行类簇的划分,划分完成之后,重新对类中心进行计算,经过循环迭代,直到类中心收敛,完成类簇划分;采用无监督K-means聚类算法,对数据量的要求较低。由于采用无监督算法,并不需要数据的标注,这在一定程度上节约了经济成本,且此方法只需在确立类簇中心时耗费一定算力,而在中心确立后,只需较少的计算成本即可完成数据的分类工作。同时真正做到了无人参与、智能识别。
步骤五、输出结果,并储存。
在一种可能的实施方式中,步骤步骤二中去噪时,首先对一维心电信号按照一维时间序列排序X=x1,x2,...,xn,同时按照
Figure BDA0002750503340000041
进行缩放。即采用数据归一化的计算方法,例如原本时间序列{2.5 3.5 0.5 1.5}归一化后变成了{0.31250.4375 0.0625 0.1875},即将数据的变量范围控制在[0,1]之间,通过采用数据归一化后,减轻后续数据运算量。
在一种可能的实施方式中,S2中一维心电信号去噪采用滤波器,所述滤波器的截止频率为0.08,所述滤波器采用阶数为4的低通滤波器。
在一种可能的实施方式中,步骤三中格罗姆变换的具体转换过程如下:一维心电信号进行缩放和去噪后,计算每一对的点积并放入格罗姆矩阵G中,
Figure BDA0002750503340000042
根据矩阵的值完成二维图片的构建。
在一种可能的实施方式中,步骤四中采用的类中心计算方法为;通过EM算法的两步走策略而计算出类中心,求取最小化平方误差函数E,最小化平方误差函数E公式为:
Figure BDA0002750503340000043
其中k为数据量,μi表示类中心,t表示数据,Ci表示类簇。
其中具体的聚类过程,参照图4,首先导入二维心电图像,其导入的二维心电图像数据量为k,先通过人为设定类中心μ1,根据最小化平方误差函数E结果判断是否中心发生变化,如果发生变化则重新确定聚类中心,重复计算过程,直到中心不再发生变化,则输出结果。采用无监督K-means聚类算法模块,对数据量的要求较低。由于采用无监督算法,这在一定程度上节约了经济成本,且此方法只需在确立类簇中心时耗费一定算力,而在中心确立后,只需较少的计算成本即可完成数据的分类工作。同时真正做到了无人参与、智能识别。
一种一维序列升维聚类系统,如图5所示,包括心电信号收集模块1、预处理模块2、去噪模块3、格罗姆变换模块4、无监督K-means聚类模块5、输出结果模块6,所述心电信号收集模块1与预处理模块2,所述预处理模块2连接有去噪模块3,所述去噪模块3连接有格罗姆变换模块4,所述格罗姆变换模块4连接有无监督K-means聚类模块5,所述无监督K-means聚类模块5连接有输出结果模块6。心电信号收集模块1导入一维心电信号,并储存于数据库中,并对一维心电信号依照导入数据库先后时间顺序从X0到Xn进行脚注;预处理模块2用于对一维心电信号的时间序列X=x1,x2,...,xn进行缩放;去噪模块3用于一维心电信号进行筛选去噪;格罗姆变换模块4用于实现一维心电信号转变为二维心电图像;输出结果模块6用于输出结果并储存。
上面仅对本发明的较佳实施例作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化,各种变化均应包含在本发明的保护范围之内。

Claims (9)

1.一种一维序列升维聚类方法,其特征在于:包括下列步骤:
S1、一维心电信号收集;
S2、一维心电信号去噪;
S3、对去噪后的一维心电信号进行格罗姆变换;
S4、导入无监督K-means聚类算法;
S5、输出结果,并储存。
2.根据权利要求1所述的一种一维序列升维聚类方法,其特征在于:所述S1中一维心电信号收集的方法为:导入一维心电信号,将其分割为长度为n的心电信号段,并储存为NPY文件供模型读取。
3.根据权利要求1所述的一种一维序列升维聚类方法,其特征在于:所述S2中一维心电信号去噪的方法为:首先对一维心电信号按照一维时间序列排序X=x1,x2,...,xn,同时按照
Figure FDA0002750503330000011
进行缩放。
4.根据权利要求1所述的一种一维序列升维聚类方法,其特征在于:所述S2中一维心电信号去噪采用滤波器,所述滤波器的截止频率为0.08,所述滤波器采用阶数为4的低通滤波器。
5.根据权利要求1所述的一种一维序列升维聚类方法,其特征在于:所述S3中对去噪后的一维心电信号进行格罗姆变换的方法为:将去噪后的一维心电信号导入格罗姆变换模块,格罗姆变换模块的格罗姆角场通过对时间序列进行内积来衡量数据内部的相似性,将一维心电信号转换为格罗姆矩阵,实现一维心电信号转变为二维心电图像。
6.根据权利要求5所述的一种一维序列升维聚类方法,其特征在于:所述格罗姆变换转换过程为:一维心电信号进行缩放和去噪后,计算每一对的点积并放入格罗姆矩阵G中,
Figure FDA0002750503330000012
根据矩阵的值完成二维心电图像的构建。
7.根据权利要求1所述的一种一维序列升维聚类方法,其特征在于:所述S4中导入无监督K-means聚类算法的方法为:首先随机指定类中心,根据所述二维心电图像距离类中心的远近进行类簇的划分,划分完成之后,重新对类中心进行计算,经过循环迭代,直到类中心收敛,完成类簇划分。
8.根据权利要求7所述的一种一维序列升维聚类方法,其特征在于:所述对类中心进行计算的方法为;通过EM算法的两步走策略计算出类中心,求取最小化平方误差函数E,求取最小化平方误差函数E的公式为:
Figure FDA0002750503330000021
所述k为数据量,所述μi为类中心,所述t为数据,所述Ci为类簇。
9.一种一维序列升维聚类系统,其特征在于:包括心电信号收集模块(1)、预处理模块(2)、去噪模块(3)、格罗姆变换模块(4)、无监督K-means聚类模块(5)、输出结果模块(6),所述心电信号收集模块(1)与预处理模块(2),所述预处理模块(2)连接有去噪模块(3),所述去噪模块(3)连接有格罗姆变换模块(4),所述格罗姆变换模块(4)连接有无监督K-means聚类模块(5),所述无监督K-means聚类模块(5)连接有输出结果模块(6)。
CN202011182284.2A 2020-10-29 2020-10-29 一种一维序列升维聚类方法及系统 Pending CN112270359A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011182284.2A CN112270359A (zh) 2020-10-29 2020-10-29 一种一维序列升维聚类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011182284.2A CN112270359A (zh) 2020-10-29 2020-10-29 一种一维序列升维聚类方法及系统

Publications (1)

Publication Number Publication Date
CN112270359A true CN112270359A (zh) 2021-01-26

Family

ID=74345369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011182284.2A Pending CN112270359A (zh) 2020-10-29 2020-10-29 一种一维序列升维聚类方法及系统

Country Status (1)

Country Link
CN (1) CN112270359A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112842348A (zh) * 2021-02-07 2021-05-28 山东省人工智能研究院 一种基于特征提取与深度学习的心电信号自动分类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112842348A (zh) * 2021-02-07 2021-05-28 山东省人工智能研究院 一种基于特征提取与深度学习的心电信号自动分类方法
CN112842348B (zh) * 2021-02-07 2021-09-14 山东省人工智能研究院 一种基于特征提取与深度学习的心电信号自动分类方法

Similar Documents

Publication Publication Date Title
Li et al. Deep convolutional neural network based ECG classification system using information fusion and one-hot encoding techniques
CN109117730B (zh) 心电图心房颤动实时判断方法、装置、系统及存储介质
CN109645980A (zh) 一种基于深度迁移学习的心律异常分类方法
CN109620211A (zh) 一种基于深度学习的智能化异常心电辅助诊断方法
CN110495877B (zh) 一种基于ecg的多尺度特征提取方法及装置
Cao et al. Atrial fibrillation detection using an improved multi-scale decomposition enhanced residual convolutional neural network
Zhu et al. Classification of cardiac abnormalities from ECG signals using SE-ResNet
CN111481192B (zh) 一种基于改进U-Net的心电信号R波检测方法
Cao et al. ML-Net: Multi-Channel lightweight network for detecting myocardial infarction
CN111202512A (zh) 一种基于小波变换与dcnn的心电图分类方法和装置
Chen et al. Region aggregation network: improving convolutional neural network for ECG characteristic detection
CN111956208B (zh) 一种基于超轻量级卷积神经网络的ecg信号分类方法
CN108647584B (zh) 基于稀疏表示和神经网络的心律不齐识别分类方法
CN114052744A (zh) 基于脉冲神经网络的心电信号分类方法
Ullah et al. An end-to-end cardiac arrhythmia recognition method with an effective densenet model on imbalanced datasets using ecg signal
CN113223697A (zh) 远程体积描记信号检测模型构建、检测方法、装置及应用
Ma et al. An effective data enhancement method for classification of ECG arrhythmia
Tseng et al. Sliding large kernel of deep learning algorithm for mobile electrocardiogram diagnosis
CN111557660A (zh) 一种亚群体深度学习框架下的心律失常识别方法
CN115530788A (zh) 基于自注意力机制的心律失常分类方法
CN114692698A (zh) 一种基于残差网络的一维心电数据分类方法
CN112270359A (zh) 一种一维序列升维聚类方法及系统
CN113069124A (zh) 一种基于cnn-et模型的心电监测方法
CN113128384A (zh) 一种基于深度学习的脑卒中康复系统脑机接口软件关键技术方法
Wan et al. Research on Identification Algorithm Based on ECG Signal and Improved Convolutional Neural Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination