CN110786847A - 心电信号的建库方法和分析方法 - Google Patents
心电信号的建库方法和分析方法 Download PDFInfo
- Publication number
- CN110786847A CN110786847A CN201810870304.1A CN201810870304A CN110786847A CN 110786847 A CN110786847 A CN 110786847A CN 201810870304 A CN201810870304 A CN 201810870304A CN 110786847 A CN110786847 A CN 110786847A
- Authority
- CN
- China
- Prior art keywords
- electrocardiosignals
- sample
- electrocardiosignal
- label
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
- A61B5/318—Heart-related electrical modalities, e.g. electrocardiography [ECG]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/24—Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
- A61B5/316—Modalities, i.e. specific diagnostic methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
Abstract
本发明适用于数据分析技术领域,提供了一种心电信号的建库方法和分析方法,其中,建库方法包括:获取心电信号,和所述心电信号对应的初始标签;利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;将所述心电信号和对应的所述期望标签存储至心电信号数据库,从而解决了现有技术中构建心电信号数据库建库成本高且效率不高的问题。
Description
技术领域
本发明属于数据分析技术领域,尤其涉及一种心电信号的建库方法和分析方法。
背景技术
心电信号是一种心脏经胸腔的电生理活动数据,它以时间为单位,通过放置在皮肤上的电极捕捉并记录。
对心电信号的自动分析技术在数十年间得到了长足发展,心电信号自动分析技术主要包括心电信号的预处理、各波形位置确定、心电信号的特征提取并通过识别算法得到检测结果等。其中识别算法一般可以分为两类:采用传统的基于规则/判据的分析方法与采用机器学习算法。
传统的基于规则/判据的分析方法典型代表是采用明尼苏达码对心电信号进行分析,这种方法的优势在于与医生的诊断逻辑类似,分析结果能有很好的医学解释。缺陷也很明显,规则均是基于确定化的阈值,从统计学习理论的角度可以认为这种方法得到的模型容量十分有限,而且很难实现个性化的定制,算法性能上限低。
相对于基于规则/判据的分析方法,机器学习方法作为识别方法很有优势,其中最明显的是它所具有的学习能力,它能从样本中持续学习,样本越大,算法性能越高。但目前的算法大多基于Physionet网站提供的标准数据库,如MIT-BIH数据库开发,假设以下两条件成立:1)在标准数据库中算法性能优良;2)心电数据满足独立同分布。但由于标准数据库中数据太少,如MIT-BIH数据库只有48例长度为30min的数据,不能涵盖心电数据的分布,算法性能在实际临床中会大打折扣,甚至无法应用于临床。
近年来,人工智能技术尤其是深度学习技术在以计算机视觉为代表的工业领域取得了巨大的成功,很大程度上依赖于高成本的监督学习。监督学习技术是通过学习大量训练数据来构建预测模型,其中每个训练样本都有其对应的真值输出。
值得注意的是,这样的数据意味着标注过程的非常高昂的成本,这样使得很多任务很难获得如全部真值标签这样的强监督信息,在医学领域更是如此,这也使得以深度学习为代表的人工智能技术应用于医学领域明显滞后于工业领域。虽然迁移学习技术在一定程度上可以解决大规模样本量问题,但显然地,迁移学习尚且主要适用于不同目标域相近的领域,如都是图像,目前只能缓解人工智能技术在医学图像领域的应用问题。对于心电图这类多通道时间序列,尚无类似像ImageNet如此大规模的可提供给图像领域的数据库支持,无法通过迁移学习缓解数据规模问题。
进一步地,真实场景中,经常存在的是弱监督的或者标注有噪声的数据,在心电图的标注上尤为如此。弱监督学习是相对强监督而言的,它是一个总括性的术语,涵盖了尝试通过较弱的监督来学习并构建预测模型的各种研究。弱监督学习主要关注三种弱监督类型:不完全监督:只有一部分训练数据具备标签;不确切监督:训练数据只具备粗粒度标签;以及不准确监督:给出的标签并不总是真值。本专利具体涉及到弱监督学习领域中的不准确监督领域。
一般一份心电图由一位心电图医师分析、标注,标注容易受到医生的个人情况(分析水平参差不齐)和医院的知识传承影响,根据Hakacova等人的统计分析发现普通心电图医师的心电图判读准确率平均为85%,可见心电图判读欠缺客观性,而当心电图医师疲倦或不小心,以及一些心电图本身就难以标注的情况下,心电图判读的准备性更是大打折扣。
由于上述因素,为了获取一份精准的心电图标注报告,推荐的方法是让多名(一般3名)心电图医师独立给出报告,而后对比,若存在差异则通过多次会谈得出一致性的结论。
目前认为:监督深度学习算法在每类给定约5000个标注样本情况下一般将达到可以接受的性能,当至少有1000万个标注样本的数据集用于训练时,它将超过人类表现。具体到心电图分析问题上,心电图种类繁多,以明尼苏达码来说,标注的种类约200类,以一类含5000个标注样本粗略估算(心电图分析是多标签问题,这里粗略估计其样本量量级),意味着需要有100万标注样本,实际上,临床中大部分是正常心电图,每一类心电图数据分布很不平衡,显然,随机的100万样本是不符合要求的,这也意味着若随机标注心电图样本,效率很低,数据集达到千万级别才能满足每类约5000个标注样本的要求。
通过上述分析,可知通过强监督学习的方法得到心电图自动分析算法,需要构建一个样本量级达到千万左右的精准心电数据库,但这是不现实的,亟需通过更好的技术路径解决该问题。
发明内容
有鉴于此,本发明实施例提供了一种心电信号类型识别的方法和装置,可以解决现有技术构建心电信号数据库建库成本高且效率不高的问题。
本发明实施例的第一方面提供了一种心电信号的建库方法,包括:
获取心电信号,和所述心电信号对应的初始标签;
利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
将所述心电信号和对应的所述期望标签存储至心电信号数据库。
本发明实施例的第二方面提供了一种心电信号的分析方法,包括:
获取心电信号,和所述心电信号对应的初始标签;
利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
利用所述心电信号和对应的所述期望标签,调整所述心电分析模型,调整后的所述心电分析模型用于得到所述心电信号的期望标签。
本发明实施例的第三方面提供了一种心电信号的建库装置,包括:
第一获取单元,用于获取心电信号,和所述心电信号对应的初始标签;
计算单元,用于利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
第二获取单元,用于若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
存储单元,用于将所述心电信号和对应的所述期望标签存储至心电信号库。
本发明实施例的第四方面提供了一种心电信号的分析装置,包括:
第一获取单元,用于获取心电信号,和所述心电信号对应的初始标签;
计算单元,用于利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
第二获取单元,用于若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
调整单元,用于利用所述心电信号和对应的所述期望标签,调整所述心电分析模型,调整后的所述心电分析模型用于得到所述心电信号的期望标签。
本发明实施例的第五方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面和/或第二方面所述方法的步骤。
本发明实施例的第六方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面和/或第二方面所述方法的步骤。
本发明实施例中,利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签,若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签,最后将所述心电信号和对应的所述期望标签存储至心电信号数据库,解决了现有技术中构建精准的心电信号数据库建库成本高且效率不高的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种心电信号的建库方法的实现流程示意图;
图2是本发明实施例提供的心电图一个心拍示意图;
图3是本发明实施例提供的另一种心电信号的建库方法的实现流程示意图;
图4是本发明实施例提供的又一种心电信号的建库方法的实现流程示意图;
图5是本发明实施例提供的一种心电信号的分析方法的实现流程示意图;
图6是本发明实施例提供的一种心电信号的建库装置的结构示意图
图7是本发明实施例提供的一种心电信号的分析装置的结构示意图;
图8是本发明实施例提供的服务器的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。同时,在本发明的描述中,术语“第一”和“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
现有技术下获取一份精准的心电图标注报告成本昂贵且效率不高,应当考虑减少构建精准的心电信号数据库的成本,并提高建库效率,即减少构建无噪声标签数据库的成本并提高效率。基于此,本发明揭示一种心电信号的建库方法,该建库方法依托于心电分析模型,通过本发明构建的心电信号数据库可以称为无噪声标签心电信号数据库,又可称为精准心电信号数据库。
图1示出了本发明实施例提供的一种心电信号的建库方法的实现流程,该方法适用于建立心电信号数据库的情况,由心电信号的建库装置执行。该心电信号的建库通常配置于终端设备,由软件和/或硬件实现。终端设备可以为具有计算能力的终端设备,如服务器等。如图1所示,心电信号的建库方法包括步骤:S101至S104。
在S101中,获取心电信号,和所述心电信号对应的初始标签。
本发明实施例中,心电信号是一种生理信号,包括人体心电信号以及动物体的心电信号。通过将心电信号采集设备中的测量电极放置在生物体表面的一定部位,即可采集出一系列的心电数据,该心电数据记录了身体各部位在每一心动周期中发生的有规律的电压变化情况,则描述了该电压动态变化情况的心电数据即为心电信号,其以心电波形的形式展示于心电信号采集设备中,其中,所述心电信号采集设备可以为心电图机。
心电图中的一个心拍,在心电图上可有5个或6个波,如图2所示,从左至右为P波,QRS波,T波及U波等波群;又分为7个部分,即P波、PR段、PR间期、QRS波群、ST段、T波、QT间期,波型因导联不同可有倒置。本发明的实施例可以适用于包含标准肢体导联及胸部V1导联的心电测量模式,也可以适用于各类常规导联体系的心电测量模式,如12标准导联体系、15导联体系、18导联体系、9导联体系等。
心电信号的来源可以有很多,可来自院内也可来自院外,院内包括心电图科室、体检科、急诊中心、胸痛中心等,院外可来自院外急救过程中,还可来自基层医疗。获取心电信号通过心电图采集设备与网络传输技术即可实现,不是本发明的重点,在此不再赘述。
本发明中通过获取不同来源的心电信号及其对应的初始标签。心电信号的标签为心电医师在心电信号上标注的标签。包括但不限于:正常心电图、左/右心房肥大、双心房肥大、左/右心室肥大、双心室肥大、各类心肌梗死(包括如前壁/后壁/前间壁/侧壁/前间壁等)、各类心律失常(包括如窦性心律不齐、房性早搏、室性早搏、室上速、室速、房扑、房颤、室扑、室颤等)等等。
在S102中,利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签。
在本发明实施例中,在步骤102之前还包括:获取不同来源的样本心电信号及样本初始标签;利用不同来源的所述样本心电信号及样本初始标签,基于弱监督学习方法学习,得到所述心电分析模型;所述心电分析模型用于获取所述心电信号的模型标签。
样本心电信号的来源可以有很多,与步骤101相类似,其可来自院内也可来自院外,院内包括心电图科室、体检科、急诊中心、胸痛中心等,院外可来自院外急救过程中,还可来自基层医疗。这些样本心电信号的标注是含噪声标签的,是不准确的,但其优势是数据来源广泛、样本量大,可涵盖心电图整体分布。不同来源的样本心电信号及样本初始标签组成了含噪声标签数据库。在后续的图3和图4所示实施例中将详细描述得到心电分析模型的过程,此处不再赘述。
需要说明的是,步骤101中获取的心电信号及初始标签,可以是从含噪声标签数据库中获取到的一个或多个心电信号;也可以不是为从含噪声标签数据库中获取到的一个或多个心电信号,即属于新获取到的通过心电信号采集设备采集到的心电信号及心电图医师标注的心电信号对应的初始标签。
将心电信号通过预先学习得到的心电分析模型,获取心电分析模型的分析的结果,即获得所述心电信号的模型标签。
在S103中,判断所述初始标签和模型标签是否一致,若不一致,则执行步骤104;若一致,则执行步骤105。
将心电分析模型分析的结果与原心电医师对心电信号的标注标签进行对比,即将心电信号的模型标签与初始标签进行对比,判断两者是否一致,若不一致,则执行步骤104,若一致,则执行步骤105。
在S104中,获取与所述心电信号对应的期望标签。
当心电分析模型分析的结果与原心电医师的标注标签不一致时,将该例心电信号交由多名心电图医师进行人工标记,并通过会谈得到一致性结论,即得到与所述心电信号对应的期望标签,再将得到的期望标签输入服务器,服务器获取到所述期望标签,从而进行后续的步骤106。这种方法有效的减少强监督学习中心电图医师人工标记的成本,同时构建的精准心电数据库更加有目的性,这是因为:心电分析模型的分析结果与原心电医师的标注标签不一致,意味着该例心电数据具有典型性的概率更高。
在S105中,舍弃所述心电信号和对应的模型标签。
当心电分析模型分析的结果与原心电医师标注标签一致时,舍弃所述心电信号和对应的模型标签,不执行将心电信号和对应的模型标签存储至精准的心电信号数据库的步骤。返回步骤101,重新获取下一个心电信号。
若步骤101中获取的心电信号是从含噪声标签数据库中获取到的心电信号,那么,当模型标签与初始标签不一致时,将所述心电信号返回原来的含噪声标签数据库;若步骤101中获取的心电信号不是从含噪声标签数据库中获取到的心电信号,而是通过心电信号采集设备新获取的心电信号,那么,当模型标签与初始标签不一致时,将该例心电信号入选至含噪声标签数据库,这样含噪声标签数据库的规模可进一步扩大。
在本发明其他实施例中,进一步地,通过扩大后的含噪声标签数据库优化所述心电分析模型,从而得到优化后的所述心电分析模型,优化后的心电分析模型具有更高的准确度,利用优化后的所述心电分析模型替换之前的心电分析模型,提高本发明实施例最终建立的数据库的准确性。
在S106中,将所述心电信号和对应的所述期望标签存储至心电信号数据库。
在本发明实施例中,当获取到与心电信号对应的期望标签后,将心电信号和对应的期望标签存储至心电信号数据库,从而实现建立心电信号数据库的目的。本发明建立的心电信号数据库为精准心电信号数据库。
心电信号数据库可为服务器存储器中的一个数据库。也可以为几个子数据库的集合,本发明对此不做具体限制。
接下来对步骤102之前,利用不同来源的样本心电信号及样本初始标签,基于弱监督学习方法学习,得到心电分析模型的步骤,进行详细描述。如图3所示,该步骤包括步骤301至302。
在S301中,对不同来源的所述样本心电信号及所述样本初始标签,进行数据清洗。
在本发明实施例中,获取不同来源的所述样本心电信号及所述样本初始标签,然后对本心电信号及所述样本初始标签进行数据清洗。
样本心电信号的来源可以有很多,可来自院内也可来自院外,院内包括心电图科室、体检科、急诊中心、胸痛中心等,院外可来自院外急救过程中,还可来自基层医疗。这些样本心电信号被标注的样本初始标签是含噪声标签的,是不准确的,但其优势是数据来源广泛、样本量大,可涵盖心电图整体分布。这些不同来源的样本心电信号组成的数据库可以称为含噪声标签数据库。获取不同来源的样本心电信号通过心电图采集设备与网络传输技术即可实现,同时不是本发明的重点,在此不再赘述。
获取的含噪标签样本心电信号存在一些心电图质量太差以至于无法进行有效分析、各种原因导致缺失心电医师的标注、采集设备存在差异性、或心电医师标注习惯不统一等,因而需要进行数据清洗。对样本心电信号进行数据清洗,筛选出满足预设条件的样本心电信号,得到清洗后的样本心电信号,从而提高后续学习得到心电分析模型的准确度。
可选地,如图4所示,S301包括步骤3011至3013。
在S3011中,从不同来源的样本心电信号中筛选出信号质量满足预设条件,且具有对应的样本初始标签的样本心电信号。
其中,通过信号质量检测算法判断样本心电数据的信号质量是否满足预设条件,若满足预设条件则保留该样本心电信号,否则丢弃该样本心电信号,信号质量检测算法已很成熟。需要说明的是,预设条件为经验值,本领域技术人员可以理解,该预设条件可以根据实际需要进行设定,本发明对此不做具体限定。
例如,可采用Qiao Li等人披露的方法,详见“A machine learning approach tomulti-level ECG signal quality classification”,COMPUTER METHODS AND PROGRAMSIN BIOMEDICINE117(2014)第435-447页。又如,利用小波分解的方法,将采样率为500Hz的样本心电信号分解在六个子频率段内,包括:0-1Hz、1-5Hz、5-15Hz、15-50Hz、50-100Hz以及100-250Hz六个子频率段,分别提取六个子频率段内的信号小波能量比值和能量熵值,以及样本心电信号峰度值共13个特征参数作定义样本心电信号的质量指数,并以此为标注评判样本心电信号的质量。
根据心电分析标志位判断该例样本心电信号是否存在心电医师的标注结果,即判断是否存在与样本心电信号对应的样本初始标签,若存在,则保留该样本心电信号,否则丢弃该样本心电信号。
将质量满足预设条件,且同时具有样本初始标签的样本心电信号筛选出来,进入下一个预处理的步骤。
在S3012中,预处理筛选出的所述样本心电信号,得到预处理后的样本心电信号;结构化所述样本心电信号对应的样本初始标签,得到结构化的样本初始标签。
由于心电采集设备存在一定的差异性,以采样率来说,存在500Hz和1000Hz等,而样本心电信号为来自不同来源的心电信号。因而,需要对样本心电信号进行预处理,得到预处理后的样本心电信号。
同时,由于不同心电医师的标注习惯并不一致,以正常心电图为例,有的医师仅标注为“窦性心律”,有的医师则标注为“正常心电图”。因而需要对样本初始标签进行结构化,得到规范化的标签,使不同医师对一类标签的不同标注转换为确定化的标签,以“正常心电图”为例,本发明中将转换为以下形式的标签:{{窦性心律}{正常心电图}}。
可选地,预处理筛选出的样本心电信号包括:将所述样本心电信号的采样率转换成预设采样率,将所述样本心电信号的采样精度转换成预设采样精度。
在本发明实施例中,对筛选出的样本心电信号的采样率和采样精度进行统一,从而使后续学习得到的心电分析模型能适用于不同采样率和采样精度的心电信号。
采样率转换分为升采样与降采样两种。例如,若采用500Hz作为预设采样率,当心电信号采集设备的采样率大于500Hz时,采用降采样方法,将采样率降至500Hz;当心电信号采集设备采样率小于500Hz时,采用升采样方法,将采样率提高至500Hz。
采样精度的统一通过不同采样精度间的尺度因子换算即可实现。例如,若采用1uV/LSB作为预设采样精度,其它采样精度换算至此采样精度即可,如某心电信号采集设备的采样精度为5uV/LSB,采集的心电信号序列为:为使该心电信号序列转换为预设采样精度,序列中每一元素乘以尺度因子即可,由于其采样精度为5uV/LSB,所以这里的尺度因子为(5uV/LSB)/(1uV/LSB)=5,转换后的序列变为:
样本心电信号经过数据清洗后便可入库,逐步构成大样本量的含噪声标签数据库,通过上述步骤构建的数据库有如下优点:建库成本低,建库过程中步骤301可通过成熟的技术实现,成本最高的心电医师标注工作,随着心电医师在各场景下对心电数据的分析便已完成;样本量大,虽然一些标签存在不准确的问题,但其优势是临床中可获取大量的此类数据,建库规模可达到千万级。
在S302中,利用进行数据清洗后的所述样本心电信号及样本初始标签,基于弱监督学习方法学习得到所述心电分析模型。
其中,构建好大样本量的含噪声标签数据库后,本发明基于弱监督学习学习得到心电分析模型。具体的,利用预处理后的样本心电信号及结构化的样本初始标签,基于弱监督学习方法学习得到所述心电分析模型。所述心电分析模型用于得到心电信号的模型标签。
心电分析模型从简单到复杂,包括:线性模型(如逻辑斯特回归)、基于核函数的模型(如采用核函数的SVM)、深度学习模型(如卷积神经网络(Convolutional NeuralNetwork,CNN))等。
本发明实施例以机器学习技术为基础的构建模型,机器学习技术包括但不限于逻辑回归算法、支持向量机、卷积神经网络等。根据采用的不同的模型,可选用不同的训练方法进行训练。为使更好地理解本专利,这里以卷积神经网络为例说明基于弱监督学习方法构建心电分析模型的过程。
卷积神经网络是一类特殊的神经的人工神经网络,区别于神经网络其它模型,其主要特点是卷积运算操作。卷积神经网络在诸多领域表现优异,如:图像分类、图像检索、语音识别等。总体来说,卷积神经网络是一种层次模型,输入是原始数据,如RGB图像、原始音频数据等。卷积神经网络通过卷积操作、池化操作和非线性激活函数映射等一系列才做的层层堆叠,将高层语义信息逐层由原始数据输入层中抽取出来,这一过程称为“前馈运算”。最终,卷积神经网络的最后一层将其目标任务形式化为目标函数。通过计算预测值与真实值之间的误差或损失,利用反向传播算法将误差或损失由最后一层逐层向前反馈,更新每层参数,并在更新参数后再次前馈,如此往复,直到网络模型收敛,从而到达模型训练目的。
本发明实施例中,将样本心电信号作为卷积神经网络的输入,对应的样本初始标签作为输出,利用反向传播算法训练便可得到心电分析模型。
本发明学习得到的自动分析模型基于含噪声标签数据库,该数据库数据来源广泛、样本量大,可涵盖心电图整体分布,因此学习得到的心电图自动分析模型较好的鲁棒性及泛化性能。
可选地,在本发明图1所示实施例的基础上,在步骤102,利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签,包括:对所述心电信号进行数据清洗,利用清洗后的所述心电信号,通过心电分析模型,得到所述心电信号的模型标签。
其中,数据清洗的步骤与图3和图4所示实施例中数据清洗的原理和步骤相同,技术效果也相同,此处不再赘述。
本发明实施例还提供一种心电信号的分析方法,如图5所示,包括步骤501至504。
在S501中,获取心电信号,和所述心电信号对应的初始标签;
在S502中,利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
在S503中,若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
步骤501至503为与图1所述实施例对应的建立精准的心电信号数据库的步骤。请参见前述,此处不再赘述。
在S504中,利用所述心电信号和对应的所述期望标签,调整所述心电分析模型,调整后的所述心电分析模型用于得到所述心电信号的期望标签。
在本发明实施例中,在获得心电分析模型与构建精准的心电信号数据库的基础上,采用迁移学习,获取优化的心电分析模型。为了描述的方便,在本发明实施例中,将优化前的心电分析模型称为心电分析初始模型,将优化后的心电分析模型称为心电分析精准模型。本发明中心电分析初始模型在不精准的心电数据库中学习得到,请参见图3和图4所述实施例,其优势是样本量大,保证了模型的鲁棒性,精准库通过有目的性的构建得到,优势是标注精准,不同数据库间的数据是满足独立同分布的假定的,可自然的采用迁移学习的方法在精准库中优化心电分析模型得到优化后的模型。
可选地,本发明实施例中采用fine-tuning技术对心电分析模型进行调整。Fine-tuning是机器学习中的一个重要概念,是利用已经训练好的模型,针对特殊任务进行再调整,它具有不需要针对新任务从头开始训练网络、心电分析模型是在大规模样本上进行的,使得模型更鲁棒、泛化能力更好、实现简单等优势。
为使更好地理解本专利,前文以卷积神经网络为例说明了构建心电自动分析初始模型过程,这里进一步说明在此基础上利用fine-tuning技术得到优化后的心电分析模型。其步骤包括:固定心电分析模型前面的若干层参数,在精准心电数据库上,通过反向传播算法微调后面的若干层。优选地,由于目标任务一致,这里微调模型的最后一层即可。通过上述步骤,在心电分析初始模型的基础上便可得到心电分析精准模型。心电分析精准模型用于得到所述心电信号的期望标签。
本发明所揭示的方法还具有可持续迭代的优势:优化后的模型可以作为构建精准心电数据库时采用的心电分析模型,同时精准心电数据库的规模也在持续扩大,又可以在扩大后的精准库基础上优化心电分析模型,通过持续不断的迭代,心电自动分析模型性能将得到不断提升。
如图6所示,为本发明实施例提供的一种心电信号的建库装置600,包括:
第一获取单元601,用于获取心电信号,和所述心电信号对应的初始标签;
计算单元602,用于利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
第二获取单元603,用于若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
存储单元604,用于将所述心电信号和对应的所述期望标签存储至心电信号库。
需要说明的是,本实施例提供的一种心电信号的建库装置的实现过程可以参考如图1中提供的一种心电信号的建库方法的实现过程,在此不再赘述。
如图7所示,为本发明实施例提供的一种心电信号的分析装置700,包括:
第一获取单元701,用于获取心电信号,和所述心电信号对应的初始标签;
计算单元702,用于利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
第二获取单元703,用于若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
调整单元704,用于利用所述心电信号和对应的所述期望标签,调整所述心电分析模型,调整后的所述心电分析模型用于得到所述心电信号的期望标签。
需要说明的是,本实施例提供的一种心电信号的分析装置的实现过程可以参考如图5中提供的一种心电信号的分析方法的实现过程,在此不再赘述。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图8是本发明一实施例提供的服务器的示意图。如图8所示,该实施例的服务器8包括:处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82,例如心电信号数据库的建库或分析程序。所述处理器80执行所述计算机程序82时实现上述心电信号数据库的建库或分析方法实施例中的步骤,例如图1所示的步骤S101至S104,又如图5所示的步骤S501至S504。或者,所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块/单元的功能,例如,图6所示单元601至604的功能,又如,图7所示单元701至704的功能。
示例性的,所述计算机程序82可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器81中,并由所述处理器80执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序82在处理器80中的执行过程。
例如,所述计算机程序82可以被分割成第一获取单元、计算单元、第二获取单元和存储单元(虚拟装置中的单元),各单元具体功能如下:
第一获取单元,用于获取心电信号,和所述心电信号对应的初始标签;
计算单元,用于利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
第二获取单元,用于若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
存储单元,用于将所述心电信号和对应的所述期望标签存储至心电信号库。
又如,所述计算机程序82可以被分割成第一获取单元、计算单元、第二获取单元和调整单元(虚拟装置中的单元),各单元具体功能如下:
第一获取单元,用于获取心电信号,和所述心电信号对应的初始标签;
计算单元,用于利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
第二获取单元,用于若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
调整单元,用于利用所述心电信号和对应的所述期望标签,调整所述心电分析模型,调整后的所述心电分析模型用于得到所述心电信号的期望标签。
所述服务器8可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是服务器8的示例,并不构成对服务器8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述服务器还可以包括输入输出设备、网络接入设备、总线等。
所称处理器80可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器81可以是所述服务器8的内部存储单元,例如服务器8的硬盘或内存。所述存储器81也可以是所述服务器8的外部存储设备,例如所述服务器8上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器81还可以既包括所述服务器8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述服务器8所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种心电信号的建库方法,其特征在于,包括:
获取心电信号,和所述心电信号对应的初始标签;
利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
将所述心电信号和对应的所述期望标签存储至心电信号数据库。
2.如权利要求1所述的建库方法,其特征在于,利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签之前,还包括:
利用不同来源的样本心电信号及样本初始标签,基于弱监督学习方法学习得到所述心电分析模型;所述心电分析模型用于获取所述心电信号的模型标签。
3.如权利要求2所述的建库方法,其特征在于,利用不同来源的样本心电信号及样本初始标签,基于弱监督学习方法学习得到所述心电分析模型,包括:
对不同来源的所述样本心电信号及所述样本初始标签,进行数据清洗;
利用进行数据清洗后的所述样本心电信号及样本初始标签,基于弱监督学习方法学习得到所述心电分析模型。
4.如权利要求2或3所述的建库方法,其特征在于,利用所述样本心电信号及样本初始标签,基于弱监督学习方法学习得到所述心电分析模型,包括:
从不同来源的样本心电信号中筛选出信号质量满足预设条件,且具有对应的初始标签的样本心电信号;
预处理筛选出的所述样本心电信号,得到预处理后的样本心电信号;结构化所述样本心电信号对应的样本初始标签,得到结构化的样本初始标签;
利用预处理后的样本心电信号及结构化的样本初始标签,基于弱监督学习方法学习得到所述心电分析模型。
5.如权利要求4所述的建库方法,其特征在于,预处理筛选出的所述心电信号,得到预处理后的心电信号,包括:
将所述样本心电信号的采样率转换成预设采样率,将所述样本心电信号的采样精度转换成预设采样精度。
6.一种心电信号的分析方法,其特征在于,包括:
获取心电信号,和所述心电信号对应的初始标签;
利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
利用所述心电信号和对应的所述期望标签,调整所述心电分析模型,调整后的所述心电分析模型用于得到所述心电信号的期望标签。
7.一种心电信号的建库装置,其特征在于,包括:
第一获取单元,用于获取心电信号,和所述心电信号对应的初始标签;
计算单元,用于利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
第二获取单元,用于若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
存储单元,用于将所述心电信号和对应的所述期望标签存储至心电信号库。
8.一种心电信号的分析装置,其特征在于,包括:
第一获取单元,用于获取心电信号,和所述心电信号对应的初始标签;
计算单元,用于利用所述心电信号,通过心电分析模型,得到所述心电信号的模型标签;
第二获取单元,用于若所述初始标签和所述模型标签不一致,则获取与所述心电信号对应的期望标签;
调整单元,用于利用所述心电信号和对应的所述期望标签,调整所述心电分析模型,调整后的所述心电分析模型用于得到所述心电信号的期望标签。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810870304.1A CN110786847B (zh) | 2018-08-02 | 2018-08-02 | 心电信号的建库方法和分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810870304.1A CN110786847B (zh) | 2018-08-02 | 2018-08-02 | 心电信号的建库方法和分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110786847A true CN110786847A (zh) | 2020-02-14 |
CN110786847B CN110786847B (zh) | 2022-11-04 |
Family
ID=69425639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810870304.1A Active CN110786847B (zh) | 2018-08-02 | 2018-08-02 | 心电信号的建库方法和分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110786847B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111134662A (zh) * | 2020-02-17 | 2020-05-12 | 武汉大学 | 一种基于迁移学习和置信度选择的心电异常信号识别方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170112401A1 (en) * | 2015-10-27 | 2017-04-27 | CardioLogs Technologies | Automatic method to delineate or categorize an electrocardiogram |
CN106952204A (zh) * | 2015-12-02 | 2017-07-14 | 联发科技股份有限公司 | 保健系统以及生理信号的监控方法 |
CN106999342A (zh) * | 2014-12-12 | 2017-08-01 | 皇家飞利浦有限公司 | 利用双ecg分析算法来分析用于自动体外除颤器(aed)的选项按钮 |
CN107103182A (zh) * | 2017-03-28 | 2017-08-29 | 南京医科大学 | 一种基于深度学习算法的心脏性疾病风险预警系统及方法 |
CN107334459A (zh) * | 2017-08-01 | 2017-11-10 | 厦门兴联集团有限公司 | 一种老人智能看护系统 |
CN107403162A (zh) * | 2017-06-15 | 2017-11-28 | 公安部第三研究所 | 车辆公告号数据采集和分类的系统及方法 |
CN107688815A (zh) * | 2017-08-31 | 2018-02-13 | 京东方科技集团股份有限公司 | 医学图像的分析方法和分析系统以及存储介质 |
CN107951485A (zh) * | 2017-11-27 | 2018-04-24 | 乐普(北京)医疗器械股份有限公司 | 基于人工智能自学习的动态心电图分析方法和装置 |
CN108095716A (zh) * | 2017-11-21 | 2018-06-01 | 郑州鼎创智能科技有限公司 | 一种基于置信规则库和深度神经网络的心电信号检测方法 |
CN108171335A (zh) * | 2017-12-06 | 2018-06-15 | 东软集团股份有限公司 | 建模数据的选取方法、装置、存储介质及电子设备 |
CN108186011A (zh) * | 2017-12-13 | 2018-06-22 | 深圳竹信科技有限公司 | 房颤检测方法、装置及可读存储介质 |
-
2018
- 2018-08-02 CN CN201810870304.1A patent/CN110786847B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106999342A (zh) * | 2014-12-12 | 2017-08-01 | 皇家飞利浦有限公司 | 利用双ecg分析算法来分析用于自动体外除颤器(aed)的选项按钮 |
US20170112401A1 (en) * | 2015-10-27 | 2017-04-27 | CardioLogs Technologies | Automatic method to delineate or categorize an electrocardiogram |
CN106952204A (zh) * | 2015-12-02 | 2017-07-14 | 联发科技股份有限公司 | 保健系统以及生理信号的监控方法 |
CN107103182A (zh) * | 2017-03-28 | 2017-08-29 | 南京医科大学 | 一种基于深度学习算法的心脏性疾病风险预警系统及方法 |
CN107403162A (zh) * | 2017-06-15 | 2017-11-28 | 公安部第三研究所 | 车辆公告号数据采集和分类的系统及方法 |
CN107334459A (zh) * | 2017-08-01 | 2017-11-10 | 厦门兴联集团有限公司 | 一种老人智能看护系统 |
CN107688815A (zh) * | 2017-08-31 | 2018-02-13 | 京东方科技集团股份有限公司 | 医学图像的分析方法和分析系统以及存储介质 |
CN108095716A (zh) * | 2017-11-21 | 2018-06-01 | 郑州鼎创智能科技有限公司 | 一种基于置信规则库和深度神经网络的心电信号检测方法 |
CN107951485A (zh) * | 2017-11-27 | 2018-04-24 | 乐普(北京)医疗器械股份有限公司 | 基于人工智能自学习的动态心电图分析方法和装置 |
CN108171335A (zh) * | 2017-12-06 | 2018-06-15 | 东软集团股份有限公司 | 建模数据的选取方法、装置、存储介质及电子设备 |
CN108186011A (zh) * | 2017-12-13 | 2018-06-22 | 深圳竹信科技有限公司 | 房颤检测方法、装置及可读存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111134662A (zh) * | 2020-02-17 | 2020-05-12 | 武汉大学 | 一种基于迁移学习和置信度选择的心电异常信号识别方法及装置 |
CN111134662B (zh) * | 2020-02-17 | 2021-04-16 | 武汉大学 | 一种基于迁移学习和置信度选择的心电异常信号识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110786847B (zh) | 2022-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Murugesan et al. | Ecgnet: Deep network for arrhythmia classification | |
Huang et al. | Accurate classification of ECG arrhythmia using MOWPT enhanced fast compression deep learning networks | |
Afkhami et al. | Cardiac arrhythmia classification using statistical and mixture modeling features of ECG signals | |
US20230143594A1 (en) | Systems and methods for reduced lead electrocardiogram diagnosis using deep neural networks and rule-based systems | |
Wang et al. | Arrhythmia classification algorithm based on multi-head self-attention mechanism | |
CN111990989A (zh) | 一种基于生成对抗及卷积循环网络的心电信号识别方法 | |
Xiong et al. | Deep learning for detecting and locating myocardial infarction by electrocardiogram: A literature review | |
Moses et al. | A survey of data mining algorithms used in cardiovascular disease diagnosis from multi-lead ECG data | |
Zhou et al. | Arrhythmia recognition and classification through deep learning-based approach | |
Ullah et al. | An end-to-end cardiac arrhythmia recognition method with an effective densenet model on imbalanced datasets using ecg signal | |
Dhyani et al. | Arrhythmia disease classification utilizing ResRNN | |
Cai et al. | Real-time arrhythmia classification algorithm using time-domain ECG feature based on FFNN and CNN | |
Midani et al. | DeepArr: An investigative tool for arrhythmia detection using a contextual deep neural network from electrocardiograms (ECG) signals | |
AKDAĞ et al. | A new approach for congestive heart failure and arrhythmia classification using downsampling local binary patterns with LSTM | |
Bigler et al. | Detection of myocardial ischemia by intracoronary ECG using convolutional neural networks | |
Dhyani et al. | Analysis of ECG-based arrhythmia detection system using machine learning | |
Houssein et al. | Integration of machine learning and optimization techniques for cardiac health recognition | |
Li et al. | An intelligent heartbeat classification system based on attributable features with AdaBoost+ Random forest algorithm | |
Karri et al. | A real-time cardiac arrhythmia classification using hybrid combination of delta modulation, 1D-CNN and blended LSTM | |
Berger et al. | Generative adversarial networks in electrocardiogram synthesis: Recent developments and challenges | |
CN110786847B (zh) | 心电信号的建库方法和分析方法 | |
Lu et al. | Identification of arrhythmia by using a decision tree and gated network fusion model | |
Neifar et al. | Deep Generative Models for Physiological Signals: A Systematic Literature Review | |
Jothiramalingam et al. | Review of Computational Techniques for the Analysis of Abnormal Patterns of ECG Signal Provoked by Cardiac Disease. | |
Deepak et al. | Review of ECG Signal Classification Using Deep Learning and Traditional Methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |