CN111096736A - 基于主动学习的心电图分类方法、装置和系统 - Google Patents

基于主动学习的心电图分类方法、装置和系统 Download PDF

Info

Publication number
CN111096736A
CN111096736A CN201811261608.4A CN201811261608A CN111096736A CN 111096736 A CN111096736 A CN 111096736A CN 201811261608 A CN201811261608 A CN 201811261608A CN 111096736 A CN111096736 A CN 111096736A
Authority
CN
China
Prior art keywords
electrocardiogram
model
sample
classification
unlabeled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811261608.4A
Other languages
English (en)
Inventor
欧凤
周雅琪
周峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Edan Instruments Inc
Original Assignee
Edan Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Edan Instruments Inc filed Critical Edan Instruments Inc
Priority to CN201811261608.4A priority Critical patent/CN111096736A/zh
Publication of CN111096736A publication Critical patent/CN111096736A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Cardiology (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

本发明公开了一种基于主动学习的心电图分类方法、装置和系统。其中,方法包括:基于已标注心电图样本,通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本;将未标注心电图样本输出至专家客户端,以使专家客户端将未标注心电图样本提供给专家,并接收专家对未标注心电图样本的标注;获取专家客户端反馈的标注后的心电图样本,并将标注后的心电图样本添加至用以存储已标注心电图样本的标注数据库中;根据扩充后的标注数据库进行模型训练,得到心电图分类模型。该方法可以使得模型容量更多,而且通过对标注心电图的需求定制,可以实现训练得到的模型的个性化定制,并且,训练样本越大,使得算法性能越高。

Description

基于主动学习的心电图分类方法、装置和系统
技术领域
本发明涉及医疗领域,尤其涉及一种基于主动学习的心电图分类方法、装置和系统。
背景技术
心电图(Electrocardiography,英文简称:ECG)检测是20世纪建立起来并广泛应用于临床诊断和监测的重大技术成果之一。这种检测手段对心脏疾病(如各类心律失常、心肌梗死及心室肥大等)的诊断对临床诊疗功不可没。
心电图自动分析技术在数十年间得到了长足发展,心电图自动分析技术主要包括心电信号的预处理、各波形定位或分类、心电信号的特征提取并通过识别算法得到疾病分类结果等。其中,波形分类通常包括拍分为窦性心拍、室性心拍、室上性心拍,疾病分类通常包括心律失常分类、心梗分类、传导阻滞分类等。
相关技术中,心电图分类方法通常是采用基于规则或判据的分析方法,其典型代表是采用明尼苏达码对心电信号进行分析,这种方法的优势在于与医生的诊断逻辑类似,分析结果能有很好的医学解释。但是存在以下缺点:分析方法中的规则均是基于确定化的阈值,从统计学习理论的角度可以认为这种方法得到的模型容量十分有限,而且很难实现个性化的定制,算法性能上限低。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种基于主动学习的心电图分类方法。该方法可以使得模型容量更多,而且通过对标注心电图的需求定制,可以实现训练得到的模型的个性化定制,并且,训练样本越大,使得算法性能越高。
本发明的第二个目的在于提出一种基于主动学习的心电图分类装置。
本发明的第三个目的在于提出一种基于主动学习的心电图分类系统。
本发明的第四个目的在于提出一种计算机设备。
为达到上述目的,本发明第一方面实施例提出的基于主动学习的心电图分类方法,包括:基于已标注心电图样本,通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本;将所述未标注心电图样本输出至专家客户端,以使所述专家客户端将所述未标注心电图样本提供给专家,并接收所述专家对所述未标注心电图样本的标注;获取所述专家客户端反馈的标注后的心电图样本,并将所述标注后的心电图样本添加至用以存储所述已标注心电图样本的标注数据库中;根据扩充后的标注数据库进行模型训练,得到心电图分类模型。
根据本发明实施例的基于主动学习的心电图分类方法,基于已标注心电图样本,通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本,并将未标注心电图样本输出至专家客户端,以使专家客户端将未标注心电图样本提供给专家,并接收专家对未标注心电图样本的标注,并获取专家客户端反馈的标注后的心电图样本,并将标注后的心电图样本添加至用以存储已标注心电图样本的标注数据库中,以及根据扩充后的标注数据库进行模型训练,得到心电图分类模型。即利用主动学习,通过查询能够主动地选择包含信息量大的未标注心电图并将其交由临床专家进行标注,然后置入训练集进行训练,从而在训练集较小的情况下获得较高的分类正确率,这样,通过这种训练方法得到的模型容量更多,而且通过对标注心电图的需求定制,可以实现训练得到的模型的个性化定制,并且,训练样本越大,使得算法性能越高。另外,可以尽可能地减小训练集及标注成本;同时在原始有限的标注数据库构建初始模型,并利用主动学习方法尽可能提升初始模型分类的准确性;并且,可以有效地降低构建高性能分类器的代价。
为达到上述目的,本发明第二方面实施例提出的基于主动学习的心电图分类装置,包括:未标注样本获取模块,用于基于已标注心电图样本,通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本;样本标注模块,用于将所述未标注心电图样本输出至专家客户端,以使所述专家客户端将所述未标注心电图样本提供给专家,并接收所述专家对所述未标注心电图样本的标注;标注数据库扩充模块,用于获取所述专家客户端反馈的标注后的心电图样本,并将所述标注后的心电图样本添加至用以存储所述已标注心电图样本的标注数据库中;模型训练模块,用于根据扩充后的标注数据库进行模型训练,得到心电图分类模型。
根据本发明实施例的基于主动学习的心电图分类装置,利用主动学习,通过查询能够主动地选择包含信息量大的未标注心电图并将其交由临床专家进行标注,然后置入训练集进行训练,从而在训练集较小的情况下获得较高的分类正确率,这样,通过这种训练方法得到的模型容量更多,而且通过对标注心电图的需求定制,可以实现训练得到的模型的个性化定制,并且,训练样本越大,使得算法性能越高。另外,可以尽可能地减小训练集及标注成本;同时在原始有限的标注数据库构建初始模型,并利用主动学习方法尽可能提升初始模型分类的准确性;并且,可以有效地降低构建高性能分类器的代价。
为达到上述目的,本发明第三方面实施例提出的基于主动学习的心电图分类系统,包括:心电图采集中心,用于采集心电图数据;自动分析中心,用于对采集到的心电图数据进行预处理,并根据预先训练的心电图分类模型对预处理后的心电图数据进行分类识别,得到所述心电图数据的所属类别,其中,所述心电图分类模型是利用本发明第一方面实施例所述的方法训练得到的;心电图确认中心,用于接收所述自动分析中心发送的针对所述心电图数据的分类识别结果,并将所述分类识别结果发送给医生诊断设备上,并在接收到诊断医生通过所述医生诊断设备对所述分类识别结果的确认操作后,将所述心电图数据和分类结果发送至终端设备;所述终端设备,用于在接收到患者输入的操作指令时,根据所述患者的标识获取所述患者的心电图和分类结果,并根据所述操作指令对所述心电图和分类结果进行相应处理,其中,所述操作指令包括查看和/或打印指令。
根据本发明实施例的基于主动学习的心电图分类系统,通过自动分析中心中的心电图分类模型实现对心电图进行自动分类,其中,由于心电图分类模型是利用主动学习,通过查询能够主动地选择包含信息量大的未标注心电图并将其交由临床专家进行标注,然后置入训练集进行训练而得到的,从而在训练集较小的情况下获得较高的分类正确率,从而可以提高针对心电图分类识别的准确度,并可以尽可能地减小训练集及标注成本,并可以有效地降低构建高性能分类器的代价。
为达到上述目的,本发明第四方面实施例提出的计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现本发明第一方面实施例所述的基于主动学习的心电图分类方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的基于主动学习的心电图分类方法的流程图;
图2是根据本发明另一个实施例的基于主动学习的心电图分类方法的流程图;
图3是根据本发明一个实施例的基于主动学习的心电图分类装置的结构示意图;
图4是根据本发明另一个实施例的基于主动学习的心电图分类装置的结构示意图;
图5是根据本发明又一个实施例的基于主动学习的心电图分类装置的结构示意图;
图6是根据本发明一个实施例的基于主动学习的心电图分类系统的结构示意图;
图7是根据本发明一个实施例的计算机设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于主动学习的心电图分类方法、装置和系统。
图1是根据本发明一个实施例的基于主动学习的心电图分类方法的流程图。需要说明的是,本发明实施例的基于主动学习的心电图分类方法可应用于本发明实施例的基于主动学习的心电图分类装置。例如,该心电图分类装置可被配置于本发明实施例的基于主动学习的心电图分类系统上。
如图1所示,该基于主动学习的心电图分类方法可以包括:
S110,基于已标注心电图样本,通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本。
可以理解,在本发明的实施例中,所述已标注心电图样本可以存储在标注数据库中,也就是说,该标注数据库中存储的是已经标注过的心电图样本,其中,该标注数据库中的样本数量相对较少;所述未标注数据库中存储的是大量的未经过标注的心电图样本。
在本发明的实施例中,可基于数量有限的已标注心电图样本,通过第一查询策略从未标注数据库中选取满足一定条件的未标注心电图样本。作为一种示例,可根据所述已标注心电图样本进行模型训练,得到基础模型,并根据所述基础模型对所述未标注数据库中的未标注样本进行分类预测,并通过第一查询策略,根据针对所述未标注样本的预测结果从所述未标注数据库中选取满足第一预设条件的未标注心电图样本。
举例而言,可基于有限的已标注心电图样本进行模型训练以得到基础模型,其中,该基础模型可以是各已标注心电图样本与各概率密度函数的参数值之间的对应关系,包括全连接层,所述全连接层的输入为已标注心电图样本,所述全连接层的输出为各概率密度函数的参数值。在得到所述基础模型之后,可根据该基础模型对所述未标注数据库中的每个未标注心电图样本进行分类预测,例如,以一个未标注心电图样本的分类预测为例,可将该未标注心电图样本输入至该基础模型中,获得该基础模型输出的各概率密度函数的目标参数值,其中,该各概率密度函数的目标参数值可以是针对该未标注心电图样本所对应的各分类结果的概率值,比如,假设该基础模型中包括3个分类,即分类A、分类B和分类C,将某个未标注心电图样本输入至该基础模型中进行分类预测,得到该基础模型输出的分类A、分类B和分类C对应的概率密度函数的参数值分别为90%、5%和5%,此时可判定该某个未标注心电图样本的分类结果为分类A。
在得到所述未标注数据库中的各未标注样本的分类预测结果之后,可通过第一查询策略,根据针对所述未标注样本的预测结果从所述未标注数据库中选取满足第一预设条件(如查询信息量大)的未标注心电图样本。其中,在本发明的实施例中,所述第一查询策略包括:样本不确定性查询策略,和/或,样本代表性查询策略。
举例而言,在得到所述未标注数据库中的各未标注样本的分类预测结果之后,可基于样本不确定性查询策略,和/或,样本代表性查询策略,从所述未标注数据库中筛选出查询信息量大的心电图,例如,当查询的心电图满足第一预设条件,如熵值高于设定的某个阈值时,说明该心电图有利于提升心电图分类模型的准确性,比如,以查询策略为样本不确定性查询策略为例,所述满足第一预设条件的未标注心电图可以是指熵值高于设定的阈值的未标注心电图。其中,挑选查询样本有两种策略,一种是基于样本的信息量,即这个样本在统计学习中,能够减少分类模型的不确定性的程度;另一种是基于样本的代表性,即这个样本能否代表整个数据集。作为本发明的一种实施例是可以基于这两种策略之一,或结合两种策略来挑选未标注的心电图。可以理解,这些方法的关键点就是找到当前模型最可能出错的样本,这样在标记和加入到训练数据集之后,模型对于不可见数据上的这些错误变得更加有效而快速,使得更小的子集来达到模型最理想的性能。
由此,在少量的已标注心电图样本基础上,可使用主动学习方法尽可能地从未标注样本中筛选出最有用的未标注心电图样本,即筛选出有利于提升模型性能的心电图样本。
需要说明的是,在本发明的实施例中,所述基础模型可以是在有限的已标注心电图样本基础上使用主动学习方法而训练得到的。作为一种示例,如图2所示,所述根据已标注心电图样本进行模型训练得到基础模型的具体实现过程可包括以下步骤:
S210,根据所述已标注心电图样本进行模型训练,构建针对心电图分类的初始模型;
可选地,基于神经网络,根据所述已标注心电图样本构建针对心电图分类的初始模型。其中,在本发明的实施例中,所述神经网络可以包括但不限于卷积神经网络、循环神经网络等。作为一种示例,所述初始模型可以是各已标注心电图样本与各概率密度函数的参数值之间的对应关系,包括全连接层,所述全连接层的输入为已标注心电图样本,所述全连接层的输出为各概率密度函数的参数值。
S220,通过第二查询策略从所述标注数据库中获取满足第二预设条件的已标注心电图样本;
其中,在本发明的实施例中,所述第二查询策略包括:样本不确定性查询策略,和/或,样本代表性查询策略。举例而言,可将所述标注数据库中的各已标注心电图样本输入到该初始模型中,获得该基础模型输出的各概率密度函数的目标参数值,其中,该各概率密度函数的目标参数值可以是针对已标注心电图样本所对应的各分类结果的概率值。在得到所述标注数据库中各已标注心电图样本的分类预测结果之后,可通过第二查询策略,根据针对所述已标注心电图样本的预测结果从所述标注数据库中筛选出满足第二预设条件的已标注心电图样本,即通过第二查询策略从标注数据库中筛选出信息量较大的心电图,其中,该心电图可包括但不限于上述构建初始模型时分类错误的心电图。
S230,根据所述满足第二预设条件的已标注心电图样本对所述初始模型进行再训练;
S240,判断所述进行再训练后的模型的性能是否大于再训练前的最新模型的性能;其中,所述再训练前的最新模型是指未进行再训练时的那个最新模型,例如,以对初始模型进行一次再训练为例,此时所述进行再训练后的模型即理解是经过再训练的初始模型,所述再训练前的最新模型可理解是所述初始模型。
在本发明的实施例中,可确定所述进行再训练后的模型对某个已标注心电图样本进行分类预测时的分类结果,并确定所述再训练前的最新模型对该同一个已标注心电图样本进行分类预测时的分类结果,将这两个分类结果进行比较,确定哪个分类结果更准确,如果针对所述进行再训练后的模型的分类结果,比针对所述再训练前的最新模型的分类结果更加准确,则可判定所述进行再训练后的模型的性能大于所述再训练前的最新模型的性能。也就是说,可根据再训练的前后两个模型针对同一个已标注心电图样本的分类结果,来判断该再训练的前后两个模型的性能,如果再训练前的那个最新模型的分类结果,比再训练后的那个模型的分类结果更加准确,则可判定再训练后的模型的性能小于或等于再训练前的那个最新模型,否则可判定再训练后的模型的性能大于再训练前的那个最新模型。
S250,若否,则将所述再训练前的最新模型作为所述基础模型;
可选地,在判断所述进行再训练后的模型的性能小于或等于所述再训练前的最新模型的性能时,认为此时模型无需再训练,可将所述再训练前的最新模型作为所述基础模型。
S260,若是,则将所述再训练前的最新模型替换成所述进行再训练后的模型,并返回执行所述通过第二查询策略从所述标注数据库中获取满足第二预设条件的已标注心电图样本的步骤,即返回执行步骤S220。
可选地,在判断所述进行再训练后的模型的性能大于所述再训练前的最新模型的性能时,为了使得模型性能能够达到更优,此时可需对该模型进行再训练,即可将所述再训练前的最新模型替换成所述进行再训练后的模型,并返回执行所述通过第二查询策略从所述标注数据库中获取满足第二预设条件的已标注心电图样本的步骤,即返回执行步骤S220,重复上述步骤S220~S260,直至训练得到的最新模型性能大于训练前的模型性能。
由此,通过上述步骤S210~S260,可以实现在有限的已标注心电图样本基础上使用主动学习方法尽可能地使构建的基础模型的性能更优,即尽可能地提升模型分类的准确性。
S120,将未标注心电图样本输出至专家客户端,以使专家客户端将未标注心电图样本提供给专家,并接收专家对未标注心电图样本的标注。
也就是说,在从未标注数据库中筛选出所述未标注心电图样本之后,可将所述未标注心电图样本发送给专家客户端。专家客户端可将所述未标注心电图样本提供给专家。专家可对所述未标注心电图样本进行标注。专家客户端可接收该专家对所述未标注心电图样本的标注,并在接收到专家针对所述未标注心电图样本的标注之后,可反馈专家针对所述未标注心电图样本的标注情况。
S130,获取专家客户端反馈的标注后的心电图样本,并将标注后的心电图样本添加至用以存储已标注心电图样本的标注数据库中。
也就是说,可获取专家客户端反馈的经过专家标注后的心电图样本,并将这些标注后的心电图样本添加至所述标注数据库中,以扩充所述标注数据库。
S140,根据扩充后的标注数据库进行模型训练,得到心电图分类模型。
在本发明的实施例中,可通过扩充后的标注数据库重新进行模型训练,并将训练后的模型作为所述心电图分类模型;或者,可通过扩充后的标注数据库对所述基础模型进行再训练,并将再训练得到的新模型作为所述心电图分类模型。下面将给出这两种实现方式的示例:
作为一种可能实现方式的示例,从所述扩充后的标注数据库中获取所述专家客户端反馈的标注后的心电图样本,并根据所述标注后的心电图样本对所述基础模型进行再训练,并判断再训练后的基础模型的性能是否达到预设要求,若是,则将所述再训练后的所述基础模型作为所述心电图分类模型;若否,则返回执行所述通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本的步骤。
也就是说,可从扩充后的标注数据库中获取所述专家客户端反馈的标注后的心电图样本,之后,可利用该专家客户端反馈的标注后的心电图样本对所述基础模型进行再训练,判断再训练后的基础模型的性能是否达到预设要求,例如,该训练后的模型的分类结果准确率是否大于某个阈值,若是,则可判定该训练后的模型的性能达到预设要求,此时,可将该再训练后的所述基础模型作为所述心电图分类模型,否则返回执行所述通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本的步骤,即再次从未标注数据库中筛选出有利于提升模型性能的心电图样本。
作为另一种可能实现方式的示例,可从所述扩充后的标注数据库中获取所述已标注心电图样本和所述专家客户端反馈的标注后的心电图样本,并根据所述已标注心电图样本和所述专家客户端反馈的标注后的心电图样本,重新进行模型训练,并判断训练后模型的性能是否达到预设要求,若是,则将所述训练后模型作为所述心电图分类模型;若否,则返回执行所述通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本的步骤。
也就是说,可从所述扩充后的标注数据库中选取所述已标注心电图样本和所述专家客户端反馈的标注后的心电图样本,并基于所述已标注心电图样本和所述专家客户端反馈的标注后的心电图样本,重新训练新的模型,判断训练后的最新模型的性能是否达到预设要求,若是,则将该训练后的最新模型作为所述心电图分类模型,否则返回执行所述通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本的步骤,即再次从未标注数据库中筛选出有利于提升模型性能的心电图样本。
由此可见,通过本发明实施例可以得到用以对心电图进行分类的心电图分类模型。其中,该心电图分类模型已训练得到各心电图与各概率密度函数的参数值之间的对应关系,该心电图分类模型包括全连接层,所述全连接层的输入为心电图,所述全连接层的输出为各概率密度函数的参数值。
为了能够实现心电图的自动分类,可选地,在本发明的一个实施例中,可接收待识别心电图,并根据所述心电图分类模型对所述待识别心电图进行分类识别,得到所述待识别心电图的所属类别。也就是说,在实际应用所述心电图分类模型对心电图进行分类识别时,可先获取待识别心电图,之后,可将该待识别心电图输入到所述心电图分类模型进行分类识别,得到所述心电图分类模型输出的各概率密度函数的参数值,根据该各概率密度函数的参数值的大小即可判定出该待识别心电图的分类结果。例如,假设心电图分类分为三种,即分类A、分类B和分类C,将某个待识别心电图输入至所述心电图分类模型进行分类识别时,得到所述心电图分类模型输出的分类A、分类B和分类C对应的概率密度函数的参数值分别为90%、5%和5%,根据这些参数值的大小,可以确定出该待识别心电图的分类结果为分类A。
根据本发明实施例的基于主动学习的心电图分类方法,基于已标注心电图样本,通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本,并将未标注心电图样本输出至专家客户端,以使专家客户端将未标注心电图样本提供给专家,并接收专家对未标注心电图样本的标注,并获取专家客户端反馈的标注后的心电图样本,并将标注后的心电图样本添加至用以存储已标注心电图样本的标注数据库中,以及根据扩充后的标注数据库进行模型训练,得到心电图分类模型。即利用主动学习,通过查询能够主动地选择包含信息量大的未标注心电图并将其交由临床专家进行标注,然后置入训练集进行训练,从而在训练集较小的情况下获得较高的分类正确率,这样,通过这种训练方法得到的模型容量更多,而且通过对标注心电图的需求定制,可以实现训练得到的模型的个性化定制,并且,训练样本越大,使得算法性能越高。另外,可以尽可能地减小训练集及标注成本;同时在原始有限的标注数据库构建初始模型,并利用主动学习方法尽可能提升初始模型分类的准确性;并且,可以有效地降低构建高性能分类器的代价。
与上述几种实施例提供的基于主动学习的心电图分类方法相对应,本发明的一种实施例还提供一种基于主动学习的心电图分类装置,由于本发明实施例提供的基于主动学习的心电图分类装置与上述几种实施例提供的基于主动学习的心电图分类方法相对应,因此在前述基于主动学习的心电图分类方法的实施方式也适用于本实施例提供的基于主动学习的心电图分类装置,在本实施例中不再详细描述。图3是根据本发明一个实施例的基于主动学习的心电图分类装置的结构示意图。如图3所示,该基于主动学习的心电图分类装置300可以包括:未标注样本获取模块310、样本标注模块320、标注数据库扩充模块330和模型训练模块340。
具体地,未标注样本获取模块310用于基于已标注心电图样本,通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本。座位一种示例,如图4所示,该未标注样本获取模块310可包括:基础模型训练单元311、分类预测单元312和未标注样本获取单元313。其中,基础模型训练单元311用于根据所述已标注心电图样本进行模型训练,得到基础模型;分类预测单元312用于根据所述基础模型对所述未标注数据库中的未标注样本进行分类预测;未标注样本获取单元313用于通过第一查询策略,根据针对所述未标注样本的预测结果从所述未标注数据库中选取满足第一预设条件的未标注心电图样本。其中,所述第一查询策略可包括:样本不确定性查询策略,和/或,样本代表性查询策略。
在本发明的实施例中,基础模型训练单元311可根据所述已标注心电图样本进行模型训练,构建针对心电图分类的初始模型,并通过第二查询策略从所述标注数据库中获取满足第二预设条件的已标注心电图样本,之后,可根据所述满足第二预设条件的已标注心电图样本对所述初始模型进行再训练,并判断所述进行再训练后的模型的性能是否大于再训练前的最新模型的性能;若否,则将所述再训练前的最新模型作为所述基础模型;若是,则将所述再训练前的最新模型替换成所述进行再训练后的模型,并返回执行所述通过第二查询策略从所述标注数据库中获取满足第二预设条件的已标注心电图样本的步骤。
样本标注模块320用于将未标注心电图样本输出至专家客户端,以使专家客户端将未标注心电图样本提供给专家,并接收专家对未标注心电图样本的标注。
标注数据库扩充模块330用于获取专家客户端反馈的标注后的心电图样本,并将标注后的心电图样本添加至用以存储已标注心电图样本的标注数据库中。
模型训练模块340用于根据扩充后的标注数据库进行模型训练,得到心电图分类模型。在本发明的实施例中,模型训练模块340可通过扩充后的标注数据库重新进行模型训练,并将训练后的模型作为所述心电图分类模型;或者,可通过扩充后的标注数据库对所述基础模型进行再训练,并将再训练得到的新模型作为所述心电图分类模型。下面将给出这两种实现方式的示例:
作为一种可能实现方式的示例,模型训练模块340具体用于:从所述扩充后的标注数据库中获取所述专家客户端反馈的标注后的心电图样本;根据所述标注后的心电图样本对所述基础模型进行再训练;判断再训练后的基础模型的性能是否达到预设要求;若是,则将所述再训练后的所述基础模型作为所述心电图分类模型;若否,则返回执行所述未标注样本获取模块的步骤。
作为另一种可能实现方式的示例,模型训练模块340具体用于:从所述扩充后的标注数据库中获取所述已标注心电图样本和所述专家客户端反馈的标注后的心电图样本;根据所述已标注心电图样本和所述专家客户端反馈的标注后的心电图样本,重新进行模型训练;判断训练后模型的性能是否达到预设要求;若是,则将所述训练后模型作为所述心电图分类模型;若否,则返回执行所述未标注样本获取模块的步骤。
为了能够实现心电图的自动分类,可选地,在本发明的一个实施例中,如图5所示,该基于主动学习的心电图分类装置300还包括:心电图分类识别模块350。其中,心电图分类识别模块350可用于接收待识别心电图,并根据所述心电图分类模型对所述待识别心电图进行分类识别,得到所述待识别心电图的所属类别。
根据本发明实施例的基于主动学习的心电图分类装置,利用主动学习,通过查询能够主动地选择包含信息量大的未标注心电图并将其交由临床专家进行标注,然后置入训练集进行训练,从而在训练集较小的情况下获得较高的分类正确率,这样,通过这种训练方法得到的模型容量更多,而且通过对标注心电图的需求定制,可以实现训练得到的模型的个性化定制,并且,训练样本越大,使得算法性能越高。另外,可以尽可能地减小训练集及标注成本;同时在原始有限的标注数据库构建初始模型,并利用主动学习方法尽可能提升初始模型分类的准确性;并且,可以有效地降低构建高性能分类器的代价。
本发明还提出了一种基于主动学习的心电图分类系统。
图6是根据本发明一个实施例的基于主动学习的心电图分类系统的结构示意图。如图6所示,该基于主动学习的心电图分类系统可以包括:心电图采集中心610、自动分析中心620、心电图确认中心630和终端设备640。
具体地,心电图采集中心610用于采集心电图数据。例如,心电图采集中心610可以有一个或者多个采集模块611;采集模块611可包括但不限于心电图机、心电图采集盒等,采集的心电图优选为标准12导联,也可以是其他导联模式;采集时间不少于10秒。
自动分析中心620用于对采集到的心电图数据进行预处理,并根据预先训练的心电图分类模型对预处理后的心电图数据进行分类识别,得到所述心电图数据的所属类别,其中,所述心电图分类模型是利用本发明上述任一个实施例所述的方法训练得到的。作为一种示例,自动分析中心620可以为但不限于心电云服务器、心电网络、心电图机等。
可选地,在本发明的实施例中,自动分析中心620可包括信号处理模块621和心电图自动分类模块622。其中,信号处理模块621可对采集上传的心电数据进行预处理,包括但不限于信号质量检测、高/低通滤波处理、工频滤波处理、肌电滤波处理。心电图自动分类模块622可根据预先训练的心电图分类模型对预处理后的心电图数据进行分类识别,得到所述心电图数据的所属类别。
心电图确认中心630用于接收自动分析中心620发送的针对所述心电图数据的分类识别结果,并将所述分类识别结果发送给医生诊断设备上,并在接收到诊断医生通过所述医生诊断设备对所述分类识别结果的确认操作后,将所述心电图数据和分类结果发送至终端设备640。也就是说,心电图确认中心630可对自动分析中心620下发的经过自动分类后的心电图进行医生确认,然后将这些经过医生确认后的心电图数据和其分类结果发送至终端设备640以反馈给用户。
终端设备640用于在接收到患者输入的操作指令时,根据所述患者的标识获取所述患者的心电图和分类结果,并根据所述操作指令对所述心电图和分类结果进行相应处理,其中,所述操作指令包括查看和/或打印指令。
根据本发明实施例的基于主动学习的心电图分类系统,通过自动分析中心中的心电图分类模型实现对心电图进行自动分类,其中,由于心电图分类模型是利用主动学习,通过查询能够主动地选择包含信息量大的未标注心电图并将其交由临床专家进行标注,然后置入训练集进行训练而得到的,从而在训练集较小的情况下获得较高的分类正确率,从而可以提高针对心电图分类识别的准确度,并可以尽可能地减小训练集及标注成本,并可以有效地降低构建高性能分类器的代价。
为了实现上述实施例,本发明还提出了一种计算机设备。
图7是根据本发明一个实施例的计算机设备的结构示意图。如图7所示,该计算机设备700可以包括:存储器710、处理器720及存储在存储器710上并可在处理器720上运行的计算机程序730,处理器720执行计算机程序730时,实现本发明上述任一个实施例所述的基于主动学习的心电图分类方法。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于主动学习的心电图分类方法,其特征在于,包括:
基于已标注心电图样本,通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本;
将所述未标注心电图样本输出至专家客户端,以使所述专家客户端将所述未标注心电图样本提供给专家,并接收所述专家对所述未标注心电图样本的标注;
获取所述专家客户端反馈的标注后的心电图样本,并将所述标注后的心电图样本添加至用以存储所述已标注心电图样本的标注数据库中;
根据扩充后的标注数据库进行模型训练,得到心电图分类模型。
2.如权利要求1所述的方法,其特征在于,所述基于已标注心电图样本,通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本,包括:
根据所述已标注心电图样本进行模型训练,得到基础模型;
根据所述基础模型对所述未标注数据库中的未标注样本进行分类预测;
通过第一查询策略,根据针对所述未标注样本的预测结果从所述未标注数据库中选取满足第一预设条件的未标注心电图样本。
3.如权利要求2所述的方法,其特征在于,所述根据所述已标注心电图样本进行模型训练,得到基础模型,包括:
根据所述已标注心电图样本进行模型训练,构建针对心电图分类的初始模型;
通过第二查询策略从所述标注数据库中获取满足第二预设条件的已标注心电图样本;
根据所述满足第二预设条件的已标注心电图样本对所述初始模型进行再训练;
判断所述进行再训练后的模型的性能是否大于再训练前的最新模型的性能;
若否,则将所述再训练前的最新模型作为所述基础模型;
若是,则将所述再训练前的最新模型替换成所述进行再训练后的模型,并返回执行所述通过第二查询策略从所述标注数据库中获取满足第二预设条件的已标注心电图样本的步骤。
4.如权利要求2所述的方法,其特征在于,所述第一查询策略包括:样本不确定性查询策略,和/或,样本代表性查询策略。
5.如权利要求2所述的方法,其特征在于,所述根据扩充后的标注数据库进行模型训练,得到心电图分类模型,包括:
从所述扩充后的标注数据库中获取所述专家客户端反馈的标注后的心电图样本;
根据所述标注后的心电图样本对所述基础模型进行再训练;
判断再训练后的基础模型的性能是否达到预设要求;
若是,则将所述再训练后的所述基础模型作为所述心电图分类模型;
若否,则返回执行所述通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本的步骤。
6.如权利要求1所述的方法,其特征在于,所述根据扩充后的标注数据库进行模型训练,得到心电图分类模型,包括:
从所述扩充后的标注数据库中获取所述已标注心电图样本和所述专家客户端反馈的标注后的心电图样本;
根据所述已标注心电图样本和所述专家客户端反馈的标注后的心电图样本,重新进行模型训练;
判断训练后模型的性能是否达到预设要求;
若是,则将所述训练后模型作为所述心电图分类模型;
若否,则返回执行所述通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本的步骤。
7.如权利要求1至6中任一项所述的方法,其特征在于,还包括:
接收待识别心电图;
根据所述心电图分类模型对所述待识别心电图进行分类识别,得到所述待识别心电图的所属类别。
8.一种基于主动学习的心电图分类装置,其特征在于,包括:
未标注样本获取模块,用于基于已标注心电图样本,通过第一查询策略从未标注数据库中获取满足第一预设条件的未标注心电图样本;
样本标注模块,用于将所述未标注心电图样本输出至专家客户端,以使所述专家客户端将所述未标注心电图样本提供给专家,并接收所述专家对所述未标注心电图样本的标注;
标注数据库扩充模块,用于获取所述专家客户端反馈的标注后的心电图样本,并将所述标注后的心电图样本添加至用以存储所述已标注心电图样本的标注数据库中;
模型训练模块,用于根据扩充后的标注数据库进行模型训练,得到心电图分类模型。
9.一种基于主动学习的心电图分类系统,其特征在于,包括:
心电图采集中心,用于采集心电图数据;
自动分析中心,用于对采集到的心电图数据进行预处理,并根据预先训练的心电图分类模型对预处理后的心电图数据进行分类识别,得到所述心电图数据的所属类别,其中,所述心电图分类模型是利用如权利要求1至7中任一项所述的方法训练得到的;
心电图确认中心,用于接收所述自动分析中心发送的针对所述心电图数据的分类识别结果,并将所述分类识别结果发送给医生诊断设备上,并在接收到诊断医生通过所述医生诊断设备对所述分类识别结果的确认操作后,将所述心电图数据和分类结果发送至终端设备;
所述终端设备,用于在接收到患者输入的操作指令时,根据所述患者的标识获取所述患者的心电图和分类结果,并根据所述操作指令对所述心电图和分类结果进行相应处理,其中,所述操作指令包括查看和/或打印指令。
10.一种计算机设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1至7中任一项所述的基于主动学习的心电图分类方法。
CN201811261608.4A 2018-10-26 2018-10-26 基于主动学习的心电图分类方法、装置和系统 Pending CN111096736A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811261608.4A CN111096736A (zh) 2018-10-26 2018-10-26 基于主动学习的心电图分类方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811261608.4A CN111096736A (zh) 2018-10-26 2018-10-26 基于主动学习的心电图分类方法、装置和系统

Publications (1)

Publication Number Publication Date
CN111096736A true CN111096736A (zh) 2020-05-05

Family

ID=70419178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811261608.4A Pending CN111096736A (zh) 2018-10-26 2018-10-26 基于主动学习的心电图分类方法、装置和系统

Country Status (1)

Country Link
CN (1) CN111096736A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111834011A (zh) * 2020-07-10 2020-10-27 华东师范大学 一种面向长期养老照护的协同交互式服务推荐方法
CN113657510A (zh) * 2021-08-19 2021-11-16 支付宝(杭州)信息技术有限公司 一种有标注价值的数据样本的确定方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007044288A (ja) * 2005-08-10 2007-02-22 Fumio Watanabe 心電図解析・判定装置及びシステム
CN103166830A (zh) * 2011-12-14 2013-06-19 中国电信股份有限公司 一种智能选择训练样本的垃圾邮件过滤系统和方法
CN103514369A (zh) * 2013-09-18 2014-01-15 上海交通大学 一种基于主动学习的回归分析系统及方法
CN103530321A (zh) * 2013-09-18 2014-01-22 上海交通大学 一种基于机器学习的排序系统
CN103793510A (zh) * 2014-01-29 2014-05-14 苏州融希信息科技有限公司 一种基于主动学习的分类器构建方法
CN105748063A (zh) * 2016-04-25 2016-07-13 山东大学齐鲁医院 基于多导联和卷积神经网络的心律失常智能诊断方法
CN105929845A (zh) * 2016-05-18 2016-09-07 中国计量大学 基于无人机网络的河道巡航系统与巡航方法
CN106485235A (zh) * 2016-10-24 2017-03-08 厦门美图之家科技有限公司 一种卷积神经网络生成方法、年龄识别方法及相关装置
CN108009589A (zh) * 2017-12-12 2018-05-08 腾讯科技(深圳)有限公司 样本数据处理方法、装置和计算机可读存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007044288A (ja) * 2005-08-10 2007-02-22 Fumio Watanabe 心電図解析・判定装置及びシステム
CN103166830A (zh) * 2011-12-14 2013-06-19 中国电信股份有限公司 一种智能选择训练样本的垃圾邮件过滤系统和方法
CN103514369A (zh) * 2013-09-18 2014-01-15 上海交通大学 一种基于主动学习的回归分析系统及方法
CN103530321A (zh) * 2013-09-18 2014-01-22 上海交通大学 一种基于机器学习的排序系统
CN103793510A (zh) * 2014-01-29 2014-05-14 苏州融希信息科技有限公司 一种基于主动学习的分类器构建方法
CN105748063A (zh) * 2016-04-25 2016-07-13 山东大学齐鲁医院 基于多导联和卷积神经网络的心律失常智能诊断方法
CN105929845A (zh) * 2016-05-18 2016-09-07 中国计量大学 基于无人机网络的河道巡航系统与巡航方法
CN106485235A (zh) * 2016-10-24 2017-03-08 厦门美图之家科技有限公司 一种卷积神经网络生成方法、年龄识别方法及相关装置
CN108009589A (zh) * 2017-12-12 2018-05-08 腾讯科技(深圳)有限公司 样本数据处理方法、装置和计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111834011A (zh) * 2020-07-10 2020-10-27 华东师范大学 一种面向长期养老照护的协同交互式服务推荐方法
CN113657510A (zh) * 2021-08-19 2021-11-16 支付宝(杭州)信息技术有限公司 一种有标注价值的数据样本的确定方法及装置

Similar Documents

Publication Publication Date Title
Khafaga et al. Optimization of Electrocardiogram Classification Using Dipper Throated Algorithm and Differential Evolution.
JP2019528511A (ja) ニューロンネットワークをトレーニングする方法及び能動学習システム
CN106815570B (zh) 一种基于动态模式识别的心电信号st-t段识别方法
Shi et al. Inter-patient heartbeat classification based on region feature extraction and ensemble classifier
CN107440679B (zh) 用于检测心电图异常的方法及对应系统
Hosseini et al. A multi-stage neural network classifier for ECG events
EP3157417A1 (en) System and method for improved cardiac rhythm classification from time between heart beat intervals using non-linear dynamics
CN111096735A (zh) 可迭代更新的心电图分析系统
CN104398254A (zh) 一种心电图分析系统、分析设备及预测模型采集设备
CN114334169B (zh) 医疗对象的类别决策方法、装置、电子设备及存储介质
Wen et al. Classification of ECG complexes using self-organizing CMAC
CN110693488A (zh) 心电信号处理系统、方法、电子设备及可读存储介质
David et al. Improvement of framework for the grouping of CA diseases by investigating bigdata
US20230181082A1 (en) System and methods for electrocardiogram beat similarity analysis
CN116322479A (zh) 用于检测和/或预测心脏事件的心电图处理系统
CN111096736A (zh) 基于主动学习的心电图分类方法、装置和系统
Midani et al. DeepArr: An investigative tool for arrhythmia detection using a contextual deep neural network from electrocardiograms (ECG) signals
Diker et al. Examination of the ECG signal classification technique DEA-ELM using deep convolutional neural network features
CN116864140A (zh) 一种心内科术后护理监测数据处理方法及其系统
Al-Huseiny et al. Diagnosis of arrhythmia based on ECG analysis using CNN
CN116012568A (zh) 一种通过拍照心电图获取心电节律信息的系统
CN110786847B (zh) 心电信号的建库方法和分析方法
Behadada et al. Logistic regression multinomial for arrhythmia detection
CN114429816A (zh) 一种心电图分析方法、装置、设备及介质
CN112989971B (zh) 一种不同数据源的心电数据融合方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination